Regresion No Lineal
Regresion No Lineal
Regresion No Lineal
Estadstica General
Introduccin
En la dependencia estocstica, se distinguen dos tipos de tcnicas: (a) Anlisis de regresin; (b) Anlisis de correlacin. El anlisis de correlacin, tiene como fin dar respuesta a las preguntas: Existe dependencia entre las variables?; Cul
5/1/12
estocstica de dicha
es
el
grado
Si existe regresin, se denominar ecuacin de regresin a la ecuacin que describe la relacin entre las dos variables. Por ejemplo: Y = a +b X Y = a +b X + c X2 En general, la variable X se conoce como variable independiente, y la Y como variable dependiente.
Evidentemente puede ser arbitrario el determinar la existencia de regresin as como el5/1/12 de la misma, ya que tipo
Tipos de regresin
Si las dos variables X e Y se relacionan segn un modelo de lnea recta, se habla de regresin lineal simple: Y = a +b X Cuando las variables X e Y se relacionan segn una lnea curva, se habla de regresin no lineal o curvilnea. Aqu se puede distinguir entre regresin parablica, exponencial, potencial, etc.
5/1/12
las dispersiones son pequeas, la curva ser un buen representante de la nube de puntos, o lo que es lo mismo, la bondad de ajuste del modelo ser alta. Si la dispersin es grande, la bondad deYajuste ser baja. forma de medir dicha bondad de ajuste es precisamente evaluando la suma de los cuadrados de los errores. Por tanto, se llamar varianza residual 5/1/12 a la expresin:
Una
La
cota mxima de la varianza residual es la varianza que se trata de explicar mediante el modelo de regresin, es decir, la varianza de la variable dependiente. Por tanto, sin ms que hacer relativa la varianza residual respecto de su mximo valor, y multiplicando por 100, se obtiene el porcentaje de variacin no explicado por el modelo:
5/1/12
Si
R2 =1 no hay residuos: habr una dependencia funcional. Cuanto ms se acerque dicho valor a la unidad, mayor poder explicativo tendr el modelo de regresin. Cuanto ms cercano a 0 est dicho valor, menor poder explicativo; R2 =0 entonces X no explica en absoluto ninguna de las variaciones de la variable Y , de modo que o bien el modelo es inadecuado, o bien las variables son independientes.
5/1/12
Si
poder predictivo
Un modelo de regresin con un alto porcentaje de variaciones explicado, puede no ser bueno para predecir, ya que el que la mayora de los puntos se encuentren cercanos a la recta de regresin, no implica que todos lo estn, y puede ocurrir, que justamente para aquel rango de valores en el que el investigador est interesado, se alejen de la recta, y por tanto, el valor predictivo puede alejarse mucho de la 5/1/12
Extrapolacin
Es
importante resaltar el hecho de que al hacer predicciones, no deben extrapolarse los resultados ms all del rango de la variable X utilizado para ajustar el modelo, ya que ms all de ese rango se desconoce qu puede estar ocurriendo. todos es conocido que las plantas necesitan abono para poder crecer y que hay que abonarlas, de modo que 5/1/12 en principio, cuanto ms abono se les
De
Comparacin de una posible verdadera relacin entre cantidad de abono y crecimiento de una planta, con los resultados de una recta de regresin obtenida mediante el estudio de un rango limitado de valores de abono.
5/1/12
Linealizacin
Algunos problemas de regresin no lineal pueden linealizarse mediante una transformacin en la formulacin del modelo. Por ejemplo, considrese el problema de regresin no lineal (ignorando el trmino de error): y = a ebx Aplicando logaritmos a ambos lados de la5/1/12 ecuacin, se obtiene:
En general, no hay una expresin de forma cerrada para los parmetros de mejor ajuste, como sucede en el caso de la regresin lineal. Mtodos numricos de optimizacin son aplicados con el fin de determinar los parmetros de mejor ajuste. Otra vez, en contraste con la regresin lineal, podra haber varios mximos locales de la funcin a ser optimizada. En la prctica se suponen algunos valores iniciales los cuales junto con el algoritmo de optimizacin conducen a 5/1/12 encontrar el mximo global.
Regresin no lineal
Supngase
que al representar grficamente la correspondiente la distribucin bidimensional, se obtiene la figura curva, y se observa una clara relacin entre las dos variables, pero claramente no lineal. Por tanto, deber buscar la funcin que ha de describir la dependencia entre las dos variables.
Parbola de regresin
5/1/12
En
muchos casos, es una funcin segundo grado la que se ajusta suficiente a la situacin real dada. expresin general de un polinomio segundo grado es: Y=a+bX+cX2 a , b y c son los parmetros.
Y
de lo La de
donde El
problema consiste, por tanto, en determinar dichos parmetros para una distribucin dada. Se seguir para ello, un razonamiento similar al que se hace en el caso5/1/12 modelo de regresin del
Las
ecuaciones que forman dicho sistema se conocen, igual que en el caso de la regresin lineal simple, como ecuaciones normales de Gauss.
5/1/12
Regresin hiperblica
Cuando
la dependencia entre las variables X e Y es de forma hiperblica, interesa ajustar a la nube de puntos una funcin del tipo:
5/1/12
problema de ajustar un modelo potencial, de la forma Y = A*Xb y uno exponencial Y = A*BX se reduce al de la funcin lineal, con solo tomar logaritmos.
5/1/12
Modelo potencial
Si en la expresin de la funcin potencial se toman logaritmos, se obtiene: logY = log a + b log X que es la ecuacin de una recta Y = a +b X , donde ahora a =log a . El problema se reduce a transformar Y en logY y X en log X y ajustar una recta a los valores transformados. El parmetro b del modelo potencial coincide con el 5/1/12 coeficiente de regresin de la recta
5/1/12
5/1/12
Grfico de dispersin
5/1/12
De donde se tiene el sistema de ecuaciones 68 = 5a + 15b + 55c 277,5=15a + 55b + 225c 1205=55a + 225b+ 979c Resolviendo en sistemas de ecuaciones Tenemos: a= -0,45 b= 0,49285 c= 1,14286
5/1/12
5/1/12
Ajuste
lnY = ln a + b ln X Y = a+bX
5/1/12
Grafico
5/1/12
b= 1,99019655 a'= 0,2276718 a= Ln(a)= 1,25567315 r = 0,99997524 De donde la ecuacin de la curva ser. Y= 1,25567315*X 1,99019655 e2=ECM=0.197945544/5= 0,03958911
5/1/12
Ajuste
5/1/12
De donde: b'= 0,77754606 b= 2,17612563 a'= -0,19935648 a= 0,81925779 r= 0,97200255. Donde la ecuacin es: Y=(0,81925779)*(2,17612563)X e2=ECM=70.2921126/5=14,0584225 2 5/1/12
La
comparacin de la bondad de modelos de regresin mediante el coeficiente de determinacin slo es correcta cuando la variable dependiente no ha sido sometida a transformaciones no lineales (por ejemplo, una transformacin logartmica). En este ejercicio, mediante R2 slo se puede comparar la regresin lineal y la parablica. Por eso, para comparar los cuatro ajustes efectuados se utiliza el error cuadrtico 5/1/12 medio (ECM). El mejor ajuste resulta