Regresion Logaritmica
Regresion Logaritmica
Regresion Logaritmica
Contenido
Introducción.................................................................................................................................3
Objetivos......................................................................................................................................3
Desarrollo del tema......................................................................................................................3
Ecuación característica.............................................................................................................3
Tabla de datos..........................................................................................................................3
Estimadores del modelo...........................................................................................................4
Análisis de varianza para la regresión......................................................................................4
Grado de ajuste del modelo......................................................................................................4
Pruebas de Hipótesis para el modelo........................................................................................5
Para el coeficiente b.............................................................................................................5
Para el coeficiente a..............................................................................................................5
Intervalos de confianza.............................................................................................................5
Para el coeficiente b.............................................................................................................5
Para el coeficiente a..............................................................................................................6
Para la media de y................................................................................................................6
Para la estimación de y.........................................................................................................6
Cálculo de estimadores, coeficiente de determinación y análisis de varianza mediante el uso
de matrices...............................................................................................................................6
Ejemplo 01...............................................................................................................................7
Ejemplo 02.............................................................................................................................13
Conclusiones..............................................................................................................................15
Referencias bibliográficas..........................................................................................................16
Anexos.......................................................................................................................................16
2
Introducción
Este modelo de regresión es una alternativa cuando el modelo lineal no logra un coeficiente de
determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento que puede
considerarse potencial o logarítmico. La forma más simple de tratar de establecer la tendencia es
a través de un diagrama de dispersión o nube de puntos, tal como la siguiente:
Este modelo también es conocido como potencial, Cobb-Douglas de primer grado o exponencial
inverso.
Objetivos
Estudiar el modelo de regresión logarítmica
Determinar si el modelo explica o no el fenómeno en estudio
Y i= A∗Xi B∗E
En la cual:
Yi: Variable dependiente, i esima observación
A, B: Parámetros de la ecuación, que generalmente son desconocidos
E: Error asociado al modelo
X i : Valor de la í-esima observación de la variable independiente
y i=a∗x i b
La ecuación se transforma aplicando logaritmos de ambos lados, con lo cual se convierte a una
forma lineal:
ln y i=ln a+b∗ln x i
Tabla de datos
Para el ajuste de un conjunto de datos al modelo geométrico de regresión, se construye la
siguiente tabla de datos:
.. .. .. .. .. ..
3
Σln x Σln y Σ(ln x)2 Σ(lny)2 ΣLnx*lny
Debido a las propiedades de los logaritmos, ningún valor de X ni de Y puede ser negativo. En
tal caso, lo que se hace es definir un valor de x o de y muy pequeño (Ej: 0.00000001)
Se puede trabajar con logaritmos naturales o logaritmos base 10.
∑ ln (x)∑ ln ( y)
∑ ln ( x )∗ln ( y )− n
b= 2
( ∑ ln ( x))
2
∑ (ln ( x)) − n
ln ( a )=
∑ ln ( y )−b∗∑ ln ( x)
n
4
Para el coeficiente b
Para probar la hipótesis de que el coeficiente b es igual a un valor b´, ser igual a cero, se
procede de la siguiente manera:
iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:
n-2 grados de libertad y un nivel α/2
iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, se
acepta.
Para el coeficiente a
Se puede probar la hipótesis de que el coeficiente a es igual a un valor a´, para lo cual se
sigue el siguiente procedimiento:
√ 2
n∗( ∑ ln ( x ) ) −
n
2
( ∑ ln ( x ))
iv) Se obtiene en la tabla de t de student el estadístico comparador, con los siguientes datos: n-2
grados de libertad y nivel α/2
v) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la
hipótesis se acepta
Intervalos de confianza
Para el coeficiente b
El intervalo de confianza para el coeficiente b se calcula así:
5
t∗√ cuadrado medio del error
IC ≔ b ±
√∑ ¿¿¿¿¿
El cuadrado medio del error se obtiene del análisis de varianza
El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un nivel α/2
Para el coeficiente a
El intervalo de confianza para el coeficiente a se calcula así:
Para la media de y
Un intervalo de confianza para la respuesta media de y, dado x 0 sería:
1
ln ( ý ) ±t∗√ cuadrado medio del error∗
√ n
+ ¿ ¿ ¿¿
Para la estimación de y
El intervalo de confianza para la estimación de y, dado un valor de x 0 se obtiene de la siguiente
manera:
1
√
ln ( ^y ) ±t∗ √ cuadrado medio del error∗ 1+ + ¿ ¿¿ ¿
n
6
Cálculo de estimadores, coeficiente de determinación y análisis de varianza mediante el uso de
matrices
Un método alternativo para realizar los cálculos, es el uso de matrices. En este caso, el
procedimiento es el siguiente:
Ln y1
Ln y2
.....
Ln yn
1 1 ... 1
Ln x1 Ln x2 ... Ln xn
7
Error n-2 y´y-b( x´ )(y) S.C.
Error/(n-2)
Total n-1 y´y- nym2 n-1
Ejemplo 01
Se realizó un estudio comparativo del nivel de ruido (en decibeles) producido por discotecas
rodantes, se procedió a evaluar diferentes niveles de potencia (en vatios). Los datos finales
fueron:
POTENCIA DECIBELES
100 60
500 80
1000 90
5000 99
10000 120
8
a) Construya un diagrama de dispersión
b) Efectúe la estimación del modelo logarítmico.
c) Determine el grado de ajuste e interprételo
d) Elabore el análisis de varianza y discútalo
e) ¿Qué lectura se obtendría con una potencia de 3000 vatios?
f) Pruebe la hipótesis que b=1 con un 99% de confianza
g) Calcule intervalo de confianza al 95% para a y b.
h) Efectúe la estimación del modelo, el anova y obtenga el coeficiente de determinación por
medio de matrices.
DESARROLLO
a) Diagrama de Dispersión
El diagrama de dispersión muestra una tendencia logarítmica, pues aunque hay incrementos
fuertes de potencia, los niveles de ruido no crecen excesivamente.
i) Tabla de Datos:
9
ii) Estimadores del modelo
35.4551∗22.3588
160.4033−
5
b= =0.1374
(35.4551)2
264.919−
5
22.3588−0.1374∗35.4551
=3.497
5
a=e 3.497=33.0164
y=33.0164∗X 0.1374
35.4551−22.3588
R 2=
(
0.1374∗ 160.4033−
5 ) =0.9586
2
(22.3588 )
100.2493−
5
Se puede concluir que el grado de ajuste del modelo es alto, por lo que el modelo es confiable
para hacer predicciones.
suma de cuadrados de regresión:
10
vii) Cuadrado medio de regresión= 0.255/1=0.255
viii) Cuadrado medio del error= 0.0111/3=0.0037
ix) F Calculada=0.255/0.0037=68.91
x) F Tabulada (1,3,0.01)= 34.12
xi) Tabla de Andeva:
Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha, con lo
cual se concluye que el modelo si explica el fenómeno en estudio y que los resultados obtenidos
no se deben a la casualidad.
y= 33.164*(3000)0.1374=99.63
Se puede aplicar la operación equivalente por medio de los logaritmos de los estimadores:
ln y= 3.497+0.1374*Ln(3,000)=4.59707
Finalmente, y=e4.59707=99.63
11
sb = √ 0.0037 =0.0165
(35.455)2
√ 264.919−
5
El valor de t de student de calcula de la siguiente manera: (el logaritmo de 1 es cero)
0.0037
IC=0.1374 ± 3.182∗
√ 264.919−
( 35.4551 )2
5
=0.1374 ± 0.5266
√(
5∗ 264.919−
( 35.4551 )2
5 )
=3.497 ± 0.3833
1 4.6052
[ ]
16.2146
Matriz x: 16.9078
1 8.5172
19.2103
12
1 1 1 1 1
4.6052 6.2146 6.9078 8.5172 9.2103
4.09430
4.3820
Y= 4.4998
4.5595
4.7875
Producto x’x:
5 35.4551
35.4551 264.9191
3.9228 -0.5250
-0.5250 0.07403
Producto x ´ y
22.8231
163.5535
3.6644
0.1269
Análisis de varianza
Suma de cuadrados de regresión= b’x’y- nym2= 0.255
13
ym= 22.3588/5=4.47176
Suma de cuadrados total=y’y- nym2=0.2661
Suma de cuadrados del error =: 0.2661-0.255=0.0111
Grados de libertad de regresión=1
Grados de libertad totales= 5-1=4
Grados de libertad del error=5-2=3
Cuadrado medio de regresión= 0.255/1=0.255
Cuadrado medio del error= 0.0111/3=0.0037
F Calculada=0.255/0.0037=68.91
F Tabulada (1,3,0.01)= 34.12
Análisis de Varianza Final:
0.255
r 2= =0.958
0.2661
Ejemplo 02
La empresa Saga Falabella Perú invierte dinero en publicidad para obtener una utilidad al mes
como se detalla en el siguiente cuadro:
14
Modelo de regresion logaritmica
4.5
2. Linealizar el modelo
Y^ =a+b∗x ' Donde x ' =ln ( x)
Y además
∑ y=n∗a+b∗∑ x '
∑ x ' y=a∗∑ x ' + b ∑ x '2
Reemplazando valores
17.6=5∗a+4.7874917∗b
18.587753=4.7874917∗a+6.1995044∗b
15
a= 2.4912
b= 1.0745
Y^ =2.4912+1.0745∗ln( x)
16
Y^ =2.4912+1.0745∗ln (5,8)
Y^ =4.380
La utilidad de la empresa es de 4380 dólares
c) Cuando se invirtió en publicidad, si la empresa genero 6800 dólares de utilidad
^ =6.8
d) Y
6.8=2.4912+ 1.0745∗ln ( x )
6.8−2.4912=1.0745∗ln ( x )
4.3088
ln ( x )= =4.01
1.0745
e ln ( x )=e 4.01
x=e 4.01
x=55.1469
La inversión estimada será de 55146.9 dólares
Conclusiones
La regresión logarítmica sirve para usarlo cuando el diagrama de dispersión no tiende a una
línea recta.
El modelo e regresión logarítmica no es recomendado para usarlo en problemas relacionados a
los negocios ya que su crecimiento es demasiado lento.
Referencias bibliográficas
Referencias bibliográficas
https://reyesestadistica.blogspot.com/2011/07/analisis-de-regresion-logaritmica.html
https://www.bing.com/videos/search?
q=+modelo+de+regresion+logaritmica&&view=detail&mid=3FF20E8EBFF3AAB4A83E3FF20E8E
17
BFF3AAB4A83E&&FORM=VRDGAR&ru=%2Fvideos%2Fsearch%3Fq%3D%2Bmodelo%2Bde
%2Bregresion%2Blogaritmica%26qs%3Dn%26form%3DQBVR%26sp%3D-1%26pq
%3Dsupuestos%2Bde%2Bmodelo%2Bde%2Bregresion%2Blogaritmica%26sc%3D0-44%26sk
%3D%26cvid%3D6C84B17A01124033B98B283D4DCACC67
Anexos
18