Estadistica 2 Unas
Estadistica 2 Unas
Estadistica 2 Unas
Por ejemplo, en qu medida, un aumento de los gastos en publicidad hace aumentar las
ventas de un determinado producto?, Cmo representamos que la bajada de temperaturas
implica un aumento del consumo de la calefaccin?,...
Objetivos
139
DEFINICIN: Consideremos una variable dependiente Y con una sola variable independiente
X. Representemos una muestra aleatoria de tamao n de (X, Y) por el conjunto de
observaciones formadas por pares de variables: {(Xi, Yi) / i = 1,2,,n}
A travs de esta muestra, se desea estudiar la relacin existente entre las dos variables X e Y.
Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un
modelo de Regresin Simple.
Y es una funcin de X
Y = f(X)
Como Y depende de X,
Y: Es la variable dependiente, y
X: Es la variable independiente.
En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y
cul es la variable independiente.
La variable dependiente es la variable que se desea explicar, predecir. Tambin se le llama
REGRESANDO VARIABLE DE RESPUESTA.
La variable Independiente X se le denomina VARIABLE EXPLICATIVA REGRESORA y se le
utiliza para EXPLICAR a Y.
140
Variable independiente
variable explicativa
Predicha
Predictora
Regresada
Regresora
Respuesta
Estmulo
Endgena
Exgena
Resultado
Covariante
Variable controlada
Variable control
Datos. Las variables dependientes e independientes deben ser cuantitativas. Las variables
categricas, como la religin, estudios principales o el lugar de residencia, han de
decodificarse como variables binarias (dummy) o como otros tipos de variables de contraste.
Los supuestos para el modelo de regresin lineal simple son:
a) Igualdad de varianzas (homoscedasticidad).
Para cada valor xi de la variable independiente X, la distribucin de la variable aleatoria
dependiente Yi tiene media , y varianza 2 . Se supone que cada una de estas
en una lnea recta denominada lnea de regresin poblacional, cuya ecuacin es:
(Y/Xi) = = +
141
1. Diagrama de dispersin: grfica que describe la relacin entre las dos variables de
inters.
Variable dependiente: la variable que se pronostica o estima.
Variable independiente: la variable que proporciona la base para la estimacin. Es la
variable predictora.
2. Modelo de regresin lineal simple
Propsito: determinar la ecuacin de regresin; se usa para predecir el valor de la
variable dependiente (Y) basado en la variable independiente (X). El modelo es:
= 0 + 1 +
3. Estimacin de los parmetros del modelo de regresin
Procedimiento: seleccionar una muestra de la poblacin y enumerar los datos por pares
para cada observacin; dibujar un diagrama de dispersin para visualizar la relacin;
determinar los estimadores de los parmetros 0 , y 1 del modelo de regresin. La
ecuacin de regresin estimada es:
= 0 + 1
Donde:
142
Y
DE LA ECUACIN DE REGRESIN POBLACIONAL, A
ESTIMACIN DE LOS PARMETROS
b1
x y
xy
x
( x )
Suma de productos XY
SP. XY
SC. X
suma de cuadrados de X
b0
y b x
n
: Nivel de significac in
( )2 = ( )2 + ( )2
=1
=1
SCT
=1
SCE
SCR
Grficamente.
143
SCT y
2
SCR 1 (
( y ) 2
n
x y )
xy
SCR ( x
2
1
( x) 2
n
Fuente de
variacin
Debido a la regresin
Suma de
cuadrados
SCR
Grados de
libertad
P-1
Cuadrados
medios
CMR=SCR/1
SCE
n-P
CME=SCE/(n-2)
SCT
n-1
Debido al error
Total
F calculado
(Fc)
CMR/CME
(Y Y )
n2
b0 y b1 xy
n2
S y. x
SCE
CME
n2
144
CME
s b1
SCX
( x 2 )CME
nSCX
CME
SCX
s b1
( x 2 )CME
nSCX
b0 t n 2; sb0 0 b0 t n 2; sb0
b1 t n 2; sb1 1 b1 t n 2; sb1
Prueba individual de significacin de los estimadores de j del modelo (Prueba t-student)
PARA 0
Hiptesis
H 0 : 0 0
H1 : 0 0
Nivel de significac in :
Estadistic a de prueba : t c
b0
t n 2;
sb0
PARA
si t c t n 2;
si t c t n 2;
Hiptesis
H 0 : 1 0
H 1 : 1 0
Nivel de significac in :
Estadistic a de prueba : t c
b1
t n2;
sb1
si t c t n2;
145
Anlisis de correlacin: se usa un grupo de tcnicas estadsticas para medir la fuerza de la relacin
(correlacin) entre dos variables.
Correlacin cero
Frmula para r
x y
xy n
( x )
( y )
( x
)( y
n
n
2
SCR
SCE
1
SCT
SCT
146
Coeficiente de determinacin
El coeficiente de determinacin, r2 es la proporcin de la variacin total en la variable
dependiente Y que est explicada por o se debe a la variacin en la variable
independiente X.
El coeficiente de determinacin es el cuadrado del coeficiente de correlacin, y toma
valores de 0 a 1.
Ms sobre el coeficiente de determinacin
r n2
t n 2;
1 r2
Decisn : Re chazar H 0 si t c t n 2; prueba bilateral
si t c t n 2;
si t c t n 2;
6. Prediccin.
y t
n 2;1
1 ( X X )2
1 ( X X )2
CME (
Y y t
CME
(
n 2;1
n
SCX
n
SCX
2
147
y t
n 2;1
1 ( X X )2
1 ( X X )2
CME (1
Y y t
CME (1
n 2;1
n
SCX
n
SCX
2
t = 1.9055,
Se rechaza H0 si t > 3.143 o si t< -3.143, gl = 6, =0.02. No se rechaza H0
v) Use la informacin del primer ejemplo: calcule el error estndar de la estimacin:
a) desarrolle un intervalo de confianza de 95% para los libros de 650 pginas: [24.03,
30.25]. Verifique
b) desarrolle un intervalo de prediccin de 95% para un libro de 650 pginas: [18.09,
36.19] Verifique
149
160
140
120
100
80
60
40
20
0
0
50
100
150
200
250
300
Resumen
Estadsticas de la regresin
Coeficiente de correlacin
mltiple
Coeficiente de determinacin
R^2
R^2 ajustado
Error tpico
Observaciones
ANLISIS DE VARIANZA
Fuente de
Grados de
Suma de
0.98084737
0.96206156
0.95731926
6.49300323
10
Cuadrados
Valor crtico de
150
libertad
Regresin
Residuos
Total
cuadrados
8552.7272
7
337.27272
7
8890
Medios
8552.72727
F
202.86792
5
5.7527E-07
42.1590909
Residuos
4.81818182
-10.3636364
4.45454545
-0.72727273
4.09090909
-1.09090909
-6.27272727
3.54545455
8.36363636
-6.81818182
Y(Peso
medio %)
X2
Y2
XY
100
10000
92
8464
184
95
16
9025
380
90
64
8100
720
12
98
144
9604
1176
16
85
256
7225
1360
151
30
67
900
4489
2010
SUMA
72
627
1384
56907
5830
REGRESIN LINEAL:
XY
X
X Y
n
X 2
1 -0.96225577
72 627
7
72
1384
7
5830
Y X 627 0.96225577 72
0 99.4689165
n
Ecuacin
Y 0 1 X Y 99.4689165 - 0.96225577 X
Comportamiento:
CORRELACIN:
X2
X Y
72 627
n
7
2
2
2
72 56907 627 2
Y 2 Y
1384
7
7
n
n
XY
X
5830
-0.89382905
Coeficiente de determinacin:
2 - 0.893829052 2 0.79893037
152
El 80% de Y depende de X
ANLISIS DE VARIANZA:
Y
Y
n
SCTOTAL
SC REGRESIN
627 2
56907
745.714286
7
X 2
72 2
2
-619.142857
1 X
-0.962255771384
n
7
S.C.
G.L.
C.M.
Regresin
619.14
619.14
Error
126.57
745.714
2
25.31
TOTAL
F.C.
24.4582
Sig.
**
124.28
22
20.8
484
432.64
457.6
22
22.3
484
497.29
490.6
153
24
24.1
576
580.81
578.4
24
25.6
576
655.36
614.4
26
25.7
676
660.49
668.2
26
27.2
676
739.84
707.2
28
27.3
784
745.29
764.4
28
28.8
784
829.44
806.4
30
29.4
900
864.36
882
10
30
31.9
900
1017.61
957
11
32
32.4
1024
1049.76 1036.8
12
32
33.8
1024
1142.44 1081.6
13
34
32.8
1156
1075.84 1115.2
14
34
34.1
1156
1162.81 1159.4
15
36
32.4
1296
1049.76 1166.4
16
36
37.9
1296
1436.41 1364.4
17
38
38
1444
1444
1444
18
38
36.5
1444
1332.25
1387
19
40
39
1600
1521
1560
20
40
41
1600
1681
1640
SUMA
620
621
19880
19918.4
19881
REGRESIN LINEAL:
XY
X
X Y
n
X 2
1 0.95454545
620 621
20
6202
19880
20
19881
154
0 1.45909091
Ecuacin
n
20
20
Y 0 1 X Y 1.45909091 0.95454545 X
Comportamiento:
CORRELACIN:
X2
X Y
620 621
n
20
2
2
2
2
620
621
2
Y
19880
19918.4
20
20
n
n
XY
X
19881
0.97212152
Coeficiente de determinacin:
Nota
2 0.972121522 2 0.94502025
:
El 95% de Y depende de X
ANLISIS DE VARIANZA:
Y
Y
n
6212
19918.4
636.35
SCTOTAL
20
X 2
620 2
2
630
0.9545454519880
SC REGRESIN 1 X
n
20
Hiptesis
155
F.C.
1785.8268
Sig.
**
REGRESIN: Consiste en determinar una relacin funcional entre las variables con el fin de
que se pueda predecir el valor de una variable (dependiente) en base a otra(s) variables
(independientes).
Los modelos para un anlisis de regresin mltiple son similares a los de regresin lineal
simple, excepto que contienen ms trminos y pueden servir para proponer relaciones ms
complejas que una lnea recta en lugar de usar un modelo de lnea recta E(y) =0 + 1 X ,
para modelar el componente determinstico podramos emplear el modelo cuadrtico E(y)
=0 + 1X + 2X2 , Tambin conocido como modelo de segundo orden se representa
156
utilizaramos
un
modelo
de
tercer
orden:
Estos modelos e denominan modelos lineales generales porque E(y) es funcin lineal de
los PARMETROS desconocidos 0, 1, 2...
X
E(y) 0
1 X 1 2 X 2 3 X 3 4 X 4 5 X 5 6 X 6
Las variables ficticias introducen al parmetro apropiado ( de que puede ser positivo o
negativo) dependiendo del da de la semana. As: En domingo X1= 1, X2 = X3, ...., = X6 = 0 y el
valor medio de Y es:
157
En lunes
En martes
En mircoles
En jueves
En viernes
E(y) =0 + 1(1)
E(y) =0 + 1
E(y) =0 + 2
E(y) =0 + 3
E(y) =0 + 4
E(y) =0 + 5
E(y) =0 + 6
En sbado se asigna 0 a todas las variables ficticias y el valor medio de Y es: E(y) =0
Se recomienda seleccionar el modelo de regresin apropiado para una situacin en
particular. Ningn mtodo estadstico puede compensar una mala seleccin del modelo.
Propondremos un anlisis ms profundo al respecto en una prxima sesin. En el presente su
pondremos que se ha seleccionado un modelo razonable para la situacin y nos
concentraremos en el procedimiento de ajuste del modelo a un conjunto de datos y en los
mtodos asociados de inferencia estadstica.
Despus de haber seleccionado una porcin determinstica de un modelo de regresin, esto
es para E(y) agregamos un componente a fin de compensar el error aleatorio, de modo que
se tiene:
Y = E(y) +
Componente
aleatorio
Componente
Deterministico
El componente aleatorio debe obedecer los supuestos del modelo de regresin lineal:
Tenga distribucin normal con media 0 y varianza 2. Esto implica que la media de Y
equivale al componente deterministico
E(y) 0 1 X 1 ... k X k
Para todos los valores de las variables independientes X1, X2, X3,..., Xk la varianza de
es constante.
Los errores aleatorios asociados a cualquier par de Y son independientes (en sentido
probabilstico).
DESCRIPCIN DE LOS DATOS Y DEL MODELO:
158
X1
X2
X3
...
Xk
Y1
X11
X12
X13
Y2
X21
X22
X23
Y3
X31
X32
X33
...
X3K
...
...
...
Yn
Xn3
Xnk
Xn1
Xn2
...
X1K
...
X2K
Las relaciones entre la variable Y con las variables X1, X2, X3, ..., Xk, donde cada observacin
(Xi1 Xi2
Xi3 ...
Xik , Y) satisface
el modelo lineal general de regresin
siguiente:
Yi 0 1 X i1 2 X i 2 3 X i3 ... k X ik i
Cada modelo describe un hiperplano en el espacio k-dimensional formado por {Xi }
Donde:
Yi:
X1, X2, X3, ..., Xk: variables independientes. Podran en realidad representar los
cuadrados cubos productos cruzados u otras funciones
(sen, log. Etc.) de las variables de prediccin. Lo esencial
es que se pueden medir sin error cuando se observe un
valor de
Y y
que
no intervengan parmetros
desconocidos.
j:
Parmetros
de
la
regresin
constantes
de
159
Los coeficientes j : 0,k son estimados por el mtodo de mnimos cuadrados, as:
El modelo:
Yi 0 1 X i1 2 X i 2 3 X i3 ... k X ik i
Despejando i y elevando al cuadrado ambos miembros:
(i)2= (Yi
( 0 1 X i1 2 X i 2 3 X i3 ... k X ik )) 2
i 1
i2
(Yi ( 0 1 X i1 2 X i 2 3 X i 3 ... k X ik )) 2
i 1
i 1
i2
(Yi Yi ) 2 SSE
i 1
SSE
0
0
SSE
0
1
SSE
0
2
.
.
.
SSE
0
k
160
n
SSE
2 (Yi ( 0 1 X i1 2 X i 2 3 X i 3 ... k X ik ))(1)
0
i 1
Introduciendo el operador SUMATORIA e Igualando a cero, queda:
Yi (n 0 1X i1 2 X i 2 3X i3 ... k X ik ) 0
Osea: (despejando e intercambiado miembros):
n 0 1X i1 2 X i 2 3X i3 ... k X ik Yi
Esta es una ecuacin lineal en los parmetros. Las ecuaciones de
mnimos cuadrados restantes todas lineales en los parmetros son:
0 X ik 1X ik X i1 2 X ik X i 2 ... k X ik2 X ik Yi
Luego el sistema es:
n 0 1X i1 2 X i 2 3X i3 ... k X ik Yi
161
0 X ik 1X ik X i1 2 X ik X i 2 ... k X ik2 X ik Yi
El sistema tiene p = k +1 ecuaciones e incgnitas
Como puede verse, escribir k+1 ecuaciones lineales de mnimos cuadrados
ya cuesta trabajo, resolverlos simultneamente a mano es todava ms
difcil. Una forma fcil de expresar las ecuaciones y resolverlos es
mediante el lgebra de Matrices
Donde:
X1 X2 X3 Xk:
Variables de prediccin
error aleatorio
p = k +1: nmero de parmetros del modelo
k: Nmero de variables de prediccin
Supongamos que se tiene una muestra de tamao n
denota as:
Valor
de
Variables explicatorias
Datos
X1
X2
Y1
X11
X12
Y2
X21
X22
X3... Xk
X13...X1K
X23...X2K
( n k ) que se
Error
aleatorio
1
2
162
Y3
X31
X32
X33...X3K
. ....
. ....
. ....
Yn
Xn1
Xn2
Xn3 Xnk
En notacin matricial:
En forma desarrollada puede verse as:
nx1 1
Y1
Y
2
Y3
.
.
.
Y
n
nx1
X11
X12
X 21
X 22
X31
X32
.
.
.
.
.
.
X n1
X n2
= X
1
2
.
.
. . .
.
. . .
.
X n3 X np k px1 n nx1
nxp
nxp .
px1
nx1
Matriz de error
Matriz de parmetros coeficientes
De regresin
k: nde variables Xs
p= k +1 n de parmetros
Matriz de datos xs
Matriz de los datos Ys
OBSERVACIONES:
La primera columna de X es una columna de unos, es decir estamos
insertando un valor de X, especficamente X0 como coeficiente de
donde X0 es una variable que siempre toma valores iguales a 1.
163
( 0 1 2 3 ) '
y
y X , donde y Y
el
modelo
de
estimacin
es
Ahora bien:
ESTIMACIN DE LOS PARMETROS
Utilizamos las matrices de datos Y y X, sus transpuestas y la matriz
( 0 1 2 3 ) ' ,
cuadrados, as:
El modelo:
Despejando
y X
y X
' ( y X )'( y X )
164
'
2 X ' y 2 X ' X
Igualando a cero:
2 X ' y 2 X ' X 0
Obtenemos:
X ' X X ' y
= (XX)1 XY
165
Y1
Y
2
Y3
.
.
.
Y
n
nx1 1
X11
X12
X 21
X 22
X31
X32
.
.
.
.
.
.
X n1
X n2
.
.
. . .
.
. . .
.
X n3 X np k px1 n nx1
nxp
SE ESCRIBE:
X11
X12
X ' X X13
X1k
1
X 21
1 1
X 31 X n1
X 22
X32
X n2
X 23
X33
X n3
X 2k
X3k
X nk
1
1
1
.
.
.
1
pxn
X11 X12
X 21 X 22
X31 X32
.
.
.
.
.
X n2
X n1
.
. .
.
. .
.
. .
X n3 X nk nxp
El producto resulta:
Xi1
Xi2
X ' X Xi3
Xik
Xi1
Xi2
Xi3
2
Xi1
Xi1 Xi2
Xi1 Xi3
...
Xi1Xi2
2
Xi2
Xi2 Xi3
...
Xi1Xi3
Xi2Xi3
2
Xi3
Xi1Xik
X i 2 X ik
...
Xi3Xik
Xik
Xi1 Xik
Xi2 Xik
Xi3Xik
166
es matriz cuadrada. El
clculo de su
X11
X12
X ' Y X13
X1k
1
X 21
1
1
X 31 X n1
X 22
X32
X n2
X 23
X33
X n3
X 2k
X3k
X nk
Y1
Y2
Y3
.
.
.
Y
pxn n
Yi1
X Y
i1 1
X i 2Y2
X
Y
i
3
3
X Y
nx1 ik n px1
0
1
1
( X ' X ) X ' Y 2
K
Y el modelo de regresin estimado es:
Yi 0
j X ij ;
i 1, n
j 1, k
j 1
Y X
CARACTERSTICAS
DE
LOS
ESTIMADORES
DE
MINIMOS
CUADRADOS
a.
ESPERANZA MATEMTICA DE
E( ) =
Demostracin:
167
E( )=
E( )=
E ( ) ( X ' X ) 1 X ' E ( )
E( ) =
b. VARIANZA Y COVARIANZA DE
Var-cov( )=
2 ( X ' X ) 1
Demostracin:
Var-cov( )=E( -E( ))( -E( ))
Var-cov( )=E( - )( - )
Observe que:
( X ' X ) 1 X ' Y
donde Y X
( X ' X ) 1 X ' ( X )
( X ' X ) 1 X ' X ( X ' X ) 1 X '
( X ' X ) 1 X '
( X ' X ) 1 X '
Var-cov( )=E[( ( X ' X )
Var-cov( )=E[ ( X ' X )
Var-cov( )= ( X ' X )
Observe:
Var-cov( )= ( X ' X )
X ' 2 I n X ( X ' X ) 1
Var-cov( )= ( X ' X )
X ' X 2 I n ( X ' X ) 1
168
( X ' X ) 1
se
c00
c
10
1
( X ' X ) c20
ck 0
ck1 ck 2 ck 3 ckk pxp
SE ( j ) c jj ,
Donde
j , i
Donde
i j
cov( i j )= 2 cij 2 c ji
169
EN EL MODELO DE REGRESIN
MLTIPLE
Las varianzas de los estimadores de los parmetros y de Y dependen del
valor de 2 (varianza del error aleatorio
n p
n p
SCT Y ' Y nY 2
SCR X ' Y nY 2
170
Fuente de
variacin
Debido a la regresin
Suma de
cuadrados
SCR
Grados de
libertad
P-1
Cuadrados
medios
CMR=SCR/1
SCE
n-P
CME=SCE/(n-2)
SCT
n-1
Debido al error
Total
F calculado
(Fc)
CMR/CME
SOBRE
LOS
COEFICIENTES
INDIVIDUALES
DE
REGRESIN
Estas pruebas son tiles para determinar el valor potencial de cada una de
las variables de regresin del modelo, as el modelo puede ser mas eficaz
con la inclusin de variables adicionales o quiz con la eliminacin de una
o ms regresoras presentes en el modelo
Hiptesis
H0 : j =0
H1 : j 0
ESTADSTICA DE PRUEBA
171
TO
j
2 c jj
DECISIN:
Rechazar H0 si |To|> tn-p para un
de significacin
CONCLUSIN
Si no se rechaza la hiptesis H0 indica que el regresor Xj puede
eliminarse del modelo
MEDIDAS DE ADECUACION DEL MODELO
a.
R2
SSR
SSE
1
,
SCT
SCT
0 R2 1
R2 R
de variables de regresin X1 X2 X3 Xk
R es una mediad de asociacin lineal que existe entre Y y X 1 X2 X3 Xk.
Cuando k=1 tenemos el coeficiente de correlacin simple entre Y y X
Ejercicio resuelto:
El consumo de un producto x de la empresa Agraroindustrial Naranjillo Ltda. de la
ciudad de Tingo Mara, se ha venido observando que a travs del tiempo ha tenido
una demanda permanente que se muestra en el siguiente cuadro :
172
CONSUMO/VENTAS
PRECIO
2002
45
2003
50
2004
60
2005
55
2006
64
11
2007
68
10
2008
70
12
2009
72
11
2010
75
15
2011
80
14
173
= 0 + 1 1 + 2 2 +
Dado que:
AO
CONSUMO/
VENTAS
Yt
X1t
2002
45
2003
50
2004
PRECIO
INGRESO
FAMILIAR
Yt2
X1t2
2025
49
14
315
90
2500
64
24
400
150
60
3600
81
36
16
540
240
2005
55
3025
81
27
495
165
2006
64
11
4096
121
55
25
704
320
2007
68
10
4624
100
50
25
680
340
2008
70
12
4900
144
72
36
840
420
2009
72
11
5184
121
55
25
792
360
2010
75
15
5625
225
105
49
1125
525
2011
80
14
6400
196
84
36
1120
480
TOTAL
639
106
46
41979
1182
522
234
7011
3090
X2t
X2t*Yt
Reemplazando en la frmula:
174
0
(1 ) =
2
1
=1
( =1
1
=1
2
=1
2
1
=1
=1
1 2
=1
=1
2 1
2
2
=1
=1
0
10
(1 ) = (106
46
2
A
2
) ( =1
)
106
46
639
1182 522) (7011)
522 234 3090
B
-1
Hallamos la inversa de A :
106
1182 522
106 522
Det(A)= (10) (
) (106) (
) + (46) (
522 234
46 234
46
Det(A)= 1248
Cof(A):
1182 522
A11= (1)2 (
) = 4104
522 234
A12 = (1)3 = (
106
46
1182
)
522
522)
= 792
234
106 1182
) = 960
A13 =(1)4 = (
46
522
106 46
) = 792
A21 = (1)3 = (
522 234
10
A22 =(1)4 = (
46
46
) = 224
234
10
A23 =(1)5 = (
46
106
) = 344
522
106
A31 =(1)4 = (
1182
46
) = 960
522
10
A32 =(1)5 = (
106
46
) = 344
522
10
A33 =(1)6 = (
106
106
) = 584
1182
Adjunta(A)
175
792
224
344
960
344)
584
792
224
344
960
639
344) (7011)
584
3090
(1 ) = ( 1.13 )
4.98
2
t = 0 + 1X1t + 2 X 2t
Y
t
Y
1
= 1.13
t
Y
2
= 4.98
2
Y nY
=
=
2
2
0
2
(1 ) ( 1 ) () ( )
2
2
2 =
2
2
() (
)
28.96
639
639 2
( 1.13 ) (7011 ) (10) (
)
10
3090
2 = 4.98
639 2
41979 (10) (
)
10
2 = 0.88908228 88.91 %
Interpretacin: El 88.91 % de la fluctuacin de las ventas viene siendo explicado por
el precio(1 ) y el ingreso familiar (2 ), durante los aos comprendidos entre 2002 al
2011.
)
Coeficiente de determinacin ajustado (
2 = 1 (
2 = 1 [
1
)(
)
Y 1
][
]
2
177
28.96
639
41979 ( 1.13 ) (7011)
4.98
3090 [10 1]
2 = 1
10 3
639 2
41979 (10) (
)
10
[
]
2 = 1 0.1426085
2 = 0.8573915 85.74 %
Interpretacin:
Los precios y el ingreso familiar tienen mucha influencia en el consumo del producto
X, por lo tanto no es necesario incorporar otra variable independiente en el modelo
Anlisis de Varianza (ANVA)
FUENTE DE
VARIACION
GRADOS DE
LIBERTAD
SUMA DE
CUADRADOS
CUADRADO
MEDIO
COCIENTE
F
DEBIDO A LA
REGRESION (E)
SCE =1019.69
= 509.84
= 36.07
k-1=3-1=2
DEBIDO AL
ERROR DELA
MUESTRA (R)
n-k=10-3=7
SCR = 127.21
=14.13
TOTAL(T)
n-1=10-1=9
SCT = 1146.90
2
= Y nY
28.96
639
639 2
= ( 1.13 ) (7011) (10) ( )
10
4.98
3090
= 1019.69
= 2
= 41979 (10) (
639 2
10
178
= 1146.90
=
= 1146.90 1019.69
= 127.21
1019.69
127.21
31
= 509.84
=
101
= 14.13
=
509.84
14.13
= 36.07
Prueba de relevancia global:
1) Planteamiento de hiptesis
: 0 = 1 = 2
: 0 1 2
2) Nivel de significancia
= 5 % 0.05
3) Punto critico
179
2 =
0
2
(1 ) ( 1 )
2
2
2 =
28.96
639
(
)
(
41979 1.13
7011)
4.98
3090
2 =
10 3
2 = 18.17
() = 2 ( Y)
=1
21
() = 2 1
=1
=1
( =1
)
(
0
=1
1 2
=1
2 1
=1
=1
,
)
() = ((
1 0
,
)
(
1
,
) (
,
)
(
0 1
0 1
)
(
1
,
)
(
2 1
,
))
(
1 2
)
(
2
10 106 46 1
() = 18.17 (106 1182 522)
46 522 234
180
() =
18.17 4104
(792
1248 960
(0 )
((1 , 0 )
(1 , 0 )
(0 , 1 )
(1 )
(2 , 1 )
792
224
344
960
344)
584
(0 , 1 )
59.76 11.53
3.26
(1 , 2 )) = (11.53
13.98
5.01
(2 )
13.98
5.01)
8.50
1 1
(1 )
1.13
3.26
0.6282
= 0.6282
5) Conclusiones
tc < t7;0.025 ( 0.6282 < 2.36 ).Entonces AHo, es decir el efecto del precio
no explica significativamente el comportamiento del consumo/ventas del
producto X de la empresa Agraroindustrial Naranjillo Ltda.
:
Para
181
2 2
(2 )
4.98
8.50
= 1.7079
5) Conclusiones
tc <t7;0.05 ( 1.71 < 2.36).Entonces AHo, es decir el efecto del ingreso
familiar no explica el comportamiento del consumo/ventas del producto X
de la empresa Agraria Industrial Naranjillo ltda .
Pronostico para 2 aos:
AO
2012
2013
PRECIO
15
16
INGRESO
FAMILIAR
7
8
CONSUMO/VENTAS
81
87
Y2012 = 80.85 = 81
182
Y2013 = 86.96 = 87
184
185
2.1.- Estadsticos
Con el botn Estadsticos accedemos al cuadro de dilogo que muestra la figura 2 que
nos nos vale para solicitar resultados estadsticos opcionales, incluyendo los coeficientes
de regresin, descriptivos, estadsticos de ajuste del modelo, la prueba de Durbin-Watson y
diagnsticos de la colinealidad.
Figura 55.
Cuadro de dilogo estadisticos
186
Coeficientes
de
regresin.
En
este
recuadro
podemos
obtener
tanto
las
estimaciones de los coeficientes de regresin, la bondad del ajuste del modelo elegido,
los intervalos de confianza de cada coeficiente as como la matriz de covarianzas. Podemos
elegir una o ms de las opciones:
187
valores
mayores
de
indican
188
Grficos de residuos tipificados. En este recuadro podemos elegir uno de los grficos:
Histograma: Crea un histograma de los residuos tipificados con una curva normal
superpuesta.
de
la
independientes.
189
El botn Guardar nos permite guardar los valores pronosticados, los residuos y
medidas relacionadas como nuevas variables que se aaden al archivo de datos de trabajo.
En los resultados una tabla muestra el nombre de cada nueva variable y su contenido.
2.4.- Opciones
El botn Opcionesnos permite controlar los criterios por los que se eligen las
variables para su inclusin o exclusin del modelo de regresin, suprimir el
trmino constante y controlar la manipulacin de los valores perdidos.
Aplicacin.
Vamos a realizar un anlisis de regresin lineal simple para estudiar la posible relacin
entre
Las ventas de un determinado producto (variable dependiente) y los gastos en publicidad
(variable independiente) en una muestra de 15 productos. La figura muestra la matriz de
datos q se va a analizar.
Editor de datos SPSS vista de variables.
190
191
192
193
194
Frecuencia
Media =-6,94E-16
Desviacin tpica =0,964
N =15
0
-3
-2
-1
1,0
0,8
0,6
0,4
0,2
0,0
0,0
0,2
0,4
0,6
0,8
1,0
Ejercicios propuestos.
1) El gerente de personal de la empresa agroindustrial Naranjillo estudia la relacin entre los
gastos y los salarios de su personal obrero. Una muestra aleatoria de 10 obreros revel los
siguientes datos en dlares por semana:
Gastos 25 20 32 37 40 40 45 30 55 60
Salarios 28 25 35 40 45 50 50 35 70 80
a) Trace el diagrama de dispersin e indicar si existe cierta dependencia lineal entre las
variables.
b) Halle la ecuacin de la recta de regresin estimada Y = f(x)
c) Interprete y/o de su comentario sobre el valor de la pendiente.
d) Estime el gasto que correspondera a un salario semanal de 90 dlares.
e) Pruebe la significacin de la pendiente de la regresin muestral con nivel de confianza
del 95%
f) Utilice el mtodo de anlisis de varianza para probar la significacin de la ecuacin de
regresin muestral, al nivel de significancia del 5%.
g) Calcule el coeficiente de correlacin (r) y el coeficiente de determinacin r2, e
interprete los resultados.
2) Se obtuvieron los siguientes datos para determinar la relacin entre cantidad de fertilizantes
y produccin de papa por hectrea.
Sacos de fertilizantes por hectrea. 3 4 5 6 7 8 9 10 11 12
Rendimiento en kg.
45 48 52 55 60 65 68 70 74 76
196
2.1
0
3.5
2
2.1
0
2.5
5
3.5
0
3.5
0
2.9
9
2.9
9
2.2
5
X2 X3 Y
12 1 280
15 0 300
16 1 320
16 1 350
17 1 390
18 0 420
19 1 480
23 0 430
24 0 490
26 1 510
30 1 550
32 1 590
200