Regresion y Correlacion
Regresion y Correlacion
Regresion y Correlacion
Regresión y Correlación
Relaciones entre variables
Francis Galton
•Primo de Darwin
“Cada peculiaridad en un hombre es compartida por •Estadístico y aventurero
•Fundador (con otros) de
sus descendientes, pero en promedio , en un grado la estadística moderna
menor. Regresión a la media” para explicar las teorías
de Darwin.
Regresión y Correlación
Conclusión
Regresión y Correlación
Modelo de Regresión Lineal
Yi x i i
Error
Residual
Parámetros
Parte sistemática
Regresión y Correlación
Elementos del Modelo
Regresión y Correlación
Supuestos del Modelo
( x1 , y1 ) , ( x2 , y2 ) , ... , ( xn , yn )
Yi x i i
Modelo de Regresión
y i ~ N ( E (Y / x i ), 2 )
Recta de Estimación y a b. x
Regresión y Correlación
Regresión Lineal
Algebra de la Muestra.
Predicha
Explicada
X = Variable independiente
Predictora
Explicativa
Regresión y Correlación
Estudio conjunto de dos variables
Regresión y Correlación
Diagramas de dispersión o nube de puntos
100
90
80 Pesa 76 kg.
70
60
Regresión y Correlación
Relación entre variables.
100
90
ur a
80 al t
n la
co
70
en ta
aum
60 e so
p
El
50
40
30
140 150 160 170 180 190 200
Regresión y Correlación
Predicción de una variable en función de la otra.
El peso aumenta 10Kg por cada 10 cm de altura... o sea,
el peso aumenta en una unidad por cada unidad de altura.
100
90
80
70
10 kg.
60
50
40 10 cm.
30
140 150 160 170 180 190 200
Regresión y Correlación
Estimación
a ˆ Existen dos métodos para hallar los estimadores de y
que dan los mismos resultados.
b ˆ
Método de Máxima Verosimilitud
n
2 n
i i i
( y y ) [ y ( a b. x i )]2
Regresión y Correlación i 1 i 1
n
(a, b) [ yi a b. x i ]2 mín
i 1
(a, b)
0
a
(a , b)
0
a Y b. X
b
n n
xi . yi n. X .Y ( xi . X ).( yi Y ) Cov ( x , y )
b i 1
n
i 1
n
V ( x)
x 2
i n. X 2
( xi X ) 2
i 1 i 1
Regresión y Correlación
Covarianza de X e Y 1
cov( x, y ) ( xi x )( yi y )
n i
280 90
80
230
70
180
60
130 50
80 40
30 30
140 150 160 170 180 190 200
140 150 160 170 180 190 200
Para valores de X por encima de la media •Para los valores de X mayores que la media le
tenemos valores de Y por encima y por debajo corresponden valores de Y mayores también.
en cantidades similares. No existe relación
•Para los valores de X menores que la media le
corresponden valores de Y menores también.
Regresión y Correlación
Supuestos de los errores
e i yo yc 16
14
12
10
yo 8
i ~ N (0, 2 ) 6
4
0
0 1 2 3 4 5 6
cov( i , j ) 0 i j
Regresión y Correlación
100
90
80
70
ei en
yˆ a bx
60 e1
50
40
30
140 150 160 170 180 190 200
Regresión y Correlación
Interpretación de los coeficientes
b= pendiente de la recta
Regresión y Correlación
Otros modelos de Regresión
¿recta o parábola?
¿recta o cúbica?
Regresión y Correlación
Interpretación de la variabilidad en Y
Regresión y Correlación
Interpretación del residuo
Ahora en los errores de predicción (líneas
verticales). Los proyectamos sobre el eje Y. Y
Regresión y Correlación
100
Coeficiente de Determinación = r2
90 ŷ
80 Error no Explicado yo
Error total
70 Error Explicado
60
50 y
40
30
140 150 160 170 180 190 200
Regresión y Correlación
Error total = Error no Explicado + Error Explicado
y i Y y i yˆ i yˆ i Y
y yi y
ˆi y
2 2
i Y ˆi Y
y y ˆi y
n n
2 2
i Y i y ˆi Y
i 1 i 1
yi Y y i yˆ i yˆ i Y
n n n
2 2 2
i 1 i 1 i 1
V .T .V . N .E V .E .
Regresión y Correlación
V .T . V . N .E .V .E . V . N .E . V .E .
1
V .T . V .T . V .T . V .T .
V . N .E . V .E .
1 r 2
V .T . V .T .
0 r2 1
r 2 0 VE 0 VNE VT
r 2 1 VE VT VNE 0
No detecta el tipo de relacion
Regresión y Correlación
Coeficiente de Determinación
Resumiendo: Y
VNE
R 1
2
VT
S 2
e S 2
Y
Regresión y Correlación
Resumen sobre bondad de un ajuste
Regresión y Correlación
Coef. de correlación lineal de Pearson
Existe una relación lineal entre las variables, la cual está medida por el
coeficiente de correlación poblacional definido como :
cov( x, y )
n i 1
( xi X )( yi Y ) x i y i n XY
r r i 1
1 r 1
S ( x ).S ( y ) 1 n
( x nX )( y nY )
2 2 2 2
n
( xi X ) 2 ( yi Y ) 2 i i
i 1
2 2 2
Regresión y Correlación r (r ) 0 r 1; 1 r 1
Correlaciones Negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Regresión y Correlación
correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Regresión y Correlación
casi perfectas y positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
Regresión y Correlación
Animación: Residuos del modelo de regresión
Regresión y Correlación
INFERENCIA SOBRE EL COEFICIENTE DE CORRELACIÓN
Distribución del coeficiente de correlación muestral r
r
2
~ t n2
( n ) es pequeño 1 r
n2
H0 : = 0 H0 : X e Y son independientes
H1 : 0 H1 : X e Y no son independientes
Regresión y Correlación
DISTRIBUCIÓN DE LOS ESTIMADORES DE y
a ~ N ( , a )
a
~ N (0,1) con a e. xi2 e es desconocid o
a n. ( x i X ) 2
a
entonces ~ t n2
Sa
b e
b ~ N ( , b ) ~ N (0,1) como b e es desconocid o
b ( xi X ) 2
b
entonces ~ t n2 ,
Sb
Regresión y Correlación
VARIANCIA DE LA RECTA DE REGRESIÓN
Y X
i i i con i ~ N (0, 2 )
Yˆi ˆ ˆX i a bx i
E (Yˆi ) E (a ) E (b) x i xi
E ( yˆ i ) x i E ( yi )
yˆ i es un estimador no viciado de x i
Regresión y Correlación
V {Y b( x i X )}
V (Yˆi ) V (a bxi )
V (Yˆi ) V (Y ) ( x i X ) 2V (b)
2 V ( i )
2 2
V (Y ) e
n
2
2
V (Yˆi ) ( xi X ) 2 .
n ( xi X ) 2
1 ( x X ) 2
V (Yˆi )
2 i
2
n ( xi X )
Regresión y Correlación
ESTIMACIÓN DE LA MEDIA DE Yi
Yi ~ N ( . x i , e )
yˆ i ( . xi ) yˆ i yi
yˆ i
yˆ i
~ N (0,1)
yˆ i ( . x i ) yˆ i yi
~ t n2
yˆ i S ( yˆ i ) S ( yˆ i ) S ( yˆ i )
yˆ i t n 2; / 2 .S ( yˆ i ) yi yˆ i t n 2; / 2 .S ( yˆ i )
Regresión y Correlación
ESTIMACION DE UN FUTURO VALOR Yi PARA Xi FIJO
1 ( xi X ) 2
V(yˆ /x i ) V ( i ) V ( yˆ i ) .
2 2
2
n i( x X )
1 ( xi X ) 2
V ( yˆ / x i ) S 2
S .1
2
2
i
( yi ) e
n ( x X )
yˆ i t n 2; / 2 .S ( yi ) y yˆ i t n 2; / 2 .S ( yi )
Regresión y Correlación