Correlación y Regresión Simple
Correlación y Regresión Simple
Correlación y Regresión Simple
simple
100
90
80 Pesa 76 kg.
70
30
140 150 160 170 180 190 200
Relación entre variables.
100
ur a
alt
90 l a
con
80 nt a
m e
u
70
es oa
el p
60
que
ece
50 r
Pa
40
30
140 150 160 170 180 190 200
Predicción de una variable en función de la otra
Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea,
el peso aumenta en una unidad por cada unidad de altura.
100
90
80
70
10 kg.
60
50
40 10 cm.
30
140 150 160 170 180 190 200
Relación directa e inversa
330 100
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Relación
inversa Relación
perfecta directa
Variables
casi
incorreladas
perfecta
-1 0 +1
Correlaciones positivas o de relación directa
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Correlaciones negativas o de relación inversa
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Animación: Evolución de r y diagrama de dispersión
Preguntas frecuentes
¿Si r=0 eso quiere decir que las variables son no independientes?
En la práctica, casi siempre sí, pero no tiene por qué ser cierto en todos
los casos.
Lo contrario si es cierto: Independencia implica incorrelación.
Explicada
X = Variable independiente
Predictora
Explicativa
15
Modelo de regresión lineal simple
En el modelo de regresión lineal simple, dado dos variables
Y (dependiente)
X (independiente, explicativa, predictora)
buscamos encontrar una función de X muy simple (lineal) que nos permita
aproximar Y mediante
Ŷ = b0 + b1X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
Y e Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión.
A la cantidad
e=Y-Ŷ se le denomina residuo o error residual.
16
Interpretación de la ecuación lineal
Si se posee información sobre el No de reparaciones X Y
de motor (x) y el costo de mantenimiento en miles de 1 2
Bs. (y), Se podría obtener la siguiente ecuación de
regresión: 2 4
3 2
Y= 0,8665 + 0,8970 X
4 4
5 6
b0 = 0,8665 es una constante que representa el valor del
costo de mantenimiento cuando el número de 6 8
reparaciones es cero. Es decir, indica el nivel de costo 7 6
de mantenimiento que no depende del número de
reparaciones. Este es de 0,8665 miles de Bs. 8 5
14
12
10
B1= 0,897
f(x) = 0.9 x + 0.87
8
2
b0=0,866
0
0 2 4 6 8 10 12
El modelo lineal de regresión se construye utilizando la técnica de estimación
mínimo cuadrática:
Buscar b , b de tal manera que se minimice la cantidad
0 1
Σ e2
i i
280
230
Baja
bondad de 180
ajuste
130
80 r=0,1
Coeficiente de determinación r2
30
140 150 160 170 180 190 200
100
90
80
Alta 70
bondad 60
de ajuste
50
40 r=0,8
30
140 150 160 170 180 190 200
Otros modelos de regresión
Se pueden considerar otros tipos de
modelos, en función del aspecto que ¿recta o parábola?
presente el diagrama de dispersión
(regresión no lineal)
¿recta o cúbica?
21
Modelos de análisis de regresión