Correlación y Regresión Lineal
Correlación y Regresión Lineal
Correlación y Regresión Lineal
•Concepto:
Correlación positiva
Una correlación es una medida o
grado de relación entre dos variables. Un
conjunto de datos puede ser
positivamente correlacionado,
negativamente correlacionado o no
correlacionado del todo.
Correlación nula
Correlación negativa o inversamente
proporcional r = (-).
Nos muestra que al cambiar una
variable en una determinada dirección
(en promedio), la otra lo hace en sentido
contrario u opuesto.
Tipos de Correlación
• Correlación Directa:
La correlación directa se da cuando al
aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de
puntos de la distribución es una recta
creciente
• Correlación Inversa:
La correlación inversa se da cuando al
aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de
puntos de la distribución es una recta
decreciente.
• Correlación nula:
La correlación nula se da cuando no hay
dependencia de ningún tipo entre las
variables.
En este caso se dice que las variables son
incorrelacionadas y la nube de puntos
tiene una forma redondeada.
Grado de Correlación
Correlación fuerte
•Correlación fuerte:
La correlación será fuerte cuanto más
cerca esté los puntos de la recta.
•Correlación nula:
Clasificación de la Correlación
•Según el signo:
⁻Correlación positiva: Dos variables tiene correlación
positiva cuando al aumentar o disminuir el valor de una
de ellas entonces el valor correspondiente a la otra
aumentará o disminuirá respectivamente, es decir,
cuando las dos variables aumentan en el mismo sentido.
⁻Correlación negativa: Dos variables tiene correlación
negativa cuando al aumentar o disminuir el valor de una
de ellas entonces el valor de la otra disminuirá o
aumentará respectivamente, es decir, una variable
aumenta y otra disminuye o viceversa.
Coeficiente de Correlación
•Concepto:
Para Sote (2005), el coeficiente de
correlación (r) se define como un
“indicador estadístico que nos permite
conocer el grado de relación, asociación
o dependencia que pueda existir entre
dos o más variables”. (p. 360)
Concepto:
En estadística el Coeficiente de
Correlación de Pearson es un índice
estadístico que mide la relación lineal entre
dos variables cuantitativas. A diferencia de la
covarianza, la correlación de Pearson es
independiente de la escala de medida de las
variables.
Siendo:
Sx: La covarianza
de (X,Y).
Sx y Sy: Las
desviaciones
típicas de las
El cálculo del coeficiente de distribuciones
correlación lineal se realiza dividiendo la marginales.
covarianza por el producto de las El valor del índice
desviaciones estándar de ambas variables. de correlación
varía en el
intervalo [-1, + 1]
Coeficiente de Correlación de Pearson
r= Coeficiente de Correlación.
Ejercicios
Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo
de correlación que existe entre ellas mediante el coeficiente de PEARSON.
X 18 17 15 16 14 12 9 15 16 14 16 18 SX =180
Y 13 15 14 13 9 10 8 13 12 13 10 8 SY= 138
Coeficiente de Correlación de Pearson
Resultado:
Una vez aplicada la
formula de correlación
de Pearson obtenemos
como resultado una
Correlación Moderada
de 0,416.
Valor Significado
0 Correlación nula
Concepto:
En probabilidad y estadística, la Ejercicios
covarianza es un valor que indica el grado de
variación conjunta de dos variables
aleatorias.
Si
Covarianza
xi yi xi · yi
Ejercicios
2 1 2
3 3 9
4 2 8
Las notas de 12 alumnos de
4 4 16 una clase en Matemáticas y
5 4 20 Física son las siguientes.
6 4 24 Hallar la covarianza de la
6 6 36 distribución.
7 4 28
7 6 42
8 7 56
10 9 90
10 10 100
72 60 431
Coeficiente de Correlación para Datos No Agrupados
Concepto:
Así en estadística podremos
calcular la correlación para datos no
agrupados con la siguiente formula.
n n n
n∑ xi y i − ∑ x i * ∑ y i
r= i= 1 i= 1 i= 1
n 2 n 2 n 2 n 2
n ∑ xi − ∑ xi n∑ y i − ∑ y i
i = 1 i= 1 i= 1 i = 1
En donde:
donde
R = coeficiente de correlación
N = número de pares ordenados
X = variable independiente
Y = variable dependiente.
Coeficiente de Correlación para Datos No Agrupados
Supóngase que
28 60 784 3600 1680 deseamos
obtener la
19 65 361 4225 1235 correlación de los
datos de la tabla
31 92 961 8464 2852 siguiente
Concepto:
De cualquier forma aquí también
estamos evaluando numéricamente si existe
relación entre dos variables y lo haremos con
la siguiente ecuación.
Tipos de correlación en cuanto al signo del
coeficiente “r”
c) Con la Covarianza