Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Coeficiente de Correlación Lineal Simple

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

ESTADÍSTICA GENERAL

COEFICIENTE DE CORRELACIÓN LINEAL SIMPLE (r)

El coeficiente de correlación lineal simple mide el grado de asociación entre las variables (X i, Yi), debido a
una causa o factor común aleatorio, el coeficiente de correlación lineal simple, está definido por:

r=
∑ x i y i−n x y
√ ∑ x 2i −n x 2 √∑ y 2i −n y 2
Propiedades.

i. El coeficiente de correlación lineal simple (r) solamente toma valores comprendidos en el


intervalo [-1, 1], esto es: r Є [-1, 1].
ii. El signo del coeficiente de correlación lineal simple (r) es el mismo que el signo de la pendiente
de la recta estimada, esto es: Signo(r)= Signo ( ^β ).
iii. Si r=1 nos indica que existe una asociación perfecta positiva, las observaciones se hallan sobre la
recta (Xi, Yi) estimada y que ambas variables crecen o decrecen.
iv. Si r= -1 nos indica que existe una asociación o relación perfecta negativa, si una de las variables
decrece la otra crece y viceversa.
v. Si r=0 nos indica ausencia de correlación o asociación entre variables en estudio.
vi. Si r¿ 0 nos indica un cierto grado de relación positivo o existe una correlación directa (+).
vii. Si r¿ 0 nos indica un cierto grado de relación negativa o existe una correlación inversa (-).

En cuanto a la correlación, tomaremos en cuenta lo siguiente:


 Perfecta: r = 1
 Excelente o muy buena: 0.90< r <1
 Buena: 0.80< r <0.90
 Regular: 0.50< r <0.80
 Baja: r <0.50

COEFICIENTE DE DETERMINACIÓN (r2).

Mide la proporción de variación total de los valores de la variable Y i, explicadas por las variaciones de X i.
Si el modelo de regresión usado es adecuado el coeficiente de determinación será alto (tiende a 1).

Ejemplos:
1. Los siguientes datos corresponden a la cantidad de fertilizantes en libras ( x i) y la cantidad de
trigo producida en toneladas al sembrar parcelas de 2 hectáreas cada una.

Fertilizante ( x i) 2 4 5 7 10 11 12 15
Producción ( y i 8 9 11 11 12 14 15 16
)

a) Grafica el diagrama de dispersión.


b) Calcule el coeficiente de correlación y de determinación e interprete cada uno.
SOLUCIÓN
Nº Fertilizante ( Producción xi × yi 2
xi
2
yi
x i) ( y i)
1 2 8
2 4 9
3 5 11
ESTADÍSTICA GENERAL

4 7 11
5 10 12
6 11 14
7 12 15
8 15 16
TOTAL

n = , ∑ x i y i=, ∑ x i=, ∑ y i=¿ , ∑ x 2i =, ∑ y2i =¿ ¿

x=
∑ x i = ❑ =, y= ∑ y i = ❑ =¿
n ❑ n ❑

COEFICIENTE DE CORRELACIÓN

r=
∑ x i y i−n x y =
−(× ×)
√ ∑ x i −n x √∑ y i −n y √−(×❑2) √−(×❑2)
2 2 2 2

r = −¿ = ❑ = ❑ = ❑ =¿ ¿
√❑ √ √❑ √❑ √❑ ❑

r =¿, esto significa que existe una excelente correlación o asociación positiva entre las variables
fertilizante en libras y producción de trigo en toneladas.
Esto quiere decir que a mayor cantidad de fertilizante mayor será la producción de trigo.
COEFICIENTE DE DETERMINACIÓN
2 2
r =( ) =¿,

% son las variaciones existentes en la producción de trigo en toneladas (y) que son explicadas
por las variaciones del fertilizante en libras (x) mientras que el % de las variaciones existentes en
la producción de trigo en toneladas son explicadas por otras variables que no están incluidas en
el modelo. Por lo tanto, el modelo de regresión lineal simple es adecuado para estimar o
predecir.

Con Excel

2. Un grupo de estudiantes ingresaron a la Universidad Andina del Cusco, se tiene el rendimiento


académico en nivel secundario (X) y del nivel superior (Y).
a) Grafica el diagrama de dispersión.
b) Calcule el coeficiente de correlación y de determinación e interprete cada uno.

Se tiene la tabla a continuación.

Nº Rendimiento Rendimiento
estudiantes Nivel Nivel
secundario ( superior ( y i)
x i)
1 16 15
2 13 11
3 15 17
4 12 14
5 11 11
6 16 14
7 13 15
ESTADÍSTICA GENERAL

8 10 12

Solución

a) Diagrama
b) Coeficiente de correlación y determinación

Nº Rendimiento Rendimient xi × yi xi
2
yi
2

estudiantes Nivel o Nivel


secundario ( superior ( y i)
x i)
1 16 15
2 13 11
3 15 17
4 12 14
5 11 11
6 16 14
7 13 15
8 10 12
TOTAL

n = , ∑ x i y i=, ∑ x i=, ∑ y i=¿ , ∑ x 2i =, ∑ y2i =¿ ¿

x=
∑ x i = ❑ =, y= ∑ y i = ❑ =¿
n ❑ n ❑

COEFICIENTE DE CORRELACIÓN

r=
∑ x i y i−n x y =
−(× ×)
√ ∑ x i −n x √∑ y i −n y √−(×❑2) √−(×❑2)
2 2 2 2

r = −¿ = ❑ = ❑ = ❑ =¿ ¿
√❑ √ √❑ √❑ √❑ ❑

r =¿, esto significa que existe una excelente correlación o asociación positiva entre las variables
fertilizante en libras y producción de trigo en toneladas.
Esto quiere decir que a mayor cantidad de fertilizante mayor será la producción de trigo.
COEFICIENTE DE DETERMINACIÓN
2 2
r =( ) =¿,

% son las variaciones existentes en la producción de trigo en toneladas (y) que son explicadas
por las variaciones del fertilizante en libras (x) mientras que el % de las variaciones existentes en
la producción de trigo en toneladas son explicadas por otras variables que no están incluidas en
el modelo. Por lo tanto, el modelo de regresión lineal simple es adecuado para estimar o
predecir.

Con Excel
ESTADÍSTICA GENERAL

3. En la tabla se tiene la información de una muestra aleatoria de 15 estudiantes de la Institución


Educativa “El Andino”. Desea obtener el coeficiente de correlación y determinación entre los
puntajes obtenidos en Aritmética y Lenguajes para medir su grado de relación.
Nº Aritmética ( x i Lenguaje ( y i
estudiantes ) )
1 15 01
2 14 15
3 13 12
4 12 12
5 11 10
6 13 15
7 15 15
8 15 16
9 16 17
10 12 15
11 11 12
12 08 09
13 10 11
14 15 14
15 13 15

a) Diagrama
b) Coeficiente de correlación y determinación

Nº Rendimiento Rendimient xi × yi 2
xi yi
2

estudiantes Nivel o Nivel


secundario ( superior ( y i)
x i)
1 15 01
2 14 15
3 13 12
4 12 12
5 11 10
6 13 15
7 15 15
8 15 16
9 16 17
10 12 15
11 11 12
12 08 09
13 10 11
14 15 14
15 13 15
TOTAL

n = , ∑ x i y i=, ∑ x i=, ∑ y i=¿ , ∑ x 2i =, ∑ y2i =¿ ¿


ESTADÍSTICA GENERAL

x=
∑ x i = ❑ =, y= ∑ y i = ❑ =¿
n ❑ n ❑

COEFICIENTE DE CORRELACIÓN

r=
∑ x i y i−n x y =
−(× ×)
√ ∑ x 2i −n x 2 √∑ y 2i −n y 2 √−(×❑2) √−(×❑2)
r = −¿ = ❑ = ❑ = ❑ =¿ ¿
√❑ √ √❑ √❑ √❑ ❑

r =¿, esto significa que existe una excelente correlación o asociación positiva entre las variables
fertilizante en libras y producción de trigo en toneladas.
Esto quiere decir que a mayor cantidad de fertilizante mayor será la producción de trigo.
COEFICIENTE DE DETERMINACIÓN
2 2
r =( ) =¿,

% son las variaciones existentes en la producción de trigo en toneladas (y) que son explicadas
por las variaciones del fertilizante en libras (x) mientras que el % de las variaciones existentes en
la producción de trigo en toneladas son explicadas por otras variables que no están incluidas en
el modelo. Por lo tanto, el modelo de regresión lineal simple es adecuado para estimar o
predecir.

Con Excel

4. En la tabla, la variable X corresponde a las puntuaciones en deporte y la variable Y corresponde


a las puntuaciones en Matemática de un grupo de alumnos.
a) Grafica el diagrama de dispersión.
b) Calcule el coeficiente de correlación y de determinación e interprete cada uno.

Se tiene la tabla a continuación.


Nº X Y
estudiantes
1 02 25
2 04 10
3 04 35
4 08 05
5 08 40
6 14 05
7 14 15
8 14 40
9 18 20
10 18 35

a) Diagrama
b) Coeficiente de correlación y determinación

Nº X Y xi × yi 2
xi
2
yi
estudiantes
1 02 25
2 04 10
3 04 35
ESTADÍSTICA GENERAL

4 08 05
5 08 40
6 14 05
7 14 15
8 14 40
9 18 20
10 18 35
TOTAL

n = , ∑ x i y i=, ∑ x i=, ∑ y i=¿ , ∑ x 2i =, ∑ y2i =¿ ¿

x=
∑ x i = ❑=, y= ∑ y i = ❑ =¿
n ❑ n ❑

COEFICIENTE DE CORRELACIÓN

r=
∑ x i y i−n x y =
−(× ×)
√ ∑ x 2i −n x 2 √∑ y 2i −n y 2 √−(×❑2) √−(×❑2)
r = −¿ = ❑ = ❑ = ❑ =¿ ¿
√❑ √ √❑ √❑ √❑ ❑

r =¿, esto significa que existe una excelente correlación o asociación positiva entre las variables
fertilizante en libras y producción de trigo en toneladas.
Esto quiere decir que a mayor cantidad de fertilizante mayor será la producción de trigo.
COEFICIENTE DE DETERMINACIÓN
2 2
r =( ) =¿,

% son las variaciones existentes en la producción de trigo en toneladas (y) que son explicadas
por las variaciones del fertilizante en libras (x) mientras que el % de las variaciones existentes en
la producción de trigo en toneladas son explicadas por otras variables que no están incluidas en
el modelo. Por lo tanto, el modelo de regresión lineal simple es adecuado para estimar o
predecir.

Con Excel

5. Un grupo de estudio tiene asignado obtener un modelo de regresión lineal para predecir las
ventas semanales de un producto en función de la publicidad por la radio, ha recopilado al azar
los tiempos de duración en minutos de la publicidad de 10 semanas y el respectivo número de
unidades vendidas del producto, los datos son los siguientes. Calcule el coeficiente de
correlación y determinación e interprete cada uno.

N° Publicidad X Ventas Y
1 20 50
2 30 73
3 30 69
4 40 87
5 50 108
6 60 128
ESTADÍSTICA GENERAL

7 60 135
8 60 132
9 70 148
1 80 140
0

SOLUCIÓN
N° Publicidad X Ventas Y xi × yi 2
xi
2
yi
1 20 50 1000 400 2500
2 30 73 2190 900 5329
3 30 69 2070 900 4761
4 40 87 3480 1600 7569
5 50 108 5400 2500 11664
6 60 128 7680 3600 16384
7 60 135 8100 3600 18225
8 60 132 7920 3600 17424
9 70 148 10360 4900 21904
10 80 140 11200 6400 19600
TOTAL 500 1070 59400 28400 125360

n =10 , ∑ x i y i=59400 , ∑ x i=500 , ∑ y i=1070, ∑ x 2i =28400 , ∑ y 2i =125360

x=
∑ x i = 500 =50 , y= ∑ y i = 1070 =107
n 10 n 10

COEFICIENTE DE CORRELACIÓN

r=
∑ x i y i−n x y =
59400−(10 ×50 ×107)
√ ∑ x 2i −n x 2 √∑ y 2i −n y 2 √ 28400−(10 ×502 )√ 125360−(10 ×107 2)
59400−53500 5900 5900 5900
r= = = = =0.971
√ 28400−(25000) √125360−(114490 ) √ 3400 √10870 √ 3400 ×10870 6079.309
r =0. 971, esto significa que existe una excelente correlación o asociación positiva entre las
variables número de unidades vendidas y publicidad en minutos.
Esto quiere decir que a más minutos de publicidad mayor será el número de unidades vendidas.
COEFICIENTE DE DETERMINACIÓN
2 2
r = ( 0.971 ) =0.943,

94.3% son las variaciones existentes del número de unidades vendidas que son explicadas por
las variaciones de la publicidad en minutos mientras que el 5.7% de las variaciones existentes
del número de unidades vendidas son explicadas por otras variables que no están incluidas en el
modelo. Por lo tanto, el modelo de regresión lineal simple es adecuado para estimar o predecir.

Estadísticas de la regresión
Coeficiente de correlación 0.9705050
múltiple 1
Coeficiente de determinación 0.9418799
ESTADÍSTICA GENERAL

R^2 7
0.9346149
R^2 ajustado 7
8.8865397
Error típico 2
Observaciones 10

También podría gustarte