Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Ejemplo Regresion y Correlacion Multiple Ok

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 31

REGRESION Y CORRELACION MULTIPLE

PROBLEMA 01:
Se pretende estimar los gastos en alimentacion de una familia con base en la informacion que proporcionan las variables independientes o regresoras "Ingresos mensu
familia". Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se facilitan en la siguiente tabla.
Los gastos e ingresos se encuentran expresados en cien mil euros.

N° MIEMBROS DE LA
N° GASTOS DE ALIMENTACION (Y) INGRESOS (X1) FAMILIA (X2)

1 0.43 2.1 3
2 0.31 1.1 4
3 0.32 0.9 5
4 0.46 1.6 4
5 1.25 6.2 4
6 0.44 2.3 3
7 0.52 1.8 6
8 0.29 1 5
9 1.29 8.9 3
10 0.35 2.4 2
11 0.35 1.2 4
12 0.78 4.7 3
13 0.43 3.5 2
14 0.47 2.9 3
15 0.38 1.4 4

Regresion y Correlacion Lineal Multiple:


- Realizar el diagrama de dispersion de dichas variables.
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.
- Relacionar la informacion obtenida con el problema.
SOLUCION
- Realizar el diagrama de dispersion de dichas variables.

Relacion: Gastos vs N° miembros


Relacion: Gastos vs Ingresos
1.4
1.4
f(x) = 0.1343217934x + 0.1618989784 1.2
1.2 R² = 0.8882291765
1
1
0.8
0.8
0.6
0.6 f(x) = - 0.0363461538x + 0.6712692308
R² = 0.0159942981
0.4
0.4
0.2
0.2
0
0 1.5 2 2.5 3 3.5 4 4.5
0 1 2 3 4 5 6 7 8 9 10

- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.

Y=b0+b1X1+b2X2

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9744945769
Coeficiente de determinación R^2 0.9496396804
R^2 ajustado 0.9412462938
Error típico 0.0775122828
Observaciones 15

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F
Regresión 2 1.3595421521 0.679771076 113.14142
Residuos 12 0.0720978479 0.006008154
Total 14 1.43164

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -0.1604580427 0.0903891033 -1.7751923275 0.10121136
Variable X 1 0.1487270228 0.009971317 14.9154843642 4.1458E-09
Variable X 2 0.0769151943 0.020106868 3.8253195049 0.00241602

Y=-0.1605+0.1487X1+0.0769X2

R^2=0.9496, por ser cercano a 1, el modelo matematico es muy confiable.


R^2=94.96%, el modelo matematico se aplica al 94,96% de confiabilidad
r=0.9745=97.45%, la correlacion entre las variables es excelente , dado que su valor de coeficiente es 0.9745

- Relacionar la informacion obtenida con el problema.

Y=-0.1605+0.1487X1+0.0769X2

este modelo explica al 94.96% de confiabilidad ,esto se deb a que los variables se encuentran en una correlacion de 0.9745.
egresoras "Ingresos mensuales" y "Numero de miembros de la
astos vs N° miembros de familia

8x + 0.6712692308

3.5 4 4.5 5 5.5 6 6.5


Valor crítico de F
1.6313E-08

Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
-0.357399 0.0364829 -0.357399 0.0364829
0.12700139 0.17045266 0.12700139 0.17045266
0.03310609 0.1207243 0.03310609 0.1207243
PROBLEMA 02:
Variable X
Se pretende estimar los ingresos de una familia con base en la informacion que proporcionan las variables independientes 100
o regresoras "Habitantes" y "superficie". Para ello se recoge una muestra aleatoria simple de 13 datos, cuyos resultados se
facilitan en la siguiente tabla. 50

Residuos
0
0 f(x)
10= - 1
-50 R² = 2.22
-100

N° INGRESOS (Y) HABITANTES (X1) SUPERFICIE (X2)


1 198 70 21
2 209 35 26
3 197 55 14
4 156 25 10
5 85 28 12 Resumen
6 187 43 20
7 43 15 5 Estadísticas de la regresión
8 211 33 28 Coeficiente d
9 120 23 9 Coeficiente
10 62 4 6 R^2 ajustado
11 176 45 10 Error típico
12 117 20 8 Observacione
13 273 56 36
ANÁLISIS DE VARIANZA
Regresion y Correlacion Lineal Multiple: Grados de libertad
- Realizar el diagrama de dispersion de dichas variables. Regresión
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion. Residuos
- Relacionar la informacion obtenida con el problema. Total

SOLUCION
Intercepción
Variable X 1
Análisis de los residuales
Relacion: Ingresos vs habiltantes
300
Observación
250 f(x) = 6.0293058057x + 61.3840238326
R² = 0.750382399 1
200 2
150 3
100 4
50 5
0 6
0 5 10 15 20 25 30 35 40 7
8
Relacion: Ingresos vs superficie 9
10
300
11
250
f(x) = 2.8632061354x + 56.910063599 12
200 R² = 0.6267516711
13
150
100
50
0
0 10 20 30 40 50 60 70 80

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9250965282
Coeficiente de determinación R^2 0.8558035865
R^2 ajustado 0.8269643038
Error típico 27.8499805424
Observaciones 13

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 46033.0166070861 23016.5083 29.6749262 6.2341E-05
Residuos 10 7756.2141621447 775.621416
Total 12 53789.2307692308

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción 37.5023003593 17.6461216318 2.12524322 0.05949604 -1.8157088
Variable X 1 1.4962877931 0.553386309 2.7038757 0.02216541 0.26326626
Variable X 2 4.244624453 1.0649998266 3.98556352 0.0025777 1.87165696

Y=-37.5023+1.4962X1+4.2446X2
Variable X 1 Gráfico de los residuales
100
50
Residuos

0
0 f(x)
10= - 1.77283119649584E-15x
20 30 40 + 5.769859503633E-14
50 60 70 80
-50 R² = 2.22044604925031E-16
-100
Variable X 1

Variable X 1 Curva de regresión ajustada


300

tadísticas de la regresión 200


Y
0.79167649 100 Pronóstico para Y
Y

0.62675167
0
0.59282 0 10 20 30 40 50 60 70 80
42.7218706 Variable X 1
13

NÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
1 33712.4903 33712.4903 18.470996 0.00126061
11 20076.7405 1825.15823
12 53789.2308

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Superior 95.0%
56.9100636 26.0180796 2.1873276 0.05120647 -0.3553435 114.175471 -0.3553435 114.175471
2.86320614 0.66620434 4.29778966 0.00126061 1.39690026 4.32951201 1.39690026 4.32951201
nálisis de los residuales

Pronóstico para YResiduos


Residuos estándares
257.334493 -59.334493 -1.450612
157.122278 51.8777217 1.26830853
214.386401 -17.386401 -0.4250634
128.490217 27.509783 0.67256023
137.079835 -52.079835 -1.2732498
180.027927 6.97207258 0.1704535
99.8581556 -56.858156 -1.3900704
151.395866 59.6041339 1.45720416
122.763805 -2.7638047 -0.0675696
68.3628881 -6.3628881 -0.1555601
185.75434 -9.7543397 -0.2384745
114.174186 2.82581369 0.0690856
217.249607 55.7503928 1.36298775
PROBLEMA 03: Variable X
un constructor inmobiliario desea estudiar la relacion entre el tamaño de la casa que compraria un cliente
(en pies cuadrados) y otras variables, las posibles variables independiente son: el ingreso familiar, el 10

Residuos
numero de miembros en la familia, si hay un adulto mayor viviendo con la familia (1 para si, 0 para no), y 5
los años totales de educacion adicionales al bachillerato del esposo y la esposa . La informacion muestral
se reporta en la siguiente tabla. 0
-52000 2

Pies Ingresos (mil Miembros Adulto


Familia Educacion
Cuadrados dolares) de Familia Mayor
1 2240 60.8 2 0 4 Resumen
2 2380 68.4 2 1 6
3 3640 104.5 3 0 7 Estadísticas de la regresión
4 3360 89.3 4 1 0 Coeficiente d 0.37381248
5 3080 72.2 4 0 2 Coeficiente 0.13973577
6 2940 114 3 1 10 R^2 ajustado 0.03220274
7 4480 125.4 6 0 6 Error típico 2.97850211
8 2520 83.6 3 0 8 Observacione 10
9 4200 133 5 0 2
10 2800 95 3 0 6 ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Formule una ecuacion de regresion multiple apropiada . Regresión 1 11.5282012
¿Qué variable independiente incluira en la ecuacion de regresion final?, Residuos 8 70.9717988
Total 9 82.5

regresion lineal Chart Title Coeficientes Error típico


140 5000 Intercepción 0.76295732 4.26091765
f(x) = 0.0272669861x + 8.3472560976
4500 Variable X 1 0.00149717 0.00131337
120 f(x) = 540.6896551724x + 1271.5862068966
R² = 0.711078109 4000 R² = 0.8242220353
100 3500
3000
80 2500
Análisis de los residuales
60 2000
1500
40 1000
20 500
0
1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5
R² = 0.711078109 4000 R² = 0.8242220353
100 3500
3000
80 2500
60 2000
1500
40 1000 Observación
Pronóstico para YResiduos
20 500 1 4.11661585 -3.1166159
0 2 4.32621951 -2.3262195
0 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5
2000 2500 3000 3500 4000 4500 5000 3 6.21265244 -3.2126524
4 5.79344512 -1.7934451
5 5.3742378 -0.3742378
6 5.16463415 0.83536585
7 7.47027439 -0.4702744
8 4.53582317 3.46417683
9 7.05106707 1.94893293
10 4.95503049 5.04496951
Variable X 1 Gráfico de los residuales
10
Residuos

5
0
-52000 2500 3000 3500 4000 4500 5000
Variable X 1

Variable X 1 Curva de regresión ajustada


20
10 Y
Pronóstico para Y
Y

0
2000 2500 3000 3500 4000 4500 5000
Variable X 1

Promedio de los cuadradosF Valor crítico de F


11.5282012 1.2994684 0.28728787
8.87147485

Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
0.17905939 0.86234287 -9.0627364 10.588651 -9.0627364 10.588651
1.13994228 0.28728787 -0.0015315 0.00452581 -0.0015315 0.00452581
Residuos estándares
-1.1098432
-0.8283789
-1.1440423
-0.6386552
-0.133268
0.29747815
-0.1674672
1.23361148
0.6940252
1.79654001
PROBLEMA 04:
se desea construir un modelo de regresion para obtener el volumen de
madera de un "cerezo negro" en funcion de la altura del tronco y del diametro
del mismo a un metro sobre el suelo. Se ha tomado una muestra de 31
arboles. Las unidades de longitudes son pies y de volumen pies cubicos).

Arbol Diametro Altura Volumen Chart Title


1 8.3 70 10.3 25
2 8.6 65 10.3
3 8.8 63 10.2 20
4 10.5 72 16.4
5 10.7 81 18.8 15 f(x) = 0.2557471264x - 6.1883945124
6 10.8 83 19.7 R² = 0.2696517931
7 11 66 15.6 10
8 11 75 18.2
9 11.1 80 22.6 5
10 11.2 75 19.9
11 11.3 79 24.2 0
60 65 70 75 80
12 11.4 76 21
13 11.4 76 21.4
14 11.7 69 21.3
15 12 75 19.1
16 12.9 74 22.2
17 12.9 85 33.8
18 13.3 86 27.4
19 13.7 71 25.7
20 13.8 64 24.9
21 14 78 34.5
22 14.2 80 31.7
23 14.5 74 36.3
24 16 72 38.3
25 16.3 77 42.6
26 17.3 81 55.4
27 17.5 82 55.7
28 17.9 80 58.3
29 18 80 51.5
30 18 80 51
31 20.6 87 77

Regresion y Correlacion Lineal Multiple:


- Realizar el diagrama de dispersion de dichas variables.
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.
- Relacionar la informacion obtenida con el problema.
Chart Title
Chart Title
25

20 f(x) = 0.1846321321x + 7.6778569939


R² = 0.9353198725

15
57471264x - 6.1883945124
6517931

10

70 75 80 85 90 0
0 10 20 30 40 50 60 70 80 90

Resumen

Estadísticas de la regresión
Coeficiente d 0.96720669
Coeficiente 0.93548878
R^2 ajustado 0.93326426
Error típico 2.34879151
Observacione 31

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 2320.01218 2320.01218 420.534208 8.322E-19
Residuos 29 159.987825 5.51682153
Total 30 2480

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción -21.125763 1.858901 -11.364652 3.357E-12 -24.927643
e su relacion. Variable X 1 2.80228551 0.13665065 20.5069307 8.322E-19 2.52280354
Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 2.13320653 -1.1332065 -0.4907115
2 2.97389218 -0.9738922 -0.4217237
3 3.53434929 -0.5343493 -0.2313888
4 8.29823466 -4.2982347 -1.861261
5 8.85869176 -3.8586918 -1.6709261
6 9.13892031 -3.1389203 -1.3592441
7 9.69937741 -2.6993774 -1.1689092
8 9.69937741 -1.6993774 -0.73588
9 9.97960596 -0.979606 -0.424198
10 10.2598345 -0.2598345 -0.1125159
11 10.5400631 0.45993693 0.19916611
12 10.8202916 1.17970838 0.51084815
13 10.8202916 2.17970838 0.94387733
14 11.6609773 2.33902273 1.01286509
15 12.5016629 2.49833707 1.08185285
16 15.0237199 0.97628011 0.42275778
17 15.0237199 1.97628011 0.85578695
18 16.1446341 1.85536591 0.80342758
19 17.2655483 1.7344517 0.7510682
20 17.5457768 2.45422315 1.06275024
21 18.1062339 2.89376605 1.25308514
22 18.6666911 3.33330895 1.44342003
23 19.5073767 3.49262329 1.5124078
24 23.710805 0.28919503 0.12522988
25 24.5514906 0.44850937 0.19421765
26 27.3537761 -1.3537761 -0.5862246
27 27.9142332 -0.9142332 -0.3958897
28 29.0351474 -1.0351474 -0.448249
29 29.315376 -0.315376 -0.136567
30 29.315376 0.684624 0.29646217
31 36.6013183 -5.6013183 -2.4255343
60 70 80 90
Variable X 1 Gráfico de los residuales
5
Variable X 1 Curva de regresión ajustad
0
Residuos

40
6 8 10 12 14 16 18 20 22
-5 30
20 Y
Pronóstico
Y

-10 10
0 Variable X 1
6 8 10 12 14 16 18 20 22
Variable X 1

or crítico de F

Superior 95%Inferior 95.0%


Superior 95.0%
-17.323884 -24.927643 -17.323884
3.08176748 2.52280354 3.08176748
s residuales
de regresión ajustada
16 18 20 22
Y
Pronóstico para Y

16 18 20 22
1
PROBLEMA 05:
Hemos recogido datos sobre usuarios de mediana edad de una biblioteca en la que además se realizan actividades tanto para
adolescentes y adultos, y estamos interesados en analizar cuáles son las variables que determinan el nivel de satisfacción de s
recogidas son: afición a la lectura, al cine, a la música, número de hijos, renta… y, por supuesto, nivel de satisfacción.

affcion_lectunum_hijos affi_cine affic_musica renta_mens


4 0 3 5 1200
3 0 3 4 1500
5 1 4 1 1800
2 2 1 3 1000
4 1 5 3 1300
3 1 3 4 1900
5 3 4 5 1300
3 0 2 3 1200
3 1 4 1 1600
1 3 2 1 1400
4 0 5 4 1700
5 0 5 5 2500
5 2 4 4 1100
5 2 5 3 1400
2 1 1 4 1800
4 2 5 4 2000
3 3 2 4 1500
1 1 2 3 1000
2 1 2 2 1300
1 0 2 5 1600
5 1 4 4 1800
2 2 3 3 1200
4 1 5 5 1700
4 1 4 3 1500
5 2 4 5 1100

Regresion y Correlacion Lineal Multiple:


- Realizar el diagrama de dispersion de dichas variables.
- Calcular el modelo de regresion y el coeficiente de correlacion para probar estadisticamente su relacion.
- Relacionar la informacion obtenida con el problema.
6

f(x) = 0.6593567251x + 1.2280701754


4 R² = 0.4843157704
6

f(x) = 0.6593567251x + 1.2280701754


4 R² = 0.4843157704

0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
se realizan actividades tanto para niños como para
minan el nivel de satisfacción de sus usuarios; las variables
to, nivel de satisfacción.

nivel_estudioaficcion_Tv satisfaccion
4 4 4
5 4 3
3 5 5
2 2 3
3 4 4
1 4 3
4 5 5
4 4 3
2 5 4
2 1 2
3 4 4
4 5 5
5 3 5
3 4 5
4 3 3
4 5 5
4 3 3
2 2 2
3 3 3
4 4 2
3 4 4
4 4 4
2 5 4
5 4 4
5 5 5

e su relacion.

4
f(x) = 0.160041841x + 3.1966527197
R² = 0.039880133
6

4
f(x) = 0.160041841x + 3.1966527197
R² = 0.039880133

3.5 4 4.5 5 5.5 0


0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Variable X 1 Gráfico de l
3
2
1

Residuos
0
-1 0.5 1 1.5 2 2.5 3
-2
-3
Variable X 1

4 f(x) = 0.3133333333x + 2.6946666667


R² = 0.1199239957
6

4 f(x) = 0.3133333333x + 2.6946666667


R² = 0.1199239957

0
4.5 5 5.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
iable X 1 Gráfico de los residuales Variable X 1 Curva de regresión ajusta
6
4
Y
2 Pronós

Y
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Variable X 1 Variable X 1
Resumen

Estadísticas de la regresión
Coeficiente d 0.69592799
Coeficiente 0.48431577
R^2 ajustado 0.46189472
Error típico 0.74206541
Observacione 25

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 11.8947953 11.8947953 21.6009373 0.00011201
Residuos 23 12.6652047 0.55066107
Total 24 24.56

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Intercepción 1.22807018 0.56462712 2.17501098 0.04016257 0.06005 2.39609035 0.06005
Variable X 1 0.65935673 0.1418679 4.64768085 0.00011201 0.36588061 0.95283284 0.36588061

Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 3.86549708 0.13450292 0.18515321
2 3.86549708 -0.8654971 -1.1914206
3 4.5248538 0.4751462 0.65407383
4 2.54678363 0.45321637 0.62388581
5 3.86549708 0.13450292 0.18515321
6 3.86549708 -0.8654971 -1.1914206
7 4.5248538 0.4751462 0.65407383
8 3.86549708 -0.8654971 -1.1914206
9 4.5248538 -0.5248538 -0.7225
10 1.8874269 0.1125731 0.15496518
11 3.86549708 0.13450292 0.18515321
12 4.5248538 0.4751462 0.65407383
13 3.20614035 1.79385965 2.46938028
14 3.86549708 1.13450292 1.56172706
15 3.20614035 -0.2061404 -0.2837674
16 4.5248538 0.4751462 0.65407383
17 3.20614035 -0.2061404 -0.2837674
18 2.54678363 -0.5467836 -0.752688
19 3.20614035 -0.2061404 -0.2837674
20 3.86549708 -1.8654971 -2.5679945
21 3.86549708 0.13450292 0.18515321
22 3.86549708 0.13450292 0.18515321
23 4.5248538 -0.5248538 -0.7225
5 5.5
24 3.86549708 0.13450292 0.18515321
25 4.5248538 0.4751462 0.65407383
a de regresión ajustada

Y
Pronóstico para Y

3.5 4 4.5 5 5.5


X1

Superior 95.0%
2.39609035
0.95283284

También podría gustarte