Ejemplo Regresion y Correlacion Multiple Ok
Ejemplo Regresion y Correlacion Multiple Ok
Ejemplo Regresion y Correlacion Multiple Ok
PROBLEMA 01:
Se pretende estimar los gastos en alimentacion de una familia con base en la informacion que proporcionan las variables independientes o regresoras "Ingresos mensu
familia". Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se facilitan en la siguiente tabla.
Los gastos e ingresos se encuentran expresados en cien mil euros.
N° MIEMBROS DE LA
N° GASTOS DE ALIMENTACION (Y) INGRESOS (X1) FAMILIA (X2)
1 0.43 2.1 3
2 0.31 1.1 4
3 0.32 0.9 5
4 0.46 1.6 4
5 1.25 6.2 4
6 0.44 2.3 3
7 0.52 1.8 6
8 0.29 1 5
9 1.29 8.9 3
10 0.35 2.4 2
11 0.35 1.2 4
12 0.78 4.7 3
13 0.43 3.5 2
14 0.47 2.9 3
15 0.38 1.4 4
Y=b0+b1X1+b2X2
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9744945769
Coeficiente de determinación R^2 0.9496396804
R^2 ajustado 0.9412462938
Error típico 0.0775122828
Observaciones 15
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F
Regresión 2 1.3595421521 0.679771076 113.14142
Residuos 12 0.0720978479 0.006008154
Total 14 1.43164
Y=-0.1605+0.1487X1+0.0769X2
Y=-0.1605+0.1487X1+0.0769X2
este modelo explica al 94.96% de confiabilidad ,esto se deb a que los variables se encuentran en una correlacion de 0.9745.
egresoras "Ingresos mensuales" y "Numero de miembros de la
astos vs N° miembros de familia
8x + 0.6712692308
Residuos
0
0 f(x)
10= - 1
-50 R² = 2.22
-100
SOLUCION
Intercepción
Variable X 1
Análisis de los residuales
Relacion: Ingresos vs habiltantes
300
Observación
250 f(x) = 6.0293058057x + 61.3840238326
R² = 0.750382399 1
200 2
150 3
100 4
50 5
0 6
0 5 10 15 20 25 30 35 40 7
8
Relacion: Ingresos vs superficie 9
10
300
11
250
f(x) = 2.8632061354x + 56.910063599 12
200 R² = 0.6267516711
13
150
100
50
0
0 10 20 30 40 50 60 70 80
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9250965282
Coeficiente de determinación R^2 0.8558035865
R^2 ajustado 0.8269643038
Error típico 27.8499805424
Observaciones 13
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 46033.0166070861 23016.5083 29.6749262 6.2341E-05
Residuos 10 7756.2141621447 775.621416
Total 12 53789.2307692308
Y=-37.5023+1.4962X1+4.2446X2
Variable X 1 Gráfico de los residuales
100
50
Residuos
0
0 f(x)
10= - 1.77283119649584E-15x
20 30 40 + 5.769859503633E-14
50 60 70 80
-50 R² = 2.22044604925031E-16
-100
Variable X 1
0.62675167
0
0.59282 0 10 20 30 40 50 60 70 80
42.7218706 Variable X 1
13
NÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
1 33712.4903 33712.4903 18.470996 0.00126061
11 20076.7405 1825.15823
12 53789.2308
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Superior 95.0%
56.9100636 26.0180796 2.1873276 0.05120647 -0.3553435 114.175471 -0.3553435 114.175471
2.86320614 0.66620434 4.29778966 0.00126061 1.39690026 4.32951201 1.39690026 4.32951201
nálisis de los residuales
Residuos
numero de miembros en la familia, si hay un adulto mayor viviendo con la familia (1 para si, 0 para no), y 5
los años totales de educacion adicionales al bachillerato del esposo y la esposa . La informacion muestral
se reporta en la siguiente tabla. 0
-52000 2
5
0
-52000 2500 3000 3500 4000 4500 5000
Variable X 1
0
2000 2500 3000 3500 4000 4500 5000
Variable X 1
15
57471264x - 6.1883945124
6517931
10
70 75 80 85 90 0
0 10 20 30 40 50 60 70 80 90
Resumen
Estadísticas de la regresión
Coeficiente d 0.96720669
Coeficiente 0.93548878
R^2 ajustado 0.93326426
Error típico 2.34879151
Observacione 31
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 2320.01218 2320.01218 420.534208 8.322E-19
Residuos 29 159.987825 5.51682153
Total 30 2480
Observación
Pronóstico para YResiduos
Residuos estándares
1 2.13320653 -1.1332065 -0.4907115
2 2.97389218 -0.9738922 -0.4217237
3 3.53434929 -0.5343493 -0.2313888
4 8.29823466 -4.2982347 -1.861261
5 8.85869176 -3.8586918 -1.6709261
6 9.13892031 -3.1389203 -1.3592441
7 9.69937741 -2.6993774 -1.1689092
8 9.69937741 -1.6993774 -0.73588
9 9.97960596 -0.979606 -0.424198
10 10.2598345 -0.2598345 -0.1125159
11 10.5400631 0.45993693 0.19916611
12 10.8202916 1.17970838 0.51084815
13 10.8202916 2.17970838 0.94387733
14 11.6609773 2.33902273 1.01286509
15 12.5016629 2.49833707 1.08185285
16 15.0237199 0.97628011 0.42275778
17 15.0237199 1.97628011 0.85578695
18 16.1446341 1.85536591 0.80342758
19 17.2655483 1.7344517 0.7510682
20 17.5457768 2.45422315 1.06275024
21 18.1062339 2.89376605 1.25308514
22 18.6666911 3.33330895 1.44342003
23 19.5073767 3.49262329 1.5124078
24 23.710805 0.28919503 0.12522988
25 24.5514906 0.44850937 0.19421765
26 27.3537761 -1.3537761 -0.5862246
27 27.9142332 -0.9142332 -0.3958897
28 29.0351474 -1.0351474 -0.448249
29 29.315376 -0.315376 -0.136567
30 29.315376 0.684624 0.29646217
31 36.6013183 -5.6013183 -2.4255343
60 70 80 90
Variable X 1 Gráfico de los residuales
5
Variable X 1 Curva de regresión ajustad
0
Residuos
40
6 8 10 12 14 16 18 20 22
-5 30
20 Y
Pronóstico
Y
-10 10
0 Variable X 1
6 8 10 12 14 16 18 20 22
Variable X 1
or crítico de F
16 18 20 22
1
PROBLEMA 05:
Hemos recogido datos sobre usuarios de mediana edad de una biblioteca en la que además se realizan actividades tanto para
adolescentes y adultos, y estamos interesados en analizar cuáles son las variables que determinan el nivel de satisfacción de s
recogidas son: afición a la lectura, al cine, a la música, número de hijos, renta… y, por supuesto, nivel de satisfacción.
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
se realizan actividades tanto para niños como para
minan el nivel de satisfacción de sus usuarios; las variables
to, nivel de satisfacción.
nivel_estudioaficcion_Tv satisfaccion
4 4 4
5 4 3
3 5 5
2 2 3
3 4 4
1 4 3
4 5 5
4 4 3
2 5 4
2 1 2
3 4 4
4 5 5
5 3 5
3 4 5
4 3 3
4 5 5
4 3 3
2 2 2
3 3 3
4 4 2
3 4 4
4 4 4
2 5 4
5 4 4
5 5 5
e su relacion.
4
f(x) = 0.160041841x + 3.1966527197
R² = 0.039880133
6
4
f(x) = 0.160041841x + 3.1966527197
R² = 0.039880133
Residuos
0
-1 0.5 1 1.5 2 2.5 3
-2
-3
Variable X 1
0
4.5 5 5.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
iable X 1 Gráfico de los residuales Variable X 1 Curva de regresión ajusta
6
4
Y
2 Pronós
Y
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Variable X 1 Variable X 1
Resumen
Estadísticas de la regresión
Coeficiente d 0.69592799
Coeficiente 0.48431577
R^2 ajustado 0.46189472
Error típico 0.74206541
Observacione 25
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 11.8947953 11.8947953 21.6009373 0.00011201
Residuos 23 12.6652047 0.55066107
Total 24 24.56
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Intercepción 1.22807018 0.56462712 2.17501098 0.04016257 0.06005 2.39609035 0.06005
Variable X 1 0.65935673 0.1418679 4.64768085 0.00011201 0.36588061 0.95283284 0.36588061
Observación
Pronóstico para YResiduos
Residuos estándares
1 3.86549708 0.13450292 0.18515321
2 3.86549708 -0.8654971 -1.1914206
3 4.5248538 0.4751462 0.65407383
4 2.54678363 0.45321637 0.62388581
5 3.86549708 0.13450292 0.18515321
6 3.86549708 -0.8654971 -1.1914206
7 4.5248538 0.4751462 0.65407383
8 3.86549708 -0.8654971 -1.1914206
9 4.5248538 -0.5248538 -0.7225
10 1.8874269 0.1125731 0.15496518
11 3.86549708 0.13450292 0.18515321
12 4.5248538 0.4751462 0.65407383
13 3.20614035 1.79385965 2.46938028
14 3.86549708 1.13450292 1.56172706
15 3.20614035 -0.2061404 -0.2837674
16 4.5248538 0.4751462 0.65407383
17 3.20614035 -0.2061404 -0.2837674
18 2.54678363 -0.5467836 -0.752688
19 3.20614035 -0.2061404 -0.2837674
20 3.86549708 -1.8654971 -2.5679945
21 3.86549708 0.13450292 0.18515321
22 3.86549708 0.13450292 0.18515321
23 4.5248538 -0.5248538 -0.7225
5 5.5
24 3.86549708 0.13450292 0.18515321
25 4.5248538 0.4751462 0.65407383
a de regresión ajustada
Y
Pronóstico para Y
Superior 95.0%
2.39609035
0.95283284