Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Actividad 5

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 15

Problema # 3.

Determinar el modelo de regresión lineal múltiple que asocie el peso de una persona con 5 mediciones
corporales.

a) Calcular valores estadísticos descriptivos de los datos (media, mediana, moda, varianza, desviación estándar).
b) Obtener el modelo de regresión lineal (ecuación) y los parámetros de calidad que corresponden (Prueba de
significancia, r2, R2).
c) Predecir valor de masa cuando tenemos los siguientes valores: X1: 160 cm, X2: 35 cm, X3: 72 cm; X4: 40. cm; X5:
55.5

Dato Sexo Estatura (cm) Pie Brazo Espalda Cráneo


X1 X2 X3 X4 X5
1 Mujer 158 36 68 43 55
2 Mujer 152 34 66 40 55
3 Mujer 168 39 72.5 41 54.5
4 Mujer 159 36 68.5 42 57
5 Mujer 158 36 68.5 44 57
6 Mujer 164 36 71 44.5 54
7 Mujer 156 36 67 36 56
8 Mujer 167 37 73 41.5 58

Resumen

Estadísticas de la regresión
Coeficiente d 0.73586817
Coeficiente d 0.54150197
R^2 ajustado-0.60474312
Error típico 4.1603246
Observacione 8

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 5 40.8833985 8.1766797 0.47241378 0.78422551
Residuos 2 34.6166015 17.3083007
Total 7 75.5

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -46.9663177 96.1381258 -0.48852957 0.67348986 -460.615287 366.682652
Variable X 1 2.10328655 3.45862142 0.60812858 0.60496307 -12.7779604 16.9845335
Variable X 2 -2.4463692 3.34705827 -0.73090129 0.54086875 -16.8475986 11.9548602
Variable X 3 -2.78235894 6.41385227 -0.43380465 0.70674053 -30.3789379 24.8142201
Variable X 4 -0.55709871 0.69763117 -0.79855765 0.50830698 -3.55876339 2.44456597
Variable X 5 1.13446598 1.30528964 0.86912969 0.4764076 -4.48174203 6.75067399
rsona con 5 mediciones

Coeficientes cm
Intercepción -46.9663177 X1 160
Variable X 1 2.10328655 m1 X2 35
esviación estándar).
onden (Prueba de Variable X 2 -2.4463692 m2 X3 72
Variable X 3 -2.78235894 m3 X4 40
72 cm; X4: 40. cm; X5: Variable X 4 -0.55709871 m4 X5- 55.5
Variable X 5 1.13446598 m5

Masa (kg) Y= m*x1 44.2856777


Y Y = mx1+mx2+mx3+mx4+mx5+b
43
45 b)
48 Valor Cumple / no
Criterio
49 obtenido cumple
50 #dato (n): O n>5 8 si
51 r2 r2>0.95 0.54150197 no
52 R2 R2>0.95 -0.60474312 no
52
Pruba de significancía: Faltan datos

Inferior 95.0%
Superior 95.0%
-460.615287 366.682652
-12.7779604 16.9845335
-16.8475986 11.9548602
-30.3789379 24.8142201
-3.55876339 2.44456597
-4.48174203 6.75067399
Columna1 Columna2 Columna3 Columna4

Media 160.25 Media 36.25 Media 69.3125 Media 41.5


Error típico 1.97076852 Error típico 0.49099025 Error típico 0.90601906 Error típico 0.94962399
Mediana 158.5 Mediana 36 Mediana 68.5 Mediana 41.75
Moda 158 Moda 36 Moda 68.5 Moda #N/A
Desviación es 5.57417515 Desviación es 1.38873015 Desviación es 2.56260888 Desviación es 2.68594224
Varianza de l 31.0714286 Varianza de l 1.92857143 Varianza de l 6.56696429 Varianza de l 7.21428571
Curtosis -1.03130559 Curtosis 2.7654321 Curtosis -1.32975611 Curtosis 1.98650132
Coeficiente d 0.17898633 Coeficiente d 0.69341259 Coeficiente d 0.39937949 Coeficiente d-1.21645458
Rango 16 Rango 5 Rango 7 Rango 8.5
Mínimo 152 Mínimo 34 Mínimo 66 Mínimo 36
Máximo 168 Máximo 39 Máximo 73 Máximo 44.5
Suma 1282 Suma 290 Suma 554.5 Suma 332
Cuenta 8 Cuenta 8 Cuenta 8 Cuenta 8
Columna5 Columna6

Media 55.8125 Media 48.75


Error típico 0.49944165 Error típico 1.1611263
Mediana 55.5 Mediana 49.5
Moda 55 Moda 52
Desviación es 1.41263432 Desviación es 3.28416112
Varianza de l 1.99553571 Varianza de l 10.7857143
Curtosis -1.3262826 Curtosis -0.35415991
Coeficiente d 0.30643876 Coeficiente d-0.86709574
Rango 4 Rango 9
Mínimo 54 Mínimo 43
Máximo 58 Máximo 52
Suma 446.5 Suma 390
Cuenta 8 Cuenta 8
Problema # 1 Montgomery y Peck (1992) describen el uso de un modelo de regresión para relacionar la cantidad de
tiempo que requiere un vendedor para dar servicio a una máquina expendedora de artículos y el número de
empaques contenidos en la máquina y la distancia del vehículo (pies) de servicio del sitio donde se encuentra la
máquina. Este modelo de regresión múltiple fue utilizado para diseñar la ruta, los horarios y la salida de los vehículos.
La tabla de abajo muestra 25 observaciones del tiempo de suministro, número de empaques y la distancia, del
vehículo.

a) Identificar variable dependiente e independiente (o explicativa).


b) Calcular valores estadísticos descriptivos de los datos (media, mediana, moda, varianza, desviación estándar).
c) Obtener el modelo de regresión lineal múltiple y los parámetros de calidad que corresponden (r2, R2).
d) Predecir el tiempo de suministro para pares de valores de las variables de regresión; número de envases = 1 y
distancia = 25 pies.

No.
Observación Tempo No. Envases Distancia
1 9.45 2 50 Columna1
2 24.45 8 110
3 31.75 11 120 Media 28.9968
4 35 10 550 Error típico 3.18939058
5 25.02 8 295 Mediana 24.45
6 16.86 4 200 Moda #N/A
7 14.38 2 375 Desviación es 15.9469529
8 9.6 2 375 Varianza de l 254.305306
9 24.35 9 100 Curtosis 0.15741556
10 27.5 8 300 Coeficiente d 0.85661943
11 17.08 4 412 Rango 59.55
12 37 11 400 Mínimo 9.45
13 41.95 12 500 Máximo 69
14 11.66 2 360 Suma 724.92
15 21.65 4 205 Cuenta 25
16 17.89 4 400
17 69 20 600 Resumen
18 10.3 1 585
19 34.93 10 540 Estadísticas de la regresión
20 46.59 15 250 Coeficiente d 0.99023832
21 44.88 15 290 Coeficiente d 0.98057193
22 54.12 16 510 R^2 ajustado 0.97880575
23 56.23 17 590 Error típico 2.32159664
24 22.13 6 100 Observacione 25
25 21.15 5 400
ANÁLISIS DE VARIANZA
Grados de libertad
Regresión 2
Residuos 22
Total 24

Coeficientes
Intercepción 1.74332962
Variable X 1 2.77878381
Variable X 2 0.01263866
acionar la cantidad de
el número de
e se encuentra la
salida de los vehículos.
la distancia, del

esviación estándar).
den (r2, R2).
ero de envases = 1 y

Columna2 Columna3

Media 8.24 Media 344.68


Error típico 1.07901189 Error típico 34.1482415
Mediana 8 Mediana 375
Moda 2 Moda 400
Desviación es 5.39505947 Desviación es 170.741208
Varianza de l 29.1066667 Varianza de l 29152.56
Curtosis -0.6735097 Curtosis -1.08305197
Coeficiente d 0.5158787 Coeficiente d-0.14193445
Rango 19 Rango 550
Mínimo 1 Mínimo 50
Máximo 20 Máximo 600
Suma 206 Suma 8617
Cuenta 25 Cuenta 25
Criterio

#dato (n): O n>5


r2 r2>0.95
R2 R2>0.95

Y= mx+b
y= 25 y=
X1 25
X2 1

Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
5984.7515 2992.37575 555.191225 1.48842E-19
118.575841 5.38981097
6103.32734

Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
1.15495377 1.50943672 0.14541647 -0.65189789 4.13855714 -0.65189789 4.13855714
0.09234066 30.0927437 2.27189E-19 2.587281 2.97028662 2.587281 2.97028662
0.00291777 4.33161665 0.00026839 0.00658757 0.01868974 0.00658757 0.01868974
Valor Cumple / no
obtenido cumple
25 si
0.98057193 si
0.97880575 si

4.83807982
Problema # 2 Este es un ejemplo del libro Applied Statistics: Análisis of Variance and
Regresion de los autores Dunn y Clark. Esta es una investigación relacionada con la
temperatura en función de variables regresoras como la altitud, longitud y latitud. La tabla
de abajo muestra los resultados.

a) Identificar variable dependiente e independiente (o explicativa).


b) Calcular valores estadísticos descriptivos de los datos (media, mediana, moda, varianza, desviación estándar).
c) Obtener el modelo de regresión lineal múltiple y los parámetros de calidad que corresponden (r2, R2).
d) Predecir el tiempo de suministro para los valores de regresión; altitud = 505, longitud = 90.5, latitud = 35.

Temperatura Altitud (X1) Longitud (x2) Latitud (x3)


(y)
55.7 1083 112 33 Columna1
37.8 457 86 38
56.4 312 118 34 Media 37.65
51 305 90 32 Error típico 3.00380314
34.5 5221 105 40 Mediana 36.5
34 2842 116 44 Moda 36.7
36.7 807 94 41 Desviación es 12.0152126
33.4 4260 112 41 Varianza de l 144.365333
32.6 815 83 40 Curtosis 0.04055733
49.1 3920 106 32 Coeficiente d-0.23920288
46.6 1054 84 34 Rango 43.1
36.3 4397 120 39 Mínimo 13.3
18.2 830 93 45 Máximo 56.4
36.7 465 9 39 Suma 602.4
13.3 1162 92 47 Cuenta 16
30.1 787 820 41

Resumen

Estadísticas de la regresión
Coeficiente d 0.93793854
Coeficiente d 0.87972871
R^2 ajustado 0.84966089
Error típico 4.65872895
Observacione 16

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 3 1905.03493 635.011645 29.258146 8.40595E-06
Residuos 12 260.445065 21.7037554
Total 15 2165.48

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 131.606903 10.1237091 12.99987 1.97285E-08 109.549235 153.66457
Variable X 1 1.6504E-05 0.00071261 0.02315973 0.98190352 -0.00153615 0.00156916
Variable X 2 -0.00202351 0.00664994 -0.30429041 0.76611888 -0.01651248 0.01246546
Variable X 3 -2.41814794 0.26235147 -9.21720755 8.57681E-07 -2.98976268 -1.84653319
esviación estándar).
den (r2, R2).
.5, latitud = 35.

Columna2 Columna3 Columna4

Media 1794.8125 Media 140 Media 38.75


Error típico 425.808146 Error típico 45.7984716 Error típico 1.16010057
Mediana 942 Mediana 99.5 Mediana 39.5
Moda #N/A Moda 112 Moda 41
Desviación es 1703.23258 Desviación es 183.193886 Desviación es 4.64040228
Varianza de l 2901001.23 Varianza de l 33560 Varianza de l 21.5333333
Curtosis -0.59796303 Curtosis 15.2367281 Curtosis -0.8588511
Coeficiente d 1.03941214 Coeficiente d 3.85501746 Coeficiente d-0.02401842
Rango 4916 Rango 811 Rango 15
Mínimo 305 Mínimo 9 Mínimo 32
Máximo 5221 Máximo 820 Máximo 47
Suma 28717 Suma 2240 Suma 620
Cuenta 16 Cuenta 16 Cuenta 16

Valor Cumple / no
Criterio
obtenido cumple
#dato (n): O n>5 16 si
r2 r2>0.95 0.87972871 no
R2 R2>0.95 0.84966089 no
505, longitud = 90.5, latitud = 35.
Y= mx+b
y= 25 y= 46.7969316
X1 505
X2 90.5
X3 35

Inferior 95.0%
Superior 95.0%
109.549235 153.66457
-0.00153615 0.00156916
-0.01651248 0.01246546
-2.98976268 -1.84653319

También podría gustarte