Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Etacion

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

tarea nueve

METODOS ESTADISTICOS

REYES BELLO MARIA DEL REFUGIO REYES BELLO


Data nfl;
input y x1 x2 x3 x4 x5 x6 x7 x8 x9;
cards;
10 2113 1985 38.9 64.7 4 868 59.7 2205 1917
11 2003 2855 38.8 61.3 3 615 55 2096 1575
11 2957 1737 40.1 60 14 914 65.6 1847 2175
13 2285 2905 41.6 45.3 -4 957 61.4 1903 2476
10 2971 1666 39.2 53.8 15 836 66.1 1457 1866
11 2309 2927 39.7 74.1 8 786 61 1848 2339
10 2528 2341 38.1 65.4 12 754 66.1 1564 2092
11 2147 2737 37 78.3 -1 761 58 1821 1909
4 1689 1414 42.1 47.6 -3 714 57 2577 2001
2 2566 1838 42.3 54.2 -1 797 58.9 2476 2254
7 2363 1480 37.3 48 19 984 67.5 1984 2217
10 2109 2191 39.5 51.9 6 700 57.2 1917 1758
9 2295 2229 37.4 53.6 -5 1037 58.8 1761 2032
9 1932 2204 35.1 71.4 3 986 58.6 1709 2025
6 2213 2140 38.8 58.3 6 819 59.2 1901 1686
5 1722 1730 36.6 52.6 -19 791 54.4 2288 1835
5 1498 2072 35.3 59.3 -5 776 49.6 2072 1914
5 1873 2929 41.1 55.3 10 789 54.3 2861 2496
6 2118 2268 38.2 69.6 6 582 58.7 2411 2670
4 1775 1983 39.3 78.3 7 901 51.7 2289 2202
3 1904 1792 39.7 38.1 -9 734 61.9 2203 1988
3 1929 1606 39.7 68.8 -21 627 52.7 2592 2324
4 2080 1492 35.5 68.8 -8 722 57.8 2053 2550
10 2301 2835 35.3 74.1 2 683 59.7 1979 2110
6 2040 2416 38.7 50 0 576 54.9 2048 2628
8 2447 1638 39.9 57.1 -8 848 65.3 1786 11776
2 1416 2649 37.4 56.3 -22 684 43.8 2876 2524
0 1503 1503 39.3 47 -9 875 53.5 2560 2241
;
proc print;
proc reg all;
model y=x1 x2 x3 x4 x5 x6 x7 x8 x9/influence;
output out=residuales res=residual pred=predicted;
proc print data=residuales;
proc plot;
plot residual*predicted="A";
run;
proc glm;
model residual=predicted;
run;
Se puede observar que son muy poco los datos de la matriz que son <0.05, por lo que
existe poca correlación dentro de los datos que componen a la matriz analizada.

y=-9.9445+0.00018x1+0.0034x2+0.2082x3+0.0334x4-0.0072x5+0.0015x6+0.1593x7-
0.0052x8-0.000087x9
Con el análisis de varianza se puede observar que el 80.09% de la relación que existe
entre las variables independiente y dependientes, se puede explicar con el modelo,
además de que su Pr>F es menor a 0.05 (F tab).

De las 9 variables presentadas, se observa que la de mayor error son la x3, x5 y x7, por
lo que podría ser modificado el modelo eliminando esas variables.
Observando la tabla de Output statistic se puede notar que no existen outliers
representativos o que causen un gran impacto dentro del modelo.
Si se eliminan las observaciones que contienen 3 *, se obtiene el siguiente análisis de
varianza:
Analizando la modificación de la eliminación de los supuestos outliers, se nota un
aumento en el valor de la R-cuadrado y en Adj R-sq.
Observando la gráfica se concluye que no existe heterocedasticidad.

Q.6.12 Table B.11 contains data on the quality of Pinot Noir wine. Fit a regression
model using clarity, aroma, body, flavor, and oakiness as the regressors.
Investigate this model for influential observations and comment on your findings.
Y=3.996865 + 2.339454x1 + 0.482551x2 + 0.273161x3 + 1.168324x4 -0.684010x5
1. Relación entre Y y X

El coeficiente de determinación (R2) es igual a 0.8376. Esto significa que las variables (Xi)
explican el 72,1% de la varianza de Y. El coeficiente de correlación múltiple (R) es igual a
0.7997. Esto significa que hay una relación directa muy fuerte entre los datos (ŷ) y los
datos observados (y).
2. Bondad del ajuste
En general, la regresión es valor p = 22.10 Dado que el valor p < α (0.0001), rechazamos la
H0.
3. Validación
Normalidad de los residuos, la regresión lineal asume normalidad para los errores
residuales. El valor p es igual a 0,236200. Se asume que los datos están distribuidos
normalmente.
4. Homocedasticidad - homogeneidad de la varianza
El valor p de la prueba es igual a 0.0019 . Se asume que la varianza no es homogénea. Los
estimadores de los coeficientes son imparciales, pero ineficientes, con errores estándar
inexactos y grandes, por lo tanto, las pruebas estadísticas sobre el modelo y los
coeficientes no son precisas
Se puede considerar eliminar X4 del
modelo
6.18 able B.17 contains hospital patient satisfaction data. Fit an appropriate regression
model to the satisfaction response using age and severity as the regressors and account
for the medical versus surgical classification of each patient with an indicator variable.
Has adding the indicator variable improved the model? Is that any evidence to support a
claims that medical and surgical patients differ in their satisfaction?
Ŷ = 139.923348 - 1.046154 X1 - 0.435907 X2
1. Los resultados de la regresión lineal múltiple indicaron que había un efecto
colectivo muy fuerte y significativo entre X1, X2 e Y,, R2 = 0.81, R2ajustado = 0.78).
Los predictores individuales fueron examinados más detalladamente y se encontró
que X1 (t = -6.652, p < .001).
Correlation matrix (pearson)

Relación entre Y y X
El cuadrado de R (R2) es igual a 0.81. Esto significa que los predictores (Xi) explican
el 81% de la varianza de Y.
Bondad del ajuste
El modelo de regresión lineal, Y = b0+ b1X1 +...+bpXp + ε, proporciona un ajuste
mejor que el modelo sin las variables independientes, que resulta en Y = b0 + ε

En la grafica se puede mostrar que hay problemas de heteroelastocidad , significa que la


varianza de los errores del modelo no es constante en todas las observaciones y puede
afectar la precisión

También podría gustarte