Etacion
Etacion
Etacion
METODOS ESTADISTICOS
y=-9.9445+0.00018x1+0.0034x2+0.2082x3+0.0334x4-0.0072x5+0.0015x6+0.1593x7-
0.0052x8-0.000087x9
Con el análisis de varianza se puede observar que el 80.09% de la relación que existe
entre las variables independiente y dependientes, se puede explicar con el modelo,
además de que su Pr>F es menor a 0.05 (F tab).
De las 9 variables presentadas, se observa que la de mayor error son la x3, x5 y x7, por
lo que podría ser modificado el modelo eliminando esas variables.
Observando la tabla de Output statistic se puede notar que no existen outliers
representativos o que causen un gran impacto dentro del modelo.
Si se eliminan las observaciones que contienen 3 *, se obtiene el siguiente análisis de
varianza:
Analizando la modificación de la eliminación de los supuestos outliers, se nota un
aumento en el valor de la R-cuadrado y en Adj R-sq.
Observando la gráfica se concluye que no existe heterocedasticidad.
Q.6.12 Table B.11 contains data on the quality of Pinot Noir wine. Fit a regression
model using clarity, aroma, body, flavor, and oakiness as the regressors.
Investigate this model for influential observations and comment on your findings.
Y=3.996865 + 2.339454x1 + 0.482551x2 + 0.273161x3 + 1.168324x4 -0.684010x5
1. Relación entre Y y X
El coeficiente de determinación (R2) es igual a 0.8376. Esto significa que las variables (Xi)
explican el 72,1% de la varianza de Y. El coeficiente de correlación múltiple (R) es igual a
0.7997. Esto significa que hay una relación directa muy fuerte entre los datos (ŷ) y los
datos observados (y).
2. Bondad del ajuste
En general, la regresión es valor p = 22.10 Dado que el valor p < α (0.0001), rechazamos la
H0.
3. Validación
Normalidad de los residuos, la regresión lineal asume normalidad para los errores
residuales. El valor p es igual a 0,236200. Se asume que los datos están distribuidos
normalmente.
4. Homocedasticidad - homogeneidad de la varianza
El valor p de la prueba es igual a 0.0019 . Se asume que la varianza no es homogénea. Los
estimadores de los coeficientes son imparciales, pero ineficientes, con errores estándar
inexactos y grandes, por lo tanto, las pruebas estadísticas sobre el modelo y los
coeficientes no son precisas
Se puede considerar eliminar X4 del
modelo
6.18 able B.17 contains hospital patient satisfaction data. Fit an appropriate regression
model to the satisfaction response using age and severity as the regressors and account
for the medical versus surgical classification of each patient with an indicator variable.
Has adding the indicator variable improved the model? Is that any evidence to support a
claims that medical and surgical patients differ in their satisfaction?
Ŷ = 139.923348 - 1.046154 X1 - 0.435907 X2
1. Los resultados de la regresión lineal múltiple indicaron que había un efecto
colectivo muy fuerte y significativo entre X1, X2 e Y,, R2 = 0.81, R2ajustado = 0.78).
Los predictores individuales fueron examinados más detalladamente y se encontró
que X1 (t = -6.652, p < .001).
Correlation matrix (pearson)
Relación entre Y y X
El cuadrado de R (R2) es igual a 0.81. Esto significa que los predictores (Xi) explican
el 81% de la varianza de Y.
Bondad del ajuste
El modelo de regresión lineal, Y = b0+ b1X1 +...+bpXp + ε, proporciona un ajuste
mejor que el modelo sin las variables independientes, que resulta en Y = b0 + ε