Prueba de Hipótesis Análisis de Varianza
Prueba de Hipótesis Análisis de Varianza
Prueba de Hipótesis Análisis de Varianza
Para que la prueba sea significativa F debe ser mayor que 1 y el valor p < 0.05 determinar si hay
diferencias significativas entre los grupos en que hemos dividido la población; es decir, comprobar
la variación que existe entre los grupos (SCE) es lo suficientemente importante como para
entender que no se trata de una población homogénea.
Análisis: A simple vista se puede observar que el valor medio de estos grupos es
numéricamente distinto, de hecho la media del día lunes tiene un valor medio casi
equivalente al doble de la media del viernes. Por tanto, nuestra hipótesis se centra en
comprobar si la concentración de CO es significativamente distinta en los cinco grupos .
3.- Para responder a esta hipótesis recurrimos al Análisis de la Varianza de un factor y
ANOVA
Concetracion_CO
Suma de Media
cuadrados gl cuadrática F Sig.
Entre grupos 119484,350 4 29871,087 4,775 ,004
Dentro de grupos 218948,750 35 6255,679
Total 338433,100 39
Plantear Hipótesis
Ho: El promedio de las concentraciones es igual el día lunes que el martes, que el miércoles. que el jueves,
1
que el viernes H 0 :µ 1=µ 2=µ3=µ 4=µ 5
H1: El promedio de las concentraciones de CO son diferentes al menos en dos días
H 1: µ i ≠ µ j Para algún i ± j
Pero ¿Cuáles son esos grupos? ¿Los cinco grupos son distintos o sólo alguno de ellos?
4.- Para responder a esta pregunta recurrimos a un análisis de Modelo Lineal general
5.- La salida de SPSS también nos muestra que R cuadrado vale 0.353, indicándonos que
el modelo explica el 35.3% de la variabilidad de los datos por lo que se hace necesario
realizar un estudio de la Idoneidad del modelo Como hemos dicho anteriormente,
validar el modelo propuesto consiste en estudiar si las hipótesis básicas del modelo
están o no en contradicción con los datos observados. Es decir si se satisfacen los
supuestos del modelo: Normalidad, Independencia, Homocedasticidad. Para ello
utilizamos procedimientos gráficos y analíticos.
El análisis de la varianza (Anova) permite comparar las medias de varios
grupos, después de cumplir algunos supuestos de partida
6.- Hipótesis de normalidad. En primer lugar, analizamos la normalidad de las
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Dias_Semana Estadístico gl Sig. Estadístico gl Sig.
*
Concetraci Lunes ,215 8 ,200 ,903 8 ,309
on_CO Martes ,127 8 ,200* ,966 8 ,868
*
Miercoles ,138 8 ,200 ,978 8 ,953
Jueves ,139 8 ,200* ,958 8 ,787
Cada grupo tiene su promedio (el círculo en cada una de las barras) y dos
desviaciones típicas a la izquierda y dos desviaciones típicas a la derecha del
promedio. Observamos que el miércoles hay mucha más dispersión que el resto
de los días y donde hay menos dispersión es el lunes, la dispersión del martes y
viernes son muy similares. Del gráfico no se deduce directamente si hay
homogeneidad en estas varianzas, por lo que recurrimos analizar la
heterocedasticidad analíticamente mediante el test de Levene.
Una vez comprobado que se verifican las hipótesis del modelo se puede
interpretar la tabla ANOVA. Si alguna de las hipótesis de homocedasticidad e
independencia fallase no debería aplicarse el ANOVA, en cuanto a la hipótesis de
Normalidad hay que tener en cuenta que las pruebas ANOVA son robustas ante
leves desviaciones de la normalidad.
Análisis:
Esta salida nos muestra los intervalos de confianza simultáneos construidos por
el método de Tukey. En la tabla se muestra un resumen de las comparaciones de
El análisis de la varianza (Anova) permite comparar las medias de varios
grupos, después de cumplir algunos supuestos de partida
cada tratamiento con los restantes. Es decir, aparecen comparadas dos a dos las
cinco medias de los tratamientos. En el primer bloque de la tabla se muestran
comparadas la media del lunes con la media de los otros cuatro días de la
semana. En los siguientes bloques se muestran comparadas las restantes medias
entre sí. En la columna Diferencias de medias (I-J) se muestran las diferencias
entre las medias que se comparan. En la columna Sig. aparecen los p-valores de
los contrastes, que permiten conocer si la diferencia entre cada pareja de medias
es significativa al nivel de significación considerado (en este caso 0.05) y la última
columna proporciona los intervalos de confianza al 95% para cada diferencia. Así
por ejemplo, si comparamos la concentración media de CO del Lunes con el
Martes, tenemos una diferencia entre ambas medias de 19.750, un error típico
de 39.546, que es un error típico para la diferencia de estas medias, un P-valor
(Sig.) de 0.987 no significativo puesto que la concentración de CO no difiere
significativamente el lunes del martes y un intervalo de confianza con un límite
inferior negativo y un límite superior positivo y por lo tanto contiene al cero de lo
que también deducimos que no hay diferencias significativas entre los dos
grupos que se comparan o que ambos grupos son homogéneos. En cambio si
observamos el grupo formado por el Lunes y el Miércoles, vemos que ambos
extremos del intervalo son del mismo signo y el P-valor es significativo
deduciendo que si hay diferencias significativas entre ambos. Ya se había
observado que la concentración media de CO el miércoles era muy inferior al
lunes, de hecho el valor de la diferencia de medias es 120.875. Las otras
comparaciones se interpretan de forma análoga. Por lo tanto la tabla se
interpreta observando los valores de Sig menores que el 5%, o si el intervalo de
confianza contiene al cero. Además, los contrastes que sí han resultado
significativos al nivel de significación 0.05 aparecen marcados con asterisco.
Concluimos que se detectan diferencias significativas en las concentraciones de
CO entre lunes y miércoles; lunes y viernes; martes y viernes.
El análisis de la varianza (Anova) permite comparar las medias de varios
grupos, después de cumplir algunos supuestos de partida
12.- En la tabla de resultados damos doble click y nos vamos al menú principal
Lista dinámica.
Concetracion_CO
HSD Tukeya,b
Subconjunto
Dias_Semana N 1 2 3
Viernes 8 284,2500
Miércoles 8 303,3750 303,3750
Jueves 8 359,3750 359,3750 359,3750
Martes 8 404,5000 404,5000
Lunes 8 424,2500
Sig. ,336 ,101 ,483
Se visualizan las medias para los grupos en los subconjuntos homogéneos.
Se basa en las medias observadas.
El término de error es la media cuadrática(Error) = 6255,679.
a. Utiliza el tamaño de la muestra de la media armónica = 8,000.
b. Alfa = ,05.
Análisis:
La tabla de subconjuntos homogéneos muestra por columnas los subgrupos de
medias iguales, formados al utilizar el método de Tukey. Se llama Prueba de
subgrupos homogéneos por que se agrupan en columnas aquellos grupos que no
difieren significativamente. Se observa que la prueba de Tukey ha agrupado los
días viernes, miércoles y jueves en una misma columna; miércoles, jueves y
martes en otra columna y jueves, martes y lunes en una tercera columna. De esta
forma gráfica deducimos que subgrupos son homogéneos y cuales difieren
significativamente. Los subgrupos homogéneos son los formados por: viernes,
miércoles y jueves; miércoles, jueves y martes y jueves, martes y lunes. De
hecho, por ejemplo, si comparamos en el primer subconjunto, los tres primeros
grupos el P-valor (Sig.) es 0.336 mayor que el nivel de significación 0.05
deduciendo que no hay diferencias significativas en la concentración media de
CO entre estos tres. También se deduce qué subconjuntos difieren
significativamente entre sí. La concentración de CO en el primer subconjunto
difiere de la concentración en el segundo y de la concentración en el tercero y
dentro de estos subconjuntos no se aprecian diferencias significativas entre las
El análisis de la varianza (Anova) permite comparar las medias de varios
grupos, después de cumplir algunos supuestos de partida
concentraciones implicadas. También se observa que la concentración media de
CO es mayor los lunes (424,25) y menor los viernes (284,25).
.
El análisis de la varianza (Anova) permite comparar las medias de varios
grupos, después de cumplir algunos supuestos de partida
Análisis: