Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Análisis de La Varianza ANOVA

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

ANÁLISIS DE LA VARIANZA DE UN FACTOR (ANOVA DE UN FACTOR)

Para comparar dos grupos se ha estudiado la decisión estadística. Pero si se trata de más de
dos grupos el número de comparaciones en parejas se puede tornar aparatoso y complicado.
Existen de hecho muchas situaciones en las cuales se necesita ensayar la significación de
diferencias entre más de dos medias muestrales o lo que es equivalente ensayar la hipótesis
nula de que las medias muestrales son iguales.

Supóngase que se tienen n diferentes grupos sujetos a n “tratamientos” diferentes, uno para
cada grupo.

T1 T2 T3 Tr
X11 X12 … X1r
X21 X22 … X2r

Xn1 Xn2 … Xnr


Se calculan las medias para cada grupo y del grupo total:
𝑟

𝑥̅𝑗 = ∑ 𝑥𝑖𝑗
𝑘=1

𝑟 𝑛
1
𝑥̅ = ∑ ∑ 𝑥𝑖𝑗
𝑟𝑛
𝑗=1 𝑖=1

Se define la variación total como la suma de los cuadrados de las desviaciones de cada 𝑥𝑗𝑖
respecto de 𝑥𝑇 . En símbolos:

2
𝜈 = ∑(𝑥𝑖𝑗 − 𝑥̅ )
𝑖,𝑗

Se puede demostrar que:

2 2 2
𝑆𝐶 = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅ ) = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅𝑗 ) + ∑(𝑥̅𝑗 − 𝑥̅ )
𝑖 𝑗 𝑖 𝑗 𝑗

Donde el primer sumando es la variación dentro de los grupos. Se denotará 𝑉𝐼 .

El segundo sumando es la variación entre los grupos. Se denotará 𝑉𝐸 .

Esto conduce a establecer la ecuación:

𝑉 = 𝑉𝐼 + 𝑉𝐸

Más detalladamente:

La variación total es por definición:


𝑛 𝑟

𝑆𝐶 = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅ )2
𝑖=1 𝑗=1

Desarrollando el cuadrado se tiene:


2 2 2 2
(𝑥𝑖𝑗 − 𝑥̅ ) = (𝑥𝑖𝑗 − 𝑥̅𝑗 + 𝑥̅𝑗 − 𝑥̅𝑡 ) = (𝑥𝑖𝑗 − 𝑥̅𝑗 ) + 2(𝑥𝑖𝑗 − 𝑥̅𝑗 )(𝑥̅𝑗 − 𝑥̅ ) + (𝑥̅𝑗 − 𝑥̅ )

El término central de este desarrollo al colocarlo en la sumatoria se anula. En efecto:

𝑛 𝑟 𝑛 𝑟

2 ∑ ∑(𝑥𝑖𝑗 − 𝑥̅𝑗 )(𝑥̅𝑗 − 𝑥̅ ) = 2 ∑(𝑥̅𝑗 − 𝑥̅ ) [∑(𝑥𝑖𝑗 − 𝑥̅𝑗 )]


𝑖=1 𝑗=1 𝑖=1 𝑗=1

Este paso se motiva a que para cada valor de j, 𝑥̅𝑗 − 𝑥̅ es constante y puede salir como factor
común. La última expresión es igual a:
𝑟 𝑛

2 ∑(𝑥̅𝑗 − 𝑥̅ ) [∑ 𝑥𝑖𝑗 − 𝑟𝑥̅𝑗 ]


𝑖=1 𝑖=1

∑𝑛
𝑖=1 𝑥𝑖𝑗
Pero 𝑥̅𝑗 = y por lo tanto el valor dentro de los corchetes es 0. Por lo tanto y finalmente:
𝑛

𝑛 𝑟
2 2
𝑆𝐶 = ∑ ∑ [(𝑥𝑖𝑗 − 𝑥̅𝑗 ) + (𝑥̅𝑗 − 𝑥̅ ) ]
𝑖=1 𝑗=1

𝑛 𝑟 𝑛 𝑟
2 2
= ∑ ∑(𝑥𝑖𝑗 − 𝑥̅𝑗 ) + ∑ ∑(𝑥̅𝑗 − 𝑥̅ ) = 𝑆𝐶𝑖 + 𝑆𝐶𝑒
𝑖=1 𝑗=1 𝑖=1 𝑗=1

El método tabulado en el presente material se apoya en las siguientes igualdades:


𝑛 𝑟 𝑛 𝑟
2
𝑆𝐶 = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅ ) = ∑ ∑(𝑥𝑖𝑗 2 − 2𝑥𝑖𝑗 𝑥̅𝑡 + 𝑥̅ 2 )
𝑖=1 𝑗=1 𝑖=1 𝑗=1

𝑛 𝑟 𝑛 𝑟 𝑛 𝑟

= ∑ ∑ 𝑥𝑖𝑗 − 2 ∑ ∑ 𝑥𝑖𝑗 𝑥̅ + ∑ ∑ 𝑥̅ 2
2

𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1

𝑛 𝑟

[∑ ∑ 𝑥𝑖𝑗 2 ] − 2𝑥̅ (𝑛𝑟𝑥̅ ) + 𝑛𝑟𝑥̅ 2


𝑖=1 𝑗=1

𝑛 𝑟

[∑ ∑ 𝑥̅𝑖𝑗 2 ] − 𝑛𝑟𝑥̅𝑡 2
𝑖=1 𝑗=1

Haciendo 𝑛𝑟 = 𝑁 el segundo término queda como:

2 2 2
2
∑𝑛𝑖=1 ∑𝑟𝑗=1 𝑥𝑖𝑗 (∑𝑛𝑖=1 ∑𝑟𝑗=1 𝑥𝑖𝑗 ) (∑𝑛𝑖=1 ∑𝑟𝑗=1 𝑥𝑖𝑗 )
𝑛𝑟𝑥̅ = 𝑛𝑟 ( ) = 𝑛𝑟 =
𝑛𝑟 (𝑛𝑟)2 𝑁
Es decir:
2
(∑𝑛 𝑟
𝑖=1 ∑𝑗=1 𝑥𝑖𝑗 )
𝑆𝐶 = [∑𝑛𝑖=1 ∑𝑟𝑗=1 𝑥̅𝑖𝑗 2 ] − 𝑁
(1)

Por otro lado:


𝑛 𝑟 𝑛 𝑟
2
𝑆𝐶𝑒 = ∑ ∑(𝑥̅𝑗 − 𝑥̅ ) = ∑ ∑(𝑥̅𝑗 2 − 2𝑥̅𝑗 𝑥̅𝑡 + 𝑥̅ 2 )
𝑖=1 𝑗=1 𝑖=1 𝑗=1

𝑛 𝑟 𝑛 𝑟 𝑛 𝑟
2
= ∑ ∑ 𝑥̅𝑗 − 2 ∑ ∑ 𝑥̅𝑗 𝑥̅ + ∑ ∑ 𝑥̅ 2
𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1

= 𝑛 ∑ 𝑥̅𝑗 2 − 2𝑥̅𝑡 (𝑛𝑟𝑥̅𝑡 ) + 𝑛𝑟𝑥̅ 2


𝑗=1

= 𝑛 ∑ 𝑥̅𝑗 2 − 𝑛𝑟𝑥̅ 2
𝑗=1

Pero:
𝑛
∑𝑛𝑖=1 𝑥𝑖𝑗
𝑥̅𝑗 = ⇒ ∑ 𝑥𝑖𝑗 = 𝑛𝑥̅𝑗
𝑛
𝑖=1

Luego
𝑟

∑ 𝑟𝑥̅𝑗 = 𝑛𝑟𝑥̅
𝑗=1

Sustituyendo se tiene:

𝑟 𝑟 𝑟
2 2 1 𝑛𝑟
𝑛 ∑ 𝑥̅𝑗 − 𝑛𝑟𝑥̅ 2 = ∑ 𝑛𝑥̅𝑗 − 𝑛𝑟( ∑ ∑ 𝑥𝑖𝑗 )2 = 𝑛 ∑ 𝑥̅𝑗 2 − (∑ ∑ 𝑥𝑖𝑗 )2
𝑛𝑟 (𝑛𝑟)2
𝑗=1 𝑗=1 𝑖 𝑗 𝑗=1 𝑖 𝑗

Es decir:
𝑟
(∑𝑖 ∑𝑗 𝑥𝑖𝑗 )2
𝑆𝐶𝑒 = 𝑛 ∑ 𝑥̅𝑗 2 −
𝑛𝑟
𝑗=1

𝑛 𝑟 𝑟
2 2
(∑𝑖 ∑𝑗 𝑥𝑖𝑗 )2
𝑆𝐶𝑒 = ∑ ∑(𝑥̅𝑗 − 𝑥̅𝑡 ) = 𝑛 ∑ 𝑥̅𝑗 −
𝑛𝑟
𝑖=1 𝑗=1 𝑗=1
Prueba F para igualdad de medias:

La prueba pretende evaluar:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = ⋯ = 𝜇𝑛
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔ú𝑛 𝑖 𝑦 𝑗 𝑑𝑖𝑠𝑡𝑖𝑛𝑡𝑜𝑠

Tabla del la ANOVA de un factor:

Fuente de Variación Grados de libertad Cuadrados medios F


Entre grupos n-1 𝑉𝐸 𝑆𝐸 2
𝑆𝐸 2 = 𝐹=
𝑉𝐸 𝑛−1 𝑆𝐼 2
Con n-1 y n(r-1) gl
Intra Grupos n(r-1) 𝑉𝐼
𝑆𝐼 2 =
𝑉𝐼 𝑛(𝑟 − 1)
Total rn-1
𝑉𝐼 + 𝑉𝐸

Ejemplo:

A B C
48 47 49
49 49 51
50 48 50
49 48 50
49 48 50

De donde se obtiene la tabla:

Variacion GL Cuad Med F


8 2 4 6
6 3 0,6667
14 11

Pero 𝐹0.05; 2;9 = 4.26 para 𝛼 = 0.05. Como F0.05;2;9 <6=F se rechaza la hipótesis nula de
igualdad de medias y se acepta la diferencia entre los grupos.
Para determina cuales grupos pueden ser significativamente iguales se puede aplicar varios
métodos entre los que destacan:
1) Fisher
2) Schefe
3) Dunett
4) Duncan
5) Tukey Snedecor (Tabla particular)

Fisher:

Fórmula para la razón crítica:


𝑋̅𝑖 − 𝑋̅𝑗
𝑡=
1 1
√𝑀𝐶𝐼(𝑛 − 𝑛 )
𝑖 𝑗

Este valor se usa para tomar decisión sobre las hipótesis:

𝐻0 : 𝜇𝑖 = 𝜇𝑗
{
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗

|𝑋̅𝑖 −𝑋̅𝑗 | |𝑋̅𝑖 −𝑋̅𝑗 |


Para cada pareja de determina 𝑡𝑖𝑗 = 1 1
= 0,5774
√0,667( + )
4 4

En nuestro caso se calculan las diferencias:

|𝑋̅𝐴 − 𝑋̅𝐵 | |1|


𝑡𝐴𝐵 = = = 1,7319
0,5774
√0,667(1 + 1)
4 4

|𝑋̅𝑖 − 𝑋̅𝑗 | |1|


𝑡𝐴𝐶 = = = 1,7319
0,5774
√0,667(1 + 1)
4 4

|𝑋̅𝑖 − 𝑋̅𝑗 | |2|


𝑡𝐵𝐶 = = = 3.4638
0,5774
√0,667(1 + 1)
4 4

El valor critico es 𝑡 𝛼,9 con un 𝛼 = 0.01 que según tabla es: t=3,25.
El tratamiento más consistente parece ser el C que es único que presenta diferencia
significativa.
Schefe:

Se usa cuando los grupos son de igual tamaño. Con las mismas hipótesis
𝐻0 : 𝜇𝑖 = 𝜇𝑗
{
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗

El estadístico de prueba es F siendo la razón crítica:

̅̅̅
(𝑋𝑖 − 𝑋̅𝑗 )2 𝑑𝑖𝑗 2
𝐹= =
1 1 1 1
𝑀𝐶𝐼(𝑛 − 𝑛 )(𝑟 − 1) 𝑀𝐶𝐼(𝑛 − 𝑛 )(𝑟 − 1)
𝑖 𝑗 𝑖 𝑗

Despejando 𝑑𝑖𝑗 se obtiene:

1 1
𝑑𝑖𝑗 = √𝑀𝐶𝐼( − )(𝑟 − 1)𝐹𝛼,𝑟−1,𝑁−1
𝑛𝑖 𝑛𝑗
Estableciendo 𝛼 = 0,01Se determina el valor crítico y se comparan las diferencias y se
comparan con el valor obtenido.

𝑑𝑖𝑗 = √(0,6667)(0,5)2(7,21) = 2,1925

𝑑𝐴𝐵 = 1

𝑑𝐴𝐶 = 1

𝑑𝐵𝐶 = 2

Todos los 𝑑𝑖𝑗 son menores que la razón critica. Se rechazan las hipótesis nulas de igualdad
en pareja. Luego, todos los tratamientos son iguales.

ANÁLISIS DE LA VARIANZA CON DOS FACTORES:

Supóngase que se tiene dos factores actuando sobre un conjunto de grupos sometidos a r
tratamientos pero distribuidos en n bloques que se constituyen en un factor por la
categorización que genera la selección tales bloques. Una tabla con una configuración así se
muestra a continuación precisión:

BLOQUES
B1 B2 …. Bn
T1 X11 X12 …. X1n
Tratamientos

T2 X21 X22 …. X2n

…. …. …. …. ….

Tr Xr1 Xr2 …. Xrn

La variación total se define, de forma natural, como en el caso de un único factor:


𝑛 𝑟

𝑉 = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅ )2
𝑖=1 𝑗=1

Siendo
𝑛 𝑟
𝑥𝑖𝑗
𝑥̅ = ∑ ∑
𝑛𝑟
𝑖=1 𝑗=1

Usando la igualdad:

𝑥𝑖𝑗 − 𝑥̅ = (𝑥𝑖𝑗 − 𝑥̅𝑗 − 𝑥̅𝑘 + 𝑥̅ ) + (𝑥̅𝑗 − 𝑥̅ ) + (𝑥̅𝑘 − 𝑥̅ )

Se puede demostrar que:

𝑉 = 𝑉𝐸 + 𝑉𝑅 + 𝑉𝐶

Siendo VE la variación debido al error o la casualidad, VR la variación debido a los tratamientos


y VC la variación debida a los bloques. A fin de simplificar los cálculos se establecen los
siguientes términos:
𝑛 𝑟

𝑇 = ∑ ∑ 𝑥𝑖𝑗
𝑖=1 𝑗=1

𝑇𝑗 = ∑ 𝑥𝑖𝑗
𝑖=1

Con estas abreviaturas las diferentes variaciones se pueden determinar con las formulas:
𝑛 𝑟
2 𝑇2
𝑉 = ∑ ∑(𝑥𝑖𝑗 ) −
𝑛𝑟
𝑖=1 𝑗=1

𝑟
1 2 𝑇2
𝑉𝑅 = ∑(𝑇𝑖𝑗 ) −
𝑛 𝑛𝑟
𝑗=1

𝑛
1 2 𝑇2
𝑉𝐶 = ∑(𝑇𝑖𝑗 ) −
𝑟 𝑛𝑟
𝑖=1

𝑉𝐸 = 𝑉 − (𝑉𝑅 + 𝑉𝐶 )

La Tabla para el análisis de la varianza de dos factores se muestra a continuación:

Variacion Grados de Suma de F


Libertad cuadrados
𝑟 𝑉𝑅
1 𝑇2 r-1 𝑆𝑅 2
2
𝑉𝑅 = ∑(𝑇𝑖𝑗 ) − 𝑆𝑅 2 =
𝑛 𝑛𝑟 𝑟−1 𝑆𝐸 2
𝑗=1
r-1 y (r-1)(n-1) gl
𝑛 𝑉𝐶
1 𝑇2 n-1 𝑆𝐶 2
2
𝑉𝐶 = ∑(𝑇𝑖𝑗 ) − 𝑆𝐶 2 =
𝑟 𝑛𝑟 𝑛−1 𝑆𝐸 2
𝑖=1
n-1 y (r-1)(n-1) gl
𝑉𝐸 = 𝑉 − (𝑉𝑅 + 𝑉𝐶 ) (r-1)(n-1) 𝑉𝐸
𝑆𝐸 2 =
(𝑟 − 1)(𝑛 − 1)
𝑉 = 𝑉𝐸 + 𝑉𝑅 + 𝑉𝐶 Nr-1

Para un nivel de confianza determinado se establece los valores críticos y se contrastan las
hipótesis:

También podría gustarte