Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

(Anova) 2

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 94

EXPERIMENTOS FACTORIALES

ANOVA

Anlisis de la Varianza

EAAA 1
Comprender la nocin general del anlisis de
variancia (ANOVA).
Realizar una prueba de hiptesis para determinar
si dos variancias muestrales provienen de las
mismas poblaciones o de poblaciones iguales.
Establecer y organizar datos en una tabla de
ANOVA.
Realizar una prueba para determinar si existe
diferencia entre tres o ms medias de tratamiento.
Realizar una prueba de hiptesis para determinar
si hay alguna diferencia entre medias de bloques.

EAAA 2
EXPERIMENTOS FACTORIALES

Los experimentos son esenciales para desarrollar y mejorar


los mtodos cientficos y de ingeniera. Slo mediante la
experimentacin se pueden comparar las diferentes
variantes de un mtodo con el fin de comprobar cul es el
ms efectivo. Para que sea til, un experimento se debe
disear adecuadamente, y los datos que se obtienen de
ste se deben analizar en forma correcta. En este captulo
se analizan el diseo y el anlisis de datos a partir de una
clase de experimentos conocidos como experimentos
factoriales.

EAAA 3
ANLISIS DE LA VARIANZA (ANOVA)

Es una potente herramienta estadstica, de gran


utilidad tanto en la industria, para el control de
procesos, como en el laboratorio de anlisis,
para el control de mtodos analticos.

EAAA 4
Aplicacin:
-Para la comparacin de mltiples columnas de datos

-Para la estimacin de los componentes de variacin de un


proceso.

-El anlisis de la varianza (o Anova: Analysis of variance) es


un mtodo para comparar dos o ms medias.

EAAA 5
EAAA 6
Comparacin de mltiples poblaciones
La comparacin de diversos conjuntos de resultados es habitual en los:

Laboratorios analticos. As, por ejemplo, puede interesar comparar diversos mtodos de
anlisis con diferentes caractersticas, diversos analistas entre s, o una serie de
laboratorios que analizan una misma muestra con el mismo mtodo (ensayos
colaborativos).

Tambin sera el caso cuando queremos analizar una muestra que ha estado sometida a
diferentes tratamientos o ha estado almacenada en diferentes condiciones. En todos
estos ejemplos hay dos posibles fuentes de variacin: una es el error aleatorio en la
medida y la otra es lo que se denomina factor controlado (tipo de mtodo, diferentes
condiciones, analista o laboratorio,...).

Una de las herramientas estadsticas ms utilizadas que permite la separacin


de las diversas fuentes de variacin es el anlisis de la varianza (ANOVA, del
ingls Analysis of Variance) [Massart, 1997].

EAAA 7
EAAA 8
EAAA 9
EAAA 10
EAAA 11
EAAA 12
EAAA 13
EAAA 14
EAAA 15
EAAA 16
EAAA 17
EAAA 18
EAAA 19
EAAA 20
EAAA 21
EAAA 22
EAAA 23
EAAA 24
EAAA 25
EAAA 26
EAAA 27
EAAA 28
EAAA 29
EAAA 30
Cuando tengamos un factor, controlado o aleatorio, aparte del error propio de
la medida, hablaremos del ANOVA de un factor.

En el caso de que estuvisemos desarrollando un nuevo mtodo colorimtrico


y quisiramos investigar la influencia de diversos factores independientes
sobre la absorbancia, tales como la concentracin de reactivo A y la
temperatura a la que tiene lugar la reaccin, entonces hablaramos de un
ANOVA de dos factores.

En los casos donde tenemos dos o ms factores que influyen, se realizan los
experimentos para todas las combinaciones de los factores estudiados,
seguido del ANOVA. Se puede deducir entonces si cada uno de los factores o
una interaccin entre ellos tienen influencia significativa en el resultado.

EAAA 31
Para utilizar el ANOVA de forma satisfactoria deben
cumplirse tres tipos de hiptesis, aunque se aceptan ligeras
desviaciones de las condiciones ideales:

1. Cada conjunto de datos debe ser independiente del


resto.

2. Los resultados obtenidos para cada conjunto deben


seguir una distribucin normal.

3. Las varianzas de cada conjunto de datos no deben diferir


de forma significativa.

EAAA 32
EAAA 33
El anlisis de la varianza (ANOVA) de un conjunto de muestras
consiste en contrastar:

La hiptesis nula todas las medias poblacionales de las que


provienen las muestras son iguales.

Contra

La hiptesis alternativa no todas las medias son iguales.

Con un nivel de significacin a prefijado.

EAAA 34
La lgica del ANOVA
w El contraste de hiptesis del ANOVA se basaen comprobar si las medias de
las muestras difieren ms de lo que cabe esperar cuando es cierta, la hiptesis
nula.
w Esta cuestin acerca de las medias se responde analizando las varianzas.
Nos fijamos en las varianzas, porque, cuando queremos saber si algunas medias
difieren entre s, tenemos que valorar la varianza entre estas medias.

EAAA 35
Dos Fuentes de Variabilidad
w En ANOVA, un estimador de la variabilidad entre grupos se
compara con la variabilidad dentro de los grupos.
1- La variacin Entre Grupos es la variacion entre las medias de los
diferentes tratamientos debidas al azar (error de muestreo ) y al
efecto de los tratamientos, si es que existe.
2. La variacin Dentro de los Grupos es la variacion debida al azar
(error de muestreo) entre individuos a los que se ha dado el mismo
tratamiento.

EAAA 36
Variabilidad Entre Grupos
w Hay mucha variabilidad entre las medias.
w Las diferencias entre las medias de los grupos son
demasiado grandes para atribuirlas al azar.
w Es difcil imaginar que los seis grupos son muestras
aleatorias tomadas de la misma poblacin.
w Se rechaza la hiptesis nula, es decir, existe efecto
del tratamiento al menos en uno de los grupos.

EAAA 37
EAAA 38
ANOVA de un factor

Tomemos como ejemplo la comparacin de 5 laboratorios que analizan


nk veces con el mismo procedimiento la concentracin de Pb en una
misma muestra de agua de ro.

El objetivo del ANOVA aqu es comparar los errores sistemticos con los
aleatorios obtenidos al realizar diversos anlisis en cada laboratorio.

Condiciones importantes que cada laboratorio analice sus muestras de


manera independiente y con precisiones parecidas a las del resto de
laboratorios.

En la tabla 1 se muestran los resultados obtenidos (expresados en mg/L).

EAAA 39
RESULTAD LABORAT LABORAT LABORAT LABORAT LABORAT
OS 1 2 3 4 5
1 2.3 6.5 1.7 2.1 8.5
2 4.1 4.0 2.7 3.8 5.5
3 4.9 4.2 4.1 4.8 6.1
4 2.5 6.3 1.6 2.8 8.2
5 3.1 4.4 4.1 4.8 --
6 3.7 -- 2.8 3.7 --
7 -- -- -- 4.2 --
VALOR 3.4 5.1 2.8 3.7 7.1
MEDIO x

n 6 5 6 7 4
k
suma 20.6 25.4 17.0 26.2 28.3
Aritmetica De todos Resultados X= 4.2
Media los X 40
EAAA
Observando los valores medios todo parece indicar que existen
diferencias entre los laboratorios. Ahora bien, son dichas diferencias
significativas? El ANOVA responde a esta cuestin.

El objetivo del ANOVA es comparar los diversos valores medios para


determinar si alguno de ellos difiere significativamente del resto.

Para ello se utiliza una estrategia bien lgica: si los resultados


proporcionados por los diversos laboratorios no contienen errores
sistemticos, los valores medios respectivos no diferirn mucho los
unos de los otros y su dispersin, debida a los errores aleatorios, ser
comparable a la dispersin presente individualmente en cada
laboratorio.
EAAA 41
ANOVA PARA UN FACTOR

Prueba de hiptesis para probar la igualdad de medias de


varias poblaciones para un factor

Se trata de probar si el efecto de un factor o Tratamiento en la respuesta de un


proceso o sistema es Significativo, al realizar experimentos variando Los
niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.), presiones

Ho : 1 2 3 ......... a
Ha : A lg unas. ' s.son.diferentes
EAAA 42
CONDICIONES

Todas las poblaciones son normales

Todas las poblaciones tiene la misma varianza

Los errores son independientes con distribucin normal


de media cero

La varianza se mantiene constante para todos los niveles


del factor

EAAA 43
ANOVA Suma de cuadrados total

SST es la suma de las diferencias al cuadrado de cada


resultado individual respecto a la media de todos los
resultados y por tanto, representa la variacin total de los
datos.

SStotal x
x 2
2

EAAA
44
suma de los cuadrados de los tratamientos

Es la suma de los cuadrados de la diferencias entre cada media de


tratamiento y la media total

x
2
T 2
SCTr r

nr n

Cuando se divide SSTr por los correspondientes grados de libertad, (N - K), se


obtiene el cuadrado medio (o MS, del ingls Mean Square) entre los laboratorios",
MSR.

CUADRADO MEDIO DE LOS TRATAMIENTOS = MSR = SSTr / (k-1)

EAAA 45
SUMA DE LOS CUADRADOS DEL ERROR SSE

La otra furnte de variacion se conoce como el componente aleatorio o el


componente de error. Se determina por la suma de los cuadrados de las
diferencias, entre cada observacion y su media de tratamiento. En forma
simplificada su calculo esta dado:

SUMA DE LOS CUADRADOS DEL ERROR SSE = SSTotal SSTr

Cuando se divide SSE por los correspondientes grados de libertad, (N - K), se obtiene el
cuadrado medio "dentro de los laboratorios", MSE.MSE = SSE/(N K)

EAAA 46
PROCEDIMIENTO DE ANOVA
Paso 1: Plantear (H0) y la (H1)
H0 expresa que no hay diferencias significativas entre las
ventas medias de los tres vendedores; es decir,
Ho : 1 2 3 ......... a
Ha : A lg unas. ' s.son.diferentes

Paso 2: Seleccionar el nivel de significacin


Se usara el nivel 0.05 o 0.01valores de uso convencional

Paso 3: Proporcionar el estadstico de prueba


El estadstico de prueba es la distribucin F.

EAAA 47
Fuente Suma de Grados Cuadrado Fcal p
cuadrado de medio
s libertad
Entre 53.13 4 13.28 10.30 0.3
laboratori
o
Dentro 29.64 23 1.29
de los
laboratori
o
Total 82.77 27 Ftab = 2.80 (a = 0.05, 4, 23, 1 cola)
Como Fcal > Ftab, en este caso se podra concluir que al menos uno de los
.
laboratorios ha producido resultados la media de los cuales difiere de forma
estadsticamente significativa del resto de laboratorios. El valor de
probabilidad que aparece en la Tabla 3 indica aquel valor de alfa a partir del
cual el ANOVA no detectara ninguna diferencia significativa. As pues, a menor
valor de probabilidad, mayor seguridad de que existen diferencias
significativas.
EAAA 48
Ejemplo : Se quiere evaluar la eficacia de distintas dosis de un frmaco
contra la hipertensin arterial, comparndola con la de una dieta sin sal.
Para ello se seleccionan al azar 25 hipertensos y se distribuyen
aleatriamente en 5 grupos. Al primero de ellos no se le suministra ningn
tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero
una dieta sin sal, al cuarto el frmaco a una dosis determinada y al quinto
el mismo frmaco a otra dosis. Las presiones arteriales sistlicas de los 25
sujetos al finalizar los tratamientos son:

Grupo

1 2 3 4 5

180 172 163 158 147

173 158 170 146 152

175 167 158 160 143

182 160 162 171 155

181 175 170 155 160

EAAA 49
La tabla de anova es:

Fuente de variacin GL SS MS F
Tratamiento 4 2010.64 502.66 11.24
Error 20 894.40 44.72
Total 24 2905.04

Como
ComoF0,05(4,20) =2,87 y y11,24>2,87
F0,05(4,20) =2,87 11,24>2,87 rechazamos
rechazamos la hiptesis
la hiptesis nula ynula y
concluimos
concluimosqueque
loslos
resultados de los
resultados detratamientos son diferentes.
los tratamientos son diferentes.

EAAA 50
Un fabricante de papel para hacer bolsas para comestibles, se encuentra interesado en
mejorarla resistencia a la tensin del producto. El departamento de ingeniera del producto
piensa que la resistencia a la tensin es una funcin de la concentracin de madera dura en
la pulpa y que el rango de las concentraciones de madera dura de inters prctico est entre
5% y 20%. El equipo de ingenieros responsable del estudio decide investigar cuatro niveles
de concentracin de madera dura: 5%, 10%, 15% y 20%. Deciden hacer seis ejemplares de
prueba con cada nivel de concentracin, utilizando una planta piloto. Las 24 muestras se
prueban, en orden aleatorio, con una mquina de laboratorio para probar la resistencia. En la
tabla 12-1 se muestran los datos de este experimento.

Tabla 12-1 Resistencia a la tensin del papel (psi)


Concentracin Observaciones
de madera dura 1 2 3 4 5 6 Totales Promedios
(%)
5 7 8 15 11 9 10 60 10.00
10 12 17 13 18 19 15 94 15.67
15 14 18 19 17 16 18 102 17.00
20 19 25 22 23 18 20 127 21.17
383 15.96

EAAA 51
a ) Diagramas de caja de los datos de la concentracin de madera dura,

b) Grfica del modelo de la ecuacin 12-1 para el experimento completamente autorizado con
un solo factor.

EAAA 52
HIPOTESIS NULA
Puede usarse el anlisis de varianza para probar la hiptesis de que diferentes
concentraciones de madera dura no afectan la resistencia a la tensin media del papel.
Las hiptesis son;

Las formulas para calcular las sumas de cuadrados para el anlisis de varianza con
tamaos de las muestras n1 diferentes en cada tratamiento son:
Solucin a a
y2
SS T = yij2
N
i=j i=j

a
yi2 yi2
SS Tratamient os =
n1 N
i=j

SSE = SST SSTratamientos

EAAA 53
EAAA 54
Tabla 12-4 Anlisis de varianza para los datos de la resistencia a la tensin

Fuente de Suma de Grados de Cuadrado 1


variacin cuadrados libertad medio fo Valor P
Concentracin

de madera 382.79 3 127.60 19.60 3.59 E-6


dura
Error 130.17 20 6.51
Total 512.96 23

Puesto que el valor P = 3.59 x 10-6 es considerablemente ms pequeo que = 0.01,


se cuenta con evidencia slida para concluir que Ho no es verdadera.

EAAA 55
Un intervalo de confianza del 100(1 - a) por ciento para la media del tratamiento , p es:

La ecuacin se usa para calcular los intervalos de confianza

Las estimaciones de la media de la resistencia a la tensin para el experimento del


ejemplo son las siguientes:

El intervalo de confianza de 95% para la resistencia a la tensin media con 20% de


madera dura ser:

Por lo tanto, el intervalo de confianza deseado es

EAAA 56
Un intervalo de confianza del 100(1 - a) por ciento para la diferencia de las medias
de dos tratamientos i, - i, es:

Un intervalo de confianza de 95% para la diferencia de las medias 3, - 2, se calcula con


la ecuacin 12-13 como sigue:

Por tanto, el intervalo de confianza de 95% para (i3 - fi, es

-1.74 3, - 2 4.40

Puesto que el intervalo de confianza incluye al cero, se concluira que no


hay diferencia en la resistencia a la tensin media en estos dos niveles de
madera dura particulares.
EAAA 57
.

EAAA 58
Anlisis de residuales y verificacin del modelo

En el anlisis de varianza del modelo simple o de un solo factor, se supone que las
observaciones siguen una distribucin normal e independiente con la misma
varianza para cada tratamiento o nivel del factor.

Estos supuestos debern verificarse examinando los residuales.

Un residual es la diferencia entre una observacin Yij y su valor estimado (o


ajustado) en el modelo estadstico bajo estudio, denotado como yij. Para el diseo
completamente aleatorizado Yij Yij cada residual es eij = yij - y, es decir, la diferencia
entre una observacin y la media observada del tratamiento correspondiente

EAAA 59
En la tabla 12-6 se muestran los residuales para el experimento del porcentaje de madera dura. Al
utilizar yj. para calcular cada residual en esencia, se elimina el efecto de la concentracin de
madera dura de esos datos; por consiguiente, los residuales contienen informacin acerca de la
variabilidad no explicada.

Tabla 12-6 Residuales para el experimento de la resistencia a la tensin

Concentracin
de madera dura Residuales
5% -3.00 -2.00 5.00 1.00 -1.00 0.00
10% -3.67 1.33 -2.67 2.33 3.33 -0.67
15% -3.00 1.00 2.00 0.00 -1.00 1.00
20% -2.17 3.83 0.83 1.83 -3.17 -1.17

En la figura 12-2 se muestra la grfica de probabilidad normal de los residuales del


experimento de la resistencia a la tensin del papel. En las figuras 12-3 y 12-4 se
presentan los residuales graneados contra los niveles del factor y el valor ajustado y..,
respectivamente. Estas grficas no revelan ninguna falta de adecuacin del modelo ni
algn problema excepcional con los supuestos.
EAAA 60
EAAA 61
Diseo de experimentos.

1. Anlisis de varianza.

Suponga que un experimento industrial un ingeniero est interesado en cmo la absorcin


media de humedad en concreto vara entre cinco mezclas diferentes de concreto. Las muestras
se exponen a la humedad por 48 horas y se decide que se prueben seis muestras para cada
mezcla, por lo que se requiere probar un total de 30 muestras. Los datos de este experimento
se muestran en la siguiente tabla.

Tabla 1

Absorcin de humedad en mezclas de concreto.


Mezcla 1 2 3 4 5
551.00 595.00 639.00 417.00 563.00
457.00 580.00 615.00 449.00 631.00
450.00 508.00 511.00 517.00 522.00
731.00 583.00 573.00 438.00 613.00
499.00 633.00 648.00 415.00 656.00
632.00 517.00 677.00 555.00 679.00

EAAA 62
El modelo para esta estimacin se puede considerar como sigue. Hay 6
observaciones que se toman cada una de las cinco poblaciones con medias
m1, m2,..m5 respectivamente y deseamos probar

H0 : m1 = m2 = m3 = m4 = m5

H1 : al menos dos de las medias no son iguales.

Adems, nos podemos interesar en realizar comparaciones individuales entres


estas cinco medias poblacionales.

En el procedimiento de anlisis de varianza, se supone que cualquier variacin


que exista entre los promedios de las mezclas se atribuye a

EAAA 63
Formulas para el clculo de sumas de cuadrados.

A continuacin presentamos un conjunto de formulas mas simples para calcular la suma de cuadra

2
k
n
yij

SST yij2
k n
i 1 j 1

i 1 j 1 nk
2
k n
yij

SSA n yi
k
2 i 1 j 1

i 1 nk
SSE SST SSA

EAAA 64
ANALISIS DE VARIANZA DE DOS VAS o
DIRECCIONES (ANOVA 2 VIAS)

1. Introduccin En este caso las frmulas son parecidas a la del ANOVA de una
va pero ahora agregando el clculo por renglones adicional al de columnas
donde se incluye la variable de bloqueo.

Se trata de bloquear un factor externo que probablemente tenga efecto en la


respuesta pero que no hay inters en probar su influencia, slo se bloquea
para minimizar la variabilidad de este factor externo, evitando que contamine
la prueba de igualdad entre los tratamientos.

Los tratamientos se asignan a las columnas y los bloques a los renglones. Un


bloque indica condiciones similares de los sujetos al experimentar con
diferentes tratamientos.

EAAA 65
LAS HIPTESIS SON:

Ho: No hay diferencia en las medias del factor de columna

Ha: Al menos una media del factor de columna es diferente

Ho: No hay diferencia en las medias de la variable de rengln

Ha: Al menos una media de la variable de rengln es diferente

EAAA 66
La SSTotales y SSTr (columnas)se determina
de la misma forma que para la ANOVA de una
direccin o factor

En forma adicional se determina la suma de


cuadrados del factor de bloqueo (renlgones) )
de forma similar a la de los renglones

La SSE = SSTOTALES SSTr SSBi

EAAA 67
B x
2
2
SSBi
i

ni n
gl.SSBi b 1
MSB SSB /(b 1
EAAA 68
SSE SST SSTr SSBi
gl.MSE (n k )( n b)
MSE MSBi /( n k )( n b)

EAAA 69
MSTr
Fc
MSE

MSBi
Fc
MSE

EAAA 70
FUENTE DE VARIACIN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.) SSTr a-1 MSR SSTr/MSR

Entre Bloques (Factor Bl) SSBi b-1 MSB MSB/MSR

Dentro de muestras (error) SSE (a-1)(b-1) MSE

Variacin total SSTotal n-1 MST

Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa

EAAA 71
Tabla de Anlisis de varianza para dos criterios de
clasificacin

Fuente de Suma de Grados de Cuadrados F calculada


variacin Cuadrados libertad Medios
Tratamientos SCA t-1 CMA = SCA / t-1 CMA / CME
Bloques SCB b -1 CMB = SCB / b-1 CMB / CME

Error Experimental SCE (t - 1)(b-1) CME = SCE / (t-1)(b-1)


Total SCT t.b -1

( yij y..) 2 t ( yi . y..) 2 b ( y. j y..) 2 ( yij yi. y. j y.. ) 2


i j i j i j

Variacin total Variacin debida Variacin debida Variacin propia de


a los tratamientos a los bloques las observaciones

SCT SCA SCB SCE

EAAA 72
Si Fc (Tr o Bi) es mayor que F del nivel de
confianza se rechaza Ho Aceptando Ha donde
las medias son diferentes

O si el valor de p correspondiente a Fc (Tr o


Bi) es menor de Alfa se rechaza Ho

EAAA 73
Un qumico desea probar el efecto que tienen cuatro agentes qumicos sobre la
resistencia de un tipo particular de tela. Como puede existir variacin entre un rollo de
tela y otro, decide utilizar un diseo aleatorizado por bloques, considerando los rollos de
telas como bloques. El qumico dispone de cinco rollos y les aplica los cuatro agentes
qumicos a sendas porciones de cada rollo, en un orden aleatorio. A continuacin se
proporcionan los resultados de la resistencia a la tensin:

Rollos de Tela
Agente Qumico 1 2 3 4 5
1 64 68 67 67 67
2 73 67 75 72 70
3 75 78 68 73 68
4 73 71 75 75 69

a) Determine el modelo apropiado para el anlisis de este experimento y estime los


parmetros del modelo
b) Analice el experimento en la forma ms completa posible (5% de significacin)
c) Suponer que falta la observacin correspondiente al agente qumico 2 y al rollo de
tela 3. Analice este problema estimando el valor faltante.

EAAA 74
Las hiptesis son:

Ho: 1 = 2 = 3 = 4 vs la H1 : al menos un i j donde i j. Esto se prueba con: F =


CMA / CME

Ho: 1 = 2 = 3 = 4 = 5 vs la H1 : al menos un i j donde i j. Esto se prueba con: F


= CMB / CME
k

i
y 2
y2 (333) 2 (352) 2 (362) 2 (363) 2 (1410) 2
SC A i 1
= 116,20
ni n 5 20
k

j
y 2
y2 (285) 2 (284) 2 (280) 2 (287) 2 (274) 2 (1410) 2
SC B i 1
= 26,50
k n 5 20
donde n = ni
k
y2
ni
(1410) 2
SCT y (64) (68) ..... (69)
2
ij
2 2 2
251,00
i 1 j 1 n 20

SCE = SCT - SCA SCB = 251,00 116,20 26,50 = 108,30

EAAA 75
Grados Suma de Cuadrados
Fuente de Variacin de Cuadrados Medios Fobserv Ftabla
Libertad (SC) (CM)
Tipo de circuito (k - 1) 3 116,20 38,73 *3,93 3,59 F(0,05; 3, 11)
Bloques (b 1) 4 26,50 6,62 0,67 3,36 F(0,05; 4, 11)
Error (k - 1) (b 1)-1 11 108,30 9,84
Total (n - 1)-1 18 251,00

Como Fo > Ftabla, entonces, se rechaza Ho, existen diferencias significativas en las
resistencias de las telas, con un 95 % de confianza, los agentes qumicos tienen
influencia sobre las telas seleccionadas

EAAA 76
Suponiendo que se quiere investigar si la produccin de tres diferentes
mquinas es igual, tomando en cuenta la experiencia de los operadores a un
nivel de significancia del 5%.

Experiencia Mquinas
de ops. En
aos Maq 1 Maq 2 Maq 3 Promedios
1 27 21 25 24.33333
2 31 33 35 33

3 42 39 39 40
4 38 41 37 38.66667
5 45 46 45 45.33333
Promedios 36.6 36 36.2 36.26667

EAAA 77
TABLA ANOVA
Conclusin: No hay diferencia entre mquinas a pesar de la diferencia en experiencia
de los operadores.

SS GL CM Fc Falfa

SCTR= 0.933333 2 CMTR= 0.466667 Ftr = 0.09 4.46

SCBL= 764.9333 4 CMBL= 191.2333 Fbl = 37.25 3.84

SCE = 41.06667 8 CME= 5.133333

SCT = 806.9333 14 CMT= 57.6381

EAAA 78
Ejemplo: Para el ensamble de un artculo se considera comparar 4 mquinas
diferentes. Como la operacin de las mquinas requiere cierta destreza se
anticipa que habr una diferencia entre los operarios en cuanto a la velocidad
con la cual operen la maquinaria. Se decide que se requerirn 6 operarios
diferentes en un experimento de bloques aleatorizado para comparar las
mquinas.
Tiempo en segundos para el ensamble del producto

Operario
Mquina 1 2 3 4 5 6 Total Medias
1 42,5 39,3 39,6 39,9 42,9 43,6 247,8 41,3
2 39,8 40,1 40,5 42,3 42,5 43,1 248,3 41,4
3 40,2 40,5 41,3 43,4 44,9 45,1 255,4 42,6
4 42,3 43,2 44,5 45,2 46,9 43,3 265,4 44,2
Total 164,8 163,1 165,9 170,8 177,2 175,1 1016,9
Medias 41,2 40,775 41,475 42,7 44,3 43,775 254,225 42,4

EAAA 79
Si las mquinas no difieren en cuanto a la velocidad de
ensamblado de la pieza, tendran igual velocidad promedio y las
curvas se superpondran exactamente.

H0 : 1= 2 = 3= 4 H0 =
1=2=3=4=0


Pero si las mquinas difieren en cuanto a la velocidad de ensamblado
de la pieza, pensaramos que las muestras provienen de poblaciones
diferentes, e
H1: algn promedio es
distinto de los
restantes

EAAA 80
EAAA 81
EL MODELO (DE EFECTOS FIJOS)
Yij = + i + j + eij

Modelo lineal aditivo: cada respuesta es la suma de los otros trminos.

Donde Y es la variable respuesta o dependiente, tiempo medido en


segundos, e Yij es la observacin perteneciente al j-sima bloque bajo
el tratamiento i; las observaciones son independientes.
es la media general comn a todas las mquinas y a todos los
operarios.
i es el efecto del tratamiento en el nivel i, propio de cada mquina.
j es el efecto del bloque en el nivel j, propio de cada operario.
eij es la variable aleatoria del error con distribucin normal, con
media = 0 y varianza 2 N (0 ; 2 ) e independiente.

EAAA 82
Consideremos que se lleva a cabo un experimento para comparar el
tiempo que tardan tres marcas de ordenadores de diferente marca en
cargar un mismo sistema operativo. Se toma una muestra de cuatro
ordenadores de la marca A, es decir, se mide el tiempo (ensegundos) que
tardan en cargar el sistema operativo cuatro ordenadores de esta marca.
De la marca B se toman seis medidas y cinco de la marca C. La tabla
siguiente registra los resultados del experimento:

Marca A 10,7 11,2 12,0 15,5


Marca B 13,4 11,5 11,2 15,1 13,3 12,9
Marca C 11,5 12,7 15,4 16,1 15,2

EXISTE DIFERENCIA ENTRE LAS MARCAS

EAAA 83
Muestra j = 1 Muestra j = 2 Muestra j = 3
x 11 = 10,7 x12 = 13,4 x13 = 11,5
x 21 = 11,2 x22 = 11,5 x23 = 12,7
x31 = 12,0 x32 = 11,2 x33 = 15,4
x41 = 15,5 x42 = 15,1 x43 = 16,1
x52 = 13,3 x53 = 15,2
x62 = 12,9
Media = 12,35 = 12,90 = 14,18
Varianza = 4,70 = 2,02 = 3,90
x1 x2 x3
s1 2 s2 2 s3

EAAA 84
EAAA 85
Es posible representar esta situacin mediante los diagramas de caja de las tres
muestras:

EAAA 86
Un experimento en el que se prepararon nudos de soldadura con diferentes
composiciones qumicas. Se hicieron varias soldaduras utilizando cada flujo
sobre metal con base de acero AISI-1018. La tabla 9.1 presenta los resultados
de las mediciones de la dureza, en la escala de Brinell, de cinco soldaduras
que usan cada uno de los cuatro flujos.

TABLA 9.1 Dureza de Brinell de soldaduras que utilizan cuatro flujos


diferentes
Flujo Valores de la muestra Media muestral Desviacin estndar muestral

A 250 264 256 260 239 253.8 9.7570


B 263 254 267 265 267 263.2 5.4037
C 257 2/9 269 273 277 271.0 8.7178
D 253 258 262 264 273 262.0 7.4498

Se puede concluir que hay diferencias en las medias poblacionales entre los
cuatro tipos de flujos?
Determine un intervalo de confianza del 95% para la media de la dureza de
soldaduras producidas con el flujo A.

EAAA 87
EXPERIMENTOS DE DOS FACTORES

En los experimentos de un factor, analizados, el propsito es


determinar si al cambiar el nivel de un solo factor slo se afecta la
respuesta.

Muchos experimentos implican variar algunos factores, cada uno de


ellos puede afectar la respuesta.

Se analizar el caso en el que existen dos factores. Los


experimentos, naturalmente suficientes, son llamados
experimentos de dos factores

EAAA 88
Un ingeniero qumico est estudiando los efectos de varios reactivos y
catalizadores en la produccin de cierto proceso. Esta ltima se expresa como
un porcentaje de un mximo terico. Se hicieron cuatro operaciones del
proceso para cada combinacin de tres reactivos y cuatro catalizadores. Los
resultados se presentan en la tabla 9.2. En este experimento hay dos factores,
el catalizador y el reactivo. El primero se llama factor rengln, ya que su valor
vara de rengln a rengln en la tabla; el segundo se denomina factor columna.
Estas designaciones son arbitrarias, en la tabla se poda haber presentado tan
fcilmente como que los renglones representen los reactivos y las columnas,
los catalizadores

Producciones para varias operaciones de un proceso qumico con varias


combinaciones de reactivos y catalizadores
Catalizador 1 2 3

A 86.8 82.4 86.7 83.5 93.4 85.2 94.8 83.1 77.9 89.6 89.9 83.7
B 71.9 72.1 80.0 77.4 74.5 87.1 71.9 84.1 87.5 82.7 78.3 90.1
C 65.5 72.4 76.6 66.7 66.7 77.1 76.7 86.1 72.7 77.8 83.5 78.8
D 63.9 70.4 77.2 81.2 73.7 81.6 84.2 84.9 79.8 75.7 80.5 72.9

EAAA 89
TABLA Promedio de las producciones ij para operaciones de un proceso
qumico utilizando diferentes combinaciones de reactivos y catalizadores

Reactivo
Catalizador Media del rengln X,..
1 2 3
A 84.85 89.13 85.28 86.42
B 75.35 79.40 84.65 79.80
C 70.30 76.65 78.20 75.05
D 73.18 81.10 77.23 77.17
Media de la 75.92 81.57 81.34 Gran media muestral
columna X, X... =79.61

Cada nmero en el cuerpo de la tabla es el promedio de los cuatro nmeros en


la celda correspondiente de la tabla A stos se llaman las medias de las
celdas.

Utilizando un ANOVA de dos sentidos para probar hiptesis

Un anlisis de varianza de dos sentidos est diseado para


responder tres preguntas principales:
1. El modelo aditivo vale?
2. Si es as, la media del resultado es la misma para todos los
niveles del factor rengln?
3. Si es as, la media del resultado es la misma para todos los
niveles del factor columna?
EAAA 90
1Para probar si el modelo aditivo vale se prueba la hiptesis nula de que todas las
interacciones son iguales a 0:

Si esta hiptesis nula es verdadera, el modelo aditivo vale.

2Para probar si la media del resultado es igual para todos los niveles del factor rengln,
se prueba la hiptesis nula de que todos los efectos rengln son iguales a 0:

Si esta hiptesis nula es verdadera, entonces la media del resultado es igual para todos
los niveles del factor rengln.

3Para probar si la media del resultado es igual para todos los niveles del factor
columna, se prueba la hiptesis nula de que todos los efectos columna son iguales a 0:

Si esta hiptesis nula es verdadera, entonces la media del resultado es igual para todos
los niveles del factor columna

EAAA 91
Igual que con un ANOVA de un sentido, las pruebas usuales
para estas hiptesis nulas estn basadas en las sumas de los
cuadrados.

Especficamente, son la suma de los cuadrados de rengln


(SSA), de los cuadrados de columna (SSB), de los cuadrados
de interaccin (SSAB), y de los cuadrados del error (SSE).

Tambin es de inters la suma total de los cuadrados (SST),


que es igual a la suma de las otras.

La identidad del anlisis de varianza SST = SSA + SSB + SSAB + SSE

EAAA 92
El siguiente resultado de MI-NITAB presenta la tabla ANOVA para los datos de
la tabla 9.2.

Las etiquetas DF, SS, F y P se refieren a los grados de libertad, suma de


cuadrados, media cuadrtica, los estadsticos F, y P-valor, respectivamente.
Como en un ANOVA de un sentido, la media cuadrtica para el error (MSE) es
una estimacin de la varianza del error 2, la cantidad S representa la raz
cuadrada de MSE y es una estimacin de la desviacin estndar del error. Las
cantidades R-sq y R-sq(adj) se calculan con frmulas similares a las del
ANOVA de un sentido.
EAAA 93
1. (Ejemplo1) Supngase que el administrador de una planta
industrial conjetura que el rendimiento (en nmero de artculos
producidos por turno de 8 horas) de una lnea de produccin
depende de dos variables cualitativas: el supervisor de la lnea
(de los cuales hay dos, digamos A1 y A2) y el turno para el
cual se mide la produccin. Denotaremos los tres turnos, de
8:00 am a 4:00 pm, de 4:00 pm a 12:00 am y de 12:00 am a
8:00 am, por B1;B2 y B3:
El administrador desea establecer si existen diferencias entre
las producciones de los distintos turnos, con cada supervisor y
si existe interaccin entre los dos factores, para ello efectu r =
3 rplicas de un experimento factorial 23 para investigar el
efecto de supervisor.(con dos niveles) y .turno.(con tres
niveles). Las observaciones se dan en la tabla a continuacin.

EAAA 94

También podría gustarte