Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

NotasU3 DisExp EE CL Exp CG-Conmutativo

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 10

ESPECIALIZACIN EN ESTADSTICA

Diseos Experimentales

UNIDAD 3
DISEOS DE UN FACTOR CON RESTRICCIONES EN LA
ALEATORIZACIN

Mrida, Yucatn
2016

Especializacin en
Estadstica
Diseos Experimentales

Unidad 3. Diseos de un factor con restricciones


en la aleatorizacin
Objetivo. El alumno ser capaz de identificar las caractersticas y las situaciones
experimentales adecuadas para aplicar diseos con bloques, de restringir la
aleatorizacin de los tratamientos dentro de los bloques y realizar el anlisis
estadstico de diseos con restriccin en la aleatorizacin.

U3. Diseos de un factor con restricciones en la


aleatorizacin

Pgina 2

3.7. Cuadros latino y


grecolatino Diseo de
cuadrado latino
El diseo de cuadrado latino se usa para eliminar dos fuentes de variabilidad problemticas, en
otras palabras, permite analizar sistemticamente por bloques en dos direcciones. En este
diseo los renglones y columnas representan dos restricciones a la aleatorizacin.
Ejemplo [Comparacin de cuatro marcas de llantas, tomado de Gutirrez y De la Vara (2012)].
Una compaa de mensajera est interesada en determinar cul marca de llantas tiene mayor
duracin en trminos del desgaste. Para ello se planea un experimento en cuadro latino, en el
que se comparan las cuatro marcas de llantas sometindolas a una prueba de 32000 kilmetros
de recorrido, utilizando cuatro diferentes tipos de auto y las cuatro posiciones posibles de las
llantas en el auto. As, el factor de inters es el tipo de llanta o marca, y se controlan dos
factores de bloques: el tipo de automvil y la posicin de la llanta en el automvil. Estos
factores de bloques se controlan ya que, por experiencia, se sabe que tienen efecto en el
desgaste de la misma.
Las pruebas se hacen al mismo tiempo con choferes, a quienes se les instruye para que
manejen de manera similar, sobre el mismo terreno (circuito) para los cuatro automviles. Al
hacer las pruebas de los cuatro autos al mismo tiempo se evita el efecto del ambiente en el
desgaste; asimismo, el conductor y el tipo de terreno podran influir, pero se considera
suficiente mantenerlos lo ms homogneos posible durante el experimento. El diseo y los
datos observados se muestran en la siguiente tabla.
Posicin
1
2
3
4

1
C=12
B=14
A=17
D=13

Automvil
2
D=11
C=12
B=14
A=14

3
A=13
D=11
C=10
B=13

4
B=8
A=13
D=9
C=9

Se mide la diferencia mxima entre el grosor de la llanta nueva y el grosor de la llanta despus
de haber recorrido los 32000 kilmetros. Obviamente, a mayor diferencia en grosor mayor
desgaste. Las unidades de medicin son milsimas de pulgada.
Diseo experimental
El cuadrado latino es un arreglo cuadrado en donde los tratamientos se acostumbra denotarlos
con letras latinas (A, B, C, D, en el ejemplo); de all su nombre. Se observa en el ejemplo que
cada letra latina aparece una sola vez en cada rengln y columna. En general, un cuadrado
latino para p tratamientos, o un cuadrado latino pp, es un cuadrado que contiene p renglones
y p columnas. Cada una de las p2 celdas contiene una de las p letras que corresponden a un
tratamiento, y cada letra ocurre solamente una vez en cada combinacin rengln-columna.
Seleccin y aleatorizacin de un cuadro latino
Como en cualquier experimento, las observaciones en cuadrado latino deben recopilarse de
manera aleatoria. La configuracin del cuadrado latino del ejemplo de las marcas de llantas se
clasifica como no estndar. Para que un cuadrado latino sea estndar debe tener como primer

rengln y primera columna las letras escritas en orden alfabtico. El resto del cuadrado latino
estndar se obtiene escribiendo cada rengln como el rengln anterior, desplazado un lugar
hacia la izquierda. La tabla de abajo muestra algunas propiedades importantes de los cuadrados
latinos y los cuadrados estndar. Como puede observarse, el nmero de cuadrados latinos crece
mucho conforme el tamao de stos aumenta; esto implica que es prcticamente imposible
enumerar todos los cuadrados latinos y seleccionar uno al azar. El procedimiento usual es
seleccionar un cuadrado latino de una tabla de tales diseos, y despus arreglar al azar el
orden de los renglones, columnas y letras latinas.
Cuadro. Cuadrados latinos estndares y nmero de cuadrados latinos de varios tamaos.
Tam
Eje
Cua
Est

33
A B C
B C A
C A B

A
B
C
D

44
B C
C D
D A
A B

D
A
B
C

A
B
C
D
E

B
A
D
E
C

55
C
E
A
B
D

D
C
E
A
B

E
D
B
C
A

A
B
C
D
E
F

B
C
F
E
A
D

66
C D
F A
B E
A B
D F
E C

E
D
A
F
C
B

F
E
D
C
B
A

A
B
C
D
E
F
G

B
C
D
E
F
G
A

C
D
E
F
G
A
B

77
D
E
F
G
A
B
C

E
F
G
A
B
C
D

F
G
A
B
C
D
E

No.
Est

56

9408

16,942,080

N
cua

12

576

161,280

818,851,200

61479,419,904,000

G
A
B
C
D
E
F

pp
A B C p
B C D A
C D E B

A B p

p!(p-1)!
(no. de cuadros
estndares)

Nota: Poco se sabe acerca de las propiedades de cuadrados latinos mayores de 77

En resumen, el procedimiento recomendado en la prctica es:


i)
ii)
iii)

Se construye o selecciona el cuadro latino estndar ms sencillo.


Se aleatoriza el orden de los renglones (o columnas) y despus se aleatoriza el orden
de las columnas (o renglones).
Finalmente, los tratamientos a comparar se asignan en forma aleatoria a las letras
latinas.

Nota. Se puede correr el experimento por columna o por rengln segn convenga. Lo que no es
correcto es efectuar todas las pruebas de un tratamiento, luego todas las de otro, y as
sucesivamente, puesto que se puede introducir ruido adicional debido a factores no controlables
que cambian con el tiempo.
Ejemplo.
Se desea estudiar el efecto de cuatro dietas (pasto estrella y pasto taiwan en dos formas de
presentacin: fresco y ensilado) sobre el consumo por cerdas gestantes. Se consideran 4 cerdas
y 4 perodos experimentales. Al final de cada perodo experimental se midi en kilogramos la
cantidad total consumida por cerda correspondiente (diferencia entre la cantidad ofrecida y la
rechazada).
Una vez iniciada la prueba, cada perodo experimental consisti en un da de oferta y registro
del
consumo del forraje-presentacin respectivo, del cual se suministraba 3 kg/da/cerda, seguido
de dos das de oferta de alimento comercial. Pasado este tiempo se iniciaba otro
periodo

experimental, nuevamente oferta de otra dieta y as sucesivamente hasta completar los 4


tratamientos. Los resultados fueron:
Perodos

Animales
1
2.8 (A)
2.3 (B)
2.4 (C)
1.6 (D)

1
2
3
4

2
2.2 (B)
1.9 (A)
2.4 (D)
1.8 (C)

3
2.3 (C)
1.8 (D)
2.7 (A)
2.3 (B)

4
2.5 (D)
2.5 (C)
2.2 (B)
2.1 (A)

Tratamientos: A: pasto estrella ensilado, B: pasto taiwan fresco, C: pasto taiwan ensilado y D: pasto
estrella fresco.

a)
b)

Hay diferencias entre los tipos de dietas?


Alguna dieta en particular es recomendable?
Modelo estadstico

i 1, 2,..., p

y ijk i j k ijk

j 1, 2,..., p

k 1, 2,..., p

yijk es la observacin correspondiente al i-simo rengln, la k-sima columna y el j-simo


tratamiento.
es la media global.
i es el efecto de rengln i-simo.
j es el efecto del tratamiento j-simo.
k es el efecto de la columna k-sima.
ijk es el error aleatorio.
Notas.
1. El modelo es completamente aditivo, es decir, no existe interaccin entre los renglones, las
columnas y los tratamientos.
2. Realmente slo dos de los tres subndices i, j, k se requieren para especificar una
observacin en particular porque hay nicamente una observacin por celda. Esto es
consecuencia de que cada tratamiento aparece exactamente una vez en cada rengln y en
cada columna.
Supuestos
ijk ~ NI(0, 2)
Estimadores
Restricciones para determinar los estimadores de mnimos cuadrados:
p


i1

j1

k1

0 , obtenindose:

Y
i Y i Y

j Y j Y
k Y k Y
ijk Yijk Y ijk Yijk Y i Y j Y k 2Y
Hiptesis
H0: 1 = 2 =...= p vs. H1: i j para al menos un par (i, j) donde ij
Equivalentemente:
H1 : j 0
para al menos una j.
H0 : j 0 para toda j vs.

ANOVA
El anlisis de varianza consiste en descomponer la suma de cuadrados total de las N=p2
observaciones en sus componentes de rengln, columna, tratamiento y error:
(*)
SCT SCrenglones SCcolumnas SCtrat

SCE

Con gl:
2

p 1 (p 1) (p 1) (p 1) (p 2)(p
1)
Bajo el supuesto ijk ~ NI(0, 2), cada una de las SC del lado derecho de la ecuacin (*) son (al
dividirlas entre 2) variables aleatorias independientes con distribucin ji-cuadrada. El estadstico
de prueba bajo H0 verdadera es:
CM trat ~ F(p1), (p2)(p1)
F
CM E
Regin de rechazo: F0 F; (p1), (p2)

(F0 denota el valor de la estadstica de prueba)

(p1)

Cuadro. Anlisis de varianza para un diseo en cuadrado latino


Fuente de
Cuadrado
Grados de
Suma de cuadrados
Medio
libertad
variacin
p1
2
p
2
SC trat
Tratamientos
SC y y

F0

CMtrat

trat

j 1

y 2
p N

p1

2
p
y2
SCcolumnas y k
N
k1 p

p1

Error

SCE (por diferencia)

(p2)(p1)

Total

2
SC y y

Renglones

SCrenglones

i1

Columnas

y2

p1
SC

i 1 j1k 1 ijk

p21

renglones

p1
SC

columnas

p1
SCE

(p 2)(p 1)

CME

Notas.
1. Es posible probar que no existen efectos de rengln o de columna si se toma la razn de
CMrenglones o CMcolumnas contra CME.

2. La SCE se ha reducido respecto a la del diseo de bloques completos al azar en una


cantidad igual a SC renglones o SC columnas, con un costo de (p 1) gl. El CME como
estimacin de 2 tiene muy pocos gl con un nmero pequeo de tratamientos. Adems, se
pierde poder en las pruebas de hiptesis para comparaciones entre tratamientos a menos
que la reduccin en la SCE, debida al uso de bloques segn los criterios de rengln y columna
sea sustancial.
3. En un cuadrado latino 3x3 la calidad no sera confiable, ya que los gl del error (2) es
pequeo.
4. Los cuadrados latinos ms comunes van de 5x5 a 8x8; cuadrados mayores de 12x12 se usan
muy rara vez.
5. La principal desventaja es que el nmero de filas, columnas y tratamientos debe ser el
mismo.
Error estndar de una media de tratamiento y de la diferencia de medias de tratamiento.

Sy

S yi y j

CME
p
2CME
p

Revisin del cumplimiento de las suposiciones del modelo.


Como en cualquier otro problema de diseo, el experimentador debe investigar la adecuacin
del modelo al inspeccionar y graficar los residuos. En un cuadrado latino, los residuos son:

eijk y ijk y ijk y ijk y i y j y k 2y


Se recomienda capturar los datos y combinaciones de pruebas en el orden en el que se hayan
realizado, ya que con ello se podr comprobar el supuesto de independencia de los residuos.
Repeticin de cuadrados latinos
A veces es recomendable la repeticin de cuadrados latinos en un experimento, especialmente
cuando la dimensin p es pequea, porque un nico cuadrado latino proporciona pocos grados
de libertad para el error. Por ejemplo, un cuadrado latino 33 slo proporciona dos grados de
libertad del error; uno de 44 slo seis grados de libertad, etc. Cuando se tiene un cuadrado
latino pequeo, con frecuencia stos se replican con el fin de aumentar los gl del error.
Suponga que un cuadrado latino p x p se repite n veces. Existen tres formas posibles:
1. Las unidades experimentales se repiten n veces, usando los mismos bloques rengln y
columna.
2. Usando los mismos bloques rengln pero diferentes bloques columna en cada repeticin, o
de manera equivalente, los mismos bloques columna pero diferentes bloques rengln.
3. Usando diferentes unidades experimentales asociadas a diferentes bloques rengln y
diferentes bloques columna (es decir, se construyen n cuadrados latinos).

El ANOVA para cuadrados latinos repetidos depende del mtodo utilizado para hacer las
rplicas, en Montgomery (2004) se presentan las tablas de anlisis de varianza para cada uno
de los tres casos.
Una vez estudiado la teora bsica sobre el diseo de cuadrado latino se resolver el ejemplo
planteado al inicio de la seccin
Ejemplo [Comparacin de cuatro marcas de llantas, tomado de Gutirrez y De la Vara (2012)].
Una compaa de mensajera est interesada en determinar cul marca de llantas tiene mayor
duracin en trminos del desgaste. Para ello se planea un experimento en cuadro latino, en el
que se comparan las cuatro marcas de llantas sometindolas a una prueba de 32000 kilmetros
de recorrido, utilizando cuatro diferentes tipos de auto y las cuatro posiciones posibles de las
llantas en el auto. As, el factor de inters es el tipo de llanta o marca, y se controlan dos
factores de bloques: el tipo de automvil y la posicin de la llanta en el automvil. Estos
factores de bloques se controlan ya que, por experiencia, se sabe que tienen efecto en el
desgaste de la misma.
Las pruebas se hacen al mismo tiempo con choferes, a quienes se les instruye para que
manejen de manera similar, sobre el mismo terreno (circuito) para los cuatro automviles. Al
hacer las pruebas de los cuatro autos al mismo tiempo se evita el efecto del ambiente en el
desgaste; asimismo, el conductor y el tipo de terreno podran influir, pero se considera
suficiente mantenerlos lo ms homogneos posible durante el experimento. El diseo y los
datos observados se muestran en la siguiente tabla.
Posicin
1
2
3
4

1
C=12
B=14
A=17
D=13

Automvil
2
D=11
C=12
B=14
A=14

3
A=13
D=11
C=10
B=13

4
B=8
A=13
D=9
C=9

Se mide la diferencia mxima entre el grosor de la llanta nueva y el grosor de la llanta despus
de haber recorrido los 32000 kilmetros. Obviamente, a mayor diferencia en grosor mayor
desgaste. Las unidades de medicin son milsimas de pulgada.
TALLER
a) Resolver el ejemplo con la ayuda de un software estadstico. Utilice un nivel de
significancia de 5%.
b) Interprete en el contexto del problema.
Diseo de cuadrado grecolatino
EXPOSICIN
3.8. Diseos conmutativos
EXPOSICIN

Bibliografa
Bibliografa citada
Cochran, W.G. y Cox, G.M. (1974). Diseos Experimentales. Trillas, Mxico, D.F.
Conover, W.J. (1999). Practical nonparametric statistics. 3a Ed. John Wiley and Sons. New York,
USA.
Gutirrez-Pulido, H. y de la Vara-Salazar, R. (2012). Anlisis y Diseo de Experimentos. 3 Ed.
McGraw Hill, Mxico, D.F.
Hollander, M., Wolfe, D.A. (1999). Nonparametric statistical methods. 2a Ed. John Wiley and Sons.
New York, USA.
Marques, C.M.J. (1988). Probabilidad y estadstica para ciencias qumico-biolgicas. Universidad
Autnoma de Mxico. Mxico, D.F.
Montgomery, D.C. (2004). Diseo y anlisis de experimentos. 2 Ed. Limusa Wiley, Mxico, D.F.
Siegel, S., Castellan N.J. (2001). Estadstica no paramtrica: aplicada a las ciencias de la
conducta. 4 Ed. Editorial Trillas. Mxico, D.F.
Wackerly, D.D., Mendenhall, W., Scheaffer, R.L. (2010). Estadstica Matemtica con
Aplicaciones. 7 Ed. CENGAGE Learning. Mxico, D.F.
Zar, J.H. (1999). Biostatistical Analysis. 4 Ed. Prentice Hall. New Jersey, USA.
Zar, J.H. (2010). Biostatistical Analysis. 5a Ed. Prentice-Hall. New Jersey, USA.
Bibliografa consultada
Daniel, W.W. (2006). Bioestadstica: Base para el Anlisis de las Ciencias de la Salud. 4a Ed.
Limusa Wiley. Mxico, D.F.
Daniel, W.W. (1990). Applied Nonparametrics Statistics. 2a Ed. Duxbury Thomson Learning.
Pacific Grove, CA, USA.
Dickinson, G.J., Chakraborti, S. (1992). Nonparametric statistical inference. 3a Ed. Marcel Dekker.
New York, USA.
Kuehl, R.O. (2001). Diseo de Experimentos. 2 Ed. Thomson Editores. Mxico, D.F.
Infante, G.S. y Zrate, L.G. (2005). Mtodos Estadsticos. 2 Ed. Editorial Trillas. Mxico, D.F.
Scheaffer, R.L., McClave, J.T. (1993). Probabilidad y estadstica para ingeniera. Grupo Editorial
Iberoamrica. Mxico, D.F.

También podría gustarte