DBCA
DBCA
DBCA
Capítulo IV
Diseño de Bloques Completos al Azar
Algunos usan las estadísticas como el ebrio usa los faroles: para apoyo más que para
iluminación.
- Andrew Lang
1. Introducción
El Diseño Completamente al Azar (DCA) es aplicable en casos en los que la única fuente de
variabilidad son los tratamientos. En casos en los que se pueda identificar de antemano otras
fuentes de variación, que no constituyen el objetivo de la investigación, estas deberán ser
controladas por el experimentador. Esto puede ocurrir por ejemplo en experimentos en el
terreno, en donde se sabe que parcelas adyacentes suelen presentar resultados más
homogéneos entre sí que parcelas más separadas, o en experimentos en donde los datos se
toman por días, y en donde se sabe que los resultados pueden diferir entre los distintos días.
Estas fuentes de variación son controladas mediante la formación de bloques; la idea es
agrupar a las observaciones en los distintos bloques de modo que sean lo más homogéneas
dentro del bloque y heterogéneas entre bloques.
Al diseño que controla una fuente de variación adicional a los tratamientos se le conoce como
el Diseño de Bloques. En este capítulo se verá el Diseño de Bloques Completos al Azar
(DBCA), en el caso paramétrico y no paramétrico, y sus respectivas pruebas de comparación
de medias. Los bloques son completos porque todos los tratamientos aparecen en igual
número, usualmente una vez, dentro de cada bloque, y son al azar por que los tratamientos son
asignados aleatoriamente dentro de cada bloque. A este diseño se le conoce también como
diseño de clasificación de dos vías sin interacción (Two Way).
Los diseños de bloques pueden también ser incompletos balanceados. En este caso, los
bloques son incompletos porque no todos los tratamientos aparecen dentro de cada bloque, y
balanceados porque el número de tratamientos dentro de cada bloque es el mismo y cada
tratamiento se repite el mismo número de veces dentro del experimento.
Ventajas:
- El agrupamiento de las unidades experimentales en bloques, debido a la existencia real de
esta fuente de variabilidad, aumenta la precisión del experimento con relación al DCA.
- No existen restricciones en cuanto al número de tratamientos o bloques.
- El análisis estadístico es simple.
- Si se pierden los datos de un bloque completo, estos pueden omitirse sin mayores
complicaciones para el análisis. Si faltan datos de unidades experimentales, estos pueden
estimarse.
Desventajas:
- Cuando la variabilidad entre las unidades experimentales dentro de los bloques es grande,
resulta un error experimental considerable. Esto ocurre usualmente cuando el número de
tratamientos es muy grande.
- Si existe interacción entre los bloques y los tratamientos, ésta va incluida en el error
experimental.
- Si no existe una real diferencia entre los bloques, habrá una pérdida de precisión en el
experimento con relación al DCA, debido a la disminución de los grados de libertad del
error.
En este diseño los tratamientos son asignados en forma aleatoria dentro de cada bloque. Por
ejemplo, suponga que va a evaluar 4 tratamientos con 3 repeticiones cada uno, en donde cada
repetición constituye un bloque; en este caso necesitará de 12 unidades experimentales. Para
asignar los tratamientos en forma aleatoria dentro de un bloque, genere 4 números al azar y
luego ordénelos del 1 al 4. A continuación se presenta un resultado obtenido utilizando la
función ALEATORIO() de Excel:
Bloque 1 T3 T4 T1 T2
Bloque 2 T4 T3 T1 T2
Bloque 3 T4 T2 T3 T1
Ejemplo 1: Tres diferentes soluciones están siendo estudiadas para evaluar su efectividad
en el retardo del crecimiento de bacterias en contenedores de leche de 5 galones. Los
análisis son hechos en un laboratorio y solo tres ensayos pueden efectuarse en un día dado.
Debido a que los días pueden ser una fuente de variabilidad, el investigador decide utilizar
un diseño de bloques completos al azar. Las observaciones fueron tomadas en cuatro días y
los datos (en UFC) se muestran en la siguiente tabla.
Días
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
donde:
- Yij es el número de UFC observado con la i-ésima solución, j-ésimo día (bloque).
- es el efecto de la media general.
- i es el efecto de la i-ésima solución.
- j es el efecto del j-ésimo día (bloque).
- ij es el efecto del error experimental con la i-ésima solución, j-ésimo día (bloque).
- t = 3 (Número de tratamientos)
- b = 4 (Número de días o bloques).
Los efectos del modelo, , i y j, son estimados de modo que se minimice la siguiente
expresión (Método de Mínimos Cuadrados):
t ri t ri
Q (Y ij 2
ij i )2
j
i1 j i i1 j i
i 0
i1
j 1
j 0
Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:
ˆ 18.75
Los efectos estimados de los tratamientos:
ˆ1 Y1 Y 23 18.75 4.25
ˆ2 Y2 Y 25.25 18.75 6.5
Cuadro ANVA
Total tb – 1 SC(Total)
Hipótesis:
Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los
tratamientos las siguientes:
H0: i = 0 i
H1: i 0 para al menos algún i
En términos de las medias de los tratamientos:
H0: i = i
H1: i para al menos algún i
Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la
variancia de los tratamientos:
H0: 2 = 0
H1: 2 > 0
En cualquiera de los casos, la hipótesis nula implica que los tratamientos no afectan a la
variable respuesta o lo que es lo mismo, que con todos los tratamientos se obtienen los
mismos resultados.
Bloques b–1
2j
2 t
b
2 t 2
j1 b 1
Total tb – 1
Estadístico de Prueba:
Fc CM(Trat) F
CM(Error) gl(Trat ),gl(Error)
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación si el Fc resulta mayor que el valor
de tabla F1 , gl(Trat),gl(Error) .
i1 j 1
2 2 2 2252
(13 ... 22 )
22 1862.25 (3)(4)
t
Y2
SC(Tratamientos) i TC
i1 b
922 1012 322 2252
703.5
4 4 4 (3)(4)
b
Y2j
SC(Bloques) TC
j 1 t
45
40
35
30
25
UFC
20
15
10
5
0
1 2 3
Solución
Asumiendo un modelo de efectos fijos, las hipótesis en términos de los efectos de los
tratamientos son:
H0: i = 0 i = 1, 2, 3
H1: i 0 para al menos algún i
En términos de las medias de los tratamientos:
H0: i = i = 1, 2, 3
H1: i para al menos algún i
o literalmente:
H0: Las tres soluciones son igualmente efectivas en el retardo del crecimiento de bacterias
en contenedores de leche.
H1: Al menos una de las soluciones tienen una efectividad diferente en el retardo del
crecimiento de bacterias en contenedores de leche.
El estadístico de prueba es Fc = 40.72. El valor de tabla para un nivel de significación del
5% es F0.95, 2,6 5.14. Dado que el estadístico de prueba resulta mayor que el valor de
tabla se rechaza H0. En conclusión, existe suficiente evidencia estadística para aceptar que
las tres soluciones no son igualmente efectivas en el retardo del crecimiento de bacterias en
contenedores de leche.
El coeficiente de variación para este experimento es:
8.64
cv CME = 15.68%
Y 18.75
2CME
1. Prueba t y DLS sd b
t
c2
2. Contrastes Ortogonales s Lˆ CME
i1 b
i
3. Tukey CME
sd
b
4. Dunnett 2CME
sd
b
Ejemplo 1 (Cont.): Utilice la prueba t para evaluar si la solución 1 es más eficiente que la
solución 2 (Note que con la solución más eficiente se tendrá menos bacterias)
H0: 2 - 1 = 0
H1: 2 - 1 > 0
2(8.64)
4
DLS = t(0.975, 6) 2CME = 2.447 = 5.09
b
Y
Y1 3 23 8 15
Ejemplo 1 (Cont.): Utilice un contraste que permita comparar las soluciones 1 y 2 con la
3.
El contraste a evaluar en este caso es L = 1 + 2 - 23, y las hipótesis son:
H0: L = 0
H1: L 0
El cálculo del estadístico de prueba es el siguiente:
Lˆ Y1 Y2 2Y3 32.25
En este caso, solo la solución 3 presenta resultados significativamente diferentes a los del
testigo.
4. Prueba de Friedman
4.1. Datos
Los datos consisten de k muestras relacionadas (correspondientes a los k tratamientos), cada
una de tamaño b (número de bloques).
Asigne el rango 1 a la observación más pequeña, 2 a la segunda y así sucesivamente hasta la
más grande de las k observaciones dentro de cada bloque. En caso de empates utilice la media
de los rangos correspondientes. Sea R(Xij) el rango asignado a la observación Xij dentro del
bloque j y sea Ri la suma de los rangos asignados a la muestra i:
b
Ri R( X ij )
j 1
4.2. Supuestos
Hipótesis:
H0: Los tratamientos tienen los mismos efectos.
H1: Al menos uno de los tratamientos tiene un efecto diferente.
Estadístico de Prueba:
Primero calcule los valores A y B:
A R(
i1 j
)
Bb
1 k Ri2
i1
1 Xij
2
bk (k 1)(2k 1)
A 6
El estadístico de prueba es:
k 1 bB b2k k 12
4
T
bk k 12
A
4
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación si T resulta mayor que el valor de
tabla (1
2
,k 1).
Ejemplo 2: Se desea comparar la calidad de 4 marcas de vino. Para ello, se le pide a 8
jueces que prueben (en orden aleatorio) cada una de las 4 muestras y las califiquen en una
escala del 0 al 10. Los resultados se presentan a continuación:
Juez
Vino 1 2 3 4 5 6 7 8
A 9 7 8 6 5 8 6 4
B 8 5 8 2 4 4 3 2
C 9 6 7 6 4 7 5 3
D 5 5 3 5 4 5 6 4
7
Calificativo
A B C D
Vino
Juez
Vino 1 2 3 4 5 6 7 8 Ri
A 3.5 4 3.5 3.5 4 4 3.5 3.5 29.5
B 2 1.5 3.5 1 2 1 1 1 13
C 3.5 3 2 3.5 2 3 2 2 21
D 1 1.5 1 2 2 2 3.5 3.5 16.5
4
(4 1) (8)(219.0625)
T 4 13.07
bk k = (8)(4)(4 1)2
12
A 235
4 4
El valor de tabla para un nivel de significación del 5% es
(0.95,3)
2
= 7.815. Como el
estadístico de prueba resulta mayor que el valor de tabla se rechaza H 0 y se concluye que
existe suficiente evidencia estadística para aceptar que al menos uno de los vinos es de
diferente calidad.
2b( A B)
Ri Rj t
1 / 2,(b1)(k 1) (b 1)(k 1)
2(8)(235 219.0625)
t1 / 2,(b1)(k 2b( A B)
= 2.08 21 7.25
1) (b 1)(k 1)
Tratamientos Ri Rj Significancia
comparados
AyB 16.5 *
AyC 8.5 *
AyD 13 *
ByC 8 *
ByD 3.5 n.s.
CyD 4.5 n.s.
Tratamiento: B D C A
Ri: 13 16.5 21 29.5
Anexo: Salida de Minitab
Ejemplo 1
Two-way Analysis of Variance
Analysis of Variance for UFC
Source DF SS MS F P
Trat 2 703.50 351.75 40.72 0.000
Bloq 3 1106.92 368.97 42.71 0.000
Error 6 51.83 8.64
Total 11 1862.25
Ejemplo 2
Friedman Test
Friedman test for Resp by Vino blocked by Juez
S = 11.44 DF = 3 P = 0.010
S = 13.07 DF = 3 P = 0.004 (adjusted for ties)
Est Sum of
Vino N Median Ranks
1 8 6.625 29.5
2 8 4.625 13.0
3 8 5.750 21.0
4 8 5.000 16.5
Preparación
Proceso I II III IV V
A 85 81 82 85 82
B 85 79 86 89 81
C 97 92 89 91 86
D 93 85 87 88 87
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos
del enunciado.
b) Efectúe el análisis de variancia.
c) Se justifica el uso de los bloques. Explique brevemente.
d) Realice las comparaciones por pares en caso sea necesario. Concluya mediante el
diagrama de líneas.
e) Antes de realizar el experimento se tenía principal interés en comparar los procesos C y D.
Realice la prueba correspondiente.
f) Los procesos A y B son dos variantes de una metodología, llamémosla metodología 1, y
los procesos C y D son variantes de otra, llamémosla metodología 2. Se cree que la
metodología 2 es mejor que la metodología 1. ¿Aportan los resultados de este experimento
suficiente evidencia para aceptar que la metodología 2 es mejor que la 1?
Alimento Laboratorio
Dietético 1 2 3
A 13 15 12
B 17 18 14
C 15 18 13
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos
del enunciado.
b) Efectúe el análisis de variancia.
c) Mediante la prueba DLS compare el contenido medio de colesterol de los alimentos A y
B.
d) Realice la prueba de Tukey. Resuma sus resultados mediante el diagrama de líneas.
3. En un experimento de riegos en el cultivo de algodón se tuvieron los siguientes
tratamientos que están expresados en metros cúbicos de agua absorbidos por hectárea:
T1=5400, T2=4800, T3=4200 y T4=3600. El experimento se condujo en parcelas de 300
m2 de área útil y los resultados están expresados en kilogramos. A continuación se dan los
rendimientos:
Tratamientos
Bloques T1 T2 T3 T4
I 68 73 53 50
II 86 90 62 62
III 68 71 46 50
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos
del enunciado.
b) Efectúe el análisis de variancia.
c) Realice la prueba de Tukey.
d) Efectúe la prueba DLS para comparar los tratamientos T3 y T4.
e) ¿Se puede afirmar que con T2 el rendimiento por parcela supera en más de 80 kilogramos
al que se obtiene con T4?
Tratamiento
Bloque Testigo A B C
1 92 98 96 91
2 90 94 90 93
3 88 93 91 97
4 86 91 89 95
a) Presente el modelo aditivo lineal e interprete cada uno de sus componentes en términos
del enunciado.
b) Efectúe el análisis de variancia.
c) Realice la prueba de Dunnett.
Bloque
Crema 1 2 3 4 5 6 7
1 3 3 4 4 3 4 5
2 4 4 6 5 5 6 6
3 5 4 6 5 5 7 7
4 4 5 4 6 4 6 7
6. A seis soldadores, con diferente nivel de experiencia, se les pidió que unieran dos tubos
metálicos utilizando 5 diferentes tipos de llama. Las llamas fueron utilizadas en orden
aleatorio por cada soldador. Las soldaduras ya terminadas fueron evaluadas sobre una
variedad de factores cualitativos y calificadas del 1 al 10, donde 10 representa un trabajo
perfecto. Los resultados fueron los siguientes:
Tipo de llama
Soldador 1 2 3 4 5
1 3.9 4.1 4.2 4.1 3.3
2 9.4 9.5 9.4 9.0 8.6
3 9.7 9.3 9.3 9.2 8.4
4 8.3 8.0 7.9 8.6 7.4
5 9.8 8.9 9.0 9.0 8.3
6 9.9 10.0 9.7 9.6 9.1