Métodos Estadísticos
Métodos Estadísticos
Métodos Estadísticos
Estadísticos
M.C. Nancy Toriz Robles
Criterio Porcentaje
Evaluación Frecuente
10 %
(participación en clase).
Trabajos Extraclase 30 %
Exámenes 60 %
Notas:
1. No hay global.
2. Asistencia obligatoria al 86% de las clases.
Unidad I
Planeación de los
Diseños Experimentales
Unidad I. Planeación de los
Diseños Experimentales
Objetivo:
Complejo.
Se adquiere a través del
Conocimiento método científico.
científico Busca responder interrogantes,
interpretar la realidad y de ser
posible modificarla.
Principios de la
Experimentación Científica
• Método Científico.
Método Científico
• ¿Dónde se aplica?
Planeación y
Análisis Interpretación Conclusiones
realización
Es la etapa más
importante
Planeación de los Diseños
Experimentales
Ronald A. Fisher
• De 1919 a 1933, Fisher fue contratado en Rothamsted Experimental
Station, Inglaterra; para aplicar análisis estadístico a los datos de
investigaciones agrícolas. Estudió y analizó experimentos relativos al
trigo.
• Desarrolló y consolidó los principios básicos de diseño y análisis que
hasta la fecha son utilizados.
• Desarrolló el análisis de varianza y unificó sus ideas sobre los
principios del diseño de experimentos.
Planeación de los Diseños
Experimentales
• En 1926 publicó el artículo “The Arrangement of Field Experiments”; donde
describió tres componentes fundamentales:
• Control local: condiciones de campo para reducir el error experimental.
• Replicación: como un medio para estimar la varianza del error
experimental.
• Aleatorización: para obtener una estimación válida de esa varianza.
2. Elegir la(s) variable(s) de respuesta que será medida en cada punto del
diseño y verificar que se mide de manera confiable.
6. Realizar el experimento.
Análisis
• Una estrategia de bloqueo sería que un mismo operador realizara todas las
pruebas del experimento.
• Cada operador es un bloque porque se espera que las mediciones del mismo operador
sean más parecidas entre sí que las mediciones de varios operadores.
Población y Muestra
Un estadístico se define
Son las afirmaciones válidas
como cualquier función de
acerca de la población o
los datos muestrales que no
proceso basadas en la
contiene parámetros
información contenida en la
desconocidos
muestra.
Diseño de
Experimentos 1. Planear un cambio o
y el ciclo de una prueba con el
objetivo de encontrar
causas y lograr una
Deming mejora.
• Fue inicialmente escrito por Robert Gentleman y Ross Ihaka del Departamento
de Estadística de la Universidad de Auckland en Nueva Zelanda.
• Acceder a https://cloud.r-project.org/
• Seleccionar el sistema operativo
RStudio
Script Environment
History
Ventana Sesión
Muestra los resultados de sus análisis en formato de texto.
Hoja de trabajo
Es donde se ingresan y organizan los datos.
Unidad II
Diseños
Experimentales
Unidad II. Diseños
Experimentales
Objetivo:
• La idea general de esta técnica es separar la variación total en las partes con
las que contribuye cada fuente de variación en el experimento.
• Los análisis ANOVA requieren datos que cumplan los siguientes supuestos:
• La poblaciones sigue una distribución aproximadamente normal.
• Con varianzas iguales entre los niveles de factores.
• Independencia entre las muestas.
• Donde:
• 𝜇 es la media global
• 𝜏𝑖 es un parámetro que mide el efecto del tratamiento 𝑖.
• 𝜀𝑖𝑗 es el error atribuible a la observación 𝑌𝑖𝑗
Diseño Completamente al Azar
(DCA)
• El objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad
de los tratamientos con respecto a la media de la correspondiente variable de
respuesta:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇 ∶ 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 = 0
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇 ∶ 𝜏𝑖 para al menos un tratamiento 𝑖
• ഥ ∗∗ Media global
𝒀
• El punto indica la suma sobre el correspondiente subíndice. Por ejemplo:
𝑛 𝑛
𝑖
𝑌𝑖∗ = σ𝑗=1 𝑌𝑖𝑗 𝑌∗∗ = σ𝑘𝑖=1 σ𝑗=1
𝑖
𝑌𝑖𝑗
Diseño Completamente al Azar
(DCA)
• Para probar la hipótesis nula, mediante ANOVA, lo primero es
descomponer la variabilidad total de los datos en sus dos componentes.
Elaborar bitácora de
ejemplos y ejercicios
Ejemplo 2.1
Método de Ensamble
𝑨 𝑩 𝑪 𝑫
6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9
Suma de las observaciones del
29 34 51 42
tratamiento 𝒊 𝒀𝒊∗
1. Calcular
2. Calcular
8 9 16 12 3.06 0.56 39.06 5.06
ഥ 𝒊∗
𝒀 7.25 8.50 12.75 10.50
𝒀∗∗ 156
ഥ ∗∗
𝒀 9.75
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = 𝑌𝑖𝑗 − 𝑌ത∗∗ = 27.75 + 11.25 + 52.75 + 7.25 = 99.00
𝑗=1
𝑖=1
• Para 𝑆𝐶𝑇𝑟𝑎 = σ𝑘𝑖=1 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2
3. Calcular
𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2
ഥ 𝒊∗
𝒀 7.25 8.50 12.75 10.50 Suma 25.00 6.25 36.00 2.25
𝒀∗∗ 156
ഥ ∗∗
𝒀 9.75
𝑘
2. Calcular
3.10 0.41 2.28 5.71
6.98 5.44 7.33 2.91
1.17 0.21 2.04 8.94
7.80 5.80 7.04 3.66
3.61 0.01 1.30 5.02
𝒀𝒊∗
𝒊∗ 22.44 16.50 21.78 10.08 Suma 7.87 0.63 5.62 19.67
ഥ 𝒊∗
𝒀 7.48 5.50 7.26 3.36
𝒊∗
𝒀∗∗
∗∗ 70.8
𝒀
ഥ ∗∗
∗∗ 5.9
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = 𝑌𝑖𝑗 − 𝑌ത∗∗ = 7.87 + 0.63 + 5.62 + 19.67 = 33.80
𝑗=1
𝑖=1
• Para 𝑆𝐶𝑇𝑟𝑎 = σ𝑘𝑖=1 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2
𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2
3. Calcular
ഥ 𝒊∗
𝒀 7.48 5.50 7.26 3.36 7.49 0.48 5.55 19.35
𝒀∗∗ 70.8
ഥ ∗∗
𝒀 5.9
𝑘
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇 ∶ 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 = 0
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑘 : 𝜏𝑖 para al menos un tratamiento 𝑖
DCA: diferente número de
replicas
• Las Sumas de Cuadrados, están dadas por:
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = 𝑌𝑖𝑗 − 𝑌ത∗∗
𝑗=1
𝑖=1
𝑘 𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2 + 𝑌𝑖𝑗 − 𝑌ത𝑖∗
𝑗=1
𝑖=1 𝑖=1
Catalizador
𝟏 𝟐 𝟑 𝟒
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57.0 55.4 50.0
55.8 55.3 51.7
54.9
𝑛𝑖 2
• Para 𝑆𝐶𝑇 = σ𝑘𝑖=1 σ𝑗=1 𝑌𝑖𝑗 − 𝑌ത∗∗ y 𝑆𝐶𝑇𝑟𝑎 = σ𝑘𝑖=1 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2
54.9 0.17
𝒀𝒊∗ 284.50 223.10 159.70 204.50 Suma 38.34 10.26 20.17 51.47
𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2
ഥ 𝒊∗
𝒀 56.90 55.78 53.23 51.13 29.10 6.63 4.72 45.23
𝒀∗∗ 871.80
ഥ ∗∗
𝒀 54.4875
• Por lo tanto:
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = 𝑌𝑖𝑗 − 𝑌ത∗∗ = 38.34 + 10.26 + 20.17 + 51.47 = 120.24
𝑗=1
𝑖=1
𝑘 𝑘–1 4(4−1)
• Primero se determinan la cantidad de pares de medias 2
= 2 = 6.
𝐻0 : 𝜇1 = 𝜇2 𝐻𝐴 : 𝜇1 ≠ 𝜇2 𝐻0 : 𝜇2 = 𝜇3 𝐻𝐴 : 𝜇2 ≠ 𝜇3
𝐻0 : 𝜇1 = 𝜇3 𝐻𝐴 : 𝜇1 ≠ 𝜇3 𝐻0 : 𝜇2 = 𝜇4 𝐻𝐴 : 𝜇2 ≠ 𝜇4
𝐻0 : 𝜇1 = 𝜇4 𝐻𝐴 : 𝜇1 ≠ 𝜇4 𝐻0 : 𝜇3 = 𝜇4 𝐻𝐴 : 𝜇3 ≠ 𝜇4
Ejemplo 2.3… continuación
Ejemplo 2.3… continuación
• En el ANOVA se observa que los grados de libertad del error son N – k = 12, y que el
cuadrado medio del error es CME = 2.88.
• library (agricolae)
• LSD.test(Modelo,"Catalizador")
𝑞𝛼 (𝑘, 𝑁 − 𝑘) 1 1
𝑇𝛼 = 𝐶𝑀𝐸 +
2 𝑛𝑖 𝑛𝑗
Opción 1 Opción 2
• library (agricolae) • HSD.test(Modelo,"Catalizador")
• ModANOVA<-
aov(Concentracion~Catalizador)
• TukeyHSD(ModANOVA)
• Prueba de Tukey es menos potente que la prueba LSD, por lo que las pequeñas
diferencias no son detectadas como significativas.
• El riesgo de detectar una diferencia que no existe es menor con el método de Tukey.
• Cuando la diferencia entre dos tratamientos es clara, ambos métodos coinciden.
Verificación de los supuestos
del Modelo
• La validez de los resultados obtenidos en cualquier análisis de varianza es dependiente
a que los supuestos del modelo se cumplan.
• Estos supuestos son:
• Normalidad: la respuesta (Y ) se debe distribuir de manera normal.
• Varianza constante: igual varianza de los tratamientos.
• Independencia: las mediciones deben ser independientes.
• Es común utilizar la muestra de residuos para comprobar los supuestos del modelo, ya
que si los supuestos se cumplen, los residuos se pueden ver como una muestra
aleatoria de una distribución normal con media cero y varianza constante.
• Los Residuos son generados por la diferencia entre la respuesta observada y la
respuesta predicha por el modelo en cada prueba experimental.
Verificación de los supuestos
del Modelo
• Para comprobar cada supuesto existen pruebas analíticas y gráficas.
• Cuando uno o dos los puntos que se salen del comportamiento esperado de las
gráficas se puede tratar de un problema de puntos aberrantes, no de violación de
supuestos.
• Se puede utilizar una prueba analítica para subsanar las ambigüedades que surjan en
la interpretación visual (subjetiva) de las gráficas.
Verificación de los supuestos
del Modelo: Normalidad
• Un procedimiento gráfico para
verificar el cumplimiento del supuesto
de normalidad de los residuos consiste
en graficar los residuos en la gráfica
de probabilidad normal.
3. Se calcula el estadístico
2
𝑘
1
𝑊= 𝑎𝑖 𝑋(𝑛−𝑖+1) − 𝑋(𝑖)
(𝑛 − 1)𝑆 2
𝑖=1
Con el tamaño de muestra 𝑛 = 16, el valor critico esperado 𝑊16,0.05 = 0.887 por
lo que para un nivel de significancia de 0.05 no se rechaza 𝐻0 .
• qqPlot(residuals(Modelo))
• shapiro.test(residuals(Modelo • No se rechaza 𝑯𝟎 dado que
)) el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 > 𝜶, por lo que
se concluye que los
residuales se distribuyen de
manera normal.
https://rpubs.com/MSiguenas/122473
Minitab
Minitab
¿Qué hacer cuando los
datos no son normales?
TAREA 2
Investigar los métodos de transformación de datos
para normalizar, ejemplificar y obtener el código en
R.
Verificación de los supuestos del
Modelo: Varianza Constante
• Una forma de verificar el supuesto de varianza constante es
graficando los valores predichos por el modelo contra los residuos.
https://rpubs.com/Joaquin_AR/218466
Ejemplo 2.3… continuación
Ejemplo 2.3… continuación
Verificación de los supuestos del
Modelo: Independencia
• La suposición de independencia puede verificarse si se grafica el orden en que se
colectó un dato contra el residuo correspondiente.
• dwtest(Modelo)
• Box.test(residuals(Modelo))
Verificación de los supuestos del
Modelo
• Cuando no se pueden cumplir las condiciones de normalidad o
de independencia de los datos.
Solución
Diseño de Bloques
Completamente al Azar
• Soluciones:
• Utilizar el mismo operador en las cuatro máquinas.
• Cada operador trabaje durante el experimento con cada una de las
máquinas.
• Esta estrategia es la más recomendable, ya que al utilizar a
todos los operadores con todas las máquinas permite tener
resultados de la comparación que son válidos para todos los
operadores.
• Esta forma de anular el efecto de operadores, recibe el nombre
de bloqueo.
Diseño de Bloques
Completamente al Azar
• En un DBCA se consideran tres fuentes de variabilidad:
• El factor de tratamientos
• El factor de bloque.
• El error aleatorio
• La aleatorización se hace dentro de cada bloque; por lo tanto, no
se realiza de manera total como en el DCA.
• Los factores de bloqueo que aparecen en la práctica son: turno, lote, día,
tipo de material, línea de producción, operador, máquina, método, etc.
2 2
𝑆𝐶𝐵 = 𝑘 σ𝑏𝑗=1 𝑌ത∗𝑗 − 𝑌ത∗∗ 𝑆𝐶𝐸 = σ𝑘𝑖=1 σ𝑏𝑗=1 𝑌𝑖𝑗 − 𝑌ത𝑖∗ − 𝑌ത𝑗∗ + 𝑌ത∗∗
Diseño de Bloques
Completamente al Azar
• Análisis de Varianza
Fuente de Suma de Grados de
Cuadrado Medio 𝑭𝟎 Valor-p
Variación Cuadrados Libertad
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 𝑘−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘−1 𝐶𝑀𝐸
𝑆𝐶𝐵 𝐶𝑀𝐵 𝑃(𝐹 > 𝐹0 )
Bloque 𝑆𝐶𝐵 𝑏−1 𝐶𝑀𝐵 =
𝑏−1 𝐶𝑀𝐸
𝑆𝐶𝐸
Error 𝑆𝐶𝐸 (𝑘 − 1)(𝑏 − 1) 𝐶𝑀𝐸 =
(𝑘 − 1)(𝑏 − 1)
Total 𝑆𝐶𝑇 𝑘𝑏 − 1
𝟐
• 𝑺𝑪𝑩 = 𝒌 σ𝒃𝒋=𝟏 𝒀
ഥ ∗𝒋 − 𝒀
ഥ ∗∗
Bloque ഥ𝒊∗ − 𝒀
𝒀 ഥ∗∗ 𝟐
ഥ𝒊∗ 𝟐
Tra 𝒀𝒊∗ 𝒀 ഥ ∗∗
𝒀 𝒊𝒋 − 𝒀
1 2 3 4 5
A 3.8 1.6 2.7 1.7 2.0 11.8 2.36 0.00 4.96 1.27 4.52 3.34 2.15
B 2.7 5.2 2.8 1.9 4.8 17.4 3.48 1.27 1.89 1.05 3.71 0.95 0.12
C 3.6 7.5 6.4 2.6 8.1 28.2 5.64 0.05 13.49 6.62 1.50 18.26 3.29
𝒀∗𝒋 𝟏𝟎. 𝟏 𝟏𝟒. 𝟑 𝟏𝟏. 𝟗 𝟔. 𝟐 𝟏𝟒. 𝟗 𝟓𝟕. 𝟒 Suma 1.32 20.34 8.95 9.74 22.55
ഥ∗𝒋
𝒀 𝟑. 𝟑𝟕 𝟒. 𝟕𝟕 𝟑. 𝟗𝟕 𝟐. 𝟎𝟕 𝟒. 𝟗𝟕 𝟑. 𝟖𝟐
𝟐
ഥ∗𝒋 − 𝒀
𝒀 ഥ ∗∗
0.21 0.88 0.02 3.10 1.30
𝟐
• 𝑺𝑪𝑻 = σ𝒃𝒋=𝟏 σ𝒌𝒊=𝟏 𝒀𝒊𝒋 − 𝒀
ഥ∗∗ = 𝟏. 𝟑𝟐 + 𝟐𝟎. 𝟑𝟒 + 𝟖. 𝟗𝟓 + 𝟗. 𝟕𝟒 + 𝟐𝟐. 𝟓𝟓 = 𝟔𝟐. 𝟖𝟗
• 𝑺𝑪𝑻𝒓𝒂 = 𝒃 σ𝒌𝒊=𝟏 𝒀
ഥ 𝒊∗ − 𝒀
ഥ∗∗ 𝟐
= 𝟓 𝟐. 𝟏𝟓 + 𝟎. 𝟏𝟐 + 𝟑. 𝟐𝟗 = 𝟐𝟕. 𝟖𝟎
𝟐
• 𝑺𝑪𝑩 = 𝒌 σ𝒃𝒋=𝟏 𝒀 ഥ ∗𝒋 − 𝒀
ഥ∗∗ = 𝟑 𝟑. 𝟑𝟕 + 𝟒. 𝟕𝟕 + 𝟑. 𝟗𝟕 + 𝟐. 𝟎𝟕 + 𝟒. 𝟗𝟕 = 𝟏𝟔. 𝟓𝟒
• Por lo tanto: 𝑺𝑪𝑬 = 𝟔𝟐. 𝟖𝟗 − 𝟐𝟕. 𝟖𝟎 − 𝟏𝟔. 𝟓𝟒 = 𝟏𝟖. 𝟓𝟔
Ejemplo 2.4
Fuente de Suma de
Grados de Libertad Cuadrado Medio 𝑭𝟎 Valor-p
Variación Cuadrados
𝑆𝐶𝑇𝑟𝑎
𝐶𝑀𝑇𝑟𝑎 = 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 = 27.80 𝑘−1=2 𝑘−1 = 𝟓. 𝟗𝟗 0.026
= 13.90 𝐶𝑀𝐸
𝑆𝐶𝐵 𝐶𝑀𝐵
Bloque 𝑆𝐶𝐵 = 16.54 𝑏−1=4 𝐶𝑀𝐵 = = 4.13 = 1.78 0.226
𝑏−1 𝐶𝑀𝐸
𝑆𝐶𝐸
𝐶𝑀𝐸 =
Error 𝑆𝐶𝐸 = 18.56 𝑘−1 𝑏−1 =8 (𝑘 − 1)(𝑏 − 1)
= 2.32
Total 𝑆𝐶𝑇 = 62.89 𝑘𝑏 − 1 = 14
•Se concluye que sí hay diferencia o efecto de las marcas en cuanto al porcentaje de aditivos.
•En caso de resultar significativo el efecto de los bloques, implica que tiene e influencia sobre la variable de
respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta. Si no se rechaza la 𝐻0 , entonces se
tiene el argumento a favor de no controlar este factor en futuros experimentos sobre esta misma respuesta.
Script en R
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Filas 27.797 2 13.899 5.992 0.026 4.459
Columnas 16.536 4 4.134 1.782 0.226 3.838
Error 18.556 8 2.320
Total 62.889 14
Ejemplo 2.4
¿Cuál es el tratamiento ganador?
Ejemplo 2.4
Verificación de Supuestos
No se rechazan las
𝑯𝟎 : 𝜺~𝑵 𝟎, 𝝈𝟐 ,
𝑯𝟎 : 𝝈𝟐𝟏 = 𝝈𝟐𝟐 = ⋯ = 𝝈𝟐𝒌 = 𝝈𝟐
𝑯𝟎 : 𝝆 = 𝟎
Por lo tanto se cumplen los
supuestos
Ejemplo 2.5
•Se concluye que no hay diferencia o efecto de las marcas en cuanto a la cantidad de moscas
muertas.
Diseños de Bloques
Incompletos Balanceados
(DBIB)
Diseños de Bloques Incompletos
Balanceados
• Cuando se construye un diseño de bloques al azar, puede suceder que
no sea posible realizar todos los tratamientos en cada bloque.
• library(agricolae)
• Blo<-factor(rep(1:4, each=3))
• Tra<-factor(c(1,3,4,1,2,3,2,3,4,1,2,4))
• Tiempo<-c(73,73,75,74,75,75,67,68,72,71,72,75)
• modelo<-BIB.test(Blo,Tra,Tiempo,test="lsd", group=TRUE, console=TRUE)
Diseño de Cuadro
Latino
(DCL)
Diseño de Cuadro Latino
• Diseño en el que se controlan dos factores de bloque y uno de tratamientos con la
misma cantidad de niveles.
• Los tratamientos se representan por letras latinas y se distribuyen en forma adecuada en
un cuadro.
• Existen cuatro fuentes de variabilidad que pueden afectar la respuesta observada:
• Los tratamientos.
• El factor de bloque I (columnas).
• El factor de bloque II (renglones).
• El error aleatorio.
• Sean 𝐴, 𝐵, 𝐶, … , 𝐾, los 𝑘 tratamientos a comparar, por tanto ambos factores de bloques
tienen 𝑘 bloques cada uno.
Diseño de Cuadro Latino
• Algunos ejemplos de
cuadrados latinos son:
𝐻0 : 𝛾1 = 𝛾2 = ⋯ = 𝛾𝑘 = 0
𝐻𝐴 : : 𝛾𝑗 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑗
𝐻0 : 𝛿1 = 𝛿2 = ⋯ = 𝛿𝑘 = 0
𝐻𝐴 : 𝛿𝑙 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑙
• Analís de Varianza
Fuente de Grados de
Suma de Cuadrados Cuadrado Medio 𝑭𝟎 Valor-p
Variación Libertad
𝑘
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 = 𝑘 𝑌ത𝑖∗∗ − 𝑌ത∗∗∗ 2 𝑘−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘−1 𝐶𝑀𝐸
𝑖=1
𝑏
Bloque I 2 𝑆𝐶𝐵1 𝐶𝑀𝐵1 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵1 = 𝑘 𝑌ത∗𝑗∗ − 𝑌ത∗∗∗ 𝑘−1 𝐶𝑀𝐵1 =
(columnas) 𝑘−1 𝐶𝑀𝐸
𝑗=1
𝑘
Bloque II 𝑆𝐶𝐵2 𝐶𝑀𝐵2 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵2 = 𝑘 𝑌ത∗∗𝑙 − 𝑌ത∗∗∗ 2 𝑘−1 𝐶𝑀𝐵2 =
(renglones) 𝑘−1 𝐶𝑀𝐸
𝑗=1
𝑆𝐶𝐸 𝑆𝐶𝐸
Error = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 − 𝑆𝐶𝐵1 (𝑘 − 1)(𝑘 − 2) 𝐶𝑀𝐸 =
(𝑘 − 1)(𝑘 − 2)
− 𝑆𝐶𝐵2
𝑘 𝑘
2
Total 𝑌𝑖𝑗𝑙 − 𝑌ത∗∗∗ 𝑘2 − 1
𝑙=1 𝑗=1
• Cada lote de material nuevo sólo alcanza para permitir la realización de cinco
corridas. Además, cada corrida requiere aproximadamente 1.5 horas, por lo
que sólo pueden realizarse cinco corridas en un día.
2
• 𝑺𝑪𝑻 = σ𝑘𝑙=1 σ𝑘𝑗=1 𝑌𝑖𝑗𝑙 − 𝑌∗∗∗
ҧ = (8 − 5.88)2 +(11 − 5.88)2 + ⋯ + 8 − 5.88 2
= 𝟐𝟎𝟔. 𝟔𝟒
2
• 𝑺𝑪𝑩1 = k σbj=1 Yത∗j∗ − Yത∗∗∗ = 5 (6.6 − 5.88)2 +(5.6 − 5.88)2 +(5.4 − 5.88)2 +(5.0 − 5.88)2 +(6.8 − 5.88)2 = 𝟏𝟐. 𝟐𝟒
Bloque I
𝑆𝐶𝐵1 = 12.24 𝑘−1=4 𝐶𝑀𝐵1 = 3.06 0.98 0.4550
(Día)
Bloque II
𝑆𝐶𝐵2 = 15.44 𝑘−1=4 𝐶𝑀𝐵2 = 3.86 1.23 0.3476
(Lote)
Total 206.64 𝑘 2 − 1 = 24
•Además dado que el efecto de los bloques (I y II) no es significativo, entonces se tiene el argumento
a favor de solo considerar como factor de bloqueo en futuros experimentos sobre esta misma
respuesta.
Script en R
Blo1dia Blo2lote Trat Tiempo
1 1 A 8
1 2 C 11
1 3 B 4
#Importar Datos #Opción 1. Usando función lm
1 4 D 6
1 5 E 4 Datos<- read_excel("~/3 Métodos DCLlm <-
2 1 B 7
Estadísticos/Ejercicios/Ejercicio 2-7.xlsx") lm(Tiempo~Blo1dia+Blo2lote+Trat,Datos)
2 2 E 2
2 3 A 9 Datos$Blo1dia<-factor(Datos$Blo1dia) anova(DCLlm)
2 4 C 8
2 5 D 2 Datos$Blo2lote<-factor(Datos$Blo2lote) #Opción 2. Usando la función aov
3 1 D 1
3 2 A 7 Datos$Trat<-factor(Datos$Trat) DCLaov<-
3 3 C 10 aov(Tiempo~Blo1dia+Blo2lote+Trat,Datos)
3 4 E 6
3 5 B 3 anova(DCLaov)
4 1 C 7
4 2 D 3
4 3 E 1
4 4 B 6
4 5 A 8
5 1 E 3
5 2 B 8
5 3 D 5
5 4 A 10
5 5 C 8
Script en R
#Prueba de normalidad Shapiro-Wilk
shapiro.test(DCLlm$res)
library(car)
qqPlot(DCLaov)
#Homegeneidad de varianzas
fitc <- fitted(DCLaov) #Valores predichos
res_stc <- rstandard(DCLaov) #Residuos estandarizados
plot(fitc,res_stc,xlab="Valores predichos",
ylab="Residuos estandarizados",abline(h=0))
#Predichos vs residuos estandarizados
bartlett.test(residuals(DCLlm), Datos$Trat)#Prueba de
Bartlett
#Independencia
library (lmtest)
dwtest(DCLlm)
Box.test(rstandard(DCLaov))
Script en R
Diseño de Cuadro
Grecolatino
(DCL)
Diseño de Cuadro Grecolatino
• Se puede considerar como una extensión del cuadrado latino en él, se
incluye una tercera variable de control o variable de bloque.
𝐻0 : 𝛾1 = 𝛾2 = ⋯ = 𝛾𝑘 = 0
𝐻𝐴 : : 𝛾𝑗 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑗
𝐻0 : 𝛿1 = 𝛿2 = ⋯ = 𝛿𝑘 = 0
𝐻𝐴 : 𝛿𝑙 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑙
𝐻0 : 𝜑1 = 𝜑2 = ⋯ = 𝜑𝑘 = 0
𝐻𝐴 : 𝜑𝑚 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑚
• Analís de Varianza
Fuente de Grados de
Suma de Cuadrados Cuadrado Medio 𝑭𝟎 Valor-p
Variación Libertad
2 𝑘 2
𝑌𝑖∗∗∗ 𝑌∗∗∗∗ 𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 = − 𝑘−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
𝑖=1
𝑘
2 2
Bloque I 𝑌∗𝑗∗∗ 𝑌∗∗∗∗ 𝑆𝐶𝐵1 𝐶𝑀𝐵1 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵1 = − 𝑘−1 𝐶𝑀𝐵1 =
(columnas) 𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
j=1
𝑘 2 2
Bloque II 𝑌∗∗𝑙∗ 𝑌∗∗∗∗ 𝑆𝐶𝐵2 𝐶𝑀𝐵2 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵2 = − 𝑘−1 𝐶𝑀𝐵2 =
(renglones) 𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
l=1
𝑘 2 2
Bloque II 𝑌∗∗∗𝑚 𝑌∗∗∗∗ 𝑆𝐶𝐵3 𝐶𝑀𝐵3
𝑆𝐶𝐵3 = − 𝑘−1 𝐶𝑀𝐵3 = 𝑃(𝐹 > 𝐹0 )
(letras griegas) 𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
m=1
𝑆𝐶𝐸 𝑆𝐶𝐸
Error = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 − 𝑆𝐶𝐵1 (𝑘 − 3)(𝑘 − 1) 𝐶𝑀𝐸 =
− 𝑆𝐶𝐵2 − 𝑆𝐶𝐵3 (𝑘 − 3)(𝑘 − 1)
𝑘 𝑘
2
Total 𝑌𝑖𝑗𝑙m − 𝑌ത∗∗∗ 𝑘2 − 1
𝑙=1 𝑗=1
2
• 𝑺𝑪𝑻 = σ𝑘𝑙=1 σ𝑘𝑗=1 𝑌𝑖𝑗𝑙m − 𝑌ത∗∗∗ = (5 − 9.19)2 +(6 − 9.19)2 + ⋯ + 9 − 9.19 2
= 𝟏𝟓𝟐. 𝟒𝟒
2 2
𝑌𝑖∗∗∗ 𝑌∗∗∗∗ 1600+1024+900+2025 1472
• 𝑺𝑪𝑻𝒓𝒂 = σ𝑘𝑖=1
𝑘
−
𝑁
=
4
−
16
= 𝟑𝟔. 𝟔𝟗
2 2
𝑌 1472
• 𝑺𝑪𝑩𝟏 = σ𝑘j=1 ∗𝑗∗∗ −
𝑌∗∗∗∗
=
841+1369+1681+1600
− = 𝟐𝟐. 𝟏𝟗
𝑘 𝑁 4 16
2 2
𝑌∗∗𝑙∗ 𝑌∗∗∗∗ 1849+1764+576+1444 1472
• 𝑺𝑪𝑩𝟐 = σ𝑘𝑙=1
𝑘
−
𝑁
=
4
−
16
= 𝟓𝟕. 𝟔𝟗
2
𝑌∗∗∗𝑚 2
𝑌∗∗∗∗ 2025+961+1521+1024 1472
• 𝑺𝑪𝑩𝟑 = σ𝑘m=1
𝑘
−
𝑁
=
4
−
16
= 𝟑𝟐. 𝟏𝟗
• 𝑺𝑪𝑬 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 − 𝑆𝐶𝐵1 − 𝑆𝐶𝐵2 − 𝑆𝐶𝐵3 = 152.44 − 36.69 − 57.69 − 22.19 − 32.19 = 𝟑. 𝟏𝟗
Ejemplo 2.7
Fuente de Grados de
Suma de Cuadrados Cuadrado Medio 𝑭𝟎 Valor-p
Variación Libertad
Bloque I
𝑆𝐶𝐵1 = 22.19 𝑘−1=3 𝐶𝑀𝐵1 = 7.40 6.02 𝟎. 𝟎𝟐𝟓
(columnas)
Bloque II
𝑆𝐶𝐵2 = 57.69 𝑘−1=3 𝐶𝑀𝐵2 = 19.23 15.64 0.087
(renglones)
Bloque II
𝑆𝐶𝐵3 = 32.19 𝑘−1=3 𝐶𝑀𝐵3 = 10.73 8.73 0.054
(letras griegas)