Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Métodos Estadísticos

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 184

Métodos

Estadísticos
M.C. Nancy Toriz Robles

2019 – 2020 I Semestre


BIBLIOGRAFÍA

• Castaño T. E. y Domínguez D. J. 2010. Diseño de Experimentos:


Estrategias y Análisis en Ciencia y Tecnología. Universidad Autónoma de
Querétaro. Centro de Investigación en Matemáticas.
• Gutiérrez P. H. y De la Vara S. R. 2008. Análisis y Diseño de Experimentos.
McGraw-Hill. 2da Edición.
• Kuehl R. O. 2000. Diseño de Experimentos. Principios estadísticos de
diseño y análisis de investigación. Thomson Learning. 2da Edición.
• Montgomery D. 2004. Diseño y Análisis de Experimentos. Limusa Wiley.
2da Edición.
• Walpole R. E., Myers R. H., Myers S. L. y Ye K. 2012. Probabilidad y
estadística para ingeniería y ciencias. Pearson. 9na Edición.
EVALUACIÓN

Criterio Porcentaje
Evaluación Frecuente
10 %
(participación en clase).
Trabajos Extraclase 30 %
Exámenes 60 %

Notas:
1. No hay global.
2. Asistencia obligatoria al 86% de las clases.
Unidad I
Planeación de los
Diseños Experimentales
Unidad I. Planeación de los
Diseños Experimentales
Objetivo:

• Valorar la importancia del método científico en la


planeación, conducción, análisis y conclusiones de
una investigación.
Principios de la
Experimentación Científica
• La Ciencia, se ha desarrollado gracias a un trabajo
planificado de búsqueda en el que suceden acciones cada
vez más complejas que requieren la aplicación de la
inteligencia del ser humano.

• “Es el conjunto de conocimientos que ha acumulado


el hombre a lo largo de la historia”.
Principios de la
Experimentación Científica
 Simple.
Conocimiento
común  Adquirido y aceptado sin
discusión.

 Complejo.
 Se adquiere a través del
Conocimiento método científico.
científico  Busca responder interrogantes,
interpretar la realidad y de ser
posible modificarla.
Principios de la
Experimentación Científica

• Se entiende por experimentación científica a los


métodos empleados por los investigadores para poner a
prueba sus teorías y asunciones respecto a sus objetos de
estudio.

• Método Científico.
Método Científico

• ¿Para que sirve?

• ¿Dónde se aplica?

• ¿Cuáles son sus etapas???


Diseño Experimental

• Consiste en planear y realizar un conjunto de pruebas con el objetivo


de generar datos que, al ser analizados estadísticamente, proporcionen
evidencias objetivas que permitan responder las interrogantes
planteadas por el experimentador sobre determinada situación.

• El diseño estadístico de experimentos es precisamente la forma más


eficaz de hacer pruebas.

• El diseño de experimentos es la aplicación del método científico para


generar conocimiento acerca de un sistema o proceso, por medio de
pruebas planeadas adecuadamente.
Diseño Experimental

• Los experimentos se usan para estudiar el desempeño


de procesos y sistemas.
Entrada Salida
• Factores • Variable
controlables Proceso respuesta
• Factores no
controlables

¿Cuáles características de calidad se van a medir?


¿Cuáles factores controlables deben incluirse en el
experimento?
¿Qué niveles debe utilizar cada factor?
¿Cuál diseño experimental es el adecuado?
Diseño Experimental

• Algunos problemas típicos que pueden resolverse con el


diseño y el análisis de experimentos son:
• Comparar dos o más materiales con el fin de elegir el mejor.
• Determinar los factores de un proceso que tienen impacto
sobre una o más características del producto final.
• Encontrar las condiciones de operación donde se reduzcan los
defectos o se logre un mejor desempeño del proceso.
• Reducir el tiempo de ciclo del proceso.
• Apoyar el diseño o rediseño de nuevos productos o procesos.
Definiciones Básicas

• Unidad experimental (UE)


• Individuo, objeto o unidad de material a la que se le aplica de
manera independiente un tratamiento, a ésta se le miden las
variables respuesta bajo estudio.

• Por ejemplo, si se quiere investigar alternativas para reducir el


porcentaje de piezas defectuosas, en un proceso que produce x número
de piezas en un lapso corto de tiempo.
• No sería confiable que la unidad experimental fuera cada pieza.
• La UE será cierta cantidad de piezas que se producen en las
mismas condiciones.
Definiciones Básicas

• Factor: una variable de interés de la que se desea estudiar sus


efectos en una o varias variables de respuesta.
• Factores controlables
• Factores no controlables

• Nivel: son los diferentes valores que se asignan a cada factor


estudiado.

• Tratamiento: es la combinación de niveles de todos los factores.


Definiciones Básicas

• Error experimental: describe la variación entre las unidades


experimentales tratadas de manera idéntica e independiente. Los
distintos orígenes son:
• La variación natural entre unidades experimentales.
• La variabilidad en la medición de la respuesta.
• La imposibilidad de reproducir las condiciones del tratamiento con
exactitud de una unidad a otra.
• La interacción de los tratamientos con las unidades experimentales.
• Cualquier otro factor externo que influya en las características
medidas.
Definiciones Básicas

• Error aleatorio: es la variabilidad observada que no


se puede explicar por los factores estudiados.

• Matriz de diseño o diseño: es el arreglo formado


por los diferentes tratamientos que serán corridos,
incluyendo las repeticiones.
• De manera que se obtenga la máxima información al
mínimo costo posible.
Etapas del Diseño de
Experimentos

Planeación y
Análisis Interpretación Conclusiones
realización

Es la etapa más
importante
Planeación de los Diseños
Experimentales
Ronald A. Fisher
• De 1919 a 1933, Fisher fue contratado en Rothamsted Experimental
Station, Inglaterra; para aplicar análisis estadístico a los datos de
investigaciones agrícolas. Estudió y analizó experimentos relativos al
trigo.
• Desarrolló y consolidó los principios básicos de diseño y análisis que
hasta la fecha son utilizados.
• Desarrolló el análisis de varianza y unificó sus ideas sobre los
principios del diseño de experimentos.
Planeación de los Diseños
Experimentales
• En 1926 publicó el artículo “The Arrangement of Field Experiments”; donde
describió tres componentes fundamentales:
• Control local: condiciones de campo para reducir el error experimental.
• Replicación: como un medio para estimar la varianza del error
experimental.
• Aleatorización: para obtener una estimación válida de esa varianza.

• Dos libros de Fisher que surgieron a partir de sus experiencias en Rothamsted:


• 1925 Statistical Principles for Research Workers (Principios estadísticos para
investigadores).
• 1935. Design of Experiments (Diseño de experimentos).
Planeación de los Diseños
Experimentales
• La planeación es una actividad que permite eficacia, eficiencia
y efectividad en el trabajo.

• Implica diseñar el Experimento.

• El diseño estadístico de experimentos se debe usar como una


metodología que permita planear distintas estrategias para
seleccionar, controlar, analizar e interpretar diferentes
condiciones de estudio de un fenómeno de una manera objetiva
y sistemática.
Planeación y Realización

1. Entender y delimitar el problema u objeto de estudio.

2. Elegir la(s) variable(s) de respuesta que será medida en cada punto del
diseño y verificar que se mide de manera confiable.

3. Determinar cuáles factores deben estudiarse o investigarse, de acuerdo a la


supuesta influencia que tienen sobre la respuesta.

4. Seleccionar los niveles de cada factor, así como el diseño experimental


adecuado a los factores que se tienen y al objetivo del experimento.

5. Planear y organizar el trabajo experimental.

6. Realizar el experimento.
Análisis

• En esta etapa no se debe perder de vista que los resultados


experimentales son observaciones muestrales, no poblacionales.

• Se debe recurrir a métodos estadísticos inferenciales para ver si


las diferencias o efectos muestrales (experimentales) son lo
suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso).

• La técnica estadística central en el análisis de los experimentos


es el análisis de varianza ANOVA.
Interpretación

• Se debe analizar con detalle lo que ha pasado en el


experimento, desde contrastar las hipótesis iniciales con los
resultados del experimento.

• Observar los nuevos aprendizajes que se lograron sobre el


proceso, verificar supuestos.

• Elegir el tratamiento ganador, siempre con apoyo de las


pruebas estadísticas.
Conclusiones

• Para concluir el estudio experimental se recomienda decidir qué


medidas implementar para generalizar el resultado del estudio y
para garantizar que las mejoras se mantengan.
Principios de los Diseños
Experimentales
Aleatorización
• Consiste en hacer corridas experimentales en orden aleatorio (al azar).
• Este principio aumenta la posibilidad de que el supuesto de
independencia de los errores se cumpla.
• Asegura que las pequeñas diferencias provocadas por materiales,
equipo y todos los factores no controlados, se repartan de manera
homogénea en todos los tratamientos.
Principios de los Diseños
Experimentales
Repetición
• Es correr más de una vez un tratamiento o una combinación
de factores, no se refiere a medir varias veces el mismo
resultado experimental.
• Repetir es volver a realizar un tratamiento, pero no
inmediatamente después de haber corrido el mismo
tratamiento, sino cuando corresponda de acuerdo con la
aleatorización.
• Las repeticiones permiten distinguir mejor qué parte de la
variabilidad total de los datos se debe al error aleatorio y cuál
a los factores.
Principios de los Diseños
Experimentales
Bloqueo:

• Consiste en nulificar o tomar en cuenta, en forma adecuada, todos los factores


que puedan afectar la respuesta observada.

• Al bloquear, el subconjunto de datos que se obtengan dentro de cada bloque,


debe resultar más homogéneo que el conjunto total de datos.
Principios de los Diseños
Experimentales
Bloqueo:

• Por ejemplo: si se quieren comparar cuatro máquinas, es importante tomar en cuenta


al operador de las máquinas, si se cree éste puede influir en el resultado.

• Una estrategia de bloqueo sería que un mismo operador realizara todas las
pruebas del experimento.

• Otra estrategia de bloqueo sería experimentar con cuatro operadores (cuatro


bloques), donde cada uno de ellos prueba en orden aleatorio las cuatro
máquinas. En este caso la comparación de las máquinas quizás es más real.

• Cada operador es un bloque porque se espera que las mediciones del mismo operador
sean más parecidas entre sí que las mediciones de varios operadores.
Población y Muestra

Un estadístico se define
Son las afirmaciones válidas
como cualquier función de
acerca de la población o
los datos muestrales que no
proceso basadas en la
contiene parámetros
información contenida en la
desconocidos
muestra.
Diseño de
Experimentos 1. Planear un cambio o
y el ciclo de una prueba con el
objetivo de encontrar
causas y lograr una
Deming mejora.

4. Actuar de acuerdo con


Ciclo de Deming: estrategia los resultados: 2. Hacer o llevar a cabo el
que busca mejorar implemente el cambio, cambio o las pruebas
continuamente un proceso, deséchelo o planee una planeadas.
nueva prueba.
mediante la aplicación
repetida del ciclo: planear,
hacer, verificar y actuar. 3. Estudiar los resultados.
¿Qué se aprendió?
¿Qué estuvo mal?
R Project
R Project

• Fue inicialmente escrito por Robert Gentleman y Ross Ihaka del Departamento
de Estadística de la Universidad de Auckland en Nueva Zelanda.

• R es un lenguaje de programación y un entorno para análisis estadístico y la


realización de gráficos.

• R actualmente es el resultado de un esfuerzo de colaboración de personas del


todo el mundo.

• R es un proyecto desarrollado por los Laboratorios Bell.


1924 Shewhart introduce el
concepto de Carta de Control
Instalación

• Acceder a https://cloud.r-project.org/
• Seleccionar el sistema operativo
RStudio

• RStudio es un entorno de desarrollo integrado para el lenguaje de


programación R.
1. Acceder a la página web: https://www.rstudio.com/
2. Seleccionar “Download Rstudio”.
RStudio
3. Seleccionar el icono de descarga de licencia gratis.
4. Seleccionar el Sistema Operativo.
Interfaz de RStudio

Script Environment
History

Consola Files Help


Plots Viewer
Packages
Minitab
Minitab

• Descargar de la página https://www.minitab.com/es-


mx/products/minitab/free-trial/
Barra de Herramientas

Ventana Sesión
Muestra los resultados de sus análisis en formato de texto.

Hoja de trabajo
Es donde se ingresan y organizan los datos.
Unidad II
Diseños
Experimentales
Unidad II. Diseños
Experimentales
Objetivo:

• Identificar y manejar los diseños experimentales con


aplicación en el campo de acción de la agroindustria.
Análisis de Varianza
(ANOVA)
• Los ANOVA evalúan la importancia de uno o más factores al comparar las
medias de la variable de respuesta en los diferentes niveles de los
factores.

• La idea general de esta técnica es separar la variación total en las partes con
las que contribuye cada fuente de variación en el experimento.

• Prueba el juego de hipótesis:


• La hipótesis nula establece que todas las medias de la población (medias
de los niveles de los factores) son iguales.
• La hipótesis alternativa establece que al menos una media es diferente.
Análisis de Varianza (ANOVA)
• Para ejecutar un ANOVA, debe tener una variable de respuesta continua y al
menos un factor categórico con dos o más niveles.

• Los análisis ANOVA requieren datos que cumplan los siguientes supuestos:
• La poblaciones sigue una distribución aproximadamente normal.
• Con varianzas iguales entre los niveles de factores.
• Independencia entre las muestas.

• Las transformaciones del conjunto de datos original pueden corregir estas


violaciones.
• Transformaciones Box-Cox
Error Tipo I y Tipo II

• Probar una hipótesis estadística es una decisión


probabilística, por lo que existe el riesgo de cometer
errores.
𝑯𝟎 es cierta 𝑯𝟎 es falsa
Decisión correcta Error Tipo II
No rechazar 𝑯𝟎 Nivel de Confianza 𝑃 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 = 𝛽
1−𝛼
Error Tipo I Decisión correcta
Rechazar 𝑯𝟎 Nivel de Significancia Potencia de a Prueba
𝑃 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼 = 𝛼 1−𝛽
Clasificación de los Diseños
Experimentales
• Según Gutiérrez y De la Vara (2008).
Diseño
Completamente al Azar
(DCA)
Diseño Completamente al Azar
(DCA)
• Es el diseño más simple, se utiliza para comparar dos o más tratamientos.

• Solo consideran dos fuentes de variabilidad


• Los tratamientos.
• El error aleatorio.

• Se llama completamente al azar porque todas las corridas experimentales se realizan


en orden aleatorio completo.
• Si durante el estudio se hacen en total N pruebas, éstas se corren al azar, de
manera que los posibles efectos ambientales y temporales se vayan
repartiendo equitativamente entre los tratamientos.
Diseño Completamente al Azar
(DCA)
• En caso de que los tratamientos tengan efecto, las observaciones se podrán
describir con el modelo estadístico lineal:
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 ; 𝑖 = 1,2, … , 𝑘 Número de tratamientos

• Donde:
• 𝜇 es la media global
• 𝜏𝑖 es un parámetro que mide el efecto del tratamiento 𝑖.
• 𝜀𝑖𝑗 es el error atribuible a la observación 𝑌𝑖𝑗
Diseño Completamente al Azar
(DCA)
• El objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad
de los tratamientos con respecto a la media de la correspondiente variable de
respuesta:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇 ∶ 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 = 0
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇 ∶ 𝜏𝑖 para al menos un tratamiento 𝑖

• Si no se rechaza 𝐻0 se confirma que los


efectos sobre la respuesta de los 𝑘
tratamientos son estadísticamente nulos
(iguales a cero).
• Si se rechaza 𝐻0, se estaría concluyendo
que al menos un efecto es diferente de
cero.
Representación de los efectos de los tratamientos en el DCA.
Diseño Completamente al Azar
(DCA)
𝑌𝑖𝑗 Tratamientos (𝑖 = 1, 2, … , 𝑘 )
𝝉𝟏 𝝉𝟐 ⋯ 𝝉𝒌
𝑌11 𝑌21 ⋯ 𝑌𝑘1

𝑗 = 1, 2, … , 𝑛𝑖 𝑌12 𝑌22 ⋯ 𝑌𝑘2


⋮ ⋮ ⋯ ⋮
𝑌1𝑛1 𝑌2𝑛2 ⋯ 𝑌𝑘𝑛𝑘
Suma de las observaciones del ⋯
𝑌1∗ 𝑌2∗ 𝑌𝑘∗
tratamiento 𝒊 𝒀𝒊∗
Media de las observaciones del 𝒊-
ഥ 𝒊∗ 𝑌ത1∗ 𝑌ത2∗ ⋯ 𝑌ത𝑘∗
ésimo tratamiento 𝒀
Suma total de las mediciones 𝒀∗∗
ഥ ∗∗
Media global 𝒀
Notación de Puntos
• Sirve para representar sumas y medias que se obtienen a partir de los datos experimentales.
• Sea 𝑌𝑖𝑗 la 𝑗-ésima observación en el tratamiento 𝑖, con 𝑖 = 1, 2, … , 𝑘 y 𝑗 = 1, 2, … , 𝑛𝑖 . Las
cantidades de interés son las siguientes:

• 𝒀𝒊∗ Suma de las observaciones del tratamiento 𝑖

• ഥ 𝒊∗ Media de las observaciones del 𝑖 -ésimo tratamiento


𝒀

• 𝒀∗∗ Suma total de las 𝑁 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 mediciones

• ഥ ∗∗ Media global
𝒀
• El punto indica la suma sobre el correspondiente subíndice. Por ejemplo:
𝑛 𝑛
𝑖
𝑌𝑖∗ = σ𝑗=1 𝑌𝑖𝑗 𝑌∗∗ = σ𝑘𝑖=1 σ𝑗=1
𝑖
𝑌𝑖𝑗
Diseño Completamente al Azar
(DCA)
• Para probar la hipótesis nula, mediante ANOVA, lo primero es
descomponer la variabilidad total de los datos en sus dos componentes.

• Una medida de la variabilidad total presente en las observaciones de


es la suma de cuadrados total dada por:
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = ෍ ෍ 𝑌𝑖𝑗 − 𝑌ത∗∗
𝑗=1
𝑖=1
𝑘 𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = ෍ 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2
+෍෍ 𝑌𝑖𝑗 − 𝑌ത𝑖∗
𝑗=1
𝑖=1 𝑖=1

Suma de Cuadrados de Suma de Cuadrados del


Tratamientos (SCTra) Error (SCE)
Diseño Completamente al Azar
(DCA)
Fuente de Suma de Grados de
Cuadrado Medio 𝑭𝟎 Valor-p
Variación Cuadrados Libertad
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 𝐾−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘−1 𝐶𝑀𝐸
𝑆𝐶𝐸
Error 𝑆𝐶𝐸 𝑁−𝑘 𝐶𝑀𝐸 =
𝑁−𝑘
Total 𝑆𝐶𝑇 𝑁−1

Para un nivel de significancia 𝛼:

• Se rechaza 𝑯𝟎 si 𝑭𝟎 > 𝑭𝜶,𝒌−𝟏,𝑵−𝒌 , donde 𝐹𝛼,𝑘−1,𝑁−𝑘 es el percentil


(1 – 𝛼) × 100 de la distribución 𝐹.

• Se rechaza 𝑯𝟎 si el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶, donde el 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 𝑃(𝐹 > 𝐹0 ).


Ejemplo 2.1

• Comparación de cuatro métodos de ensamble.


• Un equipo de mejora investiga el efecto de cuatro métodos de
ensamble A, B, C y D, sobre el tiempo de ensamble en minutos.
• La estrategia experimental es aplicar cuatro veces los cuatro
métodos de ensamble en orden completamente aleatorio, es decir,
las 16 pruebas en orden aleatorio.
• Si se usa el DCA, se supone que, además del método de ensamble,
no existe ningún otro factor que influya de manera significativa
sobre la variable de respuesta (tiempo de ensamble).

Elaborar bitácora de
ejemplos y ejercicios
Ejemplo 2.1
Método de Ensamble
𝑨 𝑩 𝑪 𝑫
6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9
Suma de las observaciones del
29 34 51 42
tratamiento 𝒊 𝒀𝒊∗
1. Calcular

Media de las observaciones del 𝒊-


ഥ 𝒊∗ 7.25 8.50 12.75 10.50
ésimo tratamiento 𝒀
Suma total de las mediciones 𝒀∗∗ 156
ഥ ∗∗
Media global 𝒀 9.75
𝑛𝑖 2
• Por lo tanto: 𝑆𝐶𝑇 = σ𝑘𝑖=1 σ𝑗=1 𝑌𝑖𝑗 − 𝑌ത∗∗
Método de Ensamble (𝑌𝑖𝑗 − 𝑌ത∗∗ )2
𝑨 𝑩 𝑪 𝑫 𝑨 𝑩 𝑪 𝑫

6 7 11 10 14.06 7.56 1.56 0.06

2. Calcular
8 9 16 12 3.06 0.56 39.06 5.06

7 10 11 11 7.56 0.06 1.56 1.56

8 8 13 9 3.06 3.06 10.56 0.56

𝒀𝒊∗ 29 34 51 42 Suma 27.75 11.25 52.75 7.25

ഥ 𝒊∗
𝒀 7.25 8.50 12.75 10.50

𝒀∗∗ 156
ഥ ∗∗
𝒀 9.75
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = ෍ ෍ 𝑌𝑖𝑗 − 𝑌ത∗∗ = 27.75 + 11.25 + 52.75 + 7.25 = 99.00
𝑗=1
𝑖=1
• Para 𝑆𝐶𝑇𝑟𝑎 = σ𝑘𝑖=1 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2

Método de Ensamble (𝑌𝑖𝑗 − 𝑌ത∗∗ )2


𝑨 𝑩 𝑪 𝑫 𝑨 𝑩 𝑪 𝑫

6 7 11 10 14.06 7.56 1.56 0.06

8 9 16 12 3.06 0.56 39.06 5.06

7 10 11 11 7.56 0.06 1.56 1.56

8 8 13 9 3.06 3.06 10.56 0.56

𝒀𝒊∗ 29 34 51 42 Suma 27.75 11.25 52.75 7.25

3. Calcular
𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2

ഥ 𝒊∗
𝒀 7.25 8.50 12.75 10.50 Suma 25.00 6.25 36.00 2.25

𝒀∗∗ 156
ഥ ∗∗
𝒀 9.75
𝑘

𝑆𝐶𝑇𝑟𝑎 = ෍ 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2


= 25.00 + 6.25 + 36.00 + 2.25 = 69.50
𝑖=1
• Si:
𝑆𝐶𝑇 = 99.00 𝑆𝐶𝑇𝑟𝑎 = 69.50
• Entonces:
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 = 99.00 − 69.50 = 29.50
• Por lo tanto:
Fuente de Suma de Grados
Grados de
de Cuadrado
Cuadrado Medio 𝑭𝑭𝟎𝟎 Valor-pp
Valor-
Variación Cuadrados Libertad
Libertad Medio
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 𝐾−1 𝑆𝐶𝑇𝑟𝑎 =
𝐶𝑀𝑇𝑟𝑎 𝑃(𝐹
𝑃 𝐹>>𝐹𝐹00)
Tratamientos 69.50 𝐾−1=3 = 23.17
𝑘−1 𝐶𝑀𝐸
𝐶𝑀𝐸
𝑘−1 =0.0018
𝑆𝐶𝐸 = 9.42
Error 𝑆𝐶𝐸 𝑁−𝑘 𝐶𝑀𝐸 =
𝑆𝐶𝐸 𝑁 − 𝑘
Error 29.50 𝑁 − 𝑘 = 12 = 2.46
Total 𝑆𝐶𝑇 𝑁−1 𝑁 − 𝑘
Total 99 𝑁 − 1 = 15
• Para un nivel de significancia 𝛼 = 0.05:
• Se rechaza 𝑯𝟎 dado que 𝑭𝟎 = 𝟗. 𝟒𝟐 > 𝑭𝟎.𝟎𝟓,𝟑,𝟏𝟐 = 𝟑. 𝟒𝟗 y el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶.
• Con lo cual se concluye que sí hay diferencia o efecto de los métodos de ensamble
en cuanto a su tiempo promedio, es decir, al menos uno de los método de
ensamble afecta el tiempo.
𝑭𝟎.𝟎𝟓,𝟑,𝟏𝟐 = 𝟑. 𝟒𝟗
SCRIPT EN R
• #1. Crear la matriz de datos. labels=c("A", "B", "C", "D"))
• A<-c(6, 8, 7, 8) • Datos<-data.frame(Tiempo,
• B<-c(7, 9, 10, 8) Ensamble)
• C<-c(11, 16, 11, 13)
• D<-c(10, 12, 11, 9) • #2. Definir el modelo
• Tiempo<-c(A, B, C, D) • Modelo<-lm(Tiempo~Ensamble)
• Ensamble<-rep(1:4, each=4) • anova(Modelo)
• Ensamble<-factor(Ensamble,
Minitab
Minitab
Ejemplo 2.2
• Supresión del crecimiento bacteriano en carnes almacenadas.
• La vida de anaquel de las carnes almacenadas es el tiempo que un corte previamente
empacado es sano, nutritivo y vendible. Un paquete normal expuesto al aire
ambiental tiene una vida aproximada de 48 horas, después de las cuales la carne
comienza a deteriorarse por contaminación de microbios, degradación del color y
encogimiento.
• El empaque al vacío es efectivo para suprimir el desarrollo de microbios; sin
embargo.
• Algunos estudios sugieren las atmósferas controladas de gas, como alternativa. Dos
atmósferas que prometen combinar la capacidad de suprimir el desarrollo de
microbios con la conservación de las cualidades de la carne son: 1) dióxido de
carbono puro (CO2), y 2) mezclas de monóxido de carbono (CO), oxígeno (O2) y
nitrógeno (N).
Ejemplo 2.2
• El diseño del tratamiento desarrollado por el investigador incluyó empaques con:
1) aire del ambiente con un empaque comercial de plástico; 2) al vacío; 3) una
mezcla de gases con 1% CO, 40% O2 y 59% N y 4) 100% CO2.
• Después de 9 días de almacenamiento a 4°C en una instalación normal, se midió el
número de bacterias sicotrópicas en la carne. Las bacterias sicotrópicas se
encuentran en la superficie de la carne y se asocian con la carne deteriorada.
Método de Empaque
𝟏 𝟐 𝟑 𝟒
7.66 5.26 7.41 3.51
6.98 5.44 7.33 2.91
7.80 5.80 7.04 3.66
𝑛𝑖 2
• Por lo tanto: 𝑆𝐶𝑇 = σ𝑘𝑖=1 σ𝑗=1 𝑌𝑖𝑗 − 𝑌ത∗∗
Método de Empaque (𝑌𝑖𝑗 − 𝑌ത∗∗ )2
𝟏 𝟐 𝟑 𝟒 𝟏 𝟐 𝟑 𝟒

7.66 5.26 7.41 3.51

2. Calcular
3.10 0.41 2.28 5.71
6.98 5.44 7.33 2.91
1.17 0.21 2.04 8.94
7.80 5.80 7.04 3.66
3.61 0.01 1.30 5.02
𝒀𝒊∗
𝒊∗ 22.44 16.50 21.78 10.08 Suma 7.87 0.63 5.62 19.67

ഥ 𝒊∗
𝒀 7.48 5.50 7.26 3.36
𝒊∗

𝒀∗∗
∗∗ 70.8
𝒀
ഥ ∗∗
∗∗ 5.9

𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = ෍ ෍ 𝑌𝑖𝑗 − 𝑌ത∗∗ = 7.87 + 0.63 + 5.62 + 19.67 = 33.80
𝑗=1
𝑖=1
• Para 𝑆𝐶𝑇𝑟𝑎 = σ𝑘𝑖=1 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2

Método de Empaque (𝑌𝑖𝑗 − 𝑌ത∗∗ )2


𝟏 𝟐 𝟑 𝟒 𝟏 𝟐 𝟑 𝟒

7.66 5.26 7.41 3.51


3.10 0.41 2.28 5.71
6.98 5.44 7.33 2.91
1.17 0.21 2.04 8.94
7.80 5.80 7.04 3.66
3.61 0.01 1.30 5.02
𝒀𝒊∗ 22.44 16.50 21.78 10.08 Suma 7.87 0.63 5.62 19.67

𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2

3. Calcular
ഥ 𝒊∗
𝒀 7.48 5.50 7.26 3.36 7.49 0.48 5.55 19.35

𝒀∗∗ 70.8
ഥ ∗∗
𝒀 5.9
𝑘

𝑆𝐶𝑇𝑟𝑎 = ෍ 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2


= 7.49 + 0.48 + 5.55 + 19.35 = 32.87
𝑖=1
• Si:
𝑆𝐶𝑇 = 33.80 𝑆𝐶𝑇𝑟𝑎 = 32.87
• Entonces:
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 = 33.80 − 32.87 = 0.93
• Por lo tanto:
Fuente de Sumadede Grados
Suma Grados
de de Cuadrado
Cuadrado Medio 𝑭𝑭
𝟎𝟎 Valor-p
Variación Cuadrados Libertad
Cuadrados Libertad Medio
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 𝐾−1 𝑆𝐶𝑇𝑟𝑎 𝑃(𝐹
𝑃 𝐹 > 𝐹0 )
Tratamientos 32.87 𝐾−1=3 =𝑘 10.96
−1 𝐶𝑀𝐸
𝐶𝑀𝐸
𝑘−1 = 1.38𝐸 − 06
𝑆𝐶𝐸 = 94.58
Error 𝑆𝐶𝐸 𝑁−𝑘
𝑆𝐶𝐸 𝑁 − 𝑘
Error 0.93 𝑁−𝑘 =8 = 0.12
Total 𝑆𝐶𝑇 𝑁−1 𝑁−𝑘
Total 33.80 𝑁 − 1 = 11
• Para un nivel de significancia 𝛼 = 0.05:
• Se rechaza 𝑯𝟎 dado que 𝑭𝟎 = 𝟗𝟒. 𝟓𝟖 > 𝑭𝟎.𝟎𝟓,𝟑,𝟖 = 𝟒. 𝟎𝟕 y el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶.
• Con lo cual se concluye que sí hay diferencia o efecto de los métodos de empaque
en cuanto al número de bacterias sicotrópicas, es decir, al menos uno de los
métodos afecta la calidad de la carne.
SCRIPT EN R
• #1. Crear la matriz de datos. • Empaque<-factor(Empaque)
• A<-c(7.66,6.98,7.80) • Datos<-
• B<-c(5.26,5.44,5.80) data.frame(Bacterias,Empaque)
• C<-c(7.41,7.33,7.04)
• D<-c(3.51,2.91,3.66) • #2. Definir el modelo
• Bacterias<-c(A, B, C, D) • Modelo<-lm(Bacterias~Empaque)
• Empaque<-rep(1:4, each=3) • anova(Modelo)
DCA: diferente número de
replicas
• Se puede presentar el caso de que exista diferente número de réplicas debido a:
• La pérdida de algunas unidades experimentales durante el estudio.
• La insuficiencia del número de sujetos disponibles para todos los grupos
de estudio.
• Por extravío, destrucción o nulidad de los datos recolectados.

• La pérdida de observaciones de un grupo de tratamiento tiene como


consecuencia una pérdida proporcional en la precisión de las estimaciones de la
media de ese grupo con respecto a las de los grupos con todos los datos.
DCA: diferente número de
replicas
• El modelo estadístico lineal y el juego de hipótesis a probar, son las mismas que
en el caso del DCA con mismo número de replicas.

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 ; 𝑖 = 1,2, … , 𝑘

𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇 ∶ 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 = 0
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑘 : 𝜏𝑖 para al menos un tratamiento 𝑖
DCA: diferente número de
replicas
• Las Sumas de Cuadrados, están dadas por:
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = ෍ ෍ 𝑌𝑖𝑗 − 𝑌ത∗∗
𝑗=1
𝑖=1

𝑘 𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = ෍ 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2 +෍෍ 𝑌𝑖𝑗 − 𝑌ത𝑖∗
𝑗=1
𝑖=1 𝑖=1

Suma de Cuadrados de Suma de Cuadrados del


Tratamientos (SCTra) Error (SCE)
DCA: diferente número de
replicas
Fuente de Suma de Grados de
Cuadrado Medio 𝑭𝟎 Valor-p
Variación Cuadrados Libertad
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 𝐾−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘−1 𝐶𝑀𝐸
𝑆𝐶𝐸
Error 𝑆𝐶𝐸 𝑁−𝑘
𝑁−𝑘
Total 𝑆𝐶𝑇 𝑁−1

Para un nivel de significancia 𝛼:

• Se rechaza 𝑯𝟎 si 𝑭𝟎 > 𝑭𝜶,𝒌−𝟏,𝑵−𝒌 , donde 𝐹𝛼,𝑘−1,𝑁−𝑘 es el percentil


(1 – 𝛼) × 100 de la distribución 𝐹.

• Se rechaza 𝑯𝟎 si el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶, donde el 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 𝑃(𝐹 > 𝐹0 ).


Ejemplo 2.3
• Se están investigando cuatro catalizadores que pueden afectar la concentración de
un componente en una mezcla. Se obtienen las siguientes concentraciones:

Catalizador
𝟏 𝟐 𝟑 𝟒
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57.0 55.4 50.0
55.8 55.3 51.7
54.9
𝑛𝑖 2
• Para 𝑆𝐶𝑇 = σ𝑘𝑖=1 σ𝑗=1 𝑌𝑖𝑗 − 𝑌ത∗∗ y 𝑆𝐶𝑇𝑟𝑎 = σ𝑘𝑖=1 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2

Catalizador (𝑌𝑖𝑗 − 𝑌ത∗∗ )2


𝟏 𝟐 𝟑 𝟒 𝟏 𝟐 𝟑 𝟒
58.2 56.3 50.1 52.9 13.78 3.29 19.25 2.52

57.2 54.5 54.2 49.9 7.36 0.00 0.08 21.05

58.4 57.0 55.4 50.0 15.31 6.31 0.83 20.14

55.8 55.3 51.7 1.72 0.66 7.77

54.9 0.17

𝒀𝒊∗ 284.50 223.10 159.70 204.50 Suma 38.34 10.26 20.17 51.47

𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2

ഥ 𝒊∗
𝒀 56.90 55.78 53.23 51.13 29.10 6.63 4.72 45.23

𝒀∗∗ 871.80
ഥ ∗∗
𝒀 54.4875
• Por lo tanto:
𝑘
𝑛𝑖 2
𝑆𝐶𝑇 = ෍ ෍ 𝑌𝑖𝑗 − 𝑌ത∗∗ = 38.34 + 10.26 + 20.17 + 51.47 = 120.24
𝑗=1
𝑖=1

𝑆𝐶𝑇𝑟𝑎 = ෍ 𝑛𝑖 𝑌ത𝑖∗ − 𝑌ത∗∗ 2


= 29.10 + 6.63 + 4.72 + 45.23 = 85.68
𝑖=1
• Si:
𝑆𝐶𝑇 = 120.24 𝑆𝐶𝑇𝑟𝑎 = 85.68
• Entonces:
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 = 120.24 − 85.68 = 34.56
• Por lo tanto:

Fuente de Suma de Grados de Cuadrado


Cuadrado
𝐅𝐅𝟎𝟎 Valor-p
Variación Cuadrados Libertad Medio
Medio
SCTra SCT CMTra
CMT PP FF >
> FF00
Tratamientos 85.68 K−
K−1=
13 = 28.56 = 9.92
k − 1k − 1 CMECME = 0.0014
SCE SCE
Error 34.56 N −Nk−=k 12 = 2.88
N − kN − k
Total 120.24 N −N1−=1 15

• Para un nivel de significancia 𝛼 = 0.05:


• Se rechaza 𝑯𝟎 dado que 𝑭𝟎 = 𝟗. 𝟗𝟐 > 𝑭𝟎.𝟎𝟓,𝟑,𝟏𝟐 = 𝟑. 𝟒𝟗 y el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶.
• Con lo cual se concluye que sí hay diferencia o efecto del tipo de catalizador en cuanto
a la concentración de la mezcla.
SCRIPT EN R
• #1. Crear la matriz de datos. • Datos<-
• A<-c(58.2,57.2,58.4,55.8,54.9) data.frame(Concentracion,Catalizador)
• B<-c(56.3,54.5,57.0,55.3)
• C<-c(50.1,54.2,55.4) • #2. Definir el modelo
• D<-c(52.9,49.9,50.0,51.7) • Modelo<-
• Concentracion<-c(A, B, C, D) lm(Concentracion~Catalizador)
• Catalizador<-factor(rep(1:4, c(5,4,3,4))) • anova(Modelo)
Minitab
Minitab
¿Cómo se hace en
Excel?
TAREA 1
En equipos obtener las tablas ANOVA para los tres
ejercicios anteriores, indicando el procedimiento.
Comparaciones o pruebas
de rango múltiples
• Después de que se rechazó la hipótesis nula en un análisis de varianza, es
necesario ir a detalle y ver cuáles tratamientos son diferentes.
• Método de la Diferencia Mínima Significativa (LSD).
• Método de Tukey.

• La diferencia primordial entre los métodos radica en la potencia que tienen


para detectar las diferencias entre las medias.

• Una prueba es más potente si es capaz de detectar diferencias más


pequeñas.
Método de la Diferencia Mínima
Significativa (LSD)
• Una vez que se rechazó 𝐻0, el siguiente paso es probar la igualdad de todos los
posibles pares de medias con la hipótesis:
𝐻0 : 𝜇𝑖 = 𝜇𝑗
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 para toda 𝑖 ≠ 𝑗
• Para 𝑘 tratamientos se tienen en total 𝑘(𝑘 – 1)/2 pares de medias.
• El estadístico de prueba para cada una de las hipótesis, es la correspondiente
diferencia en valor absoluto entre sus medias muestrales 𝑌ത𝑖∗ − 𝑌ത𝑗∗ .
• Se rechaza la hipótesis 𝐻0 cuando:
1 1
𝑌ത𝑖∗ − 𝑌ത𝑗∗ > 𝑡𝛼/2,𝑁−𝑘 𝐶𝑀𝐸 + = 𝐿𝑆𝐷
𝑛𝑖 𝑛𝑗

Distribución T de Student con N – k Son el número de observaciones


grados de libertad que corresponden al error para los tratamientos i y j.
Método de la Diferencia Mínima
Significativa (LSD)
• Diferencia Mínima Significativa (LSD): es la diferencia mínima que debe
haber entre dos medias muestrales para considerar que dos tratamientos son
diferentes.
• Así, cada diferencia de medias muestrales en valor absoluto que sea mayor que
el número LSD se declara significativa, es decir, que las medias de los
tratamientos i y j son diferentes.
• Si el diseño es balanceado, la LSD se simplifica como:
2𝐶𝑀𝐸
𝐿𝑆𝐷 = 𝑡𝛼/2,𝑁−𝑘
𝑛

• El método LSD tiene una potencia importante, por lo que en ocasiones


declara significativas aun pequeñas diferencias.
Ejemplo 2.3… continuación

• Tomando en cuenta que con el ANOVA se rechazó la 𝐻0 : 𝜇1 = 𝜇2 = 𝜇4 = 𝜇4 y


se concluye que al menos un par de medias de los tratamientos (catalizadores) son
diferentes entre sí.

• Para determinar cuales pares de medias son estadísticamente diferentes se


prueban los posibles pares de hipótesis.

𝑘 𝑘–1 4(4−1)
• Primero se determinan la cantidad de pares de medias 2
= 2 = 6.
𝐻0 : 𝜇1 = 𝜇2 𝐻𝐴 : 𝜇1 ≠ 𝜇2 𝐻0 : 𝜇2 = 𝜇3 𝐻𝐴 : 𝜇2 ≠ 𝜇3
𝐻0 : 𝜇1 = 𝜇3 𝐻𝐴 : 𝜇1 ≠ 𝜇3 𝐻0 : 𝜇2 = 𝜇4 𝐻𝐴 : 𝜇2 ≠ 𝜇4
𝐻0 : 𝜇1 = 𝜇4 𝐻𝐴 : 𝜇1 ≠ 𝜇4 𝐻0 : 𝜇3 = 𝜇4 𝐻𝐴 : 𝜇3 ≠ 𝜇4
Ejemplo 2.3… continuación
Ejemplo 2.3… continuación
• En el ANOVA se observa que los grados de libertad del error son N – k = 12, y que el
cuadrado medio del error es CME = 2.88.

• Si usamos una significancia predefinida de 𝑎 = 0.05, de la tabla de la distribución T


de Student con 12 grados de libertad, se obtiene 𝑡0.025,12 = 2.18.

Hipótesis 𝑌ത𝑖∗ − 𝑌ത𝑗∗ LSD Decisión


𝐻0 : 𝜇1 = 𝜇2 𝐻𝐴 : 𝜇1 ≠ 𝜇2 1.12 2.48 No significativa
𝐻0 : 𝜇1 = 𝜇3 𝐻𝐴 : 𝜇1 ≠ 𝜇3 3.67 2.70 Significativa
𝐻0 : 𝜇1 = 𝜇4 𝐻𝐴 : 𝜇1 ≠ 𝜇4 5.78 2.48 Significativa
𝐻0 : 𝜇2 = 𝜇3 𝐻𝐴 : 𝜇2 ≠ 𝜇3 2.54 2.83 No significativa
𝐻0 : 𝜇2 = 𝜇4 𝐻𝐴 : 𝜇2 ≠ 𝜇4 4.65 2.62 Significativa
𝐻0 : 𝜇3 = 𝜇4 𝐻𝐴 : 𝜇3 ≠ 𝜇4 2.11 2.83 No significativa
SCRIPT EN R

• library (agricolae)
• LSD.test(Modelo,"Catalizador")

Tratamientos con la misma


letra no son significativamente
diferentes (p<0.05)
Minitab

• Estadísticas > ANOVA > Modelo lineal general > Comparaciones


Método de Tukey

• Consiste en comparar las diferencias entre medias muestrales con el


valor crítico dado por:

𝑞𝛼 (𝑘, 𝑁 − 𝑘) 1 1
𝑇𝛼 = 𝐶𝑀𝐸 +
2 𝑛𝑖 𝑛𝑗

• Donde el estadístico 𝑞𝛼 (𝑘, 𝑁 − 𝑘) son puntos porcentuales de la


distribución del rango estudentizado, que se obtienen de tablas.

• Se declaran significativamente diferentes los pares de medias cuya


diferencia muestral en valor absoluto sea mayor que 𝑇𝛼 .
Ejemplo 2.3… continuación
• En el ANOVA se observa que los grados de libertad del error son N – k = 12, y que el
cuadrado medio del error es CME = 2.88.

• Si usamos una significancia predefinida de 𝑎 = 0.05, de la tabla de rango


estudentizado se obtiene que 𝑞0.05 4,12 = 4.20.

Hipótesis 𝑌ത𝑖∗ − 𝑌ത𝑗∗ 𝑇𝛼 Decisión


𝐻0 : 𝜇1 = 𝜇2 𝐻𝐴 : 𝜇1 ≠ 𝜇2 1.12 3.38 No significativa
𝐻0 : 𝜇1 = 𝜇3 𝐻𝐴 : 𝜇1 ≠ 𝜇3 3.67 3.68 No significativa
𝐻0 : 𝜇1 = 𝜇4 𝐻𝐴 : 𝜇1 ≠ 𝜇4 5.78 3.38 Significativa
𝐻0 : 𝜇2 = 𝜇3 𝐻𝐴 : 𝜇2 ≠ 𝜇3 2.54 3.85 No significativa
𝐻0 : 𝜇2 = 𝜇4 𝐻𝐴 : 𝜇2 ≠ 𝜇4 4.65 4.36 Significativa
𝐻0 : 𝜇3 = 𝜇4 𝐻𝐴 : 𝜇3 ≠ 𝜇4 2.11 3.85 No significativa
SCRIPT EN R

Opción 1 Opción 2
• library (agricolae) • HSD.test(Modelo,"Catalizador")
• ModANOVA<-
aov(Concentracion~Catalizador)
• TukeyHSD(ModANOVA)

Tratamientos con la misma


letra no son significativamente
diferentes (p<0.05)
Minitab

• Estadísticas > ANOVA > Modelo lineal general > Comparaciones


Método de Tukey
Hipótesis 𝑌ത𝑖∗ − 𝑌ത𝑗∗ Decisión LSD Decisión Tukey
𝐻0 : 𝜇1 = 𝜇2 𝐻𝐴 : 𝜇1 ≠ 𝜇2 1.12 No significativa No significativa
𝐻0 : 𝜇1 = 𝜇3 𝐻𝐴 : 𝜇1 ≠ 𝜇3 3.67 Significativa No significativa
𝐻0 : 𝜇1 = 𝜇4 𝐻𝐴 : 𝜇1 ≠ 𝜇4 5.78 Significativa Significativa
𝐻0 : 𝜇2 = 𝜇3 𝐻𝐴 : 𝜇2 ≠ 𝜇3 2.54 No significativa No significativa
𝐻0 : 𝜇2 = 𝜇4 𝐻𝐴 : 𝜇2 ≠ 𝜇4 4.65 Significativa Significativa
𝐻0 : 𝜇3 = 𝜇4 𝐻𝐴 : 𝜇3 ≠ 𝜇4 2.11 No significativa No significativa

• Prueba de Tukey es menos potente que la prueba LSD, por lo que las pequeñas
diferencias no son detectadas como significativas.
• El riesgo de detectar una diferencia que no existe es menor con el método de Tukey.
• Cuando la diferencia entre dos tratamientos es clara, ambos métodos coinciden.
Verificación de los supuestos
del Modelo
• La validez de los resultados obtenidos en cualquier análisis de varianza es dependiente
a que los supuestos del modelo se cumplan.
• Estos supuestos son:
• Normalidad: la respuesta (Y ) se debe distribuir de manera normal.
• Varianza constante: igual varianza de los tratamientos.
• Independencia: las mediciones deben ser independientes.
• Es común utilizar la muestra de residuos para comprobar los supuestos del modelo, ya
que si los supuestos se cumplen, los residuos se pueden ver como una muestra
aleatoria de una distribución normal con media cero y varianza constante.
• Los Residuos son generados por la diferencia entre la respuesta observada y la
respuesta predicha por el modelo en cada prueba experimental.
Verificación de los supuestos
del Modelo
• Para comprobar cada supuesto existen pruebas analíticas y gráficas.

• Por sencillez, muchas veces se prefieren las pruebas gráficas.


• La desventaja es que no son “exactas”, pero aun así, en la mayoría de las
situaciones prácticas proporcionan la evidencia suficiente en contra o a favor
de los supuestos.

• Cuando uno o dos los puntos que se salen del comportamiento esperado de las
gráficas se puede tratar de un problema de puntos aberrantes, no de violación de
supuestos.

• Se puede utilizar una prueba analítica para subsanar las ambigüedades que surjan en
la interpretación visual (subjetiva) de las gráficas.
Verificación de los supuestos
del Modelo: Normalidad
• Un procedimiento gráfico para
verificar el cumplimiento del supuesto
de normalidad de los residuos consiste
en graficar los residuos en la gráfica
de probabilidad normal.

• Esta gráfica del tipo X-Y tiene las


escalas de tal manera que si los
residuos siguen una distribución
normal, al graficarlos tienden a quedar
alineados en una línea recta; por lo
tanto, si claramente no se alinean se
concluye que el supuesto de
normalidad no es correcto.
Verificación de los supuestos
del Modelo: Normalidad
• Existen varios métodos analíticos para contrastar
𝐻0 : 𝜀~𝑁 0, 𝜎 2
𝐻𝐴 : ε no se distribuye 𝑁 0, 𝜎 2

• Entre dichas pruebas se encuentran:


• La prueba de Anderson-Darling.
• La prueba de Shapiro-Wilks
• La ji-cuadrada para bondad de ajuste.
• La prueba de Kolmogorov–Smirnov
https://support.minitab.com/es-mx/minitab/18/help-
and-how-to/statistics/basic-statistics/supporting-
topics/normality/what-is-the-normal-distribution/
Prueba de Shapiro-Wilks

• Considerando una muestra aleatoria de datos 𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 que


proceden de cierta distribución desconocida. Se quiere verificar si
dichos datos fueron generados por un proceso normal, mediante las
hipótesis estadísticas:
𝐻0 : 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑝𝑟𝑜𝑐𝑒𝑑𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙.
𝐻𝐴 : 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜 𝑝𝑟𝑜𝑐𝑒𝑑𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙.
• Pasos para la prueba de Shapiro-Wilks son:
1. Se ordenan los datos de menor a mayor.
2. De la tabla dada en el apéndice para este procedimiento se
obtienen los coeficientes 𝑎1 , 𝑎2 , ⋯ , 𝑎𝑘 , donde 𝑘 es
aproximadamente 𝑛/2.
Prueba de Shapiro-Wilks

3. Se calcula el estadístico
2
𝑘
1
𝑊= ෍ 𝑎𝑖 𝑋(𝑛−𝑖+1) − 𝑋(𝑖)
(𝑛 − 1)𝑆 2
𝑖=1

Donde 𝑆 2 es la varianza muestral.

4. Por último, si el valor del estadístico es mayor que su valor crítico


al nivel a seleccionado en la tabla, se rechaza la normalidad de los
datos.
Ejemplo 2.3… continuación
• Dados los residuales del modelo (-3.133, -2.000,-1.275,-1.225,-1.125,-1.1
00,-0.475,0.300,0.525,0.575,0.967,1.225,1.300,1.500,1.775,2.167).

𝒊 𝒂𝒊 𝑿(𝒏−𝒊+𝟏) − 𝑿(𝒊) 𝒂𝒊 𝑿(𝒏−𝒊+𝟏) − 𝑿(𝒊)


1 0.5056 2.167 - -3.133 = 5.300 2.680
2 0.3290 1.775 - -2.00 = 3.775 1.242
3 0.2521 1.500 - -1.275 = 2.775 0.700
4 0.1988 1.300 - -1.225 = 2.525 0.502
5 0.1447 1.225 - -1.125 = 2.35 0.340
6 0.1005 0.967 - -1.100 = 2.067 0.208
7 0.0593 0.575 - -0.475 = 1.050 0.062
8 0.0196 0.525 - 0.300 = 0.225 0.004
Suma 5.738
Prueba de Shapiro-Wilks
Ejemplo 2.3… continuación
Considerando una 𝑆 2 =2.304, se calcula el estadístico:
2
𝑘
1 1 2
𝑊= ෍ 𝑎𝑖 𝑋(𝑛−𝑖+1) − 𝑋(𝑖) = 5.738
(𝑛 − 1)𝑆 2 16 − 1 2.304
𝑖=1
= 0.9525

Con el tamaño de muestra 𝑛 = 16, el valor critico esperado 𝑊16,0.05 = 0.887 por
lo que para un nivel de significancia de 0.05 no se rechaza 𝐻0 .

No se rechaza 𝑯𝟎 dado que 𝑾 es mayor que 𝑾𝒏,𝜶 , además el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 > 𝜶.


SCRIPT EN R

• qqPlot(residuals(Modelo))
• shapiro.test(residuals(Modelo • No se rechaza 𝑯𝟎 dado que
)) el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 > 𝜶, por lo que
se concluye que los
residuales se distribuyen de
manera normal.

https://rpubs.com/MSiguenas/122473
Minitab
Minitab
¿Qué hacer cuando los
datos no son normales?
TAREA 2
Investigar los métodos de transformación de datos
para normalizar, ejemplificar y obtener el código en
R.
Verificación de los supuestos del
Modelo: Varianza Constante
• Una forma de verificar el supuesto de varianza constante es
graficando los valores predichos por el modelo contra los residuos.

• Si los puntos en esta gráfica se distribuyen de manera aleatoria en


una banda horizontal entonces es señal de que se cumple el
supuesto.

• Si se distribuyen con algún patrón claro y contundente, entonces es señal de


que no se está cumpliendo el supuesto de varianza constante.

• Otra manera es la gráfica de niveles de factor contra residuos. Si se cumple


el supuesto de varianza constante, se espera que la amplitud de la dispersión
de los puntos en cada nivel de factor tenderá a ser similar; y no se cumplirá
el supuesto si hay diferencias fuertes en esta amplitud.
Verificación de los supuestos del
Modelo: Varianza Constante

Ejemplos de gráficas de residuos donde no


se cumple el supuesto de varianza
constante.
Prueba de Bartlett

• Supongamos que se tienen 𝑘 poblaciones o tratamientos independientes, cada uno


con distribución normal 𝑁 𝜇𝑖 , 𝜎 2 , 𝑖 = 1,2, … , 𝑘 , donde las varianzas son
desconocidas.

• Se quiere probar la hipótesis de igualdad de varianzas:


𝐻0 : 𝜎12 = 𝜎22 = ⋯ = 𝜎𝑘2 = 𝜎 2
𝐻𝐴 : 𝜎𝑖2 ≠ 𝜎𝑗2 para algun 𝑖 ≠ 𝑗

• Bajo la hipótesis nula de igualdad de varianza, el estadístico 𝑋02 sigue una


distribución ji-cuadrada con 𝑘 – 1 grados de libertad, por lo que se rechaza 𝐻0
2
cuando 𝑋02 es más grande que 𝑋(𝛼,𝑘−1) .
Prueba de Bartlett

• El estadístico de prueba para la hipótesis está dado por:


𝑞
𝑋02 = 2.3026
𝑐
• Donde:
𝑘
𝑞 = 𝑁−𝑘 𝑙𝑜𝑔10 𝑆𝑝2 −෍ (𝑛𝑖 − 1) 𝑙𝑜𝑔10 𝑆𝑖2
𝑖=1
1 𝑘
𝑐 =1+ ෍ (𝑛𝑖 − 1)−1 −(𝑁 − 𝑘)−1
3(𝑘 − 1) 𝑖=1
𝑘 2
σ𝑖=1(𝑛 𝑖 − 1)𝑆𝑖
𝑆𝑝2 =
𝑁−𝑘
Ejemplo 2.3… continuación

• bartlett.test (residuals(Modelo), • No se rechaza 𝑯𝟎 dado que el


Catalizador) 𝒗𝒂𝒍𝒐𝒓 − 𝒑 > 𝜶, por lo que se
concluye que los tratamientos
presentan varianza constante.

https://rpubs.com/Joaquin_AR/218466
Ejemplo 2.3… continuación
Ejemplo 2.3… continuación
Verificación de los supuestos del
Modelo: Independencia
• La suposición de independencia puede verificarse si se grafica el orden en que se
colectó un dato contra el residuo correspondiente.

• Si al graficar se detecta una tendencia o patrón no aleatorio claramente definido, esto es


evidencia de que existe una correlación entre los errores y, por lo tanto, el supuesto de
independencia no se cumple.

• Si el comportamiento de los puntos es aleatorio dentro de una banda horizontal, el supuesto


se está cumpliendo.
Verificación de los supuestos del
Modelo: Independencia
• La violación de este supuesto generalmente indica deficiencias en la
planeación y ejecución del experimento.
• Puede ser un indicador de que no se aplicó en forma correcta el principio
de aleatorización.
• O conforme se fueron realizando las pruebas experimentales aparecieron
factores que afectaron la respuesta observada.
• En lo tanto las conclusiones que se obtienen del análisis son endebles, por ello es
mejor revisar lo hecho y tratar de investigar por qué no se cumplió con ese
supuesto de independencia, a fin de reconsiderar la situación.
Prueba de Durbin – Watson

• Esta prueba permite diagnosticar la presencia de autocorrelación entre los


residuos consecutivos (ordenados en el tiempo), la cual es una posible
manifestación de la falta de independencia.
• La autocorrelación se presenta en experimentos en los cuales cada medición
tiene alguna contaminación de la medición inmediata anterior.
Prueba de Durbin – Watson

• Sea 𝜌 el parámetro que representa la correlación entre residuos consecutivos


𝐶𝑜𝑟𝑟 𝑒𝑡 , 𝑒𝑡−1 = 𝜌; 𝑡 = 2,3, … , 𝑛 . La hipótesis en la prueba de Durbin-
Watson es:
𝐻0 : 𝜌 = 0
𝐻𝐴 : 𝜌 > 0
• El estadístico de Durbin-Watson es:
σ𝑛𝑡=2 𝑒𝑡 − 𝑒𝑡−1 2
𝑑=
σ𝑛𝑡=1 𝑒𝑡 2
• La decisión sobre la hipótesis, consiste en:
• Si 𝑑 < 𝑑𝐿 Se rechaza 𝐻0
• Si 𝑑 < 𝑑𝑈 No se rechaza 𝐻0 .
• Si𝑑𝐿 < 𝑑 < 𝑑𝑈 Sin decisión
Ejemplo 2.3… continuación

• dwtest(Modelo)
• Box.test(residuals(Modelo))
Verificación de los supuestos del
Modelo
• Cuando no se pueden cumplir las condiciones de normalidad o
de independencia de los datos.

• Uno se tiene que remitir a la pruebas no paramétricas.

• Éstas no requieren de estas suposiciones.


Diseño de Bloques
Completamente al Azar
(DBCA)
Diseño de Bloques
Completamente al Azar

• Cuando se quieren comparar ciertos tratamientos o estudiar el efecto


de un factor, es deseable que las posibles diferencias se deban
principalmente al factor de interés y no a otros factores que no se
consideran en el estudio.

• Cuando esto no ocurre y existen otros factores que no se controlan o


nulifican para hacer la comparación, las conclusiones podrían ser
afectadas.
Problema

Un operador más hábil puede hacer ver


a su máquina (aunque ésta sea la peor)
como la que tiene el mejor desempeño

Solución
Diseño de Bloques
Completamente al Azar
• Soluciones:
• Utilizar el mismo operador en las cuatro máquinas.
• Cada operador trabaje durante el experimento con cada una de las
máquinas.
• Esta estrategia es la más recomendable, ya que al utilizar a
todos los operadores con todas las máquinas permite tener
resultados de la comparación que son válidos para todos los
operadores.
• Esta forma de anular el efecto de operadores, recibe el nombre
de bloqueo.
Diseño de Bloques
Completamente al Azar
• En un DBCA se consideran tres fuentes de variabilidad:
• El factor de tratamientos
• El factor de bloque.
• El error aleatorio
• La aleatorización se hace dentro de cada bloque; por lo tanto, no
se realiza de manera total como en el DCA.

• Factor de Bloque: son las variables adicionales al factor de interés que


se incorporan de manera explícita en un experimento para no sesgar la
comparación.
Diseño de Bloques
Completamente al Azar
• Los factores de bloque tienen la particularidad de que no se incluyen en
el experimento porque interese analizar su efecto, sino como un medio
para estudiar de manera adecuada y eficaz al factor de interés.

• Ejemplo… continuación: La inclusión de los operadores es un medio y no


un fin para lograr una comparación adecuada y eficaz de las máquinas.

• Los factores de bloqueo que aparecen en la práctica son: turno, lote, día,
tipo de material, línea de producción, operador, máquina, método, etc.

• No se trata de caer en el extremo de querer controlarlo todo, sino básicamente


aquellos factores que por conocimiento del proceso o se sabe que afectan en
forma considerable el resultado de la comparación.
Diseño de Bloques
Completamente al Azar
• Se divide el material experimental en tantos
bloques como números de replicaciones a
utilizar.

• Cada bloque constituye una replicación


(repetición).

• Cada bloque es luego dividido en tantas UE


como tratamientos haya en estudio.

• Todos los tratamientos deben aparecer una vez


en cada replicación, la aleatorización se hace en
cada bloque.
Diseño de Bloques
Completamente al Azar
Ventajas Desventajas
• Puede proveer resultados más • Las observaciones faltantes dentro
precisos que un DCA del mismo de un bloque requiere cálculos más
tamaño si los agrupamientos son complejos.
efectivos.
• Los grados de libertad para el error
experimental no son tantos como en
el DCA.
• Sirve para cualquier número de
tratamientos y replicaciones. • Se requieran más supuestos
estadísticos para el modelo.

• Pueden existir bloques incompletos.


Diseño de Bloques
Completamente al Azar
• Supuestos:
• Los errores se distribuyen de manera normal con
media cero y varianza constante 𝜎 2 𝑁 0, 𝜎 2 .
• Existe independencia entre tratamientos.
• Homocedasticidad de varianzas
• No existe interacción entre tratamientos y bloques.
Diseño de Bloques
Completamente al Azar
• El modelo estadístico está dado por:
𝑖 = 1,2, … , 𝑘
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝛾𝑗 + 𝜀𝑖𝑗 ;
𝑗 = 1,2, … , 𝑏 Bloque
Tratamiento (𝑗 = 1,2, … , 𝑏)
• Donde: (𝑖 = 1,2, … , 𝑘)
𝜸𝟏 𝜸𝟐 𝜸𝒃
• 𝑌𝑖𝑗 corresponde a la medición al 𝝉𝟏 𝑌11 𝑌12 ⋯ 𝑌1𝑏
tratamiento 𝑖 y al bloque 𝑗.
𝝉𝟐 𝑌21 𝑌22 ⋯ 𝑌2𝑏
• 𝜇 es la media global poblacional.
⋮ ⋮ ⋮ ⋯ ⋮
• 𝜏𝑖 es el efecto debido al tratamiento 𝑖.
𝝉𝒌 𝑌𝑘1 𝑌𝑘2 ⋯ 𝑌𝑘𝑏
• 𝛾𝑗 es el efecto debido al bloque 𝑗
• 𝜀𝑖𝑗 es el error aleatorio.
Diseño de Bloques
Completamente al Azar
• El objetivo es probar el juego de hipótesis:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇 ∶ 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 = 0
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗 ∶ 𝜏𝑖 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑖

• La variabilidad esta representada por:


𝑆𝐶𝑇 = 𝑆𝐶𝑇𝑟𝑎 + 𝑆𝐶𝐵 + 𝑆𝐶𝐸
2
𝑆𝐶𝑇 = σ𝑏𝑗=1 σ𝑘𝑖=1 𝑌𝑖𝑗 − 𝑌ത∗∗ 𝑆𝐶𝑇𝑟𝑎 = 𝑏 σ𝑘𝑖=1 𝑌ത𝑖∗ − 𝑌ത∗∗ 2

2 2
𝑆𝐶𝐵 = 𝑘 σ𝑏𝑗=1 𝑌ത∗𝑗 − 𝑌ത∗∗ 𝑆𝐶𝐸 = σ𝑘𝑖=1 σ𝑏𝑗=1 𝑌𝑖𝑗 − 𝑌ത𝑖∗ − 𝑌ത𝑗∗ + 𝑌ത∗∗
Diseño de Bloques
Completamente al Azar
• Análisis de Varianza
Fuente de Suma de Grados de
Cuadrado Medio 𝑭𝟎 Valor-p
Variación Cuadrados Libertad
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 𝑘−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘−1 𝐶𝑀𝐸
𝑆𝐶𝐵 𝐶𝑀𝐵 𝑃(𝐹 > 𝐹0 )
Bloque 𝑆𝐶𝐵 𝑏−1 𝐶𝑀𝐵 =
𝑏−1 𝐶𝑀𝐸
𝑆𝐶𝐸
Error 𝑆𝐶𝐸 (𝑘 − 1)(𝑏 − 1) 𝐶𝑀𝐸 =
(𝑘 − 1)(𝑏 − 1)
Total 𝑆𝐶𝑇 𝑘𝑏 − 1

Para un nivel de significancia 𝛼:


•Se rechaza 𝑯𝟎 si 𝑭𝟎 > 𝑭𝜶,𝒌−𝟏,𝑵−𝒌 , donde 𝐹𝛼,𝑘−1,𝑁−𝑘 es el percentil (1 – 𝛼) × 100 de la
distribución 𝐹.
•Se rechaza 𝑯𝟎 si el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶, donde el 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 𝑃(𝐹 > 𝐹0 ).
Ejemplo 2.4

• Los siguientes datos corresponden al porcentaje de


aditivos, medidos por 5 analistas en 3 marcas distintas
de mermelada de fresa, A, B y C.

¿Cuál es el factor de tratamiento y cuál el


factor de bloque?
Ejemplo 2.4
Bloque Total por Media por
Tratamiento
tratamiento tratamiento
(Marca) Analista 1 Analista 2 Analista 3 Analista 4 Analista 5 ഥ 𝒊∗
𝒀𝒊∗ 𝒀
A 3.8 1.6 2.7 1.7 2.0 𝑌1∗ =
𝑌1∗11.8 𝑌ത1∗ 𝑌ത1∗2.36
=
B 2.7 5.2 2.8 1.9 4.8 𝑌2∗ =
𝑌2∗17.4 𝑌ത2∗ 𝑌ത2∗3.48
=
C 3.6 7.5 6.4 2.6 8.1 𝑌3∗ =
𝑌3∗28.2 𝑌ത3∗ =
𝑌ത3∗5.64
Total por
𝑌∗1 =
𝑌∗110.1 𝑌∗2 =
𝑌∗214.3 𝑌∗3 =
𝑌∗311.9 𝑌∗4 𝑌=
∗4 6.2 𝑌∗5 =
𝑌∗514.9 𝑌∗∗ =
𝑌∗∗57.4
bloque 𝒀∗𝒋
Media por
ഥ ∗𝒋 𝑌ത∗1 =
𝑌ത∗13.37 𝑌ത∗2 =
𝑌ത∗24.77 𝑌ത∗3 =
𝑌ത∗33.97 𝑌ത∗4 =
𝑌ത∗42.07 𝑌ത∗5 =
𝑌ത∗54.97 𝑌ത∗∗ =
𝑌ത∗∗3.82
bloque 𝒀
Ejemplo 2.4
ഥ ∗∗ 𝟐 , 𝑺𝑪𝑻𝒓𝒂 = 𝒃 σ𝒌𝒊=𝟏 𝒀
• Si 𝑺𝑪𝑻 = σ𝒃𝒋=𝟏 σ𝒌𝒊=𝟏 𝒀𝒊𝒋 − 𝒀 ഥ 𝒊∗ − 𝒀
ഥ ∗∗ 𝟐

𝟐
• 𝑺𝑪𝑩 = 𝒌 σ𝒃𝒋=𝟏 𝒀
ഥ ∗𝒋 − 𝒀
ഥ ∗∗
Bloque ഥ𝒊∗ − 𝒀
𝒀 ഥ∗∗ 𝟐
ഥ𝒊∗ 𝟐
Tra 𝒀𝒊∗ 𝒀 ഥ ∗∗
𝒀 𝒊𝒋 − 𝒀
1 2 3 4 5
A 3.8 1.6 2.7 1.7 2.0 11.8 2.36 0.00 4.96 1.27 4.52 3.34 2.15
B 2.7 5.2 2.8 1.9 4.8 17.4 3.48 1.27 1.89 1.05 3.71 0.95 0.12
C 3.6 7.5 6.4 2.6 8.1 28.2 5.64 0.05 13.49 6.62 1.50 18.26 3.29
𝒀∗𝒋 𝟏𝟎. 𝟏 𝟏𝟒. 𝟑 𝟏𝟏. 𝟗 𝟔. 𝟐 𝟏𝟒. 𝟗 𝟓𝟕. 𝟒 Suma 1.32 20.34 8.95 9.74 22.55
ഥ∗𝒋
𝒀 𝟑. 𝟑𝟕 𝟒. 𝟕𝟕 𝟑. 𝟗𝟕 𝟐. 𝟎𝟕 𝟒. 𝟗𝟕 𝟑. 𝟖𝟐
𝟐
ഥ∗𝒋 − 𝒀
𝒀 ഥ ∗∗
0.21 0.88 0.02 3.10 1.30
𝟐
• 𝑺𝑪𝑻 = σ𝒃𝒋=𝟏 σ𝒌𝒊=𝟏 𝒀𝒊𝒋 − 𝒀
ഥ∗∗ = 𝟏. 𝟑𝟐 + 𝟐𝟎. 𝟑𝟒 + 𝟖. 𝟗𝟓 + 𝟗. 𝟕𝟒 + 𝟐𝟐. 𝟓𝟓 = 𝟔𝟐. 𝟖𝟗
• 𝑺𝑪𝑻𝒓𝒂 = 𝒃 σ𝒌𝒊=𝟏 𝒀
ഥ 𝒊∗ − 𝒀
ഥ∗∗ 𝟐
= 𝟓 𝟐. 𝟏𝟓 + 𝟎. 𝟏𝟐 + 𝟑. 𝟐𝟗 = 𝟐𝟕. 𝟖𝟎
𝟐
• 𝑺𝑪𝑩 = 𝒌 σ𝒃𝒋=𝟏 𝒀 ഥ ∗𝒋 − 𝒀
ഥ∗∗ = 𝟑 𝟑. 𝟑𝟕 + 𝟒. 𝟕𝟕 + 𝟑. 𝟗𝟕 + 𝟐. 𝟎𝟕 + 𝟒. 𝟗𝟕 = 𝟏𝟔. 𝟓𝟒
• Por lo tanto: 𝑺𝑪𝑬 = 𝟔𝟐. 𝟖𝟗 − 𝟐𝟕. 𝟖𝟎 − 𝟏𝟔. 𝟓𝟒 = 𝟏𝟖. 𝟓𝟔
Ejemplo 2.4
Fuente de Suma de
Grados de Libertad Cuadrado Medio 𝑭𝟎 Valor-p
Variación Cuadrados
𝑆𝐶𝑇𝑟𝑎
𝐶𝑀𝑇𝑟𝑎 = 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 = 27.80 𝑘−1=2 𝑘−1 = 𝟓. 𝟗𝟗 0.026
= 13.90 𝐶𝑀𝐸
𝑆𝐶𝐵 𝐶𝑀𝐵
Bloque 𝑆𝐶𝐵 = 16.54 𝑏−1=4 𝐶𝑀𝐵 = = 4.13 = 1.78 0.226
𝑏−1 𝐶𝑀𝐸
𝑆𝐶𝐸
𝐶𝑀𝐸 =
Error 𝑆𝐶𝐸 = 18.56 𝑘−1 𝑏−1 =8 (𝑘 − 1)(𝑏 − 1)
= 2.32
Total 𝑆𝐶𝑇 = 62.89 𝑘𝑏 − 1 = 14

Para un nivel de significancia 𝛼 = 0.05:

•Se rechaza 𝑯𝟎 dado que 𝑭𝟎 = 𝟓. 𝟗𝟗 > 𝑭𝟎.𝟎𝟓,𝟑,𝟏𝟐 = 𝟒. 𝟒𝟔 y el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶.

•Se concluye que sí hay diferencia o efecto de las marcas en cuanto al porcentaje de aditivos.

•En caso de resultar significativo el efecto de los bloques, implica que tiene e influencia sobre la variable de
respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta. Si no se rechaza la 𝐻0 , entonces se
tiene el argumento a favor de no controlar este factor en futuros experimentos sobre esta misma respuesta.
Script en R

• Bloque <- factor(rep(1:5, 1.7,1.9,2.6,2,4.8,8.1)


each=3)) • Datos<-
• Tratamiento <- data.frame(Bloque,Tratamiento,A
c("A","B","C","A","B","C","A"," ditivo)
B","C","A","B","C","A","B","C") • Modelo <- lm(Aditivo ~ Bloque
• Aditivo<- + Tratamiento, Datos)
c(3.8,2.7,3.6,1.6,5.2,7.5,2.7,2.8,6.4, • anova(Modelo)
Minitab

• Stat > ANOVA > Balanced ANOVA


Minitab
Excel

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Filas 27.797 2 13.899 5.992 0.026 4.459
Columnas 16.536 4 4.134 1.782 0.226 3.838
Error 18.556 8 2.320
Total 62.889 14
Ejemplo 2.4
¿Cuál es el tratamiento ganador?
Ejemplo 2.4

Verificación de Supuestos

No se rechazan las
𝑯𝟎 : 𝜺~𝑵 𝟎, 𝝈𝟐 ,
𝑯𝟎 : 𝝈𝟐𝟏 = 𝝈𝟐𝟐 = ⋯ = 𝝈𝟐𝒌 = 𝝈𝟐
𝑯𝟎 : 𝝆 = 𝟎
Por lo tanto se cumplen los
supuestos
Ejemplo 2.5

• Se hace un estudio sobre la efectividad de tres marcas de atomizador para


matar moscas.
• Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el
número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas,
pero en días diferentes; por ello, se sospecha que puede haber algún efecto
importante debido a esta fuente de variación.

¿Cuál es el factor de tratamiento y cuál el


factor de bloque?
¿Hay diferencia entre las marcas?
¿La cantidad de moscas de un día a otro es
diferente?
Ejemplo 2.5

Para un nivel de significancia 𝛼 = 0.05:

•No se rechaza 𝑯𝟎 dado que 𝑭𝟎 = 𝟑. 𝟒𝟐𝟏𝟏 < 𝑭𝟎.𝟎𝟓,𝟐,𝟏𝟎 = 𝟒. 𝟏𝟎 y el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 > 𝜶.

•Se concluye que no hay diferencia o efecto de las marcas en cuanto a la cantidad de moscas
muertas.
Diseños de Bloques
Incompletos Balanceados
(DBIB)
Diseños de Bloques Incompletos
Balanceados
• Cuando se construye un diseño de bloques al azar, puede suceder que
no sea posible realizar todos los tratamientos en cada bloque.

• En estos casos es posible usar diseños en bloques al azar en los que


cada tratamiento no está presente en cada bloque.

• Estos diseño reciben el nombre de diseño de bloques incompletos.

• Hay varios tipos de diseños en bloques incompletos, uno de los más


utilizados el diseño de bloques incompletos balanceado.
Diseños de Bloques Incompletos
Balanceados
• El modelo estadístico es el mismo que en el Diseño de Bloques Completamente
al Azar:
𝑖 = 1,2, … , 𝑘
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝛾𝑗 + 𝜀𝑖𝑗 ;
𝑗 = 1,2, … , 𝑏
• Donde:
• 𝑌𝑖𝑗 corresponde a la medición al tratamiento 𝑖 y al bloque 𝑗, 𝜇 es la media
global poblacional, 𝜏𝑖 es el efecto debido al tratamiento 𝑖, 𝛾𝑗 es el efecto
debido al bloque 𝑗 y 𝜀𝑖𝑗 es el error aleatorio.
• El objetivo es probar el juego de hipótesis:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇 ∶ 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 = 0
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔𝑢𝑛 𝑖 ≠ 𝑗 ∶ 𝜏𝑖 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑖
Diseños de Bloques Incompletos
Balanceados
• Además:
• 𝑟 número de veces que cada tratamiento se presenta en el diseño, es decir el
número de replicas de un tratamiento.
• 𝜆 número de bloques en los que un par de tratamientos ocurren juntos.
poblacional.
• 𝑞 número de tratamientos por bloque.
Se debe de cumplir:
• 𝑁 = 𝑟𝑘 = 𝑏𝑞
𝑞−1
• 𝜆 = 𝑟 𝑘−1
• 𝑗≥𝑖
Diseños de Bloques Incompletos
Balanceados
• La variabilidad se descompone en:
𝑆𝐶𝑇 = 𝑺𝑪𝑻𝒓𝒂∗ + 𝑆𝐶𝐵 + 𝑆𝐶𝐸
2 2
𝑆𝐶𝑇 = σ𝑏𝑗=1 σ𝑘𝑖=1 𝑌𝑖𝑗 − 𝑌ത∗∗ 𝑆𝐶𝐵 = 𝑘 σ𝑏𝑗=1 𝑌ത∗𝑗 − 𝑌ത∗∗
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑺𝑪𝑻𝒓𝒂∗ + 𝑆𝐶𝐵
𝑞 σ𝑘𝑖=1 𝑇𝑖2
𝑺𝑪𝑻𝒓𝒂∗ =
𝜆𝑘
Siendo
1 1 𝑠𝑖 𝑒𝑙 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑖 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑒𝑙 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗
𝑇𝑖 = 𝑦𝑖∗ − 𝑞 σ𝑏𝑗=1 𝑛𝑖𝑗 𝑦∗𝑗 𝑛𝑖𝑗
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Diseños de Bloques Incompletos
Balanceados
• Análisis de Varianza
Fuente de Suma de Grados de
Cuadrado Medio 𝑭𝟎 Valor-p
Variación Cuadrados Libertad
Tratamientos ∗ 𝑆𝐶𝑇𝑟𝑎∗ 𝐶𝑀𝑇𝑟𝑎∗
𝑆𝐶𝑇𝑟𝑎 𝑘−1 ∗
𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
(ajustados) 𝑘−1 𝐶𝑀𝐸
𝑆𝐶𝐵
Bloque 𝑆𝐶𝐵 𝑏−1 𝐶𝑀𝐵 =
𝑏−1
𝑆𝐶𝐸
Error 𝑆𝐶𝐸 𝑁−𝑘−𝑏+1 𝐶𝑀𝐸 =
𝑁−𝑘−𝑏+1
Total 𝑆𝐶𝑇 𝑁−1

Para un nivel de significancia 𝛼:


•Se rechaza 𝑯𝟎 si 𝑭𝟎 > 𝑭𝜶,𝒌−𝟏,𝑵−𝒌 , donde 𝐹𝛼,𝑘−1,𝑁−𝑘 es el percentil (1 – 𝛼) × 100 de la
distribución 𝐹.
•Se rechaza 𝑯𝟎 si el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶, donde el 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 𝑃(𝐹 > 𝐹0 ).
Ejemplo 2.6
• Supóngase que un ingeniero químico cree que el tiempo de reacción en un proceso
químico es función del catalizador empleado. De hecho 4 catalizadores están siendo
investigados.
• El procedimiento experimental consiste en seleccionar un lote de materia prima,
cargar una planta piloto, aplicar cada catalizador a ensayos separados de dicha planta
y observar el tiempo de reacción.
• Debido a que las variaciones en los lotes de materia prima pueden afectar el
comportamiento del catalizador, el ingeniero Tratamiento
decide controlar este factor Bloque
por medio
de bloques. (Catalizador) Lote 1 Lote 2 Lote 3 Lote 4
• Sin embargo, cada lote es lo suficientemente 1 73 74 - 71
grande para permitir el ensayo de 3
2 - 75 67 72
catalizadores únicamente.
3 73 75 68 -
4 75 - 72 75
Script en R

• library(agricolae)
• Blo<-factor(rep(1:4, each=3))
• Tra<-factor(c(1,3,4,1,2,3,2,3,4,1,2,4))
• Tiempo<-c(73,73,75,74,75,75,67,68,72,71,72,75)
• modelo<-BIB.test(Blo,Tra,Tiempo,test="lsd", group=TRUE, console=TRUE)
Diseño de Cuadro
Latino
(DCL)
Diseño de Cuadro Latino
• Diseño en el que se controlan dos factores de bloque y uno de tratamientos con la
misma cantidad de niveles.
• Los tratamientos se representan por letras latinas y se distribuyen en forma adecuada en
un cuadro.
• Existen cuatro fuentes de variabilidad que pueden afectar la respuesta observada:
• Los tratamientos.
• El factor de bloque I (columnas).
• El factor de bloque II (renglones).
• El error aleatorio.
• Sean 𝐴, 𝐵, 𝐶, … , 𝐾, los 𝑘 tratamientos a comparar, por tanto ambos factores de bloques
tienen 𝑘 bloques cada uno.
Diseño de Cuadro Latino

• En general, un cuadrado latino


para 𝑘 factores, o cuadro latino
𝑘 ∗ 𝑘, es un cuadrado con 𝑘
renglones y 𝑘 columnas.

• Algunos ejemplos de
cuadrados latinos son:

Apéndice 8A. Selección de cuadrados latinos (Kuehl, 2000)


Diseño de Cuadro Latino
• El modelo estadístico está dado por:
𝑖 = 1,2, … , 𝑘
𝑌𝑖𝑗𝑙 = 𝜇 + 𝜏𝑖 + 𝛾𝑗 + 𝛿𝑙 + 𝜀𝑖𝑗𝑙 ; 𝑗 = 1,2, … , 𝑘
𝑙 = 1,2, … , 𝑘
Donde:
Bloque I • 𝑌𝑖𝑗 corresponde a la medición al
Bloque II (𝑗 = 1,2, … , 𝑘)
(𝒍 = 1,2, … , 𝑘)
tratamiento 𝑖, al bloque 𝑗 y
𝜸𝟏 𝜸𝟐 𝜸𝟑 ⋯ 𝜸𝒌 bloque 𝑙.
• 𝜇 es la media global poblacional.
𝛿1 𝐴 = 𝑌111 𝐵 = 𝑌2,2,1 𝐶 = 𝑌3,3,1 ⋯ 𝐾 = 𝑌𝑘,𝑘,1
• 𝜏𝑖 es el efecto debido al
𝛿2 𝐵 = 𝑌212 𝐶 = 𝑌3,2,2 𝐷 = 𝑌4,3,2 ⋯ 𝐴 = 𝑌1,𝑘,2 tratamiento 𝑖.
• 𝛾𝑗 es el efecto del bloque I.
⋮ ⋮ ⋮ ⋯ ⋮
• 𝛿𝑙 es el efecto del bloque II.
𝛿𝑘 𝐾 = 𝑌𝑘,1,𝑘 𝐴 = 𝑌1,2,𝑘 𝐵 = 𝑌2,3,𝑘 ⋯ 𝐽 = 𝑌𝑘−1,𝑘,𝑘 • 𝜀𝑖𝑗 es el error aleatorio.
Diseño de Cuadro Latino

• El objetivo es probar el juego de hipótesis:


𝑯𝟎 : 𝝁𝟏 = 𝝁𝟐 = ⋯ = 𝝁𝒌 = 𝝁 ∶ 𝝉𝟏 = 𝝉𝟐 = ⋯ = 𝝉𝒌 = 𝟎
𝑯𝑨 : 𝝁𝒊 ≠ 𝝁𝒋 𝒑𝒂𝒓𝒂 𝒂𝒍𝒈𝒖𝒏 𝒊 ≠ 𝒋 ∶ 𝝉𝒊 ≠ 𝟎 𝒑𝒂𝒓𝒂 𝒂𝒍 𝒎𝒆𝒏𝒐𝒔 𝒖𝒏 𝒊

𝐻0 : 𝛾1 = 𝛾2 = ⋯ = 𝛾𝑘 = 0
𝐻𝐴 : : 𝛾𝑗 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑗

𝐻0 : 𝛿1 = 𝛿2 = ⋯ = 𝛿𝑘 = 0
𝐻𝐴 : 𝛿𝑙 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑙
• Analís de Varianza

Fuente de Grados de
Suma de Cuadrados Cuadrado Medio 𝑭𝟎 Valor-p
Variación Libertad
𝑘
𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 = 𝑘 ෍ 𝑌ത𝑖∗∗ − 𝑌ത∗∗∗ 2 𝑘−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘−1 𝐶𝑀𝐸
𝑖=1
𝑏
Bloque I 2 𝑆𝐶𝐵1 𝐶𝑀𝐵1 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵1 = 𝑘 ෍ 𝑌ത∗𝑗∗ − 𝑌ത∗∗∗ 𝑘−1 𝐶𝑀𝐵1 =
(columnas) 𝑘−1 𝐶𝑀𝐸
𝑗=1

𝑘
Bloque II 𝑆𝐶𝐵2 𝐶𝑀𝐵2 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵2 = 𝑘 ෍ 𝑌ത∗∗𝑙 − 𝑌ത∗∗∗ 2 𝑘−1 𝐶𝑀𝐵2 =
(renglones) 𝑘−1 𝐶𝑀𝐸
𝑗=1

𝑆𝐶𝐸 𝑆𝐶𝐸
Error = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 − 𝑆𝐶𝐵1 (𝑘 − 1)(𝑘 − 2) 𝐶𝑀𝐸 =
(𝑘 − 1)(𝑘 − 2)
− 𝑆𝐶𝐵2
𝑘 𝑘
2
Total ෍ ෍ 𝑌𝑖𝑗𝑙 − 𝑌ത∗∗∗ 𝑘2 − 1
𝑙=1 𝑗=1

Para un nivel de significancia 𝛼:


•Se rechaza 𝑯𝟎 si 𝑭𝟎 > 𝑭𝜶,𝒌−𝟏,(𝑘−1)(𝑘−2) , además el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶.
Ejemplo 2.7

• Se estudia el efecto de cinco ingredientes diferentes (A, B, C, D y E) sobre el


tiempo de reacción de un proceso químico.

• Cada lote de material nuevo sólo alcanza para permitir la realización de cinco
corridas. Además, cada corrida requiere aproximadamente 1.5 horas, por lo
que sólo pueden realizarse cinco corridas en un día.

• El experimentador decide realizar el experimento como un cuadrado latino


para que los efectos del día y el lote puedan controlarse sistemáticamente.
Ejemplo 2.7
Bloque II Bloque I (Día)
𝒀∗∗𝒍 ഥ ∗∗𝒍
𝒀 𝒀𝒊∗∗ ഥ 𝒊∗∗
𝒀
(Lote) 1 2 3 4 5
1 A=8 B=7 D=1 C=7 E=3 26 5.2 𝒀𝑨∗∗
𝒀𝑨∗∗
= 𝟒𝟐 8.4
2 C=11 E=2 A=7 D=3 B=8 31 6.2 𝒀𝑩∗∗
𝒀𝑩∗∗
= 𝟐𝟖 5.6
3 B=4 A=9 C=10 E=1 D=5 29 5.8 𝒀𝑪∗∗
𝒀𝑪∗∗
= 𝟒𝟒 8.8
4 D=6 C=8 E=6 B=6 A=10 36 7.2 𝒀𝑫∗∗
𝒀𝑫∗∗
= 𝟏𝟕 3.4
5 E=4 D=2 B=3 A=8 C=8 25 5.0 𝒀𝑬∗∗
𝒀𝑬∗∗
= 𝟏𝟔 3.2
𝒀∗𝒋∗ 33 28 27 25 34 147
ഥ ∗𝒋∗
𝒀 6.6 5.6 5.4 5.0 6.8 5.88

2
• 𝑺𝑪𝑻 = σ𝑘𝑙=1 σ𝑘𝑗=1 𝑌𝑖𝑗𝑙 − 𝑌∗∗∗
ҧ = (8 − 5.88)2 +(11 − 5.88)2 + ⋯ + 8 − 5.88 2
= 𝟐𝟎𝟔. 𝟔𝟒

• 𝑺𝑪𝑻𝒓𝒂 = k σki=1 Yതi∗∗ − Yത∗∗∗ 2


= 5 (8.4 − 5.88)2 +(5.6 − 5.88)2 +(8.8 − 5.88)2 +(3.4 − 5.88)2 +(3.2 − 5.88)2 = 𝟏𝟒𝟏. 𝟒𝟒

2
• 𝑺𝑪𝑩1 = k σbj=1 Yത∗j∗ − Yത∗∗∗ = 5 (6.6 − 5.88)2 +(5.6 − 5.88)2 +(5.4 − 5.88)2 +(5.0 − 5.88)2 +(6.8 − 5.88)2 = 𝟏𝟐. 𝟐𝟒

• 𝑺𝑪𝑩2 = k σkj=1 Yത∗∗l − Yത∗∗∗ 2


= 5 (5.2 − 5.88)2 +(6.2 − 5.88)2 +(5.8 − 5.88)2 +(7.2 − 5.88)2 +(5.0 − 5.88)2 = 𝟏𝟓. 𝟒𝟒

• Por lo tanto: 𝑺𝑪𝑬 = 206.64 − 141.44 − 12.24 − 𝟏𝟓. 𝟒𝟒 = 𝟑𝟕. 𝟓𝟐


Ejemplo 2.7
Fuente de
Suma de Cuadrados Grados de Libertad Cuadrado Medio 𝑭𝟎 Valor-p
Variación

Tratamientos 𝑆𝐶𝑇𝑟𝑎 = 141.44 𝑘−1=4 𝐶𝑀𝑇𝑟𝑎 = 35.36 11.31 0.0005

Bloque I
𝑆𝐶𝐵1 = 12.24 𝑘−1=4 𝐶𝑀𝐵1 = 3.06 0.98 0.4550
(Día)
Bloque II
𝑆𝐶𝐵2 = 15.44 𝑘−1=4 𝐶𝑀𝐵2 = 3.86 1.23 0.3476
(Lote)

Error 𝑆𝐶𝐸 = 37.52 (𝑘 − 1)(𝑘 − 2) = 12 𝐶𝑀𝐸 = 3.13

Total 206.64 𝑘 2 − 1 = 24

Para un nivel de significancia 𝜶 = 𝟎. 𝟎𝟓:

•Se rechaza 𝑯𝟎 : 𝝉𝟏 = 𝝉𝟐 = ⋯ = 𝝉𝒌 = 𝟎, dado que 𝑭𝟎 = 𝟏𝟏. 𝟑𝟏 > 𝑭𝟎.𝟎𝟓,𝟒,𝟏𝟐 = 𝟑. 𝟐𝟔 y el


𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶, se concluye que sí hay diferencia o efecto de los ingredientes sobre el
tiempo de reacción en el proceso químico.

•Además dado que el efecto de los bloques (I y II) no es significativo, entonces se tiene el argumento
a favor de solo considerar como factor de bloqueo en futuros experimentos sobre esta misma
respuesta.
Script en R
Blo1dia Blo2lote Trat Tiempo
1 1 A 8
1 2 C 11
1 3 B 4
#Importar Datos #Opción 1. Usando función lm
1 4 D 6
1 5 E 4 Datos<- read_excel("~/3 Métodos DCLlm <-
2 1 B 7
Estadísticos/Ejercicios/Ejercicio 2-7.xlsx") lm(Tiempo~Blo1dia+Blo2lote+Trat,Datos)
2 2 E 2
2 3 A 9 Datos$Blo1dia<-factor(Datos$Blo1dia) anova(DCLlm)
2 4 C 8
2 5 D 2 Datos$Blo2lote<-factor(Datos$Blo2lote) #Opción 2. Usando la función aov
3 1 D 1
3 2 A 7 Datos$Trat<-factor(Datos$Trat) DCLaov<-
3 3 C 10 aov(Tiempo~Blo1dia+Blo2lote+Trat,Datos)
3 4 E 6
3 5 B 3 anova(DCLaov)
4 1 C 7
4 2 D 3
4 3 E 1
4 4 B 6
4 5 A 8
5 1 E 3
5 2 B 8
5 3 D 5
5 4 A 10
5 5 C 8
Script en R
#Prueba de normalidad Shapiro-Wilk
shapiro.test(DCLlm$res)
library(car)
qqPlot(DCLaov)
#Homegeneidad de varianzas
fitc <- fitted(DCLaov) #Valores predichos
res_stc <- rstandard(DCLaov) #Residuos estandarizados
plot(fitc,res_stc,xlab="Valores predichos",
ylab="Residuos estandarizados",abline(h=0))
#Predichos vs residuos estandarizados
bartlett.test(residuals(DCLlm), Datos$Trat)#Prueba de
Bartlett
#Independencia
library (lmtest)
dwtest(DCLlm)
Box.test(rstandard(DCLaov))
Script en R
Diseño de Cuadro
Grecolatino
(DCL)
Diseño de Cuadro Grecolatino
• Se puede considerar como una extensión del cuadrado latino en él, se
incluye una tercera variable de control o variable de bloque.

• En este modelo, como en el diseño en cuadrado latino, todos los factores


deben tener el mismo número de niveles K y el número de observaciones
necesarias es 𝑘 2 .

• Los cuadrados grecolatinos se obtienen por superposición de dos


cuadrados latinos del mismo orden y ortogonales entre sí, uno de los
cuadrados con letras latinas el otro con letras griegas.

• Dos cuadrados reciben el nombre de ortogonales si, al superponerlos,


cada letra latina y griega aparecen juntas una sola vez en el cuadrado
resultante.
Diseño de Cuadro Grecolatino

Se utilizan letras latinas


para denotar a los
tratamientos y letras griegas
para nombrar a los niveles
del tercer factor de bloque
Diseño de Cuadro Grecolatino
• El modelo estadístico está dado por:
𝑌𝑖𝑗𝑙𝑚 = 𝜇 + 𝜏𝑖 + 𝛾𝑗 + 𝛿𝑙 + 𝜑𝑚 + 𝜀𝑖𝑗𝑙𝑚 ; 𝑖, 𝑗, 𝑙, 𝑚 = 1,2, … , 𝑘
• Donde:
• 𝑌𝑖𝑗 corresponde a la medición al tratamiento 𝑖, al bloque 𝑗, 𝑙, 𝑚.
• 𝜇 es la media global poblacional.
• 𝜏𝑖 es el efecto debido al tratamiento 𝑖.
• 𝛾𝑗 es el efecto del bloque I (columnas).
• 𝛿𝑙 es el efecto del bloque II (renglones).
• 𝜑𝑚 es el efecto del bloque III (letra griega).
• 𝜀𝑖𝑗 es el error aleatorio.
Diseño de Cuadro Grecolatino
• El objetivo es probar el juego de hipótesis:
𝑯𝟎 : 𝝁 𝟏 = 𝝁 𝟐 = ⋯ = 𝝁 𝒌 = 𝝁 ∶ 𝝉𝟏 = 𝝉𝟐 = ⋯ = 𝝉𝒌 = 𝟎
𝑯𝑨 : 𝝁𝒊 ≠ 𝝁𝒋 𝒑𝒂𝒓𝒂 𝒂𝒍𝒈𝒖𝒏 𝒊 ≠ 𝒋 ∶ 𝝉𝒊 ≠ 𝟎 𝒑𝒂𝒓𝒂 𝒂𝒍 𝒎𝒆𝒏𝒐𝒔 𝒖𝒏 𝒊

𝐻0 : 𝛾1 = 𝛾2 = ⋯ = 𝛾𝑘 = 0
𝐻𝐴 : : 𝛾𝑗 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑗

𝐻0 : 𝛿1 = 𝛿2 = ⋯ = 𝛿𝑘 = 0
𝐻𝐴 : 𝛿𝑙 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑙

𝐻0 : 𝜑1 = 𝜑2 = ⋯ = 𝜑𝑘 = 0
𝐻𝐴 : 𝜑𝑚 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑚
• Analís de Varianza
Fuente de Grados de
Suma de Cuadrados Cuadrado Medio 𝑭𝟎 Valor-p
Variación Libertad
2 𝑘 2
𝑌𝑖∗∗∗ 𝑌∗∗∗∗ 𝑆𝐶𝑇𝑟𝑎 𝐶𝑀𝑇𝑟𝑎
Tratamientos 𝑆𝐶𝑇𝑟𝑎 = ෍ − 𝑘−1 𝐶𝑀𝑇𝑟𝑎 = 𝑃(𝐹 > 𝐹0 )
𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
𝑖=1
𝑘
2 2
Bloque I 𝑌∗𝑗∗∗ 𝑌∗∗∗∗ 𝑆𝐶𝐵1 𝐶𝑀𝐵1 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵1 = ෍ − 𝑘−1 𝐶𝑀𝐵1 =
(columnas) 𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
j=1

𝑘 2 2
Bloque II 𝑌∗∗𝑙∗ 𝑌∗∗∗∗ 𝑆𝐶𝐵2 𝐶𝑀𝐵2 𝑃(𝐹 > 𝐹0 )
𝑆𝐶𝐵2 = ෍ − 𝑘−1 𝐶𝑀𝐵2 =
(renglones) 𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
l=1

𝑘 2 2
Bloque II 𝑌∗∗∗𝑚 𝑌∗∗∗∗ 𝑆𝐶𝐵3 𝐶𝑀𝐵3
𝑆𝐶𝐵3 = ෍ − 𝑘−1 𝐶𝑀𝐵3 = 𝑃(𝐹 > 𝐹0 )
(letras griegas) 𝑘 𝑁 𝑘−1 𝐶𝑀𝐸
m=1

𝑆𝐶𝐸 𝑆𝐶𝐸
Error = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 − 𝑆𝐶𝐵1 (𝑘 − 3)(𝑘 − 1) 𝐶𝑀𝐸 =
− 𝑆𝐶𝐵2 − 𝑆𝐶𝐵3 (𝑘 − 3)(𝑘 − 1)

𝑘 𝑘
2
Total ෍ ෍ 𝑌𝑖𝑗𝑙m − 𝑌ത∗∗∗ 𝑘2 − 1
𝑙=1 𝑗=1

Para un nivel de significancia 𝛼:


•Se rechaza 𝑯𝟎 si 𝑭𝟎 > 𝑭𝜶,𝒌−𝟏,(𝑘−1)(𝑘−2) , además el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 < 𝜶.
Ejemplo 2.8
• En la obtención de un
determinado producto químico Bloque II Bloque I (Temperatura)
se está interesado en comparar (Presión) 1 2 3 4
4 procedimientos.
1 𝐶𝛽 = 5 𝐵𝛼 = 12 𝐴𝛾 = 13 𝐷𝛿 = 13
• Se supone que en dicha
obtención también puede influir 2 𝐵𝛿 = 6 𝐶𝛾 = 10 𝐷𝛼 = 15 𝐴𝛽 = 11
la temperatura, presión y tipo de 3 𝐷𝛾 = 7 A𝛿 = 5 𝐵𝛽 = 5 𝐶𝛼 = 7
catalizador empleado,
4 𝐴𝛼 = 11 𝐷𝛽 = 10 𝐶𝛿 = 8 𝐵𝛾 = 9
decidiéndose realizar un
experimento en cuadrado
grecolatino.
• Se consideran 4 niveles de cada Las filas representan el factor presión, las columnas
uno de estos factores. representan el factor temperatura y las letras griegas
el factor catalizador, todos ellos factor de bloqueo.
Las letras latinas representan el factor de
tratamiento procedimiento.
Ejemplo 2.8
Bloque II Bloque I (Temperatura)
𝒀∗∗𝒍∗ 𝒀∗∗𝒍∗ 𝟐 𝒀𝒊∗∗∗ 𝒀𝒊∗∗∗ 𝟐 𝒀∗∗∗𝒎 𝒀∗∗∗𝒎 𝟐
(Presión) 1 2 3 4
1 𝐶𝛽 = 5 𝐵𝛼 = 12 𝐴𝛾 = 13 𝐷𝛿 = 13 43 1849 𝒀𝑨∗∗∗
𝒀𝑨∗∗∗
= 𝟒𝟎 1600 𝒀∗∗∗𝛂
𝒀∗∗∗𝛂
= 𝟒𝟓 2025
2 𝐵𝛿 = 6 𝐶𝛾 = 10 𝐷𝛼 = 15 𝐴𝛽 = 11 42 1764 𝒀𝑩∗∗∗
𝒀𝑩∗∗∗
= 𝟑𝟐 1024 𝒀∗∗∗𝛃
𝒀∗∗∗𝛃
= 𝟑𝟏 961
3 𝐷𝛾 = 7 A𝛿 = 5 𝐵𝛽 = 5 𝐶𝛼 = 7 24 576 𝒀𝑪∗∗∗
𝒀𝑪∗∗∗
= 𝟑𝟎 900 𝒀∗∗∗𝛄
𝒀∗∗∗𝛄
= 𝟑𝟗 1521
4 𝐴𝛼 = 11 𝐷𝛽 = 10 𝐶𝛿 = 8 𝐵𝛾 = 9 38 1444 𝒀𝑫∗∗∗
𝒀𝑫∗∗∗
= 𝟒𝟓 2025 𝒀∗∗∗𝛅
𝒀∗∗∗𝛅
= 𝟑𝟐 1024
𝒀∗𝑗∗∗ 29 37 41 40 𝒀∗∗∗∗
𝒀∗∗∗∗
= 147
𝒀∗𝒋∗∗ 𝟐 841 1369 1681 1600 ഥ ∗∗∗∗𝒀
𝒀 ഥ ∗∗∗∗
= 9.19

2
• 𝑺𝑪𝑻 = σ𝑘𝑙=1 σ𝑘𝑗=1 𝑌𝑖𝑗𝑙m − 𝑌ത∗∗∗ = (5 − 9.19)2 +(6 − 9.19)2 + ⋯ + 9 − 9.19 2
= 𝟏𝟓𝟐. 𝟒𝟒
2 2
𝑌𝑖∗∗∗ 𝑌∗∗∗∗ 1600+1024+900+2025 1472
• 𝑺𝑪𝑻𝒓𝒂 = σ𝑘𝑖=1
𝑘

𝑁
=
4

16
= 𝟑𝟔. 𝟔𝟗
2 2
𝑌 1472
• 𝑺𝑪𝑩𝟏 = σ𝑘j=1 ∗𝑗∗∗ −
𝑌∗∗∗∗
=
841+1369+1681+1600
− = 𝟐𝟐. 𝟏𝟗
𝑘 𝑁 4 16
2 2
𝑌∗∗𝑙∗ 𝑌∗∗∗∗ 1849+1764+576+1444 1472
• 𝑺𝑪𝑩𝟐 = σ𝑘𝑙=1
𝑘

𝑁
=
4

16
= 𝟓𝟕. 𝟔𝟗
2
𝑌∗∗∗𝑚 2
𝑌∗∗∗∗ 2025+961+1521+1024 1472
• 𝑺𝑪𝑩𝟑 = σ𝑘m=1
𝑘

𝑁
=
4

16
= 𝟑𝟐. 𝟏𝟗

• 𝑺𝑪𝑬 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟𝑎 − 𝑆𝐶𝐵1 − 𝑆𝐶𝐵2 − 𝑆𝐶𝐵3 = 152.44 − 36.69 − 57.69 − 22.19 − 32.19 = 𝟑. 𝟏𝟗
Ejemplo 2.7
Fuente de Grados de
Suma de Cuadrados Cuadrado Medio 𝑭𝟎 Valor-p
Variación Libertad

Tratamientos 𝑆𝐶𝑇𝑟𝑎 = 36.69 𝑘−1=3 𝐶𝑀𝑇𝑟𝑎 = 12.23 9.95 𝟎. 𝟎𝟒𝟔

Bloque I
𝑆𝐶𝐵1 = 22.19 𝑘−1=3 𝐶𝑀𝐵1 = 7.40 6.02 𝟎. 𝟎𝟐𝟓
(columnas)
Bloque II
𝑆𝐶𝐵2 = 57.69 𝑘−1=3 𝐶𝑀𝐵2 = 19.23 15.64 0.087
(renglones)
Bloque II
𝑆𝐶𝐵3 = 32.19 𝑘−1=3 𝐶𝑀𝐵3 = 10.73 8.73 0.054
(letras griegas)

Error 𝑆𝐶𝐸 = 3.19 (𝑘 − 3)(𝑘 − 1) = 3 𝐶𝑀𝐸 = 1.23

Total 𝑆𝐶𝑇 = 152.44 𝑘 2 − 1 = 15

Para un nivel de significancia 𝜶 = 𝟎. 𝟎𝟓:

•Se rechaza 𝑯𝟎 : 𝝉𝟏 = 𝝉𝟐 = ⋯ = 𝝉𝒌 = 𝟎, dado que 𝑭𝟎 = 𝟗. 𝟐𝟓 > 𝑭𝟎.𝟎𝟓,𝟑,𝟑 = 𝟗. 𝟐𝟖y el 𝒗𝒂𝒍𝒐𝒓 − 𝒑 <


𝜶, se concluye que sí hay diferencia o efecto de los tratamiento (procedimientos) sobre la
obtención de un determinado producto químico

•Además, es significativo el efecto de la temperatura.


Script en R
Blo1 Blo2 Blo3 Tra Res #Importar Datos #Opción 1. Usando función lm
1 1 b C 5 Datos<- read_excel("~/3 Métodos DCG1 <- lm(Res~Blo1+Blo2+Blo3+Tra,Datos)
1 2 d B 6 Estadísticos/Ejercicios/Ejercicio 2-8.xlsx") anova(DCG1)
1 3 c D 7 Datos$Blo1<-factor(Datos$Blo1)
1 4 a A 11 Datos$Blo2<-factor(Datos$Blo2) #Opción 2. Usando la función aov
2 1 a B 12 Datos$Blo3<-factor(Datos$Blo3) DCG2<-aov(Res~Blo1+Blo2+Blo3+Tra,Datos)
2 2 c C 10 Datos$Tra<-factor(Datos$Tra) anova(DCG2)
2 3 d A 5
2 4 b D 10
3 1 c A 13
3 2 a D 15
3 3 b B 5
3 4 d C 8
4 1 d D 13
4 2 b A 11
4 3 a C 7
4 4 c B 9
Script en R
Script en R

También podría gustarte