Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Modulo 8 Dba Un Factor

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 72

DISEÑO DE BLOQUES AL AZAR

Un solo factor
GENERALIDADES
En muchos problemas de investigación es necesario diseñar experimentos
en los que pueda controlarse sistemáticamente la variabilidad producida por
diversas fuentes extrañas

A estas variables se las denomina variables bloque, y se caracterizan porque:

•No son el motivo del estudio sino que aparecen de forma natural y obligada en
el mismo

•Se asume que no tienen interacción con el factor en estudio

•El experimentador no está interesado en investigar las posibles diferencias de


•la respuesta entre los niveles de los factores bloque

La ventaja de bloquear un factor que se supone que tienen una clara influencia
en la respuesta pero en el que no se está interesado. Convierte la variabilidad
sistemática no planificada en variabilidad sistemática planificada.
Que es un DISEÑO DE BLOQUES AL AZAR

• Es el diseño experimental más ampliamente utilizado cuando se


presenta el caso de que las unidades experimentales no son
homogéneas.

• Se dividen las unidades experimentales en grupos llamados bloques de


modo que las observaciones realizadas en cada bloque se realicen bajo
condiciones experimentales lo más parecidas posibles

• En este diseño el experimentador agrupa las unidades experimentales en


bloques, a continuación determina la asignación de los niveles del factor
en cada bloque

• Requiere que cada uno de los niveles del factor de interés se


prueben por lo menos una vez en cada uno de los bloques

• Todos los posibles niveles del factor de interés los cuales se asignan
en forma aleatoria.

• Una variable bloque no presenta interacción con el factor en


estudio.
Se quieren determinar las necesidades energéticas de una persona
cuando anda, come o hace deporte.

Supongamos que se tienen 10 personas para realizar el experimento y


se considera como variable respuesta o cuantitativa, el número de
calorías consumidas por segundo.

Los resultados varían según el individuo considerado. Aquí, el factor es


la actividad realizada, con 3 posibles niveles: andar, comer o hacer
gimnasia

Si a cada una de las personas se le asigna una actividad distinta puede


ser que la variabilidad observada entre las distintas actividades sea
debida a las diferencias entre los propios individuos

Una posible solución es que cada uno de los individuos realice las
tres actividades. De este modo, la variable bloque es el tipo de
persona y cada uno de los bloques es cada persona.
A cada bloque (persona) se le aplican los 3 niveles del factor por
orden aleatorio:

BLOQUES ASIGNACION
Persona 1 C A G
Persona 2 A C G
Persona 3 G A C
Persona 4 C G A
Persona 5 . . .
Persona 6 . . .
Persona 7 . . .
Persona 8 . . .
Persona 9 . . .
Persona 10 . . .

Esto quiere decir que cada persona realiza cada una de las
actividades y se mide la variable de respuesta
Se tienen cuatro máquinas y se quiere medir su desempeño
Se tienen 4 máquinas y se quiere
comparar su ALTERNATIVA
desempeño 2
ALTERNATIVA 1 Si hay otros factores que no se han
Tomar muestras de cada considerado y controlan o
máquina evitando al máximo nulifican para hacer las
comparaciones se afectan las
ALTERNATIVA
favorecer el desempeño de 1 conclusiones
alguna de ellas para evitar
cualquier tipo de sesgo que Por ejemplo si la habilidad de los
pueda afectar la comparación operarios es diferente
del desempeño de las
máquinas

Cada operador
El mismo operario en trabaja con cada una
las cuatro máquinas de las máquinas
DCA

Se restringe la validez de la
comparación de los DBA
operarios
7
DEFINICION DEL
PROBLEMA

Comparar si hay diferencias


significativas entre los promedios
de los niveles del factor de interes

1
Determinar el efecto del factor de
interes sobre la variable de
respuesta

IDENTIFICACION Y DEFINICION
DEL PROBLEMA
2
MODELO ESTADÍSTICO

Hay dos formas de escribir el modelo


• Colocando los bloques en las filas y
los niveles del factor en las columnas
(2.1)
• Colocando los niveles del factor en
las filas y los bloques en las
columnas(2.2)
2.1
Yij =  +  i + j + ij
i =1.….n y j= 1.….k ij NID (0, ² )
Donde:
Yij = es la medición de la variable de respuesta en
el i-esimo bloque para el j-esimo nivel del
factor de interés
 = es la media total
j = es el efecto del j-esimo nivel del factor de
interés
 i= es el efecto del i-esimo bloque.
ij = es el error experimental.
2.2 MODELO ESTADÍSTICO
Yij =  +  j + i + ij
i =1.….k y j= 1.….n ij NID (0, ² )
Donde:
Yi j= es la medición de la variable de respuesta en
el j-esimo bloque para el i-esimo nivel del
factor de interés
 = es la media total
i = es el efecto del i-esimo nivel del factor de
interés
 j= es el efecto del j-esimo bloque.
ij = es el error experimental.
3 Contraste de Hipótesis para un Factor de Interés Fijo

Para el factor de interés Para los bloques


Ho : 1 = 2 = . . . = k Ho : 1 = 2 = . . . = n
H1 : al menos una de las H1 : al menos una de las
medias de los niveles del medias de los bloques es
factor de interés es diferente diferente
   

Regla de Decisión Regla de Decisión


Se descarta Ho si Se descarta Ho si
Fc ≥ F,gln,gld Fc ≥ F,gln,gld
   
gln = ( k – 1) gln = ( n – 1)
gld = ( k – 1) (n – 1) gld = ( k – 1) (n – 1)
   
Para cualquiera de los dos formatos para el modelo
3

En este caso la hipótesis de los bloques sería


solo para confirmar que hay diferencias entre
estos

Si se ha considerado un diseño por bloques


es porque estos influyen en el experimento

Esto es válido tanto para factores fijos como


para factores aleatorios
3 Contraste de Hipótesis para un Factor Aleatorio

Para el factor de interés


Ho : 1² = 2² =......... k²
H1 : al menos una de las varianzas de los niveles del
factor de interés es diferente
 
Regla de Decisión
Se descarta Ho si
Fc ≥ F,gln,gld
 
gln = ( k – 1)
gld = ( k – 1) (n – 1)
  Para cualquiera de los dos formatos para el modelo
NOTA: Los factores de bloque no se incluyen en
el experimento porque interesa su efecto sino es
un medio de estudiar de manera más adecuada el
factor de interés
Tiene un grado de importancia secundaria en
relación al factor de interés
Pueden existir otros factores que deben
controlarse durante el experimento pero no se
tiene que caer en el extremo de controlar todo
Solo aquellos que por conocimiento del proceso o
experiencia previa se sabe que pueden afectar en
forma sensible el resultado de las comparaciones
4

16
4.1 ModeloYij =  +  i + j + ij

Asignar aleatoriamente cada uno de los k niveles


del factor de interés a cada uno de los n
bloques considerados en el experimento

B1: 1 2 3 4 ........k ( en forma aleatoria)


B2: 1 2 3 4 .........k ( en forma aleatoria)

.
Bn: 1 2 3 4 ..........k ( en forma aleatoria)

Para cualquiera de los dos formatos para el modelo


4.2 Modelo: Yij =  +  j + i + ij

Asignar aleatoriamente cada uno de los k niveles


del factor de interés a cada uno de los n
bloques considerados en el experimento

B1 B2 ……………………………… Bn
1 1 1
2 2 2
. . .
. . .
K k k
Ejemplo
3 Niveles A,B,C Para el factor de interés y
4 Bloques 1,2,3,4
Una posible configuración de la asignación aleatoria
de los niveles podría ser la siguiente:

Bloque 1 C( ) A( ) B( )
Bloque 2 A( ) C( ) B( )
Bloque 3 C( ) B( ) A( )
Bloque 4 A( ) B( ) C( )
5

20
5.1 MODELO: Yij =  +  i + j +  ij

Totales/bloque

1 2 ... k Totales 
/bloque

1 Y11 Y12 ... Y1k Y1.

2 Y21 Y22 ... Y2k Y2.

...     ...    

n Yn1 Yn2 ... Ynk Yn.


 
 
Totales /nivel Y.1 Y.2   Y.k Y..
5.2 MODELO: Yij =  +  j + i + ij

REGISTRO DE DATOS
1 2 ... n  
Totales/ni
vel
1 Y11 Y12 ... Y1n Y1.
NN
I 2 Y21 Y22 ... Y2n Y2.
V
E ...     ...    

L
k Yk1 Yk2 ... Ykn Yn.
E
S   Y.1 Y.2   Y.k Y..
Totales /bloque
Se consideran las siguientes hipótesis sobre el modelo:

Normalidad: Yij sigue una distribución normal

Homocedasticidad: Var(εij) = σ2. Esto es equivalente a


que V ar(Yij) = σ2

Independencia: εij son independientes entre sí. Esto es


equivalente a que Yij son independientes
entre sí.

23
Como se comprueban estos
supuestos?

24
6

25
6.1 MODELO: Yij =  +  i + j + ij

Fuente de Grados Suma de Cuadrado Fc F


Variable de Cuadrados Medio
FV Libertad SC CM
Niveles CMN / CMEE
F,gln,gld
N k-1 *SCN SCN / k -1

Bloques CMB / CMEE F, gln, gld


B n–1 *SCB SCB / n -1

Error SCEE /    
EE (n -1)(k-1) *SCEE (n -1)(k-1)

Total nk - 1 * SCTo      
To

*Ver fórmulas en la siguiente filmina


6.1
2
Y

1 k
SCN  Y  2
j 1 . j
..
n nk

2
Y

1 n
SCB  Y 2
i 1 i .
..
k nk

SCEE  SCTO  ( SCN  SCB)

n k 2
Y
SCT0   Y  2
ij
..

i 1 j 1 nk
6.1
MODELO: Yij =  +  j + i + ij

Fuente de Grados Suma de Cuadrado Fc F


Variable de Cuadrados Medio
FV Libertad SC CM
Niveles CMN / CMEE F,gln,gld
N k-1 *SCN SCN / k -1

Bloques CMB / CMEE F, gln, gld


B n–1 *SCB SCB / n -1

Error SCEE /    
EE (n -1)(k-1) *SCEE (n -1)(k-1)

Total nk - 1 * SCTo      
To

*Ver fórmulas en la siguiente filmina


6.1 2
Y

1 k
SCN  Y 2
i 1 i .
..
n nk

2
Y

1 n
SCB  2
j 1 . j
Y  ..
k nk

SCEE  SCT0  ( SCN  SCB)


n k 2
Y
SCT0   Y  2
ij
..

i 1 j 1 nk
7 CONCLUSIONES
Se comparan los valores obtenidos
para la Fc con el punto crítico de
rechazo establecido en la Regla de
Decisión, tanto para los niveles del
factor como para los bloques

Se da respuesta al problema
planteado inicialmente en el
experimento
8
8.1 MODELO: Yij =  +  i + j + ij

Parámetros del Modelo:


 
² = CMEE
 
 
n k

 Y ij

 i 1 j 1

nk
8.2
MODELO: Yij =  +  j + i + ij

n k

 Y ij

 i 1 j 1

nk

Parámetros del Modelo:


 
² = CMEE
 
 
9

34
MODELO: Yij =  +  i + j + ij
9.1

IC j  y . j  t / 2,( k 1)( n 1) CMEE n

IC i  y i .  t / 2,( k 1)( n 1) CMEE k


MODELO: Yij =  +  j + i + ij
9.2

IC i  y i .  t / 2 ,( k 1)( n 1) CMEE n

IC j  y . j  t / 2,( k 1)( n 1) CMEE k


10
Coeficiente de Determinación:
R² = (SCN + SCB) / SCTo

Interpretación:
Es un valor entre 0 y 1
Indica que el modelo explica en ese
porcentaje la variabilidad de las
mediciones de la variable de
respuesta
EJEMPLO
Problema 5.7 (Montgomery)

Un fabricante de aleación de aluminio produce refinadores de


textura en forma de lingotes. La compañía manufactura el
producto en seis hornos. Se sabe que cada horno tiene sus
propias características de operación , de modo que los hornos
se considerarán una variable problemática en cualquier corrida
experimental en la fundición que implique más de un horno.
Los ingenieros de proceso sospechan que la velocidad de
agitación influye en el tamaño de grano del producto. Interesa
que el tamaño de grano sea pequeño, ya que se obtienen
mejores propiedades mecánicas.ICada horno puede operarse a
cuatro velocidades de agitación distintas.
Se ejecuta un diseño de bloques aleatorizados para un refinado
en particular, y se mide el tamaño de grano.
Cual es la vr
Cual es el FI
Cuales son los bloques
Cuantos bloques se tienen
Cuantos niveles tiene el FI
Cual es el problema objeto de estudio
Cual es el modelo estadístico
Formule los contrastes principales de hipótesis
Como se debe realizar el procedimiento de
aleatorización
Diseño de una hoja de recolección de datos

39
Definición del Problema:
Determinar si existe diferencia significativa en el tamaño de
grano promedio para las distintas velocidades de agitación
utilizando seis diferentes hornos.

Variable de Respuesta: Tamaño del grano .

Factores de Interés : velocidades de agitación: 5, 10, 15, 20


Bloques : hornos 1,2,3,4,5,6
Niveles=4 Bloques= 4
Modelo Estadístico:
Yij =  +  i + j + ij  i =1, ...,4 y j= 1,..., 4
Donde:
Yij = es el tamaño del grano para la j-esima
velocidad de agitación en el i-esimo horno
 = tamaño de grano promedio.
 i = es el efecto del i-esimo horno sobre el tamaño
de grano
j = es el efecto de la j-esima velocidad de agitación
sobre el tamaño de grano
ij = es el error experimental.
Contraste de Hipótesis Principal

BLOQUES (Hornos)
Ho : 1 = 2 = 3 = 4 = 5 = 6
H1 : al menos uno de los tamaños promedio de grano de los lingotes producidos
en 6 distintos hornos no son iguales
 Regla de Decisión : Se descarta Ho si la Fc ≥ F0.05,gln,gld

 gln = ( n – 1) = 6– 1=5
gld = ( k – 1) (n – 1)= (4-1)(6-1)= 15
 
FACTOR (VELOCIDADES DE AGITACION )
Ho : 1 = 2 = 3 = 4
H1 : al menos uno de los tamaños promedio de grano de los lingotes producidos
con 4 velocidades de agitación es diferente
 Regla de Decisión : Se descarta Ho si la Fc ≥ F0.05,gln,gld

 gln = ( k – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (4-1)(6-1)= 15
 
Como definiría verbalmente el procedimiento de
aleatorización para este experimento

A cada horno se le asigna


aleatoriamente cada una de las
velocidades de agitación

43
Procedimiento de Aleatorización:

Velocidades de Agitación

H
asignacion de velocidad de
O agitacion a cada uno de los
hornos hornos
R 1 10( ) 15( ) 5( ) 20( )
2 15( ) 20( ) 10( ) 5( )
N 3 10( ) 5( ) 15( ) 20( )
4 5( ) 10( ) 20( ) 15( )
O
5 15( ) 20( ) 5( ) 10( )
S 6 5( ) 15( ) 10( ) 20( )
MEDICIONES DE
TAMAÑO DE
GRANO VELOCIDADES DE AGITACION
Hornos 5 10 15 20
1 8 14 14 17
2 4 5 6 9
3 5 6 9 3
4 6 9 2 6
5 7 8 5 7
6 6 10 12 8
45
SUPUESTOS DEL MODELO

NORMALIDAD

Que contraste se debe plantear?

47
Gráfica de probabilidad normal
(la respuesta es TAMANO DE GRANO)
99

95

90

80
70
Porcentaje

60
50
40
30
20

10

5 Gráfica de probabilidad de RESID


Normal
1 99
Media -7.77156E-16
-5.0 -2.5 0.0 2.5 5.0
Desv.Est. 2.076
Residuo 95 N 24
AD 0.348
90
Valor p 0.449
80
70
Porcentaje

60
50
40
30
20

10
5

1
-5.0 -2.5 0.0 2.5 5.0
RESID 48
49
Independencia

vs. orden
(la respuesta es TAMANO DE GRANO)
4

1
Residuo

-1

-2

-3

-4

2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación

50
HOMOCEDASTICIDAD (Factor de Interés)

RESIDUOS Vs AJUSTES VELOCIDADES DE AGITACION


(la respuesta es TAMANO DE GRANO)
10.0

7.5

5.0
Residuo

2.5

0.0

-2.5

-5.0

6.0 6.5 7.0 7.5 8.0 8.5 9.0


Valor ajustado

51
a de igualdad de varianzas: TAMANO DE GRANO vs. VELOCIDAD DE AGITA
Prueba de Bartlett

5 Valor p 0.103
VELOCIDAD DE AGITACION

10

15

20

0 2 4 6 8 a10 de igualdad
12 14 de varianzas:
16 TAMANO DE GRANO vs. VELOCIDAD DE AGITA
Intervalos de confianza de Bonferroni de 95%Múltiples
para Desv.Est.
intervalos de comparación para la desviación estándar, α = 0.05

Comparaciones múltiples
5 Valor p 0.104
Prueba de Levene
VELOCIDAD DE AGITACION

Valor p 0.258

10

15

20

0 2 4 6 8 10 12 14 16 18

Si los intervalos no se sobreponen, las Desv.Est. correspondientes son significativamente diferentes.


52
Gráfica de efectos principales para TAMANO DE GRANO
Medias ajustadas
HORNOS VELOCIDAD DE AGITACION
14

13
Media de TAMANO DE GRANO

12

11

10

5
1 2 3 4 5 6 5 10 15 20

53
ANDEVA
Fuente de Grados de Suma de Cuadrado Fc F
Libertad
Variable Cuadrados Medio
gl
FV SC CM

Velocidad 3 22.19 7.40 0.85 3.86


de Agitación
N

Hornos 3 165.19 55.06 6.35 3.86


B

Error 9 78.06 8.67    


Experimental
EE

Total 15 265.44      
To
Análisis de Varianza

FUENTE DE Valor crítico


GL SC CM Valor F Valor p
VARIACION para F

  HORNOS 5.00 175.50 35.10 5.31 0.01 2.90

VELOCIDADES
3.00 25.83 8.61 1.30 0.31 3.29
DE AGITACION

ERROR
15.00 99.17 6.61      
EXPERIMENTAL

TOTAL 23.00 300.50        


55
Interpretación de Resultados

Para las Velocidades de Agitación :


Fc es menor que F 0.05,3,15 , por lo tanto no se descarta H0 . Se
concluye que no existe diferencia significativa en el tamaño de
grano promedio para las distintas velocidades de agitación.

Para los Hornos :


Fc es mayor que F 0.05,3,15 , por lo tanto se descarta
Ho. Se concluye que existe diferencia significativa
en el tamaño promedio del grano para los cuatro
hornos.
Por lo tanto se confirma que los hornos tienen características
de operación propias.
Calculo de los Parametros

 = 186 / 24 = 7.75
  ² = CMEE = 6.61
 
Coeficiente de Determinación:

R² = (SCN + SCB) / SCTotal


  R²= (2583+ 175.50) / 300.50 = 0.6669

Interpretación:
El modelo explica en un 67% la
variabilidad en los tamaños de grano
O el 67% de la variabilidad en el tamaño
del grano se debe a la velocidad de
agitación y a los hornos…
Intervalos de confianza para los tamaños de grano promedio de las distintas
velocidades de agitación

Intervalos de confianza para los tamaños de grano promedio de los hornos


Intervalos de confianza para los tamaños de grano promedio de:
a. los hornos
b. las velocidades de agitación

60
61
Ejemplo 2
Una empresa de contabilidad grande trata de seleccionar un sistema de
computación integrado a la oficina entre los 3 modelos que están actualmente
en estudio.
La selección final dependerá de la productividad del sistema. Se seleccionan
aleatoriamente 5 operadores para manejar cada sistema
Es importante tener en cuenta que el nivel de experiencia que tienen los
empleados en el manejo de computadora puede afectar el resultado de la
prueba por lo tanto existe la necesidad de justificar el impacto de la experiencia
y determinar los méritos relativos de los sistemas de comunicación.
Los niveles resultantes de producción medidos en unidades por hora aparecen
en la siguiente tabla.

Operadores Sistemas
1 2 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45
Definición del Problema

Determinar si existe diferencia significativa en la productividad


promedio, de 3 tipos de sistemas de computación manejado por
cinco
operarios con diferente grado de experiencia.

Variable de Respuesta
Es la productividad del j-esimo sistema de computación
manejado por el i-esimo operario.
Factor de Interés: Tipo de Sistema de computación
Selección del Diseño Apropiado: Diseño de bloques al azar
Bloques: operadores
Continuación.............

Modelo Estadistico
Yij = µ + Bi + Tj + Eij
i = l,.....5 j = l,...3
Yij = es la productividad del i-esimo tipo de sistema de
computación manejado por el j-esimo operario.
µ = Productividad media Total
Bi = Es el efecto del i-esimo operario sobre la
productividad
Tj = Es el efecto del j-esimo tipo de sistema de
computadora sobre la productividad
Eij = Error experimental
Continuación………..

Formulación de Hipotesis
Para Bloques ( operadores )
Ho: µ1 = µ2 =... = µ5
Hi: al menos uno de los promedios de productividad de los operarios
es diferente
Para niveles ( sistemas )
Ho: µ1 = µ2 = µ3
Hi: al menos uno de los promedio de productividad de los sistemas es
diferente
Selección del nivel de significancia y regla de decisión
œ = 0.05%
Para los operadores: Descartar Ho Si Fc> F0.05, 4, 8
Para los tipos de sistemas: Descartar Ho si Fc> F0.05, 2, 8
Procedimiento de Aleatorización

66
Continuación………
9. Recolección de los datos del experimento

  TIPOS DE SISTEMAS  
OPERARIO A B C TOTALES
1 27 21 25 73
2 31 33 35 99
3 42 39 39 120
4 38 41 37 116
5 45 46 46 136
TOTALES 183 180 181 544
SUPUESTOS DEL MODELO

normalidad

68
homocedasticidad

69
independeincia

70
Continuación………

10. Andeva

FUENTE DE
VARIACION GL SC CM Fc Fcritica

TIPOS DE SISTEMAS 2 0.933 0.4665 0.09 4.46

OPERARIOS 4 764.93 191.23 37.28 3.84


E.E 8 41.07 15.13    
Totales
14 806.93      
Continuación…………

Conclusión:
Para el factor de interés se observa que Fc = 0.09 < F0.05,2, 8 =
4.46, por lo tanto no se descarta Ho. Se concluye que no existe
diferencia significativa en la productividad promedio para los 3
tipos de sistemas.

Para los operadores se observa que Fc = 37.28 > F0.05, 4, 8 = 3.84,


por lo tanto se descarta. Se concluye que existe diferencia
sigificativa en la productividad promedio de los operadores.

También podría gustarte