Tema 8
Tema 8
Tema 8
Contrastes de Hiptesis
8.1.
Una hiptesis estadstica es una afirmacin acerca de una caracterstica poblacional formulada en base a los parmetros de su distribucin.
Existen diversos tipos de hiptesis:
- Hacen referencia a un parmetro de una poblacin.
Por ejemplo, consideremos el rendimiento obtenido en un proceso qumico,X, con distribucin N (, ), siendo desconocido. Podramos plantear las siguientes hiptesis:
= 90
6= 90
> 90
< 90
Si la hiptesis asigna un nico valor al parmetro se le llama hiptesis simple, en caso contrario, hiptesis compuesta. En este ejemplo, la primera es simple y el resto son
compuestas.
- Comparan parmetros de varias poblaciones.
Por ejemplo, supongamos que queremos contrastar si el fumar provoca cncer. Esto equivale a contrastar si la proporcin de fumadores con cncer, p1 , es significativamente mayor
que la proporcin de no fumadores con cncer, p2 .
119
120
Contrastar una hiptesis es comparar lo que dice la hiptesis con la informacin que nos
proporciona una muestra. Si hay coincidencia, dentro de un margen de error admisible entre la
hiptesis planteada (hiptesis nula, H0 ) y la informacin muestral entonces la mantendremos
como cierta, en caso contrario la rechazaremos. Rechazar una hiptesis es sustituirla por otra
que sea capaz de explicar la realidad observada en la muestra (hiptesis alternativa, H1 ).
Por ejemplo, supongamos que nos planteamos si el rendimiento del proceso puede ser en
media del 90 %, H0 : = 90. Realizamos una serie de pruebas y el rendimiento medio muestral
resulta ser x = 75, menor que 90. La informacin muestral parece ir ms a favor de H1 : < 90
que de H0 : = 90.
Una cosa en la que hay que hacer hincapi es la siguiente: nunca podemos afirmar el que
una hiptesis sea verdadera o falsa, ya que para ello tendramos que tener observaciones de
toda la poblacin. Por lo tanto, al realizar un contraste y tomar una decisin siempre cabe
la posibilidad de equivocarnos. Existen dos tipos de errores asociados a cualquier contraste:
error tipo I, que tiene lugar cuando rechazamos H0 siendo cierta, y error tipo II, que ocurre si
aceptamos H0 siendo falsa.
H0 cierta
H0 falsa
Acepto H0
No hay error
Error tipo II
Rechazo H0
Error tipo I
No hay error
A la probabilidad de que ocurra el error tipo I se le llama nivel de significacin del contraste,
que denotamos por y que fijamos antes de realizar un contraste. A la probabilidad de error
tipo II la denotamos por .
A 1 se le llama nivel de confianza, y a 1 potencia del test.
= P (error tipo I)=P (rechazar H0 /H0 es cierta ) ,
: inocente
H1
: culpable
121
8.2.
= 0
H1 :
6= 0
< 0
> 0
2. Fijamos el nivel de significacin del contraste .Generalmente se fija en 0.05, 0.01 o 0.1.
3. Determinamos una medida de discrepancia entre la hiptesis nula y la informacin muestral. Esta medida estar en funcin de la diferencia del valor que especifica H0 para el
parmetro y el estimador muestral del parmetro, y tendr distribucin conocida. A tal
medida la llamamos estadstico de contraste bajo H0 .
4. Determinamos la discrepancia mxima que estamos dispuestos a admitir para aceptar H0 .
Este valor depender de la distribucin del estadstico de contraste bajo H0 , del nivel de
significacin especificado y del tipo de hiptesis alternativa que tengamos. Delimita las
regiones de aceptacin y rechazo de H0 .
5. Concluimos: si el estadstico de contraste observado (emprico) cae en la regin de rechazo,
rechazamos H0 , en caso contrario, la mantendremos como cierta.
Ejemplo 8.1: Sea X N (, ) con , desconocidas, y sobre planteamos el siguiente
contraste:
Dpto.
H0
: = 90
H1
: > 90
122
X 90
T =
tn1 ,
S
2
ya que Z = X
N (0, 1), =
(n 1)S 2
Z
2n1 , son independientes, y T = r 2 .
2
n1
Observemos que valores observados en X mucho mayores que 90 iran claramente a favor
de H1 (en contra de H0 ). A su vez tales valores llevaran a un estadstico de contraste T
muy grande y positivo. En consecuencia, valores muy grandes y positivos en T nos llevaran a
rechazar H0 .(siendo cierta). De ah que la regin de rechazo est en este caso en la cola de la
derecha (de la distribucin tn1 ) y presente un ara igual a (probabilidad de rechazar H0
siendo cierta). El valor que delimita la regin de rechazo es por lo tanto t1,n1 . Entonces
rechazaremos H0 si el estadstico de contraste observado, t, es mayor o igual que t1,n1 .
A la probabilidad de que el estadstico de contraste terico, este caso T, sea mayor que el
observado, en este caso t, se le llama p-valor. Por lo tanto, el criterio de rechazo en base al
p-valor ser: rechazar H0 siempre que el p-valor sea menor o igual que .
Supongamos que una muestra seleccionada de tamao 20 nos proporciona una media x = 98
y una desviacin tpica s = 2,21. El estadstico observado es por tanto
t=
98 90
= 16,188
2,21
20
Para un nivel de significacin = 0,05, t1,n1 = t0,95,19 = 1,73. Como 16,188 no es mayor
que 1,73 no podemos rechazar H0 .
Ejemplo 8.2: Sobre el ejemplo anterior, consideremos ahora la hiptesis alternativa H1 :
< 90.
H0
: = 90
H1
: < 90
En este caso, valores en X mucho menores que 90 iran a favor de H1 (en contra de H0 ).
Por lo tanto, valores muy grandes en valor absoluto y negativos en el estadstico de contraste
llevaran a rechazar H0 . La regin de rechazo est ahora en la cola de la izquierda, y el valor
que la delimita es t,n1 . Rechazamos entonces H0 si t t,n1 .
123
: = 90
H1
: 6= 90
En este caso valores en el estadstico muy grandes en valores absoluto, negativos y positivos,
llevaran a rechazar H0 . Existen ahora por lo tanto dos regiones de rechazo, una a la izquierda y
otra a la derecha, cada una de las cuales engloba un rea de /2. Los valores que las delimitan
son respectivamente t/2,n1 =-t1/2,n1 y t1/2,n1 . Rechazamos H0 si t -t1/2,n1 o t
t1/2,n1 .
8.3.
8.3.1.
Estadstico de contraste
0
X
Z=
/ n
H0 : = 0
Hiptesis alternativa
Criterios de rechazo
H1 : 6= 0
Z z/2 o Z z1/2
H1 : > 0
Z z1
H1 : < 0
Z z
Dpto.
124
Ejemplo 8.4: Los sistemas de escape de emergencia para las tripulaciones de aeronaves son
impulsados por un combustible slido. Una de las caractersticas de este producto es la rapidez
de combustin, que se supone con distribucin Normal. Las especificaciones requieren que la
rapidez promedio de combustin sea de 50 cm/s. Se sabe que la rapidez estndar de la rapidez
de combustin es = 2cm/s. El experimentador decide especificar una probabilidad para el
error tipo I de = 0,05. Selecciona una muestra aleatoria de tamao 25 y se obtiene una media
muestral de 53.1 cm/s. A qu conclusiones llega?.
Planteamos el siguiente contraste:
H0
: = 50
H1
: 6= 50
53,1 50
= 7,75
2/ 25
8.3.2.
Estadstico de contraste
0
X
T =
S/ n
Hiptesis alternativa
Criterios de rechazo
H1 : 6= 0
T t/2,n1 o T t1/2,n1
H1 : > 0
T t1,n1
H1 : < 0
T t,n1
125
Ejemplo 8.5: Un artculo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia a la adhesin de 22 especmenes de aleacin U-700. La carga
para la que cada especimen falla es la siguiente (en MPa):
19.8
18.5
17.6
16.7
15.8
15.4
14.1
13.6
11.9
11.4
11.4
8.8
7.5
15.4
15.4
19.5
14.9
12.7
11.9
11.4
10.1
7.9
Sugieren los datos que la carga promedio de fallo es mayor que 10 MPa?. Realizar el
contraste a un 10 % de significacin.
El contraste a realizar es:
H0
: = 10
H1
: > 10
13,71 10
= 4,90
3,55/ 22
8.3.3.
Estadstico de contraste
Pn
(xi )2
2
= i=1 2
0
Hiptesis alternativa
Criterios de rechazo
H1 : 2 6= 20
2 2/2,n o 2 21/2,n
H1 : 2 < 20
2 2,n
H1 : 2 > 20
Dpto.
2 21,n
126
8.3.4.
Estadstico de contraste
H0 : 2 = 20
2 =
(n 1) S 2
20
Hiptesis alternativa
Criterios de rechazo
H1 : 2 6= 20
2 2/2,n1 o 2 21/2,n1
H1 : 2 < 20
2 2,n1
H1 : 2 > 20
2 21,n1
H0
: 2 = 0,01
H1
: 2 > 0,01
19 0,0153
= 29,07
0,01
Puesto que 29.07 no es mayor que 21,n1 = 20,95,19 = 30,14, no podemos rechazar H0 ,
no hay suficiente evidencia emprica para concluir que la varianza del proceso de llenado es
superior a la deseada.
127
8.3.5.
Contraste para el cociente de varianzas de dos normales independientes con medias conocidas
Sea X1 , X2 , ..., Xn1 una muestra aleatoria de una poblacin X N (1 , 1 ), y Y1 , Y2 , ..., Yn2
una muestra aleatoria de una poblacin Y N (2 , 2 ). Ambas poblaciones se suponen independientes.
Hiptesis nula
Hiptesis alternativa
Estadstico de contraste
Pn1
(xi 1 )2 /n1
F = Pi=1
n2
2
i=1 (yi 2 ) /n2
H1 : 21 6= 21
H0 : 21 = 22
H1 : 21 > 22
H1 :
8.3.6.
21
<
Criterios de rechazo
F f1,n1 ,n2
22
F 1/f1,n2 ,n1
Contraste para el cociente de varianzas de dos normales independientes con medias desconocidas
Sea X1 , X2 , ..., Xn1 una muestra aleatoria de una poblacin X N (1 , 1 ), y Y1 , Y2 , ..., Yn2
una muestra aleatoria de una poblacin Y N (2 , 2 ). Ambas poblaciones se suponen independientes.
Hiptesis nula
Estadstico de contraste
H0 : 21 = 22
F =
Hiptesis alternativa
Criterios de rechazo
H1 : 21 6= 22
H1 :
21
>
22
F f1,n1 1,n2 1
H1 : 21 < 22
8.3.7.
S 21
S 22
F 1/f1,n2 1,n1 1
Contraste para la diferencia de medias de dos normales independientes con varianzas conocidas
Dpto.
128
Sea X1 , X2 , ..., Xn1 una muestra aleatoria de una poblacin X N (1 , 1 ), y Y1 , Y2 , ..., Yn2
una muestra aleatoria de una poblacin Y N (2 , 2 ). Ambas poblaciones se suponen independientes.
Hiptesis nula
8.3.8.
H0 : 1 2 = 0
Estadstico de contraste
Y 0
X
Z= s
2
21
+ 2
n1
n2
Hiptesis alternativa
Criterios de rechazo
H1 : 1 2 6= 0
Z z/2 o Z z1/2
H1 : 1 2 > 0
Z z1
H1 : 1 2 < 0
Z z
Contraste para la diferencia de medias de dos normales independientes con varianzas desconocidas pero iguales
Sea X1 , X2 , ..., Xn1 una muestra aleatoria de una poblacin X N (1 , ), y Y1 , Y2 , ..., Yn2
una muestra aleatoria de una poblacin Y N (2 , ). Ambas poblaciones se suponen independientes.
Hiptesis nula
H0 : 1 2 = 0
Estadstico de contraste
Y 0
X
T =s
1
1
Sp2
+
n1 n2
Hiptesis alternativa
Criterios de rechazo
H1 : 1 2 6= 0
T t/2,n o T t1/2,n
H1 : 1 2 > 0
T t1,n
H1 : 1 2 < 0
T t,n
donde
n = n1 + n2 2
(n1 1) S 21 + (n2 1) S 22
Sp2 =
n
129
Ejemplo 8.7: Se analizan dos catalizadores para determinar la forma en la que afectan
el rendimiento promedio de un proceso qumico. De manera especfica, el catalizador 1 es el
que se est empleando en este momento, pero el catalizador 2 tambin es aceptable. Como el
catalizador 2 es ms caro, slo interesar emplearlo siempre y cuando aumente el rendimiento
promedio del proceso. Se hace una prueba piloto, y los rendimientos obtenidos en % son los
siguientes:
Catalizador 1
Catalizador 2
91.5
89.19
94.18
90.95
92.18
90.46
95.39
93.21
91.79
97.19
89.07
97.04
94.72
91.07
89.21
92.75
: 21 = 22
H1
: 21 6= 22
S 21
5,688
=
= 0,639
S 22
8,901
Dpto.
130
: 1 2 = 0
H1
: 1 2 < 0
= s
= 0,354
1
1
1
1
Sp2
+
7,295
+
n1 n2
8 8
T =s
Como T no es menor que t,n = t0,05,14 = 1,761 no podemos rechazar H0 para un nivel
de significacin del 5 %. Por lo tanto, el catalizador 2 no aumenta significativamente el
rendimiento promedio del proceso.
8.3.9.
Contraste para la diferencia de medias de dos normales relacionadas (muestras apareadas) con varianzas desconocidas pero
iguales
Hiptesis alternativa
Estadstico de contraste
0
D
T = q 2
H1 : 1 2 6= 0
T t/2,n1 o T t1/2,n1
H1 : 1 2 > 0
T t1,n1
H1 : 1 2 < 0
T t,n1
H0 : 1 2 = 0
SD
n
Criterios de rechazo
donde D = X Y .
Ejemplo 8.8: Se desea comparar dos mtodos para predecir la resistencia al corte de vigas
de placa de acero. Con este fin se selecciona una muestra de 9 vigas, a las que se aplican los
131
1.186
1.151
1.322
1.339
1.2
1.402
1.365
1.537
1.559
Mt. 2
1.061
0.992
1.063
1.062
1.065
1.178
1.037
1.086
1.052
: D = 0
H1
: D 6= 0
0.277
0.138
0.119
0.159
0.259
0.224
0.328
0.451
0.507 ,
Al ser 6.05 mayor que 2.306, rechazamos H0 , es decir, los mtodos proporcionan resultados
diferentes.
8.3.10.
Estadstico de contraste
p p0
Z=r
p0 (1 p0 )
n
Hiptesis alternativa
Criterios de rechazo
H1 : p 6= p0
Z z/2 o Z z1/2
H1 : p > p0
Z z1
H1 : p < p0
Z z
Dpto.
132
: p = 0,03
H1
: p > 0,03
8.3.11.
Sean X1 , ..., Xn1 una m.a.s. de X Bernoulli(p1 ) y Y1 , ..., Yn2 una m.a.s. de Y Bernoulli(p2 ).
Ambas poblaciones se suponen independientes.
Hiptesis nula
H0 : p1 = p2
Hiptesis alternativa
Estadstico de contraste
p1 p2
Z=r
pT 1 pT /n1 + pT 1 pT /n2
Criterios de rechazo
H1 : p1 6= p2
Z z/2 o Z z1/2
H1 : p1 > p2
Z z1
H1 : p1 < p2
Z z
133
donde
pT =
n1 p1 + n2 p2
n1 + n2
Ejemplo 8.10: Una central de productos lcteos recibe diariamente la leche de dos granjas
A y B. Con el fin de estudiar la calidad de los productos recibidos se extraen dos muestras, una
de cada granja, y se analiza el contenido de materia grasa de cada producto. Se obtienen los
siguientes resultados:
Granja A
Granja B
0.32
0.28
0.29
0.30
0.30
0.33
0.28
0.29
0.33
0.31
0.31
0.29
0.30
0.33
0.29
0.32
0.33
0.29
0.32
0.32
0.30
0.31
0.29
0.32
0.29
0.33
Si la central rechaza aquellos productos con un contenido graso superior a 0.32, existen
diferencias significativas entre los porcentajes de productos de A y B que se tendran que
rechazar?. Realizar el contraste al 5 % de significacin.
El contraste es:
H0
: p1 = p2
H1
: p1 6= p2
Dpto.
134
Como Z no es menor que z0,025 = 1,96 ni Z es mayor que z0,975 = 1,96 no podemos
rechazar H0 . No existen diferencias significativas en las proporciones de productos a rechazar
en ambas granjas.
8.4.
Existe una estrecha relacin entre la prueba de una hiptesis estadstica sobre un parmetro
y el intervalo de confianza de . Si denotamos por [L , U ] el intervalo de confianza para a
un nivel de confianza del (1 )100 %, entonces el contraste bilateral (dos colas)
H0
: = 0
H1
: 6= 0
8.5.
Ejercicios
1. Se utilizan dos mquinas diferentes de moldeo por inyeccin para la fabricacin de piezas
de plstico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le
falta color. Se toman dos muestras aleatorias, ambas de tamao 300, y se encuentan 15
piezas defectuosas en la muestra de la mquina 1 y 8 defectuosas en la muestra de la
mquina 2. Podemos concluir que la mquina 2 produce menos piezas defectuosas que
la mquina 1?. Realizar el contraste para un nivel de significacin a = 0,05. Suponer que
sendas muestras proceden de poblaciones normales e independientes.
2. En un proceso de fabricacin de tubos de aluminio, la longitud de stos se distribuye
segn una normal de media 100 cm y varianza 16 cm2 . Se realiza una reparacin y ahora
se desea discernir si ha habido un cambio en la longitud media de los tubos. Para ello se
135
8.5. Ejercicios
selecciona una muestra de tamao 9, obtenindose una media muestral de 102 cm. Para
un nivel de significacin del 5 %, a qu conclusin se llega?.
3. Dos laboratorios farmacuticos presentan sendas vacunas contra la alergia en el mercado
al mismo tiempo. Una organizacin de consumidores desea comprobar cul es ms efectiva
de las dos. Con este fin, aplican cada vacuna a una muestra de 10 personas alrgicas y se
mide el nivel de alergia (de 0 a 3) que presentan en la primavera del ao siguiente. Los
resultados son:
Vacuna 1
Vacuna 2
n1 = 15
x1 = 24,2
S21 = 10
n2 = 10
x2
S22 = 10,89
= 23,9
Dpto.
136
que 6 de ellos tienen defectos. Aprueba el fabricante la nueva mquina pulidora?. Tomar
= 0,1
7. Se utilizan dos mquinas diferentes de moldeo por inyeccin para la fabricacin de piezas
de plstico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le
falta color. Se toman dos muestras aleatorias, cada una de tamao 300, y se encuentran 15
defectuosas en la primera y 8 en la segunda. Es razonable concluir que la proporcin de
defectuosas es la misma en ambas mquinas?. Realizar el contraste al 5 % de significacin.
8. Quince hombres adultos con edades comprendidas entre 35 y 50 aos participan en un
estudio para evaluar el efecto de la dieta y el ejercicio sobre el nivel de colesterol en la
sangre. Los niveles de colesterol medidos sobre cada individuo antes y despus de haber
realizado el programa (dieta baja en grasas y ejercicio) aparecen en la siguiente tabla:
Sujeto
Antes
Despus
265
229
240
231
258
227
295
240
251
238
245
241
287
234
314
256
260
247
10
279
239
11
283
246
12
240
218
13
238
219
14
225
226
15
247
233
137
8.5. Ejercicios
es importante la rapidez con la que acta la sustancia. Se han comparado dos soluciones
qumicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada solucin. La
rapidez de accin observada es la siguiente (en mils/min):
Solucin 1
9.9
9.4
9.3
9.6
10.2
10.1
10.3
10.0
9.3
10.1
Solucin 2
10.2
10.6
10.7
11.4
10.5
11.0
10.2
10.7
10.4
10.3
Mquina 1
Mquina 2
103
101
115
98
101
110
105
99
107
98
110
110
105
109
110
99
115
100
Dpto.
138
11. Un sindicato pretende analizar los accidentes laborales en los sectores de la construccin
y la siderometalurgia. Para ello, toma una muestra aleatoria de 125 empresas dedicadas
a la construccin y otra de 75 pertenecientes al sector de la siderometalurgia. Una vez
analizados los porcentajes de accidentes en cada una de estas empresas, se obtienen los
siguientes datos:
Construccin
98
27
Siderometalurgia
54
21
Puede afirmarse al 5 % de significacin que el porcentaje de accidentes laborales es independiente del sector al que pertenece la empresa?.
12. La Consejera de Obras Pblicas y Urbanismo de una Comunidad engarga un estudio para
comparar el precio de las viviendas nuevas de dos municipios, A y B. Con tal fin, se recoge
informacin sobre el precio del m2 de 42 viviendas de promotoras distintas, seleccionadas
al azar en el municipio A y de 40 viviendas en el municipio B. En la muestra de viviendas
del municipio A, el precio medio del m2 ha resultado ser de 0.98 miles de euros con
una desviacin tpica de 0.09 miles de euros, mientras que en la muestra de viviendas
del municipio B, el precio medio del m2 es de 0.95 y la desviacin tpica de 0.07. A
partir de esta informacin, puede aceptarse que en los dos municipios no hay diferencias
significativas en el precio medio de las viviendas de nueva construccin para un nivel de
significacin del 5 %?.
13. Se investiga la temperatura de deflexin bajo carga para dos tipos diferentes de tubera de
plstico. Para ello se toman dos muestras aleatorias, cada una de 10 unidades, anotando
139
8.5. Ejercicios
las temperaturas de deflexin observadas (o F). Los resultados son los siguientes.
Tipo 1
Tipo 2
206
177
188
197
205
206
187
201
194
180
193
176
207
185
185
200
189
197
213
192
Dpto.