Contraste de Hipótesis
Contraste de Hipótesis
Contraste de Hipótesis
INFERENCIA ESTADSTICA:
CONTRASTE DE HIPTESIS
Pgina 311
REFLEXIONA Y RESUELVE
Mquina empaquetadora
El fabricante de una mquina empaquetadora afirma que, si se regula para que
empaquete pals con 100 kg, los pesos de los pals envasados por ella se distribuirn N (100,2).
a) Para probarla, el posible comprador efecta un empaquetado que resulta tener
101 kg. A la vista de este resultado, debera desconfiar de la afirmacin del
fabricante?
b) Para probar la mquina, se empaquetan 50 pals. El peso medio de los 50 es
101 kg. Con este resultado, crees que se debera rechazar lo que afirma el
fabricante?
a) Como la distribucin de los pesos de los sacos es normal de media = 100 kg y de
desviacin tpica q = 2 kg, obteniendo 101 kg en una medida, no parece que sea
suficiente para desconfiar de la afirmacin del fabricante.
b) En este caso s, pues ya tenemos 50 sacos; es decir, 50 unidades. Como la poblacin se
distribuye N(100, 2), sabemos que las medias muestrales siguen una distribucin
2
q
normal de media = 100 kg y de desviacin tpica
=
0,28.
n 50
Por tanto, en este caso s parece razonable desconfiar de la afirmacin del fabricante.
Monedas falsas?
Reflexionemos sobre cada una de las siguientes experiencias:
a) Lanzamos una moneda 10 veces y obtenemos 6 caras.
b) Lanzamos una moneda 100 veces y obtenemos 60 caras.
c) Lanzamos una moneda 1 000 veces y obtenemos 600 caras.
La grasa en la leche
Los fabricantes de una determinada marca de leche afirman que el contenido de materias grasas, por trmino medio, es del 12% o menos. La desviacin tpica es 2,2%.
Para estudiar si es cierta o no la afirmacin de los fabricantes, se toman 50 envases y se mide el porcentaje de grasa que hay en la leche de cada uno de ellos, obtenindose un promedio de 12,6%.
Reflexionando sobre el resultado anterior, crees que se debe rechazar la hiptesis hecha por la empresa distribuidora de que el contenido de grasas por trmino medio no supera el 12%, o bien no hay motivo suficiente para rechazarla?
En este caso se trata de dilucidar si la diferencia de ese 0,6% es atribuible al azar o no.
Esta cuestin ser una de las que estudiemos a fondo en el desarrollo de esta unidad.
Pgina 314
1. Repite, paso a paso, el CASO 1 para un nivel de significacin a = 0,01.
1. Enunciacin:
H1: p ? 0,167
H0: p = 0,167
2. Zona de aceptacin:
( ) (
N p,
pq
n
= N 0,167;
0,167 0,833
= N (0,167; 0,037)
100
UNIDAD 14
3. Verificacin:
Se extrae la muestra y se calcula el valor del parmetro:
25
pr =
= 0,25
100
4. Decisin:
0,25 s est en la zona de aceptacin. Se acepta la hiptesis nula. Consideramos el
dado correcto.
2. Repite, paso a paso, el CASO 2 para un nivel de significacin a = 0,10.
1. Enunciacin:
H0: = 102
H1: ? 102
2. Zona de aceptacin:
Las medias muestrales se distribuiran:
N 102,
11
400
= N (102; 0,55)
Pgina 315
1. a) En una poblacin para la cual es q = 29, contrasta la hiptesis de que
= 347, con un nivel de significacin del 1%, mediante una muestra de
347 2,575
29
200
; 347 + 2,575
29
200
347 1,645
29
200
; 347 + 1,645
29
200
Pgina 316
2. En una poblacin para la cual es q = 29, contrasta la hiptesis de que 347
con un nivel de significacin del 1%, mediante una muestra de 200 individuos
(
4
@ ; 347 + 2,33
29
200
= (@; 351,78)
UNIDAD 14
Pgina 318
1. Respecto a un cierto dado, A opina que P [6] = 0,15, B opina que P [6] 0,15
y C opina que P [6] 0,15. Contrasta las tres hiptesis con un nivel de significacin de 0,10, sabiendo que se arroj el dado 1 000 veces y se obtuvo
183 veces el 6.
1.er paso: Hiptesis:
PARA
PARA
PARA
HIPTESIS NULA
H0: p = 0,15
H0: p 0,15
H0: p 0,15
HIPTESIS ALTERNATIVA
H1: p ? 0,15
a = 0,10 8 za = 1,28
0,15 0,85
= (0,131; 0,169)
1 000
0,15 0,85
= (@; 0,164)
1 000
a = 0,10 8 za = 1,28
0,15 0,85
; + @ = (0,136; +@ )
1 000
183
= 0,183 solo est en la zona de aceptacin de C. Es decir, aceptamos que
1 000
ep 0,15.
Pgina 323
EJERCICIOS Y PROBLEMAS PROPUESTOS
PARA PRACTICAR
q = 1,5 a = 0,01
10
11
16
1,6
12
H0
a)
= 12
c)
11
d)
15
q=1
a = 0,1
150 14,5
0 za/2
q0
, 0 + za/2
q0
12 2,575
1,5
10
; 12 + 2,575
1,5
10
UNIDAD 14
0 za/2
q0
, 0 + za/2
q0
1,45 1,96
0,24
16
0,24
; 1,45 + 1,96
16
4,6
100
q0
150
q0
, +@
0 za/2
q0
, 0 + za/2
q0
2 400 1,96
300
100
; 2 400 + 1,96
300
100
13
12
11
10
11
11
10
12
11
UNIDAD 14
0 za/2
q0
, 0 + za/2
q0
12 1,96
1,5
10
; 12 + 1,96
1,5
10
pr
a)
p = 0,5
0,01
1 000
0,508
b)
p 0,6
0,05
600
0,61
c)
p 0,3
0,1
200
0,25
p0 za/2
p0 q0
, p0 + za/2
n
p0 q0
n
0,5 0,5
; 0,5 + 2,575
1 000
0,5 0,5
1 000
@ ; p0 + za/2
p0 q0
n
0,6 0,4
; es decir: ( @; 0,6329)
600
p0 + za/2
p0 q0
; +@
n
0,3 0,7
, +@ ; es decir: (0,259; +@)
200
10
UNIDAD 14
p0 za/2
p0 q0
, p0 + za/2
n
p0 q0
n
Para un nivel de significacin a = 0,05, tenemos que za/2 = 1,96. El intervalo ser:
0,4 1,96
0,4 0,6
; 0,4 + 1,96
100
0,4 0,6
; es decir, (0,304; 0,496)
100
30
= 0,3.
100
4. paso: Decisin:
Como la proporcin muestral queda fuera de la zona de aceptacin, rechazamos
H0; es decir, rechazamos la afirmacin del dentista.
6 Una empresa de productos farmacuticos afirma en su publicidad que uno
de sus medicamentos reduce considerablemente los sntomas de la alergia
primaveral en el 90% de la poblacin.
Una asociacin de consumidores ha experimentado dicho frmaco en una
muestra de 200 socios de la misma, obteniendo el resultado indicado en la
publicidad en 170 personas.
Determina si la asociacin de consumidores puede considerar que la afirmacin de la empresa es estadsticamente correcta al nivel de significacin de 0,05.
1.er paso: Hiptesis: Tenemos que contrastar:
H0: p = 0,9 frente a H1: p ? 0,9
2. paso: Zona de aceptacin:
p0 za/2
p0 q0
, p0 + za/2
n
p0 q0
n
Para un nivel de significacin a = 0,05, tenemos que za/2 = 1,96. El intervalo ser:
0,9 1,96
0,9 0,1
; 0,9 + 1,96
200
0,9 0,1
; es decir, (0,858; 0,942)
200
11
170
= 0,85.
200
4. paso: Decisin:
Como la proporcin muestral queda fuera del intervalo de aceptacin, rechazamos H0; es decir, no podemos considerar vlida la afirmacin de la empresa.
s7 El 42% de los escolares suele perder al menos un da de clase a causa de gripes y catarros. Sin embargo, un estudio sobre 1 000 escolares revela que en
el ltimo curso hubo 450 en tales circunstancias. Las autoridades sanitarias
defienden que el porcentaje del 42% para toda la poblacin de escolares se
ha mantenido.
a) Contrasta, con un nivel de significacin del 5%, la hiptesis defendida por
las autoridades sanitarias, frente a que el porcentaje ha aumentado como parecen indicar los datos, explicando claramente a qu conclusin se llega.
b) Cmo se llama la probabilidad de concluir errneamente que el tanto
por ciento se ha mantenido?
a) 1.er paso: Hiptesis:
Queremos contrastar:
H0: p 0,42 frente a H1: p > 0,42
2. paso: Zona de aceptacin:
@ , p0 + za/2
p0 q0
n
Para un nivel de significacin del 5%, tenemos que za/2 = 1,645. Por tanto, el intervalo ser:
@ ; 0,42 + 1,645
0,42 0,58
; es decir, (@; 0,446)
1 000
450
= 0,45.
1 000
4. paso: Decisin:
Como la proporcin muestral queda fuera de la zona de aceptacin, rechazamos H0; es decir, aceptamos que la proporcin ha aumentado.
b) La probabilidad de concluir errneamente que el tanto por ciento se ha mantenido; es decir, de aceptar H0, siendo falsa, es la probabilidad de cometer un
error de tipo II.
12
UNIDAD 14
Pgina 324
PARA RESOLVER
s8 Se ha comprobado que el tiempo de espera (en minutos) hasta ser atendido,
en cierto servicio de urgencias, sigue un modelo normal de probabilidad.
A partir de una muestra de 100 personas que fueron atendidas en dicho servicio, se ha calculado un tiempo medio de espera de 14,25 minutos y una
desviacin tpica de 2,5 minutos.
a) Podramos afirmar, con un nivel de significacin del 5% (a = 0,05),
que el tiempo medio de espera, en ese servicio de urgencias, no es de
15 minutos?
b) Qu podramos concluir si el nivel de significacin hubiese sido del
0,1% (a = 0,001)?
c) Existe contradiccin en ambas situaciones?
Justifica las respuestas.
a) 1.er paso: Hiptesis: Tenemos que contrastar:
H0: = 15 frente a H1: ? 15
2. paso: Zona de aceptacin:
0 za/2
q0
, 0 + za/2
q0
15 1,96
2,5
100
, 15 + 1,96
2,5
100
15 3,27
2,5
100
, 15 + 3,27
2,5
100
13
s9 La duracin de las bombillas de 100 vatios que fabrica una empresa sigue
una distribucin normal con una desviacin tpica de 120 horas. Su vida media est garantizada durante un mnimo de 800 horas.
Se escoge al azar una muestra de 50 bombillas de un lote y, despus de comprobarlas, se obtiene una vida media de 750 horas.
Con un nivel de significacin de 0,01, habra que rechazar el lote por no
cumplir la garanta?
1.er paso: Hiptesis: Queremos contrastar:
H0: 800 frente a H1: < 800
2. paso: Zona de aceptacin:
0 za
q0
; +@
Para a = 0,01 8 za = 2,33. Como 0 = 800; q0 = 120 y n = 50, la zona de aceptacin ser:
120
800 2,33
50
(das)
RESPUESTAS
5A9
24
10 A 14 15 A 19 20 A 24
46
19
11
(das)
5A9
10 A 14 15 A 19 20 A 24
xi
12
17
22
fi
24
46
19
11
Sf x
1 285
x = i i =
= 12,85 das; s = 4,59
100
n
14
UNIDAD 14
@ ; 0 za
q0
4,59
@ ; 11 + 1,645
100
@ ; 0 za
q0
Para un nivel de significacin del 5%, tenemos que za = 1,645. Por tanto, el intervalo es:
@ ; 6+ 1,645
64
15
s12 La Concejala de Juventud maneja el dato de que la edad a la que los hijos se
independizan es una variable normal con media 29 aos y desviacin
tpica 3 aos.
Aunque la desviacin tpica no plantea dudas, s se sospecha que la media
ha descendido, sobre todo por la poltica de ayuda al empleo que ha llevado
a cabo el ayuntamiento.
As, de un estudio reciente sobre 100 jvenes que se acaban de independizar, se ha obtenido una media de 28,1 aos de edad.
a) Con un nivel de significacin del 1%, puede defenderse que la edad media no ha disminuido, frente a que s lo ha hecho como parecen indicar
los datos? Plantea el contraste o test de hiptesis y resulvelo.
b) Explica, en este problema, en qu consisten cada uno de los errores
del tipo I y II.
a) 1.er paso: Hiptesis:
Tenemos que contrastar:
H0: 29 frente a H1: < 29
2. paso: Zona de aceptacin:
0 za
q0
; +@
Para un nivel de significacin de a = 0,01, tenemos que za = 2,33. As, el intervalo es:
29 2,33
100
16
UNIDAD 14
p0 za
p0 q0
; +@
n
Para un nivel de significacin a = 0,5 tenemos que za = 1,645. Por tanto, el intervalo ser:
0,3 1,645
0,3 0,7
, +@ ; es decir: (0,247; +@)
200
50
= 0,25.
200
4. paso: Decisin:
Como la proporcin muestral est dentro del intervalo de aceptacin, no podemos
rechazar H0; es decir, aceptamos que, al menos, el 30% de las familias posee
ordenador.
s14 En el ao 2005, un estudio indicaba que un 15% de los conductores utilizaban el mvil con el vehculo en marcha.
Con el fin de investigar la efectividad de las campaas que se han realizado
desde entonces para reducir esos hbitos, se ha hecho una encuesta a
120 conductores de los cuales 12 hacan un uso indebido del mvil.
Plantea un test para contrastar que las campaas no han cumplido su objetivo frente a que s lo han hecho, como parecen indicar los datos.
A qu conclusin se llega con un nivel de significacin del 4%?
1.er paso: Hiptesis:
H0: p 15
H1: p < 15
p za
pq
n
,@
0,15 1,75
0,15 0,85
, @ = (0,093; @)
120
12
= 0,1; luego pr = 0,1.
120
17
4. paso: Decisin:
0,1 (0,093; @). Por tanto, no podemos rechazar la hiptesis nula.
Segn estos datos, las campaas no han sido efectivas y esta afirmacin la hacemos con un nivel de significacin del 4%.
s15 En una muestra aleatoria de 225 habitantes de una poblacin hay 18 que hablan alemn. A un nivel de significacin de 0,05, hay suficiente evidencia
para refutar la afirmacin de que al menos el 10% de los habitantes de la poblacin hablan alemn?
Planteamos un test de hiptesis unilateral para la proporcin.
H0: p 0,1
H1: p < 0,1
La zona de aceptacin tiene la forma:
p0 za
p0 za
p0 (1 p0)
; +@
n
n
p0q0
p0
0,95
0,05
za = 1,645
0,1 1,645
0,1 0,9
; +@ = (0,0671; +@)
225
18
= 0,08.
225
Como 0,08 pertenece a la zona de aceptacin, aceptamos la hiptesis nula; es
decir, no hay suficiente evidencia para refutar la afirmacin de que al menos el
10% de los habitantes de la poblacin hablan alemn.
La proporcin muestral es pr =
18
UNIDAD 14
Pgina 325
s16 Se trabaja con la hiptesis de que uno de cada diez varones manifiesta algn
tipo de daltonismo.
a) Elegidos 400 varones, se detectan 50 daltnicos. Con un nivel de significacin del 10%, se puede aceptar la hiptesis de partida?
b) Sobre la muestra estudiada en el apartado a), se obtendra la misma conclusin si a = 0,02?
a) Planteamos un contraste de hiptesis bilateral para la proporcin.
Sean H0; p = 0,1 y H1: p ? 0,1.
La zona de aceptacin tiene la forma:
p0 za/2
p0 (1 p0)
, p0 + za/2
n
p0 (1 p0)
n
0,05
0,90
0,05
za/2
0,95
0,1 1,645
0,1 0,9
; 0,1 + 1,645
400
La proporcin muestral es pr =
0,1 0,9
= (0,0753; 0,1247)
400
50
= 0,125.
400
0,1 2,33
0,1 0,9
; 0,1 + 2,33
400
0,1 0,9
= (0,065; 0,135)
400
19
s17 Hace diez aos, la proporcin de personas que lean un cierto peridico era
del 35%. Para comprobar si dicha proporcin se mantiene, tomamos una
muestra de 225 personas de las cuales 65 leen dicho peridico.
a) Si a = 0,05, podemos aceptar que la proporcin de personas que leen
dicho peridico es mayor o igual al 35%?
b) Y si el nivel de significacin es del 1%?
a) Planteamos un test de hiptesis unilateral para la proporcin.
H0: p 0,35
H1: p < 0,35
La zona de aceptacin tiene la forma:
p0 za
p0 (1 p0)
; +@
n
0,95
0,05
za = 1,645
0,35 1,645
0,35 0,65
; +@ = (0,298; +@)
225
La proporcin muestral es pr =
65
0,08.
225
Como 0,29 (0,298; +@), no podemos aceptar, con a = 0,05, que la proporcin de personas que leen dicho peridico ha aumentado.
b) Si a = 0,01, za = 2,33
La zona de aceptacin es:
0,35 2,33
0,35 0,65
; +@ = (0,276; +@)
225
En este caso, 0,29 (0,276; +@). Con un nivel de significacin del 1% podemos aceptar que la proporcin de personas que leen el peridico La Ciudad ha
aumentado.
Al disminuir el nivel de significacin, la zona de aceptacin aumenta y, por tanto, casos que antes se rechazaban ahora se aceptan.
20
UNIDAD 14
s18 Hace diez aos, el 25% de los partos fueron de madres de ms de 33 aos.
Actualmente se ha tomado una muestra de 120 partos de los cuales 34 fueron de madres de ms de 33 aos. Con una significacin del 10%, se puede
aceptar que la proporcin de partos de madres de ms de 33 aos sigue siendo como mucho del 25%?
Planteamos un test de hiptesis unilateral para la proporcin.
H0: p 0,25
H1: p > 0,25
La zona de aceptacin tiene la forma:
@; p0 + za
pq
n
0,90
0,10
za = 1,28
La zona de aceptacin es:
@; 0,25 + 1,28
0,25 0,75
= (@; 0,30)
120
34
17
=
0,283.
120
60
Como 0,283 (@; 0,30), se puede aceptar, con una significacin del 10%, que la
proporcin de partos de madres de ms de 33 aos sigue siendo, como mucho,
del 25%.
La proporcin obtenida en la muestra es pr =
PARA PROFUNDIZAR
19 En un test de hiptesis para estudiar si el cociente intelectual medio de los
estudiantes de una universidad es 113, hemos seleccionado una muestra
aleatoria de 180 estudiantes, obteniendo una media de 115. La zona de aceptacin obtenida ha sido el intervalo (111,98; 114,02). Por tanto, hemos
rechazado la hiptesis.
Si q = 7, cul es la probabilidad de haber rechazado la hiptesis, cuando
en realidad era verdadera? Cmo se llama este tipo de error?
El error que consiste en rechazar H0 cuando esta es verdadera se llama error de
tipo I. La probabilidad de cometerlo es precisamente a, el nivel de significacin.
Lo calculamos en este caso concreto:
Unidad 14. Inferencia estadstica: contraste de hiptesis
21
114,02 111,98
= 1,02
2
0,90
1,02 = za/2
180
8 za/2 = 1,95 8 1
a
= 0,9744 8 a = 0,0512
2
2,3
100
As, la probabilidad de aceptar H0 siendo falsa (esto es, la probabilidad de cometer un error de tipo II) sera la probabilidad de obtener una media muestral que
cayera dentro de la zona de aceptacin, es decir:
5,35 5
6,25 5
P [5,35 < x < 6,25] = P
<z<
= P [1,52 < z < 5,43] =
0,23
0,23
= P [z < 5,43] P [z < 1,52] = 1 0,9357 = 0,0643
22
UNIDAD 14
Pgina 325
AUTOEVALUACIN
1. Contrasta las siguientes hiptesis:
a) H0: = 19,4 (q = 2,6) Nivel de significacin: a = 0,10
n = 65; pr = 0,17
n = 200; pr = 0,703
a) H0: = 19,4
H1: ? 19,4
Zona de aceptacin:
za/2
, + za/2
2,6
19,4 1,645
114
; 19,4 + 1,645
2,6
114
= (19; 19,8)
Zona de aceptacin:
za/2
, +@
500 1,645
31
300
, +@ = (497, +@)
c) H0: p = 0,2
Zona de aceptacin:
p za/2
pq
n
, p + za/2
pq
n
0,2 2,33
0,2 0,8
; 0,2 + 2,33
65
0,2 0,8
= (0,084; 0,316)
65
23
d) H0: p 0,68
Zona de aceptacin:
@ , p + za/2
pq
n
@ ; 0,68 + 2,055
0,68 0,32
200
= (@; 0,748)
Zona de aceptacin:
p za
pq
n
, +@
(
pr =
0,16 1,645
0,16 0,84
; +@ = (0,122; +@)
250
30
= 0,12 (0,122; +@)
250
24
UNIDAD 14
0,90
0,10
za = 1,28
En este caso, la zona de aceptacin es:
@ ; 120 + 1,28
40
100
= (@; 125,12)
Como 128 (@; 125,12), no se puede aceptar, con un nivel de significacin del
10%, la afirmacin de partida.
b) Si a = 0,01, entonces za = 2,33.
Ahora la zona de aceptacin es:
@ ; 120 + 2,33
40
100
= (@; 129,32)
Como 128 (@; 129,32), s se puede aceptar, con un nivel de significacin del
1%, la afirmacin de partida.
25