Tema 8 Tests Hipotesis
Tema 8 Tests Hipotesis
Tema 8 Tests Hipotesis
TESTS DE HIPOTESIS
8.1. Introducción
8.1.1. Definiciones
8.1.2. Pasos para la realización de un test
253
8.1. Introducción
8.1.1. Definiciones
254
Ejemplos:
Tests paramétricos:
Establecemos la afirmación: µ ≤ 10
Tests no paramétricos:
255
2. Hipótesis del test:
Hipótesis nula ( H 0 ) : Hipótesis que se plantea
en un problema de contraste
Hipótesis alternativa ( H 1 ) : Hipótesis contraria
a la hipótesis nula
Ejemplos:
Test paramétricos:
H 0 : µ ≤ 10
H 1 : µ > 10
Test no paramétricos:
H 0 : La muestra se ha seleccionado
aleatoriamente
H 1 : La muestra no se ha seleccionado
aleatoriamente
256
3. Estadístico del test
Llamamos Estadístico del Test o Estadístico de
Contraste a una variable aleatoria con distribución de
probabilidad conocida cuyos valores nos permiten
tomar la decisión de aceptar o rechazar la hipótesis
nula.
H 0 : µ = µ 0 σ
X → Nµ ;
H1 : µ ≠ µ 0 n
1 n
x1 , x 2 ,..., x n x = ∑ xi
n i =1
257
Ejemplo Contrate de Hipótesis
H 0 : µ = µ 0
1. Planteamiento del test:
H1 : µ ≠ µ 0
σ
2. Estadístico del test: X → Nµ ;
n
σ
Bajo la hipótesis nula: X → N µ0 ;
n
1 n
cuya media valdrá: x = ∑ xi
n i =1
258
4. Criterio de decisión: Comprobar si el valor concreto
de la media muestral calculada, está o no muy alejado
de µ 0
Rechazamos H 0 si la media muestral no está
“próxima” a µ 0.
No rechazamos H 0 si la media muestral está
“próxima” a µ 0.
α /2 1−α α /2
µ 0.
Media muestral
Rechazo No Rechazo Rechazo
259
6. Tipos de hipótesis. Región Crítica.
Contrastes unilaterales y bilaterales. P-valor
H: θ ∈ ( θ 1, θ 2 )
H0 : µ = µ0
Simple – Compuesta
H1 : µ ≠ µ 0
H0 : µ ≤ µ0
Compuesta – Compuesta
H1 : µ > µ0
H0 : µ ≥ µ0
Compuesta - Compuesta
H1 : µ < µ0
260
Al aplicar un contraste de hipótesis, clasificamos los
puntos del espacio muestral en dos regiones excluyentes
y complementarias:
Región de rechazo
Región de no
rechazo
261
Contrastes unilaterales y bilaterales:
Si la hipótesis alternativa da lugar a una región
crítica “a ambos lados” del valor del parámetro,
diremos que el test es bilateral o de dos colas
Región crítica
Región crítica
262
p-valor o nivel de significación observado: Es
el valor de α más pequeño que hace que la muestra
observada nos indique que se debe rechazar H0.
Elegido un nivel de significación α, se rechazará H0
si p ≤ α
No rechazar
hipótesis nula
R.A.
p-valor R.C.
zexp zα
Si α ≥ p - valor ⇒ Rechazar H 0
Rechazar
hipótesis nula
R.A. R.C.
p-valor
zα zexp 263
7. Errores asociados al contraste
Error tipo I: Error que se comete al rechazar la
hipótesis nula, H 0 , cuando ésta es cierta.
α = P [ Error tipo I ] =
P [ Rechazar H 0 / H 0 es verdadera ]
β = P [ Error tipo II ] =
P [ No Rechazar H 0 / H 0 es falsa ]
H0 Rechazo No rechazo
Verdadera α)
Error tipo I (α Correcto
Falsa Correcto β)
Error tipo II (β
1 − β = P [ Rechazar H 0 / H 0 es falsa ]
264
8.1.2. Pasos para la realización de un test
H0 : θ = θ0
Si el contraste es bilateral
H1 : θ ≠ θ0
Varianza Conocida
H 0 : µ = µ0 z exp ≤ − z α 2
H1 : µ ≠ µ0 z exp ≥ zα 2
H 0 : µ ≤ µ0
X −µ0
Z= → N (0;1)
σ
H1 : µ > µ0 n z exp ≥ zα
H 0 : µ ≥ µ0 z exp ≤ − z α
H1 : µ < µ0
266
Varianza Desconocida
Estadístico de contraste
X −µ0
T=
S
→ t n−1
n
Hipótesis
Criterio de rechazo
del test
H 0 : µ = µ0 t exp ≤ −t α 2;n −1
H1 : µ ≠ µ0
t exp ≥ t α 2;n −1
H 0 : µ ≤ µ0
t exp ≥ t α ;n −1
H1 : µ > µ0
H 0 : µ ≥ µ0
t exp ≤ − t α ;n −1
H1 : µ < µ0
267
Ejemplo:
X: “Contenido Proteico”, X → N (µ ; σ )
Contraste de Hipótesis:
H 0 : µ ≥ 42
H1 : µ < 42
268
n = 10; x = 40; S = 3.5
H 0 : µ ≥ 42
Contraste de Hipótesis:
H1 : µ < 42
Estadístico de contraste:
x − µ0
→ t n−1
S
n
40 − 42
t exp = = −1.8070 ⇒ No rechazamos H 0
3.5
10
0.05
0.95
t 0.95 ; 9 texp
269
Contrastes sobre la varianza
Media desconocida
Estadístico de contraste
χ2 =
( )
n − 1 S 2
→ χ n2−1
σ 02
H 0 : σ 2 = σ 02 χ exp
2
≤ χ 12−α 2; n −1
H1 : σ 2 ≠ σ 02 χ exp
2
≥ χ α2 2; n −1
H 0 : σ 2 ≤ σ 02 2
χ exp
2
≥ χ α ; n −1
2
H1 : σ > σ 02
H 0 : σ 2 ≥ σ 02
χ exp
2
≤ χ 21−α ; n −1
H1 : σ 2 < σ 02
270
Ejemplo:
X → N (µ ; σ )
n = 15 S 2 = 0.21
Contraste de Hipótesis:
H 0 : σ 2 ≥ 0.25
H1 : σ < 0.25
2
271
n = 15 S 2 = 0.21
H 0 : σ 2 ≥ 0.25
Contraste de Hipótesis:
H1 : σ < 0.25
2
2
α = 0.05; χ 0.95;14 = 6.57
Estadístico de contraste: χ2 =
( n − 1) S 2
→χ2n −1
σ 02
14 × 0.21
χ exp =
2
= 11.76 ⇒ No rechazamos H 0
0.25
0.05
0.95
χ 0.95;14
2
χ exp
2
X1, X 2 ,..., X nX (
m.a.s. de X → N µ X ; σ X )
Y1, Y2 ,..., YnY (
m.a.s. de Y → N µ Y ; σ Y )
Varianzas conocidas
273
Varianzas conocidas
Estadístico de contraste
Z=
( X −Y ) − µ0
→ N ( 0; 1)
σ X2 σ Y2
+
nX nY
H 0 : µ X − µY = µ0 z exp ≤ − z α 2
H1 : µ X − µY ≠ µ0 z exp ≥ z α 2
H 0 : µ X − µY ≤ µ0
z exp ≥ z α
H1 : µ X − µY > µ0
H 0 : µ X − µY ≥ µ0
z exp ≤ − z α
H1 : µ X − µY < µ0
274
Varianzas desconocidas, pero iguales
Estadístico de contraste
T=
( X − Y ) − µ0 → t n X + nY − 2
1 1
Sp +
n X nY
H 0 : µ X − µY = µ0 texp ≤ −tα 2; n X + nY −2
H1 : µ X − µY ≠ µ0 texp ≥ tα 2; n X + nY −2
H 0 : µ X − µY ≤ µ0 texp ≥ tα ; n X + nY −2
H1 : µ X − µY > µ0
H 0 : µ X − µY ≥ µ0 texp ≤ −tα ; n X + nY −2
H1 : µ X − µY < µ0
S p2 =
( nX ( )
− 1) S X2 + n Y − 1 S Y2
nX + n Y − 2
275
Varianzas desconocidas
con n x, n y ≥ 30
Estadístico de contraste
Z=
( X − Y ) − µ0
→ N ( 0; 1)
S X2 S Y2
+
nX nY
H 0 : µ X − µY = µ0 z exp ≤ − z α 2
H1 : µ X − µY ≠ µ0 z exp ≥ z α 2
H 0 : µ X − µY ≤ µ0
z exp ≥ z α
H1 : µ X − µY > µ0
H 0 : µ X − µY ≥ µ0
z exp ≤ − z α
H1 : µ X − µY < µ0
276
Ejemplo:
En un estudio sobre angina de pecho en ratas, se
dividió aleatoriamente a 18 animales afectados en dos
grupos de 9 individuos cada uno. A un grupo se le
suministró un placebo y al otro un fármaco
experimental FL113. Después de un ejercicio
controlado sobre una “cinta sin fin”, se determinó el
tiempo de recuperación de cada rata, obteniéndose los
siguientes resultados:
Placebo FL113
nX = 9 nY = 9
x = 329 seg. y = 283 seg.
S X = 45 seg. S Y = 43 seg.
277
Contraste de H 0 : µ X ≤ µ Y
H 0 : µ X − µ Y ≤ 0
Hipótesis:
H1 : µ X > µ Y H1 : µ X − µ Y > 0
Estadístico de contraste:
T=
( X −Y ) − µ0 → t n X + nY − 2
1 1
Sp +
n X nY
S p2 =
( nX ( )
− 1) S X2 + n Y − 1 S Y2 8 × 452 + 8 × 432
= = 1937
nX + n Y − 2 9+9−2
texp = 2.22
⇒ Rechazamos H 0
t0.05;16 = 1.746
0.95 0.05
t 0.05;16 texp
El fármaco experimental es eficaz en la reducción
del tiempo de recuperación en ratas con angina de pecho.
278
Contrastes sobre la igualdad de
varianzas
Medias desconocidas
Estadístico de contraste
2
SX
F= → Fn X −1 ; nY −1
2
SY
Hipótesis del test Criterio de rechazo
H 0 : σ X2 ≤ σ Y2
Fexp ≥ Fα ; n X −1, nY −1
H1 : σ > σ
2
X
2
Y
279
Ejemplo:
Se realiza un estudio de prácticas de prescripción. El
propósito es analizar la prescripción de digoxina, un
fármaco importante, potencialmente tóxico y
comúnmente utilizado. El nivel de dosificación para
los mayores de 64 años debe ser menor que el de
personas más jóvenes. Se extraen muestras
independientes de cada grupo y se obtiene el nivel de
dosificación para cada paciente seleccionado. Los
resultados son:
X → N ( µ X ,σ X )
Y → N ( µ Y ,σ Y )
Independientes
280
Contraste de Hipótesis: H 0 : σ X2 = σ Y2
H1 : σ X ≠ σ Y
2 2
Estadístico de S X2
contraste:
F= → Fn X −1 ; nY −1
S Y2
n X = 41; S X = 0.102mg ./ día
nY = 29; SY = 0.068mg ./ día
0.102 2
Fexp = = 2.25
0.068 2
F 0.025; 40, 28 = 2.05 ⇒
1 1
F0.975; 40, 28 = = = 0.515
F 0.025; 28, 40 1.94
Rechazamos H 0
Las varianzas poblacionales
son diferentes
0.95
0.025
0.025
281
8.2.3. Contrastes para una proporción
Estadístico de contraste
pˆ − p 0
Z= → N ( 0; 1)
(
p 0 1− p0 )
n
H 0 : p = p0 z exp ≤ − z α 2
H1 : p ≠ p0 z exp ≥ z α 2
H 0 : p ≤ p0
z exp ≥ z α
H1 : p > p0
H 0 : p ≥ p0 z exp ≤ − z α
H1 : p < p0
282
Ejemplo:
Entre los pacientes con cáncer de pulmón, el 90% o
más muere generalmente en el espacio de tres años.
Como resultado de nuevas formas de tratamiento, se
cree que esta tasa se ha reducido. En un reciente
estudio sobre 150 pacientes diagnosticados de cáncer
de pulmón, 128 murieron en el espacio de tres años.
¿Se puede afirmar que realmente ha disminuido la tasa
de mortalidad al nivel α = 0.1?
Estadístico de contraste:
pˆ − p0
Z= → N ( 0; 1)
p0 (1 − p0 )
n
Estimación muestral del parámetro:
Nº éxitos 128
pˆ = = = 0.853
Nº observaciones 150
283
H 0 : p ≥ 0.9
Contraste de Hipótesis:
H1 : p < 0.9
pˆ = 0.853
p − p0 0.853 − 0.9
Z exp = = = −1.905
p0 (1 − p0 ) 0.9 (1 − 0.9 )
n 150
⇒ Rechazamos H 0
0.1 0.9
− z exp − z 0.1
284
8.2.3. Contrastes para la comparación
de dos proporciones
Estadístico de contraste
Z=
( pˆ
X − pˆ Y ) − ( pX − pY )
0
→ N ( 0; 1)
pˆ X (1− pˆ X ) pˆ Y (1− pˆ Y )
+
nX nY
H 0 : p X − pY = ( p X − pY )0 z exp ≤ − z α 2
H1 : p X − pY ≠ ( p X − pY )0
z exp ≥ z α 2
H 0 : p X − pY ≤ ( p X − pY )0
H1 : p X − pY > ( p X − pY )0
z exp ≥ z α
H 0 : p X − pY ≥ ( p X − pY )0
z exp ≤ − z α
H1 : p X − pY < ( p X − pY )0
285
Ejemplo:
Se quiere comprobar la teoría de que la vitamina C es
una ayuda en el tratamiento del cáncer. Se examinaron
dos grupos de 75 pacientes cada uno. Al primero de
ellos se le dio 10 gr. de vitamina C diariamente y se
observó que 47 pacientes presentaron mejoría. A los
pacientes del segundo grupo se les suministró un
placebo y 43 experimentaron mejoría. Contrastar las
hipótesis: H : p − p ≤ 0.04
0 X Y
H 1 : p X − pY > 0.04
Estadístico de contraste:
Z=
( pˆ
X − pˆ Y ) − ( pX − pY )
0
→ N ( 0; 1)
pˆ X (1 − pˆ X ) pˆ Y (1 − pˆ Y )
+
nX nY
Estimación muestral de los parámetros:
47
pˆ X = = 0.63
75
43
pˆ Y = = 0.57
75
286
H 0 : p X − pY ≤ 0.04
H 1 : p X − pY > 0.04
Z exp =
( 0.63 − 0.57 ) − 0.04 = 0.75
0.63 (1 − 0.63) 0.57 (1 − 0.57 )
+
75 75
z0.05 = 1.645
z exp ≥ zα ⇒ No rechazamos H 0
0.95 0.05
zexp z 0.05
287
8.3. Tests No Paramétricos
H 0 : X → F ( x)
H1 : X sigue otra distribución
288
Planteamiento
289
Clases Marcas Fr. Prob. Valores
de clase Absolutas Teóricas esperados
empíricas
1 x1 n1 p1 np1
2 x2 n2 p2 np2
... ... ... ... ...
i xi ni pi npi
... ... ... ... ...
k xk nk pk npk
n 1 n
290
Solución del test
Hipótesis nula H 0 : X → F ( x )
Estadístico de contraste
( ni − n pi )
2
k
Y =∑ → χ2
n pi ( k −1)−r
i =1
Criterio de rechazo
Yexp ≥ χ 2
α ; ( k −1) − r
291
Ejemplo:
Se mide el número de partículas que llegan a una
determinada zona procedentes de una
sustancia radioactiva en un corto espacio de
tiempo siempre igual, anotándose los
resultados en la siguiente tabla:
Nº de partículas 0 1 2 3 4 5 6
Nº de períodos
269 325 207 82 28 7 2
de tiempo
n
1 0 × 269 + 1 × 325 + .... + 6 × 2
λˆ = x = ∑ n i x i = = 1.24
n i =1 269 + 325 + .... + 2
X → P ( λ = 1.24)
292
Cálculo de probabilidades
P( X = 0) = 0.2898 ; P ( X = 1) = 0.3586 ;
P( X = 2) = 0.2222 ; P ( X = 3) = 0.919
P( X = 4) = 0.0285 ; P ( X = 5) = 0.007
P( X = 6) = 0.0014
H o : X → P(λ = 1.24 )
H1 : X sigue otra distribución
293
Nº de Fr. Ab. Prob.
Partíc Val. Esp. np i
ni pi
0 269 0.2898 266.616
1 325 0.3586 329.912
2 207 0.2222 204.424
3 82 0.0919 84.548
4 28 0.0285 26.22
5 7 0.0070 6.44
6 2 0.0014 1.288
n = 920 1
294
Estadístico de contraste:
( ni − npi )
2
k
Y =∑ → χ 2k −1 −r
np i ( )
i =1
Nº de Gr. de Libertad, (k-1) - r = (6-1) -1 = 4;
r = Nº de Parámetros estimados = 1
2
Criterio de rechazo: Yexp ≥ χ
α ; ( k −1) − r
χ 02.05;4 = 9.49
k (n − np )2 ⇒ No rechazamos H 0
Yexp = ∑ i i = 0.5335
i =1 npi
0.95
0.05
2
Yexp χ 0.05;4
295
8.3.2. Contrastes para la independencia de
dos caracteres
TABLA DE CONTINGENCIA
296
s
ni. = ∑ nij , i = 1, 2,..., r. Total de la i -ésima fila
j =1
r
n. j = ∑ nij , j = 1, 2,..., s. Total de la j -ésima columna
i =1
297
Solución del test
Estadístico de contraste
( )
2
r nij − eij
s
U =∑∑ → χ 2r −1 s −1
e ij ( )( )
i =1 j =1
Criterio de rechazo
Estadístico de contraste
298
Ejemplo:
Un psicólogo realiza una investigación para determinar
si existe asociación aparente entre el peso de un
muchacho y un éxito precoz en la escuela. Se
selecciona una m.a.s. de 500. Se clasifica a cada uno
de acuerdo a dos criterios: el peso y el éxito en la
escuela, obteniéndose los siguientes resultados:
Sobrepeso
Éxito Sí No
Sí 162 263
No 38 37
299
Cálculo de los valores esperados, e ij
eij =
. .
ni n j
n
e11 =
. .
n 1 n 1 425 × 200
= = 170
n 500
Sobrepeso
Éxito Sí No Total
Sí 162 263 425
(170) (255)
No 38 37 75
(30) (45)
Total 200 300 500
300
Estadístico de contraste:
( nij − eij )
2
r s
U =∑∑ → χ 2r −1 s −1
e ij ( )( )
i =1 j =1
U exp =
(162 − 170 )
2
+
( 263 − 255 )
2
+
170 255
+
( 38 − 30 )
2
+
( 37 − 45 )
2
= 4.18
30 45
U exp = 4.18
(r − 1)(s − 1) = 1 ⇒ Rechazamos H o
2
χ 0.05;1 = 3.84
0.95
0.05
2
χ 0.05;1 Uexp
La obesidad y la precocidad en la escuela no son
independientes
301
8.3.3. Contrastes de homogeneidad
TABLA DE CONTINGENCIA
302
Solución del test
Hipótesis nula
H 0: Las muestras son homogéneas
Estadístico de contraste
( nij − eij )
2
r p
U =∑∑ → χ 2r −1 p −1
e ij ( )( )
i =1 j =1
Criterio de rechazo
303
Ejemplo:
Un grupo de personas ha sido expuesto a la
radiactividad de un vertedero con desechos atómicos.
Se realiza una investigación para descubrir si hay
alguna asociación entre la exposición y el desarrollo de
una enfermedad en la sangre. Se eligen 300 personas
expuestas al peligro y 320 no expuestas y se estudia a
cada sujeto para determinar si tiene o no la
enfermedad. ¿Qué se puede concluir a la vista de los
resultados?
Tiene la enfermedad
Radioactividad Sí No
Sí 52 248
No 48 272
Contraste de Hipótesis:
H0 : Hay Homogeneidad
H1 : No Hay Homogeneidad
304
Cálculo de los valores esperados, e i j
eij =
. .
ni n j
n
e 12 =
. .
n 1 n 2 300 × 520
= = 251.61
n 620
Tiene la enfermedad
Radioactividad Sí No Total
Sí 52 248 300
(48.39) (251.61)
No 48 272 320
(51.61) (268.39)
Total 100 520 620
305
Estadístico de contraste:
( nij − eij )
2
r p
U =∑∑ → χ 2r −1 p −1
e ij ( )( )
i =1 j =1
U exp = 0.62
(r − 1)( p − 1) = 1 ⇒ No rechazamos H o
2
χ 0.05;1 = 3.84
0.95
0.05
2
Uexp χ 0.05;1
306
307