C09 Tests para Una Muestra
C09 Tests para Una Muestra
C09 Tests para Una Muestra
Podemos plantear la pregunta anterior como una decisión entre las dos hipótesis
siguientes:
Esta hipótesis alternativa conduce a un test a dos colas, test bilateral. Esto
significa que valores de la media muestral observada suficientemente mayores o
suficientemente menores que 38.9% son evidencia a favor de la hipótesis
alternativa. Equivalentemente, la hipótesis nula no se rechaza cuando x no está
demasiado lejos de 38.9%. “Demasiado lejos” corresponde a valores poco
probables cuando la hipótesis nula es verdadera. Estos valores constituyen la
Región de Rechazo del test.
X − 38.9
Z= 3 ~ N (0,1)
1
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 126
ESTADÍSTICA (Q)
X − 38.9
Z= 3 es llamado estadístico del test
1
Supongamos que estamos realizando un test con nivel de significación 5%, z0.025 =
1.96. Para todas las medias muestrales que se encuentren a más de 1.96 desvíos
(σ/√3) de 38.9 el test resultará en rechazo.
Ejemplo. Continuación.
| 37.46 − 38.9 |
| zobs | = 3 = | −2.49 | = 2.49
1
Como el valor observado del estadístico del test es -2.49, su valor absoluto es
mayor que 1.96, luego se rechaza la hipótesis nula. Los datos proveen suficiente
evidencia a nivel α = 0.05 para decidir que el método introduce sesgo.
a) TEST BILATERAL
Sea X1, ... , Xn una muestra aleatoria de una población normal, N(μ,σ2). Interesa
testear las hipótesis
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 127
ESTADÍSTICA (Q)
Región de rechazo ó región crítica de nivel α está dada por: |Z| ≥ zα/2
b) c) TESTS UNILATERALES
Al testear la hipótesis nula, H0: μ=μ0, hemos elegido rechazarla para aquellos
valores de X alejados de μ0. Si sabemos que la única manera en que no ocurre
esa hipótesis es con valores de μ mayores que μ0 , la hipótesis alternativa es
b) Ha: μ > μ0. En esta situación no interesa rechazar H0 para valores pequeños de
X (ya que un valor de X pequeño es más probable cuando H0 es verdadera que
cuando lo es Ha).
Resumen. Tests para la media de una población Normal con varianza conocida
Sea X1, ... , Xn una muestra aleatoria de una población normal, N(μ,σ2)
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 128
ESTADÍSTICA (Q)
H0: μ = μ0 vs. Ha: μ ≠ μ0 H0: μ = μ0 vs. Ha: μ > μ0 H0: μ = μ0 vs. Ha: μ < μ0
X − μ0
donde el estadístico del test es Z = n
σ
¿Qué significa el nivel del test? Consideremos un test bilateral, en los unilaterales
es similar.
REALIDAD
DECISIÓN H0 Ha
H0 Error de Tipo II
Ha Error de Tipo I
19.4 P-Valor
En la práctica, se obtiene primero el valor del estadístico del test que resulta de los
valores observados. Luego se calcula la probabilidad de que la distribución Normal
estándar se obtenga un valor más alejado que el valor observado del estadístico
del test. Esta probabilidad, llamada p-valor, da el nivel de significación crítico. Es el
nivel que se obtendría al utilizar el valor observado como punto de corte entre la
región de rechazo y la región de no rechazo. Es el menor nivel para el cual se
obtendría rechazo con los datos observados.
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 129
ESTADÍSTICA (Q)
p-valor = P(|Z|≥zobs)
Si |zobs| ≥ zα/2 se rechaza H0
Ejemplo. Continuación
| 37.46 − 38.9 |
| zobs | = 3 = | −2.49 | = 2.49
1
y
⎧⎪ X − μ 0 ⎫⎪
β(μ) = Pμ (aceptar H0) = Pμ ⎨ < zα / 2 ⎬
⎪⎩ σ / n ⎪⎭
⎧⎪ X − μ + μ − μ 0 ⎫⎪ ⎧ μ − μ0 ⎫
= Pμ ⎨ < z α / 2 ⎬ = Pμ ⎨ Z + < zα / 2 ⎬
⎪⎩ σ/ n ⎪⎭ ⎩ σ/ n ⎭
X −μ
donde Z = ~ N (0,1)
σ/ n
Luego
⎧ μ − μ0 ⎫ ⎧ μ −μ μ − μ⎫
β(μ) = Pμ ⎨− z α / 2 < Z + < z α / 2 ⎬ = Pμ ⎨− z α / 2 + 0 < Z < zα / 2 + 0 ⎬
⎩ σ/ n ⎭ ⎩ σ/ n σ/ n⎭
⎛μ −μ ⎞ ⎛μ −μ ⎞
= Φ⎜ 0 + zα / 2 ⎟ − Φ ⎜ 0 − zα / 2 ⎟ (6)
⎝σ / n ⎠ ⎝σ / n ⎠
OBSERVACIÓN
La función π(μ) = 1-β(μ) es llamada función de potencia del test. Para cada valor
de μ, la potencia del test es la probabilidad de rechazo cuando el verdadero
valor es μ.
d β d β d β
2.499 0.295 2.899 0.174 3.299 0.090
2.549 0.278 2.949 0.161 3.349 0.082
2.599 0.261 2.999 0.149 3.399 0.075
2.649 0.245 3.049 0.138 3.449 0.068
2.699 0.230 3.099 0.127 3.499 0.062
2.749 0.215 3.149 0.117 3.549 0.056
2.799 0.201 3.199 0.108 3.599 0.051
2.849 0.187 3.249 0.099 3.649 0.046
n ≅ (2.649 σ / |μ-μ0|)2
Ejemplo. Continuación.
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 132
ESTADÍSTICA (Q)
DESARROLLO ANALÍTICO
⎛ μ − μ1 ⎞ ⎛ μ − μ1 ⎞
β ≈ Φ⎜ 0 + zα / 2 ⎟ − Φ ⎜ 0 − zα / 2 ⎟ (7)
⎝ σ/ n ⎠ ⎝ σ/ n ⎠
⎛ μ − μ1 ⎞
Φ⎜ 0 − zα / 2 ⎟ ≤ Φ (− zα / 2 ) = α / 2
⎝ σ/ n ⎠
⎛ μ − μ1 ⎞
β ≈ Φ⎜ 0 + zα / 2 ⎟
⎝ σ/ n ⎠
⎛ μ − μ1 ⎞
Φ(− z β ) ≈ Φ⎜ 0 + zα / 2 ⎟
⎝ σ/ n ⎠
Luego
μ − μ1
− zβ ≈ 0 + zα / 2
σ/ n
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 133
ESTADÍSTICA (Q)
( zα / 2 + z β ) 2 σ 2
n≈
( μ 0 − μ1 ) 2
⎛μ −μ ⎞ ⎛μ −μ ⎞
= Φ⎜ 0 + zα ⎟ = 1 − Φ⎜ 0 − zα ⎟
⎝σ / n ⎠ ⎝σ / n ⎠
⎛ μ −μ ⎞
= Φ⎜ − 0 + zα ⎟
⎝ σ/ n ⎠
( zα + z β ) 2 σ 2
n=
( μ 0 − μ1 ) 2
OBSERVACIONES
Para verificar que el test sigue siendo de nivel α, tenemos que verificar que la
probabilidad de rechazar H0 cuando H0 es verdadera nunca supera a α.
ó
β(μ) ≥ 1 - α para todo μ ≤ μ0
Pero
⎛μ −μ ⎞
β(μ) = Φ ⎜ 0 + zα ⎟ ≥ Φ (zα ) = 1 − α
⎝σ / n ⎠
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 135
ESTADÍSTICA (Q)
⎛ σ σ ⎞
⎜ X − zα / 2 , X + zα / 2 ⎟
⎝ n n⎠
Por lo tanto si μ = μ0
⎧ ⎛ σ σ ⎞⎫
P ⎨μ 0 ∈ ⎜ X − zα / 2 , X + zα / 2 ⎟⎬ = 1 − α
⎩ ⎝ n n ⎠⎭
Un test de nivel α para testear H0: μ = μ0 contra Ha: μ ≠μ0 de nivel α, basado en el
intervalo, consiste en rechazar H0 cuando
⎛ σ σ ⎞
μ 0 ∉ ⎜ X − zα / 2 , X + zα / 2 ⎟
⎝ n n⎠
⎧ ⎛ σ σ ⎞⎫
P ⎨μ 0 ∉ ⎜ X − zα / 2 , X + zα / 2 ⎟⎬ = α
⎩ ⎝ n n ⎠⎭
⎧ ⎛ σ σ ⎞⎫
α = P ⎨μ 0 ∉ ⎜⎜ X − z α / 2 , X + zα / 2 ⎟⎟⎬
⎩ ⎝ n n ⎠⎭
⎧ σ σ ⎫
= P ⎨μ 0 ≤ X − z α / 2 ó μ 0 ≥ X + zα / 2 ⎬
⎩ n n⎭
⎧ σ σ ⎫
= P ⎨( μ 0 − X ) / ≤ − zα / 2 ó (μ 0 − X ) / ≥ zα / 2 ⎬
⎩ n n ⎭
= P{ Z ≥ z α / 2 }
Sea X1, ... , Xn una muestra aleatoria de una población Normal con media = μ y
varianza = σ2, N(μ,σ2). Supongamos ahora que la varianza es desconocida y
consideremos los mismos tres tipos de hipótesis alternativas sobre μ que vimos
cuando la varianza era conocida.
Tipos de Hipótesis
a) b) c)
H0: μ = μ0 vs. Ha: μ ≠ μ0 H0: μ = μ0 vs. Ha: μ > μ0 H0: μ = μ0 vs. Ha: μ <
μ0
x − 70 77.8 − 70
Tobs = 5 = 5 = 2.1532
S 8 .1
Conclusión
P-valor
x − 70 77.8 − 70
Tobs = 5 = 5 = 2.1532
S 8 .1
Conclusión
Respecto al p-valor, cuando se utilizan tablas sólo es posible obtener una cota, ya
que las tablas proveen solamente algunos valores críticos de la distribución t.
Sea X1, ... , Xn una muestra aleatoria de una población Normal, N(μ,σ2). Los tres
tipos de hipótesis a testear son
a) H0: σ 2 = σ 02 vs Ha: σ 2 ≠ σ 02
(n − 1) S 2
Estadístico del test: U = . Bajo H0: σ 2 = σ 02 , U ~ χ n2−1
σ 02
respectivamente.
Respecto al p-valor, también como en el caso del test t, cuando se utilizan tablas
sólo es posible obtener una cota, ya que las tablas proveen solamente algunos
valores críticos de la distribución χ2.
Interesa saber, a nivel 0.05 si existe evidencia para decidir que la varianza de la
temperatura en ese sector del reactor es mayor que 2 o C . ( )2
(n − 1) S 2
Estadístico del test U = ,
σ2
(n − 1) S 2
Región de rechazo U= ≥ χ n2−1, 0.05
4
2
libertad obtenemos χ 24, 0.05 = 36.42 . Como el valor observado de U es 47.04, se
rechaza H0. Es decir, hay evidencia a nivel 0.05 de que la varianza de la
(
temperatura del reactor es mayor que 2 o C . )2
Sea X 1 , X 2 ,..., X n una m.a. de una distribución con media μ y varianza σ2 < ∞. El
Teorema Central del Límite establece que para n suficientemente grande
X − μ (a)
~ N (0,1)
σ/ n
σ
Además, como S es un estimador consistente de σ,
p
⎯⎯→ 1 , luego
S
X − μ (a) ⎫
n ~ N (0,1) ⎪⎪ X − μ (a )
σ ⎬ ⇒ n ~ N (0,1)
σ p ⎪ S
⎯⎯→ 1
S ⎪⎭
Tipos de hipótesis
a) b) c)
H0: μ = μ0 vs. Ha: μ ≠ μ0 H0: μ = μ0 vs. Ha: μ > μ0 H0: μ = μ0 vs. Ha: μ < μ0
X − μo (a)
Estadístico del test: Z = n . Bajo Ho: μ = μo, Z ~ N(0,1)
S
es el mismo cualquiera sea la hipótesis alternativa de interés y tiene una
distribución aproximadamente Normal cuando μ = μo
b) Ha: μ > μ0 Z ≥ zα
c) Ha: μ < μ0 Z ≤ −z α
⎛ ⎞ ⎛ ⎞
⎜ X − μo ⎟ ⎜ X − μo ⎟
π ( μ ) = Pμ ⎜ ≥ zα / 2 ⎟ = 1 − Pμ ⎜ ≤ zα / 2 ⎟
⎜ s ⎟ ⎜ s ⎟
⎝ n ⎠ ⎝ n ⎠
⎛ ⎞
⎜ X − μ + μ − μo ⎟
= 1 − Pμ ⎜ − zα / 2 ≤ ≤ zα / 2 ⎟
⎜ s ⎟
⎝ n ⎠
⎛ ⎞
⎜ μo − μ X − μ μo − μ ⎟
= 1 − Pμ ⎜ − zα / 2 + ≤ ≤ zα / 2 + ⎟
⎜ s s s ⎟
⎝ n n n ⎠
⎛ ⎞ ⎛ ⎞
⎜ μo − μ ⎟ ⎜ μo − μ ⎟
≅ 1 − Φ⎜ z α / 2 + ⎟ + Φ⎜ − z α / 2 + ⎟
⎜ s ⎟ ⎜ s ⎟
⎝ n ⎠ ⎝ n ⎠
X−p (a )
~ N (0,1)
p(1 − p )
n
n
donde X = ∑ X i / n la proporción muestral o frecuencia relativa de éxitos.
i =1
Tipos de hipótesis
a) b) c)
H0: p = p0 vs. Ha: p ≠ p0 H0: p = p0 vs. Ha: p > p0 H0: p = p0 vs. Ha: p < p0
X − p0 (a)
Estadístico del test: Z = . Bajo H0: p = p0, Z ~ N(0,1)
p 0 (1 − p 0 )
n
Región de rechazo
b) Ha: p > p0 Z ≥ zα
c) Ha:p < p0
Z ≤ −z α
X − λ (a )
~ N (0,1)
λ/n
X − λ0 (a)
Estadístico del test: Z = . Bajo H0:λ = λ0 , Z ~ N(0,1)
λ0 / n
Región de rechazo
b) Ha: λ > λ0 Z ≥ zα
c) Ha: λ < λ0 Z ≤ −z α
Observación: Varios de los procedimientos que hemos visto para el caso en que
la muestra es pequeña requieren del supuesto de Normalidad de los datos. Para
esos métodos si los datos presentan una fuerte asimetría, tienen valores atípicos
o tienen un histograma marcadamente diferente de la curva Normal en algún
sentido, el test NO ES VÁLIDO. Lo mismo ocurre con el intervalo de confianza.
Ordered Data
Frecuencia
80
4
40 2
0 -3 -2 -1 0 1 2 3
0.00.61.2 1.82.43.0 3.64.24.85.46.0 6.67.2
Rankits
DATOS2 Shapiro-Wilk W 0.6672 P(W) 0.0000 200 cases
6
Ordered Data
Frecuencia
80
4
40 2
0 -3 -2 -1 0 1 2 3
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
6.0
6.5
7.0
7.5
8.0
Rankits
DATOS1 Shapiro-Wilk W 0.7006 P(W) 0.0000 200 cases
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 146
ESTADÍSTICA (Q)
0.8
Ordered Data
Frecuencia
10
0.6
0.4
5
0.2
0.0
0
0.02
0.09
0.16
0.23
0.30
0.37
0.44
0.51
0.58
0.65
0.72
0.79
0.86
0.93
1.00
-3 -2 -1 0 1 2 3
DATOS3 Rankits
120 casos Shapiro-Wilk W 0.9495 P(W) 0.0002 120 cases
Test de Shapiro-Wilk
VARIABLE N W P
--------- ----- ------- -------
CONC 5 0.9752 0.9074
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 147
ESTADÍSTICA (Q)