Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

C09 Tests para Una Muestra

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

Tests de Hipótesis basados en una muestra. Dra.

Diana Kelmansky 125


ESTADÍSTICA (Q)

19. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL


CON VARIANZA CONOCIDA

19.1 Desarrollo de un ejemplo

Interesa saber si el método de absorción atómica de vapor frío para determinar


mercurio introduce errores sistemáticos. Se determina el porcentaje de mercurio
en un material estándar de referencia que contiene 38.9% de mercurio,
obteniéndose los siguientes valores expresados en porcentaje: 37.9, 37.4, 37.1.
Esperamos que el promedio de los valores observados ( que en este caso vale
x = 37.46 ) esté cerca del valor verdadero.

¿Es la diferencia entre el valor promedio observado y el valor medio esperado


atribuible al azar, ó es por algo más: presencia de error sistemático?

Podemos plantear la pregunta anterior como una decisión entre las dos hipótesis
siguientes:

- Hipótesis nula (H0): diferencia atribuible al azar


- Hipótesis alternativa (Ha): fue por algo más (error sistemático).

Sea X = porcentaje de mercurio obtenido en una determinación, supongamos que


X es una variable aleatoria con distribución X ~ N ( μ, 1). Esto significa que el valor
observado es igual a μ más un error que tiene media 0 y varianza 1:
X=μ+ε
ε ~ N ( 0,1 ). Consideremos X1, X2, X3 variables aleatorias independientes e
igualmente distribuidas que X, suponemos que los datos (37.9, 37.4, 37.1) son
valores observados de dichas variables. Si las mediciones no tienen sesgo μ =
38.9% ( μ0 ). Si además no se tienen razones para suponer que el sesgo debe ser
en algún sentido ya sea mayor o menor, podemos escribir las hipótesis nula y
alternativa de la siguiente manera:
H0: μ = μ0 contra Ha: μ ≠ μ0

Esta hipótesis alternativa conduce a un test a dos colas, test bilateral. Esto
significa que valores de la media muestral observada suficientemente mayores o
suficientemente menores que 38.9% son evidencia a favor de la hipótesis
alternativa. Equivalentemente, la hipótesis nula no se rechaza cuando x no está
demasiado lejos de 38.9%. “Demasiado lejos” corresponde a valores poco
probables cuando la hipótesis nula es verdadera. Estos valores constituyen la
Región de Rechazo del test.

Si la hipótesis nula es verdadera tenemos

X − 38.9
Z= 3 ~ N (0,1)
1
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 126
ESTADÍSTICA (Q)

X − 38.9
Z= 3 es llamado estadístico del test
1

Regla de decisión a nivel α

Rechazo H0 si |Z|≥ zα/2

No rechazo H0 si |Z| < zα/2

Supongamos que estamos realizando un test con nivel de significación 5%, z0.025 =
1.96. Para todas las medias muestrales que se encuentren a más de 1.96 desvíos
(σ/√3) de 38.9 el test resultará en rechazo.

¿Qué significa que el test tenga nivel α = 0.05? Es la probabilidad de tomar la


decisión equivocada de decidir que se están realizando determinaciones con
sesgo cuando en realidad las mediciones no tienen sesgo.

P (rechazar H0 cuando H0 es verdadera (μ = 38.9)) = Pμ0( |Z|≥ 1.96) = 0.05

Ejemplo. Continuación.

¿Qué decisión se toma en este caso con x = 37.46 a nivel α = 0.05?

| 37.46 − 38.9 |
| zobs | = 3 = | −2.49 | = 2.49
1

Como el valor observado del estadístico del test es -2.49, su valor absoluto es
mayor que 1.96, luego se rechaza la hipótesis nula. Los datos proveen suficiente
evidencia a nivel α = 0.05 para decidir que el método introduce sesgo.

19.2 TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL


CON VARIANZA CONOCIDA. FORMA GENERAL.

a) TEST BILATERAL

Sea X1, ... , Xn una muestra aleatoria de una población normal, N(μ,σ2). Interesa
testear las hipótesis
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 127
ESTADÍSTICA (Q)

H0: μ = μ0 contra Ha: μ ≠ μ0

El estadístico del test


X − μ0
Z= n
σ

tiene distribución N(0,1) cuando μ = μ0 (H0 es verdadera)

Región de rechazo ó región crítica de nivel α está dada por: |Z| ≥ zα/2

b) c) TESTS UNILATERALES

Al testear la hipótesis nula, H0: μ=μ0, hemos elegido rechazarla para aquellos
valores de X alejados de μ0. Si sabemos que la única manera en que no ocurre
esa hipótesis es con valores de μ mayores que μ0 , la hipótesis alternativa es
b) Ha: μ > μ0. En esta situación no interesa rechazar H0 para valores pequeños de
X (ya que un valor de X pequeño es más probable cuando H0 es verdadera que
cuando lo es Ha).

Resumen. Tests para la media de una población Normal con varianza conocida

Sea X1, ... , Xn una muestra aleatoria de una población normal, N(μ,σ2)
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 128
ESTADÍSTICA (Q)

Hipótesis a testear: tipo a) Hipótesis a testear: tipo b) Hipótesis a testear: tipo c)

H0: μ = μ0 vs. Ha: μ ≠ μ0 H0: μ = μ0 vs. Ha: μ > μ0 H0: μ = μ0 vs. Ha: μ < μ0

Región de rechazo: Región de rechazo: Región de rechazo:


|Z| ≥ zα/2 Z ≥ zα Z ≤ - zα

X − μ0
donde el estadístico del test es Z = n
σ

Es incorrecto utilizar una región de rechazo unilateral cuando en realidad debería


utilizarse una bilateral. ¿Por qué? Observe que zα/2 > zα .

¿Qué significa el nivel del test? Consideremos un test bilateral, en los unilaterales
es similar.

P(Rechazar H0, cuando H0 es verdadera) = P(|Z|≥ zα/2) = α

Mediante el nivel α utilizado controlamos la probabilidad de equivocarnos al


rechazar H0 cuando H0 es verdadera.

19.3 TIPOS DE ERRORES

REALIDAD
DECISIÓN H0 Ha
H0 Error de Tipo II
Ha Error de Tipo I

El nivel del test controla la probabilidad del Error de Tipo I

19.4 P-Valor

En la práctica, se obtiene primero el valor del estadístico del test que resulta de los
valores observados. Luego se calcula la probabilidad de que la distribución Normal
estándar se obtenga un valor más alejado que el valor observado del estadístico
del test. Esta probabilidad, llamada p-valor, da el nivel de significación crítico. Es el
nivel que se obtendría al utilizar el valor observado como punto de corte entre la
región de rechazo y la región de no rechazo. Es el menor nivel para el cual se
obtendría rechazo con los datos observados.
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 129
ESTADÍSTICA (Q)

p-valor = P(|Z|≥zobs)
Si |zobs| ≥ zα/2 se rechaza H0

Si |zobs| < zα/2 no se rechaza H0

Ejemplo. Continuación
| 37.46 − 38.9 |
| zobs | = 3 = | −2.49 | = 2.49
1
y

p-valor = P(|Z|≥2.49) = 2 P(Z ≥ 2.49) =2 x 0.0064 = 0.013

El p-valor es menor que el nivel prefijado 0.05. Rechazamos la hipótesis nula.


Cuanto más chico es el p-valor mayor es la evidencia a favor de la hipótesis
alternativa.

19.5 PROBABILIDAD DE ERROR DE TIPO II

La probabilidad de cometer un error de tipo II, es decir aceptar H0 cuando en


realidad Ha es verdadera depende del valor μ en el que es verdadera Ha.

⎧⎪ X − μ 0 ⎫⎪
β(μ) = Pμ (aceptar H0) = Pμ ⎨ < zα / 2 ⎬
⎪⎩ σ / n ⎪⎭

Ahora el μ0 que aparece restando no es la media verdadera, por lo tanto la


expresión dentro del valor absoluto no tiene distribución N(0,1).
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 130
ESTADÍSTICA (Q)

⎧⎪ X − μ + μ − μ 0 ⎫⎪ ⎧ μ − μ0 ⎫
= Pμ ⎨ < z α / 2 ⎬ = Pμ ⎨ Z + < zα / 2 ⎬
⎪⎩ σ/ n ⎪⎭ ⎩ σ/ n ⎭

X −μ
donde Z = ~ N (0,1)
σ/ n
Luego

⎧ μ − μ0 ⎫ ⎧ μ −μ μ − μ⎫
β(μ) = Pμ ⎨− z α / 2 < Z + < z α / 2 ⎬ = Pμ ⎨− z α / 2 + 0 < Z < zα / 2 + 0 ⎬
⎩ σ/ n ⎭ ⎩ σ/ n σ/ n⎭

⎛μ −μ ⎞ ⎛μ −μ ⎞
= Φ⎜ 0 + zα / 2 ⎟ − Φ ⎜ 0 − zα / 2 ⎟ (6)
⎝σ / n ⎠ ⎝σ / n ⎠

donde φ es la función de distribución acumulada de la Normal.

La función β(μ) es llamada curva Característica de Operación (Operating


Characteristic-OC- curve).

Curva OC para α =0.05, d = (√n/σ)|μ-μ0|

Para un nivel de significación fijo α, la curva OC dada por la ecuación (6) es


simétrica alrededor de μ0 y depende de μ solamente a través de d = (√n/σ)|μ-μ0|.
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 131
ESTADÍSTICA (Q)

Ejemplo. Continuación. Para el test propuesto, obtengamos la probabilidad de


aceptar la hipótesis nula de que μ = 38.9 (esto es que medimos sin sesgo) cuando
en realidad estamos cometiendo un error sistemático de -0.5 = μ-μ0

Luego d = (√3/1)|-0.5| = 0.5√3 = 0.866. Luego, como z0.025 = 1.96,


β(10) = φ(0.866 + 1.96) - φ(0.866 - 1.96)
= φ(2.826) -φ(-1.094) = 0.99764 - 0.13698 = 0.86066

OBSERVACIÓN

La función π(μ) = 1-β(μ) es llamada función de potencia del test. Para cada valor
de μ, la potencia del test es la probabilidad de rechazo cuando el verdadero
valor es μ.

19. 6 DETERMINACIÓN DEL TAMAÑO DE MUESTRA

La función Característica de Operación (y equivalentemente la función de


potencia) es útil para determinar cuan grande debe ser el tamaño de la muestra de
manera que se cumplan ciertas especificaciones sobre la probabilidad de un error
de tipo II.

De acuerdo con la curva Característica de Operación (ver figura), como d =


(√n/σ)|μ-μ0|, para una diferencia μ-μ0 fija a medida que aumenta n también
aumenta d y por lo tanto decrece la probabilidad de aceptar H0.

Valores de d y β de la función Característica de Operación con α = 0.05

d β d β d β
2.499 0.295 2.899 0.174 3.299 0.090
2.549 0.278 2.949 0.161 3.349 0.082
2.599 0.261 2.999 0.149 3.399 0.075
2.649 0.245 3.049 0.138 3.449 0.068
2.699 0.230 3.099 0.127 3.499 0.062
2.749 0.215 3.149 0.117 3.549 0.056
2.799 0.201 3.199 0.108 3.599 0.051
2.849 0.187 3.249 0.099 3.649 0.046

Si nos interesa un β aproximadamente igual a 0.25 resulta d = (√n/σ)|μ-μ0|= 2.649

n ≅ (2.649 σ / |μ-μ0|)2

Ejemplo. Continuación.
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 132
ESTADÍSTICA (Q)

¿Cuántas determinaciones deben realizarse para que la probabilidad de no


rechazar H0: μ=38.9 sea β ≅ 0.25 cuando en realidad las observaciones tienen un
sesgo de -0.5 ? y para β ≅ 0.15?

Para β ≅ 0.25 resulta n ≅ (2.649 1 / |0.5|)2=(2*2.649)2 = 28.69

Para β ≅ 0.15 resulta n ≅ (2*2.999)2 = 35.97

Si se realizan 36 determinaciones el porcentaje de veces que se cometerá el error


de no rechazar H0 cuando se están realizando determinaciones sesgadas es del
15%.

DESARROLLO ANALÍTICO

Por ejemplo, supongamos que nos interesa determinar un tamaño de muestra de


manera que la probabilidad de aceptar H0 μ= μ0 cuando la verdadera media es μ1
sea aproximadamente β. Queremos hallar n de manera que β(μ1) ≅ β. De la
ecuación (6) resulta

⎛ μ − μ1 ⎞ ⎛ μ − μ1 ⎞
β ≈ Φ⎜ 0 + zα / 2 ⎟ − Φ ⎜ 0 − zα / 2 ⎟ (7)
⎝ σ/ n ⎠ ⎝ σ/ n ⎠

La ecuación anterior no tiene una solución analítica inmediata, sin embargo


podemos hallar una solución aproximada.

Si μ1 > μ0 , como φ es una función creciente

⎛ μ − μ1 ⎞
Φ⎜ 0 − zα / 2 ⎟ ≤ Φ (− zα / 2 ) = α / 2
⎝ σ/ n ⎠

Por lo tanto podemos despreciar el segundo sumando de (7)

⎛ μ − μ1 ⎞
β ≈ Φ⎜ 0 + zα / 2 ⎟
⎝ σ/ n ⎠

⎛ μ − μ1 ⎞
Φ(− z β ) ≈ Φ⎜ 0 + zα / 2 ⎟
⎝ σ/ n ⎠

Luego

μ − μ1
− zβ ≈ 0 + zα / 2
σ/ n
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 133
ESTADÍSTICA (Q)

( zα / 2 + z β ) 2 σ 2
n≈
( μ 0 − μ1 ) 2

Ejemplo. Continuación. Recordemos que interesaba calcular cuántas


determinaciones es necesario realizar para que la probabilidad de no rechazar H0:
μ=38.9 sea β ≅ 0.25 cuando en realidad las observaciones tienen un sesgo de -0.5
y también para β ≅ 0.15?

Como z0.025 = 1.96, z0.25 = 0.67, z0.15 = 1.04, μ-μ0 = 0.5, σ = 1

• para β ≅ 0.25 resulta n ≅ (1.96+0.67)2 4= 27.68,

• para β ≅ 0.15 resulta n ≅ (1.96+1.04)2 4= 36.

Los resultados son similares a los obtenidos directamente de la curva O C.

En el caso de tests unilaterales teníamos

Hipótesis a testear Hipótesis a testear

b) H0: μ = μ0 vs. Ha: μ > μ0 c) H0: μ = μ0 vs. Ha: μ < μ0

Región de rechazo: Región de rechazo:


Z ≥ zα Z ≤ - zα

por lo tanto a probabilidad de cometer un error de tipo II, es decir no rechazar H0


cuando en realidad (la alternativa) Ha es verdadera en el valor μ es:

β(μ) = Pμ (no rechazar H0)

Ha: μ > μ0 Ha: μ < μ0


⎧ X − μ0 ⎫ ⎧ X − μ0 ⎫
β(μ) = Pμ ⎨ < zα ⎬ β(μ) = Pμ ⎨ > − zα ⎬
⎩σ / n ⎭ ⎩σ / n ⎭
⎧ μ − μ0 ⎫ ⎧ μ − μ0 ⎫
= Pμ ⎨Z + < zα ⎬ = Pμ ⎨Z + > − zα ⎬
⎩ σ/ n ⎭ ⎩ σ/ n ⎭
⎧ μ −μ ⎫ ⎧ μ −μ ⎫
= Pμ ⎨Z < 0 + zα ⎬ = Pμ ⎨Z > 0 − zα ⎬
⎩ σ/ n ⎭ ⎩ σ/ n ⎭
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 134
ESTADÍSTICA (Q)

⎛μ −μ ⎞ ⎛μ −μ ⎞
= Φ⎜ 0 + zα ⎟ = 1 − Φ⎜ 0 − zα ⎟
⎝σ / n ⎠ ⎝σ / n ⎠
⎛ μ −μ ⎞
= Φ⎜ − 0 + zα ⎟
⎝ σ/ n ⎠

Para ambas hipótesis alternativas unilaterales el tamaño de muestra para obtener


una probabilidad de cometer un error de tipo II β es:

( zα + z β ) 2 σ 2
n=
( μ 0 − μ1 ) 2

OBSERVACIONES

1. En el caso de tests unilaterales no es necesario aproximar para obtener el


tamaño de muestra.

2. Como φ es una función de distribución acumulada, es una función creciente


⎛μ −μ ⎞
de su argumento. Resulta entonces que β(μ) = Φ ⎜ 0 + zα ⎟ es una función
⎝σ / n ⎠
decreciente de μ. Esto es coherente con la intuición ya que es razonable que
cuanto más alejada de μ0 esté la media verdadera μ tanto menos probable será
no rechazar H0.

3. El test cuya región de rechazo es Z ≥ zα , fue diseñado para decidir entre


H0: μ = μ0 y Ha: μ > μ0 también puede utilizarse para testear las hipótesis

H0: μ ≤ μ0 contra Ha: μ > μ0.

Para verificar que el test sigue siendo de nivel α, tenemos que verificar que la
probabilidad de rechazar H0 cuando H0 es verdadera nunca supera a α.

Debemos verificar que

1-β(μ) ≤ α para todo μ ≤ μ0

ó
β(μ) ≥ 1 - α para todo μ ≤ μ0
Pero

⎛μ −μ ⎞
β(μ) = Φ ⎜ 0 + zα ⎟ ≥ Φ (zα ) = 1 − α
⎝σ / n ⎠
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 135
ESTADÍSTICA (Q)

4. Análogamente, cuando la alternativa es Ha: μ < μ0 la hipótesis nula se puede


extender a H0: μ ≥ μ0 es decir que el test unilateral se extiende a

H0: μ ≥ μ0 contra Ha: μ < μ0

19.7 RELACIÓN ENTRE INTERVALOS DE CONFIANZA Y


TESTS DE HIPÓTESIS BILATERALES

Un intervalo de confianza para μ basado en una muestra normal con varianza


conocida σ2 con nivel de confianza 100(1-α)% es

⎛ σ σ ⎞
⎜ X − zα / 2 , X + zα / 2 ⎟
⎝ n n⎠

Por lo tanto si μ = μ0

⎧ ⎛ σ σ ⎞⎫
P ⎨μ 0 ∈ ⎜ X − zα / 2 , X + zα / 2 ⎟⎬ = 1 − α
⎩ ⎝ n n ⎠⎭

Un test de nivel α para testear H0: μ = μ0 contra Ha: μ ≠μ0 de nivel α, basado en el
intervalo, consiste en rechazar H0 cuando

⎛ σ σ ⎞
μ 0 ∉ ⎜ X − zα / 2 , X + zα / 2 ⎟
⎝ n n⎠

⎧ ⎛ σ σ ⎞⎫
P ⎨μ 0 ∉ ⎜ X − zα / 2 , X + zα / 2 ⎟⎬ = α
⎩ ⎝ n n ⎠⎭

Este test es idéntico al presentado anteriormente:


Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 136
ESTADÍSTICA (Q)

⎧ ⎛ σ σ ⎞⎫
α = P ⎨μ 0 ∉ ⎜⎜ X − z α / 2 , X + zα / 2 ⎟⎟⎬
⎩ ⎝ n n ⎠⎭
⎧ σ σ ⎫
= P ⎨μ 0 ≤ X − z α / 2 ó μ 0 ≥ X + zα / 2 ⎬
⎩ n n⎭
⎧ σ σ ⎫
= P ⎨( μ 0 − X ) / ≤ − zα / 2 ó (μ 0 − X ) / ≥ zα / 2 ⎬
⎩ n n ⎭
= P{ Z ≥ z α / 2 }

19.8 TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL


CON VARIANZA DESCONOCIDA

Sea X1, ... , Xn una muestra aleatoria de una población Normal con media = μ y
varianza = σ2, N(μ,σ2). Supongamos ahora que la varianza es desconocida y
consideremos los mismos tres tipos de hipótesis alternativas sobre μ que vimos
cuando la varianza era conocida.
Tipos de Hipótesis
a) b) c)
H0: μ = μ0 vs. Ha: μ ≠ μ0 H0: μ = μ0 vs. Ha: μ > μ0 H0: μ = μ0 vs. Ha: μ <
μ0

Como la varianza es desconocida, la estimamos por S y resulta el siguiente:


X − μ0
Estadístico del test: T = n . Bajo H0: μ = μ0, T ~ tn-1
S
es el mismo cualquiera sea la hipótesis alternativa de interés y tiene distribución t
con n-1 grados de libertad cuando μ = μ0

Región de rechazo: La forma de la zona de rechazo depende del tipo de hipótesis


alternativa y del nivel del test.

Tipo de Región de Rechazo


Hipótesis alternativa de nivel α
a) Ha: μ ≠ μ0 T ≥ t n −1, α / 2

b) Ha: μ > μ0 T ≥ t n −1, α

c) Ha: μ < μ0 T ≤ −t n −1, α


Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 137
ESTADÍSTICA (Q)

Ejemplo: Se quiere decidir si un espectrofotómetro está calibrado. Para ello se


obtienen 5 determinaciones de un gas estándar cuya concentración de CO es de
70 ppm obteniéndose los siguientes datos: 78, 83, 68, 72, 88. Supongamos que
las observaciones se realizan de manera que pueden considerarse independientes
e idénticamente distribuidas y que provienen de una distribución Normal. Esto es:
Modelo: (X1, X2, X3, X4, X5) v.a.i.i.d. N(μ,σ2)
Pregunta: ¿Existe evidencia para pensar que el espectrofotómetro funciona mal y
las mediciones tienen un error sistemático ó el hecho que 4 de los valores sean
mayores que 70 pueden explicarse por variabilidad aleatoria?

A priori no podemos suponer en qué sentido será el sesgo.

Planteo 1. Consideramos un test bilateral

Hipótesis: H0: μ = 70 vs. Ha: μ ≠ 70


X − 70
Estadístico del test: T = n
S
como n = 5 y α = 0.05 utilizando el valor crítico t 4, 0.025 = 2.78 resulta la siguiente
Región de Rechazo a nivel α = 0.05: T ≥ 2 . 78

Valor observado del estadístico del test:

x − 70 77.8 − 70
Tobs = 5 = 5 = 2.1532
S 8 .1

Conclusión

Como Tobs = 2.1532 < 2.78 no rechazo H0 a nivel 0.05

P-valor

Es la probabilidad de rechazar H0 cuando μ = μ0 y utilizo el Tobs como valor


crítico:

Utilizando el Statistix (Statistics -> Probability functions-> 2-Tail (x, df))


p-valor = P( T ≥ 2.1532 ) = 0.09763
Utilizando las tablas de la t con 4 grados de libertad
= 2 P(T ≥ 2.1532) ≈ 2 P(T ≥ 2.132) = 2 (0.05) = 0.10

Si el técnico que utiliza el espectrofotómetro sabe que este tiende a dar


únicamente valores mayores que el esperado utilizamos el
Planteo 2. Consideramos un test unilateral
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 138
ESTADÍSTICA (Q)

Hipótesis: H0: μ = 70 vs. Ha: μ > 70


X − 70
Estadístico del test: T = n
S
como n = 5 y α = 0.05 utilizando el valor crítico t 4, 0.05 = 2.13 resulta la siguiente
Región de Rechazo a nivel α = 0.05: T ≥ 2.13
Valor observado del estadístico del test:

x − 70 77.8 − 70
Tobs = 5 = 5 = 2.1532
S 8 .1

Conclusión

Como Tobs = 2.1532 ≥ 2.13 sí rechazo H0 a nivel 0.05

p-valor = P(T ≥ 2.1532)= 0.04882 (Utilizando el Statistix)


Utilizando las tablas de la t con 4 grados de libertad
= P(T ≥ 2.1532) ≈ P(T ≥ 2.132) = 0.05

¿Cómo se explica esta aparente contradicción?

Función de potencia y cálculo del tamaño de muestra para obtener una


probabilidad de error tipo II dada: La función de potencia de este test es
complicada porque la distribución del estadístico cuando μ ≠ μo es una distribución
t no central. Aunque hay tablas y gráficos que permiten obtener probabilidades
para una distribución de este tipo, no los estudiaremos en este curso. Por la
misma razón, no calcularemos tamaño de muestra para obtener una probabilidad
de error tipo II dada para una alternativa fija.

Respecto al p-valor, cuando se utilizan tablas sólo es posible obtener una cota, ya
que las tablas proveen solamente algunos valores críticos de la distribución t.

19.9 TESTS PARA LA VARIANZA DE UNA POBLACIÓN NORMAL


CUANDO LA MEDIA ES DESCONOCIDA

Sea X1, ... , Xn una muestra aleatoria de una población Normal, N(μ,σ2). Los tres
tipos de hipótesis a testear son

a) H0: σ 2 = σ 02 vs Ha: σ 2 ≠ σ 02

b) H0: σ 2 = σ 02 vs Ha: σ 2 > σ 02


Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 139
ESTADÍSTICA (Q)

c) H0: σ 2 = σ 02 vs. Ha: σ 2 < σ 02

(n − 1) S 2
Estadístico del test: U = . Bajo H0: σ 2 = σ 02 , U ~ χ n2−1
σ 02

Región de rechazo: Como siempre la forma de la zona de rechazo depende del


tipo de hipótesis alternativa. Para cada tipo, estará dada por
U ≥ χ n2−1, α / 2 ó U ≤ χ n2−1, 1-α / 2
a)
U ≥ χ n2−1, α
b)
U ≤ χ n2−1, 1−α
c)

respectivamente.

Función de potencia y cálculo del tamaño de muestra para obtener una


probabilidad de error tipo II dada: Como en el caso del test t, la función de
potencia de este test es complicada porque la distribución del estadístico cuando
σ 2 ≠ σ o2 es una distribución no central. No la estudiaremos en este curso y, por la
misma razón, no calcularemos tamaño de muestra para obtener una probabilidad
de error tipo II dada, para una alternativa fija.

Respecto al p-valor, también como en el caso del test t, cuando se utilizan tablas
sólo es posible obtener una cota, ya que las tablas proveen solamente algunos
valores críticos de la distribución χ2.

Ejemplo: Se toman 25 determinaciones de la temperatura en cierto sector de un


reactor, obteniéndose s = 2.8 o C

Interesa saber, a nivel 0.05 si existe evidencia para decidir que la varianza de la
temperatura en ese sector del reactor es mayor que 2 o C . ( )2

Hipótesis a testear H0: σ 2 = 4 vs Ha: σ 2 > 4

(n − 1) S 2
Estadístico del test U = ,
σ2

(n − 1) S 2
Región de rechazo U= ≥ χ n2−1, 0.05
4

Tenemos que n = 25, luego de la tabla de una ji-cuadrado con 24 grados de


Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 140
ESTADÍSTICA (Q)

2
libertad obtenemos χ 24, 0.05 = 36.42 . Como el valor observado de U es 47.04, se
rechaza H0. Es decir, hay evidencia a nivel 0.05 de que la varianza de la
(
temperatura del reactor es mayor que 2 o C . )2

20. TESTS DE HIPÓTESIS DE NIVEL APROXIMADO (O ASINTÓTICO) α


PARA LA MEDIA DE UNA DISTRIBUCIÓN CUALQUIERA

Sea X 1 , X 2 ,..., X n una m.a. de una distribución con media μ y varianza σ2 < ∞. El
Teorema Central del Límite establece que para n suficientemente grande

X − μ (a)
~ N (0,1)
σ/ n

σ
Además, como S es un estimador consistente de σ,
p
⎯⎯→ 1 , luego
S

X − μ (a) ⎫
n ~ N (0,1) ⎪⎪ X − μ (a )
σ ⎬ ⇒ n ~ N (0,1)
σ p ⎪ S
⎯⎯→ 1
S ⎪⎭

Observación: No se establece ninguna condición sobre la distribución de los


datos solamente es necesario que el tamaño de la muestra sea grande. Los
valores críticos de las regiones de rechazo se obtendrán de la distribución Normal
estándar.

Nuevamente consideremos los siguientes

Tipos de hipótesis
a) b) c)
H0: μ = μ0 vs. Ha: μ ≠ μ0 H0: μ = μ0 vs. Ha: μ > μ0 H0: μ = μ0 vs. Ha: μ < μ0

X − μo (a)
Estadístico del test: Z = n . Bajo Ho: μ = μo, Z ~ N(0,1)
S
es el mismo cualquiera sea la hipótesis alternativa de interés y tiene una
distribución aproximadamente Normal cuando μ = μo

Región de rechazo: La forma de la zona de rechazo depende de la hipótesis


alternativa.
Tipo de Región de Rechazo
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 141
ESTADÍSTICA (Q)

Hipótesis alternativa de nivel aproximado α


a) Ha: μ ≠ μ0 Z ≥ z α /2

b) Ha: μ > μ0 Z ≥ zα

c) Ha: μ < μ0 Z ≤ −z α

Función de potencia aproximada: Consideremos como ejemplo el tipo a), la


función de potencia aproximada se obtiene en la forma siguiente:

⎛ ⎞ ⎛ ⎞
⎜ X − μo ⎟ ⎜ X − μo ⎟
π ( μ ) = Pμ ⎜ ≥ zα / 2 ⎟ = 1 − Pμ ⎜ ≤ zα / 2 ⎟
⎜ s ⎟ ⎜ s ⎟
⎝ n ⎠ ⎝ n ⎠

⎛ ⎞
⎜ X − μ + μ − μo ⎟
= 1 − Pμ ⎜ − zα / 2 ≤ ≤ zα / 2 ⎟
⎜ s ⎟
⎝ n ⎠

⎛ ⎞
⎜ μo − μ X − μ μo − μ ⎟
= 1 − Pμ ⎜ − zα / 2 + ≤ ≤ zα / 2 + ⎟
⎜ s s s ⎟
⎝ n n n ⎠

⎛ ⎞ ⎛ ⎞
⎜ μo − μ ⎟ ⎜ μo − μ ⎟
≅ 1 − Φ⎜ z α / 2 + ⎟ + Φ⎜ − z α / 2 + ⎟
⎜ s ⎟ ⎜ s ⎟
⎝ n ⎠ ⎝ n ⎠

En forma similar, se obtiene la función de potencia aproximada en los otros dos


tipos de hipótesis alternativas unilaterales ( b) y c) ).

En las secciones siguientes veremos que cuando la varianza y la media


dependen del mismo parámetro, no es necesario reemplazar σ por un estimador.
Se lo reemplaza por el valor que determina la hipótesis nula.

20.1. TEST DE HIPÓTESIS DE NIVEL APROXIMADO (O ASINTÓTICO) α PARA


UNA PROPORCIÓN (PARÁMETRO p DE LA DISTRIBUCIÓN BINOMIAL)
n
Sea X 1 , X 2 ,..., X n una m.a. de una distribución Bi(1,p), luego ∑ X i ~ Bi(n,p).
i =1
Aplicando el Teorema Central del Límite, si n es suficientemente grande,
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 142
ESTADÍSTICA (Q)

X−p (a )
~ N (0,1)
p(1 − p )
n

n
donde X = ∑ X i / n la proporción muestral o frecuencia relativa de éxitos.
i =1

Nuevamente consideramos los siguientes tres

Tipos de hipótesis
a) b) c)
H0: p = p0 vs. Ha: p ≠ p0 H0: p = p0 vs. Ha: p > p0 H0: p = p0 vs. Ha: p < p0
X − p0 (a)
Estadístico del test: Z = . Bajo H0: p = p0, Z ~ N(0,1)
p 0 (1 − p 0 )
n
Región de rechazo

Tipo de Región de Rechazo


Hipótesis alternativa de nivel aproximado α
a) Ha: p ≠ p0 Z ≥ zα / 2

b) Ha: p > p0 Z ≥ zα

c) Ha:p < p0
Z ≤ −z α

20.2 TEST DE HIPÓTESIS DE NIVEL APROXIMADO α


PARA EL PARÁMETRO λ DE UNA DISTRIBUCIÓN POISSON

Sea X 1 , X 2 ,..., X n una m.a. de una distribución de Poisson de parámetro λ.


Entonces, si n es suficientemente grande,

X − λ (a )
~ N (0,1)
λ/n

Nuevamente consideramos los siguientes tres


Tipos de hipótesis
a) b) c)
H0: λ = λ0 vs. Ha: λ ≠ λ0 H0: λ = λ0 vs. Ha: λ > λ0 H0: l = l0 vs. Ha: λ < λ0
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 143
ESTADÍSTICA (Q)

X − λ0 (a)
Estadístico del test: Z = . Bajo H0:λ = λ0 , Z ~ N(0,1)
λ0 / n
Región de rechazo

Hipótesis alternativa Región de Rechazo


de nivel aproximado α
a) Ha: λ ≠ λ0 Z ≥ zα / 2

b) Ha: λ > λ0 Z ≥ zα

c) Ha: λ < λ0 Z ≤ −z α

Observación: Varios de los procedimientos que hemos visto para el caso en que
la muestra es pequeña requieren del supuesto de Normalidad de los datos. Para
esos métodos si los datos presentan una fuerte asimetría, tienen valores atípicos
o tienen un histograma marcadamente diferente de la curva Normal en algún
sentido, el test NO ES VÁLIDO. Lo mismo ocurre con el intervalo de confianza.

21. EVALUACIÓN DEL SUPUESTO DE NORMALIDAD

Dado un conjunto de datos consideraremos dos estrategias para evaluar si es


razonable suponer que en la población de la cual proviene la muestra, la variable
de interés tiene una distribución aproximadamente normal.
Métodos Gráficos Métodos Analíticos (Tests de hipótesis)
• Box-plot • Test de Shapiro-Wilk
• Histograma • Otros tests que no detallaremos
• Gráfico de tallo-hojas tales como: Lilliefords,
• Gráfico de Probabilidad Kolmogorov-Smirnov, etc.
normal (Q-Q plot)

En general, se decidirá si no existen alejamientos GROSEROS de la distribución


normal. Si alguno de los métodos muestra claramente que la distribución de los
datos no puede suponerse normal, entonces, habrá que abandonar los métodos
estadísticos que tienen como supuestos esta distribución.

Gráfico de Probabilidad normal (Q-Q plot)


Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 144
ESTADÍSTICA (Q)

El gráfico de probabilidad normal es un diagrama de dispersión de los percentiles


empíricos (datos ordenados) versus los percentiles teóricos de la distribución
Normal.
Si la muestra proviene de una distribución normal los puntos se encontrarán, salvo
por fluctuaciones aleatorias, sobre una recta. Alejamientos de la distribución
normal producen diferentes curvaturas que sugieren qué tipo de distribución puede
tener la variable. Para los datos de concentración de CO no se observan
importantes alejamientos de la linealidad.

La figura siguiente muestra el gráfico de probabilidad normal para los datos de


concentración de CO (78, 83, 68, 72, 88).

Las figuras siguientes muestran los histogramas de conjuntos de datos con


diferentes alejamientos de la Normalidad y sus correspondientes gráficos de
probabilidad normal.
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 145
ESTADÍSTICA (Q)

Histograma y gráfico de probabilidad normal para un conjunto de datos con


ASIMETRÍA A IZQUIERDA o COLA PESADA A IZQUIERDA
Histograma Normal Probability Plot of DATOS2
120 8

Ordered Data
Frecuencia

80
4

40 2

0 -3 -2 -1 0 1 2 3
0.00.61.2 1.82.43.0 3.64.24.85.46.0 6.67.2
Rankits
DATOS2 Shapiro-Wilk W 0.6672 P(W) 0.0000 200 cases

Los gráficos de probabilidad normal se obtienen mediante: Statistics ->


Randomness-Normality test ->Normal Probability plot

Histograma y gráfico de probabilidad normal para un conjunto de datos con


ASIMETRIA A DERECHA o COLA PESADA A DERECHA
Histograma Normal Probability Plot of DATOS1
120 8

6
Ordered Data
Frecuencia

80
4

40 2

0 -3 -2 -1 0 1 2 3
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
6.0
6.5
7.0
7.5
8.0

Rankits
DATOS1 Shapiro-Wilk W 0.7006 P(W) 0.0000 200 cases
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 146
ESTADÍSTICA (Q)

Histograma y gráfico de probabilidad normal para un conjunto de datos con


COLAS LIVIANAS o COLAS CORTAS
Histograma Normal Probability Plot of DATOS3
15 1.0

0.8

Ordered Data
Frecuencia

10
0.6

0.4
5
0.2

0.0
0
0.02
0.09
0.16
0.23
0.30
0.37
0.44
0.51
0.58
0.65
0.72
0.79
0.86
0.93
1.00
-3 -2 -1 0 1 2 3

DATOS3 Rankits
120 casos Shapiro-Wilk W 0.9495 P(W) 0.0002 120 cases

Test de Shapiro-Wilk

Las hipótesis del test son:


H0: la variable tiene distribución normal (con cualquier media y varianza)
Ha: la variable no tiene distribución normal
El estadístico del test puede interpretarse como una medida de la asociación lineal
entre los percentiles observados en la muestra y los percentiles teóricos de la
normal que muestra el gráfico de probabilidad normal. El Statistix muestra el valor
del estadístico del test y el correspondiente p-valor en el q-q plot. También se lo
obtiene del siguiente modo:

Statistics -> Randomness-Normality test

-> Shapiro-Wilk Normality test

Para los datos correspondientes a las 5 determinaciones de la concentración de


CO obtenemos

SHAPIRO-WILK NORMALITY TEST

VARIABLE N W P
--------- ----- ------- -------
CONC 5 0.9752 0.9074
Tests de Hipótesis basados en una muestra. Dra. Diana Kelmansky 147
ESTADÍSTICA (Q)

Conclusión: El p-valor = 0.9074 (> 0.05) es altísimo. No hay evidencia suficiente


para rechazar la hipótesis de que la distribución de la concentración de CO es
normal. Cuanto mayor sea el p-valor tanto mayor será la evidencia a favor de la
hipótesis nula.

También podría gustarte