Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Pruebas de Hipotesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

Tema: 5 Pruebas de Hipótesis

Una hipótesis estadística es una aseveración o conjetura respecto a una o


más poblaciones.

Una prueba estadística de hipótesis esta formada de cinco partes:


1. La hipótesis nula, denotada por 𝐻
2. La hipótesis alternativa, denotada por 𝐻
3. El estadístico de prueba y su valor 𝑝
4. La región de rechazo
5. La conclusión

Las dos hipótesis en competencia son la hipótesis alternativa 𝑯𝒂 ,


generalmente la hipótesis que el investigador desea apoyar y la hipótesis
nula 𝑯𝒐 , una contradicción de la hipótesis alternativa.

Como pronto veremos, es más fácil presentar apoyo para la hipótesis


alternativa al demostrar que la hipótesis nula es falsa. En consecuencia, el
investigador estadístico siempre empieza por suponer que la hipótesis nula
𝑯𝒐 , es verdadera. El investigador utiliza entonces los datos muestrales para
decidir si la evidencia está a favor de 𝑯𝒂 más que de 𝑯𝒐 y saca una de dos
conclusiones:
• Rechaza 𝑯𝒐 y concluye que 𝑯𝒂 es verdadera.
• Acepta (no rechaza) 𝑯𝒐 como verdadera.

La decisión de rechazar o aceptar la hipótesis nula está basada en


información contenida en una muestra sacada de la población de interés.
Esta información toma estas
formas:
• Estadística de prueba: un solo número calculado a partir de los datos
muestrales
• Valor p: probabilidad calculada usando la prueba estadística
Cualquiera de estas mediciones, o ambas, actúan como quienes toman
decisiones para el investigador al decidir si rechazar o aceptar 𝑯𝒐 .

¿Cómo se decide si rechazar o aceptar 𝑯𝒐 ? Todo el conjunto de valores que


pueda tomar el estadístico de prueba se divide en dos conjuntos o regiones.
Un conjunto, formado de valores que apoyan la hipótesis alternativa y llevan
a rechazar H0, se denomina región de rechazo. El otro, formado de valores
que apoyan la hipótesis nula, recibe el nombre de región de aceptación.

Si el estadístico de prueba cae en la región de rechazo, entonces se rechaza


la hipótesis nula. Si el estadístico de prueba cae en la región de aceptación,
entonces la hipótesis nula se acepta o la prueba se juzga como no
concluyente. Vamos a aclarar los diferentes tipos de conclusiones que son
apropiados cuando consideremos varios ejemplos prácticos por prueba de
hipótesis. Por último, ¿cómo se decide sobre los valores críticos que separan
las regiones de aceptación y rechazo? Es decir, ¿cómo se decide cuánta
evidencia estadística se necesita antes de rechazar H0? Esto depende de la
cantidad de confianza que el investigador desea unir a las conclusiones de
prueba y el nivel de significancia a, el riesgo que estemos dispuestos a tomar
si se toma una decisión incorrecta.

Subtema: 5.1 Prueba de hipótesis para la media


Primero deberíamos describir las suposiciones en las que se basa el
experimento. El modelo para la situación subyacente se centra alrededor
de un experimento con 𝑋 , 𝑋 , … , 𝑋 que representan una muestra aleatoria
de una distribución con media μ y varianza 𝜎 > 0. Considere primero la
hipótesis
𝐻 :𝜇 = 𝜇
𝐻 :𝜇 ≠ 𝜇

El estadístico de prueba adecuado se debe basar en la variable aleatoria 𝑋

Estandarización de 𝑿

Es conveniente estandarizar 𝑿 e incluir de manera formal la variable


aleatoria normal estándar Z, donde:

𝑋−𝜇
𝑍=
𝜎/√𝑛

Sabemos que, bajo 𝐻 , es decir si 𝐻 : 𝜇 = 𝜇 , entonces √𝑛(𝑿 − 𝜇 )/𝜎 tiene


una distribución de 𝑛(𝑥; 0,1) y, por lo tanto, la expresión:
𝑋−𝜇
𝑃 −𝑍 < <𝑍 =1−𝛼
𝜎/√𝑛

Se puede utilizar para escribir una región de no rechazo adecuada.


Procedimiento de prueba para una sola media

𝑋−𝜇 𝑋−𝜇
𝑧= >𝑍 𝑜 𝑧= > −𝑍
𝜎/√𝑛 𝜎/√𝑛

Si −𝑍 < 𝑧 < 𝑍 , no se rechaza 𝐻 . El rechazo de 𝐻 , desde luego, implica


la aceptación de la hipótesis alternativa 𝜇 ≠ 𝜇 . Con esta definición de la
región critica debería quedar claro que habrá 𝛼 probabilidades de rechazar
𝐻 (al caer en la región critica) cuando, en realidad 𝜇 = 𝜇 .

Aunque es más fácil entender la región crítica escrita en términos de z,


escribimos la misma región crítica en términos del promedio calculado 𝑋. Lo
siguiente se puede escribir como un procedimiento de decisión idéntico:

𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻 𝑠𝑖 𝑥̅ < 𝑎 𝑜 𝑥̅ > 𝑏


Donde
𝜎 𝜎
𝑎 =𝜇 −𝑍 𝑏 =𝜇 +𝑍
√𝑛 √𝑛

En consecuencia, para un nivel de significancia de 𝛼, los valores críticos de


la variable aleatoria z y 𝑥̅ se representan en la figura.

Las pruebas de hipótesis unilaterales sobre la media incluyen el mismo


estadístico que se describe en el caso bilateral. La diferencia, por supuesto,
es que la región crítica sólo está en una cola de la distribución normal
estándar. Por ejemplo, supongamos que buscamos probar
𝐻 :𝜇 = 𝜇
𝐻 :𝜇 > 𝜇
La señal que favorece 𝐻 proviene de valores grandes de z. Así, el rechazo
de 𝐻 resulta cuando se calcula z > zα. Evidentemente, si la alternativa es
H1: μ < μ0, la región crítica está por completo en la cola inferior, por lo que
el rechazo resulta de z < –zα. Aunque en el caso de una prueba unilateral la
hipótesis nula se puede escribir como H0: μ < μ0 o H0: μ > μ0, por lo general
se escribe como H0: μ = μ0.

Ejemplo: Una muestra aleatoria de 100 muertes registradas en Estados Unidos


el año pasado reveló una vida promedio de 71.8 años. Si se supone una
desviación estándar de la población de 8.9 años, ¿esto parece indicar que
la vida media actual es mayor que 70 años? Utilice un nivel de significancia
de 0.05.
Solución:
1. 𝐻 : 𝜇 = 70 𝑎ñ𝑜𝑠
2. 𝐻 : 𝜇 > 70 𝑎ñ𝑜𝑠
3. 𝛼 = 0.05
4. Region critica: 𝑧 > 1.645, donde 𝑍 =
/√
.
5. Calculos 𝑋 = 71.8 𝑎ñ𝑜𝑠, 𝜎 = 8.9 𝑎ñ𝑜𝑠, 𝑒𝑛 𝑐𝑜𝑛𝑠𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑍 = = 2.02
. /√
6. Decisión: Rechazar 𝐻 y concluir que la vida media actual es mayor
que 70 años.
El valor P que corresponde a z= 2.02 es dado por el area de la region
sombreada en la figura.

Si usamos la tabla de areas bajo la curva normal tenemos que


𝑃 = 𝑃(𝑍 > 2.02)
𝑃 = 𝑃(𝑍 > 0.9783) = (1 − 0.9783) = 0.0217

Como resultado, la evidencia a favor de 𝐻 es incluso más firme que la


sugerida por un nivel de significancia de 0.05.
Nota: Para la region critica se busca dentro de los valores de areas bajo la
curva normal el valor de 0.95, donde los valores mas cercanos estaban en
1.64 y 1.65 por lo que se promedian y se obtiene 1.645.

Ejemplo: Un fabricante de equipo deportivo desarrolló un nuevo sedal para


pesca sintético que, según afirma, tiene una resistencia media a la rotura de
8 kilogramos con una desviación estándar de 0.5 kilogramos. Pruebe la
hipótesis de que μ = 8 kilogramos contra la alternativa de que μ ≠ 8
kilogramos si se prueba una muestra aleatoria de 50 sedales y se encuentra
que tienen una resistencia media a la rotura de 7.8 kilogramos. Utilice un nivel
de significancia de 0.01.

Solución:
1. 𝐻 : 𝜇 = 8 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
2. 𝐻 : 𝜇 ≠ 8 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
3. 𝛼 = 0.01
4. Region critica: 𝑧 < −2.575 y : 𝑧 > 2.575 donde 𝑍 =
/√
.
5. Calculos 𝑋 = 7.8 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠, 𝑛 = 50 , 𝑒𝑛 𝑐𝑜𝑛𝑠𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑍 = = −2.83
. /√
6. Decisión: Rechazar 𝐻 y concluir que la resistencia promedio a la
rotura no es igual a 8, si no que, de hecho, es menor que 8 kilogramos.

Como la prueba de este ejemplo es de dos colas, el valor P que se desea es


el doble del area de la region sombreada en la figura, a la izquierda de 𝑧 =
−2.83. Por lo tanto si usamos la tabla de area bajo la curva normal, tenemos:

𝑃 = 𝑃(|𝑍| > 2.83) = 2𝑃(𝑍 < −2.83)


𝑃 = 𝑃(|𝑍| > 2.83) = 2𝑃(1 − 0.9977) = 0.0046

Que nos permite rechazar la hipotesis nula de que 𝜇 = 8 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠 a un nivel


de significancia menor que 0.01.

También podría gustarte