Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Pruebas de Hipótesis en Base A Una Muestra: Estadística - Unidad 6

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

Universidad Nacional de Rosario

Facultad de Ciencias Bioquímicas y Farmacéuticas


Área Estadística y Procesamiento de Datos

Pruebas de hipótesis en base a una muestra


Estadística - Unidad 6

Año 2021∗

6.1. Introducción
En la unidad anterior se presentó una de las dos herramientas fundamentales de la inferencia estadística: la esti-
mación de parámetros. En esta unidad daremos nuestros primeros pasos en el estudio de la segunda, la prueba
o ensayo de hipótesis. Una prueba de hipótesis es un procedimiento estadístico empleado para tomar una
decisión acerca del valor de uno o más parámetros poblacionales, en base a la información de una muestra.
El procedimiento para realizar una prueba de hipótesis refleja todos los pasos del método científico: quien está
investigando realiza una observación sobre el mundo que le rodea, plantea una pregunta de interés sobre el fenómeno
observado y propone una hipótesis, es decir, formula una teoría que pretende dar respuesta a la pregunta. La
hipótesis debe ser comprobable y refutable, siendo el siguiente paso conducir un proceso de experimentación y
observación que permita concluir acerca de su validez. El circuito del método científico es iterativo, puesto que si
la hipótesis es refutada, se plantearán nuevas respuestas plausibles y si es confirmada, seguramente surgirán nuevos
interrogantes relacionados para seguir estudiando.
En términos asociados a nuestro contexto, el equipo que conduce una investigación estadística efectúa una obser-
vación y plantea una pregunta sobre la población de interés, estableciendo como posible respuesta una afirmación
cuantitativa sobre uno o más parámetros de la población, es decir, postulando una hipótesis estadística. Luego,
toma una muestra aleatoria y contrasta la información contenida en ella con lo sostenido por la hipótesis, con el fin
de llegar a una conclusión que la avale o la rechace.
Consideremos algunas situaciones:
Ejemplo 1: de acuerdo con las especificaciones, ciertos comprimidos deben contener 50 𝑚𝑔 de una droga. El
personal del laboratorio sospecha que se ha producido un aumento en el promedio de concentración de la
droga en los comprimidos, luego de que se hiciera un cambio la línea de producción.
∗ Este apunte se encuentra en desarrollo. El mismo será revisado a lo largo del cuatrimestre y no está exento de presentar errores o

expresar ideas en formas que puedan ser mejoradas. Agradeceremos que nos notifiquen de los errores encontrados.

1
Estadística - FCByF Unidad 6

• Parámetro: 𝜇 = contenido promedio de la droga en los comprimidos.


• Pregunta: ¿𝜇 > 50 𝑚𝑔?
Ejemplo 2: la prevalencia de una enfermedad en Argentina hace diez años era igual a 0.01. Autoridades
sanitarias quieren corroborar si este valor sigue vigente en la actualidad o si ha habido alguna modificación.
• Parámetro: 𝑝 = proporción de la población argentina que padece la enfermedad.
• Pregunta: ¿𝑝 ≠ 0.01?
Ejemplo 3: la precisión de un método de medición, medida a través de la variancia, se estimó en 0.5 unidades2 .
El laboratorio sospecha que la precisión ha disminuido.
• Parámetro: 𝜎2 = variancia del método de medición.
• Pregunta: ¿𝜎2 > 0.5 unidades2 ?
Todos los casos anteriores constituyen problemas que requieren se tome una decisión: “rechazar” vs “no rechazar”
una proposición sobre algún parámetro 𝜃 y, como tales, pueden ser resueltos mediante la herramienta de la prueba
de hipótesis. La Estadística, haciendo uso de todas las nociones de probabilidad aprendidas hasta el momento, nos
permitirá responder cuestiones importantes en este contexto: ¿cómo decidir si la información de la muestra avala
una hipótesis o no?, ¿qué probabilidad hay de tomar una decisión equivocada?, ¿cuál es el tamaño de muestra
adecuado para estudiar? o ¿es posible llegar a una conclusión con certeza absoluta? Estos y otros aspectos serán
discutidos en profundidad a lo largo de la presente unidad.

6.2. Conceptos generales sobre las pruebas de hipótesis


6.2.1. Hipótesis estadísticas
Una hipótesis estadística (o sencillamente, hipótesis) es una aseveración sobre el valor de uno o varios parámetros
que describen una característica de la población en estudio† . En general, la pregunta de investigación da lugar al
planteo de hipótesis estadísticas, como pueden ser “𝜇 > 50 𝑚𝑔”, “𝑝 ≠ 0.01” y “𝜎2 > 0.5 unidades2 ” en los ejemplos
anteriores.
Sin embargo, para poder avalar una hipótesis es necesario enfrentarla a otra que la anule o se le oponga. El objetivo
es tomar una decisión en favor de una u otra hipótesis en base a la evidencia que provea el estudio de una muestra
de elementos de dicha población. Para poder tomar una decisión, una de estas hipótesis se supone cierta, es decir,
es inicialmente favorecida, y será rechazada si la muestra provee evidencia suficiente en favor de la otra afirmación.
Por esta razón, en toda prueba se deben definir dos hipótesis que estarán en competencia: la hipótesis nula y la
hipótesis alternativa.
Definiciones:
Hipótesis nula: es la afirmación sobre uno o varios parámetros que generalmente representa el “status quo” o
el estado actual del conocimiento sobre el tema en estudio, por lo tanto la prueba se realiza bajo la suposición
de que esta hipótesis es verdadera. Se decide no rechazarla a menos que haya suficiente evidencia muestral para
hacerlo. Si la información de la muestra no contradice a esta aseveración, se sigue creyendo en su veracidad.
Se la simboliza con 𝐻0 .
Hipótesis alternativa: es la afirmación sobre uno o varios parámetros que representa a la pregunta de
investigación o a una nueva idea o conjetura que se desea evaluar, contradiciendo a la hipótesis nula. Se la
simboliza como 𝐻1 .
En algunos contextos se conoce a la hipótesis alternativa como la hipótesis de investigación, puesto que encierra
la sospecha que los investigadores buscan verificar. Es en este sentido que se utiliza la palabra “nula” para designar
a la otra hipótesis, ya que generalmente es la que propone que no hay cambios con respecto a lo ya conocido, que
se debe sostener la teoría vigente, que no hay diferencia entre los grupos comparados, que no hay relación entre las
variables estudiadas, etc.
De esta forma, para cada uno de los ejemplos anteriores se tiene:
† Una hipótesis estadística también puede consistir en una afirmación que señale qué distribución de probabilidad sigue una variable

aleatoria

2
Estadística - FCByF Unidad 6

Ejemplo 1:
𝐻0 )𝜇 = 50 𝑚𝑔
𝐻1 )𝜇 > 50 𝑚𝑔
Ejemplo 2:
𝐻0 )𝑝 = 0.01
𝐻1 )𝑝 ≠ 0.01
Ejemplo 3:
2
𝐻0 )𝜎2 = 0.5 unidades
2
𝐻1 )𝜎2 > 0.5 unidades
El procedimiento de la prueba de hipótesis conduce a una de las siguientes conclusiones:
Rechazar 𝐻0 , debido a la evidencia suficiente en los datos a favor de 𝐻1 .
No rechazar 𝐻0 , debido a la evidencia insuficiente en los datos a favor de 𝐻1 .
Esta forma de referirse a la conclusión de la prueba de hipótesis en términos del rechazo o no rechazo de 𝐻0 puede
ser llamativa al enfrentarse a este tema por primera vez. Se considera que es posible establecer una conclusión
firme más bien al rechazar y no tanto al aceptar una hipótesis, ya que un “rechazo” la descarta, mientras que
un “no rechazo” no excluye otras posibilidades. Por lo tanto, si una investigación pretende validar su hipótesis de
investigación plasmada en 𝐻1 , se busca hacerlo mediante el rechazo de la hipótesis que la contradiga.
Para familiarizarse con este procedimiento, puede ser de ayuda hacer un paralelo con lo que sucede en un juicio
penal. Las hipótesis son:
𝐻0 ) La persona acusada es inocente.
𝐻1 ) La persona acusada es culpable.
A la persona se la acusa porque hay una sospecha de que puede estar involucrada en el delito en cuestión. Sin
embargo, el principio de presunción de inocencia establece que toda persona es inocente hasta que se demuestre
lo contrario. Por lo tanto, el status quo o lo que se asume cierto, es decir, la hipótesis nula, es que la persona es
inocente y esto no se rechazará hasta que surja evidencia contundente que la incrimine. No rechazar 𝐻0 no implica
inocencia, sino que no hay evidencia suficiente para culpar a la persona, por lo que no necesariamente se acepta 𝐻0 ,
sino que no se la rechaza.

6.2.2. Estadística de la prueba y región de rechazo


Una vez establecidas las hipótesis a evaluar, el siguiente paso es determinar cómo se utilizará la información de la
muestra para tomar una decisión. Recordemos el caso del primer ejemplo:

𝐻0 )𝜇 = 50 𝑚𝑔 𝑣𝑠 𝐻1 )𝜇 > 50 𝑚𝑔

Siendo el parámetro en cuestión el contenido promedio del fármaco en los comprimidos (𝜇), resulta natural resumir
la información de la muestra con el cálculo de la media aritmética, 𝑋.̄ Cuanto más grande sea el valor observado
de esta estadística, más evidencia a favor de 𝐻1 proveerá la muestra y se deberá optar por el rechazo de 𝐻0 . Por lo
tanto, la media aritmética será la estadística base de la prueba.
Definición. La estadística base de la prueba, al igual que un estimador, es una función de la muestra aleatoria
que se considera como base para la toma de decisiones estadísticas.
Imaginemos que se tomó una muestra de 𝑛 = 50 comprimidos y se encontró 𝑥̄ = 59 𝑚𝑔. Posiblemente nuestra intui-
ción nos indique que tal valor es demasiado grande como para pensar que 𝐻0 )𝜇 = 50 𝑚𝑔 sea cierta y concluiríamos
a favor de 𝐻1 . ¿Pero cuál sería nuestra opinión si hubiésemos observado 𝑥̄ = 50.5 𝑚𝑔? Tal vez nos inclinaríamos a
no rechazar 𝐻0 , pensando que la muestra no presenta evidencia lo suficientemente fuerte como para concluir que

3
Estadística - FCByF Unidad 6

el verdadero promedio es mayor a 50 𝑚𝑔‡ . De hecho, sabemos que la media aritmética es una variable aleatoria,
depende de la muestra analizada y sus posibles valores presentan cierta variabilidad, por lo cual esperamos que 𝑋̄
fluctúe alrededor de 50 mg si es cierto que 𝜇 = 50 𝑚𝑔.
Entonces, queda claro que hay ciertos valores posibles de la estadística base que nos indican que se debe rechazar
la hipótesis nula y otros que avalan el no rechazo de la misma.
Definición. La región crítica o de rechazo es el conjunto de valores de la estadística base que conducen al
rechazo de la hipótesis nula en favor de la alternativa. Si en la muestra analizada el valor de la estadística base no
cae en la región de rechazo, se dirá que “no se rechaza la hipótesis nula”. El conjunto de los restantes valores de la
estadística es llamado región de no rechazo.
Ahora bien, ¿cuánta evidencia “se necesita” para rechazar 𝐻0 ? ¿A partir de qué valor observado de 𝑋̄ (𝑥𝑜𝑏𝑠 ̄ ) se
debe rechazar 𝐻0 ? ¿Si la media es mayor a 52 𝑚𝑔? ¿O si es mayor a 55 𝑚𝑔? Es decir, ¿cuál es el valor crítico de la
prueba?
Definición. El valor o punto crítico es el valor de la estadística base a partir del cual se debe rechazar 𝐻0 , es
decir, es el punto en el eje numérico que separa la región de rechazo de la de no rechazo.
La selección del valor crítico no se realiza “a ojo”, sino que está íntimamente relacionada con el estudio de la
distribución muestral de la estadística base y a la noción de que, al tomar una decisión, se puede estar incurriendo
en un error, como se explica en la siguiente sección.

6.2.3. Error de tipo I y Error de tipo II


Como se dijo anteriormente, determinar la región de rechazo sobre el campo de variación de la estadística base no
es algo trivial. A partir de ella se desprenderá la decisión a tomar y esta puede ser incorrecta. Nunca es posible
saber acerca de la falsedad o veracidad de una hipótesis estadística con total certeza, a menos que se examine a
toda la población, lo cual puede ser difícil o impracticable. Por esto, ya sea que nos decidamos a favor de 𝐻0 o 𝐻1 ,
podríamos estar tomando una decisión equivocada:

Situación real (desconocida)


Decisión en base a la muestra
𝐻0 cierta 𝐻0 falsa
Rechazar 𝐻0 Error tipo I Decisión correcta
No rechazar 𝐻0 Decisión correcta Error tipo II

Definiciones:
Un error de tipo I se comete cuando se decide rechazar 𝐻0 , siendo la misma cierta. La probabilidad de
cometer un error de tipo I se simboliza con 𝛼:

𝑃 (𝐸𝐼 ) = 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼

Un error de tipo II se comete cuando se decide no rechazar 𝐻0 , siendo cierta 𝐻1 . La probabilidad de


cometer un error de tipo II se simboliza con 𝛽.

𝑃 (𝐸𝐼𝐼 ) = 𝑃 (𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝛽

Para el ejemplo 1:
Un error de tipo I se cometería si se concluye, en base a la muestra, que el contenido promedio del fármaco en
los comprimidos es mayor a 50 𝑚𝑔 cuando en realidad no lo es. Esto puede ocurrir si, debido a la variabilididad
de la distribución muestral de la media, observamos un valor de 𝑋̄ superior al valor crítico, aún siendo cierta 𝐻0 .
Como consecuencia, el laboratorio deberá interrumpir el proceso productivo para efectuar ajustes innecesarios.
‡ La noción del valor 59 como “grande” y del valor 50.5 como cercano a 50 se establece sólo como ejemplo, ya que tales aseveraciones

deben realizarse objetivamente en base a la distribución muestral de la estadística, la cual depende del tamaño muestral y la variancia
de la variable estudiada.

4
Estadística - FCByF Unidad 6

Un error de tipo II se cometería si se concluye, en base a la muestra, que el contenido promedio del
fármaco en los comprimidos no es mayor a 50 𝑚𝑔 cuando en realidad sí lo es. Esto puede ocurrir si, debido
a la variabilididad de la distribución muestral de la media, observamos un valor de 𝑋̄ menor que el valor
crítico, aún siendo falsa 𝐻0 . Como consecuencia, el laboratorio estaría produciendo comprimidos por fuera de
lo especificado, que derivará en el desperdicio del compuesto o en problemas en futuras rondas de control.
Como 𝐻0 )𝜇 = 50 𝑚𝑔 especifica un valor único del parámetro, el valor de 𝛼 es único. Sin embargo, como 𝐻1 )𝜇 > 50 𝑚𝑔
no especifica un valor particular del parámetro sino que sostiene que el verdadero promedio podría ser cualquier
valor mayor a 50 𝑚𝑔, existe un valor de 𝛽 diferente para cada valor 𝜇 compatible con 𝐻1 .
Dado que no es posible tomar una decisión con total certeza, se pretende que la probabilidad de cometer cualquiera
de estos errores sea tan baja como sea posible. Recordemos que, después de todo, el objetivo de la Estadística
es disminuir la incertidumbre existente en procesos de toma de decisión. Desafortunadamente, para un tamaño
muestral fijo, disminuir la probabilidad de error de tipo I (𝛼) resulta en un aumento de la probabilidad de error de
tipo II (𝛽) y viceversa§ . Se debe establecer, entonces, un compromiso entre 𝛼 y 𝛽.
Siendo que la hipótesis nula plantea lo que se asume como cierto hasta el momento, el procedimiento de las pruebas
de hipótesis toma un criterio conservador: se elige el máximo valor de probabilidad de rechazar incorrectamente 𝐻0
(𝛼) que se esté dispuesto a tolerar y se determina la región de rechazo en función del mismo, de modo que 𝛽 sea
tan pequeña como sea posible, pero sin una cota superior preestablecida.
El hecho de que la probabilidad de rechazar 𝐻0 erróneamente (𝛼) sea fijada por el equipo de investigación tan
pequeña como se desee hace que el rechazo de 𝐻0 sea considerado siempre como una conclusión fuerte. Por otro
lado, como se mencionó anteriormente, la probabilidad de no rechazar 𝐻0 erróneamente (𝛽) no está acotada y
depende del verdadero valor del parámetro, por lo cual se suele considerar la decisión de no rechazar 𝐻0 como una
conclusión débil. Estas razones justifican la preferencia por la expresión “no se rechaza 𝐻0 ” en lugar de “se acepta
𝐻0 ” y el hecho de que generalmente se vuelque la hipótesis de investigación en la hipótesis alternativa, para que la
decisión de avalarla, si correspondiese, esté sostenida por una resolución firme.
Dado que la probabilidad de error de tipo II depende del verdadero valor del parámetro, es decir, de la magnitud en
la cual 𝐻0 es falsa, se la considera como un indicador de la capacidad que tiene una prueba de hipótesis de detectar
una diferencia particular respecto a lo postulado en 𝐻0 :
Definición. La potencia es la probabilidad del suceso contrario al error de tipo II, es decir, de rechazar correcta-
mente la hipótesis nula:
𝑃 𝑜𝑡𝑒𝑛𝑐𝑖𝑎 = 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 1 − 𝑃 (𝐸𝐼𝐼 ) = 1 − 𝛽

En general, se formula 𝐻0 con una afirmación de igualdad, como en el caso de 𝐻0 )𝜇 = 50 𝑚𝑔 vs 𝐻1 )𝜇 > 50 𝑚𝑔. En
algunas situaciones particulares puede ser de interés plantear 𝐻0 como una desigualdad, por ejemplo: 𝐻0 )𝜇 ≤ 50 𝑚𝑔
vs 𝐻1 )𝜇 > 50 𝑚𝑔. En estos casos, el valor exacto de la probabilidad de error de tipo I depende en realidad del
verdadero valor del parámetro bajo 𝐻0 , pero siempre será menor que el valor 𝛼 elegido para determinar la región
de rechazo. Es por esto que 𝛼 recibe el nombre de nivel de significación de la prueba. Generalmente se utiliza
𝛼 igual a 0.01, 0.05 o 0.10.

6.2.4. Clasificación
En función de la cantidad de valores postulados para el parámetro, una hipótesis se considera:
Simple: establece un solo punto (número real) para el valor del parámetro. Por ejemplo: 𝐻0 )𝜇 = 50 𝑚𝑔.
Compuesta: establece más de un punto para el valor del parámetro. Por ejemplo: 𝐻1 )𝜇 > 50 𝑚𝑔.
En función de la hipótesis alternativa, las prueba de hipótesis se clasifican en:
Unilaterales a la derecha: 𝐻1 propone para el parámetro valores mayores que aquel planteado por 𝐻0 . Es
el caso del ejemplo 1: 𝐻0 )𝜇 = 50 𝑚𝑔 vs 𝐻1 )𝜇 > 50 𝑚𝑔. La región de rechazo se localiza en la cola derecha de
la distribución muestral de la estadística base.
Unilaterales a la izquierda: 𝐻1 propone para el parámetro valores menores que aquel planteado por 𝐻0 .
Por ejemplo: 𝐻0 )𝜇 = 50 𝑚𝑔 vs 𝐻1 )𝜇 < 50 𝑚𝑔. La región de rechazo se localiza en la cola izquierda de la
distribución muestral de la estadística base.
§ Sólo es posible disminuir 𝛼 y 𝛽 simultáneamente aumentando el tamaño muestral

5
Estadística - FCByF Unidad 6

Bilaterales: 𝐻1 propone para el parámetro valores ya sea mayores o menores que aquel planteado por 𝐻0 .
Es el caso del ejemplo 2: 𝐻0 )𝑝 = 0.01 vs 𝐻1 )𝑝 ≠ 0.01. La región de rechazo se localiza en ambas colas de la
distribución muestral de la estadística base.

6.2.5. Pasos generales para llevar adelante una prueba de hipótesis


Los pasos generales para llevar a cabo una prueba de hipótesis son:
1. Plantear las hipótesis nula y alternativa en términos del parámetro de interés.
2. Fijar el nivel de significación 𝛼.
3. Especificar la estadística base y su distribución muestral bajo el supuesto de que 𝐻0 sea cierta.
4. Determinar la región de rechazo.
5. Obtener una muestra y calcular el valor observado de la estadística base.
6. Tomar una decisión y concluir.
A partir de la siguiente sección desarrollaremos cada uno de estos pasos de forma particular para la prueba de
hipótesis en base a una muestra de los parámetros poblacionales más utilizados: el promedio, la variancia y la
probabilidad de un suceso.

6.3. Ensayo de hipótesis para el promedio de una población


6.3.1. Prueba unilateral a la derecha, variancia poblacional conocida
Supongamos que, como en el ejemplo 1, se desea llevar adelante una prueba de hipótesis para el promedio 𝜇 de una
variable cuantitativa 𝑋, cuya variancia es un valor conocido igual a 𝜎2 .
1. Plantear las hipótesis. Comenzamos considerando un ensayo unilateral por derecha:

𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 > 𝜇0

𝜇0 representa el valor postulado por la hipótesis nula para el promedio poblacional (en el ejemplo 1, 𝜇0 toma
el valor 50 𝑚𝑔).
2. Fijar el nivel de significación. Se considera 𝑃 (𝐸𝐼 ) = 𝛼.
3. Especificar la estadística base. Se trabaja con la media aritmética de una muestra aleatoria de tamaño
𝑛
𝑛: 𝑋̄ = 𝑛1 ∑𝑖=1 𝑋𝑖 . Si la variable 𝑋 sigue una distribución normal o si el tamaño muestral es grande (por
el Teorema Central del Límite), la distribución de la media también es normal, como hemos aprendido en la
Unidad 4. Bajo el supuesto de que 𝐻0 es cierta, el verdadero promedio es 𝜇0 y se tiene:

𝐻0 𝜎
𝑋̄ ∼ 𝑁 (𝜇0 , √ )
𝑛

4. Determinar la región de rechazo. Dado que 𝐻1 sostiene que el verdadero promedio es mayor a lo postulado
en 𝐻0 , es claro que observar un valor grande de 𝑋̄ debe conducir al rechazo de 𝐻0 . Es decir, se debe rechazar
𝐻0 si el valor observado de 𝑋̄ es mayor o igual que el valor crítico. Simbolizaremos a este número con 𝑐𝛼 ,
enfatizando que queda determinado por la probabilidad de error de tipo I elegida para la prueba. Luego, se
deberá seguir la siguiente instrucción:

Regla de decisión: Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠


̄ ≥ 𝑐𝛼

Demostraremos que dicho valor crítico es igual a 𝑐𝛼 = 𝜇0 + 𝑧1−𝛼 √𝜎𝑛 , donde 𝑧1−𝛼 es el percentil (1 − 𝛼) × 100
de la distribución normal estándar. Para esto, se parte desde el planteo de la probabilidad de error de tipo I:

(1) (2) (3) 𝑐 −𝜇


𝑃 (𝐸𝐼 ) = 𝛼 ⟹ 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼 ⟹ 𝑃 (𝑋̄ ≥ 𝑐𝛼 /𝜇 = 𝜇0 ) = 𝛼 ⟹ 𝑃 (𝑍 ≥ 𝛼 √ 0 ) = 𝛼
𝜎/ 𝑛
(4) 𝑐𝛼 − 𝜇 0 (5) 𝜎
⟹ √ = 𝑧1−𝛼 ⟹ 𝑐𝛼 = 𝜇0 + 𝑧1−𝛼 √
𝜎/ 𝑛 𝑛

6
Estadística - FCByF Unidad 6

(1) Por definición de 𝐸𝐼 .


(2) 𝐸𝐼 para el caso de la prueba de hipótesis que estamos analizando.
(3) Debido a que la media sigue una distribución normal.
(4) El segundo miembro de la desigualdad es un percentil de la distribución normal estándar.
(5) Por despeje.
Es posible representar gráficamente lo postulado por la hipótesis nula, la probabilidad de error de tipo I y el
valor crítico en un esquema como el siguiente:

µ0 cα
X
Región de no rechazo Región de rechazo

Figura 6.1: Representación gráfica de la prueba unilateral a la derecha para un promedio.

Si 𝑥𝑜𝑏𝑠
̄ cae en la región de rechazo, significa que es un valor extraño de observar bajo el supuesto de que
𝐻0 sea cierta. Entonces esto se considera como evidencia de que no lo es y se decide rechazarla. Claramente,
podríamos haber observado dicho valor “extremo” de la media aún si 𝐻0 fuese verdadera, pero la probabilidad
de que esto ocurra es tan baja (fue fijada en el valor 𝑃 (𝐸𝐼 ) = 𝛼), que se decide por el rechazo de la misma.
La regla de decisión presentada es equivalente a la siguiente:

𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≥ 𝑧1−𝛼 𝑧𝑜𝑏𝑠 = √
𝜎/ 𝑛

La diferencia radica en que la primera compara el valor observado de la media aritmética con el valor crítico en
unidades de la variable original, mientras que la segunda estandariza el valor observado de media aritmética
y lo compara directamente con el percentil correspondiente de la distribución normal estándar.
5. Obtener una muestra y calcular el valor observado de la estadística base. Una vez establecida la
regla de decisión, a partir de los datos muestrales debe calcularse el valor de la media aritmética.
6. Tomar una decisión y concluir. La prueba de hipótesis finaliza estableciendo una conclusión en términos
del problema y que haga referencia a que la misma depende de la muestra analizada y del nivel de significación
𝛼 establecido.

6.3.2. Enfoque de la probabilidad asociada


Un enfoque alternativo para la resolución de una prueba de hipótesis consiste en comparar áreas debajo de la curva
de la distribución de la estadística base en lugar de comparar valores sobre el rango de variación de la misma. Esto
se conoce como enfoque de la probabilidad asociada (𝑝𝑎𝑠𝑜𝑐 ) y establece la siguiente regla de decisión:

Regla de decisión: Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼

7
Estadística - FCByF Unidad 6

Para el caso estudiado de una prueba unilateral por derecha, la probabilidad asociada se calcula como: 𝑝𝑎𝑠𝑜𝑐 =
𝑃 (𝑋̄ ≥ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑍 ≥ 𝑧𝑜𝑏𝑠 ). Los siguientes esquemas evidencian que esta nueva regla de decisión es
equivalente a la enunciada primeramente, ya que si 𝑥𝑜𝑏𝑠
̄ cae en la región de rechazo, entonces necesariamente será
𝑝𝑎𝑠𝑜𝑐 < 𝛼:

α
pasoc

µ0 cα xobs
X
Región de no rechazo Región de rechazo

Figura 6.2: Enfoque de la probabilidad asociada: rechazo de la hipótesis nula.

pasoc
α

µ0 xobs cα
X
Región de no rechazo Región de rechazo

Figura 6.3: Enfoque de la probabilidad asociada: no rechazo de la hipótesis nula

La probabilidad asociada es una medida de cuánta evidencia provee la muestra a favor de 𝐻0 . Un valor pequeño
de esta probabilidad significa que el valor obtenido de la estadística base (o alguno que contradiga aún más a la
hipótesis nula) tiene muy baja chance de ocurrir en el escenario que supone cierta a 𝐻0 , por lo tanto conduce a su
rechazo.
Definición. La probabilidad asociada (también llamada valor p o p-value) es la probabilidad de observar un
valor de la estadística base igual o más extremo que el obtenido en la muestra, suponiendo cierta 𝐻0 .
Los valores más extremos son aquellos que proveen más evidencia en contra de 𝐻0 y a favor de 𝐻1 . En el caso
analizado, son los valores de la media mayores o iguales que el calculado en la muestra. El sentido de lo extremo
depende del tipo de ensayo (unilateral por derecha, unilateral por izquierda o bilateral). No obstante, la regla de
decisión bajo este enfoque es la misma en todos los casos.

6.3.3. Estudio de las probabilidades de error y de la potencia


Recordemos algunas definiciones vistas con anterioridad:

8
Estadística - FCByF Unidad 6

𝑃 (𝐸𝐼 ) = 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼


𝑃 (𝐸𝐼𝐼 ) = 𝑃 (𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝛽
𝑃 𝑜𝑡𝑒𝑛𝑐𝑖𝑎 = 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 1 − 𝑃 (𝐸𝐼𝐼 ) = 1 − 𝛽

y la prueba de hipótesis que estamos analizando:

𝜎
𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 > 𝜇0 𝑋̄ ∼ 𝑁 (𝜇, √ )
𝑛
𝜎
̄ ≥ 𝑐𝛼 = 𝜇0 + 𝑧1−𝛼 √
Regla de decisión: Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛

En las figuras anteriores pudimos representar gráficamente a 𝑃 (𝐸𝐼 ) = 𝛼 bajo la distribución muestral de la estadís-
tica base ante el supuesto de que 𝐻0 sea cierta. Un error de tipo II, en cambio, sólo puede ocurrir si 𝐻0 es falsa y
𝐻1 es cierta. Por lo tanto, 𝑃 (𝐸𝐼𝐼 ) = 𝛽 depende de cuál es aquel verdadero valor del promedio, mayor que 𝜇0 . Para
poder calcularla se debe especificar este valor del promedio bajo 𝐻1 , al cual llamaremos 𝜇1 . Entonces, se tiene:

𝐻0 𝜎 𝐻1 𝜎
𝑋̄ ∼ 𝑁 (𝜇0 , √ ) y 𝑋̄ ∼ 𝑁 (𝜇1 , √ )
𝑛 𝑛

Luego, la probabilidad de error de tipo II se calcula como:

𝑐𝛼 − 𝜇 1
𝑃 (𝐸𝐼𝐼 ) = 𝑃 (𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝑃 (𝑋̄ < 𝑐𝛼 /𝜇 = 𝜇1 ) = 𝑃 (𝑍 < √ )
𝜎/ 𝑛

Ahora estamos en condiciones de representar gráficamente ambos escenarios y todas las probabilidades intervinientes:

H0 H1

Potencia

β α

µ0 cα µ1
Región de no rechazo Región de rechazo X

Figura 6.4: Potencia y probabilidades de error de tipo I y II.

Realicemos ahora algunas observaciones:


En la figura anterior es posible notar que disminuir la probabilidad de error de tipo I elegida implica “achicar”
la región de rechazo, volviendo “más difícil” el rechazo de la hipótesis nula.
Si se pretende trabajar con un 𝛼 menor, se incurre en un incremento de 𝛽 y viceversa.
La única forma de disminuir simultánemaente 𝛼 y 𝛽 es aumentar el tamaño muestral, dado que esto resultará
en una menor dispersión en la distribución muestral de la media. Las campanas estarán más concentradas
alrededor de 𝜇0 y 𝜇1 .

9
Estadística - FCByF Unidad 6

Menor heterogeneidad en la población en estudio (es decir, menor 𝜎) produce el mismo efecto que el mencionado
en el punto anterior.
Si 𝐻1 es cierta, cuanto más lejos se encuentre el verdadero promedio 𝜇1 del valor 𝜇0 postulado por 𝐻0 , más
fácil será detectarlo y rechazar la hipótesis nula, es decir, mayor es la potencia. Esto se debe a que las curvas
estarían menos superpuestas. Por el contrario, cuanto más cercano esté 𝜇1 a 𝜇0 , más difícil será notar la
diferencia y concluir por el rechazo de 𝐻0 . Se necesitaría un gran tamaño muestral para contar con una
potencia adecuada.

6.3.4. Cálculo del tamaño de muestra


Tal como se puede distinguir en los comentarios anteriores, el tamaño muestral tiene un efecto en las magnitudes de
𝛼 y 𝛽. Hemos establecido que, ante un tamaño muestral fijo, el procedimiento de las pruebas de hipótesis implica
elegir un valor de 𝑃 (𝐸𝐼 ) tan bajo como se desee, quedando 𝑃 (𝐸𝐼𝐼 ) lo más pequeña posible pero sin poder ser
acotada. Sin embargo, es posible fijar también esta magnitud en una cantidad considerada aceptable y hallar el
tamaño muestral mínimo necesario para satisfacer ambos requisitos.
De esta forma, para la prueba de hipótesis de 𝐻0 )𝜇 = 𝜇0 vs 𝐻1 )𝜇 > 𝜇0 , se deduce que la extensión de muestra para
garantizar un valor deseado de 𝑃 (𝐸𝐼 ) = 𝛼 y de 𝑃 (𝐸𝐼𝐼 ) = 𝛽 en el caso de que el verdadero promedio sea 𝜇1 es igual
a:
(𝑧1−𝛼 + 𝑧1−𝛽 )2 𝜎2
𝑛=
(𝜇0 − 𝜇1 )2
Se debe notar que cuanto menores son los valores de 𝛼 y 𝛽 pretendidos, o cuanto menor es la diferencia con respecto
al valor postulado por 𝐻0 que se desea detectar o cuanto más heterogénea es la población en estudio, mayor será el
tamaño muestral que se debe emplear.
Demostración. Se debe despejar 𝑛 a partir del planteo de 𝑃 (𝐸𝐼𝐼 ) = 𝛽:

(1) (2)
𝑃 (𝐸𝐼𝐼 ) = 𝛽 ⟹ 𝑃 (𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝛽 ⟹ 𝑃 (𝑋̄ < 𝑐𝛼 /𝜇 = 𝜇1 ) = 𝛽
(3) 𝜎 (4) 𝜇0 + 𝑧1−𝛼 √𝜎𝑛 − 𝜇1 𝜇 −𝜇
⟹ 𝑃 (𝑋̄ < 𝜇0 + 𝑧1−𝛼 √ /𝜇 = 𝜇1 ) = 𝛽 ⟹ 𝑃 (𝑍 < √ ) = 𝛽 ⟹ 𝑃 (𝑍 < 0 √ 1 + 𝑧1−𝛼 ) = 𝛽
𝑛 𝜎 𝑛 𝜎 𝑛
(5) 𝜇0 − 𝜇 1 (6) 𝜇0 − 𝜇1 (7) √
⟹ 𝑧𝛽 = √ + 𝑧1−𝛼 ⟹ −𝑧1−𝛽 = √ + 𝑧1−𝛼 ⟹ (−𝑧1−𝛽 − 𝑧1−𝛼 )𝜎 = (𝜇0 − 𝜇1 ) 𝑛
𝜎 𝑛 𝜎 𝑛
(−𝑧1−𝛽 − 𝑧1−𝛼 )𝜎 2 (𝑧1−𝛼 + 𝑧1−𝛽 )2 𝜎2
⟹ 𝑛=[ ] ⟹ 𝑛=
𝜇0 − 𝜇 1 (𝜇0 − 𝜇1 )2

(1) Por definición de 𝐸𝐼𝐼 .


(2) 𝐸𝐼𝐼 para el caso de la prueba de hipótesis que estamos analizando.
(3) Reemplazo de 𝑐𝛼 según lo deducido para esta prueba de hipótesis.
(4) Debido a que la media sigue una distribución normal, se estandariza considerando cierta 𝐻1 .
(5) El segundo miembro de la desigualdad es un percentil de la distribución normal estándar.
(6) Por simetría de la distribución normal estándar.
(7) Por despeje.
Antes de finalizar la discusión de la prueba de hipótesis: 𝐻0 )𝜇 = 𝜇0 vs 𝐻1 )𝜇 > 𝜇0 , se debe notar que todas las
consideraciones realizadas son válidas también en los casos donde 𝐻0 es una hipótesis compuesta (𝐻0 )𝜇 ≤ 𝜇0 ) o 𝐻1
es una hipótesis simple (𝐻1 )𝜇 = 𝜇1 , con 𝜇1 > 𝜇0 ).
Además, todas las interpretaciones realizadas sobre probabilidades de error, potencia, tamaño de muestra, región
de rechazo, valores extremos, etc. se extienden a las restantes pruebas de hipótesis presentadas en esta unidad y en
el resto de la asignatura.

10
Estadística - FCByF Unidad 6

6.3.5. Prueba unilateral a la izquierda, variancia poblacional conocida


En el caso de que se desee ensayar el promedio de una población con variancia conocida y distribución normal (o
no normal pero empleando una muestra grande) mediante las siguientes hipótesis:

𝐻0 )𝜇 = 𝜇0 ó 𝐻0 )𝜇 ≥ 𝜇0
versus:
𝐻1 )𝜇 < 𝜇0 ó 𝐻1 )𝜇 = 𝜇1 con 𝜇1 < 𝜇0
se deriva la siguiente regla de decisión:
𝜎
̄ ≤ 𝑐𝛼 = 𝜇0 − 𝑧1−𝛼 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛

o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≤ −𝑧1−𝛼 𝑧𝑜𝑏𝑠 = √
𝜎/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (𝑋̄ ≤ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑍 ≤ 𝑧𝑜𝑏𝑠 )

La demostración de la deducción del valor crítico queda como ejercicio propuesto, así como también la verificación
de que la fórmula para determinar la extensión muestral coincide en este caso con la vista anteriormente.

6.3.6. Prueba bilateral, variancia poblacional conocida


En el caso de que se desee ensayar el promedio de una población con variancia conocida y distribución normal (o
no normal pero empleando una muestra grande) mediante las siguientes hipótesis:

𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 ≠ 𝜇0

se deberá rechazar la hipótesis nula si el valor observado de la media en la muestra se aleja de 𝜇0 por ser “demasiado
pequeño” o “demasiado grande”. Esto hace que la región de rechazo esté dividida en dos partes, a ambas colas de
la distribución muestral de la estadística base. La correspondiente regla de decisión es:

𝜎 𝜎
̄ ≤ 𝑐1 = 𝜇0 − 𝑧1−𝛼/2 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠 o si ̄ ≥ 𝑐2 = 𝜇0 + 𝑧1−𝛼/2 √
𝑥𝑜𝑏𝑠
𝑛 𝑛

Gráficamente, esta prueba de hipótesis puede ser representada de la siguiente forma:

α 2 α 2

c1 µ0 c2
X
Región de rechazo Región de no rechazo Región de rechazo

Figura 6.5: Representación gráfica de la prueba bilateral para un promedio.

11
Estadística - FCByF Unidad 6

Las siguientes reglas de decisión son equivalentes:

𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≤ −𝑧1−𝛼/2 o si 𝑧𝑜𝑏𝑠 ≥ 𝑧1−𝛼/2 𝑧𝑜𝑏𝑠 = √
𝜎/ 𝑛

o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 2𝑃 (𝑍 ≥ |𝑧𝑜𝑏𝑠 |)

Se debe observar que para el cálculo de la probabilidad asociada se consideran como “extremos” todos aquellos
valores posibles de 𝑋̄ que estén igual o más alejados de 𝜇0 que 𝑥𝑜𝑏𝑠
̄ , en cualquier dirección.
Para demostrar la deducción de los valores críticos 𝑐1 y 𝑐2 , se parte también de la probabilidad de error de tipo I
deseada:

(1) (2)
𝑃 (𝐸𝐼 ) = 𝛼 ⟹ 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼 ⟹ 𝑃 (𝑋̄ ≤ 𝑐1 ∪ 𝑋̄ ≥ 𝑐2 /𝜇 = 𝜇0 ) = 𝛼
(3)
⟹ 𝑃 (𝑋̄ ≤ 𝑐1 /𝜇 = 𝜇0 ) + 𝑃 (𝑋̄ ≥ 𝑐2 /𝜇 = 𝜇0 ) = 𝛼

(1) Por definición de 𝐸𝐼 .


(2) 𝐸𝐼 para el caso de la prueba de hipótesis que estamos analizando.
(3) Por ser sucesos mutuamente excluyentes.
Dado que se pretende que 𝛼 esté dividido equitativamente en ambas colas de la distribución, se plantea:
𝛼 𝛼
𝑃 (𝑋̄ ≤ 𝑐1 /𝜇 = 𝜇0 ) = y 𝑃 (𝑋̄ ≥ 𝑐2 /𝜇 = 𝜇0 ) =
2 2
Queda como ejercicio propuesto completar a partir de aquí la deducción de las expresiones para 𝑐1 y 𝑐2 .

6.3.7. Variancia poblacional desconocida


Hasta aquí hemos asumido que la media muestral sigue una distribución normal y, en consecuencia, hemos utilizado
en todas las deducciones el hecho de que:
𝑋̄ − 𝜇
𝑍= √ ∼ 𝑁 (0, 1)
𝜎/ 𝑛

Sin embargo, así como existe incertidumbre sobre el promedio poblacional 𝜇, es frecuente que también se desconozca
el verdadero valor de la variancia poblacional, 𝜎2 . En estos casos, resulta natural reemplazarla por la información
muestral a través del buen estimador 𝑆 2 :
𝑋̄ − 𝜇

𝑆/ 𝑛
A diferencia del caso anterior, esta estadística no sigue una distribución normal estándar. Como se demostró en
la Unidad 4, bajo el supuesto de que la variable aleatoria 𝑋 es normal, dicha estadística sigue una distribución
t-Student con 𝑛 − 1 grados de libertad:
𝑋̄ − 𝜇
𝑇 = √ ∼ 𝑡𝑛−1
𝑆/ 𝑛
A continuación se presentan las pruebas de hipótesis para 𝜇 bajo este nuevo escenario. Quedan propuestas las
correspondientes demostraciones, las cuales siguen los mismos pasos mostrados en el caso de contar con variancia
poblacional conocida.
Prueba unilateral a la derecha:
𝐻0 )𝜇 = 𝜇0 ó 𝐻0 )𝜇 ≤ 𝜇0
versus:
𝐻1 )𝜇 > 𝜇0 ó 𝐻1 )𝜇 = 𝜇1 con 𝜇1 > 𝜇0

12
Estadística - FCByF Unidad 6

Regla de decisión:
𝑠
̄ ≥ 𝑐𝛼 = 𝜇0 + 𝑡𝑛−1;1−𝛼 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛
o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 ≥ 𝑡𝑛−1;1−𝛼 𝑡𝑜𝑏𝑠 = √
𝑠/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (𝑋̄ ≥ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑇 ≥ 𝑡𝑜𝑏𝑠 )

Prueba unilateral a la izquierda:


𝐻0 )𝜇 = 𝜇0 ó 𝐻0 )𝜇 ≥ 𝜇0
versus:
𝐻1 )𝜇 < 𝜇0 ó 𝐻1 )𝜇 = 𝜇1 con 𝜇1 < 𝜇0

Regla de decisión:
𝑠
̄ ≤ 𝑐𝛼 = 𝜇0 − 𝑡𝑛−1;1−𝛼 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛
o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 ≤ −𝑡𝑛−1;1−𝛼 𝑡𝑜𝑏𝑠 = √
𝑠/ 𝑛

o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (𝑋̄ ≤ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑇 ≤ 𝑡𝑜𝑏𝑠 )

Prueba bilateral:
𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 ≠ 𝜇0

Regla de decisión:
𝑠 𝑠
̄ ≤ 𝜇0 − 𝑡𝑛−1;1−𝛼/2 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠 o si ̄ ≥ 𝜇0 + 𝑡𝑛−1;1−𝛼/2 √
𝑥𝑜𝑏𝑠
𝑛 𝑛

o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si |𝑡𝑜𝑏𝑠 | ≥ 𝑡𝑛−1;1−𝛼/2 𝑡𝑜𝑏𝑠 = √
𝑠/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 2𝑃 (𝑇 ≥ |𝑡𝑜𝑏𝑠 |)

6.4. Ensayo de hipótesis para la probabilidad de un suceso


Ahora estudiaremos el caso en el que interese efectuar una prueba de hipótesis acerca del verdadero valor de la
probabilidad de ocurrencia de un suceso 𝐴 en una población, 𝑝 = 𝑃 (𝐴). Esta metodología es empleada cuando
se desea ensayar hipótesis sobre la proporción de individuos de la población que presentan dicho suceso o poseen
alguna característica de interés. Abordaremos esta situación recordando los pasos generales para llevar adelante
cualquier prueba de hipótesis.
Prueba unilateral a la derecha.
1. Plantear las hipótesis:
𝐻0 )𝑝 = 𝑝0 𝑣𝑠 𝐻1 )𝑝 > 𝑝0

2. Fijar el nivel de significación: 𝑃 (𝐸𝐼 ) = 𝛼.

13
Estadística - FCByF Unidad 6

3. Especificar la estadística base: se trabajará con la frecuencia relativa del suceso en la muestra, ℎ(𝐴). Por
simplicidad, nos referiremos a ella directamente como ℎ. También es llamada “proporción muestral”. Como
se ha demostrado en la Unidad 4, esta estadística tiene distribución normal si el tamaño muestral es grande.
Por lo tanto, para conducir esta prueba de hipótesis se tomará el criterio práctico de requerir 𝑛 ≥ 30. Si 𝐻0
es cierta se tiene entonces que:
𝐻0 𝑝 (1 − 𝑝0 )
ℎ ∼ 𝑁 (𝑝0 , √ 0 )
𝑛
También se acostumbra a indicar 1 − 𝑝0 = 𝑞0 .
4. Determinar la región de rechazo:

Regla de decisión: Rechazar 𝐻0 si ℎ𝑜𝑏𝑠 ≥ 𝑐𝛼

p0 cα h
Región de no rechazo Región de rechazo

Figura 6.6: Representación gráfica de una prueba de hipótesis unilateral a la derecha para la probabilidad de un
suceso.

Demostraremos que dicho valor crítico es igual a 𝑐𝛼 = 𝑝0 + 𝑧1−𝛼 √ 𝑝0𝑛𝑞0 , donde 𝑧1−𝛼 es el percentil (1 − 𝛼) × 100
de la distribución normal estándar. Para esto, se parte desde el planteo de la probabilidad de error de tipo I:

(1) (2) (3) 𝑐𝛼 − 𝑝0


𝑃 (𝐸𝐼 ) = 𝛼 ⟹ 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼 ⟹ 𝑃 (ℎ ≥ 𝑐𝛼 /𝑝 = 𝑝0 ) = 𝛼 ⟹ 𝑃 (𝑍 ≥ )=𝛼
√ 𝑝0𝑛𝑞0

(4) 𝑐𝛼 − 𝑝 0 (5) 𝑝0 𝑞0
⟹ = 𝑧1−𝛼 ⟹ 𝑐𝛼 = 𝑝0 + 𝑧1−𝛼 √
√ 𝑝0𝑛𝑞0 𝑛

(1) Por definición de 𝐸𝐼 .


(2) 𝐸𝐼 para el caso de la prueba de hipótesis que estamos analizando.
(3) Debido a que la frecuencia relativa sigue una distribución normal.
(4) El segundo miembro de la desigualdad es un percentil de la distribución normal estándar.
(5) Por despeje.
Las siguientes reglas de decisión son equivalentes:
ℎ𝑜𝑏𝑠 − 𝑝0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≥ 𝑧1−𝛼 𝑧𝑜𝑏𝑠 =
√ 𝑝0𝑛𝑞0

Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (ℎ ≥ ℎ𝑜𝑏𝑠 /𝑝 = 𝑝0 ) = 𝑃 (𝑍 ≥ 𝑧𝑜𝑏𝑠 )

14
Estadística - FCByF Unidad 6

5. Obtener una muestra y calcular el valor observado de la estadística base.


6. Tomar una decisión y concluir.
Se debe notar que las reglas de decisión mencionadas son válidas también en los casos donde 𝐻0 es una hipótesis
compuesta (𝐻0 )𝑝 ≤ 𝑝0 ) o 𝐻1 es una hipótesis simple (𝐻1 )𝑝 = 𝑝1 , con 𝑝1 > 𝑝0 ).
Prueba unilateral a la izquierda:

𝐻0 )𝑝 = 𝑝0 ó 𝐻0 )𝑝 ≥ 𝑝0

versus:

𝐻1 )𝑝 < 𝑝0 ó 𝐻1 )𝑝 = 𝑝1 con 𝑝1 < 𝑝0

Regla de decisión:
𝑝0 𝑞0
Rechazar 𝐻0 si ℎ𝑜𝑏𝑠 ≤ 𝑐𝛼 = 𝑝0 − 𝑧1−𝛼 √
𝑛
o bien,
ℎ𝑜𝑏𝑠 − 𝑝0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≤ −𝑧1−𝛼 𝑧𝑜𝑏𝑠 =
√ 𝑝0𝑛𝑞0

o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (ℎ ≤ ℎ𝑜𝑏𝑠 /𝑝 = 𝑝0 ) = 𝑃 (𝑍 ≤ 𝑧𝑜𝑏𝑠 )

Queda propuesto como ejercicio verificar la deducción del valor 𝑐𝛼 .


Prueba bilateral:

𝐻0 )𝑝 = 𝑝0 𝑣𝑠 𝐻1 )𝑝 ≠ 𝑝0

Regla de decisión:

𝑝0 𝑞0 𝑝0 𝑞0
Rechazar 𝐻0 si ℎ𝑜𝑏𝑠 ≤ 𝑝0 − 𝑧1−𝛼/2 √ o si ℎ𝑜𝑏𝑠 ≥ 𝑝0 + 𝑧1−𝛼/2 √
𝑛 𝑛

o bien,
ℎ𝑜𝑏𝑠 − 𝑝0
Rechazar 𝐻0 si |𝑧𝑜𝑏𝑠 | ≥ 𝑧1−𝛼/2 𝑧𝑜𝑏𝑠 =
√ 𝑝0𝑛𝑞0

o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 2𝑃 (𝑍 ≥ |𝑧𝑜𝑏𝑠 |)

Queda propuesto como ejercicio verificar la deducción de los valores críticos.

6.5. Ensayo de hipótesis para la variancia de una población normal


Para terminar la unidad, se presenta la prueba de hipótesis para evaluar el parámetro 𝜎2 . Consideraremos solamente
el caso de una prueba unilateral por derecha.
1. Plantear las hipótesis: 𝐻0 )𝜎2 = 𝜎02 𝑣𝑠 𝐻1 )𝜎2 > 𝜎02
2. Fijar el nivel de significación: 𝑃 (𝐸𝐼 ) = 𝛼.

15
Estadística - FCByF Unidad 6

3. Especificar la estadística base: se trabajará con la variancia muestral, 𝑆 2 . Se tendrá como requisito que
la variable estudiada siga una distribución normal, 𝑋 ∼ 𝑁 (𝜇, 𝜎), para que sea válido el empleo de la siguiente
distribución muestral demostrada en la Unidad 4:

(𝑛 − 1)𝑆 2
𝑈= ∼ 𝜒2𝑛−1
𝜎2

Si 𝐻0 es cierta se tiene entonces que:


(𝑛 − 1)𝑆 2 𝐻0 2
𝑈= ∼ 𝜒𝑛−1
𝜎02

4. Determinar la región de rechazo:

Regla de decisión: Rechazar 𝐻0 si 𝑠2𝑜𝑏𝑠 ≥ 𝑐𝛼

𝜒2 𝜎2
Demostraremos que dicho valor crítico es igual a 𝑐𝛼 = 𝑛−1;1−𝛼
𝑛−1
0
, donde 𝜒2𝑛−1;1−𝛼 es el percentil (1−𝛼)×100 de
la distribución chi-cuadrado con 𝑛−1 grados de libertad. Para esto, se parte desde el planteo de la probabilidad
de error de tipo I:

(1) (2)
𝑃 (𝐸𝐼 ) = 𝛼 ⟹ 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼 ⟹ 𝑃 (𝑆 2 ≥ 𝑐𝛼 /𝜎2 = 𝜎02 ) = 𝛼
(3) (𝑛 − 1)𝑆 2 (𝑛 − 1)𝑐𝛼 (4) (𝑛 − 1)𝑐𝛼
⟹ 𝑃( 2
≥ 2
) = 𝛼 ⟹ 𝑃 (𝑈 ≥ )=𝛼
𝜎0 𝜎0 𝜎02
(5) (𝑛 − 1)𝑐𝛼 2
(6) 𝜒2𝑛−1;1−𝛼 𝜎02
⟹ = 𝜒 𝑛−1;1−𝛼 ⟹ 𝑐 𝛼 =
𝜎02 𝑛−1

(1) Por definición de 𝐸𝐼 .

(2) 𝐸𝐼 para el caso de la prueba de hipótesis que estamos analizando.

(3) Se multiplican ambos miembros de la desigualdad por las mismas constantes.

(4) Por definición de la estadística 𝑈 , que sigue una distribución chi-cuadrado.

(5) El segundo miembro de la desigualdad es un percentil de la distribución chi-cuadrado con 𝑛 − 1 grados


de libertad.

(6) Por despeje.

Las siguientes reglas de decisión son equivalentes:

(𝑛 − 1)𝑠2𝑜𝑏𝑠
Rechazar 𝐻0 si 𝑢𝑜𝑏𝑠 ≥ 𝜒2𝑛−1;1−𝛼 𝑢𝑜𝑏𝑠 =
𝜎02

Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (𝑆 2 ≥ 𝑠2𝑜𝑏𝑠 /𝜎2 = 𝜎02 ) = 𝑃 (𝑈 ≥ 𝑢𝑜𝑏𝑠 )

5. Obtener una muestra y calcular el valor observado de la estadística base.

6. Tomar una decisión y concluir.

Se debe notar que las reglas de decisión mencionadas son válidas también en los casos donde 𝐻0 es una hipótesis
compuesta (𝐻0 )𝜎2 ≤ 𝜎02 ) o 𝐻1 es una hipótesis simple (𝐻1 )𝜎2 = 𝜎12 , con 𝜎12 > 𝜎02 ).

16
Estadística - FCByF Unidad 6

6.6. Bibliografía
Devore, J. L. (2008). Probabilidad y estadística para ingenierías y ciencias. Cengage Learning Editores. Capí-
tulo 8.
Hines, W. W., Montgomery, D. C., & Borror, D. M. G. C. M. (1993). Probabilidad y Estadística para ingeniería
y administración. Segunda Edición. (1993) Compañía Editorial Continental S.A. México. Capítulo 11.
Wackerly, D., Mendenhall, W., Scheaffer, R., Romo Muñoz, J. & García Hernández, A. (2010). Estadística
matemática con aplicaciones. Cengage Learning Editores. Capítulo 10.
Walpole, R., Myers, R., Myers, S., Ye, K. (2007). Probabilidad y estadística para ingenierías y ciencias. Pearson
Prentice Hall. Capítulo 10.

17

También podría gustarte