Pruebas de Hipótesis en Base A Una Muestra: Estadística - Unidad 6
Pruebas de Hipótesis en Base A Una Muestra: Estadística - Unidad 6
Pruebas de Hipótesis en Base A Una Muestra: Estadística - Unidad 6
Año 2021∗
6.1. Introducción
En la unidad anterior se presentó una de las dos herramientas fundamentales de la inferencia estadística: la esti-
mación de parámetros. En esta unidad daremos nuestros primeros pasos en el estudio de la segunda, la prueba
o ensayo de hipótesis. Una prueba de hipótesis es un procedimiento estadístico empleado para tomar una
decisión acerca del valor de uno o más parámetros poblacionales, en base a la información de una muestra.
El procedimiento para realizar una prueba de hipótesis refleja todos los pasos del método científico: quien está
investigando realiza una observación sobre el mundo que le rodea, plantea una pregunta de interés sobre el fenómeno
observado y propone una hipótesis, es decir, formula una teoría que pretende dar respuesta a la pregunta. La
hipótesis debe ser comprobable y refutable, siendo el siguiente paso conducir un proceso de experimentación y
observación que permita concluir acerca de su validez. El circuito del método científico es iterativo, puesto que si
la hipótesis es refutada, se plantearán nuevas respuestas plausibles y si es confirmada, seguramente surgirán nuevos
interrogantes relacionados para seguir estudiando.
En términos asociados a nuestro contexto, el equipo que conduce una investigación estadística efectúa una obser-
vación y plantea una pregunta sobre la población de interés, estableciendo como posible respuesta una afirmación
cuantitativa sobre uno o más parámetros de la población, es decir, postulando una hipótesis estadística. Luego,
toma una muestra aleatoria y contrasta la información contenida en ella con lo sostenido por la hipótesis, con el fin
de llegar a una conclusión que la avale o la rechace.
Consideremos algunas situaciones:
Ejemplo 1: de acuerdo con las especificaciones, ciertos comprimidos deben contener 50 𝑚𝑔 de una droga. El
personal del laboratorio sospecha que se ha producido un aumento en el promedio de concentración de la
droga en los comprimidos, luego de que se hiciera un cambio la línea de producción.
∗ Este apunte se encuentra en desarrollo. El mismo será revisado a lo largo del cuatrimestre y no está exento de presentar errores o
expresar ideas en formas que puedan ser mejoradas. Agradeceremos que nos notifiquen de los errores encontrados.
1
Estadística - FCByF Unidad 6
aleatoria
2
Estadística - FCByF Unidad 6
Ejemplo 1:
𝐻0 )𝜇 = 50 𝑚𝑔
𝐻1 )𝜇 > 50 𝑚𝑔
Ejemplo 2:
𝐻0 )𝑝 = 0.01
𝐻1 )𝑝 ≠ 0.01
Ejemplo 3:
2
𝐻0 )𝜎2 = 0.5 unidades
2
𝐻1 )𝜎2 > 0.5 unidades
El procedimiento de la prueba de hipótesis conduce a una de las siguientes conclusiones:
Rechazar 𝐻0 , debido a la evidencia suficiente en los datos a favor de 𝐻1 .
No rechazar 𝐻0 , debido a la evidencia insuficiente en los datos a favor de 𝐻1 .
Esta forma de referirse a la conclusión de la prueba de hipótesis en términos del rechazo o no rechazo de 𝐻0 puede
ser llamativa al enfrentarse a este tema por primera vez. Se considera que es posible establecer una conclusión
firme más bien al rechazar y no tanto al aceptar una hipótesis, ya que un “rechazo” la descarta, mientras que
un “no rechazo” no excluye otras posibilidades. Por lo tanto, si una investigación pretende validar su hipótesis de
investigación plasmada en 𝐻1 , se busca hacerlo mediante el rechazo de la hipótesis que la contradiga.
Para familiarizarse con este procedimiento, puede ser de ayuda hacer un paralelo con lo que sucede en un juicio
penal. Las hipótesis son:
𝐻0 ) La persona acusada es inocente.
𝐻1 ) La persona acusada es culpable.
A la persona se la acusa porque hay una sospecha de que puede estar involucrada en el delito en cuestión. Sin
embargo, el principio de presunción de inocencia establece que toda persona es inocente hasta que se demuestre
lo contrario. Por lo tanto, el status quo o lo que se asume cierto, es decir, la hipótesis nula, es que la persona es
inocente y esto no se rechazará hasta que surja evidencia contundente que la incrimine. No rechazar 𝐻0 no implica
inocencia, sino que no hay evidencia suficiente para culpar a la persona, por lo que no necesariamente se acepta 𝐻0 ,
sino que no se la rechaza.
𝐻0 )𝜇 = 50 𝑚𝑔 𝑣𝑠 𝐻1 )𝜇 > 50 𝑚𝑔
Siendo el parámetro en cuestión el contenido promedio del fármaco en los comprimidos (𝜇), resulta natural resumir
la información de la muestra con el cálculo de la media aritmética, 𝑋.̄ Cuanto más grande sea el valor observado
de esta estadística, más evidencia a favor de 𝐻1 proveerá la muestra y se deberá optar por el rechazo de 𝐻0 . Por lo
tanto, la media aritmética será la estadística base de la prueba.
Definición. La estadística base de la prueba, al igual que un estimador, es una función de la muestra aleatoria
que se considera como base para la toma de decisiones estadísticas.
Imaginemos que se tomó una muestra de 𝑛 = 50 comprimidos y se encontró 𝑥̄ = 59 𝑚𝑔. Posiblemente nuestra intui-
ción nos indique que tal valor es demasiado grande como para pensar que 𝐻0 )𝜇 = 50 𝑚𝑔 sea cierta y concluiríamos
a favor de 𝐻1 . ¿Pero cuál sería nuestra opinión si hubiésemos observado 𝑥̄ = 50.5 𝑚𝑔? Tal vez nos inclinaríamos a
no rechazar 𝐻0 , pensando que la muestra no presenta evidencia lo suficientemente fuerte como para concluir que
3
Estadística - FCByF Unidad 6
el verdadero promedio es mayor a 50 𝑚𝑔‡ . De hecho, sabemos que la media aritmética es una variable aleatoria,
depende de la muestra analizada y sus posibles valores presentan cierta variabilidad, por lo cual esperamos que 𝑋̄
fluctúe alrededor de 50 mg si es cierto que 𝜇 = 50 𝑚𝑔.
Entonces, queda claro que hay ciertos valores posibles de la estadística base que nos indican que se debe rechazar
la hipótesis nula y otros que avalan el no rechazo de la misma.
Definición. La región crítica o de rechazo es el conjunto de valores de la estadística base que conducen al
rechazo de la hipótesis nula en favor de la alternativa. Si en la muestra analizada el valor de la estadística base no
cae en la región de rechazo, se dirá que “no se rechaza la hipótesis nula”. El conjunto de los restantes valores de la
estadística es llamado región de no rechazo.
Ahora bien, ¿cuánta evidencia “se necesita” para rechazar 𝐻0 ? ¿A partir de qué valor observado de 𝑋̄ (𝑥𝑜𝑏𝑠 ̄ ) se
debe rechazar 𝐻0 ? ¿Si la media es mayor a 52 𝑚𝑔? ¿O si es mayor a 55 𝑚𝑔? Es decir, ¿cuál es el valor crítico de la
prueba?
Definición. El valor o punto crítico es el valor de la estadística base a partir del cual se debe rechazar 𝐻0 , es
decir, es el punto en el eje numérico que separa la región de rechazo de la de no rechazo.
La selección del valor crítico no se realiza “a ojo”, sino que está íntimamente relacionada con el estudio de la
distribución muestral de la estadística base y a la noción de que, al tomar una decisión, se puede estar incurriendo
en un error, como se explica en la siguiente sección.
Definiciones:
Un error de tipo I se comete cuando se decide rechazar 𝐻0 , siendo la misma cierta. La probabilidad de
cometer un error de tipo I se simboliza con 𝛼:
Para el ejemplo 1:
Un error de tipo I se cometería si se concluye, en base a la muestra, que el contenido promedio del fármaco en
los comprimidos es mayor a 50 𝑚𝑔 cuando en realidad no lo es. Esto puede ocurrir si, debido a la variabilididad
de la distribución muestral de la media, observamos un valor de 𝑋̄ superior al valor crítico, aún siendo cierta 𝐻0 .
Como consecuencia, el laboratorio deberá interrumpir el proceso productivo para efectuar ajustes innecesarios.
‡ La noción del valor 59 como “grande” y del valor 50.5 como cercano a 50 se establece sólo como ejemplo, ya que tales aseveraciones
deben realizarse objetivamente en base a la distribución muestral de la estadística, la cual depende del tamaño muestral y la variancia
de la variable estudiada.
4
Estadística - FCByF Unidad 6
Un error de tipo II se cometería si se concluye, en base a la muestra, que el contenido promedio del
fármaco en los comprimidos no es mayor a 50 𝑚𝑔 cuando en realidad sí lo es. Esto puede ocurrir si, debido
a la variabilididad de la distribución muestral de la media, observamos un valor de 𝑋̄ menor que el valor
crítico, aún siendo falsa 𝐻0 . Como consecuencia, el laboratorio estaría produciendo comprimidos por fuera de
lo especificado, que derivará en el desperdicio del compuesto o en problemas en futuras rondas de control.
Como 𝐻0 )𝜇 = 50 𝑚𝑔 especifica un valor único del parámetro, el valor de 𝛼 es único. Sin embargo, como 𝐻1 )𝜇 > 50 𝑚𝑔
no especifica un valor particular del parámetro sino que sostiene que el verdadero promedio podría ser cualquier
valor mayor a 50 𝑚𝑔, existe un valor de 𝛽 diferente para cada valor 𝜇 compatible con 𝐻1 .
Dado que no es posible tomar una decisión con total certeza, se pretende que la probabilidad de cometer cualquiera
de estos errores sea tan baja como sea posible. Recordemos que, después de todo, el objetivo de la Estadística
es disminuir la incertidumbre existente en procesos de toma de decisión. Desafortunadamente, para un tamaño
muestral fijo, disminuir la probabilidad de error de tipo I (𝛼) resulta en un aumento de la probabilidad de error de
tipo II (𝛽) y viceversa§ . Se debe establecer, entonces, un compromiso entre 𝛼 y 𝛽.
Siendo que la hipótesis nula plantea lo que se asume como cierto hasta el momento, el procedimiento de las pruebas
de hipótesis toma un criterio conservador: se elige el máximo valor de probabilidad de rechazar incorrectamente 𝐻0
(𝛼) que se esté dispuesto a tolerar y se determina la región de rechazo en función del mismo, de modo que 𝛽 sea
tan pequeña como sea posible, pero sin una cota superior preestablecida.
El hecho de que la probabilidad de rechazar 𝐻0 erróneamente (𝛼) sea fijada por el equipo de investigación tan
pequeña como se desee hace que el rechazo de 𝐻0 sea considerado siempre como una conclusión fuerte. Por otro
lado, como se mencionó anteriormente, la probabilidad de no rechazar 𝐻0 erróneamente (𝛽) no está acotada y
depende del verdadero valor del parámetro, por lo cual se suele considerar la decisión de no rechazar 𝐻0 como una
conclusión débil. Estas razones justifican la preferencia por la expresión “no se rechaza 𝐻0 ” en lugar de “se acepta
𝐻0 ” y el hecho de que generalmente se vuelque la hipótesis de investigación en la hipótesis alternativa, para que la
decisión de avalarla, si correspondiese, esté sostenida por una resolución firme.
Dado que la probabilidad de error de tipo II depende del verdadero valor del parámetro, es decir, de la magnitud en
la cual 𝐻0 es falsa, se la considera como un indicador de la capacidad que tiene una prueba de hipótesis de detectar
una diferencia particular respecto a lo postulado en 𝐻0 :
Definición. La potencia es la probabilidad del suceso contrario al error de tipo II, es decir, de rechazar correcta-
mente la hipótesis nula:
𝑃 𝑜𝑡𝑒𝑛𝑐𝑖𝑎 = 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 1 − 𝑃 (𝐸𝐼𝐼 ) = 1 − 𝛽
En general, se formula 𝐻0 con una afirmación de igualdad, como en el caso de 𝐻0 )𝜇 = 50 𝑚𝑔 vs 𝐻1 )𝜇 > 50 𝑚𝑔. En
algunas situaciones particulares puede ser de interés plantear 𝐻0 como una desigualdad, por ejemplo: 𝐻0 )𝜇 ≤ 50 𝑚𝑔
vs 𝐻1 )𝜇 > 50 𝑚𝑔. En estos casos, el valor exacto de la probabilidad de error de tipo I depende en realidad del
verdadero valor del parámetro bajo 𝐻0 , pero siempre será menor que el valor 𝛼 elegido para determinar la región
de rechazo. Es por esto que 𝛼 recibe el nombre de nivel de significación de la prueba. Generalmente se utiliza
𝛼 igual a 0.01, 0.05 o 0.10.
6.2.4. Clasificación
En función de la cantidad de valores postulados para el parámetro, una hipótesis se considera:
Simple: establece un solo punto (número real) para el valor del parámetro. Por ejemplo: 𝐻0 )𝜇 = 50 𝑚𝑔.
Compuesta: establece más de un punto para el valor del parámetro. Por ejemplo: 𝐻1 )𝜇 > 50 𝑚𝑔.
En función de la hipótesis alternativa, las prueba de hipótesis se clasifican en:
Unilaterales a la derecha: 𝐻1 propone para el parámetro valores mayores que aquel planteado por 𝐻0 . Es
el caso del ejemplo 1: 𝐻0 )𝜇 = 50 𝑚𝑔 vs 𝐻1 )𝜇 > 50 𝑚𝑔. La región de rechazo se localiza en la cola derecha de
la distribución muestral de la estadística base.
Unilaterales a la izquierda: 𝐻1 propone para el parámetro valores menores que aquel planteado por 𝐻0 .
Por ejemplo: 𝐻0 )𝜇 = 50 𝑚𝑔 vs 𝐻1 )𝜇 < 50 𝑚𝑔. La región de rechazo se localiza en la cola izquierda de la
distribución muestral de la estadística base.
§ Sólo es posible disminuir 𝛼 y 𝛽 simultáneamente aumentando el tamaño muestral
5
Estadística - FCByF Unidad 6
Bilaterales: 𝐻1 propone para el parámetro valores ya sea mayores o menores que aquel planteado por 𝐻0 .
Es el caso del ejemplo 2: 𝐻0 )𝑝 = 0.01 vs 𝐻1 )𝑝 ≠ 0.01. La región de rechazo se localiza en ambas colas de la
distribución muestral de la estadística base.
𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 > 𝜇0
𝜇0 representa el valor postulado por la hipótesis nula para el promedio poblacional (en el ejemplo 1, 𝜇0 toma
el valor 50 𝑚𝑔).
2. Fijar el nivel de significación. Se considera 𝑃 (𝐸𝐼 ) = 𝛼.
3. Especificar la estadística base. Se trabaja con la media aritmética de una muestra aleatoria de tamaño
𝑛
𝑛: 𝑋̄ = 𝑛1 ∑𝑖=1 𝑋𝑖 . Si la variable 𝑋 sigue una distribución normal o si el tamaño muestral es grande (por
el Teorema Central del Límite), la distribución de la media también es normal, como hemos aprendido en la
Unidad 4. Bajo el supuesto de que 𝐻0 es cierta, el verdadero promedio es 𝜇0 y se tiene:
𝐻0 𝜎
𝑋̄ ∼ 𝑁 (𝜇0 , √ )
𝑛
4. Determinar la región de rechazo. Dado que 𝐻1 sostiene que el verdadero promedio es mayor a lo postulado
en 𝐻0 , es claro que observar un valor grande de 𝑋̄ debe conducir al rechazo de 𝐻0 . Es decir, se debe rechazar
𝐻0 si el valor observado de 𝑋̄ es mayor o igual que el valor crítico. Simbolizaremos a este número con 𝑐𝛼 ,
enfatizando que queda determinado por la probabilidad de error de tipo I elegida para la prueba. Luego, se
deberá seguir la siguiente instrucción:
Demostraremos que dicho valor crítico es igual a 𝑐𝛼 = 𝜇0 + 𝑧1−𝛼 √𝜎𝑛 , donde 𝑧1−𝛼 es el percentil (1 − 𝛼) × 100
de la distribución normal estándar. Para esto, se parte desde el planteo de la probabilidad de error de tipo I:
6
Estadística - FCByF Unidad 6
µ0 cα
X
Región de no rechazo Región de rechazo
Si 𝑥𝑜𝑏𝑠
̄ cae en la región de rechazo, significa que es un valor extraño de observar bajo el supuesto de que
𝐻0 sea cierta. Entonces esto se considera como evidencia de que no lo es y se decide rechazarla. Claramente,
podríamos haber observado dicho valor “extremo” de la media aún si 𝐻0 fuese verdadera, pero la probabilidad
de que esto ocurra es tan baja (fue fijada en el valor 𝑃 (𝐸𝐼 ) = 𝛼), que se decide por el rechazo de la misma.
La regla de decisión presentada es equivalente a la siguiente:
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≥ 𝑧1−𝛼 𝑧𝑜𝑏𝑠 = √
𝜎/ 𝑛
La diferencia radica en que la primera compara el valor observado de la media aritmética con el valor crítico en
unidades de la variable original, mientras que la segunda estandariza el valor observado de media aritmética
y lo compara directamente con el percentil correspondiente de la distribución normal estándar.
5. Obtener una muestra y calcular el valor observado de la estadística base. Una vez establecida la
regla de decisión, a partir de los datos muestrales debe calcularse el valor de la media aritmética.
6. Tomar una decisión y concluir. La prueba de hipótesis finaliza estableciendo una conclusión en términos
del problema y que haga referencia a que la misma depende de la muestra analizada y del nivel de significación
𝛼 establecido.
7
Estadística - FCByF Unidad 6
Para el caso estudiado de una prueba unilateral por derecha, la probabilidad asociada se calcula como: 𝑝𝑎𝑠𝑜𝑐 =
𝑃 (𝑋̄ ≥ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑍 ≥ 𝑧𝑜𝑏𝑠 ). Los siguientes esquemas evidencian que esta nueva regla de decisión es
equivalente a la enunciada primeramente, ya que si 𝑥𝑜𝑏𝑠
̄ cae en la región de rechazo, entonces necesariamente será
𝑝𝑎𝑠𝑜𝑐 < 𝛼:
α
pasoc
µ0 cα xobs
X
Región de no rechazo Región de rechazo
pasoc
α
µ0 xobs cα
X
Región de no rechazo Región de rechazo
La probabilidad asociada es una medida de cuánta evidencia provee la muestra a favor de 𝐻0 . Un valor pequeño
de esta probabilidad significa que el valor obtenido de la estadística base (o alguno que contradiga aún más a la
hipótesis nula) tiene muy baja chance de ocurrir en el escenario que supone cierta a 𝐻0 , por lo tanto conduce a su
rechazo.
Definición. La probabilidad asociada (también llamada valor p o p-value) es la probabilidad de observar un
valor de la estadística base igual o más extremo que el obtenido en la muestra, suponiendo cierta 𝐻0 .
Los valores más extremos son aquellos que proveen más evidencia en contra de 𝐻0 y a favor de 𝐻1 . En el caso
analizado, son los valores de la media mayores o iguales que el calculado en la muestra. El sentido de lo extremo
depende del tipo de ensayo (unilateral por derecha, unilateral por izquierda o bilateral). No obstante, la regla de
decisión bajo este enfoque es la misma en todos los casos.
8
Estadística - FCByF Unidad 6
𝜎
𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 > 𝜇0 𝑋̄ ∼ 𝑁 (𝜇, √ )
𝑛
𝜎
̄ ≥ 𝑐𝛼 = 𝜇0 + 𝑧1−𝛼 √
Regla de decisión: Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛
En las figuras anteriores pudimos representar gráficamente a 𝑃 (𝐸𝐼 ) = 𝛼 bajo la distribución muestral de la estadís-
tica base ante el supuesto de que 𝐻0 sea cierta. Un error de tipo II, en cambio, sólo puede ocurrir si 𝐻0 es falsa y
𝐻1 es cierta. Por lo tanto, 𝑃 (𝐸𝐼𝐼 ) = 𝛽 depende de cuál es aquel verdadero valor del promedio, mayor que 𝜇0 . Para
poder calcularla se debe especificar este valor del promedio bajo 𝐻1 , al cual llamaremos 𝜇1 . Entonces, se tiene:
𝐻0 𝜎 𝐻1 𝜎
𝑋̄ ∼ 𝑁 (𝜇0 , √ ) y 𝑋̄ ∼ 𝑁 (𝜇1 , √ )
𝑛 𝑛
𝑐𝛼 − 𝜇 1
𝑃 (𝐸𝐼𝐼 ) = 𝑃 (𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝑃 (𝑋̄ < 𝑐𝛼 /𝜇 = 𝜇1 ) = 𝑃 (𝑍 < √ )
𝜎/ 𝑛
Ahora estamos en condiciones de representar gráficamente ambos escenarios y todas las probabilidades intervinientes:
H0 H1
Potencia
β α
µ0 cα µ1
Región de no rechazo Región de rechazo X
9
Estadística - FCByF Unidad 6
Menor heterogeneidad en la población en estudio (es decir, menor 𝜎) produce el mismo efecto que el mencionado
en el punto anterior.
Si 𝐻1 es cierta, cuanto más lejos se encuentre el verdadero promedio 𝜇1 del valor 𝜇0 postulado por 𝐻0 , más
fácil será detectarlo y rechazar la hipótesis nula, es decir, mayor es la potencia. Esto se debe a que las curvas
estarían menos superpuestas. Por el contrario, cuanto más cercano esté 𝜇1 a 𝜇0 , más difícil será notar la
diferencia y concluir por el rechazo de 𝐻0 . Se necesitaría un gran tamaño muestral para contar con una
potencia adecuada.
(1) (2)
𝑃 (𝐸𝐼𝐼 ) = 𝛽 ⟹ 𝑃 (𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑓𝑎𝑙𝑠𝑎) = 𝛽 ⟹ 𝑃 (𝑋̄ < 𝑐𝛼 /𝜇 = 𝜇1 ) = 𝛽
(3) 𝜎 (4) 𝜇0 + 𝑧1−𝛼 √𝜎𝑛 − 𝜇1 𝜇 −𝜇
⟹ 𝑃 (𝑋̄ < 𝜇0 + 𝑧1−𝛼 √ /𝜇 = 𝜇1 ) = 𝛽 ⟹ 𝑃 (𝑍 < √ ) = 𝛽 ⟹ 𝑃 (𝑍 < 0 √ 1 + 𝑧1−𝛼 ) = 𝛽
𝑛 𝜎 𝑛 𝜎 𝑛
(5) 𝜇0 − 𝜇 1 (6) 𝜇0 − 𝜇1 (7) √
⟹ 𝑧𝛽 = √ + 𝑧1−𝛼 ⟹ −𝑧1−𝛽 = √ + 𝑧1−𝛼 ⟹ (−𝑧1−𝛽 − 𝑧1−𝛼 )𝜎 = (𝜇0 − 𝜇1 ) 𝑛
𝜎 𝑛 𝜎 𝑛
(−𝑧1−𝛽 − 𝑧1−𝛼 )𝜎 2 (𝑧1−𝛼 + 𝑧1−𝛽 )2 𝜎2
⟹ 𝑛=[ ] ⟹ 𝑛=
𝜇0 − 𝜇 1 (𝜇0 − 𝜇1 )2
10
Estadística - FCByF Unidad 6
𝐻0 )𝜇 = 𝜇0 ó 𝐻0 )𝜇 ≥ 𝜇0
versus:
𝐻1 )𝜇 < 𝜇0 ó 𝐻1 )𝜇 = 𝜇1 con 𝜇1 < 𝜇0
se deriva la siguiente regla de decisión:
𝜎
̄ ≤ 𝑐𝛼 = 𝜇0 − 𝑧1−𝛼 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛
o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≤ −𝑧1−𝛼 𝑧𝑜𝑏𝑠 = √
𝜎/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (𝑋̄ ≤ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑍 ≤ 𝑧𝑜𝑏𝑠 )
La demostración de la deducción del valor crítico queda como ejercicio propuesto, así como también la verificación
de que la fórmula para determinar la extensión muestral coincide en este caso con la vista anteriormente.
𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 ≠ 𝜇0
se deberá rechazar la hipótesis nula si el valor observado de la media en la muestra se aleja de 𝜇0 por ser “demasiado
pequeño” o “demasiado grande”. Esto hace que la región de rechazo esté dividida en dos partes, a ambas colas de
la distribución muestral de la estadística base. La correspondiente regla de decisión es:
𝜎 𝜎
̄ ≤ 𝑐1 = 𝜇0 − 𝑧1−𝛼/2 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠 o si ̄ ≥ 𝑐2 = 𝜇0 + 𝑧1−𝛼/2 √
𝑥𝑜𝑏𝑠
𝑛 𝑛
α 2 α 2
c1 µ0 c2
X
Región de rechazo Región de no rechazo Región de rechazo
11
Estadística - FCByF Unidad 6
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≤ −𝑧1−𝛼/2 o si 𝑧𝑜𝑏𝑠 ≥ 𝑧1−𝛼/2 𝑧𝑜𝑏𝑠 = √
𝜎/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 2𝑃 (𝑍 ≥ |𝑧𝑜𝑏𝑠 |)
Se debe observar que para el cálculo de la probabilidad asociada se consideran como “extremos” todos aquellos
valores posibles de 𝑋̄ que estén igual o más alejados de 𝜇0 que 𝑥𝑜𝑏𝑠
̄ , en cualquier dirección.
Para demostrar la deducción de los valores críticos 𝑐1 y 𝑐2 , se parte también de la probabilidad de error de tipo I
deseada:
(1) (2)
𝑃 (𝐸𝐼 ) = 𝛼 ⟹ 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼 ⟹ 𝑃 (𝑋̄ ≤ 𝑐1 ∪ 𝑋̄ ≥ 𝑐2 /𝜇 = 𝜇0 ) = 𝛼
(3)
⟹ 𝑃 (𝑋̄ ≤ 𝑐1 /𝜇 = 𝜇0 ) + 𝑃 (𝑋̄ ≥ 𝑐2 /𝜇 = 𝜇0 ) = 𝛼
Sin embargo, así como existe incertidumbre sobre el promedio poblacional 𝜇, es frecuente que también se desconozca
el verdadero valor de la variancia poblacional, 𝜎2 . En estos casos, resulta natural reemplazarla por la información
muestral a través del buen estimador 𝑆 2 :
𝑋̄ − 𝜇
√
𝑆/ 𝑛
A diferencia del caso anterior, esta estadística no sigue una distribución normal estándar. Como se demostró en
la Unidad 4, bajo el supuesto de que la variable aleatoria 𝑋 es normal, dicha estadística sigue una distribución
t-Student con 𝑛 − 1 grados de libertad:
𝑋̄ − 𝜇
𝑇 = √ ∼ 𝑡𝑛−1
𝑆/ 𝑛
A continuación se presentan las pruebas de hipótesis para 𝜇 bajo este nuevo escenario. Quedan propuestas las
correspondientes demostraciones, las cuales siguen los mismos pasos mostrados en el caso de contar con variancia
poblacional conocida.
Prueba unilateral a la derecha:
𝐻0 )𝜇 = 𝜇0 ó 𝐻0 )𝜇 ≤ 𝜇0
versus:
𝐻1 )𝜇 > 𝜇0 ó 𝐻1 )𝜇 = 𝜇1 con 𝜇1 > 𝜇0
12
Estadística - FCByF Unidad 6
Regla de decisión:
𝑠
̄ ≥ 𝑐𝛼 = 𝜇0 + 𝑡𝑛−1;1−𝛼 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛
o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 ≥ 𝑡𝑛−1;1−𝛼 𝑡𝑜𝑏𝑠 = √
𝑠/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (𝑋̄ ≥ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑇 ≥ 𝑡𝑜𝑏𝑠 )
Regla de decisión:
𝑠
̄ ≤ 𝑐𝛼 = 𝜇0 − 𝑡𝑛−1;1−𝛼 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠
𝑛
o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si 𝑡𝑜𝑏𝑠 ≤ −𝑡𝑛−1;1−𝛼 𝑡𝑜𝑏𝑠 = √
𝑠/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (𝑋̄ ≤ 𝑥𝑜𝑏𝑠
̄ /𝜇 = 𝜇0 ) = 𝑃 (𝑇 ≤ 𝑡𝑜𝑏𝑠 )
Prueba bilateral:
𝐻0 )𝜇 = 𝜇0 𝑣𝑠 𝐻1 )𝜇 ≠ 𝜇0
Regla de decisión:
𝑠 𝑠
̄ ≤ 𝜇0 − 𝑡𝑛−1;1−𝛼/2 √
Rechazar 𝐻0 si 𝑥𝑜𝑏𝑠 o si ̄ ≥ 𝜇0 + 𝑡𝑛−1;1−𝛼/2 √
𝑥𝑜𝑏𝑠
𝑛 𝑛
o bien,
𝑥𝑜𝑏𝑠
̄ − 𝜇0
Rechazar 𝐻0 si |𝑡𝑜𝑏𝑠 | ≥ 𝑡𝑛−1;1−𝛼/2 𝑡𝑜𝑏𝑠 = √
𝑠/ 𝑛
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 2𝑃 (𝑇 ≥ |𝑡𝑜𝑏𝑠 |)
13
Estadística - FCByF Unidad 6
3. Especificar la estadística base: se trabajará con la frecuencia relativa del suceso en la muestra, ℎ(𝐴). Por
simplicidad, nos referiremos a ella directamente como ℎ. También es llamada “proporción muestral”. Como
se ha demostrado en la Unidad 4, esta estadística tiene distribución normal si el tamaño muestral es grande.
Por lo tanto, para conducir esta prueba de hipótesis se tomará el criterio práctico de requerir 𝑛 ≥ 30. Si 𝐻0
es cierta se tiene entonces que:
𝐻0 𝑝 (1 − 𝑝0 )
ℎ ∼ 𝑁 (𝑝0 , √ 0 )
𝑛
También se acostumbra a indicar 1 − 𝑝0 = 𝑞0 .
4. Determinar la región de rechazo:
p0 cα h
Región de no rechazo Región de rechazo
Figura 6.6: Representación gráfica de una prueba de hipótesis unilateral a la derecha para la probabilidad de un
suceso.
Demostraremos que dicho valor crítico es igual a 𝑐𝛼 = 𝑝0 + 𝑧1−𝛼 √ 𝑝0𝑛𝑞0 , donde 𝑧1−𝛼 es el percentil (1 − 𝛼) × 100
de la distribución normal estándar. Para esto, se parte desde el planteo de la probabilidad de error de tipo I:
(4) 𝑐𝛼 − 𝑝 0 (5) 𝑝0 𝑞0
⟹ = 𝑧1−𝛼 ⟹ 𝑐𝛼 = 𝑝0 + 𝑧1−𝛼 √
√ 𝑝0𝑛𝑞0 𝑛
14
Estadística - FCByF Unidad 6
𝐻0 )𝑝 = 𝑝0 ó 𝐻0 )𝑝 ≥ 𝑝0
versus:
Regla de decisión:
𝑝0 𝑞0
Rechazar 𝐻0 si ℎ𝑜𝑏𝑠 ≤ 𝑐𝛼 = 𝑝0 − 𝑧1−𝛼 √
𝑛
o bien,
ℎ𝑜𝑏𝑠 − 𝑝0
Rechazar 𝐻0 si 𝑧𝑜𝑏𝑠 ≤ −𝑧1−𝛼 𝑧𝑜𝑏𝑠 =
√ 𝑝0𝑛𝑞0
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 𝑃 (ℎ ≤ ℎ𝑜𝑏𝑠 /𝑝 = 𝑝0 ) = 𝑃 (𝑍 ≤ 𝑧𝑜𝑏𝑠 )
𝐻0 )𝑝 = 𝑝0 𝑣𝑠 𝐻1 )𝑝 ≠ 𝑝0
Regla de decisión:
𝑝0 𝑞0 𝑝0 𝑞0
Rechazar 𝐻0 si ℎ𝑜𝑏𝑠 ≤ 𝑝0 − 𝑧1−𝛼/2 √ o si ℎ𝑜𝑏𝑠 ≥ 𝑝0 + 𝑧1−𝛼/2 √
𝑛 𝑛
o bien,
ℎ𝑜𝑏𝑠 − 𝑝0
Rechazar 𝐻0 si |𝑧𝑜𝑏𝑠 | ≥ 𝑧1−𝛼/2 𝑧𝑜𝑏𝑠 =
√ 𝑝0𝑛𝑞0
o bien,
Rechazar 𝐻0 si 𝑝𝑎𝑠𝑜𝑐 ≤ 𝛼 𝑝𝑎𝑠𝑜𝑐 = 2𝑃 (𝑍 ≥ |𝑧𝑜𝑏𝑠 |)
15
Estadística - FCByF Unidad 6
3. Especificar la estadística base: se trabajará con la variancia muestral, 𝑆 2 . Se tendrá como requisito que
la variable estudiada siga una distribución normal, 𝑋 ∼ 𝑁 (𝜇, 𝜎), para que sea válido el empleo de la siguiente
distribución muestral demostrada en la Unidad 4:
(𝑛 − 1)𝑆 2
𝑈= ∼ 𝜒2𝑛−1
𝜎2
𝜒2 𝜎2
Demostraremos que dicho valor crítico es igual a 𝑐𝛼 = 𝑛−1;1−𝛼
𝑛−1
0
, donde 𝜒2𝑛−1;1−𝛼 es el percentil (1−𝛼)×100 de
la distribución chi-cuadrado con 𝑛−1 grados de libertad. Para esto, se parte desde el planteo de la probabilidad
de error de tipo I:
(1) (2)
𝑃 (𝐸𝐼 ) = 𝛼 ⟹ 𝑃 (𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 /𝐻0 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼 ⟹ 𝑃 (𝑆 2 ≥ 𝑐𝛼 /𝜎2 = 𝜎02 ) = 𝛼
(3) (𝑛 − 1)𝑆 2 (𝑛 − 1)𝑐𝛼 (4) (𝑛 − 1)𝑐𝛼
⟹ 𝑃( 2
≥ 2
) = 𝛼 ⟹ 𝑃 (𝑈 ≥ )=𝛼
𝜎0 𝜎0 𝜎02
(5) (𝑛 − 1)𝑐𝛼 2
(6) 𝜒2𝑛−1;1−𝛼 𝜎02
⟹ = 𝜒 𝑛−1;1−𝛼 ⟹ 𝑐 𝛼 =
𝜎02 𝑛−1
(𝑛 − 1)𝑠2𝑜𝑏𝑠
Rechazar 𝐻0 si 𝑢𝑜𝑏𝑠 ≥ 𝜒2𝑛−1;1−𝛼 𝑢𝑜𝑏𝑠 =
𝜎02
Se debe notar que las reglas de decisión mencionadas son válidas también en los casos donde 𝐻0 es una hipótesis
compuesta (𝐻0 )𝜎2 ≤ 𝜎02 ) o 𝐻1 es una hipótesis simple (𝐻1 )𝜎2 = 𝜎12 , con 𝜎12 > 𝜎02 ).
16
Estadística - FCByF Unidad 6
6.6. Bibliografía
Devore, J. L. (2008). Probabilidad y estadística para ingenierías y ciencias. Cengage Learning Editores. Capí-
tulo 8.
Hines, W. W., Montgomery, D. C., & Borror, D. M. G. C. M. (1993). Probabilidad y Estadística para ingeniería
y administración. Segunda Edición. (1993) Compañía Editorial Continental S.A. México. Capítulo 11.
Wackerly, D., Mendenhall, W., Scheaffer, R., Romo Muñoz, J. & García Hernández, A. (2010). Estadística
matemática con aplicaciones. Cengage Learning Editores. Capítulo 10.
Walpole, R., Myers, R., Myers, S., Ye, K. (2007). Probabilidad y estadística para ingenierías y ciencias. Pearson
Prentice Hall. Capítulo 10.
17