09 Prueba de Hipótesis 2020
09 Prueba de Hipótesis 2020
09 Prueba de Hipótesis 2020
IV Semestre
DE
AB
TR
AJ
13
SALGADO
SAMANIEGO
2020
Salgado`s- 2020
PRUEBA DE HIPÓTESIS
Cuando se realizan estudios cuantitativos generalmente se tiene que realizar pruebas de hipótesis para que los
conocimientos sean científicos. La prueba de hipótesis está basado en evidencias de la muestra y la teoría de
probabilidades. Para realizar una prueba de hipótesis, se hace algunas inferencias o supuestos con sentido
acerca de la población.
Para realizar pruebas de hipótesis existen dos enfoques: Enfoque clásico y el enfoque basado en un valor de
probabilidad.
HIPÓTESIS ESTADÍSTICAS
Las hipótesis estadísticas se expresan en forma simbólica. Para ello es necesario traducir las hipótesis que se
encuentran en un lenguaje ordinario al lenguaje estadístico.
H1: Uv ≠ Um
H0: Uv = Um
HIPOTESIS ESTADISTICA
H1: Hb Hc
H0: Hb Hc
HIPOTESIS DE INVESTIGACIÓN
H1: Uv 80
H0: Uv ≤ 80
HIPOTESIS DE INVESTIGACION
NIVEL DE SIGNIFICANCIA ( )
Es la probabilidad de rechazar la hipótesis nula cuando es verdadera.
La elección del nivel de significancia es del investigador.
NIVEL DE CONFIANZA NIVEL DE SIGNIFICANCIA CAMPO
Estudios de sondeo
=90%=0.90 =10%=0.10
Ciencias sociales
=95%=0.95
=5%=0.05 Control de calidad
=99%=0.99
=1%= 0.01
TEST DE PRUEBA
TEST PRIMER CASO SEGUNDO CASO
Z normal Hipótesis sobre media Hipótesis sobre proporción
Variable cuantitativa. Variable cualitativa.
Muestras pequeñas n >30 Muestras pequeñas n >30
t de Student Hipótesis sobre media Hipótesis sobre relación
Variable cuantitativa. Variable 1 y 2 cuantitativa
Muestras pequeñas n ≤30 Muestras pequeñas n ≤30
X2 Ji Cuadrada Hipótesis sobre relación Hipótesis sobre variación
Variable 1: cualitativa (una desviación estándar)
Variable 2: cualitativa Variables cuantitativa
Muestra en cualquier tamaño Muestras pequeñas n ≤30
TIPO DE PRUEBA
SIMBOLO DE LA HIPOTESIS ALTERNA
< >
ESQUEMA DE PRUEBA
PUNTO CRÍTICO
Ejemplo 01:
Una máquina envasa néctar de durazno con un contenido medio de 200 gramos con desviación estándar de 0.5
gramos. Un inspector sospecha que la máquina está fallando. Para salir de dudas, tomó una muestra de 40
botellas de néctar para observar sus contenidos (en gramos) y encontró los siguientes resultados.
198.5 200.1 194.2 200.3 200.2 200.1 199.3 197.4
198.4 197.1 203.1 201.4 202.2 195.5 197.4 198.2
200.5 201.1 194.6 195.4 203.0 200.3 200.7 202.1
196.4 203.1 198.8 200.0 198.0 196.2 199.1 200.1
201.4 197.4 195.3 197.8 202.8 192.3 197.3 199.0
b. Luego hallamos el punto crítico en la tabla de distribución normal con el = 0.05 y = 0.95
Z= 1.96
HA: 200 g
2. Esquema de prueba
……..
3. Estadístico de prueba
= -13.28
4. Decisión y conclusión
Como el estadístico cae en la zona de rechazo (-13.3 <-1.96) esto nos obliga a rechazar la hipótesis
nula y aceptar la alterna. En conclusión, diríamos que la máquina está fallando para un 95 % de
confianza.
Ejemplo 02.
En una planta embotelladora de bebidas de gaseosa el contenido promedio de llenado es de 16 onzas. ( =16).
Esta hipótesis Nula (H0:) se prueba en contra la hipótesis alternativa (H A:) que establece lo contrario. En este caso
Cuando se realiza una prueba de hipótesis, la hipótesis nula se supone que es inocente (verdadero) hasta que
una preponderancia de la evidencia indique que es culpable (falso). Al igual que en un escenario legal, la
evidencia de culpable debe establecer más allá de toda duda razonable. Antes que se rechace la hipótesis nula, la
Salgado`s- 2020
evidencia debe ser muy convincente y concluyente. Una conclusión con base a un rechazo de la hipótesis nula es
más significativa que una que termine en un decisión de no rechazo.
Si se asume que se toma una muestra de n botellas y se halla = 16.15 ¿Se puede concluir que la media
poblacional no es 16? Después de todo 16.15 no es 16. Probablemente no. Esta pequeña diferencia podría ser
estadísticamente insignificante puesto que podría explicarse fácilmente como un simple error de muestreo. Es
decir, que debido al error de muestreo es posible tener una población con una media de 16 y salir con una media
de 16.15. Debido al azar, algunas botellas de la muestra pueden estar algo más llenas, produciendo una media
muestral que sobrestime levemente la media poblacional. La evidencia muestra que =16.15 no es lo
suficientemente fuerte como para desencadenar un rechazo de la hipótesis nula de que =16.
Si la diferencia de la muestra entre el valor de la media de 16 bajo la hipótesis y el hallado en la muestra 16.15 es
insuficiente para rechazar la hipótesis nula, el asunto entonces se vuelve simplemente qué tan grande debe ser la
diferencia para que sea estadísticamente significativa y conduzca un rechazo de la hipótesis nula. Vale la pena
recordar de nuestra discusión sobre distribuciones de muestreo lo cual indica que se puede transformar toda
unidad de medida, como las onzas del embotellador, hasta los valores correspondientes de Z con la fórmula Z:
La distribución normal resultante de los valores de Z tiene una media de cero y una desviación estándar de uno.
La regla empírica dice que el 95% de las ¨ s en la distribución de muestreo están a 1.96 errores estándar de la
media poblacional conocida, tal y como se muestra en la figura.
Si =16, existe solo un 2.5% de oportunidad de que Si =16, existe solo un 2.5% de oportunidad de que
una media muestral produzca un valor una media muestral produzca un valor
Z< -1.96 Z> -1.96
Si la hipótesis es correcta y =16 onzas, es poco probable (sólo un 5% de oportunidad) que una muestra cualquiera
produzca un valor Z que caiga en cualquiera de las zonas de rechazo. Por tanto, si un valor de Z mayor que 1.96 o
menor que -1.96 ocurre, no es probable que la distribución esté centrada en =16, y la hipótesis nula sería
rechazada.
Estos valores críticos de Z 1.96 permiten establecer una regla de decisión que diga si se rechaza la hipótesis nula
o no.
Salgado`s- 2020
La regla de decisión es: “no se rechaza la hipótesis nula si los valores Z están entre 1.96. Se rechaza si el
valor Z es menor que -1.96 o mayor que+1.96”
significancia del 5%. Debido a que se plantea la hipótesis que =16, la hipótesis nula y la alterna son:
H0 : =16
HA : 16
Para probar la hipótesis, se calcula el estadístico de prueba Z, y se compara con los valores críticos de Z.
es la medida muestral.
Para nuestro caso, si el embotellador selecciona una muestra de n=50 botellas con una media de =16.357 onzas y una
desviación estándar de s= 0.866 onzas, Z es
=2.91
El nivel de significancia del 5% se divide en dos colas. El 95% restante se divide por 2 para hallar el área de 0.4750. En la
tabla Z esta área de 0.4750 da los valores críticos de Z 1.96.
La regla de decisión es: “No se rechaza la hipótesis nula si -1.96 ≤ Z ≤ 1.96. Se rechaza si
Z < -1.96 o Z > 1.96”
Ejercicios.
1. Un gerente de cuentas preferenciales desea probar la hipótesis de que las cuentas tiene un promedio de $ 312. Se
selecciona una muestra de 200 cuentas, dando una media de $ 298.10 con s= $ 97.30. Para minimizar la
probabilidad de un error tipo I, se selecciona un valor de de 1% (tenga en cuenta los cuatro pasos al realizar la
prueba).
Solución:
1° Planteamiento de la hipótesis.
Z= = - 2.02
Un = 0.01 requiere valores críticos de Z de 2.58. El 0.01 está dividido de manera homogénea en dos
zonas de rechazo, dejando un área de 0.4950 que corresponde a los valores críticos de Z de 2.58 (por
tablas)
3° Regla de decisión: “No se rechaza la hipótesis nula H0 si – 2.58 ≤ Z ≤ +2.58. Se rechaza H0 si Z < -2.58 o
Z > 2.58”
La hipótesis nula es verdadera, existe solo un 1% de probabilidad que una muestra pueda resultar en un
valor Z menor que -2.58 o mayor que 2.58. Por tanto, si Z cae en cualquiera de las colas, no es probable que
=312, y la hipótesis nula debería rechazarse. El valor Z= -2.02 está en la zona de no rechazo.
4° Conclusiones. La diferencia entre el valor de la media poblacional bajo la hipótesis nula de $ 312 y el valor
de la media muestral de $ 298.10 es estadísticamente insignificante. Podría resultar simplemente del error de
muestreo. De hecho si =$ 312; el 99% de todas las muestras de tamaño n=200 producirán valores Z entre
2.58. Por tanto, no se espera un valor de -2.02
2. Como gerente de compras para una gran empresa de seguros usted debe decidir si actualizar o no los computadores
de la oficina. A usted se le ha dicho que el costo promedio de los computadores es de $ 2,100. Una muestra de 64
minoristas revela un precio promedio de $ 2,251, con una desviación estándar de $ 812. ¿A un nivel de significancia
del 5% parece que su información es correcta?
3. Seducido por los comerciales, usted ha sido persuadido para comprar un nuevo automóvil. Usted piensa que tendrá
que pagar $ 25,000 por el auto que usted desea. Como comprador cuidadoso, averigua el precio de 40 posibles
vehículos y se encuentra un costo promedio de $ 27,312, con una desviación estándar de $ 8,012. Deseando evitar
un error tipo II, usted prueba la hipótesis de que el precio promedio es de $ 25,000 con un nivel de significancia del
10%. ¿Cuál es su conclusión?
4. Antes de publicar un nuevo libro de cocina, Bantam Books desea probar la hipótesis, con un nivel de significancia del
2% de que el precio promedio de tales libros es de $ 35. ¿Esta afirmación se sustenta si una muestra de 50 libros de
cocina tiene una media de $ 32?97 y una desviación estándar de $ 12.87?
A. Prueba de una cola debido a que hay una zona izquierda de rechazo.
B. Prueba de una cola debido a que hay una zona derecha de rechazo.
Salgado`s- 2020
Ejercicios
5. El número promedio de habitaciones alquiladas por noche es de por lo menos 212. Es decir, 212. Uno de los
funcionarios del hotel considera que esta cifra puede estar algo sobrestimada. Una muestra de 150 noches produce
una media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. Si estos resultados sugieren que
el gerente ha “inflado” su reporte, será amonestado severamente. A un nivel de 1%, ¿cuál es el destino del gerente?
6. En una encuesta mostró que los estudiantes de las universidades de la nación gastan en promedio más de $ 75
mensuales en entretenimiento. Si usted puede hallar evidencias para confirmar esta afirmación, podrá utilizarla para
solicitar a su casa ayuda monetaria adicional. De los 100 estudiantes que tomo la muestra, usted halla una media de
$ 80.23 con una desviación estándar de $ 45.67. ¿a un nivel es significancia del 2%, se encuentra justificación para
la solicitud?
7. Durante los últimos meses se ha publicitado ampliamente una empresa de suministros eléctricos. Se espera que el
resultado haya sido incrementar las ventas promedio semanales por encima de $ 7,880 que la compañía
experimento en el pasado. Una muestra de 36 semanas da una media de $ 8,023 con una desviación estándar de $
1,733. A un nivel de significancia del 1%, ¿parece que la publicidad ha producido efecto?
8. Se adquiere una compañía y se planea eliminar del menú del pollo frito. La afirmación era que los ingresos recientes
habían descendido por debajo de la media de $ 4,500 que habían presentado en el pasado. ¿Parece esta una sabia
decisión si 144 observaciones revelan una media de $ 4,477 y una desviación estándar de $ 1,228?. La gerencia
está dispuesta a aceptar una probabilidad de 2% si comete un error tipo I.
9. Muchas compañías de ropa deportiva están tratando de comercializar sus productos entre los más jóvenes. El
artículo sugirió que la edad promedio de los consumidores había caído por debajo del grupo de edad de 34.4 años
que caracterizó los comienzos de la década. Si una muestra de 1,000 clientes reporta una media de 33.2 años y una
desviación estándar de 9.4, ¿qué se concluye a un nivel de significancia del 4%?
10. En los años 90 Hyundai, el fabricante coreano de automóviles, sufrió una severa caída en las ventas, por debajo de
su pico mensual de 25,000 unidades en mayo de 1988. Hyundai Motor América (1997) reportó que las ventas habían
bajado a menos de 10,000 unidades. Durante un periodo de 48 meses que comenzó en enero de 1990, las ventas
promedio fueron de 9,204 unidades. Se asume una desviación estándar de 944 unidades. ¿A un nivel del 1% de
significancia, parece que el número promedio de unidades ha caído por debajo de la marca de 10,000?
Bibliografía
1. KASMIER, Leonard J. Estadística aplicada la Administración y Economía. 4ta edición. Editorial Schaum. Mc. Graw
Hill. 2006
2. WEBSTER, Allen L. Estadística Aplicada a los negocios y la economía. Tercera edición. Irwin - McGraw-Hill
2000.
3. MOYA C. Rufino y SARAVIA Gregorio. Probabilidad e inferencia estadística. Editorial San Marcos. 2009