Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

SEMANA 9 Fusionado

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 109

PROBABILIDAD

Y ESTADÍSTICA

UNIDAD 3
Estadística inferencial: Introducción, muestreo,
pruebas de hipótesis de media, y proporción.

TEMA 1:
DISTRIBUCIONES DE MUESTREO E INTERVALOS
DE CONFIANZA

Ing. Luis Torres Ordoñez, Mgs


SUBTEMAS

» Sub tema 1 : Métodos de Muestreo


de Probabilidad.

» Sub tema 2 : El teorema del Limite


Central.
» Sub tema 3 : Distribuciones
muéstrales de la media muestral y
de la proporción.
OBJETIVO

Explicar la forma de la distribución muestral


aplicando el teorema del limite central y su
aplicación en cualquier población.
ACTIVIDAD DE INICIO

Lluvia de ideas
Comente usted una razón de porque en los estudios
de investigación de cualquier índole se basan en
una muestra de la población, y en base a su
comentario ponga un ejemplo.
¿Por qué un muestreo
de la población?

• La imposibilidad física de revisar


todos los integrantes de la
población.
• El costo de estudiar a todos los
integrantes de una población.
• Lo adecuado de los resultados de la
muestra.
¿Por qué una muestra de
población?

• Entrevistar a toda la población


exigiría mucho tiempo.

• La naturaleza destructiva de ciertas


pruebas.
Muestra probabilística

• Una muestra probabilística se


selecciona de modo que cada
integrante de la población en
estudio tenga una probabilidad
conocida de ser incluido en la
muestra.
Métodos de muestreo de probabilidad

• Muestreo aleatorio simple: Muestra


seleccionada de manera que cada
integrante de la población tenga la
misma probabilidad de quedar
incluido.

• Muestra aleatoria sistemática: Los


integrantes o elementos de la
población se ordenan en alguna forma.
Se selecciona al azar un punto de
partida, y después se elige para la
muestra cada k- ésimo elemento de la
población.
Métodos de muestreo de probabilidad
• Muestreo aleatorio estratificado: Una población se divide en
subgrupos, denominados estratos, y se selecciona una muestra
de cada estrato. Los estratos son homogéneos (sus elementos
tienen las mismas características)
Métodos de muestreo de probabilidad

• Muestreo por conglomerados: La


población se divide en conglomerados a
partir de los limites naturales
geográficos o de otra clase. Se
seleccionan los conglomerados al azar y
se toma una muestra de forma aleatoria
con elementos de cada grupo.
Distribución geográfica de los grupos de ovejas
Pelibuey en el estado de Colima de acuerdo
con el análisis de componentes principales y
de conglomerados jerárquicos.
Métodos de muestreo de
probabilidad
• En una muestra no probabilística una
inclusión en la muestra se basa en el
juicio de la persona que selecciona la
muestra.

• El error de muestreo es la diferencia


entre un valor estadístico de muestra
y su parámetro de población
correspondiente.
Teorema de límite central

Si se seleccionan de cualquier
población todas las muestras de
un tamaño determinado, la
distribución de las medias
muéstrales se acercará a una del
tipo normal. Esta aproximación
aumenta en el caso de muestras
más grandes.
https://youtu.be/46DgBP9VwtE
Sea 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , 𝑿𝟒 , … … . . , 𝑿𝒏 un conjunto de variables aleatorias
independientes e idénticamente distribuidas de una distribución
con media µ y varianza σ𝟐 ≠ 𝟎. Entonces si n es suficientemente
grande, la variable aleatoria:
σ𝑛𝑖=1 𝑋𝑖
𝑋ത =
𝑛
Tiene aproximadamente una distribución normal con:
2 σ2
µ𝑋ത = µ y σ𝑋ത = 𝜎
𝑛 𝑋ത ~ 𝑁(µ, )
𝑛

𝑥ҧ − 𝜇
O de manera equivalente, que z= 𝜎
𝑛
A medida que n ∞, es la distribución normal estándar N(0,1)
14
Distribuciones muéstrales

La distribución muestral es la
distribución de los resultados que
demuestran si se seleccionaron
realmente todas las muestras posibles,
es utilizada cuando se requiere
elaborar inferencias estadísticas.
La distribución de probabilidad de un
estadístico se denomina distribución
muestral.
a) Distribución muestral de la
media
Se la denomina como la distribución
del conjunto de medias posibles que
aparecen si realmente se
seleccionaron en cierto tamaño
todas las muestras que sean
posibles.
Cuando ya se obtenido todos los datos de una
determinada población, la media se calcula
usando la ecuación:
σ𝑛𝑖=1 𝑋ത𝑖
µ𝑋ത =
𝑛
Y para la desviación estándar la ecuación:

σ𝑛𝑖=1 𝑋ത𝑖 − 𝜇 2
𝜎𝑋ത =
𝑛−1
Llamado error estándar de la media:
𝜎
𝜎𝑥ҧ =
𝑛
Dada una población normal N (μ, σ) se
procede a verificar:
𝜎 ҧ
𝑥−𝜇
𝑥~𝑁
ҧ 𝜇, ; tipificando 𝜎 ~𝑁(0,1)
𝑛
𝑛

b) Distribución muestral de una


proporción
La proporción muestral es representada por
p y es denominada como la relación
existente de elementos en la muestra que
entregan las características de interés
Mediante la ecuación:
𝑋
𝑝=
𝑛
Donde:
x= cantidad de elementos con la característica de interés
n= tamaño de la muestra
𝜋 = proporción poblacional.

𝜋(1 − 𝜋) 𝜋(1 − 𝜋)
ഥ ~ 𝑁 𝜋,
𝑝 𝜎𝑝ҧ =
𝑛 𝑛

Además, podemos calcular el error estándar para la


proporción:

𝑝ҧ − 𝜋
𝑍=
𝜎𝑝ҧ
Ejercicios de aplicación
1. El ascensor de un edificio limita el peso
de sus 5 ocupantes a 400kg. Se entrega
un listado donde comprueba que el peso
de uno de los individuos sigue una
distribución N(75;9), determinar la
probabilidad de que el peso de las 5
personas supere los 400kg.
Resolvemos:
Si se toma en cuenta que cada individuo
sigue una distribución N(75;9) y
seleccionamos una muestra de 5 individuos
9
𝑥~𝑁
ҧ 75;
5
Mediante tipificación
𝑿𝟏 + 𝑿𝟐 + 𝑿𝟑 + 𝑿𝟒 + 𝑿𝟓 400
𝑃 𝑿𝟏 + 𝑿𝟐 + 𝑿𝟑 + 𝑿𝟒 + 𝑿𝟓 > 400 = 𝑃 >
5 5
𝜎 9
𝜎𝑥ҧ = = = 4,025
𝑛 5
𝑥ҧ − 𝜇 80 − 75
𝑃 𝑥ത > 80 = 𝑃 𝑍 > =𝑃 𝑍> = 𝑃(𝑍 > 1,24)
𝜎𝑥ҧ 4.025
𝑃 𝑥ҧ > 80 = 𝑃(𝑍 > 1,24)
𝑃 𝑥ҧ > 80 = 0.50 − 0.3925
𝑃 𝑥ҧ > 80 = 0.1075
Ejercicios de aplicación
Una empresa de material eléctrico fabrica
bombillas que tienen una duración que se
distribuye aproximadamente en forma
normal, con media de 800 horas y
desviación estándar de 40 horas. Calcule la
probabilidad de que una muestra aleatoria
de 16 bombillas tenga una vida promedio de
menos de 775 horas.

22
Ejercicios de aplicación
El número de megabytes (Mb) descargados
mensualmente por el grupo de clientes de una
compañía de telefonía móvil con la tarifa AA se
puede aproximar por una distribución normal
con media 3,5 Mb y desviación típica igual a 1,4
Mb. Se toma una muestra aleatoria simple de
tamaño 49. ¿Cuál es la probabilidad de que la
media muestral sea inferior a 3,37Mb?

23
Ejercicios de aplicación
Se sabe que de cada 5 personas accidentadas en
una cierta carretera hay una mujer. Calcular la
probabilidad de que en los próximos 200
accidentes automovilísticos en esa carretera,
menos del 75% de los accidentados sean
hombres
Datos:
200/5=40 mujeres accidentados = 40/200 = 0,20
160 hombres accidentados = 160/200 = 0,80
𝜋(1 − 𝜋) ഥ 0.80(1 − 0.80)
ഥ ~ 𝑁 𝜋,
𝑝 = 𝑝 ~ 𝑁 0,80,
𝑛 200

Mediante tipificación
𝑝ҧ − 𝜋 0.75 − 0.80
𝑃 𝑝ҧ < 0.75 = 𝑃 𝑍 < =𝑃 𝑍< = 𝑃(𝑍 < −1,77)
𝜎𝑝ҧ 0.0283
𝑃 𝑝ҧ < 0.75 = 𝑃(𝑍 < −1,77)
𝑃 𝑝ҧ < 0.75 = 0.50 − 0.4616
𝑃 𝑝ҧ < 0.75 = 0.0384
Ejercicios de aplicación
Un estudio realizado por un grupo de alumnos
universitarios establece que en un parque de
juegos mecánicos una de cada cinco personas
accidentadas es estudiante. Si se contabilizan,
por término medio, 169 accidentes cada fin de
semana, ¿Cuál es la probabilidad de que, en un
fin de semana, la proporción de estudiantes
accidentados supere el 24 %?

26
Actividad Final:

Preguntas y Respuestas
BIBLIOGRAFÍA

• Lind, Marchal, Wathen (2012).


Estadística Aplicada a los Negocios y la
Economia. México: McGraw-Hill/Irwin
• Mendenhall, Beaver, Beaver (2004).
Introduccion a la Probabilidad y
Estadística. Mexico: Cengage Learning.
• Taylor, R. A. (2012). Probabilidad y
Estadística para Ingenieros. México:
Pearson Educación.
PROBABILIDAD
Y ESTADÍSTICA

UNIDAD 3
Estadística inferencial: Introducción, muestreo,
pruebas de hipótesis de media, y proporción.

TEMA 1:
DISTRIBUCIONES DE MUESTREO E INTERVALOS
DE CONFIANZA

Ing. Luis Torres Ordoñez, Mgs


SUBTEMAS

» Sub tema 3 : Estimación puntual e


intervalos de confianza de la media
poblacional y para la proporción.

» Sub tema 4 : Estimación por intervalos


de confianza para la diferencia de
medias poblacionales.
OBJETIVOS

Utilizar técnicas de medidas de tendencia


central y dispersión para el cálculo de
intervalos de confianza.
ACTIVIDAD DE INICIO

Lluvia de ideas
Estimación puntual
La estimación puntual da a conocer
la elección de un estadístico; esto es,
un determinado número que fue
calculado a partir de datos
muéstrales y en ocasiones otro tipo
de información, por medio del cual
guarda cierta seguridad de
permanecer cerca del parámetro
estimado.
Para resumir:
La media de la población se puede estimar
puntualmente mediante la media de la
muestra: 𝑥ҧ = 𝜇.
La proporción de la población se puede
estimar puntualmente mediante la
proporción de la muestra: 𝑝Ƹ = 𝑝
La desviación típica de la población se
puede estimar puntualmente mediante la
desviación típica de la muestra: s = 𝜎.
• Ejemplos de estimación puntual son la
media muestral, la desviación estándar
muestral, la varianza muestral, y la
proporción muestral.

• Una estimación puntual es un valor que


se utiliza para estimar el parámetro
poblacional.
Estimación puntual cuando se conoce
la desviación estándar de la población

• Si la población sigue la distribución


normal, la distribución muestral de
la media muestral seguirá también x−
la distribución normal. z=
 n
• Para determinar la probabilidad de
que una media muestral esté
dentro de una región particular,
utilice:
Estimación puntual cuando la desviación
estándar de la población es desconocida
• Si la población no sigue la
distribución normal, pero la
muestra es de al menos 30 _
observaciones, la media muestral x− 
seguirá la distribución normal.
z=
s n
• Para determinar la probabilidad de
que una media muestral esté
dentro de una región particular,
utilice:
Ejemplo
• Suponga que la media del precio de
venta de un galón de gasolina en
México es de $1.30. Además, asuma
que la distribución está posiblemente
inclinada, con una desviación
estándar de $0.28. ¿Cuál es la
probabilidad de seleccionar una
muestra de 35 estaciones de gasolina
y encontrar una media muestral
dentro de $0.08?

10
Ejemplo (Continuación)
• El primer paso es encontrar los valores z
correspondientes a $1.22 y $1.38. Existen dos
puntos dentro de $0.08 de la media de la
población.
𝑋ሜ − 𝜇 $1.38 − $1.30
𝑧= = = 1.69
𝜎Τ 𝑛 $0.28Τ 35
𝑋ሜ − 𝜇 $1.22 − $1.30
𝑧= = = −1.69
Τ
𝜎 𝑛 $0.28Τ 35
Ejemplo (Continuación)
• Después determinamos la probabilidad de los
valores z entre -1.69 y 1.69. Esto es:

P(−1.69  z  1.69) = 2(.4545) = .9090


• Esperaríamos un 91% de que la media
muestral esté dentro de $0.08 de la media de
la población.
INTERVALOS DE CONFIANZA
DE LA MEDIA POBLACIONAL

El intervalo de confianza se elabora de forma


que la probabilidad del parámetro de la
población se encuentre en un sitio
determinado dentro del intervalo conocido.

El nivel de confianza es 1 - α donde (0 < α < 1).


Los hechos que determinan la
amplitud de un intervalo de
confianza son:

❑El tamaño de la muestra, n


❑La variabilidad de la población.
normalmente estimada por s.
❑El nivel de confianza deseado.
Consideraciones para calcular el
intervalo de confianza
• Si la desviación estándar de la
población es conocida o la 
muestra es mayor que 30
X z
n
utilizamos la distribución z.

• Si la desviación estándar de la
s
población es desconocida y la X t
muestra es menor que 30 utilizamos n
la distribución t.
Intervalo de estimación
• Un intervalo de estimación establece el
rango en el cual se encuentra el parámetro
de población.
• Un intervalo en el cual se espera que ocurra
el parámetro de población se llama
intervalo de confianza.
• Los dos intervalos de confianza que son
más utilizados son de 95% y 99%.
Intervalo de estimación
• Para un 95% de intervalo de confianza, aproximadamente
95% de los intervalos construidos igualmente contendrán
el parámetro inicial. También el 95% de la muestra media
para un tamaño de muestra específico se encontrará
dentro del 1.96 de la desviación estándar de la media de la
población.

• Para el 99% de intervalo de confianza, 99% de la muestra


media para un tamaño de muestra específico se
encontrará dentro del 2.58 de la desviación estándar de la
media de la población.
Error estándar de la media muestral
El error estándar de la media muestral es la desviación estándar
de la distribución de las medias muéstrales.
Se calcula como:

 x =
n

•  x es el símbolo para el error estándar de la media, se utiliza la letra


griega por que se trata de un valor poblacional, y el subíndice 𝑥ҧ
recuerda que se refiere a la distribución de las medias muéstrales.
• σ es la desviación estándar de la población.
• n es el numero de observaciones en la muestra.
Error estándar de la media muestral
• Si σ no es conocida y n ≥ 30, la desviación
estándar de la muestra, designada s, se
aproxima a la desviación estándar de la
población.
• La fórmula para la desviación estándar
es:
s
sx =
n
95% y 99% intervalos de confianza para µ
El 95% y 99% intervalos de confianza:
➢ 95% CI para la media de la población es
dada: s
X  1.96
n

➢ 99% CI para la media de la población es dada


como:
s
X  2 .58
n
a) Estimación del intervalo de confianza de la
media Poblacional con una σ conocida.
Cuando σ es conocida, la curva normal puede ser usada como
un modelo de la distribución muestral de 𝑥,ҧ de tal manera que
de
𝜎
𝑥ҧ ± 𝑧𝛼ൗ
2 𝑛
Evento probabilístico n>30:
𝜎 𝜎
𝑥ҧ − 𝑧𝛼ൗ ≤ 𝝁 ≤ 𝑥ҧ + 𝑧𝛼ൗ
2 𝑛 2 𝑛
Dada una población normal N (μ, σ) se procede a verificar:
𝜎 ҧ
𝑥−𝜇
𝑥~𝑁
ҧ 𝜇, ; tipificando 𝜎 ~𝑁(0,1)
𝑛
𝑛
b) Estimación del intervalo de confianza
media Poblacional con σ desconocida
Antes de entrar a este tema primero debemos
conocer qué es una distribución t Student. Esta es
una distribución usada para muestras menores a
30; se encarga de calcular valores críticos
denotados mediante 𝑡∝Τ2 , este valor lo podemos
encontrar en la tabla de tal manera que primero
debemos conocer los grados de libertad (𝛼 = 𝑛 −
1) en la columna izquierda.
Luego siguiendo ese reglón hasta encontrar el
número correspondiente o aproximado abajo
del área adecuada en la parte superior.
Para encontrar la distribución t de una
probabilidad se utiliza la ecuación:

𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛
Ahora bien, para una estimación del
intervalo de confianza para la media con σ
desconocida se realiza la prueba de t de una
media. Mediante la ecuación:
𝑠
𝑥ҧ ± 𝑡𝛼ൗ
2 𝑛
Evento probabilístico n<30:
𝑠 𝑠
𝑥ҧ − 𝑡𝛼ൗ ≤ 𝜇 ≤ 𝑥ҧ + 𝑡𝛼ൗ
2 𝑛 2 𝑛
Intervalo de confianza para la
proporción de la población
• Si p representa la proporción de la muestra, x el x
numero de éxitos y n el numero de elementos en la p=
n
muestra, la proporción muestral se determina:

• El intervalo de confianza para la proporción p(1 − p)


de la población se estima como: p  Z
2 n
El intervalo de confianza para la diferencia de
proporciones de la población

• El intervalo de confianza para la diferencia de


proporciones de la población se estima como:

  p1q1 p2 q2
p1 − p2  Z  +
2 n1 n2
Estimación por intervalos de
confianza para la diferencia de
medias poblacionales
Se hace la selección de dos muestras
aleatorias escogidas
independientemente de dos
poblaciones normales (𝑥1 , 𝑥2 ,…, 𝑥𝑛 e
𝑦1 , 𝑦2 ,…, 𝑦𝑛 ), además se anhela realizar
intervalos de confianza para la
diferencia de medias 𝜇𝑥 − 𝜇𝑦 .
» Con varianzas conocidas: debido que X e Y son
independientes de tal manera que

𝑋ത − 𝑌ത − 𝜇𝑋 − 𝜇𝑌
𝑍= ∽ 𝑁(0, 1)
𝜎𝑋2 𝜎𝑌2
𝑛 + 𝑚
En un intervalo de confianza:

𝜎𝑋2 𝜎𝑌2
𝑥ҧ − 𝑦ത ± 𝑧∝ൗ +
2 𝑛 𝑚
» Con varianzas desconocidas pero iguales
Supongamos que las varianzas 𝜎𝑋2 𝑦 𝜎𝑌2 son desconocidas pero iguales:
2
ത 𝑌ത − 𝜇𝑋 −𝜇𝑌
𝑋− 𝑛−1 𝑠𝑋 +(𝑚−1)𝑠𝑦2
𝑇= ∽ 𝑁(0, 1) 𝑆መ =
1 1 𝑛+𝑚−2
𝑠 +
𝑛 𝑚

En un intervalo de confianza:

1 1
𝑥ҧ − 𝑦ത ± 𝑡𝑛+𝑚−2,∝ൗ 𝑆መ +
2 𝑛 𝑚
1. Dadas las estaturas de varias personas de las
cuales con anterioridad se sabe que tienen una
varianza de 65 cm. Se pide calcular:
a) Con un margen de error del 6%, estime la
altura media partiendo de un grupo de 100
personas, sabiendo que su promedio dio 165 cm.
Resolvemos:
Calculamos el intervalo de confianza
» 𝑥ҧ = 165
» 𝜎 2 = 65; 𝜎 = 65 = 8,06
» 𝛼 = 0,06
𝛼 0,06
» = = 0,03
2 2
𝛼
Para calcular 𝑧𝛼Τ2 , con el valor de procedemos a buscar en la
2
tabla NORMAL Z

𝛼Τ2 = 0,03 𝛼Τ2 = 0,03

-1,88 1,88
𝜎
𝑥ҧ ± 𝑧𝛼ൗ
2 𝑛
𝜎 𝜎
𝑥ҧ − 𝑧𝛼Τ2 ≤ 𝝁 ≤ 𝑥ҧ + 𝑧𝛼Τ2
𝑛 𝑛
8,06 8,06
165 − 1,88 ≤ 𝜇 ≤ 165 + 1,88
100 100
163,48 ; 166,51
2. Merrill Lynch Securities y Health Care Retirement, Inc., son
dos grandes empresas ubicadas en el centro de Toledo, Ohio.
Contemplan ofrecer de forma conjunta servicio de guardería
para sus empleados. Como parte del estudio de viabilidad del
proyecto, desean calcular el costo medio semanal por el
cuidado de los niños. Una muestra de 10 empleados que
recurren al servicio de guardería revela las siguientes
cantidades gastadas la semana pasada.
$107 $92 $97 $95 $105 $101 $91 $99 $95 $104
Construya el intervalo de confianza de 90% de la media
poblacional.
𝛼
Para calcular 𝑡𝛼Τ2 , con el valor de procedemos a buscar en la
2
tabla t student

𝛼Τ2 = 0,05 𝛼Τ2 = 0,05

-1,8331 1,8331
𝑠
𝑥ҧ ± 𝑡𝛼ൗ
2 𝑛
𝑠 𝑠
𝑥ҧ − 𝑡𝛼Τ2 ≤ 𝜇 ≤ 𝑥ҧ + 𝑡𝛼Τ2
𝑛 𝑛

5.54 5.54
98.6 − 1,8331 ≤ 𝜇 ≤ 98.6 + 1,8331
10 10
95,38 ≤ 𝜇 ≤ 101,81
3.- Suponiendo que se ha obtenido una
muestra al azar de 250 obreros de una fábrica
para estimar la proporción de obreros en la
fábrica que son ineficientes en sus actividades.
De entre los seleccionados, 125 han sido
señalados como ineficientes.
Determinar un intervalo de confianza para la
proporción de obreros en la fábrica que son
denominados ineficientes al 85%.
𝒏 = 250

125
𝛒= = 0,50
250
𝑰. 𝑪. = 85%
𝜶 = 0,15

Solución
𝛂 𝟏 − 𝑰. 𝑪. 1 − 0,85
𝒁 = = = 0,075 → 1 − 0,075 = 0,925 → 𝟏, 𝟒𝟒
𝟐 𝟐 2

𝛂 𝛒(𝟏 − 𝛒) 0,50(1 − 0,50)


𝑰. 𝑪. 𝟖𝟓% = 𝝆 ± 𝒁 = 0,50 ± 1,44 = 𝟎. 𝟒𝟓𝟓; 𝟎. 𝟓𝟒𝟓
𝟐 𝐧 250
3.- Dos marcas de refrigeradores, denotadas
por A y B, están garantizadas por 1 año. En una
muestra aleatoria de 50 refrigeradores de la
marca A, se observó que 12 de ellos fallaron
antes de terminar el periodo de garantía. Una
muestra aleatoria independiente de 60   p1q1 p2 q2
p1 − p2  Z  +
refrigeradores de la marca B también reveló 12 2 n1 n2
fallas durante el período de garantía. Calcule la
diferencia real (p1 − p2) entre las proporciones
de fallas durante el período de garantía, con un
coeficiente de confianza de aproximadamente
0.98
0,24(0,76) 0,20(0,80)
0,24 − 0,20  2,33 +
50 60
4.- Construya un intervalo de confianza del
94% para la diferencia real entre las duraciones
de dos marcas de focos, si una muestra de 40
focos tomada al azar de la primera marca dio
una duración media de 418 horas, y una
muestra de 50 focos de otra marca dieron una
duración media de 402 horas. Las desviaciones
estándares de las dos poblaciones son 26 horas
y 22 horas, respectivamente. (muestra
pequeña).
» 𝜎1 = 26 𝜎2 =22
» 𝑥ҧ1 =418 𝑦ത2 =402
» 𝑛1 =40 𝑛2 =50
0,06
» 1 −∝= 1 − 0,94 = 2
= 0,03
» 1 − 0,03 = 0,97 = 1,88

𝜎12 𝜎22
» 𝐼𝐶∝ 𝜇1 − 𝜇2 = [(𝑥1 − 𝑦2 ) ± 𝑍∝Τ2 + ]=
𝑛1 𝑛2

262 222
» 𝐼𝐶∝ 𝜇1 − 𝜇2 = [(418 − 402) ± 1,88 + 50 ]=
40
» 25,7 6,3
» 6.3 ≤ μ 1 − μ 2 ≤ 25.7
Actividad Final:

Preguntas y Respuestas
BIBLIOGRAFÍA

• Lind, Marchal, Wathen (2012).


Estadística Aplicada a los Negocios y la
Economia. México: McGraw-Hill/Irwin
• Mendenhall, Beaver, Beaver (2004).
Introduccion a la Probabilidad y
Estadística. Mexico: Cengage Learning.
• Taylor, R. A. (2012). Probabilidad y
Estadística para Ingenieros. México:
Pearson Educación.
PROBABILIDAD
Y ESTADISTICA

UNIDAD 3
ESTADÍSTICA INFERENCIAL: INTRODUCCIÓN,
MUESTREO, PRUEBAS DE HIPÓTESIS DE MEDIA, Y
PROPORCIÓN

TEMA 4:
PRUEBAS DE HIPÓTESIS

Ing. Luis Torres Ordoñez, Mgs


SUBTEMAS

» Sub tema 1 : Hipótesis Estadísticas:


Conceptos Generales.

» Sub tema 2 : Prueba de hipótesis


para la media de la población
OBJETIVO

Identificar los conceptos de hipótesis,


variables e indicadores mediante la
aplicación de las pruebas de hipótesis
para obtener una conclusión sobre un
valor desconocido.
ACTIVIDAD DE INICIO

Lluvia de ideas
¿Qué es una hipótesis?

• Una hipótesis es una declaración sobre el


valor de un parámetro de la población
desarrollado con el fin de poner a prueba.

• Ejemplos de hipótesis que se hicieron sobre


un parámetro de la población:
– El ingreso mensual para los analistas de
sistemas es diferente de $3625
– Veinte por ciento de todos los clientes de La
Majada regresan para otra comida dentro de
un mes.
¿Qué es una prueba de hipótesis?

• La prueba de hipótesis es un
procedimiento basado en la evidencia
de la muestra y la teoría de las
probabilidades, usadas para
determinar si la hipótesis es una
declaración razonable y no debe ser
rechazada, o es irrazonable y debe ser
rechazada.
Pasos básicos en pruebas de
hipótesis
La hipótesis es considerada como una
aseveración o afirmación aproximada
del valor que el parámetro de la
población bajo una investigación
lograría tomar.
Se la suele resolver en los siguientes
pasos:
1. Establecer si es una prueba de dos
colas o de una. Fije sus hipótesis.
Elija un nivel de significancia
2. Determine que distribución (t o z) es
la apropiada y halle el o los valores
críticos para el nivel de significancia
escogido en la tabla apta.
3. Deduzca el error estándar del
estadístico muestral. Utilice el error
estándar para cambiar el valor
observado del estadístico dentro de
un valor estandarizado.
4. Plantee la distribución y marque la
posición del valor de la muestra
estandarizada y de(los) valor(es)
críticos para la prueba.
5. Compare el valor estadístico muestral
estandarizado con el o los valores críticos
para esta prueba y comente los
resultados.”
Los componentes formales dentro de la
prueba de hipótesis son:
a. Hipótesis nula
La hipótesis nula denotada por 𝐻0 es la
aseveración de que un solo valor del
parámetro de la población es igual a un valor
afirmado.
𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
b. Hipótesis alternativa
La hipótesis alternativa dada por 𝐻1 es la
aseveración establecida a base de la
evidencia obtenida.
Proporciones:
𝐻1 : 𝑝 > 𝑝0 𝐻1 : 𝑝 < 𝑝0 𝐻1 : 𝑝 ≠ 𝑝0
Medias :
𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0
Desviaciones estándar:
𝐻1 : 𝜎 > 𝜎0 𝐻1 : 𝜎 < 𝜎0 𝐻1 : 𝜎 ≠ 𝜎0
Error Tipo I: denotado por el símbolo α y es
considerado el error de rechazo de la hipótesis
nula cuando efectivamente es verdadera.
Error Tipo II: denotado por el símbolo β,
considerado el error de no rechazo a la
hipótesis nula cuando efectivamente era falsa.
Mediante la siguiente tabla se mostrará el
tamaño de los errores al tomar decisiones
incorrectas:
𝐻0 Verdadera 𝐻0 Falsa

Rechazamos 𝐻0 Error Tipo I = α Decisión acertada

No rechazamos 𝐻0 Decisión acertada Error Tipo II = β


c. Región crítica
Punto de división entre la región en la que se
rechaza la hipótesis nula y la región en la que no
rechaza la hipótesis nula. La región crítica o de
rechazo es el conjunto de valores tales que el
estadístico de prueba pueda permitir el rechazo
de la hipótesis nula. La localización de esta va a
depender de la forma de la Hipótesis Alternativa,
de tal manera que:
» Si 𝐻1 : 𝜇 > 𝜇0 , entonces dicha región está
localizada en la cola derecha de la distribución
de estadístico de prueba.
» Si 𝐻1 : 𝜇 < 𝜇0 , entonces dicha región
está localizada en la cola izquierda de la
distribución de estadístico de prueba.

» Si 𝐻1 : 𝜇 ≠ 𝜇0 , entonces dicha región es


dividida en dos partes; una parte será
para la cola derecha y la otra
respectivamente para la cola izquierda
de la distribución de estadístico de
prueba
d. Estadístico de prueba
El estadístico de prueba es un determinado
valor que se calcula partiendo de datos
muéstrales, usado para determinar si se
rechaza la hipótesis nula.

𝑝−𝑝
» Para proporciones: 𝑧 = 𝑝𝑞
𝑛

ҧ
𝑥−𝜇 ҧ
𝑥−𝜇
» Para medias : 𝑧 = 𝜎 o 𝑡= 𝑠
𝑛 𝑛

𝑛−1 𝑠2
» Para desviaciones estándar: 𝑥2 =
𝜎2
Pruebas de significancia de una cola

• Una prueba es de una cola cuando la hipótesis


alternativa, H1 indica una dirección, como por
ejemplo:
– H1: Las comisiones anuales ganadas por corredores de
bienes raíces a tiempo completo son más de $35.000.
(µ>$35.000)
– H1: La velocidad de los autos que viajan en la I-95 en
Georgia es menos de 60 millas por hora. (µ<60)
– H1: Menos del 20% de los clientes pagan en efectivo su
consumo de gasolina. (µ<0.20)
Distribución muestral para el estadístico z para la prueba
de una cola, con el 0.05 de nivel de significancia

.95 de probabilidad
.05 región de rechazo

0 1 2 3
Valor crítico
Z = 1.645
Pruebas de significancia de dos colas

• Una prueba es con dos colas cuando no se


especifica ninguna dirección en la hipótesis
alterna H1, por ejemplo:
– H1: La cantidad pagada por los clientes en el
centro comercial en Georgetown no es igual a
$25. (µ ± $25).
– H1: El precio para un galón de gasolina no es
igual a $1.54. (µ ± $1.54).
Distribución muestral para el estadístico z para la prueba
de dos colas, con el .05 de nivel de significancia

.95 de probabilidad
.025 región de rechazo

-2 -1 0 1 2

Valor crítico
Z = 1.96,-1.96
Prueba de hipótesis para la
media de la población
El propósito principal de una prueba
de hipótesis para la media poblacional
es determinar si el valor hipotético
para un parámetro de la población
debe aceptarse.
Las pruebas de hipótesis para la media
poblacional se pueden dar por:
» Prueba de hipótesis de una media
(σ conocida)
Mediante la siguiente tablas se muestra los
componentes de una hipótesis:

Hipótesis nula 𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
Hipótesis alternativa 𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0
Estadístico de prueba
𝑥ҧ − 𝜇
𝑧= 𝜎
𝑛
Región crítica 𝑧: 𝑧 > 𝑧∝ 𝑧: 𝑧 > 𝑧∝ {𝑧: 𝑧 < −𝑧∝ }
2
» Prueba de hipótesis de una media
(σ desconocida)
Mediante la siguiente tablas se muestra los
componentes de la hipótesis:

Hipótesis nula 𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
Hipótesis alternativa 𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0
Estadístico de prueba
𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛
Región crítica
𝑡: 𝑡 > 𝑡𝑛−1;∝ 𝑡: 𝑡 > 𝑡𝑛−1;∝ {𝑡: 𝑡 < −𝑡𝑛−1;∝ }
2
Ejercicios de aplicación
En una empresa se fabrican piezas que no
alcanzan el tamaño mínimo de 25 cm. Se
toma una muestra a 10 elementos: 19, 15, 20,
28, 17, 13, 21, 18, 17, 20. Indicar con un nivel
de confianza del 90% si la compañía debe
tomar alguna medida para cambiar el tamaño
de dichas piezas.
Resolvemos:
Datos
𝜇 = 25
𝑛 = 10
Procedemos a aplicar los pasos para realizar
una prueba de hipótesis
Primero fijamos las hipótesis, determinamos
si es de dos colas o una y el nivel de
significancia
𝐻0 : 𝜇 ≥ 25
Para contrarrestar la hipótesis nula; nos dicen
que no alcanza el máximo de 25 cm; entonces
𝐻1 : 𝜇 < 25
Como hipótesis alterna nos dice que es <25;
es una prueba de hipótesis de una cola hacia
la izquierda.
Con un nivel de significancia 𝛼 = 100% −
90% = 10% = 0,10
Determinamos que es una distribución t y
procedemos a hallar el valor crítico
Si la muestra tiene 10 datos; los grados de
libertad serán 𝛾 = 10 − 1 = 9 y 𝛼 = 0,1 .
Procedemos a buscar en la tabla t-student y
obtenemos 𝑡𝑐 = 1.3830. y por regla del valor
critico es -1.3830
Ahora calculamos el estadístico de prueba 𝑡𝑐 = −1.3830

𝑥ҧ − 𝜇
𝑡= 𝜎
𝑛
Primero calculamos la media muestral (𝑥)ҧ
σ𝑛𝑖=1 𝑥𝑖
𝑥ҧ =
𝑛
19 + 15 + 20 + 28 + 17 + 13 + 21 + 18 + 17 + 20
𝑥ҧ =
10
188
=
10
𝑥ҧ = 18,8
Luego calculamos la desviación estándar
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2
𝜎=
𝑛−1
2
x 𝑥 − 𝑥ҧ 𝑥 − 𝑥ҧ
2
19 19 − 18,8 = 0,2 0,2 = 0,04
2
15 15 − 18,8 = −3,8 −3,8 = 14,44
2
20 20 − 18,8 = 1,2 1,2 = 1,44
2
28 28 − 18,8 = 9,2 9,2 = 84,64
2
17 17 − 18,8 = −1,8 −1,8 = 3,24
2
13 13 − 18,8 = −5,8 −5,8 = 33,64
2
21 21 − 18,8 = 2,2 2,2 = 4,84
2
18 18 − 18,8 = −0,8 −0,8 = 0,64
2
17 17 − 18,8 = −1,8 −1,8 = 3,24
2
20 20 − 18,8 = 1,2 1,2 = 1,44
SUMATORIA 147,6

Introducimos los valores en la fórmula

147,6
𝜎= = 4,05
9
Procedemos a colocar los valores para
encontrar el estadístico de prueba. La μ nos
proporciona el ejercicio (25)
18,8 − 25
𝑡=
4,05
10
𝑡 = −1,2807
En conclusión como el valor 𝑡 = −1,2807
𝑡𝑐 = −1.3830
esta dentro de la zona de aceptación por lo
tanto se acepta la hipótesis nula (𝐻0 ) y
rechazamos la hipótesis alternativa (𝐻1 ). Lo
que quiere decir que la compañía debe tomar
medidas para cambiar el tamaño de las
piezas.
2. Una embotelladora vierte 250 ml de
gaseosa por unidad. En una muestra
aleatoria a 40 gaseosas resulta un
contenido promedio de 245 ml con una
desviación estándar de 30 ml, determinar
mediante la prueba de hipótesis el
promedio teórico de 250 en
contraposición con la hipótesis alternativa
de que es menor a 250 en un nivel de
significancia del 5%
Resolvemos
El ejercicio básicamente nos proporciona toda
la información
Datos
𝑥ҧ = 245
𝜇 = 250
𝜎 = 30
𝛼 = 0.05
Seguimos los mismos pasos del ejercicio
anterior. Proponemos las hipótesis
𝐻0 : ≥ 250
𝐻1 : 𝜇 < 250
Debido a que es < 250, es de una cola hacia
la izquierda.
Trabajamos con un 95% de confianza; el 5%
será la zona de rechazo.
Buscamos en la tabla de la normal estándar el
valor de 0.05 en su centro. Entonces no
obtenemos el valor de 0.05 pero si valores
cercanos que pertenecen a 1,64 y 1,65 y
sacamos un promedio.
1,65 + 1,64
= 1,645
2
Por la regla de la región critica es -1,645
Para el estadístico de prueba
𝑥ҧ − 𝜇
𝑧= 𝜎
𝑛
245 − 250
𝑧= = −1,05
30
40
Decisión: el valor del estadístico de prueba
está dentro de la zona de aceptación; por
ende, se acepta la hipótesis nula y se rechaza 𝑧𝑐 = −1.65

la hipótesis alternativa.
Conclusión: se puede afirmar que el
contenido de cada gaseosa es mayor a 250 ml
con una significación del 5%.
3.- Los procesadores de la salsa de tomate de los
fritos indican en la etiqueta que la botella
contiene 16 onzas de la salsa de tomate. La
desviación estándar del proceso es 0.5 onza.
Una muestra de 36 botellas de la producción de
la hora anterior reveló un peso promedio de
16.12 onzas por botella. ¿En un nivel de
significancia del .05 el proceso está fuera de
control? ¿Es decir, podemos concluir que la
cantidad por botella es diferente a 16 onzas?
• Paso 1: Indique las hipótesis nulas y
alternativas:

H0: µ = 16; H1: µ ≠ 16

• Paso 2: Seleccione el nivel de significancia. En


este caso seleccionamos el nivel de significancia
del 0.05.
• Paso 3: Identifique la estadística de la prueba.
Porque conocemos la desviación estándar de la
población, la estadística de la prueba es z.
• Paso 4: Indique la regla de decisión:
Rechazo H0 si z > 1.96 o z < -1.96
• Paso 5: Compruebe el valor del estadístico de la prueba y
llegue a una decisión.

X − 16.12 − 16.00
z= = = 1.44
 n 0.5 36

No rechazamos la hipótesis nula. No -2 -1 0 1 2


podemos concluir que la media sea
diferente a 16 onzas. Valor crítico
Z = -1.96,1.96
4.- La cadena de almacenes de descuento de Roder
emite su propia tarjeta de crédito. Lisa, la gerente
de crédito, desea descubrir si el promedio sin
pagar mensual es más de $400. El nivel de
significancia se fija en .05. Una verificación al azar
de 172 balances sin pagar reveló que la media de
la muestra fue $407 y la desviación estándar de la
muestra fue $38. ¿Debe Lisa concluir que el medio
de la población es mayor de $400, o es razonable
asumir que la diferencia de $7 ($407-$400) es
debido al azar?
• Paso 1: H0: µ <= $400, H1: µ > $400
• Paso 2: El nivel de significancia es 0.05
• Paso 3: Porque la muestra es grande podemos utilizar la
distribución de z como el estadístico de la prueba.
• Paso 4: H0 es rechazada si z>1.645
• Paso 5: Realice los cálculos y tome una decisión.

X − $407 − $400
z= = = 2.42
s n $38 172

0 1 2 3

• H0 es rechazada. Lisa puede concluir que la media sin Valor crítico


Z = 1.645
pagar es mayor de $400.
Actividad Final:

Preguntas y Respuestas
BIBLIOGRAFÍA

• Lind, Marchal, Wathen (2012).


Estadística Aplicada a los Negocios y la
Economia. México: McGraw-Hill/Irwin
• Mendenhall, Beaver, Beaver (2004).
Introduccion a la Probabilidad y
Estadística. Mexico: Cengage Learning.
• Taylor, R. A. (2012). Probabilidad y
Estadística para Ingenieros. México:
Pearson Educación.

También podría gustarte