Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Diapositiva Semana 6

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 56

ESTADÍSTICA APLICADA

PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS


POBLACIONALES
PARA MUESTRAS INDEPENDIENTES Y DEPENDIENTES

Profesor: Mg. Marco Antonio Cuentas Montenegro


NORMAS BÁSICAS DE LA SESIÓN VIRTUAL
Propósito
• Conoce el procedimiento estadístico para
probar hipótesis respecto a dos medias.

• Conoce el procedimiento estadístico para


probar hipótesis y análisis de dos medias
para muestras independientes.

• Conoce el procedimiento estadístico para


probar hipótesis y análisis de dos medias
para muestras dependientes.
RECORDEMOS LA CLASE ANTERIOR
Prueba de hipótesis para dos
poblaciones
Hasta el momento Ahora que has aprendido
a determinar lo que es una prueba de
hipótesis y relacionarla con tu área de
especialidad. el siguiente paso es que
apliques estos conceptos a la comparación
de dos poblaciones diferentes sobre un
mismo problema.

Cuando se muestrean dos poblaciones


diferentes, se emplean dos tipos de
muestras: independientes y dependientes.
Las muestras independientes son aquellas
que no comparten características entre sí y
que proceden de poblaciones diferentes,
mientras que las muestras dependientes, al
ser parte de la misma población, sí
comparten características entre ellas.
Prueba de hipótesis para dos
poblaciones
Para la prueba de hipótesis de la diferencia de medias (µ1-µ2) y la
diferencia de proporciones (p1-p2) de dos poblaciones.

Supuestos para realizar la prueba de hipótesis:


1. Las muestras son aleatorias.
2. Las muestras provienen de poblaciones normales.
3. Las muestras son independientes
Ejemplo:
Para los siguientes enunciados formule la hipótesis nula y la
alterna.

Enunciado Formulación del


tipo de hipótesis
El peso promedio de los cuyes de la raza Inti es 𝑯𝟎 : 𝝁𝟏 ≤ 𝝁𝟐
mayor que la raza Andina.
𝑯𝟏 : 𝝁𝟏 > 𝝁𝟐

El rendimiento promedio de fréjol Canario es 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝟏𝟓


mayor a el frejol Percal en más de 15 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝟏𝟓
kg/parcela
La proporción de artículo defectuosos de la H0: 𝒑𝟏 ≥ 𝒑𝟐
máquina A es menor a la máquina B. H1: 𝒑𝟏 < 𝒑𝟐
La proporción de clientes morosos hombres es H0: 𝒑𝟏 − 𝒑𝟐 ≤ 𝟎. 𝟎𝟖
mayor que las mujeres en más de 8%. H1: 𝒑𝟏 − 𝒑𝟐 >0.08

7
Inferencias para las medias de dos
poblaciones

Inferencias para dos medias


Muestras
Muestras Independientes
apareadas

Varianzas
Varianzas poblacionales no
poblacionales
conocidas
conocidas

No se asumen Se asume
Varianzas varianzas
Iguales iguales
En este capitulo se seleccionan muestras aleatorias de dos
poblaciones distintas para determinar si son iguales las medias de
la población.

Diremos que dos muestras son independientes cuando no se


establece ninguna relación previa al análisis entre las unidades de
una y otra muestra.

Por ejemplo, sujetos de uno y otro curso, enfermos de dos


consultorios, hombres comparados con mujeres.
𝝈𝟏 𝒚 𝝈𝟐 Conocidas

𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


z=
𝜎12 𝜎22
+
𝑛1 𝑛2

𝜇1 = Media poblacional 𝜇2
1 = Desviación estándar poblacional 2
n1 = Ta maño de la muestra n2
𝑥ҧ1 = Media muestral 𝑥ҧ2
𝑠1 = Desviación estándar muestral 𝑠2
1. 1 y 2 son conocidas
2. Dos muestras independientes
3. Ambas muestras son aleatorias simples
4. Las poblaciones muestreadas siguen la distribución
normal.
5. Cualquiera de estas condiciones (o ambas) se
satisfacen: los dos tamaños muestrales son grandes
(con n1 ≥ 30 y n2 ≥ 30) o ambas muestras provienen
de poblaciones que tienen distribuciones normales.
El Valor de P y el Valor crítico se hallan en la tabla z
Los clientes de los supermercados FoodTown tienen una opción al
pagar por sus compras. Pueden pagar en una caja registradora
normal operada por un cajero, o emplear el nuevo procedimiento:
Fast Lane. Cuando eligen la primera alternativa, un empleado
registra cada artículo, lo pone en una banda transportadora
pequeña de donde otro empleado lo toma y lo pone en una bolsa, y
después en el carrito de víveres. En el procedimiento Fast Lane, el
cliente registra cada artículo, lo pone en una bolsa y coloca las
bolsas en el carrito. Este procedimiento está diseñado para reducir
el tiempo que los clientes pierden en la fila de la caja. El aparato de
Fast Lane se acaba de instalar en la sucursal de la calle Byrne de
FoodTown.
La gerente de la tienda desea saber si el tiempo medio de pago con el
método tradicional es mayor que con Fast Lane, para lo cual reunió la
información siguiente sobre la muestra. El tiempo se mide desde el momento
en que el cliente ingresa a la fila hasta que sus bolsas están en el carrito. De
aquí que el tiempo incluye tanto la espera en la fila como el registro. α=1%

GRUPO 1 GRUPO 2
Datos:
n=50 n=100
x̄=5.5 x̄=5.3
σ=0.4 σ=0.3
Paso 1: Planteamiento de la Paso 2: Plantear la regla de decisión
Hipótesis

H0: μ1 = μ2 (el tiempo medio de


pago con el método tradicional no
es mayor que con Fast Lane)

H1: μ1 > μ2 (el tiempo medio de


pago con el método tradicional es
mayor que con Fast Lane)
Paso 3: Calculo del estadístico de Paso 4:
prueba Decisión: Como el estadístico de prueba
de zp = 3.12 se localiza dentro de la región
𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 ) crítica, se rechaza la hipótesis nula.
z=
𝜎12 𝜎22
𝑛1 + 𝑛2
Paso 5:
Conclusión: Con base en los datos
muestrales disponibles existe suficiente
z=
información para concluir que el método
Fast Lane es mas rápido.
Los pesos de bebés nacidos de madres que recibieron
placebos tienen una media menor de los pesos de los
bebés nacidos de madres que recibieron suplementos
de zinc.
A continuación se resumen los resultados muestrales.
Someta a prueba la afirmación enunciada y utilice un
nivel de significancia 𝞪 = 0,05 y suponga que todas las
poblaciones están distribuidas normalmente.

Grupo placebo : n = 76 𝑥ҧ = 3088 g σ = 728 g


Grupo tratamiento: n = 70 𝑥ҧ = 3214 g σ = 669 g
𝝈𝟏 𝒚 𝝈𝟐 Desconocidas y 𝝈𝟐𝟏 = 𝝈𝟐𝟐 (𝜇1 − 𝜇2 𝑖𝑔𝑢𝑎𝑙 𝑎 0)

𝑥1ҧ − 𝑥ҧ2 − (𝜇1 − 𝜇2 ) 𝑛 − 1 𝑠 2


+ (𝑛 − 1)𝑠 2
t= 𝑠𝑝2 =
1 1 2 2
(𝑛1 −1) + (𝑛2 −1)
𝑠𝑝2 𝑠𝑝2
+
𝑛1 𝑛2
gl = n1 + n2 - 2

𝜇1 = Media poblacional 𝜇2
1 = Desviación estándar poblacional 2
n1 = Ta maño de la muestra n2
𝑥ҧ1 = Media muestral 𝑥ҧ2
𝑠1 = Desviación estándar muestral 𝑠2
1. 1 y 2 desconocidas (con suposición de
igualdad)
2. Dos muestras independientes
3. Ambas muestras son aleatorias simples.
4. Las poblaciones muestreadas siguen la
distribución normal.

El Valor de P y el Valor crítico se hallan en la tabla t


Para verificar la suposición de que existe
diferencia en el aprendizaje de AULA A AULA B
matemática en los alumnos de dos aulas A 16 15
43 40
y B de un colegio, se tomo una muestra 24 18
aleatoria de cada aula y se les aplico una 35 37
misma prueba de conocimiento, 20 16
obteniéndose los puntajes que a 27 29
continuación se indica en la tabla. Someta 29 30
a prueba la afirmación enunciada y utilice 30 45
40 20
un nivel de significancia 𝞪 = 0,05 y 32 36
suponga que todas las poblaciones están
distribuidas normalmente con varianzas
poblacionales desconocidas pero iguales.
Datos:
AULA A AULA B
GRUPO A GRUPO B 16 15
n= n= 43 40
24 18
x̄= x̄= 35 37
s= s= 20 16
27 29
29 30
30 45
40 20
32 36
Paso 1: Planteamiento de la Paso 2: Plantear la regla de decisión
Hipótesis

H0: μ1 = μ2 (no existe diferencia


en el aprendizaje de matemática en los
alumnos de dos aulas A y B)

H1: μ1 ≠ μ2 (existe diferencia en


el aprendizaje de matemática en los
alumnos de dos aulas A y B)
Paso 3: Calculo del estadístico de 𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )
t=
prueba
𝑠𝑝2 𝑠𝑝2
𝑛 − 1 𝑠 2
+ (𝑛 − 1)𝑠 2 𝑛1 + 𝑛2
1 1 2 2
𝑠𝑝2 =
(𝑛1 −1) + (𝑛2 −1)
29.6 − 28.6 − (0)
t= = 0.2305
94.09 94.09
10 − 1 8.42 2 + 10 − 1 10.8 2
+
2
𝑠𝑝 = 10 10
(10 − 1) + 10 − 1)
Paso 4:
𝑠𝑝2 =94.09 Decisión: Como el estadístico de prueba de
tp =0.23 se localiza dentro de la región de
aceptación, se acepta la hipótesis nula.
Paso 5:
Conclusión: Se concluye que no existe
diferencia en el aprendizaje de matemática
en los alumnos de dos aulas A y B de un
colegio.
A continuación se presentan los conteos de glóbulos blancos de
muestras aleatorias simples de hombres y mujeres.
Utilice un nivel de significancia de 0,01 para someter a prueba la
afirmación de que los hombres y las mujeres tienen conteos medios
diferentes de glóbulos blancos.
Suponga que todas las poblaciones están distribuidas normalmente
con varianzas poblacionales desconocidas pero iguales.

Mujeres:
8.90 6.50 9.45 7.65 6.40 5.15 16.60 5.75 11.60 5.90 9.30 8.55 10.80
4.85 4.90 8.75 6.90 9.75 4.05 9.05 5.05 6.40 4.05 7.60 4.95 3.00
9.10
Hombres:
5.25 5.95 10.05 5.45 5.30 5.55 6.85 6.65 6.30 6.40 7.85 7.70 5.30
6.50 4.55 7.10 8.00 4.70 4.40 4.90 10.75 11.00 9.60
𝝈𝟏 𝒚 𝝈𝟐 Desconocidas y 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐

𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )


t= (𝜇1 − 𝜇2 𝑖𝑔𝑢𝑎𝑙 𝑎 0)
𝑠12 𝑠22
+
𝑛1 𝑛2 gl = El menor de n1 – 1 y n2 - 1

𝜇1 = Media poblacional 𝜇2
1 = Desviación estándar poblacional 2
n1 = Ta maño de la muestra n2
𝑥ҧ1 = Media muestral 𝑥ҧ2
𝑠1 = Desviación estándar muestral 𝑠2
1. 1 y 2 desconocidas (sin suposición de
igualdad)
2. Dos muestras independientes
3. Ambas muestras son aleatorias simples.
4. Las poblaciones muestreadas siguen la
distribución normal.

El Valor de P y el Valor crítico se hallan en la tabla t


 Un encabezado en USA Today afirmó que “los hombres hablan
tanto como las mujeres”. El encabezado se refería a un estudio
del número de palabras de muestras de hombres y mujeres
que pronuncian en un día. Utilice un nivel de significancia de
0,05 para someter a prueba la afirmación de que los hombres y
las mujeres pronuncian el mismo número de palabras en un
día.

Número de palabras pronunciadas en un día

Hombres Mujeres
𝑛1 = 186 𝑛2 = 210
𝑥ҧ1 = 15668,5 𝑥ҧ2 = 16215,0
𝑠1 = 8632,5 𝑠2 = 7301,2
Requisitos
 Los valores de las dos desviaciones estándar poblacionales se
desconocen, y no estamos haciendo una suposición de
igualdad entre ellas.
 Las dos muestras son independientes porque los conteos de
palabras de la muestra de hombres no están pareados ni
asociados con los conteos de palabras de la muestra de
mujeres.
 Suponemos que las muestras son aleatorias simples.
 Ambas muestras son grandes, por lo que no es necesario
verificar que cada muestra provenga de una población con una
distribución normal.
Paso 1
 La afirmación de que los hombres y las mujeres
tienen la misma media: µ1 = µ2

Paso 2
 Si la afirmación original es falsa, entonces µ1 ≠ µ2

Paso 3
 La hipótesis alternativa es la expresión que no
implica igualdad
Ho: µ1 = µ2 (Afirmación original)
H1: µ1 ≠ µ2
Paso 4
 Seleccionamos  = 0,05

Paso 5
 Puesto que tenemos dos muestras independientes y estamos
sometiendo a prueba una afirmación acerca de dos medias
poblacionales, utilizamos una distribución t.

Paso 6
𝑥ത1 − 𝑥ത2 − (𝜇1 − 𝜇2 ) 15668,5 − 16215,0 − 0
𝑡= 𝑡= 𝑡 = −0,676
(8632,5)2 (7301,2)2
𝑆12 𝑆22 +
186 210
𝑛1 + 𝑛2
Los valores críticos de t = ± 1,972

 Con un área de 0,005 en dos colas (el valor t correspondiente a


185 grados de libertad que es el menor de n1 - 1 y n2 - 1 (o el
menor de 185 y 209)

 Utilizamos los valores más cercanos de ± 1,972

Paso 7
Puesto que el estadístico de prueba no se ubica dentro de la
región crítica, no se rechaza la hipótesis nula µ1 = µ2
(µ1 - µ2 = 0)
El contenido medio de alquitrán en una muestra aleatoria
simple de 25 cigarrillos tamaño grande sin filtro es de 21,1
mg, con una desviación estándar de 3,2 mg. El contenido
medio de alquitrán de una muestra aleatoria simple de 28
cigarrillos de 100 mm con filtro es de 13,2 mg, con una
desviación estándar de 3,7 mg.
Utilice un nivel de significancia de 0,01 para someter a
prueba la afirmación de que los cigarrillos tamaño
grande sin filtro tienen un contenido medio de alquitrán
mayor que el de los cigarrillos de 100 mm con filtro.

¿Qué sugiere el resultado acerca de la eficacia de los filtros


de los cigarrillos?.
Diremos que se trata de muestras pareadas cuando se usa el
conjunto de datos para obtener 2 informaciones.

Por ejemplo:

Se efectúa una prueba a 50 participantes de un grupo.


Posteriormente se capacitan los 50 participantes y se les vuelve a
hacer la prueba a ellos mismos.
Puede usar esta prueba cuando sus valores
correspondan a medidas emparejadas.

Por ejemplo, si tiene medidas de antes y después para


un grupo de personas. Además, la distribución de
diferencias entre medidas emparejadas debe tener una
distribución normal.
𝑑ҧ − 𝜇𝑑
t= 𝑠 gl = n - 1
𝑑
𝑛

𝜇𝑑 = Valor medio de las diferencias d para la población de todos los datos


pareados
d = Diferencia individual entre los dos valores de un par de datos.
𝑑ҧ = Valor medio de las diferencias d para los datos muestrales pareados.
𝑠𝑑 = Desviación estándar de las diferencias d para la muestra de datos
pareados.
n = Número de pares de datos
1. Los datos muestrales son dependientes.

2. Las muestras son aleatorias simples

3. Cualquiera o ambas de estas condiciones se


satisfacen: el número de datos pareados de datos
muestrales es grande (n > 30) o los pares de valores
tienen diferencias que provienen de una población
con una distribución aproximadamente normal.
El Valor de P y el Valor crítico se hallan en la tabla t
Por lo tanto el problema se reduce a probar una media
de población hipotética, que ya hemos visto. Se
empieza estableciendo:

1. H0: 𝜇d=0 No hay diferencia alguna entre las dos


muestras relacionadas y H1: toma las formas 𝜇d<0,
𝜇d  0, 𝜇d>0.
2. Se escoge el nivel de significancia
3. La estadística de prueba es t que tiene distribución t
con n-1 grados de libertad.
Donde: 𝜇 d= 𝜇 D- 𝜇𝐴 o 𝜇 d= 𝜇A- 𝜇𝐷
El banco INTEBANK recurre a dos empresas, Schadek S.A.C. y
Bowyer Real State, para determiner el valor de los bienes raíces
sobre los cuales se hacen los préstamos. Es importante que los
avalúos de estas dos empresas contemplen valores similares.
Para revisar la consistencia de las dos empresas, el banco
INTEBANK selecciona en forma aleatoria 10 casas y pide a
Schadek S.A.C. y a Bowyer Real State que las valúen. De cada
una se harán dos avalúos; cada casa tendrá un avalúo de Schadek
S.A.C. y otro de Bowyer Real State. Los avalúos dependen o
están relacionados con la casa seleccionada.
A esto también se le conoce como muestra apareada.
Recuerde que el banco
INTEBANK desea
comparar las dos
compañías que contrata
para valuar las casas. El
banco INTEBANK
seleccionó una muestra
de 10 propiedades y
programa los avalúos de
las dos empresas. Los
resultados, en miles de Con un nivel de significancia de 0.05, ¿se
dólares, son: puede concluir que hay una diferencia
entre los avalúos medios de las casas?
Paso 1: Planteamiento de la Hipótesis Paso 2: Plantear la regla de decisión

H0: μd= 0
H1: μd≠ 0 (hay una diferencia entre los
avalúos medios de las casas)
Paso 3: Calculo del estadístico de Paso 4:
prueba Decisión: Se rechaza la hipótesis nula.
𝑑ҧ − 𝜇𝑑
t= 𝑠
𝑑
𝑛

Paso 5:
Conclusión: hay una diferencia entre los
avalúos medios de las casas.

−𝜇𝑑
t=
Se hace un estudio de 10 personas
sobre Comprensión Lectora. Se
contó el número de palabras en 3
minutos que cada persona
era capaz de leer y comprender.
Posteriormente se les proporcionó
un curso de estrategias durante 3
meses y se volvió a contar el
número de palabras leídas. Los
resultados son los siguientes:
¿Existe suficiente evidencia para
demostrar las estrategias aplicadas
fueron exitosas con un nivel de
significancia del 0.05?
Se hace un estudio de 10 personas sobre Comprensión Lectora. Se contó el número de palabras
en 3 minutos que cada persona era capaz de leer y comprender.
Posteriormente se les proporcionó un curso de estrategias durante 3 meses y se volvió a contar
el número de palabras leídas. ¿Existe suficiente evidencia para demostrar las estrategias
aplicadas fueron exitosas con un nivel de significancia del 0.05?

Paso 1: Planteamiento de la Hipótesis Paso 2: Plantear la regla de decisión

H0: μd= 0 (No hay diferencia alguna


entre las dos muestras, las estrategias
no fueron exitosas)
H1: μd >0 (Existe suficiente evidencia
para demostrar las estrategias
aplicadas fueron exitosas “𝜇D- 𝜇𝐴 >0”)
Paso 3: Calculo del estadístico de prueba Paso 4:
Decisión: Se rechaza la hipótesis nula, se
ത 𝑑
𝑑−𝜇 5−0 acepta la hipótesis alternativa.
t= 𝑠𝑑 = 6.164414 =2.5649
𝑛 10

Paso 5:
Conclusión: Existe suficiente evidencia para
demostrar que la estrategia de comprensión
lectora tuvo éxito.
DATOS
n=10
ഥ =5
𝒅
sd=6.164414
El conjunto incluye pesos de estudiantes universitarios,
medidos en los meses de septiembre y abril de su primer año
de estudios. Utilice los datos muestrales con un nivel de
significancia de 0,05 para someter a prueba la afirmación de
que, para la población de estudiantes, el cambio medio de peso
desde septiembre hasta abril es igual a 0 kg.

Medidas del peso (kg) de estudiantes en su primer año

Peso en abril 66 52 68 69 71
Peso en setiembre 67 53 64 71 70
¿ Qué ¿ Cómo
aprendí ? aprendí ?

¿ Qué me
¿ Para qué falta
aprendí ? aprender ?

También podría gustarte