Prueba de Hipotesis para Dos Muestras
Prueba de Hipotesis para Dos Muestras
Prueba de Hipotesis para Dos Muestras
1
PRUEBA DE HIPOTESIS SOBRE LA MEDIA POBLACIONAL
Hipótesis Estadística
Se denomina hipótesis estadística, a cualquier afirmación, supuesto o conjetura
que se hace acerca de la distribución de una o más poblaciones.
En término sencillo, las hipótesis estadísticas consisten en suponer que los
parámetros, que definen a la población, toman determinados valores numéricos.
Ejemplo 1.
Una hipótesis podría ser que la comisión media de los vendedores de
computadoras en la ciudad de Lima es de S/.1000. No es posible entrevistar a
todos los agentes para determinar si la media en realidad es S/.1000. El costo de
localizar e interrogar a cada vendedor de computadoras en la ciudad de Lima seria
exorbitante. Para probar la validez de la afirmación (µ=S/.1000), debe seleccionar
una muestra de la población formada por vendedores de computadoras, calcular
valores estadísticos muestrales y con base a determinadas reglas de decisión
aceptar o rechazar la hipótesis.
Ejemplo 2.
Son hipótesis estadísticas:
1. La longitud media de un tipo de madera es 10 centímetros.
2. La proporción de objetos defectuosos producidos por cierto proceso nunca
es superior al 8%.
3. La varianza de la longitud de cierto tipo de alambre es 0.25 cm 2.
4. Son iguales las medias de dos tipos de mediciones independientes X e Y
que se distribuyen normalmente con varianza común σ 2.
4
La hipótesis alterna describe lo que se concluirá si se rechaza la hipótesis
nula, se designa por Ha y se lee “H subíndice a”. Se le conoce también
como hipótesis de investigación, esta se acepta si los datos muestrales
proporcionan suficiente evidencia estadística de que la hipótesis nula es
falsa. Otra notación que se utiliza para denotar la hipótesis alternativa está
dada por H1.
Es importante anotar que sin importar como se haya planteado el problema,
la hipótesis nula siempre incluirá el signo igual (=). Este signo nunca
aparecerá en la hipótesis alternativa pues la hipótesis nula es la afirmación
a probar, y al realizar los cálculos se requiere de un valor específico. Se
recurre a la hipótesis alterna solo si se verifica que la hipótesis nula es
falsa.
5
3. Seleccionar el estadístico de prueba
Estadístico para la media:
1. Planteo de hipótesis:
H0 : µ = 800
H1 : µ ≠ 800
2. Nivel de significancia: α = 0.04
3. Estadístico de la prueba:
Z
X μ 6
n
4. Determinación de la región critica de la prueba:
Z
X μ 788 - 800 -1.897
40
n
6. Conclusión: 40
Como -2.052 < -1.897 < 2.052 (cae en la región de aceptación) por lo tanto,
no se rechaza H0 y se concluye con un nivel de significancia del 0.04 que la
duración media de los focos no ha cambiado.
Ejemplo 2.
Estamos interesados en estudiar si existen diferencias significativas en el tiempo
medio de experiencia previa de los empleados de cierta empresa. Por ello
supongamos que dicho valor es igual a 110 meses con un nivel de confianza del
95%. Para ello utilice los siguientes reportes de SPSS:
Estadísticos para una muestra
7
Nota: Para los reportes de salida del programa SPSS, le damos la siguiente
ruta:
Analizar / Comparación de medias / Prueba T para una muestra / test value =
110
Solución:
1. Planteo de hipótesis:
H0 : µ = 110
H1 : µ ≠ 110
2. Nivel de significancia: α = 0.05
3. Tipo de prueba: t de student
4. Comprobando hipótesis:
5. Conclusión:
8
Como el valor de p=0.003 y es menor que el nivel de significación α = 0.05
rechazamos la hipótesis nula, lo que implica que aceptamos la hipótesis
alterna. Por lo tanto concluimos que a un nivel de significancia del 5%, que
el tiempo medio de la experiencia previa de los empleados es diferente a
110 meses y la probabilidad de equivocarnos en tomar esta decisión es del
0.3%.
A) Varianzas conocidas
Supóngase que hay dos poblaciones de interés X 1 y X2, Suponemos que X1 tiene
media desconocida 1 y varianza conocida 1 y que X2 tiene media desconocida
2
H 0 : 1 2
H1 : 1 2
Donde
H0 = Hipótesis nula
H1 = Hipótesis alternativa.
1 = media de la población 1
2 = media de la población 2
9
X1 X 2
Z0
21 2 2
n1 n2
Donde:
X 1 = media de la muestra 1
X 2 = media de la muestra 2
21 = varianza de la población 1
2 2 = varianza de la población 2
n1 = tamaño de la muestra 1
n2 = tamaño de la muestra 2
Z 0 Z 2 o Z 0 Z 2
Donde
H 0 : 1 2
H 1 : 1 2
10
H 0 : 1 2
H 1 : 1 2
11
Ejemplo 6:
Se emplean dos máquinas para llenar botellas de plástico con un volumen neto de
16 onzas. El proceso de llenado puede suponerse normal, con desviaciones
estándar de 1 .015 y 2 .018 . Ingeniería de calidad sospecha que ambas
máquinas llenan hasta el mismo volumen neto, sin importar que este volumen sea
o no de 16 onzas. Se toma una muestra aleatoria de la salida de cada máquina.
máquina 1 máquina 2
16.03 16.02
16.04 15.97
16.05 15.96
16.05 16.01
16.02 15.99
16.01 16.03
15.96 16.04
15.98 16.02
16.02 16.01
15.99 16
H 0 : 1 2
H 1 : 1 2
X1 X 2 16.015 16.005
Z0 1.34
1 2 = .015 2 .018 2
2 2
n1 n2 10 10
Z 2 = Z.025 = 1.96
12
1-.025 =.975 buscando el valor de Z correspondiente a .975 encontramos Z =
1.96
Presentaremos ahora pruebas para comparar dos varianzas. Supóngase que son
dos las poblaciones de interés, por ejemplo X 1 y X2, donde 1, 1 , 2 , 2 , se
2 2
13
tamaño n1 de la población 1 y de tamaño n2 de la población 2, y sean S12 yS 22 las
varianzas de muestra. Para probar la alternativa de dos lados
H 0 : 12 22
H 1 : 12 22
S12
F0 2
S2
Rechazaríamos H0 si
F0 F 2 , n1 1, n 2 1
o si
F0 F1 2 , n1 1, n2 1
Donde F 2 ,n1 1,n2 1 y F1 2 ,n1 1,n2 1 son los puntos porcentuales 2 superior e
inferior de la distribución F con n1-1 y n2-2 grados de libertad. La tabla F
proporciona sólo los puntos de la cola superior de F, por lo que para determinar
F1 2 ,n 1,n 1 debemos emplear
1 2
1
F1 2 , n1 1, n2 1 = F
2 , n1 1, n2 1
H 0 : 12 22
H 1 : 12 22
14
Ejemplo 7: Los siguientes son tiempos de quemado (en minutos) de señales
luminosas de dos tipos diferentes.
Tipo 1 Tipo 2
63 64
81 72
57 83
66 59
82 65
82 56
68 63
59 74
75 82
73 82
Pruebe la hipótesis de que las dos varianzas sean iguales. Use .05
H 0 : 12 22
H 1 : 12 22
X 1 70.6
X 2 70
S12 88.71
S 22 100.44
S12 88.71
F0 = .877
S 22 100.44
H 0 : 12 22 .
15
PROCEDIMIENTO EN EXCEL: Seleccionar análisis de datos en el menú
herramientas. En funciones para análisis elija la opción : Prueba F para
varianzas de dos muestras.
16
Prueba F para varianzas de dos muestras
Variable 1 Variable 2
Media 70.6 70
Varianza 88.7111111 100.444444
Observaciones 10 10
Grados de libertad 9 9
F 0.88318584
P(F<=f) una cola 0.42811371
Valor crítico para F (una cola) 0.2483862
De la tabla deducimos que .248 es menor que .883 por lo cual no rechazamos H 0.
En la tablazde
Prueba Excel
para tenemos
medias el valor z = 1.34 y el valor crítico de z (dos colas) =
de dos muestras
1.96, como 1.34 no es mayor que 1.96 no rechazamos la hipótesis nula.
B) Varianzas desconocidas: Variable 1 Variable 2
Media 16.015 16.005
Varianza (conocida) 0.000225 0.000324
Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias
1 yObservaciones
2 de dos distribuciones normales donde no 10
se conocen10
las varianzas 12 y 22 .
Diferencia hipotética de las medias 0
Tenemos
z dos casos en el primero las varianzas
1.34962722son iguales y en el segundo las
varianzas
P(Z<=z)sonuna desiguales,
cola a continuación, analizaremos cada uno de ellos.
0.08856785
Valor crítico de z (una cola) 1.644853
Caso 1 varianzas
Valor iguales
crítico de z (dos colas) 0.17713571
Sean X1 ycrítico
Valor X2 dosde zpoblaciones
(dos colas) normales1.95996108
independientes con medias desconocidas
1 y 2 , y varianzas conocidas pero iguales 12 22 2 . Deseamos probar:
H 0 : 1 2
H 1 : 1 2
2 2
Sean X1, X2, S1 , S 2 , las medias y las varianzas de las muestras, respectivamente.
2 2
Puesto que tanto S1 como S 2 estiman la varianza común , podemos
2
n1 1 S12 n2 1 S 22
Sp
n1 n2 2
17
H 0 : 1 2
H 1 : 1 2
Calcúlese la estadística de prueba t0 y rechácese H 0 : 1 2 si:
t 0 t , n1 n2 2
H 0 : 1 2
H 1 : 1 2
t 0 t a , n1 n2 2
Suponiendo que las dos varianzas son iguales, ¿qué conclusiones puede
extraerse respecto a la resistencia media de los alambres?
H 0 : 1 2
H 1 : 1 2
Calculando la media y la desviación estándar de la muestra:
x1 .140
x 2 .138
S1 .0021
S 2 .0022
n1 1 S12 n2 1 S 22
Sp = .0021
n1 n2 2
X1 X 2
t0
1 1 = 1.72
Sp
n1 n 2
18
Utilizando el criterio de rechazo t 0 t 2, n1 n2 2 , 1.72 no es mayor que 2.306, por
lo tanto no rechazamos H0.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción: Prueba t para dos muestras suponiendo varianzas
iguales.
X1 X 2
t0
S12 S 22
n1 n2
19
2
S12 S 22
n1 n 2 2
S12 n1 2 S 22 n2 2
n1 1 n2 1
Proceso Rendimiento %
1 24.2 26.6 25.7 24.8 25.9 26.5
2 21.0 22.1 21.8 20.9 22.4 22.0
¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio
mayor?
H 0 : 1 2
H 1 : 1 2
x1 25.62
x 2 21.70
S12 .9017
S 22 .3760
X1 X 2
25.62 21.70
t0 8.48
2 2
S S = .9017 .376
1
2
n1 n2 6 6
2
S12 S 22 .9017 .376
2
n1 n 2 2 6 6
2 9.32 9
=
S12 n1 2 S 22 n2 2 .9017 6 2 .376 6 2
n1 1 n2 1 7 7
20
Buscando el valor en la tabla t encontramos t .05,9 = 1,833, mediante el criterio de
rechazo para una cola t0>t.05,9 , 8.48>1.833, por lo tanto rechazamos la hipótesis
nula, y aceptamos la hipótesis alterna, el proceso 1 tiene mayor rendimiento que
el proceso 2.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción : Prueba t para dos muestras suponiendo varianzas
desiguales.
Variable 1 Variable 2
Media 25.61666667 21.7
Varianza 0.901666667 0.376
Observaciones 6 6
Diferencia hipotética de las medias 0
Grados de libertad 9
Estadístico t 8.487571675
P(T<=t) una cola 6.87798E-06
Valor crítico de t (una cola) 1.833113856
P(T<=t) dos colas 1.3756E-05
Valor crítico de t (dos colas) 2.262158887
21
8.48 mayor que 1.83 (valor crítico de t de una cola), se rechaza Ho.
H0 : D 0
H1 : D 0
D
t0
SD n
donde
D
D j
n
y
D j D
2
SD
n 1
Ejemplo 6:
Un fabricante desea comparar el proceso de armado común para uno de sus productos con
un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron
Trabajador Proceso actual Proceso propuesto
ocho trabajadores
1
de38la planta de armado
30
y se les pidió que armaran las unidades con ambos
procesos.
2 Los siguientes
32 son los tiempos
32 observados en minutos.
3 41 34
4 35 37
5 42 35 22
6 32 26
7 45 38
8 37 32
En .05 , ¿existe alguna razón para creer que el tiempo de armado para el proceso actual
es mayor que el del método propuesto por más de dos minutos?
H0 : D 2
H1 : D 2
D j D
2
= 3.69
SD
n 1
D 4.75 2
t0 = = 2.107
SD n 3.69 8
t ,n 1 t .05, 7 1.895
, debido a que 2.107 > 1.895 rechazamos H0, y aceptamos la H1: el
tiempo de armado para el proceso actual es mayor en dos minutos que el método propuesto.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija
la opción : Prueba t para medias de dos muestras emparejadas.
23
24
De la tabla concluimos que 2.105 > 1.895 (valor crítico de t una cola), por lo cual
rechazamos Ho.
25