U Mann Whitney Test
U Mann Whitney Test
U Mann Whitney Test
Samuel Martı́nez
October 28, 2019
H0 : M ediana1 = M ediana2
Ha : M ediana1 6= M ediana2
H0 : M ediana1 ≤ M ediana2
Ha : M ediana1 > M ediana2
1
H0 : M ediana1 ≥ M ediana2
Ha : M ediana1 < M ediana2
n1 ∗ (n1 + 1)
U = n1 ∗ n2 + − R1
2
la media del estadı́stico U − M ann − W hitney es:
n1 ∗ n2
µU =
2
y el error estándar es:
r
n1 ∗ n2 (n1 + n2 + 1)
σU =
12
La distribución muestral del estadı́stico U puede aproximarse por la dis-
tribución normal cuando n1 y n2 son mayores que 10. Luego, el estadı́stico
calculado es
U − µU
Z=
σU
El valor crı́tico Zα se encuentra en la tabla de distribución normal.
Finalmente, si el estadı́stico calculado es mayor que el valor crı́tico, se rechaza
H0
1.1 Ejemplo:
1. Suponga que la junta directiva de una gran universidad estatal del este de
Estados Unidos desea probar la hipótesis de que las calificaciones promedio
en la prueba SAT en dos planteles de la universidad son iguales. La junta
mantiene estadı́sticas de todos los estudiantes en todos los planteles del
sistema. Una muestra aleatoria de 15 estudiantes de cada plantel produjo
los datos que se muestran en la tabla
2
La junta directiva desea probar al nivel de significancia de 0.15 la hipótesis
de que estas muestras fueron extraı́das de poblaciones idénticas.
Desarrollo:
Se tiene que n1 = 15 y n2 = 15. Ahora, se organizan las calificaciones por
rangos:
n1 ∗ (n1 + 1)
U = n1 ∗ n2 + − R1
2
15 ∗ 16
U = 15 ∗ 15 + − 247
2
U = 225 + 120 − 247
U = 98
la media muestral:
n1 ∗ n2
µU =
2
15 ∗ 15
µU =
2
µU =112.5
3
y el error estándar:
r
n1 ∗ n2 (n1 + n2 + 1)
σU =
12
r
15 ∗ 15(15 + 15 + 1)
σU =
12
r
6985
σU =
12
√
σU = 581.25
σU = 24.1
U − µu
z=
σu
98 − 112.5
z=
24.1
z = − 0.602
4
1.2 Ejercicios
1. La presencia de malas hierbas, ¿reduce el rendimiento en cultivos de maı́z?
La cañota es una mala hierba común en los campos de maı́z. Un agrónomo
sembró 8 parcelas experimentales con la misma cantidad de maı́z. En 4
de ellas, escogidas al azar, se eliminaron todas las malas hierbas. En las 4
restantes se dejó una densidad de 3 cañotas por metro lineal. He aquı́ los
rendimientos del maı́z en cada una de las parcelas.
Las observaciones sugieren que los rendimientos pueden ser menores cuando
hay malas hierbas. Comprueba esta hipótesis con α = 0.05
Turistas 1 2 3 4 5 más de 5
Japoneses 10 15 26 49 10 30
Estadounidenses 37 28 52 14 5 2
¿ Exite evidencia de que los turistas japoneses visitan más ciudades que
los turistas estadounidenses?
Hombres 31 25 38 33 42 40 44 26 43 35
Mujeres 44 30 34 47 35 32 35 47 48 34
5
4. Los siguientes datos muestran horas anuales perdidas por enfermedad de
los 24 hombres y mujeres de la Northern Packing Company, Inc. Al nivel
de significancia de 0.10, ¿existe alguna diferencia atribuible al sexo?.
Hombres 31 44 25 30 70 63 54 42 36 22 25 50
Mujeres 38 34 33 47 58 83 18 36 41 37 24 48
5. Para incrementar las ventas durante los dı́as de más demanda, una cadena
de tiendas que vende queso en centros comerciales da pruebas de su pro-
ducto a la entrada de las tiendas. La administración de la cadena define
los dı́as de más venta y selecciona aleatoriamente los dı́as para repartir
muestras. De una muestra de dı́as que se consideraron fuertes en com-
pras, los siguientes datos proporcionan las ventas de una tienda en los
dı́as que dio muestras de quesos y en los que no.
Dı́as de promoción 18 21 23 15 19 26 17 18 22 20 18 21 27
Dás normales 22 17 15 23 25 20 26 24 16 17 23 21
Mujeres Hombres
8 2
6 10
7 7
4 6
6 6
10 8
8 6
6 5
6
7. McConaughy (1980) has argued that younger children organize stories
in terms of simple descriptive (“and then. . .”) models, whereas older
children incorporate causal statements and social inferences. Suppose that
we asked two groups of children differing in age to summarize a story they
just read. We then counted the number of statements in the summary
that can be classed as inferences. The data follow:
Younger Children 0 1 0 3 2 5 2
Older Children 4 7 6 4 8 7