Willcoxon
Willcoxon
Willcoxon
Tal como lo presentamos se trataría de un test para diferencia entre distribuciones, es decir que
la hipótesis nula sería Ho: F(x) = G(x) x, siendo F la distribución de la m.a. X1,...,Xn y G la de
la m.a. Y1,..., Ym. Sin embargo, nosotros lo trataremos como un test para el parámetro de
posición, para lo cual supondremos que G(x)=F(x-), para algún .
Datos: Sea F o y sean X1,...,Xn una m.a. de una distribución F(x) e Y 1,...,Ym una m.a. de una
distribución F(x-), independiente de la primera, es decir que sólo suponemos que F es
absolutamente continua con única mediana y que las dos distribuciones tienen la misma forma
(en particular, igual varianza).
Hipótesis a testear:
A. Ho: = 0 vs H1: 0
Estadístico del test y zona de rechazo: Consideremos el caso C. Wilcoxon (1945) propuso el
siguiente procedimiento. Se ordenan los datos de las dos muestras combinadas de menor a
mayor y se define el estadístico U como la suma de los rangos de la m.a. Y 1,...,Ym. Se rechaza
Ho si U es grande.
m n
U R (Yi ) T R( X i )
i 1 i 1
N ( N 1)
que verifican U T .
2
Mann y Whitney (1947) consideraron, por analogía con el test del signo, el siguiente
estadístico:
W s (Yi X j )
i, j
Si no hay empates,
m(m 1)
U W
2
1
a) P R(Yi ) k 1 k N
N
1
si k l , i j
P R(Y ) k , R (Y ) l N ( N 1)
i j
0 en caso contrario
N 1 N 2 1 ( N 1)
b) E( R( Yi )) V ( R( Yi )) cov( R( Yi ), R( Y j )) si i j
2 12 12
N 1 N 1 nm
Corolario: E (U ) m E (T ) n E (W )
2 2 2
N 1
V (U ) V (T ) V (W ) n m (2)
12
Métodos No Paramétricos I 83
Elena J. Martínez 2do cuat. 2013
s
m n (d i3 d i )
N 1 i 1
V (U / d 1 ,..., d s ) m n
12 12 N ( N 1)
^ mn N 2 mn( N 1) 2
V (U ) Ri
N ( N 1) i1 4( N 1)
(3)
siendo
R( X i ) 1 i n
Ri
R (Yi n ) n 1 i n m
Volviendo a los tests planteados inicialmente, las zonas de rechazo serán las siguientes:
A. Ho: = 0 vs H1: 0
N ( N 1)
Como U T , los cuantiles superiores pueden obtenerse mediante la relación:
2
N ( N 1)
w1mn wnm . Si n y m son suficientemente grandes o hay empates, se utiliza la
2
aproximación Normal. En este caso, el cuantil aproximado es
m( N 1) ^
wp z p V (U )
2
La expresión del estimador de la varianza de U se reemplaza por (2) si no hay empates o por
(3) si hay empates.
Métodos No Paramétricos I 84
Elena J. Martínez 2do cuat. 2013
si U w
mn
Se rechaza Ho o, si las muestras son grandes o hay empates si
m( N 1) ^
U z V (U ) .
2
si U w1
mn
Se rechaza Ho o, si las muestras son grandes o hay empates si
m( N 1) ^
U z V (U ) .
2
Distribución exacta bajo Ho: Consideremos, a modo de ejemplo, el caso n=m=2 sin empates,
con lo cual los rangos toman valores 1, 2, 3 y 4. En la siguiente tabla se presentan todas las
configuraciones posibles y los correspondientes valores de los estadísticos:
Rangos W U T
1 2 3 4
y y x x 0 3 7
y x y x 1 4 6
y x x y 2 5 5
x y y x 2 5 5
x y x y 3 6 4
x x y y 4 7 3
U 3 4 5 6 7
pU 1/6 1/6 2/6 1/6 1/6
Hay una fórmula recursiva que permite obtener la distribución exacta. (Hettmansperger, pag.
137)
Distribución asintótica bajo Ho: = 0: Supongamos que n y m tienden a infinito, de modo tal
que
m
0 1
nm
Métodos No Paramétricos I 85
Elena J. Martínez 2do cuat. 2013
W E (W ) W
d
N (0,1) W
p
1/ 2
V (W ) nm
U E (U ) T E (T )
d
N (0,1)
d
N (0,1)
V (U ) V (T )
W ( o ) s(Y j X i o ) #{(i, j) / 1 i n, 1 j m, Y j X i 0 }
i, j
ˆ med (Y j X i )
i, j
será un intervalo de confianza de nivel 1 - para , siendo D (1) .... D ( mn ) los estadísticos
de orden de las diferencias Dij Y j X i .
m(m 1)
Como U W , el valor de k se puede obtener, a partir de la tabla del libro de
2
Conover, como
m(m 1)
k wmn/ 2
2
mn 1 ^
k z / 2 V (U )
2 2
Métodos No Paramétricos I 86
Elena J. Martínez 2do cuat. 2013
^
con reemplazada por (3) o (2) según haya o no empates.
V (U )
Ejemplo: En una clase de una escuela de enseñanza superior hay 48 alumnos varones, de los
cuáles 12 viven en el campo y 36 en la ciudad. Se desarrolló un test para determinar la
condición física de los alumnos. Se aplicó este test a los 48 alumnos y se asignó a cada uno
una puntuación. Una puntuación baja indica mala condición física. Los resultados obtenidos
son los siguientes:
Se desea testear
Ho: los alumnos que viven en el campo y los que viven en la ciudad tienen la misma condición
física
H1: los alumnos que viven en el campo tiene mejor condición física que los que viven en la
ciudad.
N 1 49
T n 321 12
2 2 0.6431
mn N
mn ( N 1) 2
12 36 12 36 49 2
N ( N 1) i 1
Ri2
4( N 1) 48 47
38016
4 47
Rechazaríamos Ho a nivel 0.05 si el valor del estadístico fuese mayor que 1.65, entonces, no
rechazamos Ho . El p-valor es 0.26.
campo<-c(14.8,10.6,7.3,12.5,5.6,12.9,6.3,16.1,9.0,11.4,4.2,2.7)
ciudad<-c(12.7,16.9,7.6,2.4,6.2,9.9,14.2,7.9,11.3,6.4,6.1,10.6,12.6,16.0,
8.3,9.1,15.3,14.8,2.1,10.6,6.7,6.7,10.6,5.0,17.7,5.6,3.6,18.6,1.8,2.6,11.8,
5.6,1.0,3.2,5.9,4.0)
wilcox.test(campo,ciudad,alternative="greater",paired=FALSE)
Distribución del estadístico bajo la alternativa: Sean X1,...,Xn e Y1,...,Ym m.a. de dos
distribuciones arbitrarias continuas G(x) y H(y) respectivamente. Recordemos que el estadístico
del test de Mann Whitney es equivalente a
Métodos No Paramétricos I 88
Elena J. Martínez 2do cuat. 2013
W s (Yi X j )
i, j
1 H ( x)
2
p 2 P (Y1 X 1 , Y2 X 1 ) g ( x ) dx
p 3 P (Y1 X 1 , Y1 X 2 ) G
2
( y ) h( y ) dy
Teorema:
E (W ) m n p1
2
E (W 2 ) E Tij E Tij Tkl
i j i j k l
se obtiene
Pero, por ejemplo, E (T11T12 ) P (Y1 X 1 , Y2 X 1 ) p 2 y, operando con los otros términos en
la misma forma, y calculando V (W ) E (W 2 ) E (W ) se obtiene la expresión dada.
2
W E (W )
d
N (0,1)
V (W )
Más precisamente, si W W / mn ,
Métodos No Paramétricos I 89
Elena J. Martínez 2do cuat. 2013
N (W p1 )
d
N (0, ( p 2 p12 ) / ( p 3 p12 ) /(1 ))
Entonces,
1/ 2 si G ( x) H ( x)
(G , H )
1 / 2 si (G, H ) M
y, por lo tanto W provee un test consistente para la clase de alternativas M , en particular para
alternativas de posición, como las planteadas por nosotros.
Eficacia: Puede hacerse una deducción rigurosa de la eficacia, verificando las condiciones de
Pitman, pero daremos sólo su expresión. Consideremos G(x)=F(x) y H(x) = F(x-). Sabemos
que la varianza asintótica es
1
Bajo Ho, (0)
2
. Además,
12 (1 )
( ) p1 1 F ( x ) f ( x)dx ' (0)
2
f ( x ) dx
' (0)
c 12 (1 ) f 2 ( x)dx
(0)
Observemos que la eficacia es (1 ) veces la eficacia del test de Wilcoxon para muestras
apareadas y es máxima cuando 1 / 2 o sea cuando las dos muestras son de igual tamaño.
N (ˆ )
d
N (0,1 / c 2 )
Métodos No Paramétricos I 90
Elena J. Martínez 2do cuat. 2013
Respecto a la eficiencia asintótica relativa del test de Mann-Whitney respecto al test de t, fue
estudiada bajo la hipótesis de que las distribuciones de ambas poblaciones difieren sólo en su
media. Si ambas poblaciones son normales la eficiencia es 0.955, si son uniformes es 1.0 y si
tienen distribución doble exponencial es 1.5. Bajo la hipótesis mencionada sobre las
distribuciones, la eficiencia nunca es inferior a 0.864.
Witting (1960) estudió la eficiencia del test de Mann-Whitney relativa al test de t para dos
muestras independientes pequeñas. Usando aproximaciones numéricas, Witting mostró que
aún para tamaños de muestra pequeños (m=n=10, por ejemplo), la eficiencia, bajo normalidad
nunca era menor que 0.94.
p 3 p12 G
2
(t ) h(t ) dt G (t )h(t )d (t ) 2
Sin embargo, estos estimadores se expresan en forma más simple usando las denominadas
ubicaciones, que definimos a continuación.
i ( x) # j / Y j X i
j ( y ) # i / X i Y j
Entonces, un estimador de 1 p1 H (t ) g (t ) dt es
1 n 1 n 1
H m (t )dGn (t ) n
i 1
Hm (X i )
nm i 1
i ( x) ( x)
m
n
s 2 ( x ) i ( x ) ( x)
2
i 1
s 2 ( y) j ( y) ( y)
m
2
j 1
^
V (W ) (x) ( y) s 2 (x) s 2 ( y)
^ W mn / 2
W
^
V (W )
es un estadístico de rangos. El test rechazará Ho: = 0 a favor de H1: > 0 a nivel cuando
^
W z
.
En la tabla que sigue (Fligner y Policello (1981)) se presentan los niveles empíricos, para un
^
nivel nominal 0.05, basados en 10000 simulaciones para t W , siendo este último el
W ,W , t y
estadístico de Welch. Los tamaños de muestra son n=11 y m=10 y las distribuciones
consideradas son la distribución Normal y la Normal contaminada con = 0.1, con H de la
forma H(t)=G(t/) para diferentes valores de .
Distribución W ^ t tW
W
Normal 0.1 0.081 0.048 0.048 0.048
0.25 0.069 0.054 0.050 0.052
1 0.050 0.048 0.048 0.047
4 0.071 0.054 0.060 0.047
10 0.082 0.062 0.069 0.052
Normal contaminada 0.1 0.076 0.051 0.033 0.034
0.25 0.065 0.052 0.033 0.033
1 0.048 0.046 0.035 0.033
4 0.068 0.052 0.043 0.032
10 0.083 0.063 0.050 0.035
^
Se observa que el test basado en
W es el más estable, superando al test de Welch en el caso
contaminado. Los mismos autores simularon otras distribuciones subyacentes e incluyeron un
^
estudio de la potencia de los tests, concluyendo que el test basado en
W es superior en el
sentido de que conserva su nivel y al mismo tiempo alcanza alta potencia.
Scores generales:
Definición: Sean N=n+m, a(1) .... a(N) una sucesión no constante y definamos
V a R j
m
j 1
m N
E (V ) a(i) m a
N i 1
N
nm
Var (V ) a(i) a 2
N ( N 1) i 1
m N
1
Demostración: E (V ) E (a( R
i 1
j )) mE (a( R1 )) m a( s)
s 1 N
ma.
N
1
E (a ( R1 )) a 2 ( s )
2
s 1 N
a(s) a
2
N
entonces, 1
Var (a ( R1 )) a 2 ( s ) a2 s 1
s 1 N N
Además,
1
cov(a ( R1 ), a ( R 2 )) E ( a ( R1 ) a )(a ( R 2 ) a ) ( a (i ) a )(a ( j ) a )
i j N ( N 1)
N N
1 1
N ( N 1) i 1
( a (i ) a )
j i
( a ( j ) a )
N ( N 1) i 1
(a (i ) a ) 2
Entonces,
m
m(m 1)
Var (V ) Var a ( R j ) m Var (a( R1 )) 2 cov(a( R1 ), a ( R2 ))
j 1 2
m N m(m 1) N m N
(a( s) a ) 2
N s 1
N ( N 1) s 1
( a ( s ) a ) 2
(a(s) a ) 2 N 1 m 1
N ( N 1) s 1
N
mn
N ( N 1) s 1
(a( s) a ) 2
Más aún, puede probarse que si a ( j ) a ( N 1 j ) K (constante) para todo j, entonces bajo
Ho, V tiene distribución simétrica alrededor de m a .
Métodos No Paramétricos I 94
Elena J. Martínez 2do cuat. 2013
Definición: Sea (u), 0 < u < 1, una función no decreciente. Supongamos además que
1 1
0 ( (u) - ) 2 du con (u )du
0 0
i
Si a (i ) , definimos el estadístico generado por la función generadora de scores ,
N 1
como:
a R(Y )
m
1
V j
N j 1
Distribución asintótica bajo Ho: En el caso de una muestra, el estadístico V era asintóticamente
normal y el resultado se obtenía aplicando el TCL. En este caso, V no es suma de v.a.
independientes y es necesario usar el teorema de proyecciones para obtener su distribución
asintótica. Hajek y Sidak (1967) prueban que si min(n, m) , entonces bajo Ho,
V E (V )
d
N (0,1)
Var (V )
n
Supongamos que , 0 1, es decir que ninguno de los tamaños de muestra domina
N
asintóticamente, entonces
m m 1 N
i
E (V )
N
a
N N
N 1 (1 )
i 1
N 1
mn
N Var (V )
N ( N 1) i 1
2
( a(i ) a ) 2 (1 ) ( (u ) ) 2 du
0
y, bajo Ho
V (1 )
N 1/ 2
d
N (0,1)
1
(1 - ) ( (u) - ) du
2
0
1 m Rj
V
N
1
N 1
j 1
1 1
En este caso, (u ) du 0 y (u )
1 2
du 1 . Para probarlo basta hacer el cambio
0 0
de variable 1 (u ) t .
1/ 2
n m N3
Luego si , 1 y bajo Ho, V
d
N (0,1)
N N mn
1 1/2 u 1
(u )
0 0 u 1/2
1 1
(u )du 1 / 2 y (u )
2
Es fácil verificar que du 1 / 4 .
0 0
i 0 1 i r
a (i )
N 1 1 r 1 i N
r m
E (V * ) m a m m
N 2
1
mn
Var (V * ) a( s ) a 2 mn mn ( (u ) ) 2 du
N ( N 1) 4( N 1) N 1 0
Métodos No Paramétricos I 96
Elena J. Martínez 2do cuat. 2013
V*
Por lo tanto, si denotamos V * ,
N
1
V *
N 2
d
N (0,1)
(1 )
4
3) ¿Cómo construir scores para el problema de dos muestras a partir de los de una
muestra?: Sea (u ), 0 u 1 , una función generadora de scores para el problema de
una muestra y el correspondiente estadístico
1 n Rj
V
n 1 s( X j )
n j 1
(u ) (u ) si u (0,1)
Sea
(u ) (2u 1) si 0 u 1
(1 2u ) 0 u 1/ 2
(u )
(2u 1) 1/2 u 1
1 m R (Y j )
Se define el estadístico para el test de dos muestras en la forma V
N
N 1 .
j 1
1 1
En este caso, 0 y 2
( (u) ) du (v) dv y se puede demostrar que la eficacia
2
0 0
del test correspondiente a es (1 ) veces la del test para una muestra generado por
.
Métodos No Paramétricos I 97
Elena J. Martínez 2do cuat. 2013
1 u 1
3.3) Si (u )
, 0 u 1 , el estadístico V es el correspondiente al test de scores
2
normales. La función generadora (u ) 1 (u ) produce el test de scores normales de Van
der Waerden para dos muestras.
Eficiencia de scores generales: La eficacia del test de dos muestras generado por la función
u 1
de scores es la del test de una muestra generado por (u )
multiplicada por
2
(1 ) y por lo tanto se preservan las eficiencias relativas.