Muestreo de Redes
Muestreo de Redes
Muestreo de Redes
INTRODUCCIÓN
El diseño de muestreo de la red se utilizó por primera vez no para au-
mentar la eficiencia, sino porque surgió inevitablemente en la situación de
muestreo (un paciente que tiene registros en más de un centro médico). Do-
cumentos posteriores sobre el tema reconocieron su potencial para dar es-
timaciones de varianza más bajas que los procedimientos convencionales y
para aumentar el rendimiento”de la encuesta; es decir, el número total de
personas en la muestra con la enfermedad u otra caracterı́stica.
1
parten un casa). Si la población de unidades de selección está estratificada,
una red también puede intersectar más de un estrato.
ESTRATIFICACIÓN EN EL MUESTREO DE
RED
Cuando las unidades de selección de la población están estratificadas,
surge una complicación porque una unidad de observación dada puede estar
vinculada a unidades de selección en más de un estrato. Luego, las obser-
vaciones en diferentes estratos no son independientes como en el muestreo
estratificado convencional.
2
estratos L, con unidades de selección Mh en el estrato h, y suponga que se se-
lecciona una muestra aleatoria estratificada con un tamaño de muestra nh en
el estrato h, para h = 1, . . . , L. Para cada unidad de selección en la muestra,
todas las unidades de observación vinculadas a ella, independientemente de
en qué estratos se encuentren, se incluyen en la muestra. Sea Ahj el conjunto
de unidades de observación vinculado a la j−ésima unidad de selección en
el estrato h. Para la i−ésima unidad de observación, sea mi el número de
unidades de selección, que pueden ser de más de un estrato, a las que está
vinculado. Para la j−ésima unidad de selección P en el estrato h, una nue-
va variable de interés whj se define por whj = i∈Ahj yi /mi . Defina la media
muestral de las variables w en el estrato h para que sea w̄h = (1/nh ) nj=1
P h
whj
El estimador de multiplicidad estratificado (Birnbaum y Sirken 1965)
tiene la forma
L
X
t̂m = Mh w̄h (1)
h=1
L
X Mh (Mh − nh ) 2
V (t̂m ) = σwh (2)
h=1
nh
2
en el que σwh es la varianza de población finita de los valores de w dentro del
estrato h. Se obtiene una estimación insezgado de esta varianza reemplazando
2
σwh con s2wh , la varianza muestral de los valores de w dentro del estrato h.
Tenga en cuenta que mientras t̂m es insesgado para el total de la población
total t, un término individual Mh w̄h no es en general insezgado para un total
de población relevante dentro del estrato h. Esto se debe a que w̄h puede ba-
sarse en parte en los valores y de las unidades de observación asociadas con
estratos distintos de h. Por ejemplo, si las unidades de selección son hogares,
que están estratificados por región geográfica, y las unidades de observación
son personas vinculadas por relaciones entre hermanos, la selección de un
hogar en un estrato puede generar informes sobre hermanos en uno o más
estratos. Los valores y para cada uno de estos hermanos se combinan en el
valor whj para ese hogar.
3
valor y puede variar dependiendo del estrato en el que se realiza la selección
a la que está vinculado. Para evitar esta dependencia aparentemente arbitra-
ria del estrato a través del cual se informa una observación dada, se puede
considerar un estimador alternativo. En el Estimador de Hansen-Hurwitz,
cada valor de y se divide por el número esperado de veces que se selecciona
bajo el diseño. Sea mhi el número de unidades de selección en el estrato h al
que está vinculada la i−ésima unidad de observación. Sea zhi el número de
unidades de selección en la muestra vinculadas a la unidad de observación i.
La variable aleatoria zhi tiene una distribución hipergeométrica con el valor
esperado nh mi /Mh . El número total de veces que se selecciona la unidad de
observación i es la suma, sobre los estratos L, de zhi . P
El número esperado de
veces que se selecciona la unidad de observación i es Lh=1 nh mi /Mh .
0 nh X yi
whj = PL
Mh i∈A h=1 nh mi /Mh
j
0
y sea w̄hj la media muestral de los valores w dentro del estrato h. Un
estimador insesgado de t es
L
X
t̂p = mh wh0
h=1
4
Con estas probabilidades de inclusión, se mantienen las fórmulas habi-
tuales de Horvitz-Thompson.