3.2.4. Muestreo Por Conglomerados Monoetápico
3.2.4. Muestreo Por Conglomerados Monoetápico
3.2.4. Muestreo Por Conglomerados Monoetápico
Una solución a este problema sería la selección de una muestra por conglomerados
monoetápica: se trata de dividir la población en cierto número de partes o
conglomerados, que se consideran como UPE, e incluir en la muestra a todas las
unidades de análisis pertenecientes a los conglomerados que se elijan.
Este procedimiento también puede aplicarse en dos posibles situaciones. Estas son:
a) Cuando se cuenta con un archivo que contiene una base de datos donde cada uno
de sus registros corresponde a una unidad de análisis (marco muestral detallado)
de la que se conoce a qué UPE o conglomerado pertenece.
b) Cuando sólo se tienen identificados los conglomerados y sus tamaños; en este caso
se puede teclear la información (número de conglomerados y tamaños)
manualmente, o leer esta información de un archivo, el cual ha de contener tantos
registros como conglomerados, con una variable que identifique el conglomerado y
otra que contenga su tamaño (número de unidades de que consta).
En el caso de que se lea un archivo de datos agregados, hay que indicar además la
variable que identifica el tamaño de los conglomerados, es decir, el número de
unidades de análisis que contiene cada unote éstos. En caso de tener un marco muestral
completo en la base de datos, esta información no es necesaria, pues Epidat 4 se ocupa
de “contar” el número de sujetos en cada UPE.
Nota: Debe advertirse que, al examinar la base de datos, el sistema
considera como pertenecientes a un mismo conglomerado a todos aquellos
registros que tengan un mismo código en el campo que identifica al
conglomerado. Esto quiere decir, por ejemplo, que todos los registros para
los cuales la variable correspondiente al conglomerado tenga el código 3,
serán considerados como integrantes del tercer conglomerado de la
población. Si la base de datos estuviera conformada de manera tal que se
emplea un mismo número para identificar a conglomerados diferentes
debido, por ejemplo, a que éstos pertenecen a zonas diferentes o a distintas
unidades de muestreo de mayor jerarquía, el sistema “entenderá”
indebidamente que se trata de registros de un mismo conglomerado.
Consecuentemente, para evitar esta posible dificultad, es conveniente
atribuir siempre un código diferente a cada conglomerado de la población.
Por ejemplo, si se tuviera dos manzanas, una con 42 y otra con 23 viviendas
(siendo éstas los conglomerados), en el campo correspondiente a estos
últimos podrían usarse 65 números diferentes para identificarlos (por
ejemplo, los números del 1 al 65) en lugar de emplear los números 1, 2, ...,
42 para la primera manzana y 1, 2, ..., 23 para la segunda.
Se comunicará además el Tamaño de muestra: Valor entero mayor que cero y menor que
el tamaño poblacional (si los datos son agrupados, el tamaño poblacional no es el
número de registros de la base, sino la suma de la variable que contiene los tamaños de
los conglomerados). Indica el número de unidades de análisis que aproximadamente se
tomarán de la población para integrar la muestra. El programa selecciona el número de
conglomerados necesarios para alcanzar aproximadamente dicho tamaño.
Alternativamente, puede solicitarse que el programa seleccione un número de
conglomerados fijo en lugar de un número de unidades de análisis.
Ejemplo
Supóngase que se quiere obtener una muestra de aproximadamente 120 estudiantes de
un instituto de Enseñanza Media que tiene 966 alumnos registrados y que los alumnos
están distribuidos en 21 aulas de tamaños variables y conocidos, tal y como se describió
al final del apartado 3.2.0.
La hoja MC del archivo INSTITUTO.xls contiene la lista de las 21 aulas y los tamaños
de ellas. Nótese que el campo que contiene los conglomerados no tiene que ser
numérico (en este archivo, el campo se llama AULA, estos están identificados por los
códigos que señalan de qué aula se trata dentro de cada curso). Se teclea el tamaño
muestral deseado (120 en este caso) y Epidat 4 aplica un muestreo simple aleatorio para
seleccionar 3 de los 21 grupos. Este número es el resultado de dividir el tamaño de la
muestra (120) por el número medio de unidades de análisis de las UPE (966/21=46) y
luego “redondear”: 120/46=2,63. Epidat 4 siempre tomará el entero más pequeño que
supere o iguale a esa razón (en el ejemplo previo el menor número entero mayor que
2,6 es 3).