Tema 1
Tema 1
Tema 1
Muestreo
1.- Introducción
La investigación por encuestas consiste en establecer reglas que permitan acceder de forma
científica a lo que las personas opinan (León y Montero, 1993). Con esta metodología se
presentan cuestiones a un conjunto de individuos, de los que se presume que son
representativos de su grupo de referencia, para conocer sus actitudes con respecto al tema o
temas objeto de estudio. Por tanto, una encuesta no es más que un proceso de recogida de
información. No obstante, como dicha recogida de datos conforma una investigación, debe
ajustarse a una sistemática que garantice la objetividad de los datos recogidos.
A modo de resumen, se puede decir que la utilización de una muestra frente a la población
total será adecuada en relación a la razón coste / beneficio. Es evidente que si la población
es muy pequeña, puede no merecer la pena extraer una muestra de ella. Otra razón que hace
poco conveniente la utilización de muestra, es en el caso en que la población sea
excesivamente heterogénea; de ser así, la elección de una muestra representativa será muy
problemática, con lo cual los resultados obtenidos serán, cuanto menos, cuestionables.
La investigación mediante encuestas se plantea para objetivos de investigación diversos,
entre los que se encuentran estudios sobre grupos y organizaciones, cultura y socialización,
estructura social, población y familia, medio ambiente, economía y trabajo, política,
problemas y servicios sociales, y un largo etcétera. Es sin lugar a dudas el método de
investigación más difundido, lo que justifica que los métodos y técnicas de encuestación
sean un contenido frecuente en multitud de planes de estudio universitarios y no
universitarios.
Hemos comentado que la investigación por encuestas proporciona una forma sistemática de
obtener datos sobre cierta característica de interés. Pues bien, a continuación expondremos
los pasos que secuencialmente habremos de seguir desde la concepción hasta la publicación
de los resultados de una encuesta. Éstos son:
Diseño teórico, en el que se tendrá en cuenta:
o El análisis del problema o definición de los objetivos de la investigación.
o Ámbito de la investigación: población estudiada, periodo de tiempo del
estudio y zona geográfica en que se desenvuelve, entre otros aspectos.
o Definición de las unidades básicas de las que se obtiene la información:
hogares, empresas, personas, etc.
o Delimitación de las características objeto de estudio: p.e. ingresos, opiniones
políticas, preferencias, dolencias físicas, etc.
o Características generales del cuestionario: extensión, necesidad de pretest.
o Procedimiento de muestreo: tipo de éste y tamaño de la muestra a
considerar.
Por último, también a nivel teórico es conveniente fijar la metodología de recogida,
depuración y tratamiento estadístico de la información. También es importante saber si
hay encuestas previas igual a la que vamos a realizar.
Depuración de datos: en la que se pretende por una parte, mejorar la calidad de los
datos (corrigiendo errores, detectando valores anómalos, etc) y por otra, evaluar la
calidad de los datos, con el objeto de asegurar que la toma de éstos o el
procedimiento de muestreo ha sido adecuado.
Análisis estadístico primario. Por éste entendemos la obtención de tablas del plan de
explotación, estadísticas descriptivas de variables simples, regresiones simples, un
análisis exploratorio de datos que muestre la necesidad de transformación de
variables, etc.
Análisis estadístico secundario: en el que tendrán su lugar las técnicas habituales del
Análisis Multivariante (bien clásico, bien de datos), así como análisis más
particulares como modelos log-lineales, métodos de reducción de la dimensión,
modelos dinámicos como series temporales, etc.
Interpretación, presentación y publicación de los resultados: cuyo aspecto más
importante es la presentación del informe de resultados junto con las tablas y
gráficos obtenidos, si bien éstas últimas, si se desea, se pueden presentar en un
apéndice propio.
Una vez realizadas estas fases, la información obtenida en su conjunto debe ser almacenada
en bases de datos para facilitar su posterior reexplotación y/o tratamiento. Esta acción, que
se puede obviar en encuestas de propósito reducido, es ineludible en otro tipo de encuestas
específicas como son los paneles (de la investigación sociológica y comercial), y en otras
que en su metodología tengan implícitos análisis estadísticos dinámicos.
4.- Muestreo
En la investigación mediante encuestas es preciso tomar decisiones en diversas etapas.
Henry (1990) habla de tres tipos de decisiones: previas al muestreo, decisiones de muestreo
y decisiones posteriores.
Las decisiones pre-muestreo se encuadran en algunas de las fases descritas
anteriormente, sobre todo en la fase de diseño teórico.
Las decisiones de muestreo se refieren a:
o El listado de la población a utilizar.
o El error tolerable o tamaño del efecto esperado.
o El tipo de técnica de muestreo a utilizar.
o Determinar si la probabilidad de selección de sujetos es igual o no.
o Evaluar el tamaño de la muestra.
En cuanto a las decisiones post-muestreo, tendremos que observar:
o Cómo evaluar la ausencia de respuesta.
o Necesidad de reponderación.
o Estimación de errores típicos e intervalos de confianza.
En resumen, podríamos señalar tres objetivos básicos que se deben cubrir en un buen
diseño cuando se lleva a cabo una investigación mediante encuestas: elegir adecuadamente
a los sujetos a encuestar, seleccionar las preguntas para la elaboración de un cuestionario
acorde con los fines para abordar el problema planteado en la investigación y, finalmente,
organizar las preguntas para su análisis.
Población: conjunto de unidades del que se desea obtener cierta información. Las
unidades pueden ser personas, viviendas, escuelas, etc. y la información deseada, el
consumo medio por familia, número de personas en paro, numero medio de
escolares por aula, etc.
El segundo tipo se puede definir como aquel en el que no hay forma de estimar la
probabilidad de que cada elemento sea incluido en la muestra, ya que no se garantiza que
cualquier individuo de la muestra tenga alguna probabilidad conocida de ser incluido en la
misma. Hay muchos procedimientos de selección no aleatoria de unidades muestrales, que
difieren en cuanto a la precisión de los datos que aportan. No obstante, como característica
general en todos los casos, al no ser muestras representativas, no se pueden generalizar los
resultados a la población. La selección de los sujetos se puede realizar sin seguir ninguna
norma, como en el caso de las muestras de conveniencia, o bien es el investigador quien
determina la forma de elección de los sujetos y la composición muestral, en las
denominadas muestras a propósito.
Los tipos de muestreo probabilístico usados más frecuentemente son: muestreo aleatorio
simple, muestreo estratificado y muestreo por conglomerados.
En cuanto a la calidad del marco, podemos distinguir tres tipos. El marco ideal es el marco
perfecto, esto es, aquel donde cada elemento ocurre una sola vez, no aparecen unidades
muestrales que no pertenezcan a la población que se desee estudiar y la información
suministrada es correcta. Sin embargo, tal tipo de marcos no son demasiados comunes. Una
segunda categoría corresponde a los marcos útiles, en los cuales se debe poder calcular la
probabilidad de seleccionar las unidades muestrales. Tal probabilidad debe ser distinta de
cero. Por último, estarían los marcos imperfectos, en los que aparecen cuestiones tales
como unidades extrañas, incorrecciones, duplicaciones, etc.
Como hemos dicho, los marcos para seleccionar a los sujetos pueden ser listas o censos de
los mismos. La selección basada en listas presentan la ventaja de que permiten un gran
margen de selección. Además, la existencia de un listado posibilita la realización de
encuestas por correo. No obstante, como mayor desventaja cabe destacar que suelen
contener grandes errores.
- Faltas de cobertura:
o Inadecuado: no intenta incluir a toda la población.
o Incompleto: no incluye algunos elementos que se supone debería incluir.
Como solución podemos considerar el uso de marcos complementarios, eliminando
duplicaciones o procedimientos enlazados, ligando los elementos que faltan a
listados especificados de forma claramente definida.
- Duplicaciones o repeticiones, cuando los elementos son listados más de una vez.
Puesto que los elementos duplicados tienen mayor probabilidad de ser
seleccionados, habremos de hacer un esfuerzo previo para eliminarlos del marco.
Para diseños más complejos, se recomienda la lectura del citado libro de Sánchez-Crespo o
la monografía de Pascual et al. “Tamaño de Muestra y Precisión Estadística” del Servicio
de Publicaciones de la Universidad de Almería.
Denotando por:
- n = tamaño de la muestra.
- N = tamaño de la población.
- 1-α = el nivel de confianza elegido.
- z1 = el valor de z (con z una variable N(0,1)), que deja fuera del intervalo ±
z1 una proporción α de los individuos.
- p = proporción en que la variable estudiada se da en la población.
- q = 1 - p.
- e = error de la estimación.
z1
2
pqN
n , siempre que: np ≥ 5 y nq ≥ 5
e2 (N 1) z12 pq
En este caso de poblaciones finitas, con mismas condiciones establecidas para el caso
anterior, los tamaños muestrales son:
NOTA: Los espacios que quedan en blanco del cuadro anterior, proporcionan valores
superiores a la mitad de la población. Cuando esto ocurre lo más aconsejable es tomar toda
la población directamente, a no ser que existan razones de otra índole que aconsejen no
trabajar con su totalidad.
En la aplicación de las fórmulas para el cálculo del tamaño de la muestra suele presentarse
el problema de determinar el valor de p. Esta dificultad se puede solventar de una de las
siguientes formas: