Tipos de Muestreo
Tipos de Muestreo
Tipos de Muestreo
Las técnicas de muestreo son un conjunto de técnicas estadísticas que estudian la forma de
seleccionar una muestra representativa de la población, es decir, que represente lo más
fielmente posible a la población a la que se pretende extrapolar o inferir los resultados de la
investigación, asumiendo un error mesurable y determinado.
Cuando queremos estudiar alguna característica de una población para obtener el máximo
de información veraz, se nos plantea un problema relacionado con la elección de los
individuos. Puesto que no podemos estudiar a toda la población por varias razones (proceso
largo y coste elevado, entre otros), debemos elegir estudiar una muestra que sea
representativa y que nos permita extrapolar los resultados que obtengamos a la población
de referencia.
Sin embargo, debemos considerar que el empleo de técnicas de muestreo implica una serie
de ventajas y limitaciones.
Por otra parte, entre las limitaciones de las técnicas de muestreo se incluyen los
errores que se pueden cometer, como son el error aleatorio y el error sistemático o
sesgo, de todo esto hablaremos más adelante.
MUESTREO
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los
elementos de una población), se selecciona una muestra, entendiendo por tal una parte
representativa de la población.
1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte de
la Población, se denomina error de muestreo.
2.- Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomó la muestra. Error de Inferencia. En la estadística se usa la
palabra población para referirse no sólo a personas sino a todos los elementos que
han sido escogidos para su estudio y el término muestra se usa para describir una
porción escogida de la población.
En este método cada posible muestra que pertenece a una población, tiene la misma
probabilidad de ser elegida como parte del tamaño de la muestra final necesaria para el
experimento. El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que
todos los elementos que forman el universo y que, por lo tanto, están descritos en el marco
muestral, tienen idéntica probabilidad de ser seleccionados para la muestra. Sería algo así
como hacer un sorteo justo entre los individuos del universo: asignamos a cada persona un
boleto con un número correlativo, introducimos los números en una urna y empezamos a
extraer al azar boletos. Todos los individuos que tengan un número extraído de la urna
formarían la muestra. Obviamente, en la práctica estos métodos pueden automatizarse
mediante el uso de ordenadores.
Dependiendo de si los individuos del universo pueden ser seleccionados más de una vez en
la muestra, hablaremos de M.A.S. con reposición o sin reposición. Si usamos reposición, el
hecho de que seleccione un individuo al azar para mi muestra no impediría que este mismo
individuo pudiese volver a ser seleccionado en una siguiente selección. Sería equivalente a
decir que cada vez que extraigo un número al azar de mi urna, vuelvo a colocar el número
antes de la siguiente extracción. Si por el contrario no usamos reposición, un individuo
seleccionado para la muestra una vez ya no entraría nuevamente en el sorteo.
La pregunta obvia es, ¿qué es mejor, usar reposición o no usar reposición? Es un simple
problema matemático. César Pérez López, en su libro "Muestreo Estadístico" (Pearson,
2005) desarrolla de forma muy clara una comparación entre ambas técnicas. Tanto si lo
miramos desde el punto de vista de qué técnica genera estimaciones más precisas como
desde el punto de vista de qué técnica me permite tener la misma precisión con menor
tamaño de muestra, se puede concluir que el muestreo aleatorio simple sin reposición
siempre es más eficiente.
La característica que tiene de que cada individuo tenga la misma probabilidad de ser
elegido la hace más justa
Tamaño de la muestra para estimar una Tamaño de la muestra para estimar una
proporción población finita
Datos: 𝑍 2 𝑝(1 − 𝑝)
𝑛=
p = 0.5 𝑒2
e = 0.02
Solución:
La muestra para realizar el estudio debe ser de 1.691 personas con una confianza del 90%
Este método se usa cuando se desconoce el tamaño de la población.
1.962 0.82(1−0.82)25000
𝑛 = 0.22 (25000−1)+1.9620.82(1−0.82) = 14,1674
La muestra para realizar un estudio con un nivel de significancia del 95% debe ser de 14
artículos para una población de 25000 con un error del 20%.
Muestreo sistemático
También se sigue utilizando para seleccionar individuos a lo largo del tiempo. Por ejemplo,
para estudiar la satisfacción de un servicio, podemos elegir sistemáticamente encuestar a 1
de cada n clientes que nos visitan. En estas circunstancias, en las que puede existir diferente
varianza entre individuos en diferentes periodos de tiempo, el muestreo sistemático puede
ser incluso más preciso que el muestreo aleatorio puro.
Es una técnica dentro de la categoría de muestreos probabilísticos - y que por lo tanto
requiere tener un control preciso del marco muestral de individuos seleccionables junto con
la probabilidad de que sean seleccionados - consistente en escoger un individuo inicial de
forma aleatoria entre la población y, a continuación, seleccionar para la muestra a cada
enésimo individuo disponible en el marco muestral.
𝑵
𝒌=
𝒏
Los elementos antes que nada se deben ordenar y así crear un marco muestral; este se
representa con: N. Esto lo dividimos sobre el numero de la muestra que deseamos que, se
representa con: n. Por otro lado, k sería el intervalo de elección a cumplir en el marco
muestral.
𝟔𝟎
𝒌= =𝟓
𝟏𝟐
Ahora elegimos al azar un número entre 1 y k=5. Suponemos que nos sale i=2. La muestra
resultado mediante el muestreo sistemático será:
¿Bajo qué condición se debería usar el muestreo sistemático?
Muestreo estratificado
Los estratos suelen ser grupos homogéneos de individuos, que a su vez son heterogéneos
entre diferentes grupos. Por ejemplo, si en un estudio esperamos encontrar un
comportamiento muy diferente entre hombres y mujeres, puede ser conveniente definir dos
estratos, uno por cada sexo. Si la selección de estos estratos es correcta (1) los hombres
deberían comportarse de forma parecida entre ellos, (2) las mujeres deberían comportarse
de forma muy similar entre ellas y (3) hombres y mujeres deberían mostrar
comportamientos dispares entre sí.
Capacidad para estimar no sólo los parámetros de población, sino también para
hacer inferencia dentro de cada estrato y las comparaciones entre los estratos. Datos
suficientes sobre subgrupos de interés quizá no puedan ser capturados en el
muestreo aleatorio simple. Las muestras estratificadas producen pequeños errores de
muestreo al azar que los que son obtenidos con una muestra aleatoria simple del
mismo tamaño de la muestra. Un muestreo estratificado dará lugar a una muestra
que es al menos tan precisa como una muestra aleatoria simple del mismo tamaño
de la muestra.
Suponemos que hay k estratos de tamaños N1, N2…, Nk, de forma que:
𝑵 = 𝑵𝟏 + 𝑵𝟐 + 𝑵𝟑 + 𝑵𝟒 … 𝑵𝒌
En cada estrato se toman n1, n2…, nk elementos para la muestra, de manera que se toman
en total n individuos, es decir:
𝒏 = 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑 + 𝒏𝟒 … 𝒏𝒌
Se tomará una muestra que sea representativa del conjunto de la población. El número de
individuos que se eligen de cada estrato se puede decidir mediante diversos criterios:
Elección simple: se toman el mismo número de sujetos de cada uno de los k estratos. De
cada estrato se seleccionarían n/k individuos. Este criterio no es recomendable cuando los
estratos tienen diferente número de individuos.
Elección proporcional al tamaño del estrato: el tamaño de la muestra en cada grupo es
proporcional a los elementos de dicho grupo. En cada estrato se tomarán ni elementos,
calculados mediante la fórmula:
𝑁𝑖
𝑛𝑖 = 𝑛 ∙
𝑁
N = Elementos de la población
𝑁𝑖 = Elementos del estrato i
n = Elementos de la muestra
Elección proporcional a la variabilidad del estrato: si se conoce la variabilidad de la
característica que estamos tomando en cuenta en cada estrato, se toman los sujetos
proporcionalmente a ella en cada grupo. En los grupos donde la varianza es mayor, se
toman, por tanto, más sujetos.
𝜎𝑖 𝑁𝑖
𝑛𝑖= 𝑘
∑𝐽=1 𝜎𝑗 𝑁𝑗
Esta técnica favorece los estratos que tienen menos peso en la población, equiparándolos en
importancia a los estratos más relevantes. Globalmente, reduce la eficiencia de nuestra
muestra (menor precisión en los resultados), pero como contrapartida permite estudiar
características particulares de cada estrato con mayor precisión. En nuestro ejemplo, si
queremos emitir alguna afirmación específica sobre la población del estrato 3 (mayores de
44 años), podremos hacerlo con menor nivel de error muestral si empleamos una muestra
de 333 unidades que si lo hacemos con una muestra de 227 (como ocurría en el muestreo
estratificado proporcional).
Se utiliza el muestreo estratificado cuando los grupos o estratos son muy homogéneos
internamente y diferentes entre ellos. Si los grupos son muy heterogéneos y no existen
muchas diferencias entre ellos, es recomendable utilizar el muestreo por conglomerados.
El muestreo por conglomerados nos ayuda cuando es imposible o poco práctico crear un
marco de muestreo de una población objetivo debido a que está muy dispersa
geográficamente y el costo de la recopilación de datos es relativamente alto.
1
̅ = 𝑛 ∑𝑛𝑖=1 𝑚𝑖 = tamaño medio de los conglomerados de la muestra
𝑚
𝑛 = Conglomerados en la muestra
𝑚𝑖 = Elementos en los conglomerados
𝑚 = Elementos en la muestra
𝑦𝑖 = Suma de las observaciones en el conglomerado
𝒎𝒊 𝒚𝒊 𝒎𝟐𝒊 𝒚𝟐𝒊 𝒎 𝒊 𝒚𝒊
8 2 64 4 16
7 2 49 4 14
9 3 81 9 27
6 3 36 9 18
5 3 25 9 15
35 13 255 35 90
𝑛
1 ∑𝑛𝑖=1 𝑦𝑖
𝜇̅ = 𝑦̅ = ∑ 𝑦𝑖 = 𝑛
𝑚 ∑𝑖=1 𝑚𝑖
𝑖=1
𝑛
1 ∑𝑛𝑖=1 𝑎𝑖
𝑝̅ = 𝑦̅ = ∑ 𝑦𝑖 = 𝑛
𝑚 ∑𝑖=1 𝑚𝑖
𝑖=1
𝑛 𝑛 𝑛 𝑛
1 3,3222
𝑆12 = 𝑛−1 ∑𝑛𝐼=1 (𝑦𝑖 − 𝑦̅𝑚𝑖 )2 = = 0,8306
4
1 35
̅ = 𝑛 ∑𝑛𝑖=1 𝑚𝑖 =
𝑚 = 7 ℎ𝑜𝑔𝑎𝑟𝑒𝑠 𝑝𝑜𝑟 𝑚𝑎𝑛𝑧𝑎𝑛𝑎
5
¿Bajo qué condición se debería usar el muestreo por conglomerados?
Se utiliza el muestreo por conglomerados cuando los grupos son muy heterogéneos y no
existen muchas diferencias entre conglomerados. Se utiliza el muestreo estratificado
cuando los grupos o estratos son muy homogéneos internamente y diferentes entre ellos.
MUESTREO NO PROBALISTICO
2. El investigador elige las cuotas (número de sujetos) n1, n2,…, nk que se van a tomar de
cada grupo, siendo su suma el total de elementos n de la muestra:
Las cuotas se
pueden decidir a
criterio lógico del
investigador o mediante criterios adaptados a la muestra.
3. Se eligen los elementos en cada estrato o grupo por métodos no probabilísticos. Por
ejemplo, podríamos elegir los elementos de la muestra de nuestra ciudad porque
resulta más cómodo, o de un grupo de voluntarios, etc.
¿BAJO QUÉ CONDICIÓN SE DEBERÍA USAR EL MUESTREO POR CUOTAS?
El muestreo por cuotas se utiliza cuando se tienen datos adicionales de los individuos
(edad, sexo, etc.) y se pueden utilizar ya que el investigador considera que estos datos
pueden influenciar en las características que se estudian.
1. El análisis por estratos permite un posterior análisis de las diferencias entre grupos.
Criterios de elección de las cuotas
Las cuotas de los grupos se pueden elegir a criterio del investigador o mediante
criterios estadísticos. Veamos tres criterios estadísticos:
1. Elección simple: Las cuotas serán las mismas en los k estratos. De cada estrato se
seleccionarían n/k individuos. Este criterio no es recomendable cuando los estratos
tienen diferente número de individuos.
2. Un hospital desea hacer un estudio para testar la eficacia de su nueva vacuna contra la
gripe que acaba de patentar un laboratorio farmacéutico. Realizan el estudio sobre
sus pacientes por que así al hospital le supone menos costes económicos.
1. El método del muestreo por conveniencia permite seleccionar una muestra con
muchísima facilidad. Suele utilizarse en estudios iniciales para comprobar si se
cumplen las hipótesis que se plantea el investigador. Una vez realizado el estudio, si se
comprueba que los resultados son favorables a sus predicciones, ya se puede plantear
la posibilidad de hacer el estudio con muestras probabilísticas para generalizar el
resultado.
Se llama muestreo de bola de nieve porque cada sujeto estudiado propone a otros,
produciendo un efecto acumulativo parecido al de la bola de nieve.
EJEMPLOS
El investigador depende mucho de la información que pueda obtener de los sujetos que
estudia, y podría darse el caso de que se quede con muy pocos individuos en
la muestra.
Muestreo casual
EJEMPLOS
Una productora desea saber la opinión general de la población de una ciudad respecto
a su última película. Para ello desplaza a los cines de la ciudad a un equipo de
entrevistadores para preguntar directamente a la gente que sale de la sala si les gustó su
película.
¿BAJO QUÉ CONDICIÓN SE DEBERÍA USAR EL MUESTREO CASUAL O
ACCIDENTAL?
Muestreo discrecional
Sin embargo, desde nuestra perspectiva, estos métodos estadísticos no son completamente
fiables por factores externos que condicionan su naturaleza, por ejemplo: la característica
de no poder cubrir por completo una población por cuestiones de costos o tiempo, son
sinsabores que puede dejar un espacio a la duda. No obstante, la estadística ha demostrado,
a pesar de limitaciones externas, ser eficaz en la mayoría de las ocasiones. Además, la
tecnología ha ayudado a que cada vez la duda sobre su efectividad sea menor.
Bibliografía