DistribucionesMuestrales19Enero2018 PDF
DistribucionesMuestrales19Enero2018 PDF
DistribucionesMuestrales19Enero2018 PDF
Confiabilidad
Cantidad de
Plan muestral o bondad de
información
la inferencia
Condición
necesaria pero no
suficiente para
asegurar la
representatividad de
una nuestra
Azar como La distribución de
elemento apropiado frecuencia de las
para la selección de variables será igual
los elementos de la en la población y en
muestra la muestra
Selección
aleatoria
Muestreo Aleatorio
Cualquiera que sea el método de recolección de
datos, un requisito fundamental en la obtención
de información que pueda ser utilizada en la
inferencia estadística es la aleatoriedad.
No
Probabilístico
probabilístico
Todos los elementos tienen
Presencia el juicio personal
una probabilidad conocida
del muestrista en la
y distinta de cero de ser
selección de los elementos
parte de una muestra
Muestreos No Probabilísticos
Estudios Pilotos
Estudios Cualitativos
Investigaciones en poblaciones de difícil
registro o localización
Ej. Prostitutas, enfermos de VIH
Muestreos No Probabilísticos
Requiere
Autoponderado
ponderación
Algunos elementos
Todos los elementos
tienen distinta
tienen la misma
probabilidad de
probabilidad de ser
ser parte de la
parte de la muestra
muestra
Muestreo Probabilístico
1). Muestreo Aleatorio Simple.
En el muestreo aleatorio simple ninguna
restricción se impone en la selección aleatoria
de elementos desde la población a la muestra.
Todos los elementos de la población tienen la
misma posibilidad de pertenecer a la muestra.
Para el muestreo aleatorio simple se
recomienda el uso de una tabla de números
aleatorios o un generador de números
aleatorios por computadora.
Por ejemplo:
supongamos que se desea seleccionar una muestra de
tamaño n = 2 de una población que contiene N = 4 objetos. Si
los cuatro objetos están identificados por los símbolos x1, x2,
x3 y x4, ¿Cuántos pares distintos que podrían
seleccionarse?.
Muestra Observaciones en
la muestra
1 X1 , X2
2 X1 , X3
3 X1 , X4
4 X2 , X3
5 X2 , X4
6 X3 , X4
1 2 3 4 5 6 7 8 9 10
Método nuevo 9, 4, 8, 2, 7
Método estándar 1, 3, 5, 6, 10
2). Muestreo Aleatorio Estratificado.
Población
Muestra
3). Muestreo Aleatorio por Conglomerados
(Clusters)
En el muestreo por conglomerados, los
elementos de la población son agrupados de
acuerdo con la “cercanía” de unos a otros.
Una vez que los grupos (clusters) han sido
formados, se selecciona una muestra aleatoria
simple de grupos.
Todos los elementos en un grupo seleccionado
forman parte de la muestra.
Ejemplo
Centros de salud
Opinión de los médicos
del Sist. Nal. de Salud Estados
Regiones
• Recursos económicos
• Heterogeneidad de la
Objetivas población
• Procedimientos de análisis
• Tamaño de la población
Tamaño de la muestra
El principio general que justifica trabajar con muestras es
que resulta más barato, más rápido y más fácil que hacerlo
con poblaciones completas
El número de entrevistados
Éticos
necesarios para contestar
adecuadamente las
preguntas
Coeficiente de
/2 Z/2
confianza (1-)
σ2 σ2 σ2 σ2
Z Z Z t
Ejemplo:
Para vigilar los contaminantes químicos en alimentos se seleccionó
una muestra aleatoria de 50 adultos hombres. Se encontró que el
promedio de ingesta diaria de productos lácteos fue de 756 gramos
por día, con una desviación estándar de 35 gramos por día. Use
esta información muestral para construir un intervalo de confianza
de 95% para la ingesta diaria media de productos lácteos para
hombres.
n= 50
x= 756
s= 35
z= 95
1.96
756 ± 9.70
LSC 765.70
LIC 746.30
El intervalo de confianza de 95% es de 765.702 a 746.298
Interpretación del intervalo
de confianza
¿Qué significa decir que
estamos “95% ciertos” que el
valor real de la media
poblacional está dentro de un
intervalo determinado? Si
fuéramos a construir 20 de esos
intervalos, cada uno usando
diferente información muestral.
Comparación / Conclusión
n=40
x=10.3
s=3.1 El intervalo de confianza de 95%
z=95 es de 10.38
1.645
10.38
Intervalo de confianza de 95% para el nivel
mínimo de proteína en la dieta.
Se toma una muestra en 100 lotes de
producción y el porcentaje promedio de
proteína resulta ser de 21%. La desviación
estándar de la concentración, medida en las
mismas muestras es de 0.8%.
95%
5%
z=? 0
n=100
x=0.21
s=0.08
z=95
1.645
0.01
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506,
502, 509, 496, 498, 501, 505, 502, 506, 499, 498, 494, 500, 504,
496, 497, 502, 499, 501, 497
La distribución de probabilidad de un
estadístico se denomina distribución
muestral.
Error Estándar
V X n N 1
2 N n
V X 2
2 2
Varianza X
X n
Error N n
estándar n n N 1
Resultado
Si X1, X2,...Xn es una muestra aleatoria
tomada de una población normal con
media y varianza 2, entonces
2
X ~ N ,
n
X
Z ~ N 0,1
n
Ejemplo
Una compañía maderera planea cortar 400
árboles de un bosque muy grande con 50 años
de antigüedad. La madera que se extrae de
cada árbol depende en gran medida de su
diámetro.
Suponga que la distribución de los diámetros
en el bosque es normal con una media de 44
pulgadas y una desviación estándar de 4
pulgadas.
También suponga que la selección de 400
árboles es efectivamente aleatoria. Encuentre
la probabilidad de que el diámetro promedio
de los árboles cortados se encuentre entre
43.5 y 44.5.
Solución
σ 4
X 44 σX 0.20
n 400
P(43.5 X 44.5)
43.5 44 44.5 44
P Z
0.20 0.20
0.9938 0.0062
0.9876
Tarea
Sabemos que el tiempo medio de espera en las colas de un centro
de salud es de 15 minutos, con una desviación típica de 5
minutos. Si tomamos al azar a un grupo de 35 personas: