Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Distribuciones Muestrales

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 33

Calculo Diferencial e Integral MT210C

Doc: David Moreno Ruiz


Departamento de Matemáticas y Estadística
Distribuciones muéstrales.
Distribución muéstral de Medias
TEORIA DEL MUESTREO
Uno de los propósitos de la estadística inferencial es estimar las características
poblacionales desconocidas, examinando la información obtenida de una muestra, de una
población. El punto de interés es la muestra, la cual debe ser representativa de la población
objeto de estudio.

Se seguirán ciertos procedimientos de selección para asegurar de que las muestras


reflejen observaciones a la población de la que proceden, ya que solo se pueden hacer
observaciones probabilísticas sobre una población cuando se usan muestras representativas
de la misma.

Una población está formada por la totalidad de las observaciones en las cuales se
tiene cierto observa.

Una muestra es un subconjunto de observaciones seleccionadas de una población.


Errores en el Muestreo
Cuando se utilizan valores muestrales (parámetros), o estadísticos
para estimar valores poblacionales, generales de errores:

El error muestral y

El error no muestral.

El error muestral se refiere a la variación natural existente entre muestras tomadas de la


misma población. Aún si se ha tenido gran cuidado para asegurar que dos muestras del mismo
tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticas
en todos sus detalles. El error muestral es un concepto importante que ayudará a entender
mejor la naturaleza de la estadística inferencial.
Los errores que surgen al tomar las muestras y que no pueden clasificarse como errores muestrales y se
denominan errores no muéstrales.

El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una
tendencia sistemática inherente a un método de muestreo que da estimaciones de un parámetro
que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro
real. Ejemplo: la longitud del dedo índice de personas de la misma edad y sexo.
El sesgo muestral puede suprimirse, o minimizarse, usando la
aleatorización.

La aleatorización se refiere a cualquier proceso de selección de una muestra de la población en


el que la selección es imparcial o no está sesgada; una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.
Los tipos más comunes de técnicas de muestreo aleatorios son:

• el muestreo aleatorio simple,


• el muestreo estratificado,
• el muestreo por conglomerados y
• el muestreo sistemático.

Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la
misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
Ejemplo 1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo
de estadística de 20 alumnos. Las combinaciones se escriben 20C5 lo que da el número
total de formas de elegir una muestra no ordenada y este resultado es igual a 15,504
maneras diferentes de tomar la muestra. Un procedimiento simple para elegir una
muestra aleatoria sería escribir cada uno de los 20 nombres en pedazos separados
de papel, colocarlos en un recipiente, revolverlos y después extraer cinco papeles al
mismo tiempo.

Otro método parea obtener una muestra aleatoria de 5 estudiantes en un grupo de


20 utiliza una tabla de números aleatorios. Se puede construir la tabla usando una
calculadora o una computadora o con métodos de selección al azar.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico, imposible o no
deseado; aunque sería deseable usar muestras aleatorias simples para las encuestas nacionales de
opinión sobre productos o sobre elecciones presidenciales, sería muy costoso o tardado.
El muestreo estratificado requiere de separar a la población según grupos que no se
traslapen llamados estratos, y de elegir después una muestra aleatoria simple en cada
estrato. La información de las muestras aleatorias simples de cada estrato constituiría
entonces una muestra global.

Ejemplo 2
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una
gran universidad. Puede ser difícil obtener una muestra con todos los profesores, así
que supongamos que elegimos una muestra aleatoria de cada colegio, o departamento
académico; los estratos vendrían a ser los colegios, o departamentos académicos.
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades heterogéneas entre
sí de la población llamadas conglomerados. Cada elemento de la población pertenece exactamente a un
conglomerado, y los elementos dentro de cada conglomerado son usualmente heterogéneos o disímiles.

Ejemplo 3
Suponga que una compañía de servicio de televisión por cable está pensando en abrir una sucursal en
una ciudad grande; la compañía planea realizar un estudio para determinar el porcentaje de familias
que utilizarían sus servicios, como no es práctico preguntar en cada casa, la empresa decide
seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.

En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea posible,
a toda la población; entonces se usa una muestra aleatoria simple de conglomerados para estudiarla.
Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se realizan,
generalmente, con base en el muestreo por conglomerados.
El muestreo sistemático es una técnica de muestreo que requiere de una selección aleatoria inicial de
observaciones seguida de otra selección de observaciones obtenida usando algún sistema o regla.

Ejemplo 4
Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede obtenerse primero una
muestra aleatoria de los números de las páginas del directorio telefónico; al elegir el vigésimo nombre de
cada página obtendríamos un muestreo sistemático, también podemos escoger un nombre de la primera
página del directorio y después seleccionar cada nombre del lugar número cien a partir del ya
seleccionado.

En este caso, podríamos seleccionar un número al azar entre los primeros 100; supongamos que el elegido
es el 40, entonces seleccionamos los nombres del directorio que corresponden a los números 40, 140, 240,
340 y así sucesivamente.
DISTRIBUCIÓN MUESTRAL DE LAMEDIA
Objetivo.
Diseñar de forma práctica una distribución muestral para la
media de la población explicando la relación que guardan
estadísticos y parámetros, es decir las relaciones entre las medidas
calculadas en la población y las calculadas en las muestras.
Distribuciones Muestrales

Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas
de la misma población tenga la misma media muestral o que sean completamente
parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado
a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra,
por ello, se quiere estudiar la Distribución de todos los valores posibles de un estadístico.

Tales distribuciones serán muy importantes en el estudio de la estadística inferencial,


porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales.
Con el análisis de las distribuciones asociadas con los
estadísticos muestrales, podremos juzgar la confiabilidad de
un estadístico muestral como un instrumento para hacer
inferencias sobre un parámetro poblacional desconocido.

Como los valores de un estadístico, tal como la media, varían de una


muestra aleatoria a otra, se le puede considerar como una variable

aleatoria con su correspondiente distribución de frecuencias .


La distribución de frecuencia de un estadístico
muestral se denomina distribución muestral.

En general, la distribución muestral de un estadístico es la de


todos sus valores posibles calculados a partir de muestras del
mismo tamaño.
Distribución Muéstral de Medias
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población
grande. Se calcula la media muestral x para cada muestra; la colección de todas
estas medias muestrales recibe el nombre de Distribución muestral de medias, lo
que se puede ilustrar en la siguiente figura:
DISTRIBUCIÓN MUESTRALDEMEDIAS.
Muestreo con reposición: Muestreo sinreposición
1.Determinar el # de muestras

2. Listar todas las muestras


3. Calcular la media (x) para cada muestra.
4. Agrupación de media (x) y calculo de la media de medias (X ). Completar la siguiente tabla.
x f f.X (X  X )2 f (X  X )2

5. Cálculo de la media poblacional (la media de la poblacióndada)

6. Confirmar que
7. Calculo del error típico
Para: Muestreo con reposición Para: Muestreo sin reposición
Error típico para muestra  f (x  x)2 Error típico paramuestra  f (x  x)2
x  x 
f f
Error típico para población Error típico para población
Tabla para encontrar la desviación ( )
x
( ) se determina de la misma manera que para muestreo con
Donde: reposición.
n: son los elementos que se toman de la población
N: son el total de elementos de la población

8. Confirmar que
DISTRIBUCION MUESTRAL DEMEDIAS

Cómo determinar el número de muestras y como listar las mu estras.

1.Se tiene la siguiente población: N= A,B,C,D. (N= 4 elementos)


Determine cuántas muestras de dos elementos (n=2) se pueden obtener y haga un listado de esas muestras.
Utilice los dos métodos: muestreo con reposición y sin reposición.

Muestreo con reposición


Número de muestras que se obtienen al seleccionar dos elementos de cuatro.

N=4 n=2
N n  42 16
Habrán 16 muestras de 2 elementos
N= A,B,C,D.
Listar muestras: cada elemento de la población se relaciona con todos los elementos.
AA BA CA DA
AB BB CB DB
AC BC CC DC
AD BD CD DD
DISTRIBUCION MUESTRAL DEMEDIAS

Muestreo sin reposición

Número de muestras que se obtienen al seleccionar dos elementos de cuatro.

N=4 n=2
N Cn  4 C2  6

Setendrán 6 muestras de 2elementos

Listar muestras: como no se permite repetición; El primer elemento de la población se relaciona


con todos los elementos que aparecen después de él. El segundo elemento se relaciona, con
todos los elementos que están después de él. El tercer elemento se relaciona con todos los que
están después de él. Yasí sucesivamente.

N=A,B,C,D.
AB BC CD
AC BD
AD
EJEMPLOS

DISTRIBUCIÓN MUESTRALDEMEDIAS (CONREPOSICIÓN)


1. Para la siguiente población: haga una distribución muestral de medias para una selección de
2 elementos.
N= 1,3,5,7
Solución:
DISTRIBUCIÓNMUESTRALDEMEDIAS. N n  42 16
1.Determinar el # de muestras (muestreo conreposición)
1,1 3,1 5,1 7,1
N= 4 elementos n= 2 elementos
2. Listar todas las muestras 1,3 3,3 5,3 7,3

N= 1,3,5,7 1,5 3,5 5,5 7,5

1,7 3,7 5,7 7,7


3. Calcular la media x para cadamuestra.

muestras muestras muestras muestras


x x x x
1,1 (1+1)/2= 1 3,1 (3+1)/2= 2 5,1 (5+1)/2= 3 7,1 (7+1)/2= 4

1,3 (1+3)/2= 2 3,3 (3+3)/2= 3 5,3 (5+3)/2= 4 7,3 (7+3)/2= 5

1,5 (1+5)/2= 3 3,5 (3+5)/2= 4 5,5 (5+5)/2= 5 7,5 (7+5)/2= 6

1,7 (1+7)/2= 4 3,7 (3+7)/2= 5 5,7 (5+7)/2= 6 7,7 (7+7)/2= 7


DISTRIBUCIÓN MUESTRAL DE MEDIAS (CON REPOSICIÓN)
4. Agrupación de media x y calculo de la media de medias x . Completar la siguiente tabla.
f Prob.
x fX (X X)2 f ( X X )2 En la primer columna escribimos todas las medias que
1 1 1x1=1 9 9 1/16 resultaron , y en la segunda, el número de veces quese
2 2 2x2=4 4 8 2/16 repite cada una de ellas.
3 3 3x3=9 1 3 3/16
4 4 4x4=16 0 0 4/16
Media de medias

5 3 5x3=15 1 3 3/16
 f X 64
6 2 6x2=12 4 8 2/16 X  4
 f 16
7 1 7x1=7 9 9 1/16
Total 16 64 40 16/16
:∑

5. Cálculo de la media poblacional


(la media de la población dada).
N= 1,3,5,7

x 13 5 7
  4
N 4
6. Comprobar que x  4
El Teorema del Límite Central también nos indica que cuando se extraen muestras de
tamaño mayor a 30 o bien de cualquier tamaño pero provenientes de una población
normal, la distribución muestral de medias tiene un comportamiento aproximadamente
normal, por lo que
se puede utilizar la formula de la distribución normal con

 x s
n
s, es equivalente al error estándar de la media, entonces la fórmula para calcular la
probabilidad del comportamiento del estadístico, en este caso la media de la muestra ,
quedaría de la siguiente manera:
x 
z 
n
Sobre el Error Estándar

Veamos como es que resulta el error estándar


s

Actividad 1. n
Se eligen muestras de pares de números, con reemplazo, de la población de los
valores 0, 2, 4 y 6. Encontrar:

μ , la media poblacional.
s , la desviación estándar poblacional.
μ x, la media de la distribución muestral de medias.
s x, la desviación estándar de la distribución muestral de medias.

Además, graficar las frecuencias para la población y para la distribución


muestral de medias.

Nota: Usar muestras ordenadas implica todas las combinaciones de valores, por
ejemplo, (4,2) y (2,4) son dos parejas diferentes.
0246
Solución:  3
La media poblacional es: 4

La distribución de frecuencias de
la población es una distribución
uniforme.

La desviación estándar de la poblacional es:

(0  3)2  (2  3)2  (4  3)2  (6  3)2


  4
 2.236
la distribución muestral de las medias es:
La media de la distribución muestral de medias es:

x 
 ( fx)  (0)(1) (1)(2)  (2)(3)  (3)(4)  (4)(3)  (5)(2)  (6)(1)  48  3
f 16 16

La desviación estándar de la distribución muestral de medias es:

 f (x)   1(0  3)2  2(1 3)2  3(2  3)2  4(3  3)2  3(4  3)2  2(5  3)2 1(6  3)2
 x
x
2 1.58
16
f
Notar que:


 
2.236
 1.58
 x
2
n
El teorema del límite central y el error estándar de la media y de la proporción
están basados en que las muestras son seleccionadas con reemplazo. Sin embargo,
en virtualmente todos los casos reales, el muestreo se hace sin reemplazo de
poblaciones con tamaño finito N. En estos casos, y particularmente cuando el
tamaño de la muestra NO ES PEQUEÑO en comparación con el de la población (por
ejemplo, más del 5% de la población) de manera que:

n
 0.05
N
Siendo n el tamaño de la muestra y N el de la población. Entonces es necesario
emplear un Factor de Corrección para Población Finita para la desviación estándar:

N n
N 1
La corrección modifica la ecuación del estadístico de la siguiente forma.

x 
z
 Nn
n N 1
Siendo n el tamaño de la muestra y N el de la población.
Ejemplo 5

Una empresa eléctrica fabrica baterías que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40
horas. Encuentre la probabilidad de que una muestra aleatoria de 16 baterías tenga una
vida promedio de menos de 775 horas.
Distribution Plot
Solución: Normal, Mean=0, StDev=1

0.4

0.3

Density
0.2
Área = 0.0062
0.1

0.00621

-2.5 0
X

La respuesta sería que la probabilidad de que la media de la muestra de


16 baterías sea menor a 775 horas es de 0.0062 o 0.62 %.
Ejemplo 6.

Las estaturas de aproximadamente 1000 estudiantes están distribuidas


en forma normal con una media de 174.5 centímetro
y una desviación estándar de 6.9. centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin
reemplazo de esta población, determine:

a) El número de las medias muéstrales que caen entre 172.5 y 175.8 centímetros.
b)El número de medias muéstrales que caen por debajo de 172 centímetros.

Solución:
Como n/N=200/1000=0.2, se puede observar en este ejercicio se
cuenta con una población finita y un muestreo sin reemplazo, por lo que se tendrá que
agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo
sustituirlo en cada inciso.
a)

Distribution Plot
Normal, Mean=0, StDev=1

0.4 0.761

0.3
Área = 0.761

Density
0.2

0.1

Por lo tanto la respuesta es:


0.0
-1.47 0 0.96
X

(0.761)(200)=152 medias muestrales


b)
Área = 0.0330

Distribution Plot Distribution Plot


Normal, Mean=0, StDev=1 Normal, Mean=174.5, StDev=1.36

0.4 0.30

0.25

0.3
0.20
Density

Density
0.2 0.15

0.10
0.1
0.05
0.0330 0.0330
0.0 0.00
-1.8382 0 172 175
X X

Nota: Es lo mismo si se toman los valores originales con


la distribución para la media y desviación estándar Por lo tanto la respuesta es:
correspondientes, pero esto sólo se puede efectuar con (0.0330)(200)= 7 medias muestrales
software y no con tablas.
BIBIOGRAFIA

• KAZMIER, Leonard J. (Ultima edición). Estadística Aplicada a la administración y a


la economía. Editorial Mc Graw Hill.
• BERENSON, M.L - LEVINE D.M. (1982). Estadística para administración y
economía. Editorial Iberoamericana.
• MARTÍNEZ B. Ciro. (Ultima Edición). Estadística y muestreo. Editorial ECOE
MURRAY R. Spiegel (1987). Estadística, teoría y problemas. Editorial Mc Graw Hill
• LIPSCHUTS Seymour (Última Edición). Probabilidad, teoría y problemas. Editorial
Mc Graw Hill
• NEWBOLD Paul. (Ultima edición). Estadística para los negocios y la Economía.
Editorial

También podría gustarte