Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Clases 7 y 8 Muestreo PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 39

Muestreo

Muestreo

El muestreo es la actividad por la cual se toman ciertas muestras de una población de


elementos de los cuales vamos a tomar ciertos criterios de decisión, el muestreo es
importante porque a través de él podemos hacer análisis de situaciones de una
empresa o de algún campo de la sociedad.
El muestreo se aplica en muchas situaciones de la vida cotidiana sin tener conciencia
de ello; por ejemplo, una ama de casa, al preparar la sopa y los guisados, prueba una
pequeña porción de ellos para determinar si quedó bien el sazón o le falta algo; una
persona, mientras ve el televisor, toma el control remoto y cambia de un canal a otro,
mira algunos instantes cada uno hasta que, por fin, elige; un catador de vinos paladea
cada bebida a fin de determinar sus características organolépticas y, con base en la
prueba, describe el contenido de una barrica; cuando alguien entra a una librería y
hojea los libros, o lee el resumen de una contraportada, tiene la posibilidad de
concluir si el libro le es de utilidad o interés.
El muestreo estadístico es un enfoque sistemático para seleccionar unos cuantos
elementos ( una muestra) de un grupo de datos ( población), a fin de hacer algunas
inferencias sobre el grupo total.
Muestreo
Hay diferentes razones para hacer un muestreo, entre las que pueden
mencionarse las siguientes:

 Población infinita. No es posible analizar el total de elementos, ya que se


desconoce cuál es el último.
 Limitaciones de tiempo. Efectuar un censo en ocasiones consume demasiado
tiempo, de modo que cuando se reportan los resultados la población ya no
existe. Por ejemplo, si la población está conformada por un contenedor de
manzanas, con el paso de los días estas maduran y, posteriormente, se
pudren.
 Ensayos destructivos. El examinar los elementos implica su destrucción, por
lo que en un censo se obtendrían resultados de una población inexistente.
 Costo. Estudiar cada elemento de la población es un proceso costoso.
 Exactitud. Todas las personas que recopilan la información deben estar bien
capacitadas y bajo una supervisión muy estricta. Mientras mayor sea el
número de personas involucradas, menor control se tendrá sobre ellas, lo cual
acarrea un mayor número de errores.
Muestreo

Hay que tomar en cuenta que no cualquier muestra le será útil al investigador
sino solo aquella que pueda considerarse como muestra representativa de la
población; esta se define de la siguiente manera:
Una muestra representativa de la población es aquella parte que contiene los
elementos cuyas características influyen en las variables de interés que se
desean estudiar, es decir en esa pequeña porción se tienen las características de
la población.
Conceptos básicos en muestreo
 Población o Universo: Total de elementos que se desea estudiar, analizar, entender
o caracterizar
 Población Objetivo: Colección completa de todas las unidades que se requiere
estudiar.
 Censo: Examinar a todos los elementos de la población.
 Inferir: Proyectar en el universo el resultado observado en la muestra
 Muestra: subconjunto de interés seleccionados de la población
 Unidad de muestreo: Objeto a ser seleccionado que permitirá el acceso a la
unidad de observación
 Unidad de Observación: Objeto sobre el que finalmente se realiza la medición
 Variable de interés: Característica a medir la cual va a inferir en la población
(Media, total, proporción,etc.)
Muestreo No probabilístico
Serie de técnicas de muestreo donde las muestras se seleccionan en un proceso que no
brinda a los individuos de la población la misma probabilidad de ser seleccionados, lo
tipos de muestreo no probabilístico son el Muestreo por juicio, cuotas y Bola de nieve,
estos muestreos tienen la siguientes ventajas y desventajas:

Las ventajas de las técnicas referidas son:


 Los recursos humanos se reducen en forma considerable.
 No se requiere capacitar a tanto personal.
 El costo del estudio es menor.
 Se minimiza el tiempo requerido para el estudio.

Sus desventajas son:


 Las muestras no son representativas, por lo que es incorrecto utilizarlas para hacer
inferencias acerca de la población.
 Quedan fuera del proceso de selección en zonas peligrosas, de alto índice delictivo,
vecindarios pobres y lugares inaccesibles.
Muestreo No probabilístico
 Juicio. El investigador selecciona, según su propio criterio, los elementos de
la población que formarán su muestra, posteriormente estos elementos serán
analizados, por ejemplo el investigador seleccionó a su juicio a los médicos
endocrinólogos del Instituto Mexicano del Seguro Social para su investigación,
descartando a los que trabajan en otras instituciones de salud.
 Cuota. Ciertas características preestablecidas limitan el proceso de selección,
estas características se conocen como cuota, por ejemplo, género, nivel
socioeconómico, edad, nacionalidad, religión, idioma, entre otras.
 Bola de nieve. Los elementos de la muestra recomiendan o sugieren a otros
que pueden integrarse también, por ejemplo se entrevista a una persona para
saber si tiene adeudos con el banco por el uso de tarjeta de crédito, después
se le solicita que nos diga si conoce a otra persona que esté en su mismo caso
y así sucesivamente.
Muestreo Probabilístico
Forma de seleccionar una muestra lo suficientemente representativa de una
población, cuya información permita inferir las propiedades y características de
toda la población cometiendo un error medible y acotable, los tipos de muestreo
probabilístico son: Muestreo Aleatorio Simple, Muestreo Sistemático, Muestreo
Estratificado y por Conglomerados, estos tipos de muestreo tienen las siguientes
características:
 Todos los elementos tienen la misma probabilidad de ser elegidos
 Se debe tener un marco muestral (Lista de elementos que componen el
universo de interés)
 Nos asegura que la muestra es representativa
 Permite la inferencia estadística
 Permite estimar características poblacionales (media, proporción)
 Los errores se cuantifican mediante varianzas, desviaciones estándar o
errores cuadrados de los estimadores
Muestreo Aleatorio Simple (probabilidades)
Su uso es el más sencillo y generalizado. El muestreo aleatorio simple utiliza dos
técnicas básicas de selección de elementos: la urna y la tabla de números
aleatorios.
Hay dos técnicas que pueden utilizarse para efectuar un muestreo aleatorio
simple: el muestreo con sustitución y el muestreo sin sustitución.
Muestreo con sustitución o con reemplazo (probabilidades):
𝟏
P=
𝑵

Muestreo sin sustitución o sin reemplazo (probabilidades):


𝟏 𝟏 𝟏
P= , P= , P=
𝑵 𝑵−𝟏 𝑵−𝟐
Ejemplo 1, muestreo con remplazo

Se tiene una urna con treinta esferas (N =30), se van a extraer cinco esferas para
conformar una muestra (n = 5), con la técnica de muestreo con sustitución, el
resultado de estas extracciones se muestran en siguiente cuadro
Ejemplo 2, muestreo sin remplazo

Se tiene una urna con treinta esferas (N= 30), se van a extraer cinco esferas para
conformar una muestra (n = 5), con la técnica de muestreo sin sustitución, el
resultado de estas extracciones se muestran en siguiente cuadro:
Muestreo Aleatorio Simple (Tamaño muestra)
Nivel de confianza: Tiene relación directa con el tamaño de la muestra, por lo
tanto se dirá que a mayor nivel de confianza más grande debe ser el tamaño de
muestra. Los valores de Z se obtienen mediante el uso de tablas. El nivel de
significación es fijado por el investigador, de acuerdo con su experiencia.

Precisión de la estimación: Corresponde al margen de error que el investigador


fija de acuerdo con el conocimiento que tenga acerca del parámetro que piensa
estimar. Se le conoce como error de Muestreo (E), el cual se calcula de la
siguiente manera:
Error de Muestreo
σ
E= Z
𝑛

𝝈 = desviación estándar de la población conocida o estimada a partir de


anteriores estudios o de una prueba piloto.
n= tamaño de la muestra
Z= confiabilidad
Valores de Z para nivel de confianza
Muestreo Aleatorio Simple (Tamaño Muestra)
La fórmula para calcular el tamaño óptimo en el muestreo aleatorio simple,
en una población infinita ( no se conoce el tamaño de la población) es la
siguiente:
En la variable En la proporción
𝒁𝟐 σ𝟐 𝒁𝟐 𝑷𝑸
n= n=
𝑬𝟐 𝑬𝟐

n = tamaño de la muestra
Z = margen de confiabilidad
𝝈 = desviación estándar de la población conocida o estimada a partir de
anteriores estudios o de una prueba piloto.
E = error o diferencia máxima entre la media muestral y la media de la
población que se está dispuesto a aceptar con un nivel de confianza que se ha
definido.
Ejemplo variable

El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio


de compra por cuenta, baja de cierto nivel. El gerente de un gran almacén por
departamentos desea estimar el promedio de lo comprado mensualmente por los
clientes que usan la cuenta de crédito, con un error de $2,500, y una
probabilidad aproximada de 0.95. ¿Cuántas cuentas deberá seleccionar, si se sabe
que la desviación estándar es de $30,000, la cual fue obtenida de los balances
mensuales de cuentas de crédito?

𝒁𝟐 σ𝟐 𝟏.𝟗𝟔𝟐 𝟑𝟎𝟎𝟎𝟎𝟐
n= = n= 𝟐 = 553.1 = 554 cuentas necesarias
𝑬𝟐 𝟐𝟓𝟎𝟎
Ejemplo proporción

Un auditor desea tener un nivel de confianza del 95%, para que la verdadera
proporción no exceda del 2%. Si la población es muy grande, ¿Qué tamaño tendrá
la muestra que va a tomarse, si el auditor estima que la proporción del error es
de 5%?

𝒁𝟐 𝑷𝑸 𝟏.𝟗𝟔𝟐 𝟎.𝟎𝟓 𝟎.𝟗𝟓


n= = n= = 456.1 = 456 cuentas necesarias
𝑬𝟐 𝟎.𝟎𝟐𝟐
Muestreo Aleatorio Simple
La fórmula para calcular el tamaño óptimo en el muestreo aleatorio simple, en
una población finita ( sí se conoce el tamaño de la población) es la siguiente:
En la variable En la proporción
σ𝟐 𝑷𝑸
n= 𝟐 n=
𝑬 σ𝟐 𝑬 𝟐 𝑷𝑸
+ + 𝑵
𝒁𝟐 𝑵 𝒁

N= tamaño de la población
n = tamaño de la muestra
Z = margen de confiabilidad
𝝈 = desviación estándar de la población conocida o estimada a partir de anteriores
estudios o de una prueba piloto.
E = error o diferencia máxima entre la media muestral y la media de la población
que se está dispuesto a aceptar con un nivel de confianza que se ha definido.
Ejemplo variable

El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio de


compra por cuenta, baja de cierto nivel. El gerente de un gran almacén por
departamentos desea estimar el promedio de lo comprado de 4000 clientes que usan la
cuenta de crédito, con un error de $2,500, y una probabilidad aproximada de 0.95.
¿Cuántas cuentas deberá seleccionar, si se sabe que la desviación estándar es de
$30,000, la cual fue obtenida de los balances mensuales de cuentas de crédito?

σ𝟐 𝟑𝟎𝟎𝟎𝟎𝟐
n= 𝟐 = n= = 1110.16 cuentas = 1110 cuentas necesarias
𝑬 σ𝟐 𝟐𝟓𝟎𝟎𝟐 𝟑𝟎𝟎𝟎𝟎𝟐
𝟐 + 𝟐 +
𝒁 𝑵 𝟏.𝟗𝟔 𝟒𝟎𝟎𝟎
Ejemplo proporción

El departamento de tránsito y transporte requiere estimar la proporción de


conductores con experiencia de un año o menos, que puedan clasificarse como
conductores descuidados de un total de 10000 conductores. ¿De qué tamaño deberá ser
la muestra a fin de que los resultados estén dentro de un 2%, con una confianza del
95%? Se espera observar que aproximadamente ¼ = .25 del total de conductores sean
descuidados.

𝑷𝑸 𝟎.𝟐𝟓 𝟎.𝟕𝟓
n= = n= = 1526 conductores
𝑬 𝟐 𝑷𝑸 𝟎.𝟎𝟐 𝟐 𝟎.𝟐𝟓 𝟎.𝟕𝟓
𝒁
+ 𝑵 +
𝟏.𝟗𝟔 𝟏𝟎𝟎𝟎𝟎
Distribución Muestral (Media poblacional)
La distribución muestral es la distribución de los resultados que se presentan si en
realidad se seleccionaron todas las muestras posibles.
De una población se pueden obtener diferentes muestras aleatorias de igual tamaño. Al
respecto, se esperaría que el valor de la media muestral de cada una de ellas sea
distinto; sin embargo, los resultados pueden ser muy parecidos y la probabilidad de que
sean iguales es mínima.
Se pide a cada uno de los asistentes que teclee la misma página de un manuscrito. La
siguiente tabla muestra el número de errores.

σ 𝑋𝑖
µ𝑥 =
𝑁

NOTA: La media muestral es imparcial porque la media de todas las medias


muestrales posibles (de una muestra dada con tamaño n) es igual a la media
poblacional μ.
Distribución Muestral (Varianza / Desv. Est.
poblacional)
Se pide a cada uno de los asistentes que teclee la misma página de un manuscrito. La
siguiente tabla muestra el número de errores.

σ(𝑋𝑖 − µ)2 σ 3−2.5 2 + 2−2.5 2 + 1−2.5 2 +(4−2.5)2


σ= = 1.25
𝑁 4
Distribución Muestral (media muestral)
Si a partir de esta población usted selecciona muestras compuestas por dos
asistentes administrativos con reemplazo, habrá 16 muestras posibles. La
siguiente tabla presenta los resultados de las 16 muestras posibles. Si calcula el
promedio de las medias de las 16 muestras, la media de estos valores, 𝑥,ҧ es
igual a 2.5, que es también la media poblacional µ.
Distribución Muestral (Varianza / Desv Est
muestral, o error estándar)
El valor de la desviación estándar de todas las medias muestrales posibles, llamado error
estándar de la media, expresa cuánto varía la media muestral entre una muestra y otra.
La ecuación siguiente define al error estándar de la media al hacer muestras con o sin
reemplazo de una población enorme o infinita.
Sustituyendo valores que ya hemos obtenido anteriormente, la ecuación quedaría de la
siguiente maneara:

σ 1.25
σ𝑥ҧ = = σ𝑥ҧ = 2 = .88 errores
𝑛

NOTA: Cuando aumenta el tamaño de la muestra, el error estándar de la media se


reduce en un factor igual a la raíz cuadrada del tamaño de la muestra.
Distribución Muestral (Varianza / Desv Est
muestral, o error estándar)
Si se extraen de la población todas las posibles muestras del mismo tamaño y se
calcula su estadístico, se observará que:
a) La media poblacional es igual a la media de las medias muestrales.

b) El error típico de x es igual a la relación entre la desviación estándar


poblacional y la raíz cuadrada de n.

c) Si la población de la que se extraen las muestras es normal, la distribución


muestral de medias será normal, sin importar el tamaño de la muestra.

Nota: Si la población no se distribuye en forma normal, entonces el tamaño de


la muestra debe ser mayor o igual que 30 (n ≥ 30) para que la distribución
muestral tenga una forma de campana, por lo que mientras mayor sea el
tamaño de la muestra, más cerca estará la distribución muestral de ser
normal (por ejemplo n ≥ 50).
Ejemplo
Se supone una variable aleatoria (x) que tiene el siguiente conjunto de valores:
2, 4, 6, 8. Se eligen muestras aleatorias de tamaño 2 con reemplazo. Encontrar:
a) µ, media poblacional
b) σ, desviación estándar poblacional
ത media de la distribución muestral de medias
c) 𝑋,
d) σ𝑋ത , desviación estándar de la distribución muestral de medias

a)

2+4+6+8
µ= =5
4
Ejemplo
b) σ 2−5 2 + 4−5 2 + 6−5 2 + (8 − 5)2
σ= =5
4
c) Se enlistan los elementos que forman las posibles muestras de tamaño 2 que se
pueden tomar con reemplazo, a fin de elaborar la distribución muestral de la
media y la correspondiente distribución probabilística de las medias muestrales.

2+3+4+5+3+4+5+6+4+5+6+7+5+6+7+8
𝑋ത = =5
16

σ 5
d) σ𝑥ҧ = = σ𝑥ҧ = = 3.53 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠
𝑛 2
Muestreo de poblaciones con distribución
normal
Si está muestreando una población que tiene una distribución normal con media μ y
desviación estándar σ, independientemente del tamaño de la muestra n, la distribución
muestral de la media tendrá una distribución normal con media 𝑥ҧ = μ y error estándar de la
media σ𝑥ҧ .
Además, al aumentar el tamaño de la muestra, la distribución muestral de la media conserva
una distribución normal con media 𝑥ҧ = μ , pero se reduce el error estándar de la media σ𝑥ҧ .
Cálculo de Z para la distribución muestral de la media
Población finita y Muestreo sin remplazo Población finita y Muestreo sin remplazo
𝑥ҧ − µ 𝑥ҧ − µ
Z= σ Z=
σ 𝑁−𝑛
𝑛
𝑛 𝑁−1
El multiplicador se utilizará si el resultado del cociente de la fracción muestral (n/N) es
mayor a 0.05; en caso contrario (n/N) es menor a 0.05, no es necesario utilizarlo debido a que
el valor de este multiplicador es 1, y cualquier cantidad multiplicada por 1 es igual a sí
misma. Por ejemplo, supónganse los datos siguientes: N = 1,500 y n = 20.
n/N= 20/1500 =.013
Muestreo de poblaciones con distribución
normal
El multiplicador se utilizará si el resultado del cociente de la fracción muestral
(n/N) es mayor a 0.05; en caso contrario (n/N) es menor a 0.05, no es necesario
utilizarlo debido a que el valor de este multiplicador es 1, y cualquier cantidad
multiplicada por 1 es igual a sí misma. Por ejemplo, supónganse los datos
siguientes: N = 1,500 y n = 20.
La fracción muestral es menor que 0.05; por tanto, para este ejemplo no es
necesario utilizar el multiplicador de población finita.

En el siguiente caso en donde N = 545 y n = 36, la fracción muestral 36/545 da


como resultado 0.066, que es un valor mayor a 0.05. Entonces es necesario utilizar
el multiplicador de población finita.
Ejercicio sin ajuste de población finita
Un banco estima que sus cuentas individuales de inversión tienen una distribución normal,
con un promedio de $12,000.00 y una desviación estándar de $9,798.00. Si un empleado
selecciona una muestra de 150 cuentas.
a) ¿cuál es la probabilidad de que la media muestral esté entre $11,300.00 y $13,400.00?
σ𝑋 9768
Datos: µ=$12,000.00 σ = $9,798.00 n=150 σ𝑋ത = = =800
𝑛 150

𝑥ҧ − µ 11,300 −12000
Z= σ =Z= 9798 = -0.875  Valor de tablas = .3092
𝑛 150
𝑥ҧ − µ 13,400 −12000
Z= σ =Z= 9798 = 1.75  Valor de tablas = .4599
𝑛 150

P( 11,300 < 𝑋ത <13,400) = .3092 + .4599 = .7691


Ejercicio sin ajuste de población finita

Un banco estima que sus cuentas individuales de inversión tienen una


distribución normal, con un promedio de $12,000.00 y una desviación estándar
de $9,798.00. Si un empleado selecciona una muestra de 150 cuentas.
b) ¿cuál es la probabilidad de que dicha media muestral esté entre $10 800.00 y
$11 000.00?

𝑥ҧ − µ 10,800 −12000
Z= σ =Z= 9798 = -1.5  Valor de tablas = .4332
𝑛 150
𝑥ҧ − µ 11,000 −12000
Z= σ =Z= 9798 = -1.25  Valor de tablas = .3944
𝑛 150
P( 10,800 < 𝑋ത < 11,000) = .4332 - .3944 = .0388
Ejercicio sin ajuste de población finita

Un banco estima que sus cuentas individuales de inversión tienen una


distribución normal, con un promedio de $12,000.00 y una desviación estándar
de $9,798.00. Si un empleado selecciona una muestra de 150 cuentas.
c) ¿de que sea mayor de $9 800.00?
𝑥ҧ − µ 9,800 −12000
Z= σ =Z= 9798 = -2.75  Valor de tablas = .4970
𝑛 150

P( 𝑋ത > 9,800) = .4970 + .5000 = .9970


Ejercicio sin ajuste de población finita

Un banco estima que sus cuentas individuales de inversión tienen una


distribución normal, con un promedio de $12,000.00 y una desviación estándar
de $9,798.00. Si un empleado selecciona una muestra de 150 cuentas.
d) ¿de que sea mayor de $13 780.00 y menor de $9 650.00?
𝑥ҧ − µ 13,780 −12000
Z= σ =Z= 9798 = 2.22  Valor de tablas = .4868
𝑛 150
𝑥ҧ − µ 9,650 −12000
Z= σ =Z= 9798 = -2.93  Valor de tablas = .4983
𝑛 150

P( 13,780 < 𝑋ത < 9,650) = 1- ( .4868 + .4983) = .0149


Ejercicio con ajuste de población finita

El Estado de México tiene una población de 30 empresas artesanales del mismo


tamaño, en las cuales hay cierto nivel de ausentismo. Un estudio indica que en
una muestra de ocho empresas la distribución de los días de ausentismo del
personal en un año tiene una media de 18 días y una desviación estándar de 3
días. Dado que n/N = 8/30 = .266, se debe utilizar el multiplicador de población
finita.
µ =18 N=30 n=8 σ=3
a) Calcule el error típico o estándar de la distribución muestral de la media.
σ 𝑁−𝑛 3 30−8
σ𝑥ҧ = ∗ = ∗ = .924
𝑛 𝑁−1 8 30−1
Ejercicio con ajuste de población finita

El Estado de México tiene una población de 30 empresas artesanales del mismo


tamaño, en las cuales hay cierto nivel de ausentismo. Un estudio indica que en
una muestra de ocho empresas la distribución de los días de ausentismo del
personal en un año tiene una media de 18 días y una desviación estándar de 3
días.
µ =18 N=30 n=8 σ=3
b) ¿Cuál es la probabilidad de que la media muestral sea mayor de 16.5?
𝑥ҧ − µ 16.5 −18
Z= =Z= = -1.62  Valor de tablas = .4474
σ 𝑁−𝑛 3 30−8
𝑛 𝑁−1 8 30−1

P( 𝑋ത > 16.5) = .5000 + .4474 = .9477


Ejercicio con ajuste de población finita

El Estado de México tiene una población de 30 empresas artesanales del mismo


tamaño, en las cuales hay cierto nivel de ausentismo. Un estudio indica que en
una muestra de ocho empresas la distribución de los días de ausentismo del
personal en un año tiene una media de 18 días y una desviación estándar de 3
días. µ =18 N=30 n=8 σ=3
c) ¿De que sea mayor de 18.25 y menor de 16.75?

𝑥ҧ − µ 16.75 −18
Z= =Z= = -1.35  Valor de tablas = .4115
σ 𝑁−𝑛 3 30−8
𝑛 𝑁−1 8 30−1

𝑥ҧ − µ 18.25 −18
Z= =Z= = 0.27  Valor de tablas = .1064
σ 𝑁−𝑛 3 30−8
𝑛 𝑁−1 8 30−1

P(16.75 > 𝑋ത > 18.25) = 1 - (.4115 + .1064) = .4821


Distribuciones Muestrales de una Proporción
Considere una variable categórica que cuenta sólo con dos clasificaciones: el cliente
prefiere su marca o el cliente prefiere la marca de la competencia. Lo que resulta de
interés es la proporción de elementos que forman parte de una de las categorías; por
ejemplo, la proporción de clientes que prefieren su marca. La proporción de la población,
que se representa por medio de P, es la relación de elementos en toda la población que
cuentan con la característica de interés.
𝑋
P= 𝑁
ത , es la relación de elementos en
La proporción muestral, que se representa por medio de 𝑃
la muestra que presentan la característica de interés.

𝑥
𝑃ത =
𝑛

La proporción muestral p asume valores entre 0 y 1. Si todos los individuos cuentan con la
característica, se asigna a cada uno un valor de 1 y p es igual a 1. Si la mitad de
individuos cuentan con la característica, asigne un valor de 1 a una mitad y de 0 a la otra
mitad, y p es igual a 0.5. Si ninguno de los individuos posee la característica, asigne a
cada uno una calificación de 0, y p es igual a 0.
Distribuciones Muestrales de una Proporción
Mientras la media muestral 𝑋ത es un estimador parcial de la media poblacional μ, el
estadístico P es un estimador parcial de la proporción poblacional ഥ𝑃. Por analogía con
la distribución muestral de la media, el error estándar para la proporción σ𝑷 se da
en la ecuación :
𝑃 (1 − 𝑃)
σ𝑃 =
𝑛

Si seleccionamos todas las muestras posibles de cierto tamaño, la distribución de


todas las proporciones muestrales posibles se denomina distribución muestral de la
proporción. Al realizar muestras con reemplazo de una población finita, la
distribución muestral de la proporción sigue la distribución binomial. Sin embargo,
puede utilizar la distribución normal para aproximar la distribución binomial cuando
n P y n (1 − P) son cada uno de por lo menos 5.
Distribuciones Muestrales de una
Proporción
Si se seleccionan todas las muestras posibles de cierto tamaño, la distribución de
todas las proporciones muestrales posibles se denomina distribución muestral de
la proporción. En muchos casos, se utiliza la distribución normal para estimar la
distribución muestral de la proporción. Sustituyendo ഥ𝑃 por 𝑋,
ത P por μ y
𝑃 (1−𝑃) σ
por en la fórmula de la distribución normal, por lo que nos quedaría:
𝑛 𝑛
ഥ𝑃 −𝑃
Z=
𝑃 (1−𝑃)
𝑛
Ejemplo
Suponga que el gerente de la sucursal local de un banco determina que el 40% de
todos los clientes tienen varias cuentas en el banco. Si se selecciona una muestra
aleatoria de 200 clientes, la probabilidad de que la proporción muestral de
clientes con varias cuentas sea menor que 0.30 se calcula como sigue.

Puesto que n P = 200(0.40) = 80 ≥ 5 y n(1 − P) = 200(0.60) = 120 ≥ 5, el tamaño


de la muestra tiene la magnitud suficiente como para suponer que la distribución
muestral de la proporción tiene una distribución aproximadamente normal.
ഥ𝑃 −𝑃
Utilizando la ecuación Z= =
𝑃 (1−𝑃)
𝑛

Al emplear la tabla de la Distribución Normal, se observa que el área que queda


bajo la curva normal menor que Z = −2.89 es 0.0019. Por lo tanto, la probabilidad
de que la proporción muestral sea menor que 0.30 es 0.0019, algo muy poco
probable.

También podría gustarte