Metodos Estadisticos
Metodos Estadisticos
Metodos Estadisticos
Para finalizar, los capítulos 6 y 7 cubren los métodos de muestreo por con-
glomerados en un etapa y de respuesta aleatorizada. El primer método ayu-
da a simplificar los muestreos exhaustivos cuando la población es demasia-
do grande y sus elementos comparten rasgos comunes. Por ejemplo, en las
encuestas nacionales de los clientes bancarios, de los usuarios de servicios
públicos o del control de calidad de ciertos medicamentos. Por su parte, el
método de respuesta aleatorizada, que se complementa con el aleatorio sim-
ple o el estratificado, intenta resolver el problema de la falta de respuestas a
preguntas sensibles como el uso de enervantes, relaciones sexuales o de otra
índole. Además, para este caso se presenta el procedimiento desarrollado por
S. Warner (1965) para obtener respuestas difíciles que ayuden estimar la pro-
porción de personas con la característica de interés que se busca.
Agradecimientos
Queremos dar las gracias a todas las personas que influyeron positivamente
en la realización de este libro. En especial, a nuestros alumnos de la Licen-
ciatura en Informática, de Ingeniería en Telemática y los de la Facultad de
Ciencias de la Universidad de Colima, por su paciencia, tolerancia y sugeren-
cias para mejorar los borradores. También a los alumnos Martín Hugo del Toro
Guzmán, Hugo Torres López Y Henry Nicole Ramírez de la Facultad de Cien-
cias, por su apoyo en la captura de la versión preliminar de los manuscritos.
Los autores
Colima, México
Índice general
1. Introducción 1
III
3.5.1. La medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5.2. El estimador de la proporción poblacional P y su relación
con el estimador de una media poblacional . . . . . . . . . 52
3.5.3. La varianza de la población para una proporción . . . . . . 53
3.5.4. Los intervalos de confianza . . . . . . . . . . . . . . . . . . . 54
3.5.5. El tamaño de muestra requerido para estimar P . . . . . . 55
3.5.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
III
Índice de cuadros
V
6.6. Emigrantes de las 12 localidades. . . . . . . . . . . . . . . . . . . . 157
6.7. Nivel de satisfacción de los médicos en cada hospital . . . . . . . 161
6.8. Kg. de basura producidos por vivienda semanalmente. . . . . . . 162
6.9. El total de cacahuates producidos por tramo . . . . . . . . . . . . 165
6.10.El agua de coco por palmera (litros). . . . . . . . . . . . . . . . . . 168
6.12.smallcaption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
6.13.smallcaption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
Introducción
Los gobiernos, las empresas privadas, las instituciones, así como los ciu-
dadanos, necesitan usar intensivamente información y datos para el análisis
de fenómenos y toma de decisiones en circunstancias de gran complejidad e
incertidumbre. La información sobre la cantidad y calidad de un recurso para
tomar tales decisiones pueden ser obtenidas mediante una evaluación exhaus-
tiva, esto es, cuantificar o calificar todo el recurso (población). Sin embargo, en
la mayoría de las circunstancias no es posible o conveniente hacer la evalu-
ación exhaustiva sobre toda la población, principalmente por la carencia de
recursos, por ello se justifica que gran parte de los conocimientos, actitudes
y decisiones humanas estén basadas en el análisis de información parcial, es
decir, en el estudio de muestras, concretamente en el uso del muestreo. Al
hacer la evaluación con solamente una fracción de la población o del recurso,
se espera que las determinaciones hechas también pertenezcan a la población,
implícitamente se acepta esa suposición, aunque siempre se corre el riesgo de
que tal suposición no sea totalmente cierta. El objetivo principal de las técni-
cas de muestreo es darle objetividad a ese riesgo.
El uso del muestreo como un medio para obtener conocimiento y tomar de-
cisiones, es algo normal y cotidiano en las actividades humanas. En estudios
1
Capítulo 1. Introducción
de mercado, el muestreo sirve para conocer las preferencias de los consumi-
dores de cierto producto; en los estudios demográficos y sociales, para conocer
los niveles de empleo y desempleo, los ingresos y niveles de escolaridad en
los habitantes de una ciudad o país, la prevalencia y la incidencia de la dro-
gadicción, etc.; y en la industria, para el control de calidad en el proceso de
producción. En fin, el muestreo se utiliza prácticamente en todas las áreas del
conocimiento.
2
Capítulo 2
Estadística
”La estadística es la ciencia que se ocupa de los métodos y pro-
cedimientos para recoger, clasificar, resumir, hallar regularidades y
analizar los datos, siempre y cuando la variabilidad e incertidumbre
sea una causa intrínseca de los mismos; así como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones” (Johnson, 1996).
Como en todas las áreas del conocimiento, el muestreo emplea una termi-
3
Capítulo 2. Conceptos básicos de estadística
nología específica que define de manera apropiada los conceptos que se uti-
lizan, por lo que es conveniente revisar algunos de ellos, en particular de la es-
tadística, y presentar la simbología que se emplea en las técnicas de muestreo.
Conjunto
Es una colección de objetos definidos y distinguibles cuya
única propiedad indispensable es que sean identificados como
pertenecientes a dicho conjunto. A cada uno de los objetos que lo
constituyen se le llama elemento.
4
Por ejemplo, si el recurso son los estudiantes de la Universidad de Colima y
la característica de interés es su estatura promedio, la población original son
todos los estudiantes, pero la población a la que las técnicas de muestreo se
referirán son el conjunto constituido por las estaturas de esos estudiantes, que
estarán denominadas por el número que indica la dimensión y las unidades
en que se miden; por ejemplo 1.75 metros podría ser uno de los elementos
constitutivos del conjunto población.
2.3. Variables
Una variable es una característica de los elementos de una población y se
obtiene con una medición o una calificación. La altura de los estudiantes es
una variable, también lo es la marca de computadoras portátiles que se en-
cuentran en el mercado actual. El peso de cada silla o de cada estudiante
también es una variable.
Una variable continua, como su nombre lo indica, es aquella donde son posi-
bles todos los valores dentro de un intervalo de los números reales, al menos
teóricamente, ya que prácticamente, por limitaciones de los instrumentos de
medición, muchos valores en ese intervalo no pueden ser observados. En gene-
ral, este tipo de variables incluye mediciones en kilogramos, centímetros, etc.,
cuya precisión puede ser incrementada indefinidamente, afinando más y más
el instrumento de medición.
Una variable discreta se puede medir en una escala que no incluye todos los
valores posibles de un intervalo de los números reales. Ejemplos de este tipo
de variables son los conteos, el número de personas de un lugar, el número de
libros en una biblioteca, entre otros.
5
Capítulo 2. Conceptos básicos de estadística
6
Para medir la altura de los estudiantes se emplean técnicas muy distintas
a las que miden la longitud de un virus o una bacteria; pero los métodos es-
tadísticos para analizar los datos de ambos casos pudieran ser los mismos.
Las técnicas de medición son muy diversas y algunas son difíciles de eje-
cutar. La instrumentación, selección y validez de las técnicas de medición son
motivo de estudio de otras disciplinas, pero la comparación entre técnicas de
medición sí son motivo de aplicación de los métodos estadísticos por lo que no
abordaremos en este libro las técnicas de medición.
Escala nominal
La escala nominal se utiliza para clasificar a la población en categorías. Por
ejemplo, los seres humanos se clasifican en hombres y mujeres; los colores se
clasifican en rojo, azul, verde, etc. En este tipo de datos no existe una relación
de orden ni se pueden realizar operaciones aritméticas como suma, multipli-
cación, división o resta. Sin embargo, se pueden establecer frecuencias y pro-
porciones, así como calcular la moda y establecer relaciones de equivalencia.
Las propiedades de las relaciones de equivalencia son: reflexión: X=X; simetría:
si X=Y entonces Y=X; y transición: si X=Y y Y=Z, entonces X=Z. Las pruebas
estadísticas no paramétricas son admisibles para datos con esta escala de
medición.
Escala ordinal
La escala ordinal clasifica y ordena las observaciones. Sin embargo, no
puede definirse una distancia entre las observaciones. Las relaciones admisi-
bles en esta escala son: >,<, =. Por ejemplo, la frecuencia con que un grupo de
personas lee una revista científica podría clasificarse en: regularmente, a ve-
ces, pocas veces, casi nunca y nunca. Otro ejemplo es la definición de la jerar-
quía militar de un regimiento: teniente> subteniente> sargento 3ro.> sargento
1ro.> cabo. Un último ejemplo es la llegada a la meta de un corredor en una
competencia de 20 participantes: su clasificación C es tal que C ∈ {1, 2, . . . , 20}.
Las medidas que se pueden calcular en esta escala son: moda, frecuencia,
coeficiente de contingencia y mediana. Las pruebas estadísticas admisibles
para un conjunto de datos de esta naturaleza son las no paramétricas, en
particular las estadísticas de rango, así como los coeficientes de correlación
con base en rangos, es decir, el coeficiente de Sperman y el de Kendall.
7
Capítulo 2. Conceptos básicos de estadística
Escala de intervalo
Esta escala incluye las dos anteriores; es decir, clasifica, ordena y además
establece la proporción entre dos intervalos contiguos. Esta escala necesita
una unidad de medida y un punto cero arbitrario (no es el cero que pertenece
a los reales). En esta escala la proporción de dos intervalos cualesquiera es
independiente de la unidad de medida y del punto cero. Por ejemplo, la tem-
peratura en grados Celsius o Farenheit se mide en una escala de intervalo, ya
que la unidad de medida y el punto cero son arbitrarios.
Escala de proporción
Existe un número infinito de parámetros para una población dada; sin em-
bargo, muchos no tienen utilidad, en cambio otros manifiestan el interés de
la evaluación. Por ejemplo, la suma de todos los valores correspondientes al
gasto de agua por familia en una localidad (población), porque la suma repre-
senta el gasto total de agua en dicha localidad. Por lo tanto, el promedio, el
total, la varianza, la desviación estándar, el coeficiente de variación, la moda,
8
la mediana, el porcentaje o proporción son algunos ejemplos de parámetros.
Estimadores
Son funciones que se pueden proponer para calcular o estimar los
parámetros. Si se definen sobre el conjunto población entonces se
está calculando el parámetro; pero si esas funciones se definen para
los datos de una muestra, entonces se realiza una estimación del
parámetro. A ambos casos se les llamarán estimadores. Además, a
cada parámetro le corresponde uno o más estimadores. Existe un
número infinito de estimadores, pero sólo algunos tienen interés
práctico.
2.7. Sumatorias
La sumatoria es muy importante para comprender mejor los conceptos de-
trás del muestreo. Algunos parámetros y estimadores incluyen en su definición
la suma de varios valores o datos. Si se simboliza por yi a cualquiera de esos
datos, digamos el i-ésimo de ellos, y se tienen n datos, la suma de esos datos
se simboliza empleando el operador de sumatoria (Σ),
n
X
y1 + y2 + · · · + y n = yi
i=1
El subíndice señala una etiqueta que identifica a cada dato cuando éste
aparece en una lista. Es importante hacer notar que el subíndice puede em-
plear cualquier símbolo, aunque convencionalmente se emplean letras inter-
medias minúsculas del alfabeto como ”i”, ”j”, ”k”, etc.; incluso los mismos
datos pueden usar subíndices diferentes para indicar las operaciones apropi-
adas. Asimismo, un símbolo de dato como ”y” puede tener más de un subíndice
cuando los datos tienen más de dos criterios o sentidos de clasificación, como
puede ser el caso de una tabla o una matriz que tiene renglones y columnas,
como ”yij ”, donde ”i” es el renglón y ”j” la columna, o al revés. Si existen más
de dos criterios de clasificación podrán emplearse más de dos subíndices para
identificar apropiadamente cada dato.
9
Capítulo 2. Conceptos básicos de estadística
En otras ocasiones se empleará un subíndice con algún otro símbolo, tal vez
el de una variable, un parámetro o un estimador, para señalar que ese símbolo
pertenece al objeto identificado con la etiqueta que se usa como subíndice. Por
ejemplo, σy se refiere a la desviación estándar de la variable (de los datos de) y.
= x1 + y1 + x2 + y2 + · · · + x n + yn
= (x1 + x2 + x2 + · · · + xn ) + (y1 + y2 + · · · + yn )
n
X n
X
= xi + yi
i=1 i=1
n
X r
X n
X
d) yi = yi + yi , donde r es un número entero mayor que 1 y menor
i=1 i=1 i=r+1
que n.
Ejemplo:
5
X
yi = (y1 + y2 ) + (y3 + y4 + y5 )
i=1
2
X 5
X
= yi + yi donde yi = cualquier valor
i=1 i=2+1
10
puede tomar la variable bajo un experimento aleatorio.
1 si yi = sí fuma
½
y(yi ) =
0 si yi = no fuma.
Donde:
11
Capítulo 2. Conceptos básicos de estadística
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
Figura 2.1: Forma de la distribución normal para la variable estatura (Y ) con media
90 cm. y DE=5 cm.
12
0.4
NP 0V2 1
0.3
0.2
0.1
0.0
-4 -2 0 2 4
Ȳ − µY Ȳ − µY
r = ∼ N (0, 1)
σY2 σȳ
n
El Teorema Central del Límite establece que para un tamaño de muestra
grande, la distribución de Ȳ es aproximadamente normal, independientemente
13
Capítulo 2. Conceptos básicos de estadística
Z
t= p
χ2 /ν
tiene una distribución t-student con ν grados de libertad (Mood, et al., 1974
[4]). Su función de densidad es la siguiente:
¶−(ν+1)/2
1 [(ν + 1)/2]! t2
µ
√ +1 si −∞ ≤ t ≤ ∞
fT (t) = νπ [ν/2]! ν
0 de otra forma.
14
semejante. No obstante, una variable normal estándar siempre tiene varianza
de 1, mientras que la varianza de una variable t-student es superior a 1. Esto
se puede apreciar en la Figura 2.3, donde se compara la distribución normal
estándar con la distribucione t-student con 1, 3, 5 y 10 grados de libertad. Es
decir, se observa que las dos funciones de densidad son simétricas respecto
al origen, pero la distribución t-student posee mayor masa de probabilidad en
los extremos. Sin embargo, desde el punto de vista práctico las diferencias en-
tre estas dos distribuciones son relevantes cuando el tamaño de muestra es
menor o igual a 30, . Así, en el presente libro sugerimos obtener los valores
de tablas que se utilizan para los ejemplos y ejercicios de los capítulos poste-
riores, a partir de la distribución t-student cuando el tamaño de la muestra
sea menor o igual a 30, de lo contrario obtenerlos de la distribución normal
estándar.
0.4
NP 0V2 1
t10
t5
t3
0.3
0.2
t1
0.1
0.0
-4 -2 0 2 4
Ahora bien, para conocer una población con base en la muestra recurrimos
a dos procedimientos generales, que se diferencían en la manera de seleccionar
15
Capítulo 2. Conceptos básicos de estadística
16
confiamos en la opinión experta de personas quien uno supone son cono-
cedoras de las características de una población dada (Rendón, 1997 [10]).
17
Capítulo 2. Conceptos básicos de estadística
18
Al empezar a diseñar un plan de muestreo o una encuesta, es importante
que se definan los objetivos, pues permitirán mantenerse en una línea de
investigación sin perder tiempo con demasiados detalles.
19
Capítulo 2. Conceptos básicos de estadística
6. El marco de muestreo
Antes de seleccionar la muestra, debemos dividir la población en unidades
de muestreo. éstas deben cubrir toda la población y no traslaparse en el
sentido de que todo elemento de la población pertenezca a una y sola-
mente una unidad. Algunas veces la unidad apropiada es obvia, en otras
no es sencillo escoger lo que será la unidad de muestreo. En el muestreo
de los residentes de una ciudad, por ejemplo, la unidad puede ser una
persona, los miembros de una familia o las personas que viven en una
manzana. En el muestreo de una cosecha de limón la unidad puede ser
un lote, una parcela o un área de terreno cuya forma y dimensiones son
nuestra elección.
7. La selección de la muestra
20
Existe actualmente una gran variedad de planes para seleccionar una
muestra. Por cada plan considerado se pueden hacer estimaciones del
tamaño de la muestra partiendo de un conocimiento del nivel de precisión
deseado y la varianza de la población. Los costos relativos y el tiempo
empleado en cada plan se estudian antes de tomar una decisión (Lohr,
2000 [9]).
8. La encuesta piloto
Es de gran utilidad probar el cuestionario y los métodos de campo en pe-
queña escala. Esto casi siempre ayuda a mejorar el cuestionario y puede
evitar otros problemas serios, por ejemplo, que el costo fuera más que el
esperado.
21
Capítulo 2. Conceptos básicos de estadística
Aunque el objetivo del muestreo, al igual que muchas otras disciplinas, con-
siste en emplear recursos mínimos para obtener determinada información,
o bien en conseguir la máxima información con recursos prefijados (Brad-
burn,1998 [5]).
Las desventajas
Cuando sea difícil cumplir con los requisitos de las técnicas de muestreo
probabilístico.
22
El muestreo exige menos trabajo material que una investigación exhaus-
tiva, pero más refinamiento y preparación (conocimientos adecuados de
los diseñadores y preparación de los entrevistadores, inspectores y su-
pervisores), lo que puede suponer un uso limitado.
Cuando el costo por unidad, que es mayor en las encuestas que los cen-
sos, aconseje desestimar los métodos de muestreo.
23
Capítulo 2. Conceptos básicos de estadística
24
1. Tener una primera aproximación de los costos que se involucran en el
estudio.
d = |θ̂ − θ|
Esto significa que debemos especificar que θ y θ̂ difieren en valor absoluto en
una cantidad menor que d.
25
Capítulo 2. Conceptos básicos de estadística
1 − α = confiabilidad,
P ⌊|θ̂ − θ| ≤ d⌋ = 1 − α,
que es igual a
P ⌊−d ≤ θ̂ − θ ≤ d⌋ = 1 − α (2.1)
La ecuación anterior indica que la probabilidad de que la diferencia entre el
estimador y el parámetro tome valores dentro de un intervalo delimitado por
los valores −d y d, es 1 − α. La determinación de un límite específico con su
confiabilidad asociada (1 − α) nos ayuda a comparar diseños diferentes (méto-
dos de selección de la muestra) para especificar el procedimiento que dé la
precisión deseada con un costo mínimo.
26
embargo, si la secretaría de economía además persigue implementar un pro-
grama para subsidiar con 1000 pesos mensuales a cada una de las familias en
este estrato, por lo tanto una estimación con un error de 7 % puede provocar
que al momento de implementar dicho programa el presupuesto para tal fin
no alcance, por lo que se sugiere un error más pequeño.
Por otro lado, si el parámetro que se desea estimar es el total ya sea a partir de
variables dicotómicas o continuas se procede de igual forma y se recomienda
un error menor del 8 % del total preliminar. Por ejemplo si se desea estimar el
total de drogadictos en el estado de Colima para el año 2008, para fijar la pre-
cisión necesitamos una estimación tentativa del total. Supongamos que este
es de 5000, por lo tanto la precisión será d = 0.05 ∗ 5000 = 250, es decir el 5 % del
total preliminar. Esta forma de estimar la precisión del total es exactamente la
misma (d=(porcentaje/100)* valor preliminar del parámetro a estimar) que para
estimar la precisión para una proporción o un promedio. Por lo tanto, el lector
debe siempre recordar que la precisión se debe de calcular para el parámetro
de mayor interés en su investigación ya que de lo contrario debe de determi-
nar una precisión para cada parámetro y con ello obtener más de un tamaño
de muestra lo cual además de desgastarlo lo puede confundir. También, hay
que dejar claro que si se determina la precisión usando la expresión que pre-
sentamos anteriormente, d=(porcentaje/100)* valor preliminar del parámetro a
27
Capítulo 2. Conceptos básicos de estadística
28
la probabilidad correspondiente es igual a 0.9599. Lo anterior se muestra
en el Cuadro 2.1.
III . Ahora supóngase que se requiere encontrar el valor de Z0 tal que la prob-
abilidad de que una variable aleatoria normal estándar sea igual a 0.975,
es decir, P (Z > Z0 ) = 0.975. En este caso se procede de manera inversa que
a I., es decir, ahora se tiene la probabilidad y se busca el valor de Z0 . Por lo
tanto, se busca en el Cuadro A.1(Apéndice A) el valor de probabilidad más
cercano a 0.975 y se encuentra que éste es exactamente el mismo (0.975).
En seguida se obtienen los valores de Z para éste valor de la columna e
hilera en que se ubica (ver Cuadro 2.3). En este caso el valor de Z en la
columna es de 0.06 y en la hilera 1.90, por lo que Z0 = 1.90 + 0.06 = 1.96.
29
Capítulo 2. Conceptos básicos de estadística
30
Cuadro 2.4: Valores de Zα/2 para los niveles de confianza de uso más común
Nivel de confianza α α/2 Zα/2
90 % 0.1 0.05 1.6449
95 % 0.05 0.025 1.9600
97.5 % 0.025 0.0125 2.2414
99 % 0.01 0.005 2.5758
Por ejemplo, suponga que un investigador fija para su estudio una confia-
bilidad de 90 % y que cuenta con un tamaño de muestra de n = 6; esto implica
que α = 0.1(en términos de proporción), entonces el valor de tablas que se desea
es t0 = t6−1,0.05 ,es decir, se busca el valor de t0 tal que P (t < t0 ) = 1 − 0.05 = 0.95.
Para encontrar éste valor de t0 , se busca en el Cuadro A.2 en la primera colum-
na los ν = 6 − 1 = 5 grados de libertad y en la segunda hilera el valor α/2 = 0.05
y en la intercepción se obtiene el valor de t0 = 2.0150 (ver Cuadro 2.5 ).
31
Capítulo 2. Conceptos básicos de estadística
32
Capítulo 3
33
Capítulo 3. Muestreo aleatorio simple
El MAS es el más sencillo que veremos en este libro y nos dará las bases
para desarrollar diseños más elaborados.
N!
N Cn =
n!(N − n)!
34
deberían configurarse antes de seleccionarlas, lo cual sería imposible en pobla-
ciones grandes. Simplemente obsérvese que el número posible de muestras de
una población con 100 unidades muestrales y una muestra de tamaño 15,
100!
sin reemplazo es 100 C15 = = 2.53338 × 1017 y con reemplazo es
15!(100 − 15)!
10015 = 1 × 1030 muestras posibles. Afortunadamente, la definición se satisface
simplemente dejando que cada unidad muestral tenga la misma oportunidad
de ser incluida en la muestra; esa probabilidad es n/N y solamente necesita-
mos conocer una muestra, que será la que usaremos.
35
Capítulo 3. Muestreo aleatorio simple
36
En ocasiones se omite el subíndice ”y” ya que el contexto esclarece a qué
variable se refiere.
n
X
yi
i=1
µ̂ = ȳ = (3.1)
n
τ̂ = N ȳ (3.2)
A los valores que arrojan estos estimadores (expresiones 3.1 y 3.2) apor-
tadas por Scheaffer (1987[2]) se denominan estimaciones. Los estimadores
son variables aleatorias que tienen propiedades estadísticas derivadas de la
probabilidad, mientras que las estimaciones son simplemente números con
las unidades de medición correspondientes.
la media; también refleja la variabilidad que existe entre los valores de las
variables. Este parámetro se define por la expresión
N
X
(yi − µ)2
i=1
σY2 = σ 2 =
N −1
Al igual que µ y τ , σ 2 también tiene su estimador muestral, el cual se obtiene
de la muestra. Este estimador se denota como
n
X n
X
(yi − ȳ)2 yi2 − nȳ 2
i=1 i=1
Sy2 = S 2 = =
n−1 n−1
µȳ = µ (3.3)
N − n σy2
· ¸
2
σȳ = (3.4)
N n
37
Capítulo 3. Muestreo aleatorio simple
µ̂ȳ = µ̂ = ȳ (3.5)
µτ̂ = τ = N µ (3.7)
µ̂τ̂ = τ̂ = N µ̂ = N ȳ (3.9)
S2
· ¸
2 2 y N −n
Sτ̂ = N (3.10)
n N
Las expresiones 3.9 y 3.10 pueden simplificarse algebraicamente. Además,
en lo sucesivo simplificamos las expresiones y notación para facilitar su lec-
tura.
38
esto es, ȳ, Sȳ2 , τ̂ y Sτ̂2 que ya hemos calculado. Asimismo, suponiendo que los
estimadores ȳ y τ̂ tienen una distribución normal, o aproximadamente normal,
se puede estimar por intervalo la media y total poblacional.
39
Capítulo 3. Muestreo aleatorio simple
n ´ S2
µ ¶
2 2
³
2 2 2 1 1
d = tn−1,(α/2) 1 − ⇔ d = tn−1,(α/2) S −
N n n N
d2 d2
µ ¶
1 1 1 1
2 2
= − ⇔ = 2 2
+
tn−1,(α/2) S n N n tn−1,(α/2) S N
40
1 N d2 + t2n−1,(α/2) S 2 N t2n−1,(α/2) S 2
= ⇔n=
n N t2n−1,(α/2) S 2 N d2 + t2n−1,(α/2) S 2
Por lo tanto, se obtiene una ecuación que indica cómo calcular un tamaño
de muestra para la estimación de una media poblacional, en términos de una
precisión y una confiabilidad preestablecidas:
N t2n−1,(α/2) S 2
n= (3.14)
N d2µ + t2n−1,(α/2) S 2
S 2 = varianza muestral. Este valor se obtiene con los datos de una muestra
preliminar de tamaño n′ .
41
Capítulo 3. Muestreo aleatorio simple
3.3.5. Ejemplos
Ejemplo 1. IBM produce semanalmente N = 1, 000 computadoras, de donde
el gerente de calidad seleccionó al azar una muestra n = 10 computadoras. La
información sobre el número de fallas encontradas en cada una de las com-
putadoras se muestra a continuación: 6, 7, 9, 8, 5, 4, 7, 8, 7 y 6.
42
62 + 72 + . . . + 72 + 62 − 10(6.7)2
S2 = = 2.2333
9
ȳ ± tn−1,α/2 Sȳ
Por lo tanto,
6.7±(2.262)(0.4702)
6.7±1.0634
5.6366≤ µ ≤7.7634
τ̂ = N ȳ=(1,000)(6.7)=6,700
τ̂ ± N tn−1,α/2 Sȳ
Por lo tanto,
6,700±(1,000)(2.262)(0.4702)
6,700±(1,000)(1.0634)
6,700±1,063.4
5,636.6≤ τ ≤7,763.4
43
Capítulo 3. Muestreo aleatorio simple
N (tn−1,α/2 )2 S 2
n=
N d2 + (tn−1,α/2 )2 S 2
donde: N = 1, 000, tn−1,α/2 = t10−1,0.025 = 2.262, S 2 = 2.2333, ȳ = 6.7
Por lo tanto:
N 2 (tn−1,α/2 )2 S 2
n=
d2 + N (tn−1,α/2 )2 S 2
44
(1, 000)2 (2.262)2 (2.2333) 11, 427, 001.05
n= 2 2
= = 49.38
(469) + (1, 000)(2.262) (2.2333) 231, 388
Nota: La n estimada es el tamaño de muestra definitivo, por lo que sólo faltará
medir las unidades muestrales restantes considerando las que ya se midieron.
Esto procede siempre y cuando el muestreo piloto sea considerado apropiado.
Esta nota es válida para todos los ejercicios posteriores incluso para los esque-
mas de muestreo presentados en los capítulos restantes .
a) Haga una estimación puntual del gasto semanal promedio por estudian-
te.
y1 + y2 + · · · + y n
ȳ =
n
120 + 150 + 100 + . . . + 65 + 110
ȳ = = 90.3333
15
ȳ ± tn−1,α/2 Sȳ
Por lo tanto:
45
Capítulo 3. Muestreo aleatorio simple
90.33±(2.145)(6.4011)
90.33±13.7291
76.6043≤ µ ≤104.0624
τ̂ = N ȳ=(420)(90.3333)=37,940
τ̂ ± N tn−1,α/2 Sȳ
Por lo tanto:
37,940.0±(420)(2.145)(6.4011)
37,940.0±(420)(13.7291)
37,940.0±5766.2222
32,173.7938≤ τ ≤43,706.2062
Es decir, se estima que el gasto total de los estudiantes está entre 32,173.7938
y 43,706.2062.
N (tn−1,α/2 )2 S 2
n=
N d2 + (tn−1,α/2 )2 S 2
donde: N = 420, tn−1,α/2 = t15−1,0.025 = 2.145, S 2 = 637.381, d = 6
Por lo tanto:
(420)(2.145)2 (637.381)
n= = 69
(420)(6)2 + (2.145)2 (637.381)
Por lo tanto, 69 son las unidades muestrales (estudiantes) para tener una
precisión de ±6 pesos con 0.95 de probabilidad de incluir en el intervalo de es-
timación al promedio verdadero. En otras palabras se debe seleccionar aleato-
riamente una muestra de n = 69 estudiantes de la población de N = 420, lo
que garantiza que se cumplirá la precisión especificada (d = 6 pesos) para el
46
promedio con una probabilidad de 0.95.
N 2 (tn−1,α/2 )2 S 2
n=
d2 + N (tn−1,α/2 )2 S 2
donde: N = 420, tn−1,α/2 = t15−1,0.025 = 2.145, S 2 = 637.381, d = 2, 520
Por lo tanto:
47
Capítulo 3. Muestreo aleatorio simple
τ̂ = N ȳ=(3,000)(3.1667)=9,500
ȳ ± tn−1,α/2 Sȳ
Por lo tanto:
3.1667±(2.201)(0.6821)
3.1667±1.5014
1.6653≤ µ ≤4.6680
τ̂ ± N tn−1,α/2 Sȳ
Por lo tanto:
9,500±(3,000)(2.201)(0.6821)
9,500±(3,000)(1.5014)
9,500±4,504.2
4,995.9198≤ τ ≤14,004.0822
N (tn−1,α/2 )2 S 2
n=
N d2 + (tn−1,α/2 )2 S 2
donde: N = 3, 000, tn−1,α/2 = t12−1,0.025 = 2.201, S 2 = 5.6061, d = 0.5
Por lo tanto:
48
h) Suponga que la muestra seleccionada es una muestra preliminar de
tamaño n′ = 12. ¿Cuál es el tamaño de muestra para estimar el total de col-
imenses que vive en Estados Unidos tal que el total sea estimado con una
precisión de 1,500 parientes y una confiabilidad de 95 %?
N 2 (tn−1,α/2 )2 S 2
n=
d2 + N (tn−1,α/2 )2 S 2
donde: N = 3, 000, tn−1,α/2 = t12−1,0.025 = 2.201, S 2 = 5.6061, d = 1, 500
Por lo tanto:
49
Capítulo 3. Muestreo aleatorio simple
τ̂ = N ȳ=(900)(18.75)=16,875
ȳ ± tn−1,α/2 Sȳ
Por lo tanto:
18.75±(2.201)(2.4242)
18.75±5.3358
13.4142≤ µ ≤24.0858
τ̂ ± N tn−1,α/2 Sȳ
Por lo tanto:
16,875±(900)(2.201)(2.4242)
16,875±(900)(5.3358)
16,875±4,802.22
12,072.82243≤ τ ≤21,677.1776
N (tn−1,α/2 )2 S 2
n=
N d2 + (tn−1,α/2 )2 S 2
donde: N = 900, tn−1,α/2 = t12−1,0.025 = 2.201, S 2 = 71.4773, d = 2
Por lo tanto:
(900)(2.201)2 (71.4773)
n= = 79 colonias.
(900)(2)2 + (2.201)2 (71.4773)
50
h) Suponga que n′ = 12 es una muestra preliminar. ¿Cuál es el tamaño de
muestra para estimar el total de drogadictos en el estado, con una precisión
de 1800 drogadictos y una confiabilidad de 95 %?
N 2 (tn−1,α/2 )2 S 2
n=
d2 + N (tn−1,α/2 )2 S 2
donde: N = 900, tn−1,α/2 = t12−1,0.025 = 2.201, S 2 = 71.4773, d = 1, 800
Por lo tanto,
3.4. Ejercicios
51
Capítulo 3. Muestreo aleatorio simple
Esta aplicación también se conoce como muestreo por atributos, donde ca-
da unidad de muestreo podría pertenecer a determinado grupo debido a que
posee cierto atributo.
3.5.1. La medición
La medición consiste en determinar si la unidad de muestreo tiene el a-
tributo que la haría pertenecer a la proporción que se desea conocer. Para
muchos atributos tal determinación puede ser muy sencilla, por ejemplo, en
un conjunto de N computadoras; pertenecer a cierta marca. Sin embargo, a
veces es difícil determinar el atributo, por ejemplo, calificar a un paciente como
enfermo o no, es una condición en la que se presenta una gradualidad desde
sano hasta enfermo. Es decir, el MAS para proporciones no considera los esta-
dos intermedios, por lo que debe establecerse un criterio unívoco que permita
calificar al paciente como sano o enfermo solamente.
52
de interés aporta un valor de uno y si no la tiene aporta un valor de cero.
53
Capítulo 3. Muestreo aleatorio simple
τ̂ = N p
¶µ 2¶
Sy
µ µ ¶
2 N −n 2 N − n ³ pq ´
Sτ̂ = N =N
N n N n
La raíz cuadrada positiva de la varianza del estimador del total es el error
estándar del estimador del total.
p ± tn−1,(α/2) Sp
µ ¶³
N −n pq ´
donde Sp =
N n
El intervalo de confianza para la estimación del total poblacional
τ̂ ± N tn−1,(α/2) Sp
54
µ ¶³
N −n pq ´
donde Sp =
N n
55
Capítulo 3. Muestreo aleatorio simple
3.5.6. Ejemplos
Ejemplo 1. Con la finalidad de estimar la proporción de estudiantes que fu-
man en la Facultad de Medicina de la U de C , cuya población es de N = 430
estudiantes, se seleccionó una muestra aleatoria de n = 80 estudiantes. Si la
muestra indica que 30 de los estudiantes seleccionados fuman, calcular lo
siguiente:
p ± Zα/2 Sp
Por lo tanto:
0.375±(1.96)(0.0488)
0.375±0.09565
0.2793≤ P ≤0.4707
τ̂ = N p
56
Por lo tanto
τ̂ = (430)(0.375) = 161.25
τ̂ ± Zα/2 N Sp
Por lo tanto:
161.25±(430)(1.96)(0.0488)
161.25±(430)(0.09565)
161.25±41.1295
120.0938≤ τ ≤202.4062
N (Zα/2 )2 pq
n=
N d2 + (Zα/2 )2 pq
donde: N = 430, p = 0.375, q = 0.625. Como la precisión tiene que ser 10 %
de la proporción preliminar (p=0.375), d = (0.10)(p̂)=(0.10)(0.375)=0.0375:
por lo tanto:
N 2 (Zα/2 )2 pq
n=
d2 + N (Zα/2 )2 pq
donde: N = 430, p = 0.375, q = 0.625, Zα/2 = Z0.025 = 1.96 y d = (0.10)(430)(0.375) =
16.125
Por lo tanto:
57
Capítulo 3. Muestreo aleatorio simple
Por lo tanto:
sµ
√
¶µ ¶
2, 000 − 50 (0.44)(0.56) p
Sp = = (0.975)(0.0049) = 0.0048048 = 0.0693
2, 000 50
c) Encontrar un IC de 95 % para la proporción verdadera.
p ± Zα/2 Sp
Por lo tanto:
0.44±(1.96)(0.0693)
0.44±0.1358
0.3041≤ P ≤0.5759
τ̂ = N p
58
Por lo tanto:
τ̂ = (2, 000)(0.44) = 880
τ̂ ± Zα/2 N Sp
Por lo tanto:
880±(2,000)(1.96)(0.0693)
880±(2,000)(0.1358)
880±271.6
608.2787≤ τ ≤1,151.7213
N (Zα/2 )2 pq
n=
N d2 + (Zα/2 )2 pq
donde: N = 2, 000, p = 0.44, q = 0.56 y d = 0.07
Por lo tanto:
N 2 (Zα/2 )2 pq
n=
d2 + N (Zα/2 )2 pq
donde: N = 2, 000, p = 0.44, q = 0.56, Zα/2 = Z0.025 = 1.96 y d = 140
Por lo tanto:
59
Capítulo 3. Muestreo aleatorio simple
Por lo tanto:
sµ
√
¶µ ¶
3, 000 − 100 (0.20)(0.80) p
Sp = = (0.9667)(0.0016) = 0.001547 = 0.03933
3, 000 100
c) Calcular un IC de 95 % para la proporción verdadera.
p ± Zα/2 Sp
De ahí que:
0.20 ± (1.96)(0.03933)
0.20 ± 0.0771
0.1229 ≤ P ≤ 0.2771
τ̂ = N p
Por lo tanto:
60
τ̂ ± Zα/2 N Sp
entonces:
N (Zα/2 )2 pq
n=
N d2 + (Zα/2 )2 pq
donde: N = 3, 000, p = 0.20, q = 0.80, d = 0.07
Por lo tanto:
N 2 (Zα/2 )2 pq
n=
d2 + N (Zα/2 )2 pq
donde: N = 3, 000, p = 0.20, q = 0.80, Zα/2 = Z0.025 = 1.96 y d = 210
Por lo tanto:
61
Capítulo 3. Muestreo aleatorio simple
n
X
yi
i=1 a 70
p= = = = 0.28 ó 28 % autos estadounidenses
n n 250
q = 1 − p = 1 − 0.28 = 0.72 ó 72 % otros autos
Por lo tanto:
sµ
√
¶µ ¶
20, 000 − 250 (0.28)(0.72) p
Sp = = (0.9875)(0.00081) = 0.0007963 = 0.02822
20, 000 250
c) Calcule un IC de 95 % para la proporción verdadera.
p ± Zα/2 Sp
Por lo tanto:
0.28 ± (1.96)(0.02822)
0.28 ± 0.0553
0.2247 ≤ P ≤ 0.3353
τ̂ = N p
Por lo tanto:
τ̂ ± Zα/2 N Sp
62
Por lo tanto:
N (Zα/2 )2 pq
n=
N d2 + (Zα/2 )2 pq
donde: N = 20,000, p = 0.28, q = 0.72 y d = 0.05
Por lo tanto:
N 2 (Zα/2 )2 pq
n=
d2 + N (Zα/2 )2 pq
donde: N = 20,000, p = 0.28, q = 0.72, Zα/2 = Z0.025 = 1.96 y d = 1, 000
Por lo tanto:
3.6. Ejercicios
En los siguientes ejercicios estime los parámetros siguientes:
63
Capítulo 3. Muestreo aleatorio simple
con N = 10, 000 personas, está de acuerdo con la reforma a PEMEX, se realizó
una encuesta tomando a n = 150 personas al azar de la población. Los resulta-
dos arrojaron que 35 personas están de acuerdo.
64
Capítulo 4
65
Capítulo 4. El muestreo aleatorio estratificado
muy parecidos dentro de cada estrato. Los estratos formados funcionan inde-
pendientemente, y se les aplica un muestreo aleatorio simple para elegir los
elementos concretos que formarán parte de la muestra y obtener así las esti-
maciones de los parámetros que nos interesan. En ocasiones las dificultades
que plantean los estratos son demasiado grandes, pues exigen un conocimien-
to detallado de la población, como tamaño geográfico, género, edades, niveles
de estudio, etcétera (Pérez, 2000 [3]).
I. Produce estimaciones más precisas que las que se obtienen a partir del
muestreo aleatorio simple.
Notación
Para esta técnica de muestreo necesitamos una notación adicional que dis-
tingue los elementos de la población, como la siguiente:
66
nh
X
yhi
i=1
ȳh = : la media muestral del estrato h.
nh
nh
X nh
X
(yhi − ȳh )2 2
yhi − nh ȳh2
i=1 i=1
Sh2 = = : la varianza en el estrato h.
nh − 1 nh − 1
Si se desea conocer la cantidad de horas promedio que cierto grupo de
personas de una ciudad ve la televisión, debemos pensar que habrá niños,
jóvenes y adultos, y que el tiempo de horas libres varía de un grupo a otro. De
esta manera dividimos la población en tres estratos, ya que es lógico afirmar
que las tendencias dentro de cada estrato son similares y son homogéneas.
También podemos entender que el número total de personas de la población
es la suma de los elementos de los estratos. Otro ejemplo es el siguiente: si
queremos conocer el ingreso promedio de las familias en Colima, donde se
supone que existen tres clases sociales bien definidas, podemos considerar las
familias de la misma clase social como un estrato, ya que es homogéneo.
67
Capítulo 4. El muestreo aleatorio estratificado
E
X
Nh ȳh
h=1
ȳestr =
N
Nótese que se ha usado el subíndice estr en ȳestr para señalar que la esti-
mación se hace con el muestreo estratificado.
Dado que cada estrato se maneja de manera independiente, las ȳk con
h = 1, 2, . . . E también son independientes. Por lo tanto, la varianza de ȳestr
es la suma de las varianzas de las medias de cada estrato. Este estimador es
insesgado.
68
4.3.2. El intervalo de confianza para la estimación de la me-
dia estratificada
v
u
u 1 XE µ ¶µ 2 ¶
2 N h − nh Sh
ȳestr ± t(n−1,α/2) t
2
Nh
N h=1 Nh nh
v
u E
uX
ȳestr ± t(n−1,α/2) t W 2S 2 h ȳh
h=1
E
X
τ̂estr = N ȳestr = N1 ȳ1 + N2 ȳ2 + . . . + NE ȳE = Nh ȳh ,
h=1
E
Sh2
µ ¶µ ¶
2 2
X N h − nh
V̄ (N ȳestr ) = N V (ȳestr ) = N Wh2 , (4.1)
h=1
Nh nh
69
Capítulo 4. El muestreo aleatorio estratificado
α : el nivel de significancia.
E
X
N (t(n−1,α/2) )2
Wh Sh2
h=1
n= E
X
N d2M + (t(n−1,α/2) )2 Wh Sh2
h=1
Wh = Nh /N
dM = el tamaño del error que se desea aceptar en la estimación de la media.
70
El tamaño de muestra para estimar el total estratificado
E
X
2
N (t(n−1,α/2) )2
Wh Sh2
h=1
n= E
,
X
d2T + N (t(n−1,α/2) )2 Wh Sh2
h=1
Wh = Nh /N ,
dT = tamaño del error que se desea aceptar en la estimación del total.
Nh
ni = n = Wh n; i = 1, 2, . . . , h,
N
o especificamente como:
N1 N2 Nh
n1 = n, n2 = n, . . . , nh = n.
N N N
71
Capítulo 4. El muestreo aleatorio estratificado
En ocasiones es una tarea sencilla debido a que los estratos están implíci-
tos y se conoce el comportamiento con base en registros antiguos, nuestra
experiencia o simplemente en la naturaleza de los resultados que deseamos
obtener.
III . Se forman dos columnas más, una constituida por la raíz de las frecuen-
cias y otra por su raíz acumulada.
VI . Se puede delimitar con las marcas de clase por estrato, eligiendo la raíz
de la frecuencia acumulada más cercana a la marca de clase y así cada
estrato estará formado por todas las clases de la variable original que
correspondan a la marca de clase.
72
4.4.1. Ejemplos
Ejemplo 1. En Tecomán, Colima, hay 780 parcelas sembradas con limón. Se
desea estimar el promedio de plantas por hectárea, que en determinada etapa
del cultivo se infectaron de alguna enfermedad. De acuerdo con las condiciones
ecológicas en la región se siembran tres variedades de limón. Considerando
que el desarrollo de la enfermedad puede ser distinto de una variedad a otra,
la población de parcelas se estratificó en E = 3 estratos. Los tamaños de los
estratos son: N1 = 270, N2 = 180 y N3 = 330; N = N1 + N2 + N3 = 780. Suponga
que para realizar las estimaciones se tomó una muestra de n = 63 parcelas.
Los datos se presentan en el cuadro 4.1.
73
Capítulo 4. El muestreo aleatorio estratificado
τ̂estr = N ŷestr
Por lo tanto:
¶2 µ
µ ¶ µ 2 ¶ µ ¶2 µ ¶µ 2¶
N1 N 1 − n1 S1 N2 N 2 − n2 S2
Sȳ2estr
= +
N ¶ µ N1 ¶n
µ1 2 ¶ N N2 n2
µ 2
N3 N 3 − n3 S3
+
N N3 n3
donde: N1 = 270, N2 = 180, N3 = 330, N = 780, n1 = n2 = n2 = n3 = 21,
Por lo tanto:
57.1558 ± (1.96)(0.7967)
57.4579 ± 1.5551
55.5943 ≤ µestr ≤ 58.7173
74
e) Halle por intervalo el total de plantas infectadas en la población con una
confiabilidad del 95 %
donde: τ̂estr = 44, 581.524, N = 780, Zα/2 = Z0.025 = 1.96 y Sȳestr = 0.7934
Por lo tanto:
(780)(1.96)2 (48.7679)
n= = 59 parcelas (muestra)
(780)(1.7146)2 + (1.96)2 (48.7679)
Asignación de la muestra en forma proporcional.
N1 270
n1 = n= (59) = 20
N 780
N2 180
n2 = n= (59) = 14
N 780
75
Capítulo 4. El muestreo aleatorio estratificado
N3 330
n3 = n= (59) = 25
N 780
g) Suponga que n =63 es una muestra preeliminar. Determine el tamaño de
muestra para estimar el total con una precisión de ±3 % del total estratifica-
do y con una confiabilidad de 95 %. Además, asigne n a cada estrato en forma
proporcional al tamaño.
E
X
2
N (Zα/2 ) 2
Wh Sh2
h=1
n= E
X
2
d2 + (Zα/2 )2 W h Sh
h=1
E
X
Aquí d = (0.03)(44585.628) = 1337.568 y Wh Sh2 = 48.7679
h=1
Por lo tanto:
(780)2 (1.96)2 (48.7679)
n= = 59
(1337.568)2 + (780)(1.96)2 (48.7679)
De ahí que el número estimado de unidades muestrales (parcelas) que deben
constituir la muestra con una precisión de ±1, 337.568 plantas y 0.05 de proba-
bilidad de no incluir en el intervalo de estimación al total verdadero, es de 59
parcelas. Por tanto, la asignación proporcional es la misma. Es decir, la mues-
tra a extraer de cada estrato será de 20 en el estrato 1, 14 en el estrato 2 y de
25 en el estrato 3.
3 + 2 + 3 + ... + 5 + 2
ȳ4 = = 3.2222.
9
Por lo tanto:
µ ¶2 µ ¶µ ¶ µ ¶2 µ ¶µ ¶
120 120 − 12 1.5152 100 100 − 10 0.8889
Sy2e = +
400
µ ¶2 µ 120 ¶µ 12 ¶ µ 400 ¶2 µ 100 ¶ µ 10¶
90 90 − 9 0.2728 90 90 − 9 1.4444
+ + = 0.02395
400 p 90 √ 9 400 90 9
Syestr = Sy2estr = 0.02395 = 0.1547
77
Capítulo 4. El muestreo aleatorio estratificado
ŷestr = N ȳestr
Por lo tanto:
Por lo tanto:
4.675 ± (1.96)(0.1547)
4.675 ± 0.30330025
4.3717 ≤ µestr ≤ 4.9783
Esto significa que el promedio de fallas justificadas está entre 4.3717 y 4.9783.
Por lo tanto:
1, 870 ± (400)(1.96)(0.1547)
1, 870 ≤ (400)(0.3033)
1, 870 ± 121.3201
1, 870 ± 121.3201
1, 748.6821 ≤ τestr ≤ 1, 991.3179
Esto quiere decir que total de plantas infectadas por hectárea está entre 1,748.6821
y 1,991.3179.
78
E
X
N (Zα/2 )2 Wh Sh2
h=1
n= E
¢2 X
Wh Sh2
¡
N d2 + Zα/2
h=1
donde:
E
X N1 2 N2 2 N3 2
Zα/2 = Z0.025 = 1.96, d = (0.05)(4.675) = 0.23375, Wh Sh2 = S + S + S
h=1
N 1 N 2 N 3
Por lo tanto:
(400)(1.96)2 (1.0643)
n= = 63.05353 alumnos (muestra)
(400)(0.2337)2 + (1.96)2 (1.0643)
Asignación de la muestra en forma proporcional.
N1 120
n1 = n= (64) = 18.9106 ≈ 19
N 400
N2 100
n2 = n= (64) = 15.7588 ≈ 16
N 400
N3 90
n3 = n= (64) = 14.1829526 ≈ 14
N 400
N4 90
n4 = n= (64) = 14.1829526 ≈ 15
N 400
g) Suponga que n = 40 es una muestra preliminar. Determine el tamaño de
muestra para estimar el total con una precisión de 5 % del total estratificado y
una confiabilidad de 95 %. Además, asigne n a cada estrato en forma propor-
cional al tamaño.
E
X
2
N (Zα/2 ) 2
Wh Sh2
h=1
n= E
X
2
d2 + N (Zα/2 )2 W h Sh
h=1
XE
Aquí d = (0.05)(4.675)(400) = 93.5 y Wh Sh2 =1.0643
h=1
Por lo tanto:
79
Capítulo 4. El muestreo aleatorio estratificado
Cuadro 4.3: El ingreso promedio mensual (miles de pesos) de las familias chia-
panecas.
Estrato 1 Estrato 2 Estrato 3
10 12 8 8 4 3
11 12 8 3 3
12 13 8 2 4
10 14 7 4 4
9 11 6 3
8 9 5
13 9 4
14 8 3
9 9 5
8 9 2
80
43019.6970
ȳestr = = 7.1699 miles de pesos mensuales (promedio)
6000
b) Realice la estimación puntual del total estratificado.
τ̂estr = N ȳestr
Por lo tanto:
ȳestr ± Z α2 Sȳestr
Por lo tanto:
7.1699 ± (1.96)(0.2140)
7.1699 ± 0.4196
6.750375 ≤ µestr ≤ 7.589541
81
Capítulo 4. El muestreo aleatorio estratificado
e) Realice la estimación por intervalo del total estratificado con una confia-
bilidad de 95 %.
τ̂estr ± N Z α2 Sȳestr
Por lo tanto:
Por lo tanto:
(6000)(1.96)2 (1.9469)
n= = 57.6349 familia (muestra)
(6000)(0.3585)2 + (1.96)2 (1.9469)
Asignación de la muestra en forma proporcional
82
N1 2000
n1 = n= (57.6349) = 19.2116
N 6000
N2 1500
n2 = n= (57.6349) = 14.4087
N 6000
N3 2500
n3 = n= (57.6349) = 24.0145
N 6000
Por lo tanto:
4 + 3 + 4 + ... + 5 + 4
ȳ3 = =4
5
Por lo tanto:
(1000)(7.60) + (1600)(6) + (600)(4.00)
ȳestr =
3200
19600
ȳestr = = 6.125 horas diarias en promedio
3200
τ̂estr = N ȳestr
Por lo tanto:
84
µ ¶2 µ ¶µ ¶ µ ¶2 µ ¶µ ¶
1000 1000 − 10 1.60 1600 1500 − 15 1.1421
Sy2estr = +
3200
µ ¶2 µ 1000 ¶ µ 10 ¶ 3200 1600 15
600 600 − 5 0.50
+ = 0.0378
p 3200 √ 600 5
Syestr = Syestr = 0.0378 = 0.1945
d) Halle por intervalo de la media estratificada con una confiabilidad de
95 %.
Por lo tanto:
6.125 ± (1.96)(0.1945)
6.125 ± 0.38122
5.72723 ≤ µestr ≤ 6.522764
Esto significa que el promedio de horas por día que las familias de Colima
ven televisión está entre 5.72723 y 6.522764.
donde: τ̂estr = 19, 600, N = 3, 200, Zα/2 = Z0.025 = 1.96 y Syestr = 0.1945
Por lo tanto:
19,600±(3,200)(1.96)(0.1945)
19,600±(3,200)(0.3978)
19,600±1,272.96
18,327.1521≤ τestr ≤20,872.8479
Entonces, el total de horas por día que las familias de Colima ven televisión
está entre 18,327.1521 y 20,872.8479.
donde:
85
Capítulo 4. El muestreo aleatorio estratificado
E
X N1 2 N2 2 N3 2
Zα/2 = Z0.0025 = 1.96, d = (.05)(6.125) = 0.30625 y Wh Sh2 = S + S + S =
h=1
N 1 N 2 N 3
1.1652
Por lo tanto:
(3200)(1.96)2 (1.1945)
n= = 52 familias (unidades mues-
(3200)(0.30125)2 + (1.96)2 (1.1945)
trales)
por lo tanto:
86
4.5. Ejercicios
En los ejercicios siguientes estime:
Cuadro 4.5: Resultado del número más probable de coliformes fecales por 100
ml. de agua.
Preurbana Urbana Posturbana
350 920 1,600
240 920 2,400
1,600 920 1,600
2,400 1,600
2,400
2,400
1,600
2,400
87
Capítulo 4. El muestreo aleatorio estratificado
Defínase
88
Cuadro 4.8: Porcentaje de tanino por kg. de nance.
Variedad 1 Variedad 2 Variedad 1
(n1 = 10) (n2 = 20) (n3 = 14)
04 06 06 04 07
05 05 05 05 07
04 07 06 05 07
03 06 05 04 06
05 05 06 06
05 05 07 07
04 06 05 07
03 06 05 06
02 05 05 05
05 05 07 04
1 éxito
½
yh,i =
0 fracaso
que representa al i-ésimo componente del h-ésimo estrato. El éxito consiste en
tener la característica C.
Esta variable se comporta como una variable aleatoria del tipo binomial,
por lo que el estimador de la proporción de la característica de interés para el
estrato h es: nh
X yh,i
ph =
i=1
nh
Y su varianza correspondiente es,
µ ¶
2 Nh − nh ph (1 − ph )
S ph =
Nh nh
Obsérvese que ph es un estimador insesgado de Ph , la proporción de unidades
muestrales que tienen la característica C (Scheaffer, 1987 [2]). De la misma
manera, N ∗ ph también es un estimador insesgado del total en el estrato h que
E
X
cuentan con la característica C. De tal manera Nh ph es un buen estimador
h=1
del total poblacional que cuenta con la característica C (Pérez, 2000 [3]).
89
Capítulo 4. El muestreo aleatorio estratificado
1
Sp2h = (N 2 S 2 + ... + NE2 Sp2E )
N 2 1 p1
E
1 X 2 2
= N S (proporción)
N 2 h=1 h ph
Sτ̂2st = (N12 Sp21 + ... + NE2 Sp2E )
XE
= Nh2 Sp2h (total.)
h=1
v
u
u 1 XE µ ¶µ ¶
2 N h − n h p h q h
τ̂ ± N t(n−1,α/2) t 2 N
N h=1 h N nh
E
¡ ¢2 X
N t(n−1,α/2) Wh p h qh
h=1
n= E
X
N d2M + (t(n−1,α/2) )2 Wh p h qh
i=1
donde,
Nh
Wh =
N
dM = el tamaño del error que se desea aceptar en la estimación de la media
90
E
X
2 2
N (t(n−1,α/2) ) Wh p h qh
h=1
n= E
X
d2T + N (t(n−1,α/2) )2 Wh p h qh
i=1
Nh
Wh =
N
dT = el tamaño del error que se desea aceptar en la estimación del total
Nh
ni = n = Wh n; i = 1, 2, . . . , h,
N
o especificamente como:
N1 N2 Nh
n1 = n, n2 = n, . . . , nh = n.
N N N
Nótese que a los estratos más grandes les corresponderá un tamaño de mues-
tra mayor, esto es, la asignación de n entre los estratos es proporcional al
tamaño de cada estrato.
4.6.5. Ejemplos
i=1 40
p1 = = = 0.327731,
n1 120
91
Capítulo 4. El muestreo aleatorio estratificado
n2
X
i=1 50
p2 = = = 0.5
n2 100
Por lo tanto:
1
pst =
(2600(0.3333) + 2400(0.5))
5000
1 2066.6667
pst = (866.6667 + 1200) = = 0.4133 ó 41.33 % de en-
5000 5000
fermos con diabetes
τ̂ = N pst
Por lo tanto:
Por lo tanto:
92
0.4133± (1.645)(0.0321)
0.4133± 0.0528
0.355066 ≤ P ≤ 0.4609255
τ̂ ± N tα/2,n−1 Sps t
Por lo tanto:
2006.6667± (5000)(1.645)(0.0321)
2006.6667± (5000)(0.0528)
2006.6667± 264
1, 775.331715 ≤ τst ≤ 2, 304.627542
Esto significa que el total de personas que padecen diabetes está entre 1,802.7676
y 2,330.5657.
E
X N1 N2
donde: Zα/2 = Z0.05 = 1.645, d = 0.05, Wh Sh2 = p 1 q1 + p2 q2 = 0.2356
h=1
N N
Por lo tanto:
N2 2400
n2 = n= (242) = 116
N 5000
g) Suponga que n = 220 es una muestra preliminar. Determine el tamaño de
muestra para estimar la proporción con una precisión de 100.3333 y una con-
fiabilidad de 95 %. Además, haga la asignación de n a cada estrato en forma
proporcional al tamaño.
E
X
2 2
N (Zα/2 ) Wh p h qh
h=1
n= X
d2 + N (Zα/2 )2
E
X
d = (0.05)(2, 006.667) = 100.3333 y Wh ph qh =0.2356
h=1
Por lo tanto:
Ejemplo 2. Una empresa que produce artículos electrónicos tiene tres líneas
de producción. La línea uno produce N1 = 2, 000 artículos por hora, la dos
N2 = 1, 500 artículos por hora y la tres produce N3 = 2, 500 artículos por hora.
La producción total por hora es de N = 6, 000. Con la finalidad de estimar el
porcentaje y total de artículos defectuosos producidos por hora, se tomó una
muestra aleatoria de n = 150 artículos distribuidos de la siguiente manera:
n1 = 50 de la línea uno, n2 = 30 de la línea dos y n3 = 70 de la línea tres, debido
a que las líneas de producción no son idénticas y se sospecha que el número
de artículos defectuosos por líneas son diferentes. En la muestra de la línea
uno (n1 ) se encontraron 4 defectuosos; en la muestra de la línea dos, 3; y en la
línea tres hubo 8 defectuosos.
i=1 4
donde: N = 6, 000, N1 = 2, 000, N2 = 1, 500, N3 = 2, 500, p1 = = = 0.08,
n1 50
n2
X n3
X
i=1 3 8
p2 = = = 0.1, p3 = i=1 = = 0.1143
n2 30 n3 70
Por lo tanto:
1
pst = (2000(0,08) + 1500(0.1) + 2500(0.1142))
6000
94
1 595.7142
pst = (160 + 150 + 285.7142) = = 0.0992 ó 9.92 %
6000 6000
articulos producidos por hora
τ̂ = N pst
por lo tanto:
Por lo tanto:
0.0992± (1.645)(0.0242)
0.0992± 0.039809
0.0594≤ P ≤ 0.1390
95
Capítulo 4. El muestreo aleatorio estratificado
τ̂ ± N tα/2,n−1 Sps t
Por lo tanto:
595.8± (6000)(1.645)(0.024)
595.8± (6000)(0.03948)
595.8± 236.88
356.555 ≤ τst ≤ 834.8730
Estratos Nh ph qh Wh p h qh
1 2,000 0.08 0.92 0.0245
2 1,500 0.1 0.99 0.0225
3 2,500 0.1143 0.8857 0.0422
Total 6,000 0.0892
E
X N1 N2 N3
donde: Zα/2 = Z0.05 = 1.645, d = 0.05, Wh Sh2 = p 1 q1 + p 2 q2 + p3 q3 = 0.0892
h=1
N N N
Por lo tanto:
E
X
aquí d = (0.05)(6000) = 300 y Wh ph qh = 0.0892
h=1
(6000)2 (1.645)2 (0.0892)
n= = 95.0325
(300)2 + (6000)(1.645)2 (0.0892)
i=1 30
p1 = = = 0.3333,
n1 90
n2
X
i=1 70
p2 = = = 0.4666,
n2 150
n3
X
i=1 40
p3 = = = 0.6666,
n3 60
97
Capítulo 4. El muestreo aleatorio estratificado
Por lo tanto:
1
pst = (3000(0.3333) + 5000(0.4666) + 2000(0.6666))
10000
1 4, 666.6667
pst = (1000 + 2, 333.3333 + 1, 333.3333) = = 0.4667
10000 10000
o el 46.67 % de personas ven telenovelas
τ̂ = N pst
Por lo tanto:
Por lo tanto:
0.4667± (1.645)(0.0276)
98
0.4667± 0.0454
0.42228≤ P ≤ 0.51329
τ̂ ± N tα/2,n−1 Sps t
Por lo tanto:
4666,6667± (10, 000)(1,645)(0,0276)
4666,6667± (10, 000)(0,04539)
4666,6667± 453,9811
4, 212.7259 ≤ τst ≤ 5, 120.6074
Estratos Nh ph qh Wh p h qh
1 3,000 0.3333 0.6667 0.0667
2 5,000 0.4667 0.5333 0.1244
3 2,000 0.6667 0.3333 0.0444
Total 10,000 0.2355
99
Capítulo 4. El muestreo aleatorio estratificado
E
X
donde: d = 500 y Wh ph qh = 0.2356
h=1
por lo tanto:
100
n1
X
i=1 7
p1 = = = 0.5385,
n1 13
n2
X
i=1 6
p2 = = = 0.5454,
n2 12
n3
X
i=1 5
p3 = = = 0.625,
n3 8
n4
X
i=1 5
p4 = = = 0.71428
n4 7
Por lo tanto:
1
pst =
(174(0.5385) + 150(0.500) + 138(0.625) + 138(0.7143)) = 0.5892
600
ó 58.92 % alumnos leyeron el libro
τ̂ = N pst
Por lo tanto:
τ̂ = (600)(0.5892) = 353.52
101
Capítulo 4. El muestreo aleatorio estratificado
1
Sp2h = ((174)2 (0.0177)+(150)2 (0.0192)+(138)2 (0.0276)+(138)2 (0.0277))
6002
= 0.0014
p √
Sp = Sp2 = 0.0056 = 0.0749
Por lo tanto:
0.5892± (1.645)(0.0749)
0.5892± 0.1232
0.4761 ≤ P ≤ 0.7124
Esto significa que la proporción verdadera de lectores varía entre 46.60 y 71.24
%, con una confiabilidad de 90 %.
τ̂ ± N tα/2,n−1 Sps t
Por lo tanto:
353.52± (600)(1.645)(0,0749)
353.52± (600)(0.0626)
353.52± 37.6108
285.710 ≤ τst ≤ 434.9533
El total de alumnos lectores fluctúa entre 285.710 y 434.9533, con una confia-
bilidad de 90 %.
102
Estratos Nh ph qh Wh p h qh
1 174 0.5385 0.4615 0.0721
2 150 0.500 0.500 0.0625
3 138 0.625 0.375 0.0539
4 138 0.7143 0.2857 0.0469
Total 600 0.2354
(600)(1.645)2 (0.2354)
n= = 179 personas (muestra)
(600)(0.05)2 + (1.645)2 (0.2354)
Asignación de la muestra en forma proporcional
N1 174
n1 = n= (179) = 52
N 600
N2 150
n2 = n= (179) = 45
N 600
N3 138
n3 = n= (179) = 41
N 600
N4 138
n4 = n= (179) = 41
N 600
E
X
donde: d = (0.05)(600) = 30 y Wh ph qh = 0.2354
h=1
por lo tanto:
103
Capítulo 4. El muestreo aleatorio estratificado
4.7. Ejercicios
En los siguientes ejercicios estime los parámetros siguientes:
104
Capítulo 5
El muestreo sistemático
La estadística produce
resultados muy precisos.
Cuando es bien utilizada
y se respetan sus principios.
OAML
Muestra sistemática
Es una muestra que se obtiene con una unidad muestral por cada
k unidades en la población de tamaño N , una vez que se obtuvo el
primer elemento, el cual se selecciona aleatoriamente dentro de los
primeros k elementos que conforman el marco de muestreo. De esta
manera, tomando el valor apropiado de k, se dice que se tiene una
muestra de 1 en k.
Ysy
105
Capítulo 5. El muestreo sistemático
múltiplo de k.
106
5.1. Tipos de población por su estructura
Población aleatoria
4
2
0
5 10 15 20
Población ordenada
Población periódica
107
Capítulo 5. El muestreo sistemático
10
9
Y
8
7
6
−1 0 1 2 3
cíclica con respecto a la variable de interés. Scheaffer et. al. (1987) [2] señala
que una muestra sistemática extraída de ésta población proporciona menos
información que una muestra aleatoria simple por unidad de costo. Como en
las situaciones anteriores la varianza sistemática del estimador no puede esti-
marse a partir de una sola muestra sistemática. se puede aproximar su valor
empleando las expresiones correspondiente que da el muestreo aleatorio sim-
ple, pero como es de esperarse ésta aproximación subestimará la varianza
verdadera (sistemática).
Como una alternativa para que ésta subestimación sea mínima se sugiere
cambiar varias veces el punto de inicio aleatorio con el propósito de mezclar
los elementos de la población y al mismo tiempo seleccionar la correspondi-
ente muestra sistemática. En consecuencia se puede suponer que la muestra
así extraída es sistemática y proviene de una población aleatoria.
Para lecturas adicionales véase por ejemplo, Kish L. (1972)[12] cap. 4, Azorin
F. (1972)[15] cap.21 y Scheaffer et. al. (1987)[2] cap. 7.
108
En seguida se dan formas de como elegir el valor de k dependiente del
tamaño de la población:
Procedimiento:
Procedimiento:
109
Capítulo 5. El muestreo sistemático
En este caso puede darse un valor tentativo de k; sin embargo, podría ser
muy grande y nos daría un tamaño de muestra menor que el requerido en
el estudio. Esto no representaría un problema si se tuviera la posibilidad
de tomar nuevamente la muestra y así seleccionar la k que proporcione el
tamaño requerido. Sin embargo, existen muchos casos en los que esto no
es posible y es necesario tener una precisión dada al principio. Esto hace
difícil la tarea de estimar un valor adecuado de k (Pérez, 2000 [3]).
n
X
yi
i=1
µ̂ = ȳsY =
n
τ̂sY = N ȳsY
A continuación se presentan los estimadores correspondientes a las varian-
zas de la media y del total.
110
El estimador de la varianza del total se obtiene multiplicando el estimador
de la varianza de la media por N 2 .
σ2
V (ȳsY ) = [1 + (n − 1)ρXY ] .
n
En la fórmula anterior aparece la medida de correlación, ρXY , que indica la
relación que existe entre los elementos de la muestra. Así pues, el muestreo
sistemático estará muy ligado a este indicador. Si ρXY está alrededor de uno,
quiere decir que los elementos están estrechamente relacionados y esto pro-
ducirá una mayor varianza de la media que en el muestreo simple aleatorio,
por lo que este último será el más indicado. En caso contrario, si ρXY está cerca
de cero, la estimación por muestreo sistemático es la más recomendada pues
la varianza es aproximadamente igual al muestreo simple aleatorio. (Scheaffer,
1987 [2]). Por lo tanto, es importante aclarar que los estimadores muestrales
de este capítulo son apropiados cuando el coeficiente de correlación (ρXY ) es
casi cero, de lo contrario la muestra debe ser seleccionada bajo MAS o MAE.
111
Capítulo 5. El muestreo sistemático
5.3.4. Ejemplos
Ejemplo 1. Una línea de producción de leche ultrapasteurizada elabora N =1,000
envases por hora (cada envase contiene un litro de leche). Se desea saber si
cada envase de leche cumple con el porcentaje de grasa y para ello se toma
una muestra sistemática de 10 envases. Primero se elige k.
N 1, 000
k= = = 100
n 10
Esto quiere decir que se debe muestrear cada 100 envases de leche, eligiendo
aleatoriamente el primer elemento entre los primeros 100. Los datos están en
el cuadro 5.2.
Por lo tanto:
2.72 ± (2.2622)(0.04874)
2.72 ± 0.11026
2.6097 ≤ µ ≤ 2.8303
ȳ ± N tn−1,α\2 SS ȳ
Por lo tanto:
2,720 ± (1, 000)(2.2622)(0.04874)
113
Capítulo 5. El muestreo sistemático
N (tn−1,α\2 )2 Ss2
n=
N d2 + (tn−1,α/2 )2 Ss2
donde: N = 1, 000, tn−1,α\2 = t10−1,0.025 = 2.2622, Ss2 = 0.024 y d = 0.05
Por lo tanto:
N (tn−1,α\2 )2 Ss2
n=
d2 + N (tn−1,α\2 )2 Ss2
donde: N = 1, 000, tn−1,α\2 = t12−1,0,025 = 2.2622, Ss2 = 0.024 y d = 50
por lo tanto:
114
Cuadro 5.3: El peso de los sacos de maíz (Kg)
n Muestra Peso (Kg)
1 Saco 10 71.89
2 Saco 135 74.24
3 Saco 260 77.60
4 Saco 385 82.94
5 Saco 510 73.17
6 Saco 635 77.09
7 Saco 760 66.29
8 Saco 885 75.17
9 Saco 1010 64.41
10 Saco 1135 80.08
11 Saco 1260 79.82
12 Saco 1385 73.15
13 Saco 1510 72.88
14 Saco 1635 81.15
15 Saco 1760 78.29
16 Saco 1885 74.62
17 Saco 2010 83.31
18 Saco 2135 73.36
19 Saco 2260 69.75
20 Saco 2385 77.04
y1 + y2 + y3 + . . . + yn
ȳs =
n
71.89 + 74.24 + 77.60 + . . . + 77.04
ȳs = = 75.3125
20
b) Halle la varianza muestral (S 2 ).
n
X
yi2 − nȳ 2
i=1
Ss2 =
n−1
(71.89)2 + (74.24)2 + (77.60)2 + . . . + (77.04) − (20)(75.3125)2
Ss2=
20 − 1
2 483.0747
Ss = = 25.4249
19
c) Calcule la varianza y la desviación estándar de la media muestral.
µ ¶µ 2¶ µ ¶µ ¶
N − n S 2, 500 − 20 25.4249
Sȳ2s = = = 1.2611
N n 2, 500 20
p √
Sȳs = Sȳ2s = 1.2611 = 1.12297
115
Capítulo 5. El muestreo sistemático
Por lo tanto:
75.3125 ± (2.093)(1.12297)
75.3125 ± 2.3504
72.9621 ≤ µ ≤ 77.6629
τ̂ ± N tn−1,α\2 Sȳs
donde: τ̂s = 188, 281.25, N = 2, 500, Sȳs = 1.12297 y tn−1,α\2 = t12−1,0.025 = 2.0930
Por lo tanto:
188, 281.25 ± (2, 500)(2.0930)(1.12297)
188, 281.25 ± (2, 500)(2.3503)
188, 281.25 ± 5875.9819
182, 405.201 ≤ τs ≤ 194, 157.299
Es decir, se estima que el total de kg de maíz que hay en los sacos está entre
182,405.201 y 194,157.299.
N (tn−1,α\2 )2 Ss2
n=
N d2 + (tn−1,α\2 )2 Ss2
donde: N = 2, 500, tn−1,α\2 = t20−1,0.025 = 2.0930, Ss2 = 25.4249 y d = 0.5
Por lo tanto:
Por lo tanto, 379 es el tamaño de muestra que tiene una precisión de ±0.5
kg de maíz y 0.95 de probabilidad de incluir en el intervalo de estimación el
promedio verdadero.
116
h) Suponga que la muestra seleccionada representa una muestra prelimi-
nar de tamaño n = 20. ¿Cuál es el tamaño de muestra para estimar el total de
kg con una precisión de 1,250 kg de maíz y una confiabilidad de 95 %?
N 2 (tn−1,α/2 )2 S 2
n=
d2 + N (tn−1,α/2 )2 S 2
donde: N = 2, 500, tn−1,α\2 = t20−1,0.025 = 2.0930, Ss2 = 25.4249 y d = 1, 250
Por lo tanto:
117
Capítulo 5. El muestreo sistemático
118
d) Calcular el total estimado de sacarosa en la población.
τ̂s = N ȳs = (6, 000)(13.5645) = 81, 388.00 gramos
Por lo tanto:
13.5645 ± (2.0452)(0.4554)
13.5645 ± 0.9317
12.6330 ≤ µ ≤ 14.4963
τ̂ ± N tn−1,α\2 Sȳs
donde: τ̂s = 81, 388, N = 6, 000, Sȳs = 0.4554 y tn−1,α\2 = t30−1,0.025 = 2.0452
Por lo tanto:
81, 386.84 ± (6, 000)(2.0452)(0.4555)
81, 386.84 ± (6, 000)(0.9316)
81, 386.84 ± 5590.1517
75, 797.76736 ≤ τs ≤ 86, 978.23264
N 2 (tn−1,α\2 )2 Ss2
n=
N d2 + (tn−1,α\2 )2 Ss2
donde: N = 6, 000, t(n−1,α\2) = t(30−1,0.025) = 2.0452, Ss2 = 6.2538 y d = 0.5
Por lo tanto:
119
Capítulo 5. El muestreo sistemático
N (tn−1,α\2 )2 Ss2
n=
d2 + N (tn−1,α\2 )2 Ss2
donde: N = 6, 000, tn−1,α\2 = t30−1,0.025 = 2.0452, Ss2 = 6,2538 y d = 3, 000
Por lo tanto:
120
3+4+5+2+1+5+1+1+2+3+4+3+2+4+2
ȳs = = 2.8
15
b) Calcular la varianza muestral (S 2 ).
n
X
yi2 − nȳ 2
i=1
Ss2 =
n−1
2
(3) + (4)2 + (5)2 + . . . (2)2 − (15)(2.8)2
Ss2 =
15 − 1
2 26.4
Ss = = 1.8857
14
c) Hallar la varianza estimada de la media muestral.
µ ¶µ 2¶ µ ¶µ ¶
N − n S 1500 − 15 1.8857
Sȳ2s = = = 0.1245
N n 1500 15
p √
Sȳs = Sȳ2s = 0.1245 = 0.3528
Por lo tanto:
2.8 ± (2.1448)(0.3528)
2.8 ± 0.7566
2.0434 ≤ µ ≤ 3.5566
τ̂ ± N tn−1,α\2 Sȳs
Por lo tanto:
4, 200 ± (1, 500)(2.1448)(0.3528)
4, 200 ± (1, 500)(0.7566)
4, 200 ± 1, 134.9793
121
Capítulo 5. El muestreo sistemático
3, 065.0276 ≤ τs ≤ 5, 334.9723
N (tn−1,α\2 )2 Ss2
n=
N d2 + (tn−1,α\2 )2 Ss2
donde: N = 1, 500, t(n−1,α\2) = t(15−1,0.025) = 2.1448, Ss2 = 1.8857 y d = 0.5
Por lo tanto:
(1, 500)(2.1448)2 (1.8857)
n= = 33.9138 paquetes de micro-
(1, 500)(0.5)2 + (2.1448)2 (1.8857)
procesadores (muestra)
N 2 (tn−1,α\2 )2 Ss2
n=
d2 + N (tn−1,α\2 )2 Ss2
donde: N = 1, 500, t(n−1,α\2) = t(12−1,0.025) = 2.1448, Ss2 = 1.8857 y d = 750
Por lo tanto:
(1, 500)2 (2.1448)2 (1.8857)
n= = 33.9138 paquetes de micro-
(750)2 + (1, 500)(1.8857)(2.1448)2
procesadores (muestra)
5.4. Ejercicios
En los siguientes ejercicios estime los parámetros siguientes:
122
cuadro 5.6.
123
Capítulo 5. El muestreo sistemático
n
X
yi
i=1
ps = ȳs = (5.2)
n
124
τs = N p s (5.3)
donde qs = 1 − ps .
¡ ¢2
N t(n−1,α/2) ps qs
n= ¡ ¢2
N d2 + t(n−1,α/2) ps qs
125
Capítulo 5. El muestreo sistemático
5.5.5. Ejemplos
Ejemplo 1. La administración de la Universidad de Colima desea conocer
la cantidad de alumnos que están satisfechos por las mejoras y los logros al-
canzados por el presidente de México. Para realizar dicha encuesta se elegirán
k alumnos entre los 10,000 estudiantes de la Universidad de Colima. Se pre-
tende obtener una muestra de 18 alumnos. A continuación obtenemos k:
N 10, 000
k= = = 555.5556
n 18
Dado que N no es multiplo de n por lo tanto k = 556, el entero más cercano.
Por ello, el primer alumno que será encuestado se elegirá aleatoriamente entre
el primero y el 10,000. Los datos se presentan en el Cuadro 5.10.
126
n
X
yi
i=1 a 9
ps = = = = 0.5 ó 50 % de alumnos satisfechos
n n 18
qs = 1 − ps = 1 − 0.5 = 0.5 ó 50 % de alumnos insatisfechos
Por lo tanto: s
√
µ ¶µ ¶
10, 000 − 18 (0.5)(0.5) p
S ps = = (0.9982)(0.0139) = 0.9982 = 0.1177
10, 000 18
c) Construya un IC de 95 % para la proporción verdadera.
ps ± tn−1,α/2 Sps
Por lo tanto:
0.5 ± (2.1098)(0.1177)
0.5 ± 0.2484
0.2516 ≤ Ps ≤ 0.7484
Por lo tanto:
τ̂ = (10, 000)(0.5) = 5, 000
e) Estime por intervalo del total verdadero de alumnos satisfechos, con una
confiabilidad de 95 %.
τ̂ ± t(n−1,α\2) N Sps
Por lo tanto:
5, 000 ± (10, 000)(2.1098)(0.1177)
5, 000 ± (10, 000)(0.2484)
500 ± 248.4
127
Capítulo 5. El muestreo sistemático
2, 515.7973 ≤ τs ≤ 7, 484.2027
N (t(n−1,α\2) )2 ps qs
n=
N d2 + (t(n−1,α\2) )2 ps qs
donde: N = 10, 000, ps = 0.5, qs = 0.5, t(n−1,α\2) = t(17,0.025) = 2.1098 y d = (0.15)(ps ) =
(0.15)(0.5) = 0.075
Por lo tanto:
(10, 000)(2.1098)2 (0.5)(0.5)
n= = 194 por alumnos (mues-
(10, 000)(0.075)2 + (2.1098)2 (0.5)(0.5)
tra)
Por lo tanto:
(10, 000)2 (2.1098)2 (0.5)(0.5)
n= = 194 alumnos (muestra)
(750)2 + (10, 000)(2.1098)2 (0.5)(0.5)
Ejemplo 2. La Secretaría de Salud del estado de Colima está interesada en
conocer la cantidad de colimenses que al menos en una ocasión se ha enfer-
mado de dengue. Supóngase que N = 8, 000 personas y se pretende encuestar
a 16 personas. El primer paso es estimar k:
N 8000
k= = = 500
n 16
128
Cuadro 5.11: Los colimenses que al menos en una ocasión se han enfermado
de dengue.
Núm. de personas Respuesta
187 0
687 1
1,187 0
1,687 0
2,187 0
2,687 0
3,187 1
3,687 1
4,187 0
4,687 0
5,187 0
5,687 1
6,187 0
6,687 0
7,187 0
7,687 0
n
X
yi
i=1 a 4
ps = = = = 0.25 ó 25 % de colimenses han padeci-
n n 16
do dengue
qs = 1 − ps = 1 − 0.25 = 0.75 ó 75 % que no han padecido la enfer-
medad
Por lo tanto: sµ ¶µ ¶
8, 000 − 16 (0.25)(0.75) p
S ps = = (0.998)(0.0117188) = 0.1081
8, 000 16
ps ± t(n−1,α\2) Sps
Por lo tanto:
129
Capítulo 5. El muestreo sistemático
0.25 ± (2.1314)(0.1081)
0.25 ± 0.2305
0.0195 ≤ Ps ≤ 0.4805
τ̂ = N ps
Por lo tanto:
τ̂ = (8, 000)(0.25) = 2, 000 colimenses
τ̂ ± t(n−1,α\2) N Sps
Por lo tanto:
2, 000 ± (8000)(2.1314)(0.1081)
2, 000 ± (8, 000)(0.2305)
2, 000 ± 1844.0
155.9574 ≤ τs ≤ 3844.0426
De ahí que el total de colimenses que han padecido dengue alguna vez en
su vida está entre 155.9574 y 3,844.0426.
N (t(n−1,α\2) )2 ps qs
n=
N d2 + (t(n−1,α\2) )2 ps qs
donde: N = 8, 000, ps = 0.25, qs = 0.75, tn−1,α\2 = t15,0.025 = 2.1314 y d = 0.075
Por lo tanto:
(8, 000)(2.1314)2 (0.25)(0.75)
n= = 149 colimenses (unidades mues-
(8, 000)(0.075)2 + (2.1314)2 (0.25)(0.75)
trales)
130
muestra necesario para estimar el total con una precisión de 600 y una con-
fiabilidad de 95 %?
2
N 2 (t(n−1,α\2) ) ps qs
n=
d2 + N (t(n−1,α\2) )2 ps qs
donde: N = 8, 000, ps = 0.25, qs = 0.75, tn−1,α\2 = t15,0.025 = 2.1314 y d = 600
por lo tanto:
(8, 000)2 (2.1314)2 (0.25)(0.75)
n = = 149 colimenses (mues-
(600)2 + (8, 000)(2.1314)2 (0.25)(0.75)
tra)
131
Capítulo 5. El muestreo sistemático
n
X
yi
i=1 a 8
ps = = = = 0.4211 ó 42.11 % de estudiantes con li-
n n 19
cencia
qs = 1 − ps = 1 − 0.4211 = 0.5789 ó un 57.89 % sin licencia
Por lo tanto: sµ ¶µ ¶
300 − 19 (0.4211)(0.5789) p
S ps = = (0.936)(0.0120094)
300 19
√
= 0.0120094 = 0.1096
c) Calcule un IC de 95 % para la proporción verdadera.
ps ± t(n−1,α\2) Sps
τ̂ = N ps
Por lo tanto:
τ̂ = (300)(0.4211) = 126.3158
τ̂ ± t(n−1,α\2) N Sps
132
Por lo tanto:
126.3158 ± (300)(2.101)(0.1096)
126.3158 ± (300)(0.2303)
126.3158 ± 69.0931
57.2227 ≤ τs ≤ 195.4089
N (t(n−1,α\2) )2 ps qs
n=
N d2 + (t(n−1,α\2) )2 ps qs
donde: N = 300, ps = 0.4211, qs = 0.5789, t(n−1,α\2) = t(18,0.025) = 2.101 y d =
(0.10)(p) = (0.10)(0.4211) = 0.04211
Por lo tanto:
(300)(2.101)2 (0.4211)(0.5789)
n= = 201 estudiantes (muestra)
(300)(0.04211)2 + (2.101)2 (0.4211)(0.5789)
g) Suponga que n = 19 estudiantes es una muestra preliminar. Por lo tanto,
¿cuál es el tamaño de muestra necesario para estimar el total verdadero con
una precisión de 10 % del total preliminar y una confiabilidad de 95 %?
2
N 2 (t(n−1,α\2) ) ps qs
n=
d2 + N (t(n−1,α\2) )2 ps qs
donde: N = 300, ps = 0.4211, qs = 0.5789, t(n−1,α\2) = t(18,0.025) = 2.101 y d =
(0.10)(300)(0.42) = 12.633
Por lo tanto:
(300)2 (2.101)2 (0.4211)(0.5789)
n= = 201 estudiantes (mues-
(12.633)2 + (300)(2.101)2 (0.4211)(0.5789)
tra)
N 12000
= = 545.4545 ⇒ k = 545
n 22
De igual forma como N no es multiplo de n por ello k = 545 y el primer ele-
mento se elige al azar de entre el 1 y 12,000.
133
Capítulo 5. El muestreo sistemático
Cuadro 5.13: Los asegurados que contrajeron gripe o tos por lo menos una vez
en los últimos seis meses
Núm. de paciente Respuesta
341 0
886 0
1,431 0
1,976 1
2,521 0
3,066 0
3,611 1
4,156 1
4,701 1
5,246 0
5,791 1
6,336 0
6,881 0
7,426 0
7,971 0
8,516 0
9,061 1
9,606 0
10,151 1
10,696 1
11,241 0
11,786 0
n
X
yi
i=1 a 8
ps = = = = 0.3636 ó 36.4 %
n n 22
qs = 1 − ps = 1 − 0.36 = 0.6364 ó 63.6 %
b) La desviación estándar
sµ de la proporción muestral (Sps ).
¶
N − n ³ p s qs ´
S ps =
N n
donde: N = 12, 000, n = 22, ps = 0.36 y qs = 0.64
Por lo tanto: sµ ¶µ ¶
12, 000 − 22 (0.3636)(0.6364) p
S ps = = (0.9982)(0.010447)
12, 000 22
√
= 0.010453876 = 0.1025
c) Un IC de 95 % para la proporción verdadera.
134
ps ± t(n−1,α\2) Sps
Por lo tanto:
0.3636 ± (2.0796)(0.1025)
0.3636 ± 0.2131
0.1505 ≤ Ps ≤ 0.5767
τ̂ = N ps
Por lo tanto:
τ̂ = (12, 000)(0.3636) = 4, 363.6364 asegurados que han contraído
gripe o tos.
Por lo tanto:
4, 363.6364 ± (12, 000)(2.0796)(0.1025)
4, 363.6364 ± (12, 000)(0.2131)
4, 363.6364 ± 2, 557.908
1, 806.5790 ≤ τs ≤ 6, 920.6937
N 2 (t(n−1,α\2) )2 ps qs
n=
d2 + N (t(n−1,α\2) )2 ps qs
donde: N = 12, 000, ps = 0.3636, qs = 0.6364, t(n−1,α\2) = t(21,0.025) = 2.0796 y
d = (0.10)(p) = (0.10)(0.3636) = 0.03636
por lo tanto:
(12, 000)(2.0796)2 (0.3636)(0.6364)
n= = 713 asegurados
(12, 000)(0.03636)2 + (2.0796)2 (0.3636)(0.6364)
(muestra)
135
Capítulo 5. El muestreo sistemático
Por lo tanto:
(12, 000)2 (2.07966)2 (0.3636)(0.6364)
n= = 713 asegurados
(436.32)2 + (12, 000)(2.0796)2 (0.3636)(0.6364)
(muestra)
5.6. Ejercicios
En los siguientes ejercicios estime los parámetros siguientes:
Ejercicio 2. Una empresa que produce N = 5, 000 colchones por semana, de-
cide tomar una muestra sistemática de n = 10 colchones, el objetivo es estimar
el porcentaje de colchones que no cumplen con los requerimientos de calidad.
Use la información del cuadro (5.16).
136
Cuadro 5.16: Muestra de colchones.
Obs. No. Muestra Cumple Obs. No. Muestra Cumple
1 210 1 6 2710 1
2 710 1 7 3210 1
3 1210 0 8 3710 1
4 1710 0 9 4210 1
5 2210 1 10 4710 1
137
Capítulo 5. El muestreo sistemático
138
Capítulo 6
139
Capítulo 6. El muestreo por conglomerados en una etapa
Aún cuando fuese posible contar con un marco que contenga la lista de
todos los elementos de la población, la selección de una muestra aleatoria
simple ocasionaría costos excesivamente altos; esto se puede ver clara-
mente en poblaciones grandes y dispersas, es decir, el costo aumenta
como consecuencia de la distancia existente entre unidades de estudio.
Que las unidades que conforman cada conglomerado sean lo más diferen-
tes entre sí, y además, que estén lo más próximo posible unas de otras,
es decir, que las unidades dentro de cada conglomerado sean lo más he-
terogéneas y cercas entre sí.
Que los conglomerados sean lo más similares entre sí, es decir, homogé-
neos entre sí.
140
Si una encuesta por conglomerados se aplicara a cajas que contienen pro-
ductos terminados, entonces en este caso todos los conglomerados contendrían
el mismo número M de productos terminados o elementos (unidades de muestreo
secundarias), debido a la uniformidad del proceso de producción y empaque.
En este ejemplo diremos que los conglomerados son de tamaño homogéneo,
pero es evidente que los casos con estas características no son los más fre-
cuentes y que en general encontraremos conglomerados de tamaños desiguales;
es decir, las colonias no tienen el mismo número de habitantes, los sitios de
muestreo forestal tampoco contendrán el mismo número de árboles, etc. Pero
las técnicas de muestreo probabilístico cubren estas posibilidades, por lo que
no hay de que preocuparse. En el diseño de muestreo el investigador elige los
conglomerados aleatoriamente y mide todos sus elementos. Además, esos ele-
mentos quedarán automáticamente seleccionados al elegir el conglomerado en
la muestra, es decir, cada conglomerado de la muestra será censado (Cochran,
1985 [1]).
141
Capítulo 6. El muestreo por conglomerados en una etapa
n X Mi
n X
X
yi. yij
i=1 i=1 j=1
µ̂ = ȳc = n = n (6.1)
X X
Mi Mi
i=1 i=1
143
Capítulo 6. El muestreo por conglomerados en una etapa
n
X
µ ¶µ ¶µ ¶ (yi. − ȳc Mi )2
N −n 1 1 i=1
V̂ (ȳc ) = (6.3)
N n M̄ 2 n−1
µ ¶µ ¶µ ¶ (yi. − ȳc Mi )2
N −n 1 1 i=1
= M2 2
N n M̄ n−1
Xn
µ ¶µ ¶µ ¶ (yi. − ȳc Mi )2
¡ ¢2 N − n 1 1 i=1
= N M̄ 2
N n M̄ n−1
Xn
µ ¶µ ¶ (yi. − ȳc Mi )2
N −n 1 i=1
= N2
N n n−1
Al conocer los estimadores de las varianzas de ȳc y τ̂c (6.3 y 6.4) se puede
calcular sus correspondientes intervalos de confianza, lo que dará los límites
en los que se encuentran las estimaciones, es decir, una idea acerca de la
precisión de las estimaciones. Es importante mencionar que los estimadores
de las varianzas obtenidos con las ecuaciones (6.3 y 6.4) son sesgadas, pero
pueden ser aceptables si n es "grande"(digamos n > 30) y el sesgo desaparecería
si los tamaños de los conglomerados fueran iguales (todas las Mi iguales).
q
ȳc ± t(n−1,α/2) V̂ (ȳc ) (6.5)
q
τ̂c ± t(n−1,α/2) V̂ (τ̂c ) (6.6)
144
6.4.5. La determinación del tamaño de muestra
· q ¸
Procediendo de manera análoga a los diseños anteriores, t(n−1,α/2) V̂ (θ̂)
es el error asociado a la estimación, llamado precisión, es decir,
· q ¸
d = tn−1,α/2 V̂ (θ̂) , (6.7)
145
Capítulo 6. El muestreo por conglomerados en una etapa
N 2 (tn−1,α/2 )2 σc2
n= ¡ ¢2
d2 + N tn−1,α/2 σc2
n
X
(yi. − ȳc Mi )2
i=1
σc2 es estimada por s2c =
n−1
6.4.6. Ejemplos
Ejemplo 1. La Universidad de Colima tiene 10,000 estudiantes inscritos en
220 grupos con diferente número de estudiantes. Con la finalidad de estimar
el gasto promedio por estudiante en útiles escolares, se toma una muestra
aleatoria simple de 5 grupos, y de cada grupo se le pregunta a cada integrante
sobre su gasto en útiles escolares (cuadro 6.2).
146
Cuadro 6.2: El gasto en útiles escolares por estudiante (en pesos).
147
Capítulo 6. El muestreo por conglomerados en una etapa
Determine lo siguiente:
a) Encontrar la media.
n X Mi
n X
X
yi. yij
i=1 i=1 j=1
µ̂ = ȳc = n = n
X X
Mi Mi
i=1 i=1
donde:
N = 220: es el número total de grupos en la población
n = 5: el número de grupos o conglomerados seleccionados
M = 10, 000: el total de estudiantes en la población
M1 = 30, M2 = 32, M3 = 32, M4 = 36 y M5 = 34 :tamaño de cada conglomerado
seleccionado
Por lo tanto:
3, 094 + 3, 184 + 3, 238 + 3, 302 + 3, 716 16, 534
ȳc = = = 101.4356
30 + 32 + 31 + 36 + 34 163
b) Hallar el total.
τ̂c = M ȳc
Por lo tanto:
148
Por lo tanto:
µ ¶µ ¶
10, 000 − 5 1
V̂ (ȳc ) = ×
10, 000 (5)(45.45)2
(3, 094 − (101.4356)(30))2 + . . . + (3, 716 − (101.4356)(34))2
= 4.9391
5−1
q √
V̂ (ȳc ) = 4.9391 = 2.2224
d) Construir un IC al 90 % para la media poblacional µc .
q
ȳc ± t(n−1,α/2) V̂ (ȳc )
donde:
ȳc = 101.4356: el gasto promedio en útiles escolares por estudiante
tq(n−1,α/2) = t(5−1,0.1/2) = 2.1318
V̂ (ȳc ) = 2.2224
Por lo tanto:
101.4356 ± (2.1318)(2.2224)
101.4356 ± 4.7377
96.6978 ≤ µc ≤ 106.1734
donde: τ̂c = q
q 1, 014, 355.8282, tn−1,α/2 = t5−1,0.1/2 = 2.1318,
V̂ (τ̂c ) = M V̂ (ȳc ) = (10, 000)(2.2224)=22, 223.861
Por lo tanto:
¢2
N tn−1,α/2 σc2
¡
n= ¡ ¢2
N M̄ 2 d2 + tn−1,α/2 σc2
donde: n
X
(yi. − ȳc Mi )2
i=1
σc2 es estimada por s2c =
n−1
149
Capítulo 6. El muestreo por conglomerados en una etapa
Por lo tanto:
N 2 (tn−1,α/2 )2 σc2
n= ¡ ¢2
d2 + N tn−1,α/2 σc2
donde: n
X
(yi. − ȳc Mi )2
i=1
σc2 es estimada por s2c =
n−1
τ̂c = 1, 014, 355.8282
N = 220 : el total de grupos
n = 5: el número de grupos o conglomerados seleccionados
tn−1,α/2 = t5−1,0.1/2 = 2.1318
(3, 094 − (101.4356)(30))2 + . . . + (3, 716 − (101.4356)(34))2
s2c = = 52, 209.8943
5−1
d = (0.04)(1, 014, 355.8282) = 40, 574.2331
Por lo tanto:
n X Mi
n X
X
yi. yij
i=1 i=1 j=1
µ̂c = ȳc = n = n
X X
Mi Mi
i=1 i=1
150
Cuadro 6.4: El contenido de carbohidratos por reja de refresco
Reja 1 Reja 2 Reja 3 Reja 4 Reja 5 Reja 6
6.8 7.1 7.1 7.8 7.7 6.7
6.6 7.4 7.3 7.9 7.5 6.9
7.1 7 6.9 7.7 7.8 6.7
7 7.4 7 7.6 7.6 6.6
6.9 8 7.1 7.6 7.8 6.8
7.4 7.2 7.3 7.6 7.9 6.6
6.9 7.5 7.3 7.4 7.8 6.8
7 7.3 7.3 7.6 7.9 7.2
7 7.8 7.2 7.6 8 6.8
6.8 7.3 7.2 7.5 7.6 7.1
7.2 7.8 7.4 7.5 7.7 6.7
7.2 7.2 7.4 7.9 7.6 7
7.2 7.4 7.1 7.3 7.4 6.7
6.8 7.5 7.2 7.7 8 6.7
7.1 7.7 6.9 7.8 8 6.7
7.1 7.5 6.4 7.4 7.8 6.8
7.2 7.5 6.9 7.7 7.6 6.7
7.1 7.6 7.5 7.3 7.9 6.7
7 7.4 7.1 7.9 7.8 6.7
7.2 7.8 7.2 7.4 7.7 6.8
6.7 7.4 7.3 7.8 7.5 6.9
7.1 8.1 7.2 7.6 8 6.8
6.7 7.5 6.9 7.7 7.8 6.6
7.2 7.8 7.2 7.7 7.6 6.9
y1. = 168.3 y2. = 180.2 y3. = 171.4 y4. = 183 y5. = 186 y6. = 162.9
donde:
n = 6: el número de rejas seleccionadas
M = 24, 000: el total de refrescos producidos en ese día
M1 = 24, M2 = 24, M3 = 24, M4 = 24, M5 = 24 y M6 = 24: número de refrescos por
cada reja
Por lo tanto:
168.3 + 180.2 + 171.4 + 183 + 186 + 162.9 1, 051.8
ȳc = = = 7.3042 car-
24 + 24 + 24 + 24 + 24 + 24+ 144
bohidratos promedio por refresco.
τ̂c = M ȳc
donde:
M = 24, 000: el total de refrescos producidos en ese día
ȳc = 7.3042: el contenido promedio de carbohidratos por refresco
151
Capítulo 6. El muestreo por conglomerados en una etapa
Por lo tanto:
µ ¶µ ¶ (yi. − ȳc Mi )2
N −n 1 i=1
V̂ (ȳc ) = 2
N nM̄ n−1
donde:
M = 24, 000: el total de refrescos producidos en ese día
N = 1, 000: las rejas de refresco producidas
n = 6: el número de rejas seleccionadas
M 24, 000
M̄ = = = 24: el número promedio de refrescos por reja
N 1, 000
ȳc = 7.3042: el contenido promedio de carbohidratos por refresco
Por lo tanto:µ ¶µ ¶
24, 000 − 6 1
V̂ (ȳc ) = ×
24, 000 (6)(24)2
(168.3 − (7.3042)(24))2 + . . . + (162.9 − (7.3042)(24))2
= 0.0239
6−1
d) Calcular un IC de 90 % para la media poblacional.
q
ȳc ± t(n−1,α/2) V̂ (ȳc )
donde:
ȳc = 7.3042: el contenido promedio de carbohidratos por refresco
tn−1,α/2 = t6−1,0.1/2 = 2.0150
q
V̂ (ȳc ) = 0.1546
Por lo tanto:
7.3042 ± (2.0150)(0.1546)
7.3042 ± 0.3116
6.9925 ≤ µc ≤ 7.6158
donde: τ̂c = q
q 175, 300.8, tn−1,α/2 = t6−1,0.1/2 = 2.0150
V̂ (τ̂c ) = M V̂ (ȳc ) = (24, 000)(0.1536) = 3, 711.5380
Por lo tanto:
175, 300.8 ± (2.0150)(3, 711.5380)
175, 300.8 ± 7, 478.9287
152
167, 821.0713 ≤ τc ≤ 182, 778.9287
Por lo tanto:
(1, 000)(2.0150)2 (83.1520)
n= = 6.8201 rejas
(1, 000)(24)2 (0.2922)2 + (2.0150)2 (83.1520)
g) Suponga que n = 6 rejas es una muestra preliminar. Por tanto, ¿cuál es el
tamaño de muestra para estimar el total verdadero con una precisión del 4 %
del total preliminar y una confiabilidad del 90 %?
N 2 (tn−1,α/2 )2 σc2
n= ¡ ¢2
d2 + N tn−1,α/2 σc2
donde: n
X
(yi. − ȳc Mi )2
i=1
σc2 es estimada por s2c =
n−1
τ̂c = 175, 300.8
N = 1, 000 : las rejas de refresco producidas
n = 6: el número de rejas seleccionadas
tn−1,α/2 = t6−1,0.1/2 = 2.0150
2 (168.3 − (7.3042)(24))2 + . . . + (162.9 − (7.3042)(24))2
sc = = 83.1520
6−1
d = (0.04)(175, 300.8) = 7, 012.032
Por lo tanto:
153
Capítulo 6. El muestreo por conglomerados en una etapa
a) Estimación de la media.
n X Mi
n X
X
yi. yij
i=1 i=1 j=1
µ̂c = ȳc = n = n
X X
Mi Mi
i=1 i=1
Por lo tanto:
24 + 27 + 18 + 17 + 26 112
ȳc = = = 2.24 ejemplares por familia
10 + 10 + 10 + 10 + 10 50
b) Estimación del total.
τ̂c = M ȳc
154
donde: M = 4, 000: el total de hogares en el estado
ȳc = 2.24: el promedio de ejemplares comprados por familia
Por lo tanto:
τ̂c = (4, 000)(2.24)= 8, 960 ejemplares comprados
n
X
µ ¶µ ¶ (yi. − ȳc Mi )2
N −n 1 i=1
V̂ (ȳc ) =
N nM̄ 2 n−1
donde:
N = 400: el número de conglomerados geográficos
n = 5: el número de conglomerados seleccionados
M = 4, 000: el total de hogares en el estado
M 4, 000
M̄ = = = 10: el número promedio de hogares por conglomerado
N 400
ȳc = 2.24: el número promedio de ejemplares comprados por familia
Por lo tanto:
donde:
ȳc = 2.24: el número promedio de ejemplares comprados por familia
tn−1,α/2 = t5−1,0.1/2 = 2.1318
q
V̂ (ȳc ) = 0.2051
Por lo tanto:
2.24 ± (2.1318)(0.2051)
2.24 ± 0.4372
1.8028 ≤ µc ≤ 2.6772
e) Un IC de 90 % para el total.
155
Capítulo 6. El muestreo por conglomerados en una etapa
donde: τ̂c =q
q 8, 960, tn−1,α/2 = t5−1,0.1/2 = 2.1318,
V̂ (τ̂c = M V̂ (ȳc ) = (4, 000)(0.2051) = 820.4145
Por lo tanto:
8, 960 ± (2.1318)(820.4145)
8, 960 ± 1, 748.9981
7, 211.0019 ≤ τc ≤ 10, 708.9981
Por lo tanto:
(400)(2.1318)2 (21.3)
n= = 18.4051 conglomerados
(400)(10)2 (0.224)2 + (2.1318)2 (21.3)
g) Suponga que n=5 conglomerados es una muestra preliminar. ¿Cuál es el
tamaño de muestra para estimar el total verdadero con una precisión de 10 %
del total preliminar y una confiabilidad de 90 % ?
N 2 (tn−1,α/2 )2 σc2
n= ¡ ¢2
d2 + N tn−1,α/2 σc2
donde: n
X
(yi. − ȳc Mi )2
i=1
σc2 es estimada por s2c =
n−1
156
τ̂c = 8, 960
N = 400: el número de conglomerados geográficos
n = 5: el número de conglomerados geográficos seleccionados
tn−1,α/2 = t5−1,0.1/2 = 2.1318
(24 − (2.24)(10))2 + . . . + (26 − (2.24)(10))2
s2c = = 21.3
5−1
d = (0.1)(8, 960) = 896
Por lo tanto:
(400)2 (2.1318)2 (21.3)
n= = 18.4051 conglomerados geográ-
(896)2 + (400)(2.1318)2 (21.3)
ficos.
a) La estimación de la media.
n X Mi
n X
X
yi. yij
i=1 i=1 j=1
µ̂c = ȳc = n = n
X X
Mi Mi
i=1 i=1
donde:
n = 12: el número de localidades seleccionadas
M = 200, 000: los habitantes en el estado
M1 = 181, M2 = 316, M3 = 249, M4 = 73, M5 = 164, M6 = 120, M7 = 171, M8 = 241,
157
Capítulo 6. El muestreo por conglomerados en una etapa
M9 = 283, M10 = 115, M11 = 142, M12 = 188 : total de habitantes por localidad
10 + 20 + 14 + . . . + 23 + 24 + 13 242
ȳc = = = 0.1079 emigrantes en pro-
181 + 316 + 249 + . . . + 115 + 142 + 188 2, 243
medio
donde:
M = 200, 000: los habitantes en el estado
ȳc = 0.1079: el promedio de emigrantes por localidad
Por lo tanto:
donde:
N = 800: el número de localidades en las que está dividido el estado (conglom-
erados)
n = 12: el número de localidades seleccionadas
M = 200, 000: los habitantes en el estado
M 200, 000
M̄ = = = 250: el número promedio de habitantes por localidad (con-
N 800
glomerado)
ȳc = 0.1079: el número promedio emigrantes por localidad
Por lo tanto:
donde:
ȳc = 0.1079: el número promedio emigrantes por localidad
tq(n−1,α/2) = t(12−1,0.1/2) = 1.7959
V̂ (ȳc ) = 0.0164
158
Por lo tanto:
0.1079 ± (2.7959)(0.0164)
0.1079 ± 0.0295
0.0784 ≤ µc ≤ 0.1374
e) Un IC al 90 % para el total
donde:
τ̂c = 21, 580
t(n−1,α/2) = t(12−1,0.1/2)
q q = 1.7959
V̂ (τ̂c = M V̂ (ȳc ) = (200, 000)(0.0164) = 3, 280.3971
Por lo tanto:
159
Capítulo 6. El muestreo por conglomerados en una etapa
Por lo tanto:
(800)(1.7959)2 (204.8415)
n= = 81.5390
(800)(250)2 (0.01079)2 + (1.7959)2 (204.8415)
Por lo tanto, el tamaño de muestra requerido para estimar la media verdadera
con una precisión de 0.01079 es de n = 82 conglomerados (localidades).
N 2 (tn−1,α/2 )2 σc2
n= ¡ ¢2
d2 + N tn−1,α/2 σc2
donde: n
X
(yi. − ȳc Mi )2
i=1
σc2 es estimada por s2c =
n−1
τ̂c = 21, 580
N = 800: el número de localidades en las que está dividido el estado (conglo-
merados)
n = 12: el número de localidades seleccionadas
M = 200, 000: los habitantes en el estado
M 200, 000
M̄ = = = 250: el número promedio de habitantes por localidad
N 800
tn−1,α/2 = t12−1,0.1/2 = 1.7959
2 (10 − (0.1079)(181))2 + . . . + (13 − (0.1079)(188))2
sc = = 204.8415
12 − 1
d = (0.1)(21, 580) = 2, 158
Por lo tanto:
(800)2 (1.7959)2 (204.8415)
n= = 81.5390
(2, 158)2 + (800)(1.7959)2 (204.8415)
Por lo tanto, el tamaño de muestra requerido para estimar el total poblacional
con una precisión de 2, 158 es de n = 82.
6.5. Ejercicios
En los siguientes ejercicios estime los parámetros siguientes:
160
estudios de postgrado. Con la finalidad de medir el nivel de satisfacción en el
trabajo de los empleados, se toma una muestra aleatoria simple de 6 hospi-
tales, en cada uno de estos hospitales se realiza un censo. (El nivel de sat-
isfacción se mide de 0 (nada satisfecho) a 10 (muy satisfecho)) (cuadro (6.7)).
161
Capítulo 6. El muestreo por conglomerados en una etapa
τ̂c
µ̂c = ȳc = (6.9)
Maprox
162
n
X n
X n
X
yi. τi Mi
i=1 i=1 i=1
donde ȳ. = = , Maprox = N M̄ y M̄ = .
n n n
n
X
µ ¶µ ¶ (yi. − ȳ. )2
N −n 1 i=1
V̂ (τ̂c ) = V̂ (N ȳ. ) = N 2 (6.10)
N n n−1
n
X
µ ¶µ ¶ (yi. − ȳ. )2
V̂ (τ̂c ) 1 N −n 1 i=1
V̂ (µ̂c ) = V̂ (ȳc ) = 2
= 2 (6.11)
Maprox M̄ N n n−1
n
X
Mi
i=1
Nota: recuérdese que cuando no se conoce M , entonces M̄ =
n
Las varianzas (6.11 y 6.10) de estos estimadores nos indican la precisión de
los mismos. Los intervalos de confianza para estos estimadores se construyen
de forma habitual.
q
ȳc ± t(n−1,α/2) V̂ (ȳc )
q
τ̂c ± t(n−1,α/2) V̂ (τ̂c )
N (tn−1,α/2 )2 σt2
n=
N d2 + (tn−1,α/2 )2 σt2
n
X
(yi. − ȳ. )2
i=1
donde σt2 es estimada por s2t =
n−1
Nota: El valord es calculado con respecto al total promedio por conglomer-
Xn
yi.
i=1
ado ȳ . =
n
163
Capítulo 6. El muestreo por conglomerados en una etapa
N 2 (tn−1,α/2 )2 σt2
n=
d2 + N (tn−1,α/2 )2 σt2
n
X
(yi. − ȳ. )2
i=1
donde σt2 es estimada por s2t =
n−1
Éste diseño puede combinarse con otros diseños; por ejemplo, el estrati-
ficado.
6.7.1. Ejemplos
Ejemplo 1. Un agrónomo tiene una parcela experimental de 10, 000 m2 . Con
la finalidad de conocer la cantidad promedio por planta y el total de cacahua-
tes producidos, divide la parcela en tramos de 4m2 , y selecciona una muestra
aleatoria de 15 tramos. Enseguida cuenta el número de cacahuates por planta.
El cuadro 6.9 muestra los totales por tramo. Resuelva lo que se le pide a
continuación.
a) La estimación de la media por conglomerado (tramo).
n
X n
X
yi. τi
i=1 i=1
ȳ. = =
n n
donde:
n = 15: el número de tramos seleccionados
τi = yi. : el total de cacahuates en el tramo i, i = 1, 2, . . . , 15
164
Cuadro 6.9: El total de cacahuates producidos por tramo
Tramo Plantas Total/tramo
T1 35 y1. = 1, 680
T2 34 y2. = 1, 360
T3 28 y3. = 1, 904
T4 33 y4. = 1, 485
T5 34 y5. = 2, 346
T6 27 y6. = 1, 809
T7 28 y7. = 1, 148
T8 33 y8. = 1, 320
T9 31 y9. = 1, 953
T 10 35 y10. = 1, 645
T 11 34 y11. = 2, 414
T 12 29 y12. = 2, 146
T 13 28 y13. = 1, 232
T 14 26 y14. = 1, 404
T 15 29 y15. = 1, 450
Por lo tanto:
1, 680 + 1, 360 + . . . + 1, 404 + 1, 450 25, 290
ȳ. = = = 1, 686.4 cacahuates por con-
15 15
glomerado (tramo)
Por lo tanto:
165
Capítulo 6. El muestreo por conglomerados en una etapa
Por lo tanto:
4, 216, 000
ȳc = = 54.5172 cacahuates en promedio por plan-
77, 333.3333
ta.
V̂ (τ̂c ) N 2 V̂ (ȳ. )
V̂ (ȳc ) = 2
= 2
Maprox Maprox
X n
µ ¶µ ¶ (yi. − ȳ. )2
N −n 1 i=1
V̂ (ȳ. ) =
N n n−1
donde:
Maprox = 77, 333.3333
ȳ. = 1, 686.4
n = 15: el número de tramos que fueron selecionados
N = 2, 500: µ el número ¶ µde ¶tramos en la población
2, 500 − 15 1 (1, 680 − 1686.4)2 + . . . + (1, 450 − 1, 686.4)2
V̂ (ȳ. ) = = 10, 528.1337
2, 500 15 15 − 1
Por lo tanto:
(2, 500)2 (10, 528.1337)
V̂ (ȳc ) = = 11.0026
(77, 333.3333)2
q √
V̂ (ȳc ) = 11.0026 = 3.3170
166
q
V̂ (ȳc ) = 3.3170
Por lo tanto:
54.5172 ± (1.7613)(3.3170)
54.5172 ± 5.8423
48.6749 ≤ µc ≤ 60.3595 cacahuates por planta
por lo tanto:
4, 216, 000 ± (1.7613)(256, 516.7356)
4, 216, 000 ± 451, 805.5211
3, 764, 194.4788 ≤ τc ≤ 4, 667, 805.5211 cacahuates por parcela
N (tn−1,α/2 )2 σt2
n=
N d2 + (tn−1,α/2 )2 σt2
donde: n
X
(yi. − ȳ. )2
i=1
σt2 es estimada por s2t =
n−1
ȳ. = 1, 686.4: el promedio total de cacahuates por tramo (conglomerado)
yi. : el total de cacahuates en el tramo i,i = 1, 2 . . . , 15
N = 2, 500: los tramos en los que está dividida la parcela
2 (1, 680 − 1686.4)2 + . . . + (1, 450 − 1, 686.4)2
st = = 158, 875.2571
15 − 1
t(n−1,α/2) = t(15−1,0.1/2) = 1.7613, d = (0.1)(1, 686.4) = 168.64
Por lo tanto:
167
Capítulo 6. El muestreo por conglomerados en una etapa
N 2 (tn−1,α/2 )2 σt2
n=
d2 + N (tn−1,α/2 )2 σt2
donde: n
X
(yi. − ȳ. )2
i=1
σt2 es estimada por s2t =
n−1
ȳ. = 1, 686.4: el total promedio de cacahuates por tramo (conglomerado)
yi. : el total de cacahuates en el tramo i, i = 1, 2 . . . , 15
N = 2, 500: los tramos en los que está dividida la parcela
(1, 680 − 1686.4)2 + . . . + (1, 450 − 1, 686.4)2
s2t = = 158, 875.2571
15 − 1
t(n−1,α/2) = t(15−1,0.1/2) = 1.7613
τ̂c = 4, 216, 000: el total estimado de cacahuates producidos en la parcela
d = (0.1)(4, 216, 000) = 421, 600
Por lo tanto:
168
n
X n
X
yi. τi
i=1 i=1
ȳ. = =
n n
donde:
n = 8: el número de palmeras seleccionadas
τi = yi. : el total de litros en la palmera i, i = 1, 2, . . . , 8
por lo tanto:
6.93 + 7.27 + . . . + 9.45 + 6.69 60.65
ȳ. = = = 7.58125 litros por conglomerado
8 8
b) Estimar el total poblacional.
Xn
yi
i=1
τ̂c = N ȳ. = N
n
donde:
ȳ. = 7.5813: el promedio de litros por conglomerado (palmera)
N = 1, 000: el número de palmeras en el predio
n = 8: el número de palmeras seleccionadas
Por lo tanto:
169
Capítulo 6. El muestreo por conglomerados en una etapa
τ̂c
ȳc =
Maprox
donde: τ̂c = 7, 581.25 y Maprox = 7, 875
por lo tanto:
7, 581.25
ȳc = = 0.9627 litros de agua producidos por cada coco
7, 875
V̂ (τ̂c ) N 2 V̂ (ȳ. )
V̂ (ȳc ) = 2
= 2
Maprox Maprox
X n
µ ¶µ ¶ (yi. − ȳ. )2
N −n 1 i=1
V̂ (ȳ. ) =
N n n−1
donde:
Maprox = 7, 875
ȳ. = 7.5813
n = 8: el número de palmeras selecionadas
N = 1, 000: µ el número ¶ µ de
¶ palmeras (conglomerados) en la población
1, 000 − 8 1 (6.93 − 7.5813)2 + . . . + (6.69 − 7.5813)2
V̂ (ȳ. ) = = 0.21596
1, 000 8 8−1
Por lo tanto:
(1, 000)2 (0.21596)
V̂ (ȳc ) = = 0.00348
(7, 875)2
q √
V̂ (ȳc ) = 0.00348 = 0.059
donde:
ȳc = 0.9627 litros de agua por coco
t(n−1,α/2) = t(8−1,0.1/2) = 1.8946
q
V̂ (ȳc ) = 0.059
Por lo tanto:
0.9627 ± (1.8946)(0.059)
0.9627 ± 0.1118
0.8509 ≤ µc ≤ 1.0745
Esto significa que la media poblacional está entre 0.8509 y 1.0745 litros de agua
por coco.
170
f) Estime por intervalo el total poblacional con una confiabilidad de 90 %.
q
ȳc ± t(n−1,α/2) V̂ (ȳc )
donde:
τ̂c = 7, 581.25
N = 1, 000
t(n−1,α/2) = t(8−1,0.1/2) = 1.8946
q q √
V̂ (τ̂c ) = N V̂ (ȳ. ) = (1, 000)( 0.21596) = 464.7111
Por lo tanto:
7, 581.25 ± (1.8946)(464.7111)
7, 581.25 ± 880.4317
6, 700.8129 ≤ τc ≤ 8, 461.6817
N (t(n−1,α/2) )2 σt2
n=
N d2 + (t(n−1,α/2) )2 σt2
donde: n
X
(yi. − ȳ. )2
i=1
σt2 es estimada por s2t =
n−1
ȳ. = 7.5812: el total promedio de litros de agua de coco por palmera (conglomera-
do)
yi. : el total de litros de agua en la palmera i, i = 1, 2 . . . , 8
N = 1, 000: las palmeras en el predio
(6.93 − 7.5812)2 + . . . + (6.69 − 7.5812)2
s2t = = 1.7416
8−1
t(n−1,α/2) = t(8−1,0.1/2) = 1.8946
d = (0.1)(7.5812) = 0.75812
Por lo tanto:
(1, 000)(1.8946)2 (1.7416)
n= = 10.7594 palmeras (muestra)
(1, 000)(0.7581264)2 + (1.8946)2 (1.7416)
h) Suponga que n = 8 palmeras es una muestra preliminar. Determine el
tamaño de muestra definitivo para estimar el total con una precisión de 10 %
del total preliminar y una confiabilidad de 90 %.
N 2 (t(n−1,α/2) )2 σt2
n=
d2 + N (t(n−1,α/2) )2 σt2
171
Capítulo 6. El muestreo por conglomerados en una etapa
donde: n
X
(yi. − ȳ. )2
i=1
σt2 es estimada por s2t =
n−1
ȳ. = 7.5812: el total promedio de litros de agua de coco por palmera (conglomera-
do)
yi. : el total de litros de agua en la palmera i, i = 1, 2 . . . , 8
N = 1, 000: las palmeras en el predio
(6.93 − 7.5812)2 + . . . + (6.69 − 7.5812)2
s2t = = 1.7416
8−1
t(n−1,α/2) = t(8−1,0.1/2) = 1.8946
τ̂c = 7, 581.25: el total de agua de coco en litros en el predio
d = (0.1)(7, 581.25) = 758.125
Por lo tanto:
(1, 000)2 (1.8946)2 (1.7416)
n= = 10.7594 palmeras (muestra)
(758.125)2 + (1, 000)(1.8946)2 (1.7416)
6.8. Ejercicios
En los siguientes ejercicios estime lo siguiente:
172
Cuadro 6.12: Volumen de biomasa en m3
Conglomerado Mi yi. Conglomerado Mi yi.
1 508 1,709 21 558 2,440
2 302 1,075 22 598 2,005
3 693 3,087 23 532 2,057
4 598 1,729 24 599 2,562
5 459 1,497 25 607 1,853
6 695 2,725 26 609 2,698
7 476 2,143 27 640 3,066
8 675 2,945 28 659 1,948
9 432 1,355 29 589 1,942
10 567 2,267 30 674 2,413
11 657 2,724 31 508 1,870
12 650 2,537 32 302 987
13 667 3,284 33 693 3,258
14 598 2,370 34 598 2,700
15 548 2,026 35 459 1,750
16 657 1,987 36 583 2,007
17 508 1,479 37 476 1,231
18 499 1,668 38 675 2,701
19 549 2,163 39 432 1,669
20 543 2,463 40 567 1,904
173
Capítulo 6. El muestreo por conglomerados en una etapa
174
Capítulo 7
P A ra
que los resultados de una encuesta sean creíbles es necesario, entre
otros aspectos, que las preguntas tengan suficiente calidad o validez, lo
que exige asumir que las respuestas sean ciertas. Para creer en los resultados
de una encuesta es necesario creer también en las respuestas de las personas
que han sido entrevistadas. Sin embargo, tener respuestas verídicas es difícil.
Hay muchos problemas implícitos al tratar de conseguirlas y de que éstas sean
sinceras (Lohr, 2000 [9]).
175
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
confiables.
Respuesta aleatorizada
La técnica de respuesta aleatorizada es un método especialmente
diseñado para asegurar privacidad a los entrevistados en el estu-
dio de temas sensibles, delicados o embarazosos. Se intenta con el-
lo evitar sesgos de los estrevistados en ciertas conductas hacia la
respuesta socialmente más deseable. Es decir, le asegura al entre-
vistado que su respuesta sobre temas sensibles (falsa o verdadera)
no será conocida por el entrevistador, de ahí el nombre de respuesta
aleatorizada(RA); la respuesta se realiza al azar. Se ha utilizado para
analizar temas desde copiar en los exámenes, insolvencia, fraudes,
haber sido arrestado, conducir bajo los efectos del alcohol, infideli-
dad, tener hijos fuera del matrimonio, prácticas abortivas, etcétera..
176
Por características sensitivas o delicadas se entiende a las situaciones en
donde los entrevistados sienten dañada su intimidad al pedir que respondan
un cuestiorario. Por lo tanto, las preguntas sensitivas o delicadas sirven para
captar las características sensitivas de los entrevistados; las cuales se tienen
que manejar con cuidado debido a la no respuesta o a la respuesta falseada
contestando lo socialemente deseable.
177
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
VII. Se tiene que hacer enfasis en que debe de responder con la verdad a las
preguntas y que solamente tiene que responder una de ellas dependiendo
de la letra que obtuvo, es decir, si la la carta que obtuvo esta marcada
con la letra A debe responder con la verdadad a la pregunta delicada y
esta sería su única respuesta, lo mismo que si le toco cualquier otra letra
del abecedario debe de responder con la verdad a la segunda pregunta
pregunta y esta sería la única respuesta.
VIII. La carta elegida por un individuo tiene que ser reemplazada antes de
entrevistar a la siguiente persona.
178
preguntando si pertenece o no al grupo A, o sea, lo que no quiere responder.
3
Un valor de es usualmente adecuado. Este método requiere generalmente
4
un tamaño de muestra muy grande para obtener una varianza del estimador
razonablemente pequeña. Se necesita un tamaño de muestra grande debido a
que cada respuesta origina poca información sobre la proporción poblacional,
π. La técnica de respuesta aleatorizada que se ha presentado aquí es la más
simple de todas las que existen. Para mayor información al respecto, véanse los
artículos de Campbell y Joiner (1973); Leysieffer y Warner (1976); y Greenberg,
Kuebler, Albernathy y Horvitz (1971).
τ̂ = N π̂
donde:
N : tamaño de la población,
a : el total de respuestas "sí" de los n entrevistados,
p : fracción de las letras en el mazo de cartas marcadas con la letra A.
179
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
ecuación:
2
N Zα/2 k
n= 2
N d2 + Zα/2 k
donde: µ ¶2
1 1
k= − π̂ −
16 (p − 1/2)2 2
N = el tamaño de la población
Zα/2 = el valor de tablas de la distribución normal
p = la proporción de cartas que están marcadas con la letra A
d = la precisión fijada por el investigador
N 2 Zα/2
2
k
n= 2
d2 + N Zα/2 k
donde: µ ¶2
1 1
k= − π̂ −
16 (p − 1/2)2 2
N = el tamaño de la población
Zα/2 = el valor de tablas de la distribución normal
p = la proporción de cartas que están marcadas con la letra A
d = la precisión fijada por el investigador
7.3.5. Ejemplos
Ejemplo 1. En el estado de Colima se realiza una encuesta con la intención
de estimar la proporción de estudiantes (N = 8, 000) en nivel medio superior y
superior que han consumido algún tipo de dróga. Dado que se trata de una
5
pregunta delicada, se usó el método de respuesta aleatorizada con p = . Se
6
tomó una muestra aleatoria simple de n = 200 estudiantes. En los resultados
se encontraron 45 respuestas "sí" de los 200 entrevistados.
a) Calcule la proporción poblacional de interés.
p−1 a
π̂ = +
(2p − 1) (2p − 1)n
180
n
X 5
donde: a = yi = 45, p = y n = 200
i=1
6
Por lo tanto:
5/6 − 1 45
π̂ = + = 0.0875 u 8.75 % de estudiantes
2(5/6) − 1 (2(5/6) − 1)200
han consumido algún tipo de droga
b) Obtenga el total de estudiantes que alguna vez han consumido algún tipo
de droga.
τ̂ = N π̂
Por lo tanto:
5
donde: N = 8, 000, π̂ = 0.0875, p = , n = 200
6
Por lo tanto:
µ ¶ " µ ¶2 #
8, 000 − 200 1 1 1
Sπ̂2 = − 0.0875 −
8, 000 200 16(5/6 − 1/2)2 2
= p
0.001912676
√
Sπ̂ = Sπ̂2 = 0.001912676 =0.043734144
p √
Sπ̂ = Sπ̂2 = 0.001912676 =0.043734144
Por lo tanto:
0.0875 ± (1.96)(0.0437)
0.0875 ± 0.085718932
0.001781068 ≤ π ≤ 0.173218932
181
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
por lo tanto:
(8, 000)(0.0875) ± (8000)(1.96)(0.0437)
(8, 000)0.0875 ± (8000)(0.0857)
700 ± 685.7515
14.2486 ≤ τ ≤ 1, 385.7515
De ahí que el total de estudiantes en nivel medio superior y superior que algu-
na vez hayan consumido algún tipo de droga esté entre 14.2486 y 1385.7515.
182
µ ¶2
1 1
k= − 0.0875 − = 0.3923
16 (5/6 − 1/2)2 2
por lo tanto:
n
X 5
donde: a = yi = 80, p = , n = 250
i=1
6
Por lo tanto:
5/6 − 1 80
π̂ = + = 0.23 ó 23 % de ciudadanos que
2(5/6) − 1 (2(5/6) − 1)250
alguna vez han robado
τ̂ = N π̂
Por lo tanto:
τ̂ = (15000)(0.23) = 3,450 ciudadanos
Por lo tanto:
µ ¶ " µ ¶2 #
15, 000 − 250 1 1 1
Sπ̂2 = − 0.23 − = 0.00192576
15, 000 250 16(5/6 − 1/2)2 2
183
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
p √
Sπ̂ = Sπ̂2 = 0.00192576 = 0.043883482
Por lo tanto:
0.23 ± (1.96)(0.0438)
0.23 ± 0.086011625
0.143988375 ≤ π ≤ 0.316011625
Esto significa que la proporción de ciudadanos que han robado alguna vez
en su vida está entre 0.143988375 y 0.316011625, es decir, entre 14.39 y
31.60 %.
Por lo tanto:
(15, 000)(0.23) ± (15, 000)(1.96)(0.0438)
(15, 000)(0.23) ± (15, 000)(0.0860)
3450 ± 1290.17437
2,159.82563 ≤ τ ≤ 4,4740.17437
Esto significa que el total de ciudadanos que alguna vez han robado se en-
cuentra entre 2,159.82563 y 4,740.17437.
184
µ ¶2
1 1
k= − 0.23 − = 0.4896
16(5/6 − 1/2)2 2
Por lo tanto:
(15,000)(1.962 )(0.4896)
n= = 267.7214 ciudadanos (unidades
(15000)(0.004388)2 + (1.962 )(0.4896)
muestrales)
5
donde: a = Σni=1 yi = 40, p = y n = 160
6
por lo tanto:
5/6 − 1 40
π̂ = + = 0.125 ó 12.5 % de ciudadanos
2(5/6) − 1 (2(5/6) − 1)160
Esto significa que la proporción de ciudadanos que alguna vez en su vida han
185
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
b) Realice la estimación del total de ciudadanos que alguna vez han usado
juguetes sexuales.
τ̂ = N π̂
Por lo tanto:
5
donde: N = 7,000, π̂ = 0.125, p = , n = 160
6
por lo tanto:
µ ¶ " µ ¶2 #
7000 − 160 1 1 1
Sπ̂2 = − 0.125 − = 0.00257645
7000 160 16(5/6 − 1/2)2 2
p √
Sπ̂ = Sπ̂2 = 0.00257645 = 0.050758752
Por lo tanto:
0.125 ± (1.96)(0.05007)
0.125 ± 0.099487154
0.025512846 ≤ π ≤ 0.224487154
186
Por lo tanto:
(7, 000)(0.125) ± (7, 000)(1.96)(0.09948)
(7, 000)(0.125) ± (7, 000)(0.07740)
875 ± 696.4100
178.5899 ≤ τ ≤ 1571.41008
Esto significa que el total verdadero de ciudadanos que alguna vez han usa-
do juguetes sexuales se encuentra entre 178.58 y 1,571.41.
N 2 Zα/2
2
k
n= 2
d2 + N Zα/2 k
donde:
N = 7, 000: el tamaño de la población
Zα/2 = 1.96
5
p=
6
τ̂ = 875
d = (0.05)(875) = 43.75
µ ¶2
1 1
k= − 0.125 − = 0.421875
16(5/6 − 1/2)2 2
Por lo tanto:
187
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
5/6 − 1 60
π̂ = + = 0.11
2(5/6) − 1 (2(5/6) − 1)250
Esto significa que la proporción de ciudadanos en el estado de Colima que
alguna vez en su vida han vendido su voto es de 0.11, es decir el 11 %
τ̂ = N π̂
Por lo tanto:
τ̂ = (5, 000)(0.11) = 550
Esto significa que el total de ciudadanos de Colima que alguna vez han vendido
su voto es de 550.
188
µ ¶ " µ ¶2 #
5, 000 − 250 1 1 1
Sπ̂2 = − 0.11 − = 0.00156
5, 000 250 16(5/6 − 1/2)2 2
p √
Sπ̂ = Sπ̂2 = 0.00156 = 0.039490758
por lo tanto:
0.11 ± (1.96)(0.0395)
0.11 ± 0.077401886
0.032598114 ≤ π ≤ 0.187401886
Por lo tanto, la proporción de ciudadanos que alguna vez en su vida han ven-
dido su voto está entre 0.03259 y 0.1874, es decir, entre 3.25 y 18.74 %.
Por lo tanto:
Esto significa que el total de ciudadanos que alguna vez ha vendido su voto
está entre 162.9905 y 937.0094 personas.
2
N Zα/2 k
n= 2
N d2 + Zα/2 k
donde:
π̂ = 0.11 N = 5, 000: el tamaño de la población
Zα/2 = 1.96
5
p=
6
d = (0.05)(0.11) = 0.0055
189
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
µ ¶2
1 1
k= − 0.11 − = 0.4104
16(5/6 − 1/2)2 2
Por lo tanto:
(5000)(1.962 )(0.4104)
n= = 271.110281 ciudadanos (mues-
(5000)(0.03949)2 + (1.962 )(0.4104)
tra)
N 2 Zα/2
2
k
n= 2
d2 + N Zα/2 k
donde:
N = 5000: el tamaño de la población
Zα/2 = 1.96
5
p=
6
τ̂ = 550
d = (0.05)(550) = 27.5
µ ¶2
1 1
k= − 0.11 − = 0.4104
16(5/6 − 1/2)2 2
Por lo tanto:
190
7.4. Ejercicios
En los siguientes ejercicios estime los parámetros siguientes:
191
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
E µ ¶2 µ ¶ " µ ¶2 #
X N h N h − n h 1 1 1
Sπ̂2st = 2
− π̂h −
h=1
N N h n h 16(p − 1/2) 2
E µ ¶2 µ ¶ " µ ¶2 #
X N h N h − n h 1 1 1
Sτ̂2st = N 2 2
− π̂h −
h=1
N N h n h 16(p − 1/2) 2
Con los estimadores de las varianzas de π̂st y τ̂st se puede calcular intervalos
que contengan el valor del parámetro con una probabilidad preestablecida.
q
π̂st ± Zα/2 Sπ̂2st
192
q
τ̂st ± Zα/2 Sτ̂2st
2
PE
N Zα/2 h=1 Wh Kh
n= 2
PE
N d2 + Zα/2 h=1 Wh Kh
donde: µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
N = el tamaño de la población
π̂h = la proproción de interés en el estrato h
Zα/2 = el valor de tablas de la distribución normal
p = la proporción de cartas que están marcadas con la letra A
d = la precisión fijada por el investigador
N 2 (Zα/2)2 ΣEh=1 Wh Kh
n=
d + N (Zα/2 ) ΣE
2 2
h=1 Wh Kh
donde:
µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
N = el tamaño de la población
π̂h = la proproción de interés en el estrato h
Zα/2 = el valor de tablas de la distribución normal
p= la proporción de cartas que están marcadas con la letra A
d= la precisión fijada por el investigador
7.5.5. Ejemplos
193
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
5/6 − 1 14
π̂1 = + = 0.0125
2(5/6) − 1 (2(5/6) − 1)80
5/6 − 1 16
π̂2 = + = 0.1199
2(5/6) − 1 (2(5/6) − 1)65
5/6 − 1 17
π̂3 = + = 0.2136
2(5/6) − 1 (2(5/6) − 1)55
(4500)(0.0125) + (3500)(0.1199) + (2000)(0.2136)
π̂st = = 0.0901 ó 9 %
10000
de mujeres infieles
donde:
N = 10,000 el total de mujeres casadas por lo civil en el estado de Colima
π̂st = 0.0901: la proporción de mujeres infieles en el estado
Por lo tanto:
194
a1 = 14, a2 = 16, a3 = 17
5
p=
6
π̂1 = 0.0125
π̂2 = 0.1192
π̂3 = 0.2136
Por lo tanto:
µ ¶2 µ " ¶ µ ¶2 #
4500 4500 − 80
1 1 1
Sπ̂2st = − 0.0125 −
10000 4500 80 16 (5/6 − 1/2)2 2
µ ¶2 µ ¶ " µ ¶2 #
3500 3500 − 65 1 1 1
+ − 0.1192 −
10000 3500 65 16 (5/6 − 1/2)2 2
µ ¶2 µ ¶ " µ ¶2 #
2000 2000 − 55 1 1 1
+ − 0.2136 − = 0.0019
10000 2000 55 16 (5/6 − 1/2)2 2
q √
Sπ̂st = Sπ̂2st = 0.0019 = 0.0438
donde:
π̂st = 0.0901: la proporción de mujeres infieles en el estado
α = 0.05
Zα/2 = 1.96
q
Sπ̂2st = 0.0438
Por lo tanto:
0.0901 ± (1.96)(0.0438)
0.0901 ± 0.0859
0.0042 ≤ πst ≤ 0.1760
donde:
τ̂st = 900.83042
q = 10,000 el total de mujeres casadas por lo civil en el estado de Colima
N
Sτ̂2st = 0.0438
α = 0.05
Zα/2 = 1.96
195
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
q
Sτ̂2st = (10, 000)(0.0438) = 438.1468
Por lo tanto:
900.8304 ± (1.96)(438.1468)
900.8304 ± 858.7519
42.0785 ≤ τst ≤ 1, 759.5824
Esto significa que el total de mujeres infieles casadas por lo civil está entre
42.0785 y 1,759.5824.
donde: µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 10,000 : total de mujeres casadas por lo civil en el estado de Colima
Zα/2 = 1.96
5
p=
6 µ ¶2
1 1
K1 = − 0.0125 − = 0.3248
16 (5/6 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.1192 − = 0.4175
16 (5/6 − 1/2)2 2
µ ¶2
1 1
K3 = − 0.2136 − = 0.4805
16 (5/6 − 1/2)2 2
E
X 4,500 3,500 2,000
Wh kh = (0.3248) + (0.4175) + (0.4805) = 0.3884
h=1
10,000 10,000 10,000
d = (0.75)(0.0901) = 0.0676
Por lo tanto:
(10,000)(1.96)2 0.3884
n= = 316.5251 mujeres casadas
(10,000)(0.0676)2 + (1.96)2 (0.3884)
(muestra)
N 2 (Zα/2 )2 ΣE
h=1 Wh Kh
n=
d2 + N (Zα/2 )2 ΣEh=1 Wh Kh
donde: µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 10,000 el total de mujeres casadas por lo civil en el estado de Colima
α = 0.05
Zα/2 = 1.96
5
p=
6 µ ¶2
1 1
K1 = − 0.0125 − = 0.3248
16 (5/6 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.1192 − = 0.4175
16 (5/6 − 1/2)2 2
µ ¶2
1 1
K3 = − 0.2136 − = 0.4805
16 (5/6 − 1/2)2 2
E
X 4,500 3,500 2,000
Wh kh = (0.3248) + (0.4175) + (0.4805) = 0.3884
h=1
10,000 10,000 10,000
τ̂st = 900.83042
d = (0.75)(900.83042) = 675.6228
Por lo tanto:
197
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
5/6 − 1 50
π̂1 = + = 0.125
(2 (5/6) − 1) (2 (5/6) − 1) 200
5/6 − 1 30
π̂2 = + = 0.2
(2 (5/6) − 1) (2 (5/6) − 1) 100
(10, 000) (0.125) + (5, 000) (0.2)
π̂st = = 0.15
15, 000
Esto significa que la proporción de mujeres que han abortado en Manzani-
llo es de 0.15, es decir, el 15 %
τ̂st = N π̂st
donde:
N = 15, 000 el total de jóvenes que han abortado
π̂st = 0.15 la proporción de jóvenes que han abortado
Por lo tanto:
198
N1 = 10, 000 y N2 = 5, 000
n1 = 200 y n2 = 100
a1 = 50 y a2 = 30
5
p=
6
π̂1 = 0.125
π̂2 = 0.2
Por lo tanto:
µ ¶2 µ ¶ " µ ¶2 #
10000 10000 − 200 1 1 1
Sπ̂2st = − 0.125 −
15000 10000 200 16 (5/6 − 1/2)2 2
µ ¶2 µ ¶ " µ ¶2 #
5000 5000 − 100 1 1 1
+ 2 − 0.2 − = 0.0014
15000 5000 100 16 (5/6 − 1/2) 2
donde:
π̂st = 0.15: la proporción de jóvenes que han abortado
α = 0.05
Zα/2 = 1.96
q
Sπ̂2st = 0.0379
Por lo tanto:
(0.15) ± (1.96)(0.0379)
(0.15) ± (0.0742)
0.0758 ≤ πst ≤ 0.2242
donde:
τ̂st = 2,250 q
q
Sτ̂2st = N Sπ̂2st
N = 15, 000 :el total de jóvenes
q
Sπ̂2st = 0.0379
α = 0.05
Zα/2 = 1.96
199
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
q
Sτ̂2st = (15000)(0.379) = 567.8743
Por lo tanto:
2250 ± (1.96)(567.8743)
2250 ± 1, 113.0132
1, 136.9868 ≤ τst ≤ 3, 363.0132
Por lo tanto, el total de mujeres jóvenes que han abortado está entre 1,136.9868
y 3,363.0132.
donde: µ ¶2
1 1
Kh = − π̂h −
16 (p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 15,000: el total jóvenes
Zα/2 = 1.96
5
p=
6 µ ¶2
1 1
K1 = − 0.125 − = 0.4219
16 (5/6 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.2 − = 0.4725
16 (5/6 − 1/2)2 2
10, 000 5, 000
ΣEh=1 Wh kh = (0.4219) + (0.4725) = 0.4388
15, 000 15, 000
d = (0.49)(0.15) = 0.0735
Por lo tanto:
200
g) Suponga que n = 300 jóvenes es una muestra preliminar. ¿Cuál es el
tamaño de muestra para estimar el total con una precisión de 49 % del total
preliminar y una confiabilidad de 95 %?
N 2 Zα/2
2
ΣE
h=1 Wh Kh
n= 2
d2 + N Zα/2 ΣE
h=1 Wh Kh
donde: µ ¶2
1 1
Kh = − π̂h −
16 (p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 15, 000: el total de jóvenes
α = 0.05
Zα/2 = 1.96
5
p=
6 µ ¶2
1 1
K1 = − 0.125 − = 0.4219
16 (5/6 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.2 − = 0.4725
16 (5/6 − 1/2)2 2
E
X 10, 000 5, 000
Wh kh = (0.4219) + (0.4725) = 0.4388
h=1
15, 000 15, 000
τ̂st = 2250
d = (0.49)(2250) = 1, 102.50
Por lo tanto:
201
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
3/4 − 1 520
π̂1 = + = 0.02
2 (3/4) − 1 (2 (3/4) − 1) 2, 000
3/4 − 1 360
π̂2 = + = 0.0142
2 (3/4) − 1 (2 (3/4) − 1) 1, 400
3/4 − 1 180
π̂3 = + = 0.1
2 (3/4) − 1 (2 (3/4) − 1) 600
(19000) (0.02) + (16000) (0.0142) + (5000) (0.1)
π̂st = = 0.0277
40000
Por lo tanto, se estima que la proporción de mujeres que han tenido relaciones
antes del matrimonio es de 0.0277 ó 2.77 %.
donde:
N = 40, 000 : el total de mujeres en el estado de Colima
π̂st = 0.0277 : la proporción de mujeres que han tenido relaciones sexuales antes
del matrimonio
Por lo tanto:
202
3
p=
4
π̂1 = 0.02
π̂2 = 0.0142
π̂3 = 0.1
Por lo tanto:
µ ¶2 µ ¶ " µ ¶2 #
19000 19000 − 2000 1 1 1
Sπ̂2st = − 0.02 −
40000 19, 000 2000 16 (3/4 − 1/2)2 2
µ ¶2 µ ¶ " µ ¶2 #
16000 16000 − 1, 400 1 1 1
+ − 0.0142 −
40000 16000 1400 16 (3/4 − 1/2)2 2
µ ¶2 µ ¶ " µ ¶2 #
5000 5000 − 600 1 1 1
+ 2 − 0.01 −
40000 5000 600 16 (3/4 − 1/2) 2
= p
0.0002
Sπ̂st = (0.0002) = 0.0133
donde:
π̂st = 0.0277 : la proporción de mujeres que han tenido relaciones sexuales antes
del matrimonio
α = 0.05
Zα/2 = 1.96
q
Sπ̂2st = 0.0133
Por lo tanto:
0.0277 ± (1.96)(0.0133)
0.0277 ± 0.0260
0.0017 ≤ πst ≤ 0.0538
Por lo que se estima que la proporción de mujeres que han tenido relaciones
sexuales antes del matrimonio está entre 0.0017 y 0.0538.
donde:
τ = 412.7946
τ̂st = N π̂st
N = 40, 000 : el total de mujeres en el estado de Colima
q
Sπ̂2st = 0.0133
α = 0.05
Zα/2 = 1.96
q
Sτ̂2st = (40, 000)(0.0133) = 531.5853
203
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
por lo tanto:
1, 108.5714 ± (1.96)(531.5853)
1, 108.5714 ± 1041.8879
66.6835 ≤ τst ≤ 2, 150.4594.
Esto es, se estima que el total de mujeres que han tenido relaciones sexua-
les antes del matrimonio está entre 66.6835 y 2,1501.4594.
donde: µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 5, 000 : el total de mujeres
Zα/2 = 1.96
3
p=
4 µ ¶2
1 1
K1 = − 0.02 − = 0.7696
16(3/4 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.0142 − = 0.7641
16(3/4 − 1/2)2 2
µ ¶2
1 1
K3 = − 0.1 − = 0.8400
16(3/4 − 1/2)2 2
E
X 19, 000 16, 000 5, 000
Wh kh = (0.7696) + (0.7641) + (0.84) = 0.7762
h=1
40, 000 40, 000 40, 000
d = (0.75)(0.0277) = 0.0208
Por lo tanto:
(40, 000)(1.96)2 0.7762
n= = 5, 885.8636 mujeres (mues-
(40, 000)(0.0208)2 + (1.96)2 (0.7762)
tra)
204
g) Suponga que n = 4, 000 es una muestra preliminar. ¿Cuál es el tamaño de
muestra para estimar el total con una precisión de 75 % del total preliminar y
una confiabilidad de 95 %?
N 2 (Zα/2 )2 ΣE
h=1 Wh Kh
n= 2
d + N (Zα/2 )2 ΣE h=1 Wh Kh
donde: µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 40, 000 : el total de mujeres en el estado de Colima
α = 0.05
Zα/2 = 1.96
3
p=
4 µ ¶2
1 1
K1 = − 0.02 − = 0.7696
16(3/4 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.0142 − = 0.7641
16(3/4 − 1/2)2 2
µ ¶2
1 1
K3 = 2
− 0.1 − = 0.8400
16(3/4 − 1/2) 2
E
X 19, 000 16, 000 5, 000
Wh kh = (0.7696) + (0.7641) + (0.84) = 0.7762
h=1
40, 000 40, 000 40, 000
τ̂st = 1, 108.5714
d = (0.75)(1, 108.5714) = 831.4286
Por lo tanto:
(40, 000)2 (1.962 )(0.7762)
n= = 5, 885.8636
(831.4286)2 + (40, 000)(1.962 )(0.7762)
Dado que el tamaño de muestra es el mismo que el obtenido en f), la dis-
tribución queda con 2,796 mujeres para el estrato 1, 2,354 para el estrato 2 y
736 para el estrato 3.
205
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
3/4 − 1 55
π̂1 = + = 0.6
2 (3/4) − 1 (2 (3/4) − 1) 100
3/4 − 1 70
π̂2 = + = 0.2
2 (3/4) − 1 (2 (3/4) − 1) 200
3/4 − 1 30
π̂3 = + = 0.1
2 (3/4) − 1 (2 (3/4) − 1) 100
(4, 000) (0.6) + (4, 000) (0.2) + (2, 000) (0.1)
π̂st = = 0.34
10, 000
Por lo que se estima que la proporción de hombres con disfunción eréctil en el
Municipio de Temaltepec es de 0.34, es decir, el 34 %.
τ̂st = N π̂st
donde:
N = 10, 000 : el total de hombres en el municipio de Temaltepec
π̂st = 0.34
Por lo tanto:
206
N1 = 4, 000, N2 = 4, 000, N3 = 2, 000
n1 = 100, n2 = 200, n3 = 100
a1 = 55, a2 = 70, a3 = 30
3
P =
4
π̂1 = 0.6
π̂2 = 0.2
π̂3 = 0.1
Por lo tanto:
µ ¶2 µ " ¶ µ ¶2 #
4000 4000 − 100
1 1 1
Sπ̂2st = − 0.6 −
10000 100 16 (3/4 − 1/2)2
4000 2
µ ¶2 µ ¶ " µ ¶2 #
4000 4000 − 200 1 1 1
+ − 0.2 −
10000 3500 200 16 (3/4 − 1/2)2 2
µ ¶2 µ ¶ " µ ¶2 #
2000 2000 − 100 1 1 1
+ − 0.1 − = 0.0026
10000 2000 100 16 (3/4 − 1/2)2 2
Y así, la desviación estándar es igual a Sπ̂st =0.0505
donde:
π̂st = 0.34 : proporción de hombres con disfunción eréctil en el municipio de
Temaltepec
α = 0.10
Zα/2 = 1.645
q
Sπ̂2st = 0.0505
Por lo tanto:
0.34 ± (1.645)(0.0505)
0.34 ± 0.0831
0.2569 ≤ πst ≤ 0.4231
Esto significa que la proporción de hombres con disfunción eréctil del mu-
nicipio de Temaltepec está entre 0.2569 y 0.4231
donde:
τ̂st = 3, 400q
q
Sτ̂2st = N Sπ̂2st
207
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
Por lo tanto:
3, 400 ± (1.645)(505.4899)
3, 400 ± 831.4568
2, 568.5432 ≤ τst ≤ 4, 231.4568
Esto significa que el total de hombres con disfunción eréctil está entre 2,568.5432
y 4,231.4568.
N (Zα/2 )2 ΣE
h=1 Wh Kh
n=
N d2 + (Zα/2 )2 ΣE
h=1 Wh Kh
donde: µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 10, 000 : el total de hombres en el municipio de Temaltepec
Zα/2 = 1.645
3
p=
4 µ ¶2
1 1
K1 = − 0.6 − = 0.9900
16(3/4 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.2 − = 0.9100
16(3/4 − 1/2)2 2
µ ¶2
1 1
K3 = − 0.1 − = 0.8400
16(3/4 − 1/2)2 2
E
X 4, 000 4, 000 2, 000
Wh kh = (0.99) + (0.91) + (0.84) = 0.9280
h=1
10, 000 10, 000 10, 000
d = (0.18)(0.34) = 0.0612
Por lo tanto:
208
N1 4, 000
n1 = n= (628) = 252 para el estrato 1
N 10, 000
N2 4, 000
n2 = n= (628) = 252 para el estrato 2
N 10, 000
N3 2, 000
n2 = n= (628) = 126 para el estrato 3
N 10, 000
g) Suponga que n = 400 hombres es una muestra preliminar. ¿Cuál es el
tamaño de muestra necesario para estimar el total verdadero con una pre-
cisión de 18 % del total preliminar y una confiabilidad de 90 %?
N 2 Zα/2
2
ΣE
h=1 Wh Kh
n= 2
d2 + N Zα/2 ΣE
h=1 Wh Kh
donde: µ ¶2
1 1
Kh = − π̂h −
16(p − 1/2)2 2
Nh
Wh = ; h = 1, 2, 3
N
N = 10, 000 : el total de hombres en el municipio de Temaltepec
3
Zα/2 = 1.645; p =
4 µ ¶2
1 1
K1 = − 0.6 − = 0.9900
16(3/4 − 1/2)2 2
µ ¶2
1 1
K2 = − 0.2 − = 0.9100
16(3/4 − 1/2)2 2
µ ¶2
1 1
K3 = − 0.1 − = 0.8400
16(3/4 − 1/2)2 2
E
X 4, 000 4, 000 2, 000
Wh kh = (0.99) + (0.91) + (0.84) = 0.9280
h=1
10, 000 10, 000 10, 000
τst = 3, 400
d = (0.18)(3, 400) = 612
Por lo tanto:
7.6. Ejercicios
En los siguientes ejercicios estime los parámetros siguientes:
209
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
210
5
dos y 9 para el estrato tres. Para este caso p = .
6
211
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
φ̂ − (1 − p)pI
π̂ =
p
à !
φ̂ − (1 − p)pI
τ̂ = N π̂ = N
p
a
donde: φ̂ = , a = el total de respuestas afirmativas (sí) en la muestra de
n
tamaño n.
212
7.8.1. Ejemplos
Ejemplo 1. Se elige una muestra aleatoria simple de 350 de los 1,800 alum-
nos del bachillerato de la Universidad de Colima. Cada estudiante de la mues-
tra recibe una ficha con las siguientes preguntas:
Por lo tanto, √
0.5090 ± (1.96)( 0.00109)
0.5090 ± (1.96)(0,0330)
0.4443 ≤ π ≤ 0.5737
Por lo tanto,
τ̂ = 1800(0.5090) = 916. Así, se tiene que el número de estudi-
213
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
antes del bachillerato de la Universidad de Colima que alguna vez han fumado
marihuana es de 916.
Por lo tanto, √
916 ± (1.96)(1800)( 0.00109)
799.7226 ≤ τ ≤ 1032.6774
f) Suponga que los 350 estudiantes encuestados son una muestra prelimi-
nar. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción de
tal manera que sea estimada con una precisión de d = 0.05 y una confiabilidad
de 95 %?
à !
2 φ̂(1 − φ̂)
N Zα/2
p2
n= Ã !
2 φ̂(1 − φ̂)
N d2 + Zα/2
p2
donde: N = 1800, Zα/2 = Z0.025 = 1.96, d = 0.05, p = 0.7 y φ̂ = 125/350
Por lo tanto, µ ¶
(125/350)(1 − 125/350)
2
(1800)(1.96)
(0.7)2
n= µ ¶ = 514.2661
2 2
(125/350)(1 − 125/350)
(1800)(0.05) + (1.96)
(0.7)2
g) Suponga que los 350 estudiantes encuestados son una muestra prelim-
inar. ¿Cuál sería el tamaño de muestra necesario para estimar el total de tal
manera que sea estimado con una precisión de d = 90 y una confiabilidad de
95 %?
à !
φ̂(1 − φ̂)
N 2 Zα/2
2
p2
n= Ã !
2 φ̂(1 − φ̂)
d2 + N 2 Zα/2
p2
donde: N = 1800, Zα/2 = Z0.025 = 1.96, d = 90, p = 0.7 y φ̂ = 125/350
Por lo tanto, µ ¶
2 (125/350)(1 − 125/350)
2
(1800 )(1.96)
(0.7)2
n= µ ¶ = 514.2661
2 2 2
(125/350)(1 − 125/350)
(90) + (1800 )(1.96)
(0.7)2
214
una empresa automotriz del total de su población (N = 1, 500). Cada empleada
recibe una ficha con las siguientes preguntas:
Por lo tanto, √
0.9352 ± (1.96)( 0.00174)
0.8534 ≤ π ≤ 1
Por lo tanto,
τ̂ = 1500(0.9352) = 1402.8. Así, se tiene que el número de em-
pleadas en dicha empresa que se les ha escapado un gas en una reunión
importante es de 1403.
215
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
Por lo tanto, √
1402.8 ± (1.96)(1500)( 0.00174)
1280.163 ≤ τ ≤ 1500
f) Suponga que las 180 empleadas encuestadas son una muestra prelimi-
nar. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción de
tal manera que sea estimada con una precisión de d = 0.07 y una confiabilidad
de 95 %?
à !
2 φ̂(1 − φ̂)
N Zα/2
p2
n= Ã !
2 φ̂(1 − φ̂)
N d2 + Zα/2
p2
donde: N = 1500, Zα/2 = Z0.025 = 1.96, d = 0.07, p = 0.75 y φ̂ = 130/180
Por lo tanto, µ ¶
2(130/180)(1 − 130/180)
(1500)(1.96)
(0.75)2
n= µ ¶ = 235.692
(130/180)(1 − 130/180)
(1500)(0.07)2 + (1.96)2
(0.75)2
g) Suponga que las 180 empleadas encuestadas son una muestra prelim-
inar. ¿Cuál sería el tamaño de muestra necesario para estimar el total de tal
manera que sea estimado con una precisión de d = 105 y una confiabilidad de
95 %?
à !
φ̂(1 − φ̂)
N 2 Zα/2
2
p2
n= Ã !
2 φ̂(1 − φ̂)
d2 + N 2 Zα/2
p2
donde: N = 1500, Zα/2 = Z0.025 = 1.96, d = 105, p = 0.75 y φ̂ = 130/180
Por lo tanto, µ ¶
2 (130/180)(1 − 130/180)
2
(1500 )(1.96)
(0.75)2
n= µ ¶ = 235.692
2 2 2
(130/180)(1 − 130/180)
(105) + (1500 )(1.96)
(0.75)2
216
jeres recibe una ficha con las siguientes preguntas:
Por lo tanto, √
0.051 ± (1.96)( 0.00139)
0 ≤ π ≤ 0.1241
Por lo tanto,
τ̂ = 4000(0.051) = 204. Así, se tiene que el número de alumnas
que han tenido un aborto provocado es de 204.
217
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
Por lo tanto, √
204 ± (1.96)(4000)( 0.00139)
0 ≤ τ ≤ 496.2964
f) Suponga que las 210 alumnas encuestadas son una muestra preliminar.
¿Cuál sería el tamaño de muestra necesario para estimar la proporción de tal
manera que sea estimada con una precisión de d = 0.07 y una confiabilidad de
95 %?
à !
2 φ̂(1 − φ̂)
N Zα/2
p2
n= Ã !
2 φ̂(1 − φ̂)
N d2 + Zα/2
p2
donde: N = 4000, Zα/2 = Z0.025 = 1.96, d = 0.07, p = 0.7 y φ̂ = 39/210
Por lo tanto, µ ¶
(39/210)(1 − 39/210)
2
(4000)(1.96)
(0.7)2
n= µ ¶ = 228.1452
2 2
(39/210)(1 − 39/210)
(4000)(0.07) + (1.96)
(0.7)2
g) Suponga que las 210 alumnas encuestadas son una muestra preliminar.
¿Cuál sería el tamaño de muestra necesario para estimar el total de tal manera
que sea estimado con una precisión de d = 280 y una confiabilidad de 95 %?
à !
φ̂(1 − φ̂)
N 2 Zα/2
2
p2
n= Ã !
2 φ̂(1 − φ̂)
d2 + N 2 Zα/2
p2
donde: N = 4000, Zα/2 = Z0.025 = 1.96, d = 280, p = 0.7 y φ̂ = 39/210
Por lo tanto, µ ¶
2 2(39/210)(1 − 39/210)
(4000 )(1.96)
(0.7)2
n= µ ¶ = 228.1452
2 2 2
(39/210)(1 − 39/210)
(280) + (4000 )(1.96)
(0.7)2
218
Sabemos que pI = 0.7, el cual se obtuvo de un estudio previo reciente real-
izado a esta misma población. Suponga que el mecanismo de aleatorización es
una baraja con una fracción de cartas marcas con la letra A igual a p = 0.75 y
la fracción restante con las letras sobrantes del abecedario. De los resultados
de la encuesta se tiene que 100 contestaron sí a la pregunta correspondiente.
Por lo tanto, √
0.7543 ± (1.96)( 0.00235)
0.6593 ≤ π ≤ 0.8493
Por lo tanto,
τ̂ = 2000(0.7543) = 1508.6. Así, se tiene que el número de fun-
cionarios que han conducido en estado de ebriedad es de 1509.
Por lo tanto, √
1508.6 ± (1.96)(2000)( 0.00235)
219
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
1318.571 ≤ τ ≤ 1698.629
f) Suponga que los 135 funcionarios encuestados son una muestra prelimi-
nar. ¿Cuál sería el tamaño de muestra necesario para estimar la proporción de
tal manera que sea estimada con una precisión de d = 0.08 y una confiabilidad
de 95 %?
à !
2 φ̂(1 − φ̂)
N Zα/2
p2
n= Ã !
2 φ̂(1 − φ̂)
N d2 + Zα/2
p2
donde: N = 2000, Zα/2 = Z0.025 = 1.96, d = 0.08, p = 0.75 y φ̂ = 100/135
Por lo tanto, µ ¶
2 (100/135)(1 − 100/135)
(2000)(1.96)
(0.75)2
n= µ ¶ = 185.9025
(100/135)(1 − 100/135)
(2000)(0.08)2 + (1.96)2
(0.75)2
g) Suponga que los 135 funcionarios encuestadas son una muestra prelim-
inar. ¿Cuál sería el tamaño de muestra necesario para estimar el total de tal
manera que sea estimado con una precisión de d = 160 y una confiabilidad de
95 %?
à !
φ̂(1 − φ̂)
N 2 Zα/2
2
p2
n= Ã !
2 φ̂(1 − φ̂)
d2 + N 2 Zα/2
p2
donde: N = 2000, Zα/2 = Z0.025 = 1.96, d = 160, p = 0.75 y φ̂ = 100/135
Por lo tanto, µ ¶
2 2 (100/135)(1 − 100/135)
(2000 )(1.96)
(0.75)2
n= µ ¶ = 185.9025
(100/135)(1 − 100/135)
(160)2 + (20002 )(1.96)2
(0.75)2
7.9. Ejercicios
En los siguientes ejercicios estime lo siguiente:
a) Un intervalo de confianza para la proporción y el total con una confiabilidad
de 95 %.
b) Suponga que la muestra en cada ejercicio es una muestra preliminar. ¿Cuál
es el tamaño de muestra para estimar la proporción y el total de tal manera
que sean estimados con una precisión del 10 % con respecto a la proporción y
el total preliminar, respectivamente?
220
Ejercicio 1. Una investigadora desea estimar el porcentaje y total de mujeres
casadas que sufrieron de maltrato por parte de su pareja durante el 2007.
Supóngase que en el Municipio de Colima, Colima, se tiene una población de
matrimonios de N = 10, 000, de la cual se toma una muestra aleatoria simple de
n = 138 parejas (pero a quienes se les pregunta es a los esposos). Cada esposo
recibe una ficha con las siguientes preguntas:
221
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
h=1
N Nh p 2 nh
222
El tamaño de muestra para estimar la proporción y el total
223
Capítulo 7. El muestreo basado en el método de respuesta aleatorizada
224
Apéndice A
225
Apéndice A. Tablas de la distribución normal estándar y de la distribución
t-student
1D 2
Z0
Z0 Z0
1
Z Z
z2
P (Z < Z0 ) = fZ (z)dz = √ e− 2 dz = 1 − α/2
−∞ −∞ 2π
226
1D 2
t0
t0 t0 ¶−(ν+1)/2
t2
µ
1 [(ν + 1)/2]!
Z Z
P (T < t0 ) = fT (t)dt = √ +1 dt
−∞ −∞ νπ [ν/2]! ν
227
Apéndice A. Tablas de la distribución normal estándar y de la distribución
t-student
h h
h
h
h h
Triangular doble
h2
S2 =
8
Figura A.1: Varianzas de distribuciones finitas (S 2 ), en función de su forma y
rango.
Donde h=rango=Máximo Xi -Mínimo Xi .
228
Cuadro A.3: Tabla de números aleatorios
1 2 3 4 5 6 7 8 9 10
1 7 5 3 8 2 5 1 6 6 4 5 0 9 0 6 5 4 8 4 3 3 2 9 0 5 0 0 3 2 6 2 7 5 0 4 5 4 4 7 1 0 0 6 3 9 5 9 45 4
2 9 2 8 4 1 2 0 5 6 6 6 9 8 8 0 8 3 2 2 6 0 6 3 8 0 1 2 1 3 0 2 9 2 0 5 4 7 0 5 4 1 2 0 7 2 7 5 76 9
3 1 2 3 2 3 1 8 6 4 4 0 5 0 9 0 4 4 4 2 4 1 8 8 3 9 2 8 2 9 0 0 8 1 6 3 9 4 9 3 3 1 0 9 5 7 5 6 94 8
4 0 8 6 0 2 5 1 2 9 6 7 4 6 0 0 6 8 9 7 5 3 7 7 8 9 0 0 5 5 5 6 8 2 9 0 5 7 4 2 2 7 3 9 6 4 4 7 54 9
5 8 0 3 9 9 8 2 3 7 6 0 0 3 8 8 4 4 5 7 3 3 9 8 8 1 6 5 8 3 8 9 5 9 5 5 7 4 0 4 6 6 7 4 0 7 0 8 05 4
6 5 9 3 4 3 6 6 1 3 0 3 6 4 3 4 1 5 8 3 8 2 6 0 4 9 3 0 5 2 5 1 9 0 5 3 7 3 7 6 8 8 8 4 4 0 8 8 51 8
7 0 0 1 5 7 8 2 0 6 7 7 1 2 3 1 5 7 4 4 5 3 3 7 9 3 4 2 3 5 1 0 1 0 1 5 0 4 5 1 6 6 0 5 3 1 8 3 54 6
8 1 2 0 6 9 4 6 3 0 2 5 8 6 2 4 1 1 7 2 5 5 5 0 1 4 7 8 6 0 5 2 3 8 4 0 3 6 9 1 0 8 3 5 8 9 3 1 91 9
9 7 8 7 6 8 4 8 6 8 0 0 7 4 0 4 0 3 9 6 5 0 6 5 9 0 1 2 5 6 4 8 7 6 9 3 2 4 5 8 6 8 5 1 2 5 2 6 63 9
10 1 2 2 9 1 5 0 7 4 1 2 9 6 5 8 3 3 6 3 6 4 0 3 4 5 6 7 2 2 2 3 3 0 5 5 5 8 7 5 0 2 1 0 2 4 1 5 07 8
11 3 8 7 5 8 1 4 8 7 1 3 0 2 7 3 2 2 2 1 7 2 5 5 3 9 7 5 2 3 2 0 2 1 1 9 2 0 7 6 7 1 7 7 7 5 4 9 06 0
12 6 4 3 5 9 0 6 4 1 2 5 6 5 5 3 5 0 5 2 1 4 9 6 9 5 2 7 2 9 1 1 9 9 6 3 8 1 7 8 2 3 9 5 7 0 3 3 45 7
13 6 7 0 8 5 9 0 2 2 1 1 2 1 4 3 2 4 7 9 7 4 0 4 6 8 7 0 3 9 3 5 9 8 3 0 8 5 7 5 5 6 5 4 4 5 0 8 33 5
14 4 6 8 9 0 5 9 5 9 2 7 7 6 1 0 3 6 6 6 4 6 2 3 3 6 9 4 4 5 6 9 4 9 5 8 6 0 7 9 1 6 0 0 8 3 3 5 07 8
15 7 5 8 9 6 4 7 7 3 2 0 0 2 5 6 5 6 9 1 9 8 8 7 5 3 9 9 8 6 5 9 8 7 0 9 2 2 5 7 5 6 3 2 3 8 8 5 00 8
16 8 7 2 5 2 4 6 1 3 5 8 0 7 5 1 0 5 9 8 7 3 6 3 2 0 4 1 2 4 9 7 3 5 4 4 7 5 1 0 4 8 6 8 5 3 5 9 98 2
17 3 3 1 7 1 3 3 5 5 1 7 6 5 3 3 2 7 3 6 5 4 9 2 5 6 0 7 8 3 2 9 0 8 2 0 9 4 7 3 4 6 3 9 0 6 5 8 66 9
18 5 3 2 1 4 6 5 3 7 0 5 6 1 2 1 6 8 0 2 7 0 3 8 5 0 0 2 7 2 0 5 6 5 4 5 9 3 5 9 3 2 5 2 4 9 4 4 07 4
19 6 7 2 8 4 1 9 3 9 4 9 5 1 0 0 9 6 6 7 5 0 6 3 4 8 3 6 9 5 0 1 7 9 8 3 5 7 5 8 3 9 3 6 3 5 3 7 87 9
20 9 4 8 0 0 2 7 7 3 6 4 4 9 0 6 4 5 5 3 7 5 3 0 9 8 0 2 8 2 0 6 3 1 6 1 9 3 4 8 8 1 4 4 5 5 8 4 77 4
21 5 5 7 4 3 8 6 5 4 7 5 5 5 1 9 9 8 7 5 9 9 1 3 8 8 5 5 7 4 7 7 3 9 1 6 6 8 8 8 9 0 8 6 9 7 9 4 90 3
22 6 0 8 4 7 4 3 4 5 6 6 4 9 5 1 0 8 0 9 2 5 8 9 6 5 9 8 8 4 4 8 9 8 6 9 8 1 8 7 6 3 5 3 5 4 7 2 29 4
23 5 4 2 1 8 3 4 0 1 4 6 9 1 2 7 9 7 8 1 0 3 1 9 9 5 6 2 8 1 8 8 3 8 7 1 4 9 1 5 9 1 5 6 1 4 1 5 02 3
24 9 5 9 1 0 9 2 8 1 4 9 9 0 5 1 4 6 0 0 6 9 5 4 7 4 7 0 5 5 7 7 7 1 2 3 3 5 2 7 3 8 1 9 1 6 4 5 52 0
25 9 2 0 3 8 2 4 9 8 3 3 2 7 2 6 9 9 1 2 2 2 4 7 1 6 9 8 5 5 6 2 6 5 4 7 0 6 0 5 4 4 6 0 4 8 5 2 67 6
26 6 1 8 6 6 3 1 9 5 0 7 5 2 7 3 3 1 8 1 5 0 8 2 8 9 1 2 2 8 5 7 8 9 4 3 1 6 3 2 6 8 5 2 8 9 5 2 31 4
27 1 8 1 9 2 7 1 9 8 6 5 8 5 3 9 6 6 8 5 8 2 3 6 4 3 6 0 0 3 3 8 5 9 8 3 2 8 5 7 6 7 8 3 1 5 7 9 69 5
28 1 1 9 4 7 4 3 1 7 2 2 4 6 7 2 0 2 7 8 3 8 8 9 6 6 3 1 3 0 6 3 3 8 2 2 9 5 1 6 4 3 1 0 9 7 6 8 76 2
29 7 7 5 3 6 0 3 3 6 1 4 6 2 3 9 0 7 7 8 3 0 7 0 2 8 4 3 7 2 7 1 8 2 7 8 5 1 9 2 4 4 9 4 4 1 9 5 89 9
30 6 1 1 9 5 5 2 5 4 6 1 5 4 0 4 5 6 6 5 9 0 4 9 0 6 4 5 8 0 3 4 0 0 8 9 1 8 7 5 2 3 5 9 5 5 9 7 59 5
31 9 6 0 8 6 3 7 2 4 7 4 7 8 7 6 2 9 0 9 6 0 5 9 7 9 5 0 2 7 8 1 2 4 8 6 3 7 9 3 3 7 0 8 9 4 5 3 59 5
32 5 7 9 4 8 8 8 0 4 4 0 9 4 2 7 3 1 5 0 7 2 9 8 6 9 5 3 6 8 6 6 1 1 8 4 5 1 0 4 2 0 1 7 3 3 3 7 12 2
33 0 0 0 7 1 4 5 3 3 0 3 1 6 3 3 3 4 9 9 8 0 5 3 3 7 6 5 8 7 1 9 8 6 8 0 7 6 3 6 1 7 6 4 4 4 7 9 15 2
34 6 4 1 3 1 6 0 0 5 4 6 8 3 0 8 6 7 0 8 6 6 6 0 2 8 9 8 9 9 4 1 0 2 3 8 9 0 9 2 9 6 5 6 3 1 2 1 79 9
35 7 4 8 7 1 1 6 8 4 8 8 1 1 7 8 5 8 1 0 8 6 6 9 7 6 3 1 9 3 8 3 7 9 5 2 5 2 2 6 6 1 3 0 6 4 5 0 61 5
36 3 2 4 9 0 2 7 2 4 6 0 7 5 3 1 6 3 1 9 3 4 8 2 4 1 8 9 5 7 0 5 7 0 6 2 2 4 0 5 1 3 7 5 0 1 4 2 45 2
37 5 4 1 1 4 0 9 8 8 6 6 0 6 9 0 5 0 1 0 5 0 1 3 3 3 7 4 6 1 2 1 3 8 9 5 8 1 0 1 5 9 0 4 4 3 0 9 72 6
38 7 5 6 3 9 0 0 3 3 6 4 3 2 9 5 4 7 2 6 0 3 7 4 3 3 4 9 4 2 2 6 5 0 9 8 8 1 8 4 9 1 4 6 9 8 1 7 19 4
39 0 2 1 7 1 9 2 7 1 3 1 3 8 3 9 7 9 1 9 1 3 0 0 5 0 8 4 0 5 5 4 3 1 8 0 1 4 3 7 8 1 7 3 2 2 2 1 18 8
40 3 8 5 7 3 9 8 4 7 4 5 9 6 0 6 0 4 6 9 8 8 3 9 1 9 0 3 7 0 2 6 9 7 6 3 1 5 9 8 5 0 6 7 1 0 8 6 80 8
41 7 8 4 0 6 2 3 7 0 6 4 8 5 2 4 5 6 7 1 6 2 6 5 7 6 5 0 5 9 9 9 8 9 2 3 6 1 4 7 3 8 3 7 0 5 5 8 71 8
42 1 5 9 8 9 9 6 4 0 5 6 6 2 9 5 1 0 2 6 4 8 5 6 5 6 8 0 2 1 0 6 2 3 7 8 1 5 0 6 5 6 4 8 7 5 9 1 76 2
43 1 1 0 5 8 0 2 6 5 8 3 3 5 4 2 4 3 6 6 3 4 4 3 3 4 7 3 6 3 6 1 1 7 9 5 0 3 5 7 7 9 3 3 3 0 0 0 16 2
44 3 9 6 9 4 0 8 3 5 9 3 8 0 5 3 5 2 3 4 0 7 1 9 0 1 1 2 7 4 8 7 2 1 5 9 9 0 2 3 8 9 0 2 0 3 4 1 17 3
45 4 5 0 4 1 3 4 5 2 8 7 9 4 1 7 2 7 9 9 2 1 1 5 5 0 9 0 4 4 6 1 3 2 8 2 9 8 3 8 1 8 0 5 6 8 9 6 06 6
46 3 3 6 1 8 1 2 1 4 2 6 5 4 0 7 5 8 1 4 2 6 5 6 2 5 9 2 4 9 4 2 9 9 3 1 3 2 8 2 8 8 4 4 1 9 5 8 72 9
47 0 1 5 4 7 3 8 6 4 0 6 5 1 0 1 2 6 1 5 9 5 3 3 4 7 7 3 7 5 0 0 4 0 5 9 2 9 5 8 0 3 0 0 1 1 6 2 77 4
48 4 6 1 2 0 9 7 2 4 3 3 0 2 3 6 2 7 9 1 1 1 3 3 4 0 4 3 9 7 9 0 1 4 8 8 2 8 1 9 9 1 9 0 2 3 0 0 41 1
49 2 6 1 9 9 0 0 2 1 4 5 8 6 4 1 6 5 5 1 2 8 6 3 9 9 5 8 3 1 4 4 2 2 4 0 2 5 9 6 9 8 7 0 6 0 1 5 18 6
50 7 2 4 3 1 7 0 5 1 3 1 4 5 8 3 2 4 7 8 8 5 3 4 1 3 2 6 6 2 0 4 4 6 9 0 4 0 4 5 3 5 0 3 6 2 7 4 10 7
229
Apéndice A. Tablas de la distribución normal estándar y de la distribución
t-student
230
Bibliografía
[5] Bradburn, Norman M. and Seymour Sudman. Polls and Surveys: Under-
standing What They Tell Us. Jossey-Bass Publishers (1988).
[8] Danger, S., Huizing, N., Walker, A., Rowland, A., Anderson, R., Sciaccalu-
ga, R. EU Information Society Guide. Brussels, Belgium: The EU Com-
mittee on the American Chamber of Commerce in Belgium (1996).
[13] Deming, W. E. Some Theory of Sampling. New York: Jonh Wiley and Sons (1950).
[14] Raj D. The Desing of Sample Surveys . New York: Mcgraw-Hill, Company Book
(1972).
231
Bibliografía
232