Capítulo 9
Capítulo 9
Capítulo 9
Introducción
Las razones del muestreo son las siguientes:
• Entrar en contacto con toda la población consume demasiado tiempo.
• El costo de estudiar todos los elementos de la población es muy alto.
• Por lo general, los resultados de la muestra resultan adecuados.
• Algunas pruebas resultan negativas.
• Es imposible revisar todos los elementos.
Un estimador puntual consiste en un solo valor (punto) deducido de una muestra para estimar el
valor de una población. Por ejemplo, suponga que elige una muestra de 50 ejecutivos de nivel
medio y le pregunta a cada uno de ellos la cantidad de horas que laboró la semana pasada. Se
calcula la media de esta muestra de 50 y se utiliza el valor de la media muestral como estimador
puntual de la media poblacional desconocida. Ahora bien, un estimador puntual es un solo valor.
Un enfoque que arroja más información consiste en presentar un intervalo de valores del que se
espera que se estime el parámetro poblacional. Dicho intervalo de valores recibe el nombre de
intervalo de confianza.
Ejemplo
3. ¿Cómo se deben interpretar estos resultados?Suponga que selecciona varias muestras de 256
gerentes, tal vez varios cientos. Para cada muestra, calcula la media y después construye un
intervalo de confianza de 95%, como en la sección anterior. Puede esperar que alrededor de 95%
de estos intervalos de confianza contenga la media de la población. Cerca de 5% de los intervalos
no contendrán el ingreso anual medio poblacional, . No obstante, un intervalo de confianza
particular contiene el parámetro poblacional o no lo contiene.
Como no conoce σ, no puede utilizar la distribución z. Sin embargo, hay una solución: utilizar la
desviación estándar de la media y sustituir la distribución z con la distribución t. La distribución t
es una distribución de probabilidad continua, con muchas características similares a las de la
distribución z.
Observe que la distribución t es más plana y que se extiende más que la distribución normal
estándar. Esto se debe a que la desviación estándar de la distribución t es mayor que la
distribución normal estándar.
Valores de z y t para el nivel de confianza de 95 por ciento
Cabe hacer una aclaración en este momento. La decisión de utilizar t o z se basa en el hecho de
que se conozca σ, la desviación estándar poblacional. Si se conoce, se utiliza z. Si no se conoce,
se debe utilizar t.
Cómo determinar cuándo se debe usar la distribución z o la distribución t
Ejemplo
Ejemplo
Intervalo de confianza de una proporción
PROPORCIÓN: Fracción, razón o porcentaje que indica la parte de la muestra de la población
que posee un rasgo de interés particular.
Elección del tamaño adecuado de una muestra
Esta decisión se basa en tres variables:
1. El margen de error que tolerará el investigador.
2. El nivel de confianza deseado.
3. La variabilidad o dispersión de la población que se estudia.
La primera variable es el margen de error. El máximo error admisible, designado E, es la magnitud
que se suma y resta de la media muestral (o proporción muestral) para determinar los puntos
extremos del intervalo de confianza. Por ejemplo, en un estudio de salarios, podemos decidir que
deseamos estimar el salario promedio de la población con un margen de error de más o menos
$1 000. O en una encuesta de opinión, podemos decidir que deseamos calcular la proporción de
la población con un margen de error de más o menos 5%. El margen de error es la magnitud del
error que se tolerará al estimar un parámetro poblacional. Quizás se pregunte por qué no elegir
márgenes pequeños de error. Existe una compensación entre el margen de error y el tamaño de
la muestra. Un margen de error pequeño requiere de una muestra más grande y de más tiempo y
dinero para recolectarla. Un margen de error más grande permitirá tener una muestra más
pequeña y un intervalo de confianza más amplio.
La segunda elección es el nivel de confianza. Al trabajar con un intervalo de confianza,
lógicamente se elegirán niveles de confianza relativamente altos como de 95 y 99%, que son los
más comunes. Para calcular el tamaño de la muestra, se necesitará un estadístico z que
corresponda al nivel de confianza elegido. El nivel de confianza de 95% corresponde al valor z de
1.96, y el nivel de confianza de 99%, a un valor z de 2.58. Note que las muestras más grandes
(con su consecuente requerimiento de más tiempo y dinero para recolectarlas) corresponden a
niveles de confianza más altos. Asimismo, observe que utilizamos un estadístico z.
El tercer factor en la determinación del tamaño de una muestra es la desviación estándar de la
población. Si la población se encuentra muy dispersa, se requiere una muestra grande. Por el
contrario, si se encuentra concentrada (homogénea), el tamaño de muestra que se requiere será
menor. No obstante, puede ser necesario utilizar un estimador de la desviación estándar de la
población. He aquí algunas sugerencias para determinar dicho estimador.