ESTIMACIÓN
ESTIMACIÓN
ESTIMACIÓN
En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor
aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra.
Por ejemplo, una estimación de la media de una determinada característica de una población de
tamaño N podría ser la media de esa misma característica para una muestra de tamaño n.
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos métodos que
se usan en función de las características y propósitos del estudio:
Estimación puntual.
Estimación por intervalos.
Estimación bayesiana.
ESTIMADOR.
Un estimador es un estadístico al que se le exigen ciertas condiciones para que pueda calcular con
ciertas, garantías ciertos parámetros de una población.
Nombramos estos dos por ser los más sencillos, pero en estadística existen muchos más. Ahora bien,
volviendo a la definición, ¿Qué entendemos por ciertas condiciones para que puedan calcular con
ciertas garantías ciertos parámetros?
En primer lugar, debemos entender que cuando realizamos un estudio de investigación, normalmente,
queremos estudiar cierto parámetro. Por ejemplo, queremos estudiar cual es la altura media de los
árboles en cierta ciudad de Colombia. La variable objeto de estudio es la altura de los árboles en cierta
ciudad de Colombia. Mientras que, el parámetro es la altura media de los árboles de esa ciudad.
En el ejemplo anterior, ¿qué condición tendríamos que exigir a nuestro estimador? Pues, por ejemplo,
que no tome valores negativos. Y, por supuesto, que el cálculo de la altura media de lugar a valores
posibles. Si el árbol más alto mide 10 metros, el estimador media no puede arrojarnos 15 metros. En
ese caso, no podría tratarse de un estimador, pues no estaría dando lugar a valores físicamente
posibles.
Así, de lo anterior concluimos que los estimadores son estadísticos que deben, obligatoriamente,
tomar valores posibles de los datos que estamos estudiando.
ESTIMACIÓN PUNTUAL.
Un estimador puntual del parámetro de una población es una regla que indica como calcular un número
con base en los datos muéstrales. Al número resultante se le llama estimación puntual del parámetro.
ESTIMACIÓN PUNTUAL DE LA MEDIA DE UNA POBLACIÓN.
Algunos problemas de decisión en los negocios requieren a menudo de la estimación de la media 𝜇
de una población. Por ejemplo, suponga que se está interesado en la producción media diaria de una
línea de ensamblado, o en el número promedio de accidentes por mes en una fábrica, o bien en la
demanda promedio para un nuevo producto. En todos estos casos la estimación de 𝜇 resulta una
importante aplicación práctica de la inferencia estadística y resulta también una excelente ilustración
de los principios de estimación puntual.
Se dispone de varios estimadores para estimar la media 𝜇 de una población. Entre estos se tiene la
mediana muestral, el promedio entre la máxima y la mínima observación en la muestra y la media
muestral 𝑦̅.
La media muestral 𝑦̅ es comúnmente superior a aquellos debido a que para algunas poblaciones la
desviación estándar de su distribución muestral es mínimo y siempre es insesgada
independientemente de la población.
Por lo anterior tenemos que:
Estimador: 𝑦̅
2𝜎
Cota del error: 2𝜎𝑦̅ =
√𝑛
Nota: Si se desconoce 𝜎 y 𝑛 es mayor o igual a 30, se puede usar la desviación estándar muestral 𝑠
para aproximar 𝜎.
Ejemplo 1.
Suponga que se desea estimar la producción diaria promedio de cierto producto en una planta de
productos químicos. Se registra la producción diaria durante 𝑛 = 50 días y se obtiene una media y
una desviación estándar de 871 tons y 21 tons respectivamente.
Estime la producción diaria promedio 𝜇.
Solución.
El estimador es 𝑦̅ = 871 𝑡𝑜𝑛𝑠.
La cota del error de estimación es:
2𝜎 2𝜎
2𝜎𝑦̅ = =
√𝑛 √50
Aunque se desconoce el valor de 𝜎, éste puede ser aproximado por 𝑠, el estimador de 𝜎. Se tiene
entonces que la cota del error de estimación es aproximadamente:
2𝜎 2𝜎 2𝑠 2 ∙ (21) 42
2𝜎𝑦̅ = = = = = ≈ 5.94
√𝑛 √50 √50 7.07 7.07
Se puede confiar en que la estimación de 871 tons se encuentra a menos de 5.94 tons del verdadero
rendimiento promedio.
ESTIMACIÓN POR INTERVALO DE LA MEDIA DE UNA POBLACIÓN.
El estimador por intervalo, o intervalo de confianza, puede obtenerse fácilmente a partir de los
resultados de la estimación puntual de la media. Es posible que 𝑦̅ pueda resultar mayor o menor que
la media de la población aunque no es de esperarse que se desvíe más de 2𝜎𝑦̅ de 𝜇. Por lo tanto, si
se escoge (𝑦̅ − 2𝜎𝑦̅ ) como el extremo inferior del intervalo, llamado límite inferior de confianza (LIC),
y (𝑦̅ + 2𝜎𝑦̅ ) como el extremo superior, o límite superior de confianza (LSC), el intervalo así construido
contendrá muy probablemente a la verdadera media de la población 𝜇. De hecho si 𝑛 es
suficientemente grande como para que la distribución de 𝑦̅ sea aproximadamente normal, se espera
que aproximadamente el 95% de los intervalos, que se obtuvieron por muestrear repetidas veces,
contendrá a la media de la población 𝜇.
El intervalo de confianza que se describe en el párrafo anterior es llamado intervalo de confianza de
muestras grandes puesto que se requiere que el tamaño de la muestra sea suficientemente grande
para que el teorema central del límite garantice la distribución aproximadamente normal de 𝑦̅. Puesto
que comúnmente se desconoce 𝜎 es necesario usar la desviación estándar de la muestra 𝒔 para
estimar 𝝈. Por lo general este intervalo de confianza resulta apropiado cuando 𝒏 es mayor o
igual a 30.
En general, es posible construir intervalos de confianza para cualquier coeficiente de confianza
𝜎
(1 − 𝛼) por medio de la siguiente fórmula : 𝑦̅ ± 𝑍𝛼⁄2
√𝑛
Los límites de confianza correspondiente a los coeficientes de confianza que se usan más
frecuentemente se muestran en la siguiente tabla.
Límites de confianza para 𝝁
COEFICIENTE DE
CONFIANZA
(𝟏 − 𝜶) 𝜶 𝒁𝜶⁄𝟐 LIC LSC
0.90 0.10 1.645 𝜎 𝜎
𝑦̅ − 1.645 𝑦̅ + 1.645
√𝑛 √𝑛
0,95 0.05 1.96 𝜎 𝜎
𝑦̅ − 1.96 𝑦̅ + 1.96
√𝑛 √𝑛
0.99 0.01 2.58 𝜎 𝜎
𝑦̅ − 2.58 𝑦̅ + 2.58
√𝑛 √𝑛
Ejemplo 2.
Encuentre un intervalo de confianza del 90% para la media de la población del ejemplo 1.
Solución.
Del ejemplo 1 se tiene que 𝑦̅ = 871 𝑡𝑜𝑛𝑠 𝑦 𝑠 = 21 𝑡𝑜𝑛𝑠
Los límites de confianza para el 90% son:
𝜎
𝑦̅ ± 1.645
√𝑛
Al usar 𝑠 para estimar 𝜎 se tiene:
𝜎 21 21
𝑦̅ ± 1.645 = 871 ± 1.645 = 871 ± 1.645 ∙ = 871 ± 4.89
√𝑛 √50 7.07
𝐿𝐼𝐶 = 871 − 4.89 = 866.11 𝑡𝑜𝑛𝑠
𝐿𝑆𝐶 = 871 + 4.89 = 875.89 𝑡𝑜𝑛𝑠
Por lo tanto se estima que el rendimiento diario promedio 𝜇 se encuentra en el intervalo de 866.11
tons a 875.89 tons. El coeficiente de confianza 90% = 0.90 implica que en muestreo sucesivo si se
determinan los intervalos de confianza para cada muestra, el 90% de los intervalos contendrán a 𝜇.
𝜎2 𝜎2
Cota del error 2𝜎(𝑦̅1 −𝑦̅2 ) = 2√𝑛1 + 𝑛2 .
1 2
Nota: Si 𝜎12 , 𝜎22 son desconocidas, pero 𝑛1 , 𝑛2 son mayores o iguales que 30, se pueden utilizar
𝑠12 , 𝑠22 en lugar de 𝜎12 , 𝜎22 .
Ejemplo 3.
Una comparación del desgaste de dos tipos distintos de neumáticos para automóvil, se hizo rodando
100 neumáticos de cada tipo. El número de kilómetros – vida de cada neumático se anotó, en donde
km-vida fue definido como el kilometraje andando antes de que el neumático quedase en un estado
determinado de desgaste. Los resultados de las pruebas fueron los siguientes:
NEUMÁTICO 1 NEUMÁTICO 2
̅𝟏 = 𝟐𝟔𝟒𝟎𝟎 𝑲𝒎
𝒚 ̅𝟐 = 25100 𝑲𝒎
𝒚
𝒔𝟐𝟏 = 𝟏𝟒𝟒𝟎𝟎𝟎𝟎 𝒔𝟐𝟏 = 1960000
Estime (𝜇1 − 𝜇2 ), la diferencia en Km-vida medios, y obtenga la cota para el error de estimación.
Solución.
El estimador puntual de (𝜇1 − 𝜇2 ) es:
(𝑦̅1 − 𝑦̅2 ) = 26400 − 25100 = 1300 𝐾𝑚
Se tiene entonces que la cota para el error es:
= 368 𝐾𝑚 − 𝑣𝑖𝑑𝑎
Ejercicios.
1) Debido a la escasez de agua producida por el calor severo del verano en una comunidad, el
gobierno de la ciudad selecciona al azar 100 viviendas para observar el medidor de agua
durante un día y estimar el consumo diario promedio por vivienda durante un día caluroso. Se
obtiene de ésta muestra una media y una desviación estándar de 117.5 galones y 16.8
galones respectivamente. Estime 𝜇, el consumo diario promedio por vivienda en ésta
comunidad y determine una cota para el error de estimación.
2) Se selecciona una muestra de 100 empleados de una compañía, se registra el salario anual
de cada empleado en la muestra y se calculan la media y la desviación estándar muestral de
los obteniéndose $7750 dólares y $900 dólares respectivamente. Construya el intervalo de
confianza del 95% para el salario promedio de la población 𝜇.
3) Casi todas las escuelas de posgrado requieren de la aprobación de un examen de admisión
que mide tanto la habilidad verbal como la cuantitativa de los candidatos. Suponga que uno
de éstos exámenes, con escala 0 – 80, se utiliza para comparar a los estudiantes ya admitidos
en dos escuelas distintas. Se seleccionan dos muestras aleatorias consistentes en 75
calificaciones correspondientes a cada una de las escuelas. Los promedios muestrales y
desviaciones estándar calculados son:
Escuela 1: 𝑦̅1 = 564 𝑠1 = 70
Estime la diferencia entre la calificación media de los estudiantes de cada una de las escuelas
y dé la cota para el error de estimación.