Capitulo Estimacion PDF
Capitulo Estimacion PDF
Capitulo Estimacion PDF
OBJETIVOS
Explicar conceptos básicos de la estimación estadística.
Estipular las propiedades que debe cumplir un estimador.
Ilustrar el empleo de estimadores en situaciones de muestreo prácticas.
Calcular estimadores puntuales y por intervalos.
Palabras claves
Estimador Estimador Puntual
Estimador por intervalo Estimador Insesgado
Estimador EficienteEstimador Suficiente
Estimador ConsistenteMétodos de estimación
ESTIMACIÓN
Mendenhall W. y Sincich T., Probabilidad y Estadística, Cuarta edición, editorial
Prentice Hall, 1997, páginas 337 a la 342.
Hay dos formas de hacer una inferencia acerca de un parámetro de una población: podemos
estimar el valor del parámetro desconocido o pedemos tomar una decisión acerca de un
valor hipotético del parámetro. Por ejemplo, podemos estimar el número medio de
trabajos presentados cada hora a un centro de procesamiento de datos o podríamos querer
decidir si la media excede o no cierto valor, digamos 60. El método para tomar una
decisión acerca de uno o más parámetros de una población, denominado prueba
estadística de una hipótesis, es el tema del capítulo siguiente.
Definición
Un estimador puntual es una regla o fórmula que nos dice cómo calcular una estimación
numérica con base en las determinaciones contenidas en una muestra. El número que
resulta es una estimación puntual.
Definición
Dado que un estimador puntual se calcula a partir de una muestra, posee una distribución de
muestreo. La distribución de muestreo de un estimador puntual describe por completo sus
propiedades. Por ejemplo, según el teorema de límite central, la distribución de muestreo de
una media de muestra estará distribuida normal si el tamaño de la muestra es grande,
digamos n=30 o más, con media y error estándar (véase la figura 8.1). La figura
n
muestra que una media de muestra y tiene las mismas probabilidades de quedar por arriba
o por debajo de y que hay una probabilidad de aproximadamente 0.95 de que no se
2
desviará de en más de 2 y .
n
Figura 8.1
Distribución de muestreo
de una media de muestra
cuando la muestra es
grande.
Las características manifestadas en la figura 8.1 identifican las dos propiedades más
deseables de los estimadores. Primero, nos gustaría que la distribución de muestreo de un
estimador esté centrada en el parámetro que se desea estimar. Si la media de la distribución
de muestro de un estimador ˆ es igual al parámetro estimado , se dice que el estimador
está Insesgado. Si no es así, se dice que el estimador está sesgado. La media de muestra es
un estimador Insesgado de la media de la población .
Definición
Un estimador ˆ de un parámetro es insesgado si E ˆ . Si E ˆ , se dice que el
estimador está sesgado.
Ejemplo 8.1
Solución
2
s2 2 de lo que sigue que
n 1
2
Es 2
E 2
n 1
n1 E
2
E s2 2
Por la sección anterior se sabe que E 2 y V 2 2 ; por tanto
n
2
yi
1 n 2 i 1 1 n 2 2
s
2
y y i n y
n 1 i 1
i
n n 1 i 1
Como 2 E y 2 2 . En consecuencia, E y 2 2 2 para una variable aleatoria y.
Dado que cada valor de y, y1 , y2 ,, yn se escogió al azar de una población con media
y varianza 2 , se sigue que
E y i2 2 2 i 1,2,3,, n
y
2
E y i2 y y
n
2 2
2
2
Si tomamos el valor esperado de s y sustituimos estas expresiones, obtenemos
1 n 2 2
E s 2 E y i n y
n 1 i 1
1 n 2
E y i E n y
n 1 i 1
2
1 n
2
E y i nE y
n 1 i 1
2
1 n
2
n 2
2 2
n 1 i 1 n
1
n 1
n 2 n 2 2 n 2
1
n 1
n 2 2
n 1 2
n 1
2
Este intervalo se llama el intervalo de confianza del 1001 % para , y es apenas uno
del gran número de intervalos de los cuales el 1001 % contiene a . Para expresar este
solo intervalo, podemos escribir
C x o k xo k 1 5.4
n n
donde C indica que el intervalo es un intervalo de confianza y que se trata de un enunciado
de confianza más bien que un enunciado de probabilidad. En la ecuación (5.4), 1 se
denomina coeficiente de confianza e indica el grado o cantidad de confianza que tenemos
en que nuestro intervalo único contenga a . El coeficiente de confianza expresado en
forma de porcentaje recibe el nombre de nivel de confianza.
En esta ecuación, x o es el estimador, z1 es el llamado factor de confiabilidad y
es el
2 n
error típico del estimador. Podemos entonces expresar un intervalo de confianza de este
tipo, en términos generales, como
Ejemplo
1. ¿Cuál es el ingreso medio estimado de todos los gerentes (la población)? Es decir,
¿Cuál es la estimación puntual?
2. ¿Cuál es el intervalo de confianza del 95 por ciento para la media (redondeada a la
decena de dólares más próxima)?
3. ¿Qué grado de confianza se utiliza?
4. Interprete los resultados.
Solución:
Ejemplo
Solución:
xo 12500, so 3000 , 1 0.95 , N 3000 y n 200 .
De los valores anteriores notamos que se debe incorporar el cpf a la fórmula anterior. El
valor de t es t 0.975,199 1.9719.
Con un 95% de confiabilidad, se puede afirmar que el ingreso familiar promedio para los
3000 hogares de ese sector está entre $12095.82 y $12904.18.
Cuando se saca una muestra aleatoria simple de cada una de las poblaciones normalmente
distribuidas con varianzas conocidas, la distribución muestral de x1 x 2 es normal y tiene
12 22
una media igual a y una varianza igual a . Cuando esta situación prevalece, el
n1 n2
intervalo de confianza del 1001 % para la diferencia entre dos medias de población,
está dado por
12 2 2 1 2 2 2
C x1 x 2 z 1 x1 x 2 z 1 1
n1 n2 n1 n2
2 2
donde x1 x 2 es una diferencia observada entre dos medias muestrales. Debe entenderse
que x1 y x2 son valores números específicos.
Cuando se sabe que las varianzas de las dos poblaciones normalmente distribuidas son
iguales o cuando se desea hacer esa suposición, el intervalo de confianza del 1001 %
para 1 2 (diferencia entre las medias poblacionales) viene dado por:
2 2 2
s
2
C x1 x2 t P 1
sP s sP
P x1 x2 t
1 , n1 n 2 2 n1 n2 1 , n1 n 2 2 n1 n2
2 2
En la ecuación t es el valor de la distribución t de Student correspondiente a n1 n 2 2
2
grados de libertad y al valor deseado de 1 y s es la estimación combinada de la
P
varianza común de la población.
Sin embargo, en la situación más normal, las varianzas poblacionales son desconocidas y se
emplean las varianzas muestrales como estimaciones de las varianzas poblacionales, el
intervalo de confianza del 1001 % para 1 2 viene dado por
2 2
sP sP
2 2
C x1 x2 t x1 x2 t
sP sP
1
1 , n 1 n 2 2 n1 n2 1 , n 1 n 2 2 n1 n2
2 2
Ejemplo:
Queremos estimar la diferencia entre los salarios iniciales medios de graduados recientes en
ingeniería mecánica e ingeniería civil de la University of Florida (UF). Contamos con la
siguiente información:
1. Una muestra aleatoria de 59 salarios de graduados en ingeniería mecánica de la UF
arrojó una media de muestra de $32675 y una desviación estándar de $4430.
2. Una muestra aleatoria de 30 salarios de graduados en ingeniería civil de la UF
arrojó una media de muestra de $27460 y una desviación estándar de $4286.
Solución
Utilizaremos el subíndice 1 para referirnos a los graduados en ingeniería mecánica, y el 2
en ingeniería civil. También definiremos la siguiente notación:
1 = Media de la población de salarios iniciales de todos los graduados recientes de UF
en ingeniería mecánica
2 = Media de la población de salarios iniciales de todos los graduados recientes de UF
en ingeniería civil
Con alguna frecuencia, se desea hacer una estimación de la proporción de sujetos que
componen una población y poseen una característica de interés. Generalmente, no es
práctico examinar toda la población para determinar p, proporción verdadera que posee la
característica de interés. En lugar de esto se toma una muestra aleatoria de la población y se
utiliza la proporción muestral p̂ para hacer una estimación de p.
Cuando el muestreo se hace sin reemplazamiento (que es lo usual) en una población finita,
resulta adecuado el uso del cpf y por tanto el intervalo de confianza del 1001 % para p
viene dado por
pˆ 1 pˆ N n pˆ 1 pˆ N n
C pˆ o z1 p pˆ o z1 1
n N 1 n N 1
2 2
donde p̂ o es un valor numérico específico de p̂ calculado en una muestra.
INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL
x
i 1
i x
2
razón
n 1s 2 sigue una distribución chi-cuadrado con n 1 grados de libertad. Podemos
2
utilizar este hecho en la construcción de intervalos de confianza para varianzas
poblacionales. De aquí que podamos escribir el intervalo de confianza del 1001 % ,
para 2 como
n 1so 2 n 1so 2
C 2 2 1
2
1 , n1 , n 1
2 2
n
Como n 1s xi x , podemos construir el intervalo de confianza para 2
2 2
i 1
como
n n
x i x 2 xi x 2
C i 1 2 2 i 1 1
2
1 , n 1 , n 1
2 2
Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta contenida
en cada lata varía, pues hay ciertos factores imposibles de controlar que afectan la cantidad
de llenado. Si es grande, algunas latas contendrán poco, y otras, demasiado. A fin de
2
7.96 7.90 7.98 8.01 7.97 7.96 8.03 8.02 8.04 8.02
Establezca un intervalo de confianza de 90% para la verdadera variación del llenado de
latas en la enlatadora.
Solución
Para que el intervalo de confianza sea válido, debemos suponer que la muestra de
observaciones (cantidades de llenado) se selecciona de una población normal. A fin de
2
calcular el intervalo, necesitamos calcular ya sea la varianza de la muestra s o la
desviación estándar de la muestra s . Para nuestro caso es s 0.043 .
0.10
Ahora bien, 1 0.90 y 0.05 . Por tanto, los valores tabulados
2 2
02.05 y 0.95
2
para n 1 9 gl (obtenidos de la tabla del anexo 3) son
02.05 3.32511 y 0.95
2
16.9190 .
La razón entre las dos varianzas muestrales s12 s2 2 , proporciona un estimador puntual de
12 22 , que es la razón entre las dos varianzas poblacionales. Un estimador de esta
naturaleza resulta útil cuando hay interés en averiguar las magnitudes comparativas de dos
varianzas.
Podemos construir intervalos de confianza para 12 2 2 , la razón entre las varianzas de dos
poblaciones normalmente distribuidas, utilizando la distribución F. Podemos escribir el
intervalo de confianza del 1001 % , para 12 2 2 como
s12 s 2 2 12 s12 s 2 2
C 1
F1 / 2 2 F
2 /2
Como la tabla del anexo 4 contiene solamente los percentiles de la cola superior de la
distribución F (esto es, sólo valores de F1 / 2 ), vale la pena dar una explicación de la
forma de obtener valores de F / 2 .
1
Para hallar F / 2 utilizamos la identidad F / 2, 1 , 2 , donde 2 y 1
F1 / 2, 2 , 1
son los grados de libertad del numerador y del denominador respectivamente. Así pues, si
1 15, 2 20 y 0.05,
F0.975, 15, 20 2.57
1 1
F0.025, 15, 20 0.36
F0.975, 20, 15 2.76
Ejemplo:
Solución
2 2
Sean n1 y n2 , s1 y s2 los tamaños y varianzas de las muestras, respectivamente.
Así n1 13 y n2 16, s1 525 y s2 350, 1 - 0.90 y 0.10 .
2 2
1 1
Ahora F0.95,12,15 2.48 y F0.05,12,15 0.38 .
F0.95,15,12 2.62
s12 s 2 2 12 s12 s 2 2
Remplazando en C 1 , se tiene
F1 / 2 2 F / 2
2
525 350 12 525 350
C 2 0.90
2.48 2 0.38
1.5 12 1.5
C 2 0.90
2.48 0.38
2
2
C 0.6 1 2 3.95 0.90
2
EJERCICIOS, SECCIÓN 2
3. Como parte de un experimento, una gran empresa manufacturera encontró que el tiempo
promedio requerido para que 16 empleados realizaran una tarea determinada era de 26
minutos. La desviación típica era de 5 minutos. Construir el intervalo de confianza del 90%
para . ¿Qué suposiciones son necesarias para poder construir un intervalo de confianza
válido?
4. Una gran compañía deseaba calcular la proporción en que sus empleados estaban de
acuerdo con un nuevo plan de seguros. De una muestra aleatoria de 300 empleados, 75 de
ellos dijeron que estaban de acuerdo. Construir el intervalo de confianza del 95% para la
proporción real que está de acuerdo con el plan.
6. Un banco nacional, al igual que otros bancos grandes, encuentra que el uso de cajeros
automáticos (ATM, de automatic teller machine) reduce el costo de as transacciones
bancarias de rutina. Tal banco instaló Un ATM en las oficinas centrales de una industria. El
ATM es para uso exclusivo de los 605 empleados de la compañía. Después de varios meses
de operación, una muestra de 100 empleados reveló que en un mes usan la máquina ATM
como sigue.
Veces que Frecuencia
se usa el ATM
0 25
1 30
2 20
3 10
4 10
5 5
Total 100
8. Una serviteca desea corresponder a sus clientes por su confianza, en especial cuidado con
los neumáticos para camiones que más acreditación le da al negocio. Ofrece dos marcas
que tienen la misma duración, pero no está muy segurote su variabilidad. Selecciona
muestras de tamaños 16 y 21 neumáticos de cada marca, con varianzas de 36000 y 42000
Km. Encuentre un intervalo de confianza del 990% para la razón entre las varianzas.
9. Se comparan dos métodos para realizar cierta operación. Supongamos que los resultados
obtenidos en las dos muestras fueron: x 725 ; s x 61 y y 661 ; s y 86 , los
2 2
10. El salario mensual para una muestra de 30operarios textiles es de $212000, con una
varianza de $935000. Fije los límites de confianza del 95% para el salario medio mensual
de las operaciones en fábricas de textiles.
a) Obténgase un intervalo de confianza del 95% para estimar el salario medio por semana
de los operadores de máquinas perforadoras empleadas por los bancos comerciales de dicha
ciudad.
b) Al nivel del 1%, ¿Podría afirmarse que estos resultados son inferiores a los señalados por
la empresa, de 22 amperios de punto medio de ruptura?
12. Se hizo una entrevista a 7 subdirectores y a cinco analistas de mercado de una gran
empresa. Se les preguntó, a través de estas dos muestras aleatorias, cuál consideraban que
debería ser el porcentaje óptimo de cobertura de mercado para su compañía. Los resultados
fueron:
Subdirectores 35.0 31.3 37.8 30.3 34.2 32.5 36.3
Análisis de 33.1 28.6 34.2 33.5 36.3
mercado
Establezca límites de confianza del 95%, para la diferencia entre los promedios de
porcentajes.