Estadistica LL E2 PDF
Estadistica LL E2 PDF
Estadistica LL E2 PDF
Lectura Fundamental
Intervalos de confianza
Contenido
1 Introducción
Referencias
Para cada uno de los párametros en la población existe su equivalente en la muestra, en la siguiente tabla aparece
dicha relación:
Las estimaciones que se hacen cuando se toma una muestra pueden arrojar, o no, resultados con un valor igual
al del párametro en la población. Por ejemplo, a continuación se muestra una población de cuatro personas a las
que se les preguntó la cantidad de dinero que gastan diariamente en transporte.
Si se toma la muestra con los datos 1 y 2 el promedio de la población seria igual al promedio de la muestra, es
decir, µ = x̄ = 11.000, mientras que si tenemos los datos 2 y 3 mu = 11.000 6= x̄ = 12.000. Por otro lado, como en
una muestra aleatoria el promedio puede cambiar cada vez que se selecciona la muestra, entonces, los estimadores
se comportan como una variable aleatoria, y como consecuencia de esto, cada uno de ellos tiene una distribución
muestral (Triola, 2004).
X̄ ∼ N (µ; σ 2 /n)
Que corresponde a una distribución normal con media µ y varianza 2
q σ /n (Anderson, Sweeney, & Williams, 2008),
−n
es decir, E(X̄) = µ y σx̄ = √σn para población infinita y σx̄ = √σn NN −1 para población finita.
POLITÉCNICO GRANCOLOMBIANO 1
Figura 1: Distribución de la media muestral.
Fuente: elaboración propia
1. La probabilidad de que la variable aleatoria X̄ sea menor o igual que un valor x¯1 P (X̄ ≤ x¯1 )
2. La probabilidad de que la variable aleatoria X̄ sea mayor o igual que un valor x¯1 P (X̄ ≥ x¯1 )
POLITÉCNICO GRANCOLOMBIANO 2
Figura 3: Distribución de la media muestral para P (X̄ ≥ x¯1) .
Fuente: elaboración propia
3. La probabilidad de que la variable aleatoria X̄ este entre dos valores x¯1 , x¯2 .
P (x¯1 ≤ X̄ ≤ x¯2 )
Ejemplos
1. Para la construcción de una carretera nacional se require material granulado, se sabe que el costo en millones
(COP) por metro cúbico tiene una distribución normal de la siguiente manera X ∼ N (0.6; 2) asumiendo que
a través de una muestra de tamaño 49 se utiliza x̄ como estimador para µ calcule:
POLITÉCNICO GRANCOLOMBIANO 3
X̄ − µ
= Z ∼ N (0, 1)
√σ
n
√
Reeemplazando por µ = 0.6, σ = 2 y n = 49.
!
1 − 0.6
P Z≤ √ = P (Z ≤ 1.98) = 0.98
2
7
b) P (X̄ ≥ 0.3)
En este caso:
P (X̄ ≥ 0.3) = 1 − P (X̄ ≤ 0.3)
De donde:
1 − P (Z ≤ −1.48) = 1 − 0.07 = 0.93
2. El precio en COP de un activo finaciero sigue una distribución normal como sigue X ∼ N (30000; 10000000)
con base en una compra que se hace de 40 acciones se quiere observar cual es la probabilidad de:
a) P (X̄ ≤ 29000)
Algebraicamente se resuelve ası́:
Partiendo de P (X̄ ≤ 29000) tenemos que:
!
X̄ − µ 1−µ
P ≤
√σ √σ
n n
√
Reeemplazando por µ = 30000, σ = 10000000 y n = 40
29000 − 30000
P Z ≤ √ = P (Z ≤ −2) = 0.02
10000000
√
40
POLITÉCNICO GRANCOLOMBIANO 4
b) P (X̄ ≥ 30050)
En este caso:
P (X̄ ≥ 30050) = 1 − P (X̄ ≤ 30050)
de donde:
1 − P (Z ≤ 0.1) = 1 − 0.54 = 0.46
3.1. Promedio
E(p̂) = p,
Donde:
p es la proporción poblacional
E(p̂) = p es el valor esperado de la proporción muestral.
Por lo tanto es un estimador insesgado.
r r
N −n p(1 − p)
σp =
N −1 n
r
p(1 − p)
σp =
n
Ejemplo
Se sabe que el 60 % de los adultos de una zona del paı́s compran determinado producto. Se obtiene una muestra
de 150 adultos de esta área. ¿Cuál es la probabilidad de que la proporción muestral esté entre el 50 % y el 70 %?
POLITÉCNICO GRANCOLOMBIANO 5
r
0.6 ∗ 0.4
p = 0.6 σp =
150
Recordemos que como P es aproximadamente normal, se requiere estandarizar la variable aleatoria para poder
utilizar las tablas de probabilidades.
0.5 − 0.6 p − p̂ 0.7 − 0.6
P (0.5 < P < 0.7) = P ≤ ≤ = P (−2.5 < Zp < 2.5)
0.04 σp 0.04
= 0.9938 − 0.0062 = 0.9876
(n − 1)s2
∼ χ2n−1
σ2
En una estimación puntual, el valor de dicha estimación puede ser igual al valor del parámetro poblacional o no;
por ejemplo, si se tiene una población que corresponde al costo de mantenimiento un vehı́culo anualmente con los
siguientes datos:
POLITÉCNICO GRANCOLOMBIANO 6
Tomando dos muestras de tamaño 2:
Tabla 4: Muestra 1.
Muestra 1 (n1 )
1 $600000
2 $1000000
El valor del promedio muestral es x̄1 = 800000, en este caso la estimación puntual es igual al parámetro poblacional.
Tabla 5. Muestra 2
Muestra 2 (n2 )
1 $700000
2 $1000000
Fuente: elaboración propia
El valor del promedio muestral es x̄2 = 850000, aquı́ la estimación puntual NO es igual al parámetro poblacional.
Por lo tanto, en este ejemplo se puede observar la limitación de las estimaciones puntuales de acertar, o no, a los
parámetros poblacionales, ya que el interés que se tiene es concluir que pasa en la población a través de muestras,
como una solución se construyen estimaciones por intervalo.
1. La estimación puntual.
2. Margen de error.
3. Nivel de confianza (1 − α) %.
Estimación puntual:
x̄
Margen de error:
z α2 √σn
POLITÉCNICO GRANCOLOMBIANO 7
El intervalo de confianza es el siguiente:
σ
x̄ ± z α2 √
n
Donde:
s
x̄ ± t α2 √
n
Ejemplos
• El gerente de una fábrica preocupado por la demora en la producción, desea estimar el tiempo promedio que
gastan sus trabajadores en ensamblar una pieza determinada. Por experiencia se sabe que el tiempo gastado
tiene distribución normal con desviación estándar de 3,38 minutos. Se toma una muestra de seis obreros y
se registra el tiempo, en minutos, que gastan obteniendo:
Solución P
xi 101.4
Con los datos de la muestra se obtiene x̄ = n = 6 = 16, 9.
• Paso 1: Encontrar el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa de
10 %), vaya al paso 2. Para este caso, restamos el nivel de confianza del 100 %. Es decir, si tiene un nivel
de confianza del 90 por ciento, entonces el 100 % - 90 % = 10 %.
• Paso 2: divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una prueba
de dos colas: 10 % / 2 = 5 %
• Paso 3: reste el paso 2 del 50 %: 50 % - 5 % = 45 %
POLITÉCNICO GRANCOLOMBIANO 8
• Paso 4: convierta el paso 3 a un decimal y encuentre esa zona en el centro de la tabla Z.
El más cercano de puntuación Z de 45 % (0.45) se encuentra entre en Z = 1,64 y Z=1,65; lo que haremos es
sumar estos dos datos y dividir en 2 el resultado, obteniendo Z α2 = 1, 645.
El intervalo queda entonces:
x̄ ± Z α2 σx̄
3, 83
16, 9 ± 1, 645 √
6
16, 9 − 2, 57 = 14, 32
16, 9 + 2, 57 = 19, 47
Con una confiabilidad del 90 % se estima que el tiempo promedio de ensamblado esta entre 14,32 y 19,47
minutos.
• Un supermercado vende café cuya etiqueta dice 40 onzas. Ante los reclamos hechos, el gerente toma una
muestra de 14 paquetes y encuentra un peso promedio de 34,86 y una desviación estándar de 4,23. Con una
confiabilidad del 95 % estimar el peso promedio de todos los paquetes. Datos: n = 14, número de muestras
x̄ = 34, 86 (media de la muestra).
s = 4, 23 (desviación estándar).
n − 1 = 14 − 1 = 13 (grados de libertad).
Para una confiabilidad o nivel de confianza del 95 % encontramos el valor t en la tabla de la distribución
t-Student, para ello haremos lo siguiente:
• Paso 1: encuentre el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa de
10 %), vaya al paso 2. Para este caso Restamos el nivel de confianza del 100 %. Es decir, si tiene un
nivel de confianza del 95 %, entonces el 100 % - 95 % = 5 %.
• Paso 2: divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una prueba
de dos colas: 5 % / 2 = 2.5 %
• Paso 3: ubique en la columna 1, de la tabla los n − 1 grados de libertad en esta caso da 13.
• Paso 4: convierta el paso 2 a un decimal 2,5 % (0.025) y encuentre el valor que en este caso es:
4, 23
x̄ ± t α2 ,n−1 Sx̄ = 34, 86 ± 2, 1604 √ = 34, 86 ± 2, 44
14
Ls = 34, 86 + 2, 44 = 32, 42
Li = 34, 86 − 2, 44 = 37, 00
Con una confianza del 95 % se puede decir que el peso promedio se encuentra entre 32,42 y 37,0 onzas.
POLITÉCNICO GRANCOLOMBIANO 9
Ejemplo
En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa ha obtenido la certifica-
ción ISO en los dos últimos años. Halle el intervalo de confianza al 99 % de la proporción poblacional de empresas
que han recibido la certificación en los dos últimos años.
Solución
La proporción muestral está dada por:
p̂ = 67/95
Para una confiabilidad o nivel de confianza del 99 % encontramos el valor Z en la tabla de la distribución normal,
para ello haremos lo siguiente:
• Paso 1: encuentre el nivel alfa. Si se le da el nivel alfa en la pregunta (por ejemplo, un nivel alfa de 10 %),
vaya al paso 2. Para este caso Restamos el nivel de confianza del 100 %. Es decir, si tiene un nivel de confianza
del 90 %, entonces el 100 % - 99 % = 1 %.
• Paso 2:divida la cantidad que se encontró en el paso 1 en 2 para obtener el nivel alfa para una prueba de
dos colas: 1 % / 2 = 0,5 %.
El más cercano de puntuación Z de 49,5 % (0.495) se encuentra entre en Z = 2, 57 y Z = 2, 58; lo que haremos es
sumar estos dos datos y dividir en 2 el resultado, obteniendo Z α2 = 2, 575
0, 71 − 0, 12 ≤ P ≤ 0, 71 + 0, 12
0, 58 ≤ P ≤ 0, 705
Ası́, la proporción de empresas con certificación ISO (con un margen de error de un 12 % y un nivel de confianza
del 99 %) se encuentra entre el 58 % y 71 %, aproximadamente.
(n − 1)s2 2 (n − 1)s2
≤ σ ≤
χ2α ,n−1 χ21− α ,n−1
2 2
POLITÉCNICO GRANCOLOMBIANO 10
Donde el lı́mite inferior es:
(n − 1)s2
χ2α ,n−1
2
Ejemplo
El director de control de calidad de una empresa quı́mica ha extraı́do una muestra aleatoria de 20 sacos de
fertilizante de 100 kilos, para estimar la varianza de los kilos de impurezas. Se ha observado que la varianza muestral
es de 6,62. Determine el intervalo de confianza al 95 % de la varianza poblacional de los kilos de impurezas.
Solución:
α
Dado que s2 = 6, 62 y n = 20 vamos a establecer los valores y cuando 2 = 0.025.
α
P χ2n−1 < χ2(1− α ,n−1) =
2 2
P χ219 < χ2(19,0.975) = 0, 025
χ2(19,0.975) = 8.91
Luego el intervalo de confianza es:
(n − 1)s2 2 (n − 1)s2
< σ <
χ2α ,n−1 χ21− α ,n−1
2 2
En otras palabras la varianza poblacional o la varianza en kilos de impurezas se encuentra entre 3,83 y 14,12 kilos.
POLITÉCNICO GRANCOLOMBIANO 11
Referencias
[1] Montgomery, Douglas C and Runger Probabilidad y estadı́stica aplicadas a la ingenierı́a 1996.
[2] Walpole, Ronald E and Myers, Raymond H and Myers, Sharon L Probabilidad y estadı́stica para ingenieros
1999.
[3] Anderson, D.R. and Sweeney, D.J. Estadı́stica Para Administración y Economı́a 2008.
POLITÉCNICO GRANCOLOMBIANO 12
INFORMACIÓN TÉCNICA
Módulo: Estadı́stica II
Unidad 1: Muestreo, distribuciones muestrales y estimación
de parámetros.
Escenario 2: Intervalos de confianza para una muestra
POLITÉCNICO GRANCOLOMBIANO 13