11 Paramentros de Confianza
11 Paramentros de Confianza
11 Paramentros de Confianza
Índice
1. Estimación 2
1
Inferencia Estadística 1. Estimación
1 Estimación
En general, inferencia estadística consiste en hacer conclusiones basado en la teoría de probabilidad
sobre cantidades desconocidas (parametros).
El objetivo de un investigador que usa estadística es aprender y obtener resultados sobre los parámetros
de una población después de observar los datos (muestra). Desde la perspectiva del investigador, los
datos contienen información relevante para verificar algunas hipótesis en relación a algunos parametros
de la población.
A fin de obtener resultados y conclusiones de uno o más parametros de la población se utiliza inferencia
estadística.
El término conclusiones probabilísticas significa que para realizar conclusiones en relación a uno o
mas parámetros de la población se utiliza la teoría de probabilidad.
A fin de obtener conclusiones probabilísticas es necesário utilizar un estimador para un parámetro θ
θ(X1 , X2 , . . . , X n )
b
X1 = x1 , X2 = x2 , . . . , X n = xn ,
entonces
θ(x1 , x2 , . . . , xn )
b
es denominado estimación (estimativa) de θ.
1. Estimación puntual Basado en los datos, se calcula el valor observado del estimador b
θ del
parámetro θ, así se asocia
θ=b θ.
El valor observado b
θ se le denomina estimación puntual de θ.
Problema: Un estimador puntual no proporciona la precisión de la estimación.
2. Estimación por intervalo Tiene por finalidad estimar un conjunto de posibles valores de θ consis-
tentes con los datos.
2
Inferencia Estadística 1. Estimación
Ejemplo 1.1
Para los siguientes parámetros se presenta los estimadores respectivos
Ejemplo 1.2
Muchos de los medicamentos empleados en el tratamiento del cáncer son costosos. BusinessWeek
informó de los costos de los tratamientos con Herceptin, un medicamento para tratar el cáncer de mama
(BusinessWeek, 30 de enero de 2006). Los siguientes son los costos de tratamientos con Herceptin en
una muestra aleatoria de 10 pacientes.
a) Calcule una estimación puntual del costo medio y la desviaciõn estándar de un tratamiento con
Herceptin
b) Calcule una estimación puntual del coeficiente de variación en los costos de los tratamientos con
Herceptin.
Ejemplo 1.3
Una muestra de 20 estudiantes que recientemente tomaron un curso de estadística elemental arrojó la
siguiente información sobre la marca de calculadora que poseían. (T=Texas Instruments, H=Hewlett
Packard, C=Casio, S=Sharp):
T T H T C T T S C H
S S T H C T T T H T
Estime la proporción verdadera de los estudiantes que poseen una calculadora Texas Instruments,
Hewlett Packard y Casio.
3
Inferencia Estadística 1. Estimación
La raíz cuadrada de la varianza del estimador es conocida como error estándar del estimador
q h i
SE bθ = Var b θ
1. Son pocos los casos en que el error de estimación puede ser calculado exactamente.
4
Inferencia Estadística 2. Estimación por Intervalos
La finalidad de la estimación por intervalos es proporcionar información de que tan próximo esta el
estimador puntual del valor del parámetro poblacional.
Por ejemplo, la estimación del intervalo de confianza para µ es
x ± Margen de error
L = L(X1 , X2 , . . . , X n ) y U = U(X1 , X2 , . . . , X n )
L(x1 , x2 , . . . , xn ) = c1 y U(x1 , x2 , . . . , xn ) = c2
Las estadísticas L y U son construidas a partir de la distribución muestral del estimador del
parámetro θ
Los valores c1 y c2 son usados para obtener el margen de error de la estimación puntual de los
parámetros.
5
Inferencia Estadística 2. Estimación por Intervalos
2.1 Interpretación
i) Antes de:
osea, antes de observar los datos se puede afirmar que el intervalo aleatorio (L, U)
contiene (incluye) al verdadero valor del parámetro con probabilidad 100(1 − α) % (nivel de
confianza).
L = c1 y U = c2
Ejemplo 2.1
Sea una m.a X1 , X2 , . . . , X n que proviene de una distribución normal con media µ y varianza σ2 . Un IC
para µ con un nivel de confianza 1 − α = 0.95
!
σ σ
X − 1.96 √ , X + 1.96 √
n n
Interpretación:
i) El intervalo X − 1.96 √σn , X + 1.96 √σn contiene el verdadero valor de µ con probabilidad 0.95. Esto
por que los extremos del intervalo son aleatorios.
ii) Dado n = 31 y x = 80, entonces se obtiene el intervalo de 95 % de confianza observado (fijo) del
para µ dado por (79.3, 80.7). Para la interpretación se debe de considerar lo siguiente
6
Inferencia Estadística 2. Estimación por Intervalos
La figura 2.1 muestra dos simulaciones del intervalo de confianza para este ejemplo. Se realizo 100
simulaciones (repeticiones) en que para cada simulación se consideró una muestra de tamaño n=30 y la
muestras son tomadas de una población normal con media µ=3 y varianza σ2 =1. En la Figura 2.1(a) se
observa que en las 100 repeticiones 95 (95 %) intervalos de confianza contienen al verdadero valor de la
media poblacional y 5 de ellos no lo contienen. En la Figura 2.1(b) se muestra que de las 100 repeticiones
93(93 %) intervalos contienen la media µ=3 y el restante no lo contienen.
De esta manera se puede observar que la noción de intervalo de confianza esta en base a la frecuencia o
repetición del experimento.
Intervalos de confianza
4.0
3.5
3.0
µ
2.5
2.0
0 20 40 60 80 100
Muestras
(a)
Intervalos de confianza
4.0
3.5
3.0
µ
2.5
2.0
0 20 40 60 80 100
Muestras
(b)
Figura 2.1: Simulación de intervalos de confianza
7
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
σ
IC(µ) : µ ∈ x ± z α2 × √
n
!
σ σ
µ ∈ x − z α2 √ ; x + z α2 √
n n
en que z α2 representa el valor del cuantil de la distribución normal. Además el error estándar del
estimador x es
σ
SE(x) = √
n
El IC para µ dada anteriormente se aplica bajo las siguientes condiciones
Si el ancho del intervalo es angosto, se tiene mayor precisión sobre el valor del parámetro
Si el ancho del intervalo es amplio, se tiene mayor incertidumbre (menos precisión) sobre el valor
del parámetro.
8
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
Ejemplo 3.1
Un científico interesado en vigilar contaminantes químicos en alimentos y, por lo tanto, la acumulación
de contaminantes en la dieta humana, seleccionó una muestra aleatoria de n = 20 adultos hombres. Se
encontró que el promedio de ingesta diaria de productos lácteos fue de x = 756 gramos por día. Se tiene
información que la desviación estándar poblacional es σ = 35 gramos por día.
Use esta información muestral para construir un intervalo de confianza de 90 % para la ingesta diaria
media de productos lácteos para hombres. Suponga que la población es normal.
Solución:
La muestra es pequeña, n = 20, la población es normal y además la varianza es conocida entonces si se
puede aplicar el IC para la media con varianza conocida.
σ
σ = 35 IC(µ) : µ ∈ x ± z α2 × √
n
n = 20
35
x = 756 µ ∈ 756 ± 1.645 × √
20
1 − α = 0.90
µ ∈ 756 ± 12.8742
z α2 = 1.645
µ ∈ (756 − 12.8742 ; 756 + 12.8742)
µ ∈ (743.1258 ; 768.8742)
9
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
Ejemplo 3.2
Muchos pacientes con problemas del corazón tienen un marcapasos para controlar su ritmo cardíaco. El
marcapasos tiene montado un módulo conector de plástico en la parte superior. Suponga una desviación
estándar de 0.0015 pulgadas, y con base en esto calcule un intervalo de confianza del 95 % para la media
de la profundidad de todos los módulos conectores fabricados por cierta empresa. Una muestra aleatoria
de 75 módulos tiene una profundidad promedio de 0.310 pulgadas.
Solución:
La muestra es grande, n = 75, la población es no normal y además la varianza es conocida entonces si
se puede aplicar el IC para la media con varianza con conocida.
σ
σ = 0.0015 IC(µ) : µ ∈ x ± z α2 × √
n
n = 75
0.0015
x = 0.310 µ ∈ 0.310 ± 1.96 × √
75
1 − α = 0.95
µ ∈ 0.310 ± 0.0003395
z α2 = 1.96
µ ∈ (0.310 − 0.0003395 ; 0.310 + 0.0003395)
µ ∈ (0.3096605 ; 0.3103395)
10
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
X−µ
T= √ ∼ tν , (3.1)
S/ n
s
IC(µ) : µ ∈ x ± tν, α2 √
n
!
s s
µ ∈ x − tν, α2 √ ; x + tν, α2 √
n n
Nótese que tν, α2 representa el cuantil de la distribución t-student con ν = n − 1 grados de libertad.
El cuantil tν, α2 satisface:
α α
P(T < −tν, α2 ) = y P(T > tν, α2 ) =
2 2
11
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
distribucion t
0.4
n =1
n =4
n = 10
n = 30
normal
0.3
Densidad
0.2
0.1
0.0
-4 -2 0 2 4
Ejemplo 3.3
Se registran las siguientes mediciones del tiempo de secado, en horas, de cierta marca de pintura vinílica:
Suponga que las mediciones representan una muestra aleatoria de una población normal y con base en
esto calcule el intervalo de confianza del 95 % para el tiempo medio de secado de la pintura.
Solución:
La muestra es pequeña, n = 15, la población es normal y además la varianza es desconocida entonces se
aplica el IC para la media con varianza desconocida para muestras pequeñas
12
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
s
s = 0.9709 IC(µ) : µ ∈ x ± tν, α2 √
n
n = 15
0.9709
x = 3.7867 µ ∈ 3.7867 ± 2.145 × √
15
1 − α = 0.95
µ ∈ 3.7867 ± 0.5377
ν = n − 1 = 15 − 1 = 14 (gl)
µ ∈ (3.7867 − 0.5377 ; 3.7867 + 0.5377)
t α2 = 2.145
µ ∈ (3.249 ; 4.3244)
Ejemplo 3.4
En un estudio de National Retail Foundation se encontró que las familias estaban dispuestas a gastar en
promedio $649 durante las vacaciones decembrinas (The Wall Street Journal, 2 de diciembre de 2002).
Suponga que en el estudio participaron 600 familias y que la desviación estándar muestral fue $175.
13
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
s
IC(µ) : µ ∈ x ± z α2 √ ,
n
!
s s
µ ∈ x − z α2 √ ; x + z α2 √
n n
Ejemplo 3.5
Un proveedor vende fibras sintéticas a una compañía de manufactura. Se selecciona una muestra
aleatoria simple de 81 fibras de un envío. El promedio de la fuerza de ruptura de éstas es de 29 lb y la
desviación estándar de 9 lb.
Solución:
La muestra es grande, n = 81 y además la varianza es desconocida entonces si se puede aplicar el IC
para la media con varianza desconocida.
n = 81 x = 29 s=9
9
µ ∈ 29 ± 1.96 × √
81
µ ∈ 29 ± 1.96
µ ∈ (29 − 1.96 ; 29 + 1.96)
µ ∈ (27.04 ; 30.96)
14
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
9
µ ∈ 29 ± 2.576 × √
81
µ ∈ 29 ± 2.576
µ ∈ (29 − 2.576 ; 29 + 2.576)
µ ∈ (26.424 ; 31.576)
ii) En el caso que la muestra es extraída de una población normal y es grande se tiene que los
grados de libertad de la distribución t también es grande por ejemplo ν >100. En este sentido,
la distribución t se aproxima a la distribución normal estándar, Z. Sin embargo, para este
curso se considerara que la aproximación es adecuada si n > 30.
15
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
i) Usar como valor para σ una estimación de la desviación estándar poblacional calculada a partir de
datos de estudios anteriores.
ii) Por medio de un estudio piloto se selecciona una muestra preliminar. La desviación estándar
muestral obtenida puede usarse como valor para σ.
Ejemplo 3.6
Un experto en eficiencia desea determinar el tiempo promedio que toma perforar tres hoyos en cierta
placa metálica. ¿De qué tamaño debe ser una muestra para tener un 95 % de confianza en que esta media
muestral estará dentro de 15 segundos de la media verdadera? Suponga que por estudios previos se sabe
que σ= 40 segundos.
Solución:
Se pide el tamaño de muestra n, en que el nivel de confianza es 1 − α=0.95. El error de estimación o
margen de error es igual a B = 15. Se nos indica que σ=40, luego
z α σ 2 2
1.96 · 40
2
n= = = 27.3180 ≈ 28
B 15
El tamaño de muestra debe ser n = 28.
16
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ
la gráfica de probabilidad normal denominada también gráfico q-q (del ingles q-q plot) o
realizar una prueba de hipótesis (no parametrico) tales como: Kolmogorov-Smirnov, Shapiro-Wilk
y Anderson-Darling
● ● ●
●
●
2 ●●
●
12 ●
●● ●●
●●●
●●●● ●●
●●●
●
●●
● ●
●
●
●●
●
●●
●
10 ●●
1 ●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
●
●
●●
●
●●
● ●●●
Sample Quantiles
Sample Quantiles
●
●●
● ●
●●
●
●●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
8 ●
●
●
●●
●
●●
● ●
●
●
●
●●
●
0 ●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
6 ●
●●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●● ●
●●
●
●
●
●● ●●
●
●●
●
●
●●
●
●●
●
●● ●
●●
●
● ●
●●
●
●
●●
●
●●
●
●● ●
●
●●
−1 ●●
●
●
●
●
●
●
●
●
●
●●
●
●●
4 ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●● ●
●
●●
●
●
●
●● ●●
● ●
●
●
●●
●
●
●
●
●●
●
●
●
● ●
●
●●
●● ●
●●
●
●
●
●
●
●
●●● ●
●
●●
●
●●
●
●●
●
●
●
●
−2 ●
●● 2 ●
●●
●
●●
●●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●●
●
●●
●
●● ●●●
●●
●●
●●
●
●●●
● ●●●
● ● ●●●●●●●
●
● ● ● ●
0
−3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3
Theoretical Quantiles Theoretical Quantiles
(a) Los datos presentan normalidad (b) Los datos no presentan normalidad
Figura 3.4: Normalidad y no normalidad de los datos
17
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p
La aproximación es buena si nb
p ≥ 5 y n(1 − b
p) ≥ 5
18
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p
Ejemplo 4.1
En una muestra aleatoria de 1000 viviendas en cierta ciudad se encuentra que 228 utilizan petróleo
como combustible para la calefacción. Calcule intervalos de confianza del 99 % para la proporción de
viviendas en esta ciudad que utilizan petróleo con el fin mencionado.
Solución:
Se pide calcular el IC para la proporción de viviendas que utilizan petróleo para la la calefacción, p. Así,
para obtener el IC para p, se calcula la proporción muestral bp
228
r
p= p (1 − b
b p)
b
1000 IC(p) : p∈b
p ± z α2
n
= 0.228 r
0.228(1 − 0.228)
1 − α = 0.99 p ∈ 0.228 ± 2.576 ×
1000
z α2 = 2.576
p ∈ 0.228 ± 0.0342
p ∈ (0.228 − 0.0342, 0.228 + 0.0342)
p ∈ (0.1938, 0.2622)
Ejemplo 4.2
Pascal Inc., una tienda de computación que compra al mayoreo chips sin probar para computadora, está
considerando cambiar a su proveedor por otro que se los ofrece probados y con garantía, a un precio más
alto. Con el fin de determinar si éste es un plan costeable, Pascal debe determinar la proporción de chips
defectuosos que le entrega el proveedor actual. Se probó una muestra de 200 chips y 5 % tenía defectos.
Ejemplo 4.3
Un fabricante de reproductores de MP3 utiliza un conjunto de pruebas exhaustivas para evaluar el
funcionamiento eléctrico de su producto. Todos los reproductores de MP3 deben pasar todas las pruebas
antes de ser puestos a la venta. De una muestra aleatoria de 500 reproductores, 15 no pasan una o más
de las pruebas. Calcule un intervalo de confianza del 90 % para la proporción de los reproductores de
MP3 de la población que pasan todas las pruebas.
19
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p
z 2α b
p (1 − b
p)
2
n= ,
B2
en que B es el grado de precisión.
Frecuentemente, se utiliza una muestra piloto (preliminar) de tamaño n ≥ 30 para obtener
un valor para b
p.
z 2α × 0.52
2
n=
B2
Ejemplo 4.4
Se llevará a cabo un estudio para estimar el porcentaje de ciudadanos de una ciudad que están a favor de
tener agua fluorada. ¿Qué tan grande debería ser la muestra si se desea tener al menos 95 % de confianza
en que el estimado esté dentro del 1 % del porcentaje verdadero?
Solución:
B = 0.01
1 − α = 0.95 z 2α × 0.52
2
z α2 = 1.96 n=
B2
1.962 × 0.52
n=
0.012
No se tiene ninguna informa- n = 9604
ción en relación a b
p , así se asu-
me que bp = 0.5
Ejemplo 4.5
Según Thomson Financial, hasta el 25 de enero de 2006, la mayor parte de las empresas que informaban
tener ganancias habían superado las estimaciones (BusinessWeek, 6 de febrero de 2006). En una muestra
de 162 empresas, 104 superaron las estimaciones, 29 coincidieron y 29 se quedaron cortas.
a) ¿Cuál es la estimación puntual de la proporción de empresas que superaron las estimaciones?
b) Determine el margen de error y dé un intervalo de confianza de 95 % para la proporción que
superó las estimaciones.
c) ¿De qué tamaño debe de ser la muestra para estudiar las empresas que superaron las estimaciones,
si el margen de error es 0.05?
Solución:
20
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p
a) El número de empresas que superaron las estimaciones es igual 104 de las n = 162 empresas, luego
104
p=
b
162
= 0.642 = 64.2 %
La estimación puntal es b
p = 64.2 %
p = 0.642
b r r
p (1 − b
p) 0.642(1 − 0.642)
1 − α = 0.95
b
margen de error ≡ z α2 = 1.96 = 0.0058
n 162
z α2 = 1.96
c) ¿De qué tamaño debe de ser la muestra para estudiar las empresas que superaron las estimaciones,
si el margen de error es 0.05 considerando un 95 % de confianza.
z 2α × b
p (1 − b
p)
B = 0.05 n= 2
1 − α = 0.95 B2
1.962
× 0.642(1 − 0.642)
z α2 = 1.96 n=
0.052
p = 0.642
b n = 353.1752 ≈ 354
21
Inferencia Estadística 5. Intervalo de confianza para la varianza poblacional, σ2
A fin de obtener los cuantiles considerando un nivel de confianza, 1 − α, de la distribución chi cuadrado
para construir el intervalo de confianza para, σ2 , usualmente se buscan en la tabla de cuantiles (ó valores
críticos) de esta distribución.
Generalmente en las tablas estadísticas para la distribución chi cuadrada, los cuantiles, χ2α,ν, satisfacen
P χ2 ≥ χ2α,ν = P χ2 > χ2α,ν = α
α χ2
χ2α,ν
Figura 5.1: Distribución chi cuadrada con el cuantil χ2α,ν
Como se puede observar de la gráfica anterior, la distribución chi cuadrado, χ2ν , no es simétrica alrededor
del eje Y. Por ello, se obtiene diferentes valores para los cuantiles dependiendo de los grados de libertad
ν y el nivel de confianza 1 − α.
22
Inferencia Estadística 5. Intervalo de confianza para la varianza poblacional, σ2
Así, considerando un nivel de confianza 1 − α, entonces los cuantiles para el intervalo de confianza de la
varianza poblacional deben de satisfacer
α
2 2
P χ > χ α ,ν =
2
2
α
P χ2 > χ21− α ,ν = 1 −
2 2
La figura abajo muestra los cuantiles en la distribucion chi cuadrado χ2α,ν. Estos cuantiles dependen de
los grados de libertad ν y el valor α.
α
2
1−α
α
2 χ2
χ21− α ,ν χ2α ,ν
2 2
Los cuantiles χ2α ,ν y χ21− α ,ν serán obtenidos usando la tabla de valores críticos (cuantiles) de la distribución
2 2
chi cuadrada.
El intervalo de confianza para la varianza poblacional de una población normal de media desconocida
con un nivel de confianza 1 − α es dada por
(n − 1)S2 (n − 1)S2
IC σ2 : σ2 ∈ 2 ; 2
χα χ α
,n−1
2 1− ,n−1
2
23
Inferencia Estadística 5. Intervalo de confianza para la varianza poblacional, σ2
Ejemplo 5.1
Los pesos de 10 envases de legumbres medidos en gramos son
995, 1010, 1005, 1002, 998, 998, 1000, 996, 996, 999
Bajo la suposicion que los pesos de los envases tienen una distribución normal construya un intervalo de
confianza para la varianza y la desviacion estandar con un nivel de confianza del 95 %
Solución:
n = 10 (n − 1)S2 (n − 1)S2
IC(σ2 ) : σ2 ∈ 2 ; 2
x = 1000
χα χ α
2 ,n−1 1− ,n−1
2
s2 = 20.8889 (10 − 1)20.8889 (10 − 1)20.8889
!
2
1 − α = 0.95 → α = 0.05 σ ∈ ;
19.023 2.7
α/2 = 0.05 σ2 ∈ (9.8828; 69.6297)
1 − α/2 = 0.975
ν = n − 1 = 10 − 1 = 9 (gl)
χ2α ,ν = 19.023
2
χ21− α ,ν = 2.7
2
Para obtener el intervalo de confianza para la desviación estandar es tomar la raíz cuadrada de los limites
del IC para la varianza calculada anteriormente, así
s s
(n − 1)S2 2
(n − 1)S
IC (σ) : σ ∈ ;
χ2α ,n−1 χ21− α ,n−1
2 2
√ √
σ ∈ 9.8828; 69.6297
σ ∈ (3.1437; 8.3444)
24
Inferencia Estadística REFERENCIAS
Referencias
A. Agresti, C. Franklin, and B. Klingenberg. Statistics The Art and Science of Learning from Data. Pear-
son, fourth edition, 2018.
G. Casella and R. L. Berger. Statistical inference. Duxbury, Thomson Learning, Pacific Grove, CA, USA.,
2002.
R. D. De Veaux, P. F. Velleman, and D. E. Bock. Stats Data and Models. Pearson/Addison Wesley, Boston,
MA, USA., third edition, 2012.
J. L. Devore. Probabilidad y Estadística para Ingeniería y Ciencias. Cengage Learning, México, septima
edition, 2008.
J. L. Devore and K. N. Berk. Modern mathematical statistics with applications. Springer, New York,
USA, second edition, 2012.
S. A. Lesik. Applied Statistical Inference with MINITAB. CRC Press, Boca Raton, FL, USA., second
edition, 2019.
R. E. Walpole, R. H. Myers, S. L. Myers, and K. Ye. Probabilidad y estadística para ingeniería y ciencias.
Pearson, México, novena edition, 2012.
25