Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

11 Paramentros de Confianza

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

Inferencia Estadística ÍNDICE

Intervalos de Confianza para un Parámetro


Poblacional
Jhon F. Bernedo Gonzales

Última revisión: 9 de enero de 2024

Índice

1. Estimación 2

2. Estimación por Intervalos 5


2.1. Interpretación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3. Intervalo de confianza para la media poblacional µ 8


3.1. Si la varianza σ2 es conocida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.2. Si la varianza σ2 desconocida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2.1. Población Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2.2. Población No normal: Muestra Grande . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3. Tamaño de muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4. Normalidad de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4. Intervalo de confianza para la proporción poblacional p 18


4.1. Tamaño de muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

5. Intervalo de confianza para la varianza poblacional, σ2 22

1
Inferencia Estadística 1. Estimación

1 Estimación
En general, inferencia estadística consiste en hacer conclusiones basado en la teoría de probabilidad
sobre cantidades desconocidas (parametros).
El objetivo de un investigador que usa estadística es aprender y obtener resultados sobre los parámetros
de una población después de observar los datos (muestra). Desde la perspectiva del investigador, los
datos contienen información relevante para verificar algunas hipótesis en relación a algunos parametros
de la población.
A fin de obtener resultados y conclusiones de uno o más parametros de la población se utiliza inferencia
estadística.

Definición 1.1 (Inferencia Estadística)


Una inferencia estadística, es un procedimiento que proporciona conclusiones probabilísticas en
relación a uno o más parámetros de una población objetivo.

El término conclusiones probabilísticas significa que para realizar conclusiones en relación a uno o
mas parámetros de la población se utiliza la teoría de probabilidad.
A fin de obtener conclusiones probabilísticas es necesário utilizar un estimador para un parámetro θ

Definición 1.2 (Estimador)


Sea X1 , X2 , . . . , X n una m.a, un estimador del parámetro θ es una función basada en la m.a

θ(X1 , X2 , . . . , X n )
b

Si la muestra aleatoria es observada,

X1 = x1 , X2 = x2 , . . . , X n = xn ,

entonces
θ(x1 , x2 , . . . , xn )
b
es denominado estimación (estimativa) de θ.

Los estimadores se usan en dos formas diferentes:

1. Estimación puntual Basado en los datos, se calcula el valor observado del estimador b
θ del
parámetro θ, así se asocia
θ=b θ.
El valor observado b
θ se le denomina estimación puntual de θ.
Problema: Un estimador puntual no proporciona la precisión de la estimación.

2. Estimación por intervalo Tiene por finalidad estimar un conjunto de posibles valores de θ consis-
tentes con los datos.

2
Inferencia Estadística 1. Estimación

Ejemplo 1.1
Para los siguientes parámetros se presenta los estimadores respectivos

parámetro estimador estimación


media µ X x
2
varianza σ2 S
b sˆ2
desviación estándar σ S s
proporción p P
b p̂
diferencia de medias µ1 − µ2 X1 − X2 x1 − x2
diferencia de proporciones p1 − p2 P2 − b
b P2 p1 − b
b p2
coefiente de variación σ/µ S/ X s/x

Ejemplo 1.2
Muchos de los medicamentos empleados en el tratamiento del cáncer son costosos. BusinessWeek
informó de los costos de los tratamientos con Herceptin, un medicamento para tratar el cáncer de mama
(BusinessWeek, 30 de enero de 2006). Los siguientes son los costos de tratamientos con Herceptin en
una muestra aleatoria de 10 pacientes.

4376 5578 2717 4920 4495


4798 6446 4119 4237 3814

a) Calcule una estimación puntual del costo medio y la desviaciõn estándar de un tratamiento con
Herceptin

b) Calcule una estimación puntual del coeficiente de variación en los costos de los tratamientos con
Herceptin.

Ejemplo 1.3
Una muestra de 20 estudiantes que recientemente tomaron un curso de estadística elemental arrojó la
siguiente información sobre la marca de calculadora que poseían. (T=Texas Instruments, H=Hewlett
Packard, C=Casio, S=Sharp):

T T H T C T T S C H
S S T H C T T T H T

Estime la proporción verdadera de los estudiantes que poseen una calculadora Texas Instruments,
Hewlett Packard y Casio.

3
Inferencia Estadística 1. Estimación

θ(X1 , X2 , . . . , X n ) es una variable aleatoria y su distribución de probabilidad es denominada


El estimador b
distribución muestral.
La varianza de la distribución muestral del estimador es dado por
   h i2
h i 2
Var bθ =E b θ − Eb θ .

La raíz cuadrada de la varianza del estimador es conocida como error estándar del estimador
  q h i
SE bθ = Var b θ

Definición 1.3 (Error de Estimación)


El error de estimación es definido como la diferencia entre el parámetro y la estimación del
parámetro
error de estimación = θ − b
θ

1. Son pocos los casos en que el error de estimación puede ser calculado exactamente.

2. Si el error de estimación es aproximadamente cero, entonces la estimación del parámetro es


buena, caso contrario existe mucho error

4
Inferencia Estadística 2. Estimación por Intervalos

2 Estimación por Intervalos


Las estimación puntual de un parámetro no siempre es igual al valor verdadero del parámetro. Por
tanto, se prefiere determinar un intervalo dentro del cual se espera encontrar el valor del parámetro. Así,
se suele calcular una estimación por intervalos al sumar y restar al estimador puntual una cantidad
llamada margen de error

Estimación puntual ± Margen de error


Estimación puntual ± Cuantil × error estándar

La finalidad de la estimación por intervalos es proporcionar información de que tan próximo esta el
estimador puntual del valor del parámetro poblacional.
Por ejemplo, la estimación del intervalo de confianza para µ es

x ± Margen de error

Pregunta: Como obtener el margen de error?

Definición 2.1 (Estimación por Intervalos)


Dada una m.a X1 , X2 , . . . , X n tomada de una distribución (población) con parametro θ. Sean

L = L(X1 , X2 , . . . , X n ) y U = U(X1 , X2 , . . . , X n )

dos estadísticas que tienen la propiedad que para todo valor de θ

P(L < θ < U) = 1 − α,

en que (1 − α) es denominada de coeficiente de confianza.


Entonces el intervalo aleatorio (L, U) es denominado intervalo de confianza de (1 − α)100 % para
θ.

El coeficiente de confianza 100(1 − α) % es también denominado nivel de confianza.


Con los valores observados de la muestra aleatoria x1 , x2 , . . . , xn se obtiene los valores numéricos de

L(x1 , x2 , . . . , xn ) = c1 y U(x1 , x2 , . . . , xn ) = c2

y así el intervalo (c1 , c2 ) es denominado valor observado del intervalo de confianza.


Observación:

Las estadísticas L y U son construidas a partir de la distribución muestral del estimador del
parámetro θ

Los valores c1 y c2 son usados para obtener el margen de error de la estimación puntual de los
parámetros.

5
Inferencia Estadística 2. Estimación por Intervalos

2.1 Interpretación
i) Antes de:

realizar el experimento y de colectar los datos


realizar la encuesta
de hacer un estudio de mercado

osea, antes de observar los datos se puede afirmar que el intervalo aleatorio (L, U)

P(L < θ < U) = 1 − α

contiene (incluye) al verdadero valor del parámetro con probabilidad 100(1 − α) % (nivel de
confianza).

ii) Despues de observar los datos, y se calculan los valores para

L = c1 y U = c2

entonces es incorrecto interpretar que

P(c1 < θ < c2 ) = 1 − α

es la probabilidad que el parámetro θ esté en el intervalo (c1 , c2 ) con probabilidad 1 − α.


La interpretación correcta esta basada en la idea de probabilidad a largo plazo (frecuencia relativa)
esto es considerando repeticiones sucesivas.

Ejemplo 2.1
Sea una m.a X1 , X2 , . . . , X n que proviene de una distribución normal con media µ y varianza σ2 . Un IC
para µ con un nivel de confianza 1 − α = 0.95
!
σ σ
X − 1.96 √ , X + 1.96 √
n n

Interpretación:
 
i) El intervalo X − 1.96 √σn , X + 1.96 √σn contiene el verdadero valor de µ con probabilidad 0.95. Esto
por que los extremos del intervalo son aleatorios.

ii) Dado n = 31 y x = 80, entonces se obtiene el intervalo de 95 % de confianza observado (fijo) del
para µ dado por (79.3, 80.7). Para la interpretación se debe de considerar lo siguiente

a) Interpretación incorrecta: La probabilidad que µ esté en el intervalo (79.3, 80.7) es 0.95.


b) Interpretación correcta: Dado que se repite el experimento, por ejemplo, 100 veces. Entonces,
se espera que el 95 % de esos intervalos contengan el verdadero valor de µ.

6
Inferencia Estadística 2. Estimación por Intervalos

La figura 2.1 muestra dos simulaciones del intervalo de confianza para este ejemplo. Se realizo 100
simulaciones (repeticiones) en que para cada simulación se consideró una muestra de tamaño n=30 y la
muestras son tomadas de una población normal con media µ=3 y varianza σ2 =1. En la Figura 2.1(a) se
observa que en las 100 repeticiones 95 (95 %) intervalos de confianza contienen al verdadero valor de la
media poblacional y 5 de ellos no lo contienen. En la Figura 2.1(b) se muestra que de las 100 repeticiones
93(93 %) intervalos contienen la media µ=3 y el restante no lo contienen.
De esta manera se puede observar que la noción de intervalo de confianza esta en base a la frecuencia o
repetición del experimento.

Intervalos de confianza

4.0

3.5

3.0
µ

2.5

2.0

0 20 40 60 80 100
Muestras

(a)

Intervalos de confianza

4.0

3.5

3.0
µ

2.5

2.0

0 20 40 60 80 100
Muestras

(b)
Figura 2.1: Simulación de intervalos de confianza

7
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

3 Intervalo de confianza para la media poblacional µ


3.1 Si la varianza σ2 es conocida
Dado que el estimador puntual de µ es la media muestral X, el intervalo de confianza (IC) para la media
poblacional µ cuando la varianza, σ2 , es conocida es dado por

σ
IC(µ) : µ ∈ x ± z α2 × √
n
!
σ σ
µ ∈ x − z α2 √ ; x + z α2 √
n n

en que z α2 representa el valor del cuantil de la distribución normal. Además el error estándar del
estimador x es
σ
SE(x) = √
n
El IC para µ dada anteriormente se aplica bajo las siguientes condiciones

a) Población normal y cualquier tamaño de muestra.

b) Población no normal y muestra grande (n ≥ 30)

El margen de error en la estimación por intervalo para µ es dado por

margen de error ≡ z α2 × SE(x)

El ancho del intervalo de confianza es dado por

ancho del intervalo ≡ 2 × margen de error


≡ 2 × z α2 × SE(x)

El ancho del intervalo da información sobre la precisión de una estimación de intervalo.

Si el ancho del intervalo es angosto, se tiene mayor precisión sobre el valor del parámetro

Si el ancho del intervalo es amplio, se tiene mayor incertidumbre (menos precisión) sobre el valor
del parámetro.

Los cuantiles z α2 satisfacen:


α α
P(Z < −z α2 ) = y P(Z > z α2 ) =
2 2

8
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

Figura 3.1: Cuantiles −z α2 y z α2

Ejemplo 3.1
Un científico interesado en vigilar contaminantes químicos en alimentos y, por lo tanto, la acumulación
de contaminantes en la dieta humana, seleccionó una muestra aleatoria de n = 20 adultos hombres. Se
encontró que el promedio de ingesta diaria de productos lácteos fue de x = 756 gramos por día. Se tiene
información que la desviación estándar poblacional es σ = 35 gramos por día.
Use esta información muestral para construir un intervalo de confianza de 90 % para la ingesta diaria
media de productos lácteos para hombres. Suponga que la población es normal.

Solución:
La muestra es pequeña, n = 20, la población es normal y además la varianza es conocida entonces si se
puede aplicar el IC para la media con varianza conocida.

σ
σ = 35 IC(µ) : µ ∈ x ± z α2 × √
n
n = 20
35
x = 756 µ ∈ 756 ± 1.645 × √
20
1 − α = 0.90
µ ∈ 756 ± 12.8742
z α2 = 1.645
µ ∈ (756 − 12.8742 ; 756 + 12.8742)
µ ∈ (743.1258 ; 768.8742)

9
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

Ejemplo 3.2
Muchos pacientes con problemas del corazón tienen un marcapasos para controlar su ritmo cardíaco. El
marcapasos tiene montado un módulo conector de plástico en la parte superior. Suponga una desviación
estándar de 0.0015 pulgadas, y con base en esto calcule un intervalo de confianza del 95 % para la media
de la profundidad de todos los módulos conectores fabricados por cierta empresa. Una muestra aleatoria
de 75 módulos tiene una profundidad promedio de 0.310 pulgadas.

Solución:
La muestra es grande, n = 75, la población es no normal y además la varianza es conocida entonces si
se puede aplicar el IC para la media con varianza con conocida.

σ
σ = 0.0015 IC(µ) : µ ∈ x ± z α2 × √
n
n = 75
0.0015
x = 0.310 µ ∈ 0.310 ± 1.96 × √
75
1 − α = 0.95
µ ∈ 0.310 ± 0.0003395
z α2 = 1.96
µ ∈ (0.310 − 0.0003395 ; 0.310 + 0.0003395)
µ ∈ (0.3096605 ; 0.3103395)

10
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

3.2 Si la varianza σ2 desconocida


En este escenario se tiene 2 casos cuando la muestra es extraída de una población normal o la muestra es
grande. En ambos casos, el error estándar SE(x) no puede ser obtenido porque la varianza es desconocida.
En este sentido, se utiliza el error estándar estimado (SEE) dado por
s
SEE(x) = √
n

3.2.1. Población Normal


En este caso, la muestra aleatoria debe seguir una (aproximadamente) distribución normal.
Así, se considera la variable aleatoria,

X−µ
T= √ ∼ tν , (3.1)
S/ n

en que ν = n − 1 son los grados de libertad de la distribución t-student.


El IC para µ cuando σ2 es desconocida para muestras pequeñas para una población normal es dado por

s
IC(µ) : µ ∈ x ± tν, α2 √
n
!
s s
µ ∈ x − tν, α2 √ ; x + tν, α2 √
n n

Nótese que tν, α2 representa el cuantil de la distribución t-student con ν = n − 1 grados de libertad.
El cuantil tν, α2 satisface:
α α
P(T < −tν, α2 ) = y P(T > tν, α2 ) =
2 2

Figura 3.2: Cuantiles −tν, α2 y tν, α2

11
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

Cuando la muestra es grande, la distribución t-student se aproxima a la distribución normal. La figura


abajo muestra el comportamiento de la distribución t cuando los grados de libertad aumenta. Se puede
observar que cuando ν ≥30 la distribución es próxima de la distribución normal estandar

Comparacion de la distribucion t y normal

distribucion t
0.4
n =1
n =4
n = 10
n = 30
normal

0.3
Densidad

0.2

0.1

0.0

-4 -2 0 2 4

Figura 3.3: Distribución t-student y normal

Ejemplo 3.3
Se registran las siguientes mediciones del tiempo de secado, en horas, de cierta marca de pintura vinílica:

2.8 3.3 5.6 3.7 2.8


4.4 4 5.2 3 4.8
3.4 2.5 4.8 2.9 3.6

Suponga que las mediciones representan una muestra aleatoria de una población normal y con base en
esto calcule el intervalo de confianza del 95 % para el tiempo medio de secado de la pintura.

Solución:
La muestra es pequeña, n = 15, la población es normal y además la varianza es desconocida entonces se
aplica el IC para la media con varianza desconocida para muestras pequeñas

12
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

s
s = 0.9709 IC(µ) : µ ∈ x ± tν, α2 √
n
n = 15
0.9709
x = 3.7867 µ ∈ 3.7867 ± 2.145 × √
15
1 − α = 0.95
µ ∈ 3.7867 ± 0.5377
ν = n − 1 = 15 − 1 = 14 (gl)
µ ∈ (3.7867 − 0.5377 ; 3.7867 + 0.5377)
t α2 = 2.145
µ ∈ (3.249 ; 4.3244)
Ejemplo 3.4
En un estudio de National Retail Foundation se encontró que las familias estaban dispuestas a gastar en
promedio $649 durante las vacaciones decembrinas (The Wall Street Journal, 2 de diciembre de 2002).
Suponga que en el estudio participaron 600 familias y que la desviación estándar muestral fue $175.

a) ¿Con 90 % de confianza cuál es el margen de error?

b) ¿Cuál es el intervalo de confianza de 90 % para estimar la media poblacional?

13
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

3.2.2. Población No normal: Muestra Grande


Cuando la población es no normal y la muestra es grande, n ≥ 30. El IC para µ es dado por

s
IC(µ) : µ ∈ x ± z α2 √ ,
n
!
s s
µ ∈ x − z α2 √ ; x + z α2 √
n n

Ejemplo 3.5
Un proveedor vende fibras sintéticas a una compañía de manufactura. Se selecciona una muestra
aleatoria simple de 81 fibras de un envío. El promedio de la fuerza de ruptura de éstas es de 29 lb y la
desviación estándar de 9 lb.

a) Determine un intervalo de confianza de 95 % y 99 % para la media de la fuerza de ruptura de todas


las fibras del envío.

b) ¿Cuál es el nivel de confianza del intervalo (27.5, 30.5)?

Solución:
La muestra es grande, n = 81 y además la varianza es desconocida entonces si se puede aplicar el IC
para la media con varianza desconocida.

n = 81 x = 29 s=9

Para obtener el IC se utiliza


s
IC(µ) : µ ∈ x ± z α2 × √
n

a) Se tiene dos casos

Para 1 − α = 0.95 ⇒ z α2 =1.96

9
µ ∈ 29 ± 1.96 × √
81
µ ∈ 29 ± 1.96
µ ∈ (29 − 1.96 ; 29 + 1.96)
µ ∈ (27.04 ; 30.96)

14
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

Para 1 − α = 0.99 ⇒ z α2 =2.576

9
µ ∈ 29 ± 2.576 × √
81
µ ∈ 29 ± 2.576
µ ∈ (29 − 2.576 ; 29 + 2.576)
µ ∈ (26.424 ; 31.576)

b) ¿Cuál es el nivel de confianza del intervalo (27.5, 30.5)?


9
29 − z α2 × √ = 27.5
81
z α2 = 1.5

Luego se sabe que


  α
P Z ≤ −z α2 =
2
α
P (Z ≤ −1.5) = buscando en la tabla Z
2
α
P (Z ≤ −1.5) = = 0.0668
2

Finalmente α = 0.1336 ⇒ 1 − α = 0.8664


Notas:
i) Es necesario verificar la normalidad de los datos usando métodos gráficos o una prueba de
hipótesis de normalidad tal como el test de Barlett, Ryan-Joiner entre otros.

ii) En el caso que la muestra es extraída de una población normal y es grande se tiene que los
grados de libertad de la distribución t también es grande por ejemplo ν >100. En este sentido,
la distribución t se aproxima a la distribución normal estándar, Z. Sin embargo, para este
curso se considerara que la aproximación es adecuada si n > 30.

15
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

3.3 Tamaño de muestra


El tamaño de muestra para la estimación de un IC para la media µ es
 z α σ 2
2
n= ,
B
en que B es el máximo error de estimación (margen de error).
Nótese que, σ es conocido, sin embargo en la práctica σ no es conocida, ante ello se pueden considerar lo
siguiente

i) Usar como valor para σ una estimación de la desviación estándar poblacional calculada a partir de
datos de estudios anteriores.

ii) Por medio de un estudio piloto se selecciona una muestra preliminar. La desviación estándar
muestral obtenida puede usarse como valor para σ.

iii) Se puede utilizar la aproximación (un tanto grosero) para σ

valor máximo - valor mínimo


σ
4

Ejemplo 3.6
Un experto en eficiencia desea determinar el tiempo promedio que toma perforar tres hoyos en cierta
placa metálica. ¿De qué tamaño debe ser una muestra para tener un 95 % de confianza en que esta media
muestral estará dentro de 15 segundos de la media verdadera? Suponga que por estudios previos se sabe
que σ= 40 segundos.

Solución:
Se pide el tamaño de muestra n, en que el nivel de confianza es 1 − α=0.95. El error de estimación o
margen de error es igual a B = 15. Se nos indica que σ=40, luego
 z α σ 2 2
1.96 · 40

2
n= = = 27.3180 ≈ 28
B 15
El tamaño de muestra debe ser n = 28.

16
Inferencia Estadística 3. Intervalo de confianza para la media poblacional µ

3.4 Normalidad de los datos


Es importante verificar la normalidad de los datos para así proceder a construir el intervalo de confianza
para µ.
Si no se cumple la normalidad de los datos entonces no se podrá aplicar la fórmula para obtener el IC.
Generalmente en muestras pequeñas casi siempre se tiene problemas para verificar la normalidad.
Nótese, que es difícil determinar si una muestra es “realmente” normal, por tal razón se pide que por lo
menos se aproxime a la distribución normal.
Para verificar la normalidad, en general se utiliza

la gráfica de probabilidad normal denominada también gráfico q-q (del ingles q-q plot) o

realizar una prueba de hipótesis (no parametrico) tales como: Kolmogorov-Smirnov, Shapiro-Wilk
y Anderson-Darling

Normal Q−Q Plot Normal Q−Q Plot

● ● ●


2 ●●

12 ●
●● ●●
●●●
●●●● ●●
●●●

●●
● ●


●●

●●

10 ●●

1 ●












●●
●●
●●



●●

●●
● ●●●
Sample Quantiles

Sample Quantiles


●●
● ●
●●

●●
● ●























8 ●


●●


●●
● ●



●●

0 ●●















































6 ●
●●











● ●

●● ●
●●



●● ●●

●●


●●

●●

●● ●
●●

● ●
●●


●●

●●

●● ●

●●
−1 ●●









●●

●●
4 ●
















●●

●●
●● ●

●●



●● ●●
● ●


●●




●●



● ●

●●
●● ●
●●






●●● ●

●●

●●

●●



−2 ●
●● 2 ●
●●

●●
●●

●●









●●

●●

●●

●●

●● ●●●
●●
●●
●●

●●●
● ●●●
● ● ●●●●●●●

● ● ● ●
0
−3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3
Theoretical Quantiles Theoretical Quantiles

(a) Los datos presentan normalidad (b) Los datos no presentan normalidad
Figura 3.4: Normalidad y no normalidad de los datos

17
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p

4 Intervalo de confianza para la proporción poblacional p


Sea X1 . . . , X n una m.a de tamaño n, en que cada X i sigue una distribución de Bernoulli, esto es,

1, éxito


Xi = 
0, fracaso

Con probabilidad de éxito P (X i = 1) = p y probabilidad de fracaso P (X i = 0) = 1 − p.


Un estimador puntual para p es dado por

X1 + . . . + X n X número total de éxitos en la muestra


p=
b = =
n n n
Un IC para la proporción poblacional, p, se construye considerando que el tamaño de la muestra n es
grande y asi usando teorema del limite central se tiene que la distribución de la proporción muestral es
una distribución normal !
p(1 − p)
p ∼ N p,
b ,
n
en que la aproximación es adecuada si np ≥ 5 y n(1 − p) ≥ 5.
Nótese que el error estándar de la proporción muestral es dado por
r
p(1 − p)
SE(bp) = ,
n
sin embargo el parámetro p es desconocido. Así, por esta razón se usa un valor valor estimado de SE(b
p)
dado por r
p (1 − b
b p)
SEE(b
p) =
n
Luego el intervalo de confianza para la proporción poblacional p es dador por
r
p (1 − b
b p)
IC(p) : p∈b
p ± z α2
n
p ∈ p ± z 2 × SEE(b
b α p)

La aproximación es buena si nb
p ≥ 5 y n(1 − b
p) ≥ 5

18
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p

Ejemplo 4.1
En una muestra aleatoria de 1000 viviendas en cierta ciudad se encuentra que 228 utilizan petróleo
como combustible para la calefacción. Calcule intervalos de confianza del 99 % para la proporción de
viviendas en esta ciudad que utilizan petróleo con el fin mencionado.

Solución:
Se pide calcular el IC para la proporción de viviendas que utilizan petróleo para la la calefacción, p. Así,
para obtener el IC para p, se calcula la proporción muestral bp

228
r
p= p (1 − b
b p)
b
1000 IC(p) : p∈b
p ± z α2
n
= 0.228 r
0.228(1 − 0.228)
1 − α = 0.99 p ∈ 0.228 ± 2.576 ×
1000
z α2 = 2.576
p ∈ 0.228 ± 0.0342
p ∈ (0.228 − 0.0342, 0.228 + 0.0342)
p ∈ (0.1938, 0.2622)
Ejemplo 4.2
Pascal Inc., una tienda de computación que compra al mayoreo chips sin probar para computadora, está
considerando cambiar a su proveedor por otro que se los ofrece probados y con garantía, a un precio más
alto. Con el fin de determinar si éste es un plan costeable, Pascal debe determinar la proporción de chips
defectuosos que le entrega el proveedor actual. Se probó una muestra de 200 chips y 5 % tenía defectos.

a) De un valor estimado del error estándar de la proporción de chips defectuosos.

b) Construya un intervalo de confianza del 98 % para la proporción de chips defectuosos adquiridos.

Ejemplo 4.3
Un fabricante de reproductores de MP3 utiliza un conjunto de pruebas exhaustivas para evaluar el
funcionamiento eléctrico de su producto. Todos los reproductores de MP3 deben pasar todas las pruebas
antes de ser puestos a la venta. De una muestra aleatoria de 500 reproductores, 15 no pasan una o más
de las pruebas. Calcule un intervalo de confianza del 90 % para la proporción de los reproductores de
MP3 de la población que pasan todas las pruebas.

19
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p

4.1 Tamaño de muestra

i) Si se tiene alguna información en relación a b


p entonces

z 2α b
p (1 − b
p)
2
n= ,
B2
en que B es el grado de precisión.
Frecuentemente, se utiliza una muestra piloto (preliminar) de tamaño n ≥ 30 para obtener
un valor para b
p.

ii) Si no se tienen ninguna información a b


p entonces de considera b
p = 0.5 y de esta forma

z 2α × 0.52
2
n=
B2

Ejemplo 4.4
Se llevará a cabo un estudio para estimar el porcentaje de ciudadanos de una ciudad que están a favor de
tener agua fluorada. ¿Qué tan grande debería ser la muestra si se desea tener al menos 95 % de confianza
en que el estimado esté dentro del 1 % del porcentaje verdadero?
Solución:

B = 0.01
1 − α = 0.95 z 2α × 0.52
2
z α2 = 1.96 n=
B2
1.962 × 0.52
n=
0.012
No se tiene ninguna informa- n = 9604
ción en relación a b
p , así se asu-
me que bp = 0.5
Ejemplo 4.5
Según Thomson Financial, hasta el 25 de enero de 2006, la mayor parte de las empresas que informaban
tener ganancias habían superado las estimaciones (BusinessWeek, 6 de febrero de 2006). En una muestra
de 162 empresas, 104 superaron las estimaciones, 29 coincidieron y 29 se quedaron cortas.
a) ¿Cuál es la estimación puntual de la proporción de empresas que superaron las estimaciones?
b) Determine el margen de error y dé un intervalo de confianza de 95 % para la proporción que
superó las estimaciones.
c) ¿De qué tamaño debe de ser la muestra para estudiar las empresas que superaron las estimaciones,
si el margen de error es 0.05?
Solución:

20
Inferencia Estadística 4. Intervalo de confianza para la proporción poblacional p

a) El número de empresas que superaron las estimaciones es igual 104 de las n = 162 empresas, luego

104
p=
b
162
= 0.642 = 64.2 %

La estimación puntal es b
p = 64.2 %

b) Determine el margen de error y dé un intervalo de confianza de 95 % para la proporción que


superó las estimaciones.

p = 0.642
b r r
p (1 − b
p) 0.642(1 − 0.642)
1 − α = 0.95
b
margen de error ≡ z α2 = 1.96 = 0.0058
n 162
z α2 = 1.96

c) ¿De qué tamaño debe de ser la muestra para estudiar las empresas que superaron las estimaciones,
si el margen de error es 0.05 considerando un 95 % de confianza.

z 2α × b
p (1 − b
p)
B = 0.05 n= 2

1 − α = 0.95 B2
1.962
× 0.642(1 − 0.642)
z α2 = 1.96 n=
0.052
p = 0.642
b n = 353.1752 ≈ 354

21
Inferencia Estadística 5. Intervalo de confianza para la varianza poblacional, σ2

5 Intervalo de confianza para la varianza poblacional, σ2


Para construir un intervalo de confianza para la varianza poblacional se asume que la muestra es tomada
de una población normal.
Distribución de la varianza muestral
Si X1 , X2 , . . . , X n una muestra aleatoria de una población normal con media µ y σ2 , entonces la
variable aleatoria
n 
P 2
Xi − X
i=1 (n − 1)S2
= ∼ χ2(n−1) (5.1)
σ2 σ 2

tiene una distribución chi cuadrado con ν = n − 1 grados de libertad

A fin de obtener los cuantiles considerando un nivel de confianza, 1 − α, de la distribución chi cuadrado
para construir el intervalo de confianza para, σ2 , usualmente se buscan en la tabla de cuantiles (ó valores
críticos) de esta distribución.
Generalmente en las tablas estadísticas para la distribución chi cuadrada, los cuantiles, χ2α,ν, satisfacen
   
P χ2 ≥ χ2α,ν = P χ2 > χ2α,ν = α

La figura abajo muestra la probabilidad anterior de forma gráfica

α χ2
χ2α,ν
Figura 5.1: Distribución chi cuadrada con el cuantil χ2α,ν

Como se puede observar de la gráfica anterior, la distribución chi cuadrado, χ2ν , no es simétrica alrededor
del eje Y. Por ello, se obtiene diferentes valores para los cuantiles dependiendo de los grados de libertad
ν y el nivel de confianza 1 − α.

22
Inferencia Estadística 5. Intervalo de confianza para la varianza poblacional, σ2

Así, considerando un nivel de confianza 1 − α, entonces los cuantiles para el intervalo de confianza de la
varianza poblacional deben de satisfacer
α
 
2 2
P χ > χ α ,ν =
 2
2
α

P χ2 > χ21− α ,ν = 1 −
2 2

La figura abajo muestra los cuantiles en la distribucion chi cuadrado χ2α,ν. Estos cuantiles dependen de
los grados de libertad ν y el valor α.

α
2
1−α

α
2 χ2
χ21− α ,ν χ2α ,ν
2 2

Figura 5.2: Distribución chi cuadrada con el cuantil χ2α,ν

Los cuantiles χ2α ,ν y χ21− α ,ν serán obtenidos usando la tabla de valores críticos (cuantiles) de la distribución
2 2
chi cuadrada.
El intervalo de confianza para la varianza poblacional de una población normal de media desconocida
con un nivel de confianza 1 − α es dada por
 
   (n − 1)S2 (n − 1)S2 
IC σ2 : σ2 ∈  2 ; 2
 

 χα χ α

,n−1
2 1− ,n−1
2

De forma analoga se puede construir un intervalo de confianza para la desviación estandar


s s 
 (n − 1)S2 2
(n − 1)S 
IC (σ) : σ ∈  ;

χ2α ,n−1 χ21− α ,n−1 


2 2

23
Inferencia Estadística 5. Intervalo de confianza para la varianza poblacional, σ2

Ejemplo 5.1
Los pesos de 10 envases de legumbres medidos en gramos son

995, 1010, 1005, 1002, 998, 998, 1000, 996, 996, 999

Bajo la suposicion que los pesos de los envases tienen una distribución normal construya un intervalo de
confianza para la varianza y la desviacion estandar con un nivel de confianza del 95 %

Solución:

 
n = 10  (n − 1)S2 (n − 1)S2 
IC(σ2 ) : σ2 ∈  2 ; 2
 
x = 1000

 χα χ α

2 ,n−1 1− ,n−1
2
s2 = 20.8889 (10 − 1)20.8889 (10 − 1)20.8889
!
2
1 − α = 0.95 → α = 0.05 σ ∈ ;
19.023 2.7
α/2 = 0.05 σ2 ∈ (9.8828; 69.6297)
1 − α/2 = 0.975
ν = n − 1 = 10 − 1 = 9 (gl)
χ2α ,ν = 19.023
2

χ21− α ,ν = 2.7
2

Para obtener el intervalo de confianza para la desviación estandar es tomar la raíz cuadrada de los limites
del IC para la varianza calculada anteriormente, así
s s 
 (n − 1)S2 2
(n − 1)S 
IC (σ) : σ ∈  ;

χ2α ,n−1 χ21− α ,n−1 


2 2
√ √ 
σ ∈ 9.8828; 69.6297
σ ∈ (3.1437; 8.3444)

24
Inferencia Estadística REFERENCIAS

Referencias
A. Agresti, C. Franklin, and B. Klingenberg. Statistics The Art and Science of Learning from Data. Pear-
son, fourth edition, 2018.

D. R. Anderson, D. J. Sweeney, and T. A. Williams. Estadistica para administracion y economia. Cengage


Learning, México, decima primera edition, 2012.

D. C. Boes, F. A. Graybill, and A. M. Mood. Introduction to the Theory of Statistics. McGraw-Hill


International, USA, 1982.

G. Casella and R. L. Berger. Statistical inference. Duxbury, Thomson Learning, Pacific Grove, CA, USA.,
2002.

D. R. Cox. Principles of Statistical Inference. Cambridge, New York, USA., 2006.

R. D. De Veaux, P. F. Velleman, and D. E. Bock. Stats Data and Models. Pearson/Addison Wesley, Boston,
MA, USA., third edition, 2012.

J. L. Devore. Probabilidad y Estadística para Ingeniería y Ciencias. Cengage Learning, México, septima
edition, 2008.

J. L. Devore and K. N. Berk. Modern mathematical statistics with applications. Springer, New York,
USA, second edition, 2012.

S. A. Lesik. Applied Statistical Inference with MINITAB. CRC Press, Boca Raton, FL, USA., second
edition, 2019.

W. Mendenhall, R. J. Beaver, and B. M. Beaver. Introducción a la probabilidady estadística. Cengage


Learning, México, décima tercera edition, 2010.

W. Navidi. Estadística para ingenieros. McGRAW-HILL, México, primera edition, 2006.

R. E. Walpole, R. H. Myers, S. L. Myers, and K. Ye. Probabilidad y estadística para ingeniería y ciencias.
Pearson, México, novena edition, 2012.

A. L. Webster. Estadistica Aplicada a Los Negocios y La Economia. McGRAW-HILL, Colombia, tercera


edition, 2001.

25

También podría gustarte