Trabajo de Investigación
Trabajo de Investigación
Trabajo de Investigación
INTEGRANTES
CHULDE LENIN
MANTILLA GRACE
INTERVALOS DE CONFIANZA
Intervalos de confianza para las medias en una población normal con varianza
conocida
Sigue una distribución normal de media 0 y desviación típica 1. Buscamos los cuantiles
de esta distribución tales que
̅̅̅1 ≤ 𝑋̅ ≤ 𝑋
𝑃(𝑋 ̅̅̅̅
2 ) = 0.95
̅̅̅1 − 𝜇
𝑋 ̅̅̅2 − 𝜇
𝑋 ̅̅̅1 − 4.5
𝑋 ̅̅̅2 − 4.5
𝑋
𝑃( 𝜎 ≤𝑍≤ 𝜎 )=( ≤𝑍≤ )
1 1
√𝑛 √𝑛 √100 √100
̅̅̅1 − 4.5
𝑋
̅̅̅1 = 4.304
= −1.96 => 𝑋
1
10
̅̅̅2 − 4.5
𝑋
̅̅̅2 = 4.696
= 1.96 => 𝑋
1
10
𝑃(4.304 ≤ 𝑋̅ ≤ 4.696) = 0.95
Por lo tanto, el 95% de los promedios muestrales estarán entre 4.304 y 4.696:
𝜎 𝜎
𝑃 (𝜇 − 1.96 ≤ 𝑋̅ ≤ 𝜇 + 1.96 ) = 0.95
√𝑛 √𝑛
Intervalos de confianza para las medias en una población normal con varianza
desconocida
En este caso, donde se tiene una varianza desconocida se procede a reemplazar σ por S
(desvío muestral), por esa razón se recurre a una nueva distribución llamada: T de Student
con 𝒏 − 𝟏 grados de libertad.
Se ha obtenido una muestra de 15 vendedores de una Editorial para estimar el valor medio
de las ventas por trabajador en la Empresa. La media y varianza de la muestra (en miles
de euros) son 5 y 2, respectivamente.
𝑠
̅
X ± 𝑡𝛼
2 √𝑛
𝑉(𝑋) = 2
𝑛 15
𝑠2 = 𝑉(𝑋) = (2) = 2,143
𝑛−1 14
𝑠 = √𝑠 2 = 1,464
1,464
5 ± 1,761 ≡ 5 ± 0,666
√15
(4,334,5,666)
(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
( 2
, 2 )
𝑋𝑠𝑢𝑝 𝑋𝑖𝑛𝑓
(15 − 1)2; 143 (𝑛 − 1)2; 143
( , )
23,685 6,571
(1,27,4, 58)
Sean 𝑋11 , 𝑋12 , … , 𝑋1𝑛1, una muestra aleatoria de 𝑛1 observaciones tomadas de una
primera población con valor esperado 𝜇1 , y varianza 𝜎12 ; y 𝑋21 , 𝑋22 , … , 𝑋2𝑛2. Y una
segunda muestra aleatoria de 𝑛2 observaciones tomada de otra población con valor
esperado 𝜇2 , y varianza 𝜎22 .
̅̅̅1 y 𝑋
Si 𝑋 ̅̅̅2 son las medias muestrales, la estadística 𝑋
̅̅̅1 - 𝑋
̅̅̅2 es un estimador puntual de
𝜇1 − 𝜇2 , y tiene una distribución normal si ambas poblaciones son normales, si cumple
con las condiciones del teorema del límite central (tamaños de muestras relativamente
grandes).
̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
Z=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2
b) La variable aleatoria asociada con el estimador será la variable normal estándar dada
por:
̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
Z=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2
Teorema. Si 𝑋 ̅̅̅1 − 𝑋
̅̅̅2 son las medias de dos muestras aleatorias independientes de tamaño 𝑛1
y 𝑛2 tomadas de poblaciones que tienen varianzas conocidas 𝜎12 y 𝜎22 , respectivamente, entonces
el intervalo de confianza para 𝜇1 − 𝜇2 es:
b) La variable aleatoria asociada con el estimador será la variable definida como (se
usa t en caso de muestras pequeñas):
̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
t=
1 1
𝑆𝑝 √ +
𝑛1 𝑛2
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2
𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2
Teorema. Si ̅̅̅ ̅̅̅2 , 𝑆12 , 𝑆22 son las medias y las varianzas de dos muestras aleatorias de
𝑋1 , 𝑋
tamaños 𝑛1 , 𝑛2 respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas pero iguales, entonces un intervalo de confianza para la
diferencia entre medias 𝜇1 − 𝜇2 es:
1 1 1 1
̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − 𝑡 𝑆𝑝 √ + ≤ 𝜇1 − 𝜇2 ≤ ̅̅̅ ̅̅̅2 + 𝑡 𝑆𝑝 √ +
𝑋1 − 𝑋
𝑛1 𝑛2 𝑛1 𝑛2
̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
t=
𝑆12 𝑆22
√
𝑛1 + 𝑛2
Teorema. Si ̅̅̅ ̅̅̅2 , 𝑆12 , 𝑆22 son las medias y las varianzas de dos muestras aleatorias de
𝑋1 , 𝑋
tamaños 𝑛1 , 𝑛2 respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas y diferentes, entonces un intervalo de confianza para la
diferencia entre medias 𝜇1 − 𝜇2 es (nuevamente para el caso de muestras pequeñas):
Ejemplo
Proceso estándar 446 401 476 421 459 438 481 411 456 427 459 445
Proceso Nuevo 462 448 435 465 429 472 453 459 427 468 452 447
𝒏 Media 𝑺
12 443.3 24.8
12 451.4 14.9
2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2 2
𝑆2 𝑆2
(𝑛1 ) (𝑛2 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]
𝑡1 = 2.10, 𝑡2 = −2.10
14.92 24.82
(451.4 − 443.3) − 2.10 √ + ≤ 𝜇1 − 𝜇2
12 12
14.92 24.82
≤ (451.4 − 443.3) + 2.10 √ +
12 12
−25.65 ≤ 𝜇1 − 𝜇2 ≤ 9.49
TAMAÑO DE LA MUESTRA
Siempre es necesario planificar la inferencia conjuntamente con la obtención de los datos.
Si el error de estimación para la media es:
𝜎
𝜀 = 𝑧𝛼
√𝑛
El tamaño de muestra para un error de estimación ε y un nivel de confianza determinado se deduce
de la ecuación anterior, resultando:
𝜎 2
𝑛 = (𝑧𝛼 )
𝜀
El tamaño de la muestra debe ser más grande cuanto menor sea el error máximo
admisible:
Para estimaciones más precisas se debe aumentar el tamaño de la muestra.
Al aumentar el nivel de confianza 1-𝛼 aumenta el tamaño de la muestra, luego:
Para aumentar el nivel de confianza se debe aumentar el tamaño de la muestra
Ejemplo
¿Cuál es el número mínimo de estudiantes que debemos elegir de una población
de 𝜎 2 , para una muestra aleatoria simple si el error mínimo admisible es de 0’1, y
el nivel de confianza del 95%?
𝜎 2 ′
2 2
𝑛 ≥ (𝑧𝛼 ) => 𝑛 ≥ (1 96 ′ ) = 1536′64
𝜀 01
𝑝𝑞 𝑝(1 − 𝑝)
𝑃 ± 𝑧𝑐 √ = 𝑃 ± 𝑧𝑐 √
𝑁 𝑁
Si el muestreo se hace de una población infinita o de una población finita, pero con
reposición, y están dados por
𝑝𝑞 𝑁𝑝 − 𝑁
𝑃 ± 𝑧𝑐 √ =√
𝑁 𝑁𝑝 − 1
De igual manera, los límites de confianza para la diferencia entre dos proporciones
poblacionales, si las poblaciones son infinitas, están dados por
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝑃1 − 𝑃2 ± 𝑧𝑐 𝜎𝑃1 −𝑃2 = 𝑃1 − 𝑃2 ± 𝑧𝑐 √ +
𝑁1 𝑁2
Donde 𝑃1 y 𝑃2 son las dos proporciones muestrales, 𝑁1 y 𝑁2 son los tamaños de las dos muestras
obtenidas de las poblaciones y 𝑝1 y 𝑝2 son las proporciones en las dos poblaciones (estimadas por
𝑃1 y 𝑃2 ).
Ejemplo
Una empresa de cable desea conocer qué proporción de sus clientes se informan de las
noticias a través de los noticiarios que difunden. Para ello seleccionó una muestra
aleatoria de 200 clientes. De las 200 personas, 110 respondieron que se informan a través
de los noticieros televisivos. El intervalo obtenido para una confianza de 95% es:
Se puede inferir que la proporción de clientes que se informan a través de los noticieros
se encuentra entre el 48% y el 62%
A tal fin decide consultar a más clientes. El tamaño de muestra que lo llevaría a cometer
un error de 4%, con la misma confianza, y utilizando la proporción muestral ya obtenida,
resulta:
𝜎 2 1.96 2
𝑛 = (𝑧𝛼 ) 𝑝̅ (1 − 𝑝̅ ) = ( ) 0.55 ∗ 0.45 = 594.25
𝜀 0.04
PRUEBAS DE HIPÓTESIS
Dada una población sobre la que se observa una variable X, tal que:
𝑋 → 𝑁(𝜇, 𝜎)
Se desea contrastar a un nivel de significación 𝛼 la hipótesis nula:
𝐻𝑜 : 𝜇 = 𝜇𝑜
Frente a la alternativa
𝐻1 : 𝜇 ≠ 𝜇𝑜
Con los datos observados se determina la media de la muestra, 𝑋̅ y el estadístico de
contraste Z. Se sabe que el estadístico media muestral sigue un modelo normal de media
𝜎
𝐸(𝑋̅ ) = 𝜇 y desviación típica 𝜎𝑋̅ = 𝑛
√
𝑋̅ − 𝜇
𝑧= 𝑠
√𝑛
que sigue un modelo N (0, 1).
Hipótesis nula
𝜇1 − 𝜇2 = 0
𝜇1 − 𝜇2 = 𝑑0
Hipótesis alternativa
𝜇1 − 𝜇2 > 0
𝜇1 − 𝜇2 > 𝑑0
𝜇1 − 𝜇2 ≠ 0
Población 1 Población 2
𝝁𝟏 𝝁𝟐
𝝈𝟐𝟏 𝝈𝟐𝟐
Muestra 1 Muestra 2
̅𝟏
𝑿 ̅𝟐
𝑿
𝑺𝟐𝟏 𝑺𝟐𝟐
𝒏𝟏 𝒏𝟐
𝑋̅ − 𝜇
𝑧=
𝜎 − √𝑛
Si 𝑛 → ∞ es la distribución normal estándar n (z; 0; 1).
Por propiedad reproductiva, y aplicando TLC. Ya que son independientes:
𝑋̅1 − 𝑋̅2 ~𝑁𝑜𝑟𝑚𝑎𝑙(𝜇𝑋̅1 −𝑋̅2, 𝜎𝑋̅1−𝑋̅2 , )
Media
𝜇𝑋̅1 −𝑋̅2 = 𝜇𝑋̅1 − 𝜇𝑋̅2 = 𝜇1 −𝜇2
Varianza
𝜎12 𝜎22
𝜎𝑋2̅1 −𝑋̅2 = 𝜎𝑋2̅1 − 𝜎𝑋2̅2 = +
𝑛1 𝑛2
̅̅̅̅
𝑋1 − ̅̅̅̅
𝑋2 −(𝜇𝑋
̅ 1 −𝜇𝑋
̅2) ̅̅̅̅
𝑋1 − ̅̅̅̅
𝑋2 −(𝑑0 )
Z= Z=
𝜎 2𝜎 2 𝜎 2𝜎 2
√ 1+ 2 √ 1+ 2
𝑛1 𝑛2 𝑛1 𝑛2
(𝑛1 −1)𝑆12
𝜎2
(𝑛1 −1)𝑆22
} 𝑣. 𝑎. 𝑋 2 con v=n-1
𝜎2
𝑍
𝑇=
𝑉
√
𝑣
̅̅̅̅
𝑋1 − ̅̅̅̅
𝑋2 −(𝜇1 −𝜇2 )
T= 1 1
√𝑆𝑝 [𝑛 + 𝑛 ]
1 2
2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2 2
𝑆2 𝑆2
(𝑛1 ) (𝑛2 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]
Usamos la distribución t-student, con v gl. A partir de ella, encontramos 𝑡𝛼,𝑣 y
comparamos nuevamente.
3
𝑃𝑜 = = 0.333
10
𝛼 = 0.025
𝑛 = 600
𝑋 = 200
𝑁 = 10000
1 1
𝜇𝑝1 -𝜇𝑝2 =0 y 𝜎𝑃1−𝑃2 = √𝑝𝑞 (𝑁 + 𝑁 )
1 2
Donde
𝑁1 𝑃1 + 𝑁2 𝑃2
𝑝=
𝑁1 + 𝑁2
BIBLIOGRAFÍA
Caro, R. (13 de 08 de 2015). Matemáticas Aplicadas a las Ciencias Sociales ll. Obtenido de
http://www.apuntesmareaverde.org.es/grupos/mat/Bachillerato/BS2%2009%20Estim
acion.pdf