Semana 03
Semana 03
Semana 03
TEOREMA:
Supongamos que X1 es una variable aleatoria definida sobre una poblacin 1
12 22
X2
1X 2
n1 n2
( X 1 X 2 ) ( 1 2 )
Z
que 12 22 es tal que Z N(0, 1).
n1 n2
Comentarios:
1. La distribucin de X 1 X 2 es vlida cuando ambas poblaciones son finitas y
las muestras se extraen con reposicin.
2. Es vlida tambin cuando las poblaciones son infinitas y las muestras se extraen
con o sin reposicin.
3. Si las poblaciones de las cuales se extraen las muestras son finitas y sin
reposicin, para encontrar la varianza de cada una de las medias se debe usar lo
visto en el teorema de las medias muestrales.
4.
Ejemplo 8
E[ X 2 ] = 1 , V[ X 2 ] = ......................... y n2 = ....................
La probabilidad de que la diferencia entre las medias muestrales exceda a 0.60 se
expresa por P( | .................... | > 0.6 ).
Resolviendo
P( | ..................... | > 0.6 ) = P( ................ < - 0.6 ) + P( ............... > 0.6 )
Ahora le restamos la diferencia de medias poblacionales y dividimos por la varianza
de la diferencia de medias. Esto en ambos miembros de la desigualdad.
( X 1 X 2 ) ( 1 2 ) 0.6 0 ( X X 2 ) ( 1 2 ) 0.6 0
P( ) P( 1 )
= 12 22 4
9 2
2
4
9
1
2
n1 n2 64 64 n1 n2 64 64
Ejemplo 9
En el ciclo de verano del 2004, el curso de Estadstica Aplicada tuvo dos secciones.
En cada seccin se aplic metodologas de enseanza diferentes. Al final del ciclo
los estudiantes se sometieron a un examen final integrado, donde se obtuvo los
siguientes resultados:
Seccin Nmero de alumnos Desviacin estndar
401 30 4.5
402 30 2.9
Sea X 1
y X 2
los promedios de notas en ambas muestras de tamao 30. Se
Obtenga X 1
X2
= . y X 1
X 2 ..
Ejemplo 10
E[ X 2 ] = 1 = ............ V[ X 2 ] = ..................
Luego
P(3.4 < X 1 - X 2 < 5.9 )
Use Minitab para obtener esta probabilidad, que debe ser igual a 0.7146, creo.
Ejercicio 6
Eejercicio 7
Ejercicio 8
Una fbrica trabaja con dos tipos de mquinas: Mquina de tipo A y Mquina de tipo
B. El costo semanal X de reparacin, para las mquinas de tipo A, tienen una
distribucin normal con media 220 dlares y una desviacin de . El costo semanal
Y de reparacin, para las mquinas de tipo B, tambin tienen una distribucin
normal con media 250 dlares y una varianza de 3. Si el costo total de reparacin
para la fbrica se define como C = 2X + Y,
a) Obtenga la media y varianza del costo semanal C de reparacin de las dos
mquinas
b) Cul ser el valor de , para que el costo semanal de reparacin de las dos
mquinas no exceda los 1000 dlares, en el 95% de las veces?
c) Si se selecciona una muestra aleatoria X1, X2, ..., Xn de costos semanales para
las mquinas de tipo A y otra muestra aleatoria Y1, Y2, ..., Ym de costos
semanales para las mquinas de tipo B, obtenga la distribucin muestral de
X Y , calculando su media y varianza.
DEFINICIN
Sea p1 la proporcin de xitos en la ocurrencia de un evento en la poblacin 1 y
p1 (1 p1 ) p2 (1 p2 )
2p p2
V [ p1 p 2 ] V [ p1 ] V [ p 2 ]
1
n n
De donde
p1 (1 p1 ) p2 (1 p2 )
p p2
1
n n
Si los tamaos de las muestras son suficientemente grandes, aplicando el TLC la
variable
( p1 p 2 ) ( p )
1 p2
Z es tal que Z N(0,1).
p
1 p2
Comentarios
1. Si el muestreo se hace con reposicin sobre poblaciones finitas entonces la
media y varianza de p1 p 2 sern las indicadas en el teorema.
2. Si el muestreo se realiza sin reposicin, sobre poblaciones finitas, se deber
aplicar el factor de correccin para poblaciones finitas en el clculo de la
varianza.
3. Si las muestras se extraen con o sin reposicin sobre poblaciones infinitas, tanto
la media como la varianza de p1 p 2 sern las que se indica en el teorema.
Ejemplo 11
.......... ..............
p p2
0.043
1
200 200
Luego
0 p 0.10
1 p2
P ( p1 p 2 ) P ( p1 p 2 0) P ( Z ) P( Z ) 1 ( 2.32)
p 0.043
1 p2
0.9898
Luego la probabilidad de que las mujeres acepten el producto ms que los hombres
es 0.9898
Ejemplo 12
Ejercicio 9
Tomando en cuenta las consideraciones del problema anterior, se cree que el 16%
de los hogares del Distrito de La Victoria tienen ingresos familiares que se
clasifican como los de nivel bajo. Del mismo modo se cree que en el Distrito del
Rimac, esta proporcin es del 11%. Si estas proporciones fueron vlidas en 1996,
cul es la probabilidad de que en una muestra aleatoria de 200 hogares del
Distrito de La Victoria y en otra muestra aleatoria de 225 hogares del Distrito del
Rimac, arrojen una diferencia entre las proporciones muestrales de por lo menos el
10%?
Ejercicio 11
Ejercicio 12
Cada domingo a las 9:00 de la maana y a las 20:00 de la noche un gran porcentaje
de televidentes sintonizan en gran proporcin, dos programas de televisin que se
emiten en estos horarios. Supongamos que estos programas son emitidos por los
canales A y B. El rating del ltimo domingo, practicado en 500 televidentes,
muestran proporciones de 30% para el programa en el canal A y 35% para el
programa en el canal B. Una empresa consultora de opinin no est satisfecho con
estos resultados, motivo por el cual decide realizar su propia encuesta a 500 casas
de televidentes durante la transmisin del programa por el canal A, transmitido por
las maanas y otra encuesta practicada bajo la misma modalidad sobre 500
televidentes, durante la transmisin del programa por el canal B. Cul es la
probabilidad de que los resultados indiquen una preferencia superior por el
programa transmitido por el canal B, respecto del programa transmitido por el
canal A?.
Nota:
Pero no se emplea indistintamente,
Nota:
Sea X1, X2, ..., Xn una ................................ de tamao ...., extrada de una poblacin
normal con ....... y ............ desconocida. Sea X la ......................... Si n < 30
X
T
entonces la variable s es una variable que tiene distribucin t (n-1).
n
Observacin:
Si no se conoce la varianza poblacional, cmo se calcula entonces la variable T?
Sea X1, X2, ..., Xn una muestra aleatoria de tamao n1, extrada de una poblacin
normal con media 1 y varianza 1 desconocida. Sea Y1, Y2, ..., Yn una muestra
aleatoria de tamao n2, extrada de una poblacin normal con media 2 y varianza
2 desconocida. Sea X Y la v.a. definida como la diferencia muestral de
medias muestrales.
( X Y ) ( )
Si n1 + n2 30 entonces la variable T 1 2
es una variable que
X Y
tiene distribucin t (n1 + n2 -2 ).
donde faltara determinar cmo obtenemos X Y
a) Que, siendo desconocidas las varianzas poblaciones, suponer que son iguales
(1 = 2)
En este caso
( X Y ) ( )
T
1 2
1 1 t(n1+n2-2) donde
( )
n n 1 2
2 2
(n 1) s (n 1) s
1 1 2 2
n n 2 1 2
( X Y ) ( )
T 2
1
2
2
s s1 2
t(g)
n n 1 2
2
2 2
s1 s 2
n1 n2
g 2 2
2
donde 2
2
s1 s 2
n1 n2
n1 1 n2 1
TAREA 5
Sugerencia
Sea X1: Salario semanal en Metro
1 = 70; n1 = 14; s1 = 8
Debemos encontrar P( X X
2 2
5) . Si esta probabilidad es alta, diremos que es
muy probable que exista diferencia de sueldos, en caso contrario, no la hay.
Caso a). Suponer varianzas poblacionales desconocidas e iguales
Obtener su media y varianza y luego usar Minitab par resolver la probabilidad.
Ejemplo 13
Ventas
Tcnica 1 Tcnica 2
Media 68 72
Varianza 50 75
Si se supone que la variabilidad para ambas tcnicas son desconocidas pero iguales;
presentan estos datos suficiente evidencia para afirmar que la tcnica 2 produce
mejores resultados que la tcnica 1? Se supone que la distribucin de ambas tcnicas
son aproximadamente normal.
Solucin
Para responder a esta pregunta es suficiente encontrar
P ( ) P ( 0)
2 1 2 1
X
2
n1 = ......... ;
1
= ............... s 1
= ..................
; X
2
n2 = .........
1
= ............... s 2
= .........................
Al no conocer las varianzas poblacionales y suponer que son iguales debemos
aplicar el caso ..............
Segn esto, primero obtenga
= ...................................................................
Ahora obtenga T = ..................................................................
Sea X1, X2, ..., Xn una ................................ de tamao ...., extrada de una
poblacin normal con ....... y ............ .
2
(n 1) s
V
2
Si definimos la variable entonces V ( n 1)
2
X X
n
i 2
Del mismo modo, si entonces V ( n 1)
V i 1
Ejemplo 14
Solucin
Segn los datos: n = .........; = ...........
Debemos hallar: P(......... s ..........)
De acuerdo a esto, debemos generar la definicin de V en el centro de esta
desigualdad. Para ello, debemos multiplicar por (n -1 ) y dividir por .
Esto es:
24 * 4.071 (n 1) s 24 * 15.10125
2
P( ) P (10.856 (24) 40.27)
9 9
.........
Ejemplo 15
Solucin
Segn los datos: n = .....; = ......... y nro. de gdos. Lib. = .........
Debemos obtener: P( .............................)
Esto es P(............................) = 1 P(...................................)
Usando Minitab, obtendremos que P(s 0.75 ) = 0.00723
(aproximadamente)
F
2
1
2
tal que F F(n1 1, n2 1)
s 2
2
2
2 2
donde s 1
y s 2
son las varianzas muestrales de cada muestra.
Ejemplo 16
Dadas dos muestras aleatorias de poblaciones normales con varianzas
iguales, de tamao 10 cada una, cual es la probabilidad de observar que la
varianza de la primera muestra sea por lo menos cuatro veces la varianza de
la segunda muestra?
Solucin
La pregunta es P(s1 4 s2 )
F
2
1
2
s 2
2
2
P( s21 4)
s 2
2
s 1
P( s 4) P(
2
2
1 1
2
4) P(F(10 -1, 10 1) 4 )
s 2 s 2
2
2
ESTADISTICA INFERENCIAL
4. INTRODUCCION
En la mayora de los problemas econmicos y sociales en los cuales se puede
utilizar la estadstica son susceptibles de ser explicados mediante la construccin de
un modelo estadstico, mxime si la regularidad de la ocurrencia de tales ocurrencias
se puede expresar mediante los conceptos de variable aleatoria. En este caso, el
modelo que describe al comportamiento de la poblacin, en los cuales se manifiesta
el problema, son modelos probabilsticas.
Segn esto, el modelo puede ser representado mediante una funcin, digamos f, por
la variable aleatoria X (pueden ser mltiples variables) y por un conjunto de
parmetros, los que en conjunto describe el comportamiento de la poblacin.
1
La direccin es la siguiente: http://www.geocities.com/inforice/modelosprob.doc
Sea X una variable aleatoria con f(x; ), su funcin de distribucin en el cual,
representa el o los parmetros poblacionales. Sea X1, X2, ..., Xn una muestra aleatoria
de tamao n, extrada de esta poblacin. Diremos que
es un estimador del
parmetro , si existe una funcin H tal que
= H(X1, X2, ..., Xn ).
Observaciones:
Para que
sea un estimador de , debe poseer algunas propiedades y estas son las
siguientes:
En cuanto al estimador de :
X X
n
2
s
a) Si = i
entonces es un estimador
s i 1
n
SESGADO de ya que NO se cumple que E(
) = .
X X
n
2
b) Si
= entonces
s es un estimador
i
2
s i 1
n 1
INSESGADO de ya que se cumple que E(
) = .
Ejercicio de consulta:
En la pgina 121 del Libro Inferencia Estadstica de Mximo Mitacc se encuentra las
demostraciones de los casos a) y b). Usted debe estudiar estas demostraciones y
presentarlas al profesor en una hoja.
Ejemplo 1
Sea Z1, Z2, ..., Z5 una muestra aleatoria extrada de una poblacin N(, ).
Sean los estadsticos:
1 y 2 definidos como
= Z Z
2Z3 Z 4 Z 5
= Z y 1 2
1 2
6
Ambos estadsticos son estimadores insesgados de ?
Solucin
Por definicin, si E(
) = entonces
es un estimador insesgado de .
Tomemos esperanza al primer estadstico: E(
1 ) = .E( Z ) = ...............
Segn esto, Z (es / no es ) es un estimador insesgado de .
En cuanto al segundo estadstico:
Tomemos esperanza a ambos miembros:
E( Z 1
Z 2 2Z 3 Z 4 Z 5
E(
2 )=
6
) .............................................
Luego
2 (es / no es ) un estimador insesgado de .
Ejercicio 1
a) Si X
n X n X1 1 2 2
es la estadstica un estimador insesgado de ?.
n n 1 2
2
b) Si
(n11) s1 (n2 1) s
2
la estadstica s un
s2
2
n1 n2 2
estimador insesgado de ?
Ejercicio 2
n1 X 1
n2 X 2
a) Probar que la estadstica es un estimador insesgado de ?
n1 n2
b) Pruebe que la varianza de este estimador es igual a
n1 n2
P2. Debe ser un estimador CONSISTENTE
Un estimador
es un estimador CONSISTENTE del parmetro si P(|
-|>
)=0
Un estimador
es un estimador EFICIENTE del parmetro si es INSESGADO y
de VARIANZA MINIMA.
Se dice que es de varianza mnima ya que si existiera otro estimador insesgado digamos
Sea X1, X2, X3, X4 una muestra aleatoria de cualquier poblacin con y sus
parmetros. Cul de los dos estadsticos que se definen a continuacin, es el ms
eficiente ?.
1 X X X X
1 2 3 4
2
4 X1 X 3 X 4
4 4
Solucin
Primero debemos probar si son insesgados, encontrando E(
1 ) y E(
2 )
.............................................................................................................................
Luego debemos obtener la varianza de cada uno de ellos; es decir, debemos encontrar
V(
1 ) y V(
2 ).
V(
1 ) = ..........................................................................................................................
V(
2 ) = ......................................................................................................................
Ejercicio
Resuelva los ejercicios 1 y 4 de la pgina 151 del Libro Inferencia Estadstica de
Mximo Mitacc (519.54/ M66 / 1999).