Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Ada Inferencia Unidad 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

Universidad Autónoma de Yucatán

Facultad de Matemáticas

Licenciatura en Actuaría

“Inferencia Estadística”

Profesor: Felipe Reyes Tuz Poot

ADA 1 Unidad 2
Equipo:
Amilcar Campos Mena
Alejandra Maribel Greene Mex
Jose Eduardo Herrera Hernandez
Hector Jaasiel Torres Marquez
ABRIL 2021
Ejercicio 1. Si 𝑋1 , … , 𝑋 es una muestra aleatoria que se distribuye 𝐸𝑥𝑝(𝜆).

a) ¿Cuál es la función de densidad conjunta de la muestra?


Debido a que 𝑋1 , … , 𝑋 es una m.a 𝑋 ~𝑒𝑥𝑝(𝜆), esto implica que las variables
son independientes e idénticamente distribuidas, además se tiene que para
cada 𝑋 ~𝑒𝑥𝑝(𝜆):
𝑓(𝑥 ){0 𝑠𝑖 𝑥 < 0 𝜆𝑒 𝑠𝑖 𝑥 ≥ 0

Por todo esto, la función de densidad conjunta es:

𝑓(𝑋1 , … , 𝑋 ) = 𝑓(𝑋 )
1

𝑓(𝑋1 , … , 𝑋 ) = 𝜆𝑒 1 𝜆𝑒 2 … 𝜆𝑒

(∑ 1 )
𝑓(𝑋1 , … , 𝑋 ) = 𝜆 𝑒 =𝜆 𝑒
1

Para 𝑥 ≥ 0 y 0 en otro caso.

b) Hallar la distribución de 𝑋1 + 𝑋2 + ⋯ + 𝑋 .

Bajo los mismos supuestos de las variables aleatorias, usaremos el método de


la función generadora de momentos.

Ya que la función generadora de momentos de una v.a. con distribución


exponencial es:
𝜆
𝜆−𝑡

Entonces

𝑚 1 ⋯ = 𝑚 1𝑚 2
…𝑚

𝜆 𝜆 𝜆 𝜆
𝑚 1 ⋯ = … =
𝜆−𝑡 𝜆−𝑡 𝜆−𝑡 𝜆−𝑡

Con 𝑡 < 𝜆
Se puede observar que la función generadora de momentos resultante
corresponde a una distribución Gamma, así 𝑋1 + 𝑋2 + ⋯ 𝑋 ~𝐺𝑎𝑚𝑚𝑎(𝑛, 𝜆).

1
c) Hallar la distribución de 𝑋 = ∑ 1 𝑋.

Tenemos que 𝑋 ~𝑒𝑥𝑝 (𝜆), además, por el inciso b) tenemos que

𝑋1 + 𝑋2 + ⋯ 𝑋 ~𝐺𝑎𝑚𝑚𝑎(𝑛, 𝜆).

Ahora

1
𝑋= 𝑋
𝑛
1

1
𝐹 (𝑥) = 𝑃 𝑋 ≤ 𝑥 = 𝑃 𝑋 ≤𝑥 =𝑃 𝑋 ≤ 𝑛𝑥
𝑛
1 1

Esta última expresión se puede ver como

𝐹∑ (𝑛𝑥)
1

Ahora, por la regla de la cadena 𝐹 (𝑥) = 𝑓 (𝑥) = 𝐹∑ 1


(𝑛𝑥) =

𝑛𝑓∑ (𝑛𝑥)
1

𝜆 1
𝜆 1
𝑛𝑓∑ (𝑛𝑥) = 𝑛 (𝑛𝑥) 𝑒 = 𝑛 (𝑥) 𝑒
1 𝛤(𝑛) 𝛤(𝑛)

(𝑛𝜆) 1
∴ 𝑓 (𝑥){ (𝑥) 𝑒 𝑝𝑎𝑟𝑎 𝑥 > 0 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝛤(𝑛)

∴ 𝐴 𝑝𝑎𝑟𝑡𝑖𝑟 𝑑𝑒 𝑠𝑢 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑟 𝑞𝑢𝑒 𝑋~𝐺𝑎𝑚𝑚𝑎(𝑛, 𝑛𝜆)

Ejercicio 2. Demostrar que si 𝑋1, … , 𝑋𝑘 son variables aleatorias


independientes con distribuciones 𝐵(𝑛1, 𝑝), … , 𝐵(𝑛𝑘, 𝑝) respectivamente,
entonces 𝑋 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘 tiene distribución 𝐵(𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘, 𝑝).
La fgm de una binomial es:
𝑀 𝐵(𝑛, 𝑝) = (𝑝𝑒 + 1 − 𝑝)
sea
𝑀 𝐵(𝑛, 𝑝) la fgm de las X1, … , Xk v.a. Por independencia, tenemos lo siguiente:

1 ...
𝑀 𝐵(𝑛, 𝑝) = (𝑝𝑒 + 1 − 𝑝) = (𝑝𝑒 + 1 − 𝑝)
1

Luego, concluimos que es una variable aleatoria que tiene una distribución
𝐵(𝑛1+. . . +𝑛𝑘, 𝑝). Concluimos que no es una muestra aleatoria.

2 2 𝑉𝑎𝑟[𝑋 ] 4
𝐸 𝑋 −𝜃 =𝐸 𝑋 −𝐸 𝑋 = 𝑉𝑎𝑟 𝑋 = = ≤ 0.1
𝑛 𝑛

Entonces 𝑛 ≥ 40

Por lo tanto, la muestra debe ser de tamaño 40 o mayor.

4. La Environmental Protection Agency se ocupa del problema de establecer


criterios para las cantidades de sustancias químicas tóxicas permitidas en lagos y
ríos de agua dulce. Una medida común de toxicidad para cualquier contaminante
es la concentración de éste que mataría a la mitad de la especie de prueba en un
tiempo determinado (por lo general 96 horas para especies de peces). Esta
medida se denomina 𝐶𝐿50 (concentración letal que mata 50% de la especie de
prueba). En
muchos estudios, los valores contenidos en el logaritmo natural de mediciones del
𝐶𝐿50 están distribuidos normalmente y, en consecuencia, el análisis está basado
en datos del 𝑙𝑛(𝐶𝐿50). Estudios de los efectos del cobre en cierta especie de
peces (por ejemplo, la especie 𝐴) muestran que la varianza de mediciones de
𝑙𝑛(𝐶𝐿50) es alrededor de 0.4 con mediciones de concentración en miligramos por
litro.
a) Si han de completarse 𝑛 = 10 estudios sobre el 𝐶𝐿50 para cobre, encuentre la
probabilidad de que la media muestral de 𝑙𝑛(𝐶𝐿50) difiera de la verdadera media
poblacional en no más de 0.5.

Respuesta:
el ln(CL50) se distribuye normal, es decir 𝑋 ∼ 𝑁(𝜇, 0.4/10) , luego nos piden que
calculemos:
0.5 0.5
𝑃(|𝑋 − 𝜇| ≤ 0.5) = 𝑃(−0.5 ≤ 𝑋 − 𝜇 ≤ 0.5) = 𝑃( ≤ ≤ ) = 𝑃( ≤
√0.04 √0.04 √0.04 √0.04

2.5)+𝑃(−2.5 ≤ ) = 𝑃(−2.5 ≤ 𝑍) + 𝑃(𝑍 ≤ 2.5) ∼ 𝑁(0,1)


√0.04

usando la tabla de probabilidades, obtenemos:


0.9876
b) Si se desea que la media muestral difiera de la media poblacional en no más de
0.5 con probabilidad 0.95, ¿cuántas pruebas deben realizarse?
Respuesta:
Nos piden
2
𝑃(|𝑋 − 𝜇| ≤ 0.5), donde 𝜎 = 0.4/𝑛mismo procedimiento que en el inciso a,
tenemos:
𝑃(−2.5√𝑛 ≤ 𝑍) + 𝑃(𝑍 ≤ 2.5√𝑛) ∼ 𝑁(0,1) = 0.95 = 𝑃(−1.96 ≤ 𝑍) + 𝑃(𝑍 ≤ 1.96)
⇒ 2.5√𝑛 = 1.96 ⇒
𝑛 = 0.6146

c) Suponga que los efectos del cobre en una segunda especie (por ejemplo la
especie 𝐵) de peces muestran la varianza de mediciones de 𝑙𝑛(𝐶𝐿50) que son
de 0.8. Si las medias poblacionales del 𝑙𝑛(𝐶𝐿50) para las dos especies son
iguales, encuentre la probabilidad de que, con muestras aleatorias de diez
mediciones de cada especie, la media muestral para la especie 𝐴 sea mayor a
la media muestral para la especie 𝐵 en al menos 1 unidad.
Respuesta:
tenemos que la especie B 𝑋2 ∼ 𝑁(𝜇, 0.8/10)
Nos piden:
𝑃(𝑋 − 𝑋2 ≥ 1) =

Al ser dos normales, la esperanza de la transformación se suma y la varianza se


suma linealmente, obtenemos:
𝑋3 ∼ 𝑁(0.5 − 0.5,0.04 + 0.08) = 𝑋3 ∼ 𝑁(0,0.12) ,
luego sacamos:
𝑋3 − 0
𝑃(𝑋3 ≥ 1) = 1 − 𝑃( < 1/ 0.12) ∼ 𝑁(0,1) = 1 − 𝑃(𝑍 < 2.88) = 1 − 0.9980
√0.12
= 0.002
5. Los resistores que se han de usar en un circuito tienen un promedio de
resistencia de 200 ohms y desviación estándar de 10 ohms. Suponga que 25 de
estos resistores se seleccionan aleatoriamente para usarse en un circuito.

a) ¿Cuál es la probabilidad de que la resistencia promedio para los 25 resistores


este entre 199 y 202 ohms?

Datos: 𝜇 = 200, 𝜎 = 10, usemos 𝑋~𝑁(200,100), con la media muestra tenemos


∑ 1
𝑥 =

100
𝑥 ~𝑁 200, → 𝑥 ~𝑁(200,25) aquí calcularemos la probabilidad de la
4

resistencia. 𝑃(199 < 𝑥 ≤ 202).

199 200 200 202 200 1 1 1 1


𝑃 ≤ ≤ =𝑃 − ≤𝑧≤1 = + − 𝑃(𝑧 > 1) − 𝑃 𝑧≥
2 2 2 2 2 2 2

1
𝑃(𝑍 > 1) = 0.15865 𝑦 𝑃 𝑍 ≥ = 0.308537
2

con los datos concluimos que.


𝑃 199 ≤ 𝑥 ≤ 202 = 0.5328

b) Encuentre la probabilidad de que la resistencia total no exceda de 5100 ohms.

Tengamos que 𝑌 = 𝑥1 𝑥2 𝑥3 … 𝑥 con 𝑖 ∈ (1,2,3 … 𝑛) donde las variables son idéntica


mente distribuidas con 𝑥 ~𝑁(200,100), apoyémonos del teorema.

𝑌~𝑁 ∑ 1 𝜇 ,∑ 1 𝜎 2 con n=25 por lo tanto tendríamos 𝑌~𝑁(5000,2500)

∑ 1
Realizamos su estandarización: 𝑧 = para poder calcular 𝑃(𝑌 ≤ 5100).
∑ 1 2

𝑌 − 5000
𝑧=
√2500
5100 5000 100
𝑃 𝑧≤ =𝑃 𝑧≤ = 𝑃(𝑧 ≤ 2) aplicamos el complemento y sacamos el
√2500 0

valor en R

1 − 𝑃(𝑧 > 2) = 1 − 0.02275 = 0.97725 por lo tanto 𝑃(𝑌 ≤ 5100)=0.97725

1 2 1 1 1 1
a) 𝐸 − = 𝐸[𝑌1 ] − 𝐸[𝑌2 ] = (𝑛1 𝑝1 ) − (𝑛2 𝑝2 ) = 𝑝1 − 𝑝2
1 2 1 2 1 2
1 2 1 1 1 1
b) 𝑉𝑎𝑟 − = 2 𝑉𝑎𝑟[𝑌1 ] − 2 𝑉𝑎𝑟[𝑌2 ] = 2 𝑛1 𝑝1 (1 − 𝑝1 ) − 2 𝑛2 𝑝2 (1 − 𝑝2 )
1 2 1 2 1 2

𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
= −
𝑛1 𝑛2

7. Supóngase que X tiene una distribución 𝑋 2 con 200 grados de libertad.


Explíquese porque se puede usar el teorema del límite central para determinar el
valor apropiado de 𝑃(160 < 𝑋 < 240) y obténgase el valor aproximado.

La variable aleatoria 𝑋 2 tiene 200 grados de libertad, usando el teorema de límite


central podemos realizar lo siguiente. Sabemos que las V.A 𝑋 2 con K grados de
libertad resulta de la suma de K V.A´s al cuadrado.

Sea 𝑥 la media de las V.A 𝜃~(0,1) = 𝐸 𝜃 2 = 1, donde la ∑2001 𝜃 = 200


obtenemos la media.

Obtendremos la varianza: 𝑉𝑎𝑟 𝜃 2 = 2𝜃, con estos resultados podemos formar la


2
V.A 𝑥200 ~𝑁(200,400).

160 200
Ahora calculemos: 𝑃(160 < 𝑋 < 240) esto puede ser escrito como 𝑃 <
√400
200 240 200
< = 𝑃(−2 < 𝑧 < 2) = 1 − 2𝑃(𝑧 ≥ 2) = 1 − 2(0.022750) = 0.9544
√400 √400

8. Sean 𝑥1 , 𝑥2 , 𝑥3 ⋯ 𝑥𝑛 una muestra aleatoria de una distribución 𝑁(0,1). Definamos


1 1 1
𝑥 = ∑ 1 𝑥 y𝑥 = ∑ 1 𝑥 ¿Cuál es la distribución de 𝑥 + 𝑥𝑛 − 𝑘
2

Hallemos las distribuciones de cada uno.

1 1
𝑥 = ∑ 1 𝑥 podemos agruparla con la distribución que necesitamos 𝑥 tal
2

que nos quedaría.

1 1
𝑥𝑘 = ∑ 1 𝜒 aquí nos apoyamos de lo siguiente
2 2

𝐶1 𝑥 ~𝑁 ∑ 1 𝐶1 𝜇1 ∑ 1 𝐶 2 𝜎 2 y acoplando esto a nuestro ejercicio quedaría.


1 1 1 1 1 1
𝑥 ~𝑁 ∑ 1 𝜇, ∑ 1 (2 )2
𝜎2 = 𝑥 ~𝑁 𝜇, 𝜎 2 como nuestra muestra
2 2 2 2 4

aleatoria tiene distribución 𝑁(0,1) se obtiene lo siguiente de la distribución.

1 1
𝑥𝑘~𝑁 0,
2 4𝑘
1
Ahora nos toca enfocarnos en la otra distribución 𝑥 esto lo agrupamos con la
2
1 1
distribución 𝑥 = ∑ 1 𝑥 por lo que junto quedaría, 𝑥 =
2
1
∑ 1 𝑥 nos volvemos a apoyar de la propiedad anterior.
2( )

𝐶1 𝑥 ~𝑁 ∑ 1 𝐶1 𝜇1 ∑ 1 𝐶12 𝜎12 ahora acomodamos los términos para


obtener.

1 1 1 𝑛−𝑘 𝑛−𝑘
𝑥 ~𝑁 2
𝜎2 = 𝑁 𝜇, 𝜎2
2 2(𝑛 − 𝑘) 2(𝑛 − 𝑘) 2(𝑛 − 𝑘) 2(𝑛 − 𝑘)2
1 1

1 1
=𝑁 𝜇, 𝜎2
2 4(𝑛 − 𝑘)

Nuevamente la muestra aleatoria con distribución 𝑁(0,1) se obtendrá.

1 1
𝑥 ~𝑁 0,
2 4(𝑛 − 𝑘)

Una vez obtenido las distribuciones, realizaremos la suma para obtener la


1
distribución de 𝑥 + 𝑥𝑛 − 𝑘 , tal que
2

1 1 1
𝑥 + 𝑥𝑛 − 𝑘 = 0, +
2 4𝑘 4(𝑛 − 𝑘)

1 4𝑘 − 4𝑘 + 4𝑛
𝑥 + 𝑥𝑛 − 𝑘 = 0,
2 16𝑘𝑛 − 16𝑘 2

1 4𝑛
𝑥 + 𝑥𝑛 − 𝑘 = (0, )
2 4𝑘(4𝑛 − 4𝑘)

1
𝑥 + 𝑥𝑛 − 𝑘 = (0, ) hemos encontrado la distribución pedida.
2 (4 4 )
9. Sean 𝑋1, 𝑋2, 𝑋3 variables aleatorias independientes con distribución normal
𝑁(2𝑖, 3𝑖)
para 𝑖 = 1,2,3. Sea 𝑌 = 𝑋1 − 2𝑋2 − 3𝑋3.
i) Hallar la función de densidad de 𝑌.
Respuesta:
La distribución de cada uno es:
𝑋1 ∼ 𝑁(2 ∗ 1,3 ∗ 1) = (2,3)
𝑋2 ∼ 𝑁(2 ∗ 2,3 ∗ 2) = (4,6)
𝑋3 ∼ 𝑁(2 ∗ 3,3 ∗ 3) = (6,9)
Luego la distribución de X4 es:
𝑋4 ∼ 𝑁(2 − 2(4) − 3(6), (1)2 (3) + (−2) 2
(6) + (−3) 2
(9)) = (−24,107)
Concluimos que
𝑋4 ∼ 𝑁(−24,108)
ii) Hallar 𝑃(𝑌 < −25.96).
24 25.96 24
siendo 𝑋4 = 𝑌, 𝑃(𝑌 < −25.96) = 𝑃( < ) ∼ 𝑁(0.1) = 𝑃(𝑍 < −0.18) =
10.3923 10.3923

0.4286

25
𝑃 𝑌−𝜇 ≤ =𝑃 ≤ 2 = 𝑃(|𝑡 1| ≤ 2) = 2𝑃(|𝑡6 1 | ≤ 2) − 1 ≈ 0.898
Ejercicio 11. Suponga que 𝑌1 , 𝑌2 , … , 𝑌40 denota una muestra aleatoria de
mediciones de la proporción de impurezas en muestras de mineral de hierro.
Cada variable 𝑌 tiene una función de densidad de probabilidad dada por:

𝑓(𝑦) = {3𝑦 2 , 0 ≤ 𝑦 ≤ 1 0, 𝑜𝑡𝑟𝑜 𝑝𝑢𝑛𝑡𝑜

El mineral ha de ser rechazado por el comprador potencial si 𝑌 excede de 0.7.

Encuentre 𝑃(𝑌 > 0.7) para la muestra de tamaño 40.

Debido a que la muestra tiene un número de eventos mayor a 30, entonces la


media de las variables tiene distribución normal.

2
𝑌 ~𝑁(𝜇, ) . Además, notemos que 𝑃 𝑌 > 0.7 = 1 − 𝑃(𝑌 ≤ 0.7)

Ahora, necesitamos calcular 𝜇.

1 1 1
2 3
𝑦4 3
𝐸(𝑌) = 𝜇 = 𝑦(3𝑦 )𝑑𝑦 = 3 𝑦 𝑑𝑦 = 3 =
0 0 4 0
4

También 𝜎2 .

1 1 1
𝑦5 3
𝐸 𝑌2 = 𝑦 2 3𝑦 2 𝑑𝑦 = 3 4
𝑦 𝑑𝑦 = 3 =
0 0 5 0
5

2
3 9
(𝐸(𝑌))2 = =
4 16

Por lo tanto

3 9 3
𝜎2 = 𝐸 𝑌 2 − (𝐸(𝑌))2 = − =
5 16 80
3
2 3
Como 𝑛 = 40 ⟹ = 80
=
40 3200

3 3
Entonces, la distribución de la media nos queda: 𝑌 ~𝑁 ,
4 3200

Ahora podemos calcular la probabilidad requerida.


3
3 3 𝑌−
𝑃 𝑌 ≤ 0.7 = 𝑃 𝑌 − ≤ 0.7 − = 𝑃⎛ 4 ≤ −0.05 ⎞
4 4 3 3
⎝ 3200 3200⎠

𝑃 𝑌 ≤ 0.7 = 𝑃(𝑍 ≤ −1.632993162) = 0.0516

𝑃 𝑌 > 0.7 = 1 − 𝑃(𝑌 ≤ 0.7) = 1 − .0516 = 0.9484

∴ 𝑃 𝑌 > 0.7 = 0.9484

Ejercicio 12. Sea 𝑋1 , … , 𝑋 una muestra aleatoria de una distribución


𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆). Hallar:

a) La distribución de 𝑋1 + 𝑋2 + … + 𝑋
La muestra es aleatoria, por lo tanto, las variables son independientes e
idénticamente distribuidas, además, las 𝑋 se distribuyen 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆),
entonces cada v.a. tiene función generadora de momentos
( 1)
𝑀 (𝑡) = 𝑒 .
Así, tenemos:
𝑚 1 ⋯ = 𝑚 1𝑚 2
…𝑚

( 1) ( 1) ( 1) ( 1) ( 1)
𝑚 1 ⋯ = 𝑒 𝑒 … 𝑒 = 𝑒 =𝑒

De lo anterior podemos notar que la función generadora de momentos


resultante corresponde a una distribución Poisson.
Así 𝑋1 + 𝑋2 + ⋯ 𝑋 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆𝑛)

b) 𝐸(𝑋)
Como las 𝑋 se distribuyen 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆), 𝐸(𝑋 ) = 𝜆 y 𝑉(𝑋 ) = 𝜆

1 1 1
𝐸 𝑋 =𝐸 𝑋 = 𝐸(𝑋 ) = 𝑛𝜆 = 𝜆
𝑛 𝑛 𝑛
1 1

c) 𝑉(𝑋)

1 1 𝑛𝜆 𝜆
𝑉 𝑋 =𝑉 𝑋 = 𝑉(𝑋 ) = =
𝑛 𝑛2 𝑛2 𝑛
1 1

d) 𝐸(3𝑋)
𝐸 3𝑋 = 3𝐸 𝑋 = 3𝜆

e) 𝑉(3𝑋)

2 9𝜆
𝑉 3𝑋 = 3 𝑉 𝑋 =
𝑛

f) 𝐸(2𝑋 − 5)
𝐸 2𝑋 − 5 = 𝐸 2𝑋 − 𝐸(5) = 2𝐸 𝑋 − 5 = 2𝜆 − 5

g) 𝑉(2𝑋 − 5)

2 4𝜆
𝑉 2𝑋 − 5 = 𝑉 2𝑋 − 𝑉(5) = 2 𝑉 𝑋 − 0 =
𝑛

También podría gustarte