Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
11 vistas24 páginas

Tema1 EstadII Profesor2021

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 24

ASIGNATURA: ESTADÍSTICA II

TEMA 1:
MUESTRAS Y ESTADÍSTICOS DE MUESTREO

1.1. Introducción a la Inferencia Estadística


1.2. Concepto de población, muestra y estadístico
1.3. Distribución de un estadístico en el muestreo
1.4. Principales estadísticos de muestreo
1.4.1. Media muestral
1.4.2. Varianza muestral
OBJETIVOS:

Al finalizar este tema, el alumno será capaz de:

 Distinguir población y muestra

 Comprender la naturaleza aleatoria de la muestra y los estadísticos

 Enunciar las propiedades fundamentales de la media muestral y comprender su


significado

 Interpretar el significado de la distribución asintótica de la media muestral y


comprender la importancia de su aplicación a problemas reales

 Conocer la distribución muestral de la media muestral y la varianza muestral en


poblaciones Normales
1.1. Introducción a la Inferencia estadística
ESTADÍSTICA DESCRIPTIVA (Estadística I)
Se ocupa de organizar y resumir un conjunto de datos, con el fin de describir, las
características más relevantes de esos datos.

INFERENCIA ESTADÍSTICA (Estadística II)


Existe incertidumbre en los fenómenos que generan los datos ⇒ Evaluar la información que
nos proporcionan los datos con el fin de sacar conclusiones fiables sobre la población (o el
modelo) que los genera
POBLACIÓN / MODELO
XXXXXXXXXXXXX Datos/muestra
XXXXXXXXXXXXX
XXXXXX
xxxx

INFERENCIA ESTADÍSTICA

Herramienta: CÁLCULO DE PROBABILIDADES (Estadística I)

Modelos de comportamiento Cuantificación del riesgo


(variables aleatorias) (probabilidad, varianza, etc)
INFERENCIA PARAMÉTRICA: Un “modelo”: X→F(x;θ), θ∈Θ genera mis datos

Modelo F(x;θ) Muestra

xxxx
x x xx

Muestra
xx x
xxxx
Con esta muestra
Muestra xx concreta ¿Qué puedo
xxxx “inferir” sobre θ?

 ESTIMACIÓN: θ̂
 CONTRASTES DE HIPÓTESIS: ¿θ=5?
1.2. Concepto de población, muestra y estadístico
Población: 2 acepciones
 Conjunto de individuos que tratamos de estudiar: los votantes de un país, las
empresas del sector agroalimentario, el parque automovilístico europeo,…; Las
poblaciones pueden ser finitas o infinitas.

 Conjunto de posibles valores que puede tomar la variable a estudiar (votar a un


partido o no, los beneficios empresariales, la antigüedad de los vehículos,…). En
este sentido, la población queda caracterizada por una variable aleatoria X y su
distribución, distribución que será parcial o totalmente desconocida y que
trataremos de conocer en el proceso de inferencia.
Para estudiar una población utilizaremos una parte representativa de la misma, una
muestra, un subconjunto de n individuos de la población elegidos aleatoriamente
(2.000 votantes, 150 empresas del sector agroalimentario, 1.000 automóviles,…). No
obstante, desarrollemos el concepto de muestra considerando la población, no como
el conjunto de individuos, sino como una variable con un modelo probabilístico
asociado.
Ejemplo 1: Queremos conocer el porcentaje de hogares con lavavajillas en el
conjunto de hogares españoles.

La población a estudiar es el conjunto de hogares españoles, pero para nosotros la


población es la variable aleatoria que recoge el objetivo del estudio. En este caso, la
disponibilidad de lavavajillas en un hogar se modeliza por una variable de Bernoulli:

1 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑐𝑐𝑐𝑐𝑐𝑐 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 → 𝑝𝑝


Población/Modelo: X=� →v.a.unidimensional b(p)
0 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 sin 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 → 1 − 𝑝𝑝

p es la probabilidad de que un hogar elegido al azar disponga de lavavajillas (p(X=1))


y la proporción de hogares de toda la población que cuenta con lavavajillas (E(X)).
¿Cómo “averiguar” p? ⇒ elegir una muestra representativa de hogares.
Por simplicidad, tomaremos 3 hogares.
Muestra: A priori, antes de hacer el experimento (preguntar u observar):
1 𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 𝑐𝑐𝑐𝑐𝑐𝑐 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 → 𝑝𝑝
X i=� →v.a. b(p), i=1,2,3, independientes
0 𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 sin 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 → 1 − 𝑝𝑝
Muestra: (X 1, X 2, X 3) muestra de tamaño n=3 de una b(p) → v.a. tridimensional
Valores de la Función de probabilidad
muestra: de la muestra
(x1, x2, x3) P(X 1 =x 1 ,X 2 =x2 ,X 3 =x 3 )
(0, 0, 0) (1-p)3
(0, 0, 1) (1-p)2p
(0, 1, 0) (1-p)2p
(1, 0, 0) (1-p)2p
(1, 1, 0) (1-p)p2
(0, 1, 1) (1-p)p2
(1, 0, 1) (1-p)p2
(1, 1, 1) p3
¡ La muestra es una variable aleatoria n-dimensional !
Muestra aleatoria simple (m.a.s.) de X de tamaño n:
(X1,...,Xn ) variables aleatorias independientes igualmente distribuidas (i.i.d.)

Distribución de la muestra:

Caso discreto: p(X1=x1 , ..., Xn =xn )= p(X1=x1 )*...*p(Xn =xn )

Caso continuo:𝑓𝑓𝑋𝑋1 ,…,𝑋𝑋𝑛𝑛 (𝑥𝑥1 , … , 𝑥𝑥𝑛𝑛 ) = 𝑓𝑓𝑋𝑋1 (𝑥𝑥1 ) ∗ 𝑓𝑓𝑋𝑋2 (𝑥𝑥2 ) ∗ … ∗ 𝑓𝑓𝑋𝑋𝑛𝑛 (𝑥𝑥𝑛𝑛 ) =

𝑓𝑓(𝑥𝑥1 ) ∗ 𝑓𝑓(𝑥𝑥2 ) ∗. . .∗ 𝑓𝑓(𝑥𝑥𝑛𝑛 )

Realización de la muestra: (x1 ,...,xn ) ⇒ valor concreto numérico de (X1,...,Xn )

Ejemplo: después del experimento: (x1, x2, x3)=(0,1,0) ¡ datos concretos !


Ejemplos de distribuciones de una muestra de tamaño n:
Caso discreto: Modelo/Población Bernoulli [X→b(p)]

p(X1=x1 ,...,Xn =xn )=p(X1=x1 )* p(X2 =x2 )*...*p(Xn =xn )=

𝑝𝑝 𝑥𝑥1 (1 − 𝑝𝑝)1−𝑥𝑥1 ∗ 𝑝𝑝 𝑥𝑥2 (1 − 𝑝𝑝)1−𝑥𝑥2 ∗ … ∗ 𝑝𝑝 𝑥𝑥𝑛𝑛 (1 − 𝑝𝑝)1−𝑥𝑥𝑛𝑛 = 𝑝𝑝∑ 𝑥𝑥𝑖𝑖 (1 − 𝑝𝑝)𝑛𝑛−∑ 𝑥𝑥𝑖𝑖

• Ejemplo 1: p(0,1,0)= 𝑝𝑝1 (1 − 𝑝𝑝)3−1 = 𝑝𝑝1 (1 − 𝑝𝑝)2 ya que ∑ 𝑥𝑥𝑖𝑖 = 1


• Si hubiésemos encuestado a 1000 hogares y 630 de ellos hubieran tenido
lavavajillas, la probabilidad de esa realización de la muestra sería:
p(1,….1,0…0)= 𝑝𝑝630 (1 − 𝑝𝑝)1000−630 = 𝑝𝑝630 (1 − 𝑝𝑝)370

630 370
Caso continuo: Modelo/Población Exponencial negativa [X → ε(λ)]

𝐹𝐹𝑋𝑋1 ,…,𝑋𝑋𝑛𝑛 (𝑥𝑥1 , … , 𝑥𝑥𝑛𝑛 ) = 𝑓𝑓𝑋𝑋1 (𝑥𝑥1 ) ∗ 𝑓𝑓𝑋𝑋2 (𝑥𝑥2 ) ∗ … ∗ 𝑓𝑓𝑋𝑋𝑛𝑛 (𝑥𝑥𝑛𝑛 )
−𝜆𝜆𝑥𝑥1 −𝜆𝜆𝑥𝑥2 −𝜆𝜆𝑥𝑥𝑛𝑛 𝑛𝑛 −𝜆𝜆 ∑𝑛𝑛
𝑖𝑖=1 𝑥𝑥𝑖𝑖
= 𝜆𝜆𝑒𝑒 ∗ 𝜆𝜆𝑒𝑒 ∗ … ∗ 𝜆𝜆𝑒𝑒 = 𝜆𝜆 𝑒𝑒
Estadístico= función (resumen) de la muestra: T(X1,...,Xn) ⇒ es v.a.
unidimensional. Los estadísticos más usuales
1.3. Distribución de un estadístico en el muestreo
Ejemplo 1 (continuación): (X 1,X2,X 3) m.a.s. tamaño n=3 de una b(p).
X 1 ++ X n
Estadístico: X= n ⇒ ¿Valores de X ?

MUESTRA Función de probabilidad MEDIA MUESTRAL


(X 1,X 2,X 3) de la muestra X
(0, 0, 0) (1-p)3 0
(0, 0, 1) (1-p)2p
(0, 1, 0) (1-p)2p 1/3
(1, 0, 0) (1-p)2p
(1, 1, 0) (1-p)p2
(0, 1, 1) (1-p)p2 2/3
(1, 0, 1) (1-p)p2
(1, 1, 1) p3 1

¡ X es variable aleatoria ! ⇒ Tiene su propia distribución ⇒


⇒ distribución muestral o distribución en el muestreo de X
Distribución muestral de X : (L:lavavajillas; NL=No lavavajillas)
_
p( X =0)=p(0,0,0)=p(NL,NL,NL)=p(NL)p(NL)p(NL)= (1-p)3
_
p( X =1/3)= p((0,0,1) ó (1,0,0) ó (0,1,0)) = p(0,0,1)+p(1,0,0)+p(0,1,0)=3(1-p)2p
_
p( X =2/3)= p((1,0,1) ó (1,1,0) ó (0,1,1)) = p(1,0,1)+p(1,1,0)+p(0,1,1)=3(1-p)p2
_
p( X =1)= p(1,1,1)=p(LLL)= p(L)p(L)p(L)= p3

X 0 1/3 2/3 1
p( X =x) (1-p)3 3(1-p)2p 3(1-p) p2 p3 ⇒ suma=1

0 1/3 2/3 1
Distribución de un estadístico en el muestreo: distribución de los valores tomados por el
estadístico en todas las posibles muestras de igual tamaño de la misma población
1.4. Principales estadísticos de muestreo
Sea (X1,...,Xn ) m.a.s. de X con E(X)=µ y Var(X)=σ2.

1.4.1. MEDIA MUESTRAL


La distribución de la media
Momentos:
muestral:
X 1 +... + X n 1 nµ
 E( X )=E( n )= [E(X1 ) + ... + E(X n )]= n =µ  Está centrada en la
n
media poblacional
1 nσ2 σ2
 Var( X )= [Var (X1 ) + ... + Var (X n )]=
n2 n2 = n  Tiene menos dispersión
σ que el modelo
 Error típico = Var (X) = σ =
X n
Distribución de X :
La distribución “exacta” de X depende de la distribución del modelo X:
 Caso particular: Si X → ε(λ) ⇒ X1 +... +Xn → γ(n, λ)⇒ X → γ(n, λn)
 Caso particular: Si X → N(µ,σ) ⇒ X → N(µ,σ/ n )
La distribución muestral de la media muestral en una población Normal1

1 Este gráfico está tomado del libro de Peña, D., 2001, p. 271)
Ejemplo 2:
La altura de los ciudadanos de un determinado país es una variable
aleatoria Normal de media 160 cm y desviación típica 10.
a) Calcula la probabilidad de que un ciudadano elegido al azar mida más de
166cm
b) Para una muestra aleatoria simple de tamaño 25, calcula la probabilidad
de que la media muestral supere los 166cm.

Solución:
a) Sea X= altura de los ciudadanos → N(160, 10)

p(X >166)=p( X −160 > 166 −160 )=p(Z>0.6)=1-Φ(0.6)=1-0.7257=0.2743


10 10
X 1 + ... + X 25
b) Sea X = la altura media de 25 ciudadanos → N(160, 10 )=N(160,2)
25 25
p( X >166)=p( X −160 > 166 −160 )=p(Z>3)=1-Φ(3)=1-0.9987=0.0013 ¡menor!
2 2
Solución Statgraphics: Graficar/Distribuciones de probabilidad
a) X= altura de los ciudadanos → N(160, 10), calculo p(X >166)
X 1 + ... + X 25
b) X = altura media de 25 ciudadanos → N(160,2), calculo p( X >166)
25
Distribución: Normal

Parámetros: Media Desv. Est.


Dist. 1 160 10
Dist. 2 160 2
Dist. 3
Dist. 4
Dist. 5

Distribuciones de Probabilidad Distribución Acumulada


Distribución: Normal

Área Cola Inferior (<)


Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5
166 0,725748 0,99865

Probabilidad de Densidad
Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5
166 0,0333225 0,00221592

Área Cola Superior (>)


Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5
166 0,274252 0,00134996
Si no se conoce la distribución “exacta” de X , ¿ qué hacer ?
 En algunos casos particulares, no conocemos la distribución “exacta” de
X pero sí la distribución “exacta” de la suma (X1+... +Xn) y podemos
utilizar ésta para el cálculo de probabilidades sobre la media muestral.
¡ Recordad ! : Distribuciones de sumas de v.a. independientes
• Bernoulli: X 1 ,...,X n v.a. independientes con X i → b(p):
SUMA ⇒ X 1 +..... +X n → B(n , p)
• Binomial: X 1,...,X k v.a. independientes con X i → B(n i , p):
SUMA ⇒ X 1 +..... +X k → B(n 1 +...+nk , p)
• Poisson: X 1 ,...,X n v.a. independientes con X i →Poisson(λi):
SUMA ⇒ X1+..... +Xn → Poisson(λ1+…+λn)
• Geométrica: X1,...,Xr v.a. independientes con Xi →G(p):
SUMA ⇒ X1+..... +Xr → BN(r, p)
• Normal: X1,...,Xn v.a. independientes con Xi → N(µi,σi):
SUMA ⇒ X1+..... +Xn → N(µ1+...+µn, σ 12 +...+ σ n2 )
• Gamma: X1, ... , Xn v.a. independientes con Xi → γ(αi,λ):
SUMA ⇒ X1+..... +Xn → γ(α1+…+αn , λ)
Caso particular: X1, ... ,Xn v.a. i.i.d. con Xi → ε(λ) = γ(1,λ)⇒ X1+..... +Xn → γ(n,λ)
Ejemplo 2 (continuación):
X= altura de los ciudadanos → N(160, 10)
X +...+X = suma altura de 25 ciudadanos → N(160*25, 102 * 25 )=N(4000,50)
1 25

p( X >166)= p( X 1 +...+ X 25 > 166 )=p( X 1 + ... + X 25 > 4150 )=p(Z>3)=1-Φ(3)= 0.0013
25
Solución Statgraphics:
Distribuciones de Probabilidad

Distribución: Normal
Parámetros: Media Desv. Est.
Dist. 1 4000 50
Dist. 2
Dist. 3
Dist. 4
Dist. 5

Área Cola Superior (>)


Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5
4150 0,00134996
Ejemplo 3:
Si la probabilidad de que nazca un varón es 0.514, ¿cuál es la probabilidad
de que en 1000 nacimientos haya menos hombres que mujeres?
1 si nace var ón → 0.514
Sea X= 0 caso contrario → 0.486 → b(0.514)

⇒ X1,..., X1000 m.a.s. de X


X = proporción “muestral” de varones
ΣXi=Nº de varones en la muestra →B(1000, 0.514).
Calculo p( X <0.5) = p(ΣXi <500)=0,179452
Solución Statgraphics: Distribuciones de Probabilidad
Distribución: Binomial
Parámetros: Prob. Evento Ensayos
Dist. 1 0,514 1000
Dist. 2

Distribución Acumulada
Distribución: Binomial
Área Cola Inferior (<)
Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5
500 0,179452
 En general, ¿se podría obtener la distribución “exacta” de X ?
⇒ conocer los valores que toma X en todas las posibles muestras de
tamaño n de X (ver ej. Bernoulli sección 1.3) ⇒ ¡ inviable, en general !

http://www.youtube.com/watch?v=xZmFqLHIFJk

Teorema central del límite: Distribución “asintótica” de X
X1,...,Xn m.a.s. de X con E(X) , Var(X)

X − E( X ) d
→ N (0,1)
Var(X) / n

Si n es “suficientemente” grande: X ≈ N(E(X), Var( X ) / n )
¡¡¡¡ sea cual sea la distribución de X !!!!
Caso particular: X1, X2,..., Xn m.a.s de una Bernoulli ⇒ Xi= 1 ocurre A → p
0 ocurre A →1 − p

X = proporción “muestral” de éxitos


Momentos:
• E( X )=E(X)=p;
• Var( X )= Var(X)
p( 1 − p)
n
= n
Distribución asintótica:
X − p
~ N (0,1) ⇔ X ≈ N ( p, p (1 − p) )
p (1 − p ) n→∞ n
n

Ejemplo 3 (continuación):
1 si nace var ón → 0.514
Sea X= 0 caso contrario → 0.486 → b(0.514) ⇒ X1,..., X1000 m.a.s de X

X = proporción “muestral” de varones ≈ N (0.514,
0.514 (1 − 0.514) =N(0.514,
) 0.0158)
1000

p( X <0.5) = p( X − 0.514 <


0.5 − 0.514 ) ≈ p(Z<−0.89)=p(Z>0.89)=1−Φ(0.89)=0.1867
0.0158 0.0158

Solución Statgraphics: Distribuciones de Probabilidad


Distribución: Normal
Parámetros: Media Desv. Est.
Dist. 1 0,514 0,0158

Distribución Acumulada
Distribución: Normal
Área Cola Inferior (<)
Variable Dist. 1 Dist. 2 Dist. 3 Dist. 4 Dist. 5
0,5 0,187787
1.4.2. VARIANZA MUESTRAL:2
n n 2
∑ ( X i − X )2 ∑ Xi
S X2 = i=1 n = i =1 − X2
n
Momentos:
2 n −1 2 La distribución de la varianza muestral NO
 E( S )= X σ ≠σ 2
n está centrada en la varianza poblacional
⇒ Demostración:
n 1 n 1 σ2 n −1 2
21
E( S )=E( ∑ X i ) − E( X )= ∑ E(Xi ) −E( X ) = n (σ + µ ) −( +µ2) =
2 2 2 2 2 2 σ ≠ σ2
X
n i=1 n i =1 n n n

⇒ E( Xi2 ) = Var(Xi) + [E(Xi)]2 = σ2 + µ2


_ _ σ2
2
⇒ E( X )= Var( X ) + [E( X )] =
2
+ µ2
n

Distribución:
n
S X → χ2
2
La distribución de S X2 depende de la distribución del modelo X. Caso particular: Si X→N(µ,σ) ⇒ 2
n -1
σ

Desviación típica muestral: S X = S X2


n
2 Algunos autores definen la varianza muestral como: S = i∑
2 ( X i − X )2 . Sin embargo, nosotros llamaremos a este estadístico, que emplea como divisor (n-1), cuasi-
=1
n −1
varianza muestral y lo denotaremos por S c , para distinguirlo de lo que definimos como varianza muestral S X2 .
2
Resumen: trabajamos con DOS “MUNDOS”:

Poblacional Muestral

MODELO DATOS de una m.a.s


Variable aleatoria X X1,X2,…,Xn (v.a.i.i.d.)

MOMENTOS TEÓRICOS MOMENTOS MUESTRALES


Parámetros (constantes) Estadísticos (v.a)

 E(X) = µ 1
 X = (X1 + .... + X n )
n
media poblacional media muestral
n
1
 Var(X) = σ ∑ (X − X )
2 2 2

 S X = i
n t =1
varianza poblacional
varianza muestral
BIBLIOGRAFÍA BÁSICA*
Canavos, G.C. (2001), Probabilidad y Estadística: Aplicaciones y Métodos,
Madrid: McGraw-Hill.
Secciones 7.1-7.5

Casas Sánchez, J.M. y Gutiérrez López, P. (2011) Estadística II: Inferencia


estadística. Edición revisada. Madrid: Centro de Estudios Ramón Areces.
Secciones 1.1 – 1.6, 1.7.1., 1.7.3, 1.8

BIBLIOGRAFÍA COMPLEMENTARIA*
Casas, J.M. (1997) Inferencia estadística (incluye ejercicios resueltos). Madrid:
Centro de Estudios Ramón Areces.
Secciones 1.1 – 1.8

Peña, D. (2008), Fundamentos de Estadística, Madrid: Alianza


Secciones 7.1, 7.2, 7.4

*También pueden consultarse las ediciones de años anteriores de los mismos libros

También podría gustarte