Notas de Clase Muestreo 2017
Notas de Clase Muestreo 2017
Notas de Clase Muestreo 2017
Muestreo Estadstico
Febrero 2017
Captulo 1
Conceptos b
asicos del muestreo
Este captulo constituye una breve introduccion a la teora relacionada con el mues-
treo probabilstico, considerando como punto de partida la revision de algunos conceptos
fundamentales que permiten la comprension de la teora de muestreo a desarrollar en los
siguientes captulos. Los conceptos y teora desarrollados en este captulo estan basados
en gran parte, en el texto Model Assisted Survey Samplingde Sarndal, Swensson y
Wretman (1992).
2
1.1. ALGUNOS CONCEPTOS IMPORTANTES 3
Nota: No siempre coinciden los elementos y las unidades muestrales, cuando son
las mismas es posible un muestreo directo de elementos.
OBSERVACIONES IMPORTANTES
2.1. Ideas b
asicas
Consideremos las siguientes notaciones:
U : Universo o Poblaci
on.
U = {1, 2, ..., k, ..., N } o U = {e1 , e2 , ..., ek , ..., eN }
Y : Variable de estudio.
yk : Valor de la variable en el k-esimo elemento.
N : Tama
no de la poblaci
on (Se asume conocido).
s: Muestra
ns : Tama
no de la muestra
P
El objetivo es estimar el par
ametro: ty = U yk (Total de la variable Y )
Diseno muestral: Es una funcion p(.) que asigna a cada muestra s, la probabilidad
de ser seleccionada bajo un procedimiento muestral.
Sean
4
DE PRIMER Y SEGUNDO ORDEN
2.2. PROBABILIDADES DE INCLUSION 5
Tambien se tiene que P (S = s) := p(s), observe que p(s) es una distribucion de proba-
bilidad sobre el conjunto de todas las muestras por tanto, se cumple:
(i) p(s) 0, s P
P
(ii) p(s) = 1
sP
Notas:
1. Cuando k = l se tiene que kk = k :
kk = P (Ik Ik = 1) = P (Ik2 = 1) = P (Ik = 1) = k
2. kl = lk
3. Si se tiene un Universo conformado por N elementos y un dise no muestral p() es
aplicado, se cuenta con N probabilidades de inclusion de primer orden:
1 , 2 , ...k , ...N .
4. Si se cuenta con un universo conformado
por N elementos y con un dise
no muestral
p() aplicado, entonces se tienen N2 = N (N21) probabilidades de inclusion de
segundo orden.
5. Un muestreo probabilstico debe garantizar que k > 0 k U (Condicion 3 de
muestra probabilstica).
6. Se dice que un dise
no muestral es medible si se cumple:
(i) k > 0 k U
(ii) kl > 0 k 6= l U
La segunda condici on garantiza que se puedan calcular estimaciones de la
varianza y se puedan obtener intervalos de confianza validos basados en la
informaci
on recolectada en la muestra.
Un estadstico ser
a denotado como Q(S), por lo que es una funcion de valores reales
de S.
2.4. INDICATRIZ DE PERTENENCIA
FUNCION 7
Varianza :
V ar(Q(S)) = E(Q(S) E(Q))2 = p(s)(Q(s) E(Q))2
P
sS
Covarianza :
Sean Q1 (S) = Q1 y Q2 (S) = Q2 dos estadsticos entonces:
Ejemplos:
Ik (S)
P
ns = U Ik (S) (tama
no de muestra)
P
s yk
P
Ps yk (Raz
on de totales de las variables)
s zk
Notas
2.4. Funci
on indicatriz de pertenencia
Se tienen las siguientes propiedades:
1. E(Ik ) = k
2. V (Ik ) = k (1 k )
3. Cov(Ik , Il ) = kl k l
8CAPITULO 2. IDEAS SOBRE ESTIMACION
EN MUESTRAS PROBABILISTICAS
Demostraciones
1.
X
E(Ik ) = p(s)Ik (s)
s`P
X X
= 1 p(s) + 0 p(s)
S3k kS
/
X
= p(s) = k
S3k
2.
3.
Notas:
2.5. Tama
no de Muestra ns
P
ns = U Ik (S) Se tienen las siguientes propiedades:
P
1. E(ns ) = U k
k ]2 +
P P PP
2. V (ns ) = U k [ U U kl
k6=l
2.5. DE MUESTRA NS
TAMANO 9
Demostraciones
1.
X
E(ns ) = E( Ik )
U
X
= E(Ik )
U
X
= k
U
2.
X
V (ns ) = V ( Ik )
U
X XX
= V (Ik ) + Cov(Ik , Il )
U k6=l U
X XX
= k (1 k ) + (kl k l )
U k6=l U
X X XX XX
= k k2 + kl k l
U U k6=l U k6=l U
X XX XX
= k + kl k l
U k6=l U U
!2
X XX X
= k + kl k
U k6=l U U
2.5.1. Tama
no de Muestra fijo
Se dice que un dise
no p() es de tamano fijo, si para p(s) > 0, todas las muestras
seleccionadas mediante ese dise
no tienen exactamente n elementos.
Si el dise
no p() es de tama
no fijo, se cumple:
P
(i) U k = n
PP
(ii) U kl = n(n 1)
k6=l
P
(iii) lU kl = k (n 1)
k6=l
10CAPITULO 2. IDEAS SOBRE ESTIMACION
EN MUESTRAS PROBABILISTICAS
Demostraciones
(i)
X
k = E(ns )
U
= E(n) = n
(ii)
XX XX X
kl = kl k
k6=l U U U
XX
= E(Ik Il ) n
U
XX
= E( Ik Il ) n
U
X X
= E( Ik Il ) n
U U
= E(n n) n = n(n 1)
(iii)
X X
kl = kl kk
lU lU
k6=l
X
= E(Ik Il ) k
lU
X
= E( Ik Il ) k
lU
X
= E(Ik Il ) k
U
= E(Ik n) k
= E(Ik ) E(n) k
= k n k
= k (n 1)
Definici
on de Par
ametro:
Es una funci
on de valores de una variable en toda la poblacion, esto es:
= f (y1 , y2 , ..., yN )
Ejemplos:
P
Total de una variable: U yk
P
yk
Media poblacional: y U = N
U
1
Varianza poblacional: Sy2U = y U )2
P
N 1 U (yk
Distribuci
on Muestral del Estimador:
Se define como el conjunto de todos los valores que puede asumir el estimador con
las correspondientes probabilidades bajo un dise
no muestral p(.)
P
P (b = c) = p(s)
sP
b = P p(s)[(s)
Varianza: V () b 2
b E()]
sP
q
Error est
andar: V ()
b
Coeficiente de Variaci
on Muestral: En la practica, no conocemos V ()
b sino
V
b ()
b
Vb ();
b CVs ()
b =
b
Notas: Se consideran aceptables valores del CV ()
b menores del 15 %
12CAPITULO 2. IDEAS SOBRE ESTIMACION
EN MUESTRAS PROBABILISTICAS
OBSERVACIONES IMPORTANTES
1. Una estimacion es una valor particular del estimador calculado a partir de la
informaci
on recolectada en la muestra. En general una estimacion se denota: (s).
b
Demostraciones:
1.
X
yk
E(t ) = E
b Ik
U k
X yk
= E(Ik )
U k
X yk
= k
U k
X
= yk
U
= ty
2.7. EL -ESTIMADOR Y SUS PROPIEDADES 13
2.
X
yk
V (b
t ) = V Ik
U k
X y2 XX yk yl
k
= V (Ik ) + Cov(Ik , Il )
U 2 U k l
k k6=l
X yk2 X X yk yl
= kk 2 + kl
U k U k l
k6=l
XX yk yl
= kl
U k l
Vb (b
t ) es un estimador insesgado de V (b
t ).
Demostracion:
Se debe probar: E(Vb (b
t )) = V (b
t )
X X
kl y k yl
E(Vb (b
t )) = E
s kl k l
X X
kl yk yl
=E Ik Il
U kl k l
XX kl yk yl
= E(Ik Il )
U kl k l
XX yk yl
= kl
U k l
= V (b
t )
OBSERVACIONES IMPORTANTES
1. El -estimador tiene en cuenta el peso de cada elemento (k ).
2. En general, si el k-esimo elemento tiene probabilidad de inclusion k ; 1k indica el
n
umero de elementos de la poblacion representados por el k-esimo elemento de la
muestra.
3. La varianza del -estimador depende en gran parte de la covarianza, si se asume
que yk > 0 k U y si Cov(Ik , Il ) < 0, entonces la varianza del -estimador se
reduce.
4. Las variables indicadoras generalmente NO son ni independientes ni identicamente
distribuidas.
14CAPITULO 2. IDEAS SOBRE ESTIMACION
EN MUESTRAS PROBABILISTICAS
Resultado 1:
Si p() es un dise
no de tama
no fijo, se tiene otra expresion para la varianza del -
estimador, la cual viene dada por:
1 XX yk yl
t ) =
V (b kl ( )2
2 k l
U
Resultado 2:
1 XX yk yl XX yk yl
kl ( )2 = kl
2 k l k l
U U
Demostraci
on:
2
y2 X X y2
1 XX yk yl 1 XX yk yl 1 XX
kl = kl k2 + kl kl l2
2 U k l 2 U k U k l 2 U l
y 2
XX yk yl X X
= kl kl k2
U k l U k
Veamos que:
!
XX y2 X y2 X
kl k2 = k
kl
U k k2
kU lU
2.7. EL -ESTIMADOR Y SUS PROPIEDADES 15
Tenemos:
X X X
kl = kl k l
lU lU lU
X
= E(Ik Il ) nk
lU
X
= E Ik Il nk
U
= nE(Ik ) nk
= nk nk
=0
Por lo cual,
XX yk2
kl =0
U k2
De esta forma queda demostrado.
Resultado 3:
kl yk yl 2
t ) = 12
PP
Vb (b s kl ( k l ) con kl > 0 k 6= l U es un estimador insesgado
de la varianza debida a Yates:
E(Vb (b
t )) = V (b
t )
Demostraci
on:
X X kl E(Ik Il ) yk 2
1 y l
t )) =
E(Vb (b
2 U kl k l
2
1 XX yk yl
= kl
2 k l
U
= V (b
t )
OBSERVACIONES IMPORTANTES
1. Las expresiones para las varianzas de Horvitz-Thompson y Yates son iguales, pero
sus correspondientes estimadores NO lo son.
2.8. Dise
nos con Reemplazamiento
En dise
nos con reemplazamiento, la muestra seleccionada puede contener elementos
repetidos, esto es, cada elemento en la muestra puede aparecer al menos una vez. Ejem-
plo: Muestreo Aleatorio Simple con reemplazamiento.
En dise
nos sin reemplazamiento, cada elemento seleccionado debe aparecer exacta-
mente una vez.
Algunos conceptos:
Muestra ordenada: Si tenemos m extracciones independientes, la muestra ordenada
es un conjunto expresado por: Sord = {k1 , k2 , ..., km } con ki : el elemento seleccio-
nado en la i-esima extracci
on.
1
Nm para las muestras ordenadas de tama
no m
p(s) = (2.1)
0 en otro caso
1 m
Para cada elemento k, k viene dado por: k = 1 1 N k = 1, 2, ..., N
2.9. INTERVALOS DE CONFIANZA 17
Prueba:
P [IC(s) 3 t] = 1
P
con = p(s)
Poc
Observaciones:
Po : Conjunto de muestras posibles bajo un dise
no dado. (muestras con p(m) > 0)
: Conjunto conformado por todas las muestras cuyos intervalos de confianza
Poc
no contienen al par P )
ametro.(Poc o
18CAPITULO 2. IDEAS SOBRE ESTIMACION
EN MUESTRAS PROBABILISTICAS
Nota:
Para que el anterior I.C pueda ser construido, se requiere que:
i) La distribuci
on de b
t sea aproximadamente normal, con media t y varianza V (b
t).
Dise
nos muestrales
Los disenos muestrales con muestreo directo de elementos tienen dos caractersticas
esenciales:
Dise
no Bernoulli
Dise
no de Poisson
Dise
no Estratificado
Dise
no Proporcional al tama
no sin reemplazamiento (-PT)
Dise
no Proporcional al tama
no con reemplazamiento (P-PT)
Dise
no Sistem
atico
Dise
no por conglomerados en una etapa
3.1. Dise
no Bernoulli
Las caractersticas del dise
no Bernoulli son:
La funci
on indicatriz de pertenencia I1 , I2 , . . . , Ik , . . . , IN son variables aleatorias
independientes e igualmente distribuidas. Por lo tanto se tiene:
19
20 CAPITULO 3. DISENOS
MUESTRALES
P (Ik = 1) = k =
P (Ik = 0) = 1 k = 1
Ik Bernoulli()
El tama no de muestra es variable, en particular, ns es una variable aleatoria que
se distribuye binomialmente con parametros N y . As
E(ns ) = N
V (ns ) = N (1 )
Def: Se dice que p() es un dise no Bernoulli, si su funcion p() tiene la siguiente expre-
sion matematica:
(
ns (1 )N ns para s de tama no ns y distintos elementos
p(s) =
0 en otro caso
Respecto a las probabilidades de inclusion de primer y segundo orden se tiene:
no Bernoulli k = , k U
1. En el dise
Demostracion
X
k = p(s)
s3k
N 1 N 1 N 1 2 N 2 N 1 N
= (1 ) + (1 ) + + (1 )0
0 1 N 1
N 1 N 1 N 1 N 2 N 1 N 1
= (1 ) + (1 ) + +
0 1 N 1
Haciendo L = N 1
L L L L1 L L
k = (1 ) + (1 ) + +
0 1 L
L
!
X L k
= (1 )Lk
k
k=0
=
Luego k =
2. Adicionalmente, kl = 2 , k 6= l U
X
kl = p(s)
s3k,l
N 2 2 N 2 N 2 3 N 3 N 2 N
= (1 ) + (1 ) + + (1 )0
0 1 N 2
2 N 2 N 2 N 2 N 3 N 2 N 2
= (1 ) + (1 ) + +
0 1 N 2
BERNOULLI
3.1. DISENO 21
Haciendo L = N 2
2 L L L L1 L L
kl = (1 ) + (1 ) + +
0 1 L
L
!
X L
= 2 k (1 )Lk
k
k=0
2
=
Luego kl = 2
XX yk yl
V tBE = kl
k l
U
1 XX
= 2 kl yk yl
U
1 X XX
kk yk2 +
= 2
kl yk yl
U U
k6=l
1 X XX
(1 )yk2 + ( 2 2 )yk yl
= 2
U U
k6=l
(1 ) X 2
= yk
2
U
1 X 2
= yk
U
X
1
= 1 yk2
U
22 CAPITULO 3. DISENOS
MUESTRALES
X X kl yk yl
V tBE =
kl k l
S
X kk y 2 X X kl yk yl
K
= +
kk k2 kl k l
S S
k6=l
X (1 )
= yk2
3
S
X1
= yk2
2
S
1 1 X 2
= yk
2
S
X
1 1
= 1 yk2
S
Mecanismo de Selecci
on de la muestra probabilstica bajo el Dise
no Bernoulli
Se generan N n
umeros aleatorios, 1 , 2 , . . . , N provenientes de una distribucion
U(0,1).
OBSERVACIONES IMPORTANTES
1. El -estimador es ineficiente bajo el dise
no Bernoulli.
2. Para el dise
no Bernoulli, se propone un estimador alterno, que generalmente va a
tener menor varianza que el -estimador.
P
S yk
talt = N
ns
N2
1 2 2 1 1 n 2
SY2U =
V talt = N 1 S YU = N 1 S YU
n N n N
3. Entre m as peque
no es el coeficiente de variacion de la variable Y mas eficiente
sera el estimador alterno talt .
V tBE
1
1+ 2
V talt CV YU
3.2. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (MAS) 23
kl Bajo el MAS
N 2
n2
kl = N
n
(N 2!)
(N n)!(n 2)!
=
N!
(N n)!n!
(N 2)! n!
=
(n 2)! N !
(N 2)!(n 2)!(n 1)n
=
(n 2)!(N 2)!(N 1)N
n(n 1)
=
N (N 1)
24 CAPITULO 3. DISENOS
MUESTRALES
Entonces
n(n 1)
kl =
N (N 1)
Adicionalmente, si k = l entonces kk = k
Mecanismo de selecci
on de una muestra probabilstica bajo el MAS
Coordinado Negativo
X yk
tM AS =
M
k
X yk
= n
M N
NX
= yk
n M
3.2. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (MAS) 25
2
1 XX yk yl
V tM AS
= kl
2 U
k l
2
1 X XX yk yl
= kk (0)2 + kl
2 U k l
U
k6=l
2
1 XX yk yl
= kl n n
2 U N N
k6=l
1 X X N2
= 2
kl (yk yl )2
2 U
n
k6=l
n(n 1) n2
kl = 2
N (N 1) N
N n(n 1) n2 (N 1)
=
N 2 (N 1)
N n N n N n 2 + n2
2
=
N 2 (N 1)
n(N n)
= 2
N (N 1)
Reemplazando en lo anterior:
2 XX
n(N n) 1 N
V tM AS = (yk yl )2
2 2
N (N 1) 2 n U
k6=l
N n XX
= (yk yl )2
2n(N 1) U
k6=l
XX
1 N
= 1 (yk yl )2
2(N 1) n U
26 CAPITULO 3. DISENOS
MUESTRALES
Ahora
XX XX
(yk yl )2 = (yk y U + y U yl )2
U U
XX
= [(yk y U ) (yl y U )]2
U
XX XX XX
= (yk y U )2 2 (yk y U )(yl y U ) + (yl y U )2
U U U
XX XX
= (yk y U )2 + (yl y U )2
k l l k
X X X X
= (yk y U )2 1+ (yl y U )2 1
k l l k
X X
=N (yk y U )2 + N (yk y U )2
k k
X
= 2N (yk y U )2
k
1 X X kl N 2
= 2
(yk yl )2
2 S
kl n
k6=l
1 kl N 2 X X
= (yk yl )2
2 kl n2 S
k6=l
3.2. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (MAS) 27
n(N n)
kl N 2 (N 1)
=
kl n(n 1)
N (N 1)
N (N 1)(N n)n
= 2
N n(N 1)(n 1)
N n
=
N (n 1)
XX XX
(yk yl )2 = (yk y S + y S yl )2
S S
XX
= [(yk y S ) (yl y S )]2
S
XX XX XX
= (yk y S )2 2 (yk y S )(yl y S ) + (yk y S )2
S U S
XX XX
2
= (yk y S ) + (yl y S )2
k l l k
X X X X
2
= (yk y S ) 1+ (yl y S )2 1
k l l k
X X
=n (yk y S )2 + n (yk y S )2
k k
X
2
= 2n (yk y S )
S
28 CAPITULO 3. DISENOS
MUESTRALES
As:
1 kl N 2 X X
V tM AS = (yk yl )2
2 kl n2 S
2
1 N n N X
= 2n (yk y S )2
2 N (n 1) n2 S
N (N n) X
= (yk y S )2
n(n 1) S
!
N 1 X
=N 1 (yk y S )2
n n1 S
2
N
= N SY2S
n
2
N n 2
= 1 SYS
n N
3.3. Dise
no de Poisson
Es una generalizacion del dise
no Bernoulli. En un dise
no Poisson cada elemen-
to en la poblacion tiene una probabilidad de inclusion k distinta y su funcion
p() viene dada por:
(Q Q
kS k k(U S) (1 k ) para las muestras con elementos distintos.
p(s) =
0 en otro caso
Caractersticas
Es un dise
no de tama
no de muestra variable.
P (Ik = 1) = k
P (Ik = 0) = 1 k
X
Epo (ns ) = k
U
X
Vpo (ns ) = k (1 k )
U
DE POISSON
3.3. DISENO 29
X yk
t(po) =
S
k
XX yk yl
Vpo t(po) = kl
U
k l
X y2 X X yk yl
= kk k2 + kl
U
k U k6=l
k l
X yk2
= kk
U
k2
X yk2
= k (1 k )
U
k2
X 1
= 1 yk2
U
k
X X kl yk yl
Vpo t =
S
kl k l
X kk y 2
K
=
S
k k2
X k (1 k ) y 2
k
=
S
k k2
X 1 1
= 2
yk2
S
k k
X 1 1
= 1 yk2
S
k k
Nota Importante
En la practica los k se calculan en terminos de una variable auxiliar X, esto
es, una variable que se conoce para todos los elementos de la poblacion y que es
proporcional a la variable de estudio Y .
nxk
k = P
U xk
1. Si nx
P k 1
U xk
30 CAPITULO 3. DISENOS
MUESTRALES
entonces P
U xk
xk
n
con n = E(nm ).
2. Si nx
P k >1
U xk
entonces
k = 1
se hace inclusion forzosa del elemento en la muestra.
Mecanismo de selecci
on de la muestra probabilstica bajo el Dise
no Poisson
umeros aleatorios 1 , 2 , . . . , N con k U (0, 1).
i) Se generan N n
ii) A cada elemento de la poblacion se le asigna un n
umero aleatorio.
iii) Si k < k el k-esimo elemento es seleccionado, en caso contrario no.
P yk
N S
k
talt = P
1
S
k
X (yk y U )2
V talt N SY2U
U
k
Notas importantes
El dise
no Poisson no se usa con mucha frecuencia en la practica, porque el
tamano de muestra es variable, y eso implica que el costo de la encuesta no
se tenga con exactitud. Sin embargo este dise
no es usado para modelar la no
respuesta en encuestas muestrales.
El diseno Poisson puede ser considerado como dise
no con probabilidad de-
sigual.
3.4. MUESTREO ESTRATIFICADO 31
Caractersticas
SE
iii) i=1 Ui = U
Considere las siguientes notaciones:
Ne : N
umero de elementos en el estrato Ue
ne : N
umero de elementos en la muestra probabilstica seleccionada en el
estrato Ue .
N : Tama
no Poblacion (Conocido)
S = S1 S2 SE
La probabilidad de que ocurra S es la probabilidad de que ocurra S1 y S2 y
. . . y SE , esto es
P (S) = P (S1 S2 SE )
= P (S1 )P (S2 ) . . . P (SE )
El total poblacional viene dado por:
E
X
t = te
e=1
con
X yk
te =
M
k
e
Notas
Al interior de los estratos las observaciones deben ser lo mas homogeneas
posibles y entre los estratos heterogeneidad en las observaciones.
Si los estratos no estan conformados, se debe considerar una variable de
estratificacion que este altamente correlacionada con la variable de estudio.
Ejemplo: La variable edad de los empleados de una compa na puede ser una
buena variable de estratificacion si el interes es sobre alguna limitacion o
enfermedad de los empleados.
3.4. MUESTREO ESTRATIFICADO 33
E
X
V t = V te
e=1
E
Ne2
X ne 2
= 1 SYUe
e=1
ne Ne
E
X
V te
V t =
e=1
E
Ne2
X ne 2
= 1 SYSe
e=1
ne Ne
Asignaci
on de tama
nos de muestras Bajo ESTMAS
Sean
ns : Tama
no de muestra de la muestra se
E
X
c = c0 + n e ce
e=1
donde c0 es el costo fijo y ce es el costo por estrato para encuestar los ele-
mentos en el estrato Ue .
34 CAPITULO 3. DISENOS
MUESTRALES
La idea general consiste en obtener un ne que minimice los costos para una pre-
cision dada (V ) o lo contrario que minimice V para un costo fijo.
Asumiendo que los ce son iguales para todos los estratos, se tienen las siguien-
tes opciones:
1. Asignaci
on Optima o Asignaci
on de Neyman
Ne SYUe
ne = n PE
e=1 Ne SYUe
2. Asignaci
on X-
optima
Ne SXUe
n e = n PE
e=1 Ne SXUe
Asumiendo una variable auxiliar X que toma valores positivos y ademas que
sea altamente correlacionada con la variable de estudio.
3. Asignaci
on Proporcional
Ne
ne = n
N
Puede ser calculado si los SYUe son iguales o aproximadamente iguales en
todos los estratos, en caso contrario, obtenemos estimadores con varianzas
mas grandes que con la asignacion de Neyman.
4. Asignaci
on Proporcional al total de Y
P
yk
ne = n PUe
U yk
Ne SYUe
ne = n PE
e=1 Ne SYUe
SY
Ne Ue y Ue
y Ue
=n
PE S YU e
e=1 Ne y
y Ue Ue
P
yk
Ne CVYUe Ue
NPe
=n
PE Ue yk
e=1 Ne CVYUe
P Ne
y
e k
= n PE UP
e=1 Ue y k
X
yk
e U
=nX
yk
U
5. Asignaci
on Proporcional al total de X
P
xk
ne = n PUe
U xk
Asumiendo que los CVXUe son aproximadamente iguales en todos los estratos
y ademas si la variable auxiliar esta altamente correlacionada con la variable
de estudio.
6. Asignaci
on de Potencia
Dada por Bankier (1988)
P
Uexk CVYUe
ne = n PE P
e=1 Ue x k CVYUe
3.5. Estimaci
on de los tama
nos absolutos y relativos de
un dominio
Dominio se define como cualquier subpoblacion de interes sobre la cual se
desea estimar un parametro.
Sean:
Ud : Dominio de Interes, con Ud U .
Nd : Tama
no absoluto del dominio.
Pd : Tama
no relativo del dominio.
Sea (
1 si k Ud
Zdk =
0 si k
/ Ud
El total de la variable Zd es el mismo tama
no absoluto del dominio.
X
Zdk = Nd
U
P
U Zdk
Zd =
N
Nd
=
N
= Pd
umero de elementos de S que caen en Sd , y pd = nnd . Se
P
Sean S Zdk = nd el n
asume N conocido y Nd desconocido. Bajo MAS sin reemplazo un estimador de
Nd viene dado por:
P
d = S Zdk
N
k
NX
= Zdk
n S
nd
=N
n
= N pd
La varianza del estimador viene dada por:
N2 n 2
V Nd = 1 SZd
n N U
DE LOS TAMANOS
3.5. ESTIMACION ABSOLUTOS Y RELATIVOS DE UN DOMINIO37
con
1 X
SZ2 d = (Zdk Z dU )2
U N 1 U
Y un estimador insesgado de la varianza esta dado por la siguiente expresion:
N2 n 2
V N
d = 1 SZd
n N S
con
1 X
SZ2 d = (Zdk Z dS )2
S n1 M
Ahora, un estimador de Pd viene dado por:
Nd
Pd =
N
1
= N pd
N
= pd
3.5.1. Estimaci
on del total de una variable en un dominio cuando Nd
es desconocido
P
Sea td = Ud yk y sea la variable indicadora
(
yk si k Ud
ydk =
0 si k
/ Ud
X X
td = yk = ydk
Ud U
X yd
td = k
kM
NX
= yd
n M k
38 CAPITULO 3. DISENOS
MUESTRALES
N 2 n
V td = 1 SY2d
n N M
Vp (t )
def f (p(), t ) = (3.1)
VM AS (t )
Si def f < 1 entonces se gana eficiencia al usar p() en vez de MAS sin re-
emplazo.
Ejemplo
Obtener el def f (Be, t )
1
P 2
1 U yk
def f (Be, t ) = 2
(3.2)
N n
1 SY2U
n N
Por otro lado se tiene:
X
(N 1) SY2U = (yk y U )2
"U #
X X X
= yk2 2 yk y U + y 2U
U U
" #U
X
= yk2 2N y 2U + N y 2U
U
" #
X
= yk2 N y 2U
U
3.7. DISENOS CON PROBABILIDAD PROPORCIONAL A UNA VARIABLE AUXILIAR39
Donde:
X
yk2 = (N 1) SY2U + N y 2U
U
SY2U
= N SY2U SY2U
+ N y 2U
SY2U
1 1
= N SY2U 1 +
N CVY2U
n
Asumiendo que = N
con E(ns ) = n y reemplazando en (3.2)
1
P 2
1 U yk
def f (Be, t ) = 2
N n
1 SY2U
n N
N 2 1 1
1 N S YU 1 +
n N CVY2U
=
N2 n 2
1 SYU
n N
1 1
=1 +
N CVY2U
1
Para N relativamente grande se tiene que N
0, luego:
1
def f (Be, t ) 1 +
CVY2U
CV def f
0,4 7,25
0,5 5
0,6 3,77
0,7 3,041
0,8 2,56
3.7. Dise
nos con Probabilidad Proporcional a una variable
auxiliar
Son disenos muestrales cuyas probabilidades son proporcionales a una variable
auxiliar que esta altamente correlacionada con la variable de estudio.
3.7.1. Dise
no con Probabilidad Proporcional al Tama
no y con Reem-
plazamiento o Dise
no P-PT
Sea U = {1, 2, . . . , N } una poblacion finita. A cada elemento de la poblacion
se le asigna una probabilidad de seleccion pk , se tienen p1 , p2 , . . . , pN tal que
X
pk = 1
U
Sea
X
t= yk
U
Propiedades de tP P T
1. tP P T es insesgado para t
Demostraci
on:
yki yki
Sea Zi = y con P Zi = = pk i
pki pki
3.7. DISENOS CON PROBABILIDAD PROPORCIONAL A UNA VARIABLE AUXILIAR41
" m
#
1 X
E tP P T = E
Zi
m i=1
m
1 X
= E(Zi )
m i=1
m !
1 X X yki
= Zi Pr Zi =
m i=1 U
pk i
m
!
1 X X yki
= pk
m i=1 U
pki i
m
!
1 X X
= yki
m i=1 U
m
1 X
= t
m i=1
mt
=
m
=t
" m
#
1 X
V tP P T = V
Zi
m i=1
m
1 X
= 2 V (Zi )
m i=1
m
" 2 #
1 X X yki
= 2 t pki
m i=1 U pki
m
" #
1 X X yk2i
yki
= 2 2t + t2 pki
m i=1 U p2ki pk i
2
m X yki
= 2 t pki
m U pki
2
1 X yki
= t pk i
m U pk i
42 CAPITULO 3. DISENOS
MUESTRALES
m 2
1 X yk i
V tP P T =
tP P T
m(m 1) i=1 pki
Demostraci
on
" m 2 #
h i 1 1 X y ki
E V tP P T = E tP P T
m m 1 i=1 pki
2
1 X yk
= t pki
m U pki
= V tP P T
Nota
yk
De la formula de la V tP P T se puede ver que si
= t, k = 1, 2, . . . , N
pk
entonces
V (tP P T ) = 0
xk
pk = P
U xk
1
pk =
N
3.7. DISENOS CON PROBABILIDAD PROPORCIONAL A UNA VARIABLE AUXILIAR43
m
1 X yki
tM ASR =
m i=1 pki
m
1 X yki
=
m i=1 N1
m
NX
= yk
m i=1 i
SY2
V tM ASR = N (N 1) U
m
Mecanismo de selecci
on de la muestra probabilstica bajo el Dise
no MAS
con Reemplazo
1. Para cada elemento K en la poblacion se tiene un valor xk de la variable
auxiliar. Con K=1,2,...,N
2. Se acumulan los valores de la variable auxiliar desde el primer elemento hasta
el N-esimo elemento.
P
3. Se generan m n umeros aleatorios entre 0 y U xk
4. El k-esimo elemento es incluido en la muestra si el n
umero aleatorio cumple
Ti1 < Ti y el proceso continua hasta que m unidades son seleccionadas.
Muestreo de conglomerados y en
varias etapas
Notaci
on
Tenemos un universo finito U = {1...N }, el cual esta conformado por una
particion U1 , U2 ...UN , entonces se cumple:
i) Ui Uj = , i 6= j
S
ii) i=1 Ui = U
44
4.1. MUESTREO ALEATORIO SIMPLE DE CONGLOMERADOS 45
Expresiones generales
Notaci
on
U : Universo Finito
46 CAPITULO 4. MUESTREO DE CONGLOMERADOS Y EN VARIAS ETAPAS
SI : La muestra de conglomerados
NI : N
umero total de conglomerados en la poblacion
nI : Tama
no de la muestra SI si p(.) es un dise
no de tama
no fijo
nS I : Tama
no de la muestra SI en dise
nos muestrales de tama
no variables
S : Muestra de elementos
Nota:
En general el tama no de S, nSI es variable porque los tama nos de los conglo-
merados son diferentes independientemente si el dise
no p(.) es de tama no fijo.
Ii :Probabilidad de inclusion de primer orden del i-esimo conglomerado
P
Ii = pI (SI ) donde sI es una muestra particular de conglomerados.
SI 3i
Sea
X
t= yk
U
Este dise
no sera eficiente si:
ti tj 1
i) = =C Ii = ti ; ti Ii ti , la varianza V(tcong )=0 y el
Ii Ij C
dise
no de conglomerados sera muy eficiente.
1 XX Ni YU Ni YU
porque V(tcong )= Iij ( 0 i )2 0 i
2 U
k Ni k Nj
I
0
pero ti =Ni YUi y Ii =k Ni
NI2 nI 2 1 X
V(tM ASC )= (1 )StU ; St2U = (ti tUI )2
nI NI I I NI 1 U
I
P
UI ti
donde tUI =
NI
2
N nI 2 1 X
y Vb (tM ASC )= I (1 )StS ; St2S = (ti tsI )2
nI NI I I nI 1 S
I
P
t
SI i
donde tSI =
nI
48 CAPITULO 4. MUESTREO DE CONGLOMERADOS Y EN VARIAS ETAPAS
P P P
N NI = Ui Ni UI 1= UI (Ni 1) (2)
y U )2 = UI ( Ui (yk y Ui )2 )+SCE
P P P
U (yk
SY2w N 1 SY2w N 1
2 2
SYU N NI SYU N NI
Luego,
4.1. MUESTREO ALEATORIO SIMPLE DE CONGLOMERADOS 49
SY2w N 1 N NI N + 1 NI 1 NI 1
=1 2
1 = =
S YU N NI N NI N NI N NI
NOTAS IMPORTANTES
SY2w
1. Si 2
> 1 SY2w > SY2U (mayor variabilidad de los conglomerados)
SYU
< 0(Negativo).
Indica en general que los elementos al interior de los conglomerados son muy
diferentes con respecto a la variable de estudio. Se justifica un diseno de
conglomerados en una sola etapa (se pueden observar todos los elementos).
SY2w
2. Si < 1 SY2w < SY2U (menor variabilidad de los conglomerados)
SY2U
> 0(Positivo).
SY2 w
3. =0 si =1, esto es, en promedio la variabilidad al interior de los conglo-
SY2U
merados es igual a la variabilidad visto el universo como un todo.
N
con N = :tama
no promedio de los conglomerados.
NI
50 CAPITULO 4. MUESTREO DE CONGLOMERADOS Y EN VARIAS ETAPAS
OBSERVACIONES IMPORTANTES
N NI N NI NI NI (N 1)
deff(MASC,t )=1+ =1+ =1+
NI 1 NI 1 NI 1
NI
pero NI relativamente grande 1
NI 1
4.2. Dise
no Sistem
atico
El dise
no sistematico puede ser considerado como un caso particular del mues-
treo de conglomerados.Sean:
a: un n
umero entero fijo (intervalo muestral).
m: n
umero de comienzos aleatorios o replicas.
r:n
umero aleatorio (caso de una replica).
% n cuando c < r a
?Si c > 0 El tama
no de la muestra sera
& n + 1 cuando r c
4.2.1. Dise
no Sistem
atico Con Una Sola R
eplica m=1
Forma de Selecci
on
i) Se genera un n
umero aleatorio r entre 1 y a.
Ejemplo
Nota
El dise
no sistematico con una sola replica:
iv) El dise
no sistematico con una sola replica puede ser considerado como un
M.A.S de conglomerados, con nI =1 y NI =a. En este caso, no se tiene un
estimador de la varianza [ver f ormula de VbM ASC (t )]
52 CAPITULO 4. MUESTREO DE CONGLOMERADOS Y EN VARIAS ETAPAS
4.2.2. Dise
no Sistem
atico con m
as de una R
eplica m > 1
Forma de Selecci
on
i) Se generan m n
umeros aleatorios (r1 , r2 , ..., rm ) entre 1 y ma.
n
M={k : k = ri + (j 1)ma; i = 1, 2, ..., m, j = 1, ..., m }
Ejemplo
* El dise
no sistematico con m replicas (m > 1) puede ser considerado como
un muestreo aleatorio simple de conglomerados con nI = m y NI =ma.
En este caso, si se tiene un estimador de la varianza que puede ser obtenido
usando las formulas M.A.S.C.
4.3. MUESTREO EN DOS ETAPAS 53
NI X ma X
* tSIST =
P
ti = ti =a SI ti
nI SI
n S
I
NI2 nI 2
* V (tSIST )= (1 )S
nI NI tUI
NI2 nI 2 1 X
* V (tSIST )= (1 )StS ; con St2S = (ti tSI )2
nI NI I I nI 1 S
I
Caractersticas
Nota Importante
Cada vez que la i-esima UPM sea incluida en la primera etapa, se debe
utilizar el mismo dise
no pi (), esto es, pi (/SI )=pi ()
EJEMPLO
Considere un dise
no PPT-MAS
54 CAPITULO 4. MUESTREO DE CONGLOMERADOS Y EN VARIAS ETAPAS
UI ={U1 , U2 , U3 , U4 , U5 , U6 , U7 , U8 , U9 , U1 0} ; SI ={U1 , U1 , U3 }
Considere un dise
no MAS-MAS
UI = {U1 , U2 , U3 , U4 }
M AS(20, 100) M AS(30, 150) M AS(15, 90) M AS(30, 100)
(4 , 2)
Si en la primera etapa M.A.S.
N, n
Todas las muestras posibles en la 1a etapa.
(U1 , U2 ) MAS(20,100)-MAS(30,150)
(U1 , U3 ) MAS(20,100)-MAS(15,90)
(U1 , U4 ) MAS(20,100)-MAS(30,100)
(U2 , U3 ) MAS(30,150)-MAS(15,90)
(U2 , U4 ) MAS(30,150)-MAS(30,100)
(U3 , U4 ) MAS(15,90)-MAS(30,100)
Notaci
on
no muestral en la 1a etapa.
PI (): Dise
no muestral en la 2a etapa.
Pi (): Dise
nSI : tama
no de muestra de SI si pI () es de tama
no variable.
nI : tama
no de muestra de SI si pI () es de tama
no fijo.
nsi : tama
no de muestra de Si si pi () es de tama
no variable.
ni : tama
no de muestra de Si si pi () es de tama
no fijo.
4.3.1. t Un Dise
no en Dos Etapas de elementos
k :P(k S)=P(i SI k Si ) con k Ui
Prueba
P yk P P yk P P yk 1 X yk
tdosetapas = s
P
= SI Si = SI Si = SI
k k Ii k/i Ii S k/i
i
P ti
tdosetapas = SI
Ii
ti tj Vi
PP P
VU P M = UI Iij Ii Ij ; VU SM = UI Ii
ti tj
Vdosetapas (t )=VU P M + VU SM ; Vdosetapas (t )= Vi
PP P
UI Iij Ii Ij + UI Ii
4.3. MUESTREO EN DOS ETAPAS 57
Prueba
De probabilidad se tiene:
=
EII (t )=E(t /SI ) Epi (ti /Ii /SI )= SI Epi (ti /Ii )= SI tIi
P P P i
invarianza SI
=
VII (t )=V (t /SI ) i /Ii /SI )= S V (ti /Ii )= S V2i
P P P
S V ( t
independencia I I I Ii
ti tj
PP
Sea VU P M = UI Iij Ii Ij
Iij ti tj
Vbdosetapas (t )= Vbi
PP P
SI Iij Ii Ij
+ SI Ii
Ejemplos de dise
nos en dos etapas de elementos
MAS-MAS
yk
con ti = Si = si ynki = Nnii
P P P
k/i Si yk =Ni y Si
N i
tM ASM AS = NnII
P
SI Ni y Si
P P
SI ti yk
donde tSI = nI
y Si = Si
ni
ESTMAS-MAS
yk
con tih = Sih ; Iih = NnIh ; k/ih = Nnih
P
k/ih Ih ih
H
NIH
tEST M ASM AS =
P
t
nIh ih
h=1
H
VEST M AS (t )= V (th )
P
h=1
NIh 2 2
Nih
nIh NIh nih
V (th )= nIh )St2U )SY2U
P
(1 NIh
+ nIh UIh nih (1 Nih
Ih ih
H 2 2
NIh nIh NIh Nih nih
VEST M AS (t )= )St2U )SY2U
P P
nIh
(1 NIh
+ nIh UIh nih (1 Nih
Ih ih
h=1
2
NIh 2
Nih
Vb (th ) = (1 NnIh )St2S NIh nih
)SY2s
P
nIh Ih
+ nIh SIh nih (1 Nih
Ih ih
H 2 2
NIh nIh NIh Nih nih
Vb (t )= )St2S )SY2s
P P
nIh
(1 NIh
+ nIh SIh nih (1 Nih
Ih ih
h=1
ti tj
Vretapas (t )= Vi
PP P
UI Iij Ii Ij + UI Ii
Notaci
on
UI : Universo de UPMs.
Resumen
Etapa Diseno P rob.Inc 1erOrden P rob.Inc 2o Orden
I pI () Ii Iij Iij = Iij Ii Ij
II PIIi () IIq/i IIqr/i IIq/i = IIqr/i IIq/i IIr/i
III piq () k/iq kl/iq kl/iq = kl/iq k/iq l/iq
Nota importante:
Ni : Tama
no de Ui (i-esima UPM)
Niq : Tama
no de Uiq (iq-esima USM)
PP ti tj
con VU P M = UI Iij
Ii Ij
P VIIi
VU SM = UI
Ii
P P Viq
VU T M = UI ( UIIi )/Ii
IIq/i
El estimador insesgado para Vtresetapas (t )
P P Iij ti tj X Vbi
Vbtresetapas (t )= SI +
Iij Ii Ij S
Ii
I
B()
=q
BR() (5.1)
V ()
= E()
donde B() es el sesgo del estimador.
El sesgo relativo de un estimador adquiere importancia en los enunciados de con-
fianza, dado que los intervalos de confianza para se pueden expresar en terminos
del sesgo relativo del estimador como se vera a continuacion:
La probabilidad de que un intervalo contenga al parametro viene dada por:
q q
Po = P Z1 2 V () < < + Z1 2 V ()
= P Z1 BR() < Z < Z1 BR()
2 2
Prueba:
63
64 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
q q
Po = P Z1 2 V () < < + Z1 2 V ()
q q
= P + E() Z1 2 V () < + E() < + E() + Z1 2 V ()
q q
= P E() Z1 2 V () < + E() < E() + Z1 2 V ()
q q
= P E() Z1 2 V () < E() < E() + Z1 2 V ()
q q
= P E() > E()
+ + Z1 V () > E()
+ Z1 V ()
2 2
q q
Z1 V ()
= P r E() < E() < E()
+ Z1 V ()
2 2
E() E()
E()
=P q Z1 2 < q < q + Z1 2
V ()
V ()
V ()
= P BR() Z1 2 < Z < BR() + Z1 2
= P Z1 2 BR() < Z < Z1 2 BR()
lm [E(tn )] = t
n
lm P r[(tn t) > ] = 0
n
Se tiene lo siguiente:
1. Sea una sucesion infinita de elementos, esto es, 1, 2, 3, ... y una sucesion de
valores de una variable de interes y1 , y2 , y3 , ...
2. Sea una sucesion creciente de poblaciones U1 , U2 , U3 , ...Uv donde Uv es la
poblacion conformada por los primeros Nv elementos, y adicionalmente U1
U2 ... Uv ..., por lo tanto N1 < N2 < ... < Nv < ... y n1 < n2 < ... <
nv < ..., cuando v , N n . Y
3. Sea bv un estimador de v de una poblacion Uv . Con este marco concep-
tual se pueden extender las definiciones de insesgamiento y el de estimador
consistente.
Definiciones
1. Un estimador v es asintoticamente insesgado para v si
] = 0
lm [Epv ()
v
lm P [| v v |> ] = 0
v
66 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
Notas Importantes
1. Sea un parametro que puede ser expresado como una funcion de tota-
les, esto es, = f (t1 , t2 , ..., tj , ..., tq ) donde tj = U y jk y y 1k , y 2k , ..., y qk son
los valores de las variables de estudio y1 , y2 , ..., yq observados en el k-esimo
elemento.
2. Su correspondiente
P yjk estimador viene dado por = f (t1 , t2 , ..., tq ) con
tj = S k
Resultado 1
t es un vector insesgado de t
Prueba:
E(t1 ) t1
E(t2 ) t2
E(t ) =
.. = ..
=t
. .
E(tq ) tq
Entonces E(t ) = t
Resultado 2
Sea tj el vector de los -estimadores, la matriz de varianzas y covarianzas de
t viene dada por:
Resultado 3
t ), que
Un estimador insesgado de la matriz V(t ) viene dada por la matriz V(
es una matriz cuadrada de orden q simetrica y cuyas componenetes de la diagonas
vienen dadas por las varianzas estimadas de cada uno de los -estimados, esto es
kl yjk yj 0 l
V (tj ) = M
kl k l
y elementos por fuera de la diagonal son las respectivas covarianzas estimadas
dadas por
c(tj , tj 0 )] = c(tj , tj 0 )
E[
= U E(Ik , Il ) klkl yjkk yj0ll
y yj 0 l
= U kl kl
kl jk
k l
= c(tj , tj 0 )
5.4. El par
ametro como una funci
on de totales
= f (t1 , t2 , ..., tq )
Caso 1
= V [ Pq aj tj ] = Pq Pq0 Cov[ tj , tj 0 ].
Su V () j=1 j=1 j =1
= q
Su V ()
P P q
j=1 j 0 =1 Cov[ tj , tj 0 ].
Notas Importantes:
y su corres-
1. Cuando f es lineal se tienen expresiones exactas para la V ()
pondiente V ().
68 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
2. = a0 + S uk Pq
aj tj
P
k
, con uk = j=1
Prueba:
P uk
= a0 + S
k
Pq yjk P
= a0 + a
j=1 j S
P Pq aj yjkk
= a0 + S j=1
k
= V [P uk ] = PP kl uk ul
V () S k U k l
V () =
PP kl uk ul
S kl k l
Caso 2
con
f
aj = |
tj (t1 ,t2 ,...,tq )=(t1 ,t2 ,...,tq )
=
PP kl uk ul
V () S kl k l
con q
f
|
X
uk = a
j yjk y a
j =
j=1
tj (t1 ,t2 ,...,tq )=(t1 ,t2 ,...,tq )
70 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
Nota Importante
= PP kl uk ul
1. AV () U k l
q
X
donde uk = aj yjk
j=1
PP
=
2. V () kl u
k u
l
S kl k l
q
X
donde uk = a
j yjk
j=1
f
con aj = |
tj (t1 ,t2 ,...,tq )=(t1 ,t2 ,...,tq )
f
a
j = |
tj (t1 ,t2 ,...,tq )=(t1 ,t2 ,...,tq )
2. zk : N
umero de personas en el k-esimo hogar.
yk :Ingreso total del k-esimo hogar.
Denota el ingreso per capita.
R:
5.5. ESTIMADOR DE RAZON 71
Resultado 1
satisface:
El sesgo de R
[E(
2 R]2
R) V (tz )
=
[BR(R)] ()
V (R) t2z
es el sesgo relativo de
BR()
B()
E()
=q
BR() = q
V ()
V ()
Prueba (*):
tz ) = E(R
Cov(R, tz ) E(R)
E(tz )
= E(ty ) (E(R))E(t z)
z
= ty (E(R))t
z
= ty E(R)t
zE
= Rtz (R)t
R]
= tz [E(R)
2 tz )]2
[Cov(R,
[E(R R)] =
t2z
Cov(R, tz )
tz ) = r
(R, q
V (R) V (tz )
tz ) V (R)V
2 (R, (tz )
=
t2z
(tz )
V (R)V
t2z
porque 11
72 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
2 (tz )
V (R)V R]2
[E(R) V (tz )
[E(R) R]
2
tz
V (R) t2z
0
V (tz ) 0 = BR(R)
X uk
=R
R 0 = R +
S
k
=R+P
R uk
S k
Pq
uk = j=1 aj yjk
R
a1 = |
ty (ty ,tz )=(ty ,tz )
1
=
|(ty ,tz )=(ty ,tz ) = t1
tz z
R
a2 = |
tz (ty ,tz )=(ty ,tz )
ty ty
= 2 |(ty ,tz )=(ty ,tz ) = 2
tz tz
luego
DE LA MEDIA POBLACIONAL POR ELEMENTO
5.6. ESTIMACION 73
1 ty
uk = yk 2 zk
tz tz
1
= (yk Rzk )
tz
1 k)
uk = (yk Rz
tz
X yk Rzk
R =R+ 1
tz S k
= 1
XX (yk Rzk ) (yl Rzl )
AV (R) kl
tz
2
U
k l
k ) (yl Rz
X X kl (yk Rz l)
= 1
V (R)
t2z S
kl k l
5.6. Estimaci
on de la Media Poblacional por Elemento
Parametro de Interes: yU (Media Poblacional). Un estimador insesgado de yU
viene dado por:
yU = tN
Siempre y cuando N sea conocido.
1
V (yU ) = V (t )
N2
1
V (yU ) = 2 V (t )
N
=P
donde N 1
es el -estimador de N.
S k
74 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
Notas Importantes
na mejor que yU .
1. En la mayora de los casos yS se desempe
ty
yS = tz
zk
Con tz = 1
P P
S k = S k
Resultado 1
1 XX yk yU yl yU
AV (
yS ) = 2
kl ( )( )
N U
k l
Prueba (*):
X uk
= yS R
R 0 = yU +
S
k
uk = a1 yk + a2 zk
DE LA MEDIA POBLACIONAL POR ELEMENTO
5.6. ESTIMACION 75
yS
a1 = |
ty (ty ,tz )=(ty ,tz )
1 1
= P 1 |(ty ,tz )=(ty ,tz ) =
S k tz
yS
a2 = |
tz (ty ,tz )=(ty ,tz )
ty
= 2 |(ty ,tz )=(ty ,tz )
tz
ty ty 1 R
= 2 = =
tz tz tz tz
1 1 1
uk = yk Rzk = (yk Rzk )
tz tz tz
1 k)
uk = (yk Rz
tz
X 1 (yk Rzk )
yS ) = V [
AV ( ]
S
tz k
1 X yk Rzk 1 X y y
= 2V[ ( )] = 2 V [ ( k U )]
tz S
k tz S
k
t
yk Rzk yk ty 1
S( )
P P
Por otro lado se tiene que S k
= k
z
X (yk Rzk ) X yk ty X yk yU
k
= ( N
)= ( )
k k
S S S
de donde:
1 XX yk yU yl yU
AV (
yS ) = kl ( )( )
tz
2
U
k l
1 X X kl yk yS yl yS
V (
yS ) = 2 ( )( )
tz kl S
k l
76 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
Observaciones Importantes
a) En Dise
nos de tamano de Muestra Variable
Ejemplo: Considere yk = c k = 1, 2, ..., N
p() = Be()
P yk
S k
yS = P 1
S k
P c P 1
S S k
= P 1k = cP 1 =c
S k S k
yS = c
P yk
S k
yU =
N
1
P
S
=c
N
cns 1 c ns 1 c ns
= = =
N N N
c ns
yU = N
5.6.2. Estimaci
on de la Media de un Dominio
Sean:
U :Universo o Poblacion Finita.
Ud :Un dominio de U, tal que Ud U .
Nd :Tama
no del dominio, Nd < N .
S: Muestra extrada de la poblacion U.
Sd : Es el conjunto formado por los elementos de la muestra que pertenecen al
dominio Ud .
Sd = S Ud
El tama
no de sd es aleatorio.
Nd es desconocido y los elementos que pertenecen a Ud no pueden ser identificados
de antemano.
Parametro de Interes: yUd (Media por Elemento en el Dominio Ud ).
X
yUd = yk
Ud
(
1 si k Ud
Sea Zdk =
0 en otro caso
P
U zdk yk tz y
yUd = P = d
U zdk tzd
Su correspondiente estimador:
P zdk yk P yk
s
sd k
ysd = P zdkk = P 1
s k sd k
78 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
Resultado 1
Un estimador aproximadamente insesgado de la Media Poblacional de un do-
minio viene dado por:
P yk
sd k
ysd = P 1
sd k
1 XX yk yud yl yud
AV (
y sd ) = kl ( )( )
Nd 2
ud
k l
1 XX yk ysd yl ysd
V (
y sd ) = 2 kl ( )( )
Nd k l
s d
d = P
donde N 1
sd k
5.7. Estimaci
on de los Coeficientes de Regresi
on
Los parametros de interes son los coeficientes de regresion; B1 , B2 , ..., Bq de un
modelo de regresion:y = 1 Z1 , 2 Z2 + ... + q Zq , donde y y z1 , z2 , ..., zq son q + 1
variables de estudio.
Una muestra probabilstica es seleccionada mediante un dise
no muestral y yk , Z1k , Z2k , ..., Zqk
son observados para cada k S.
El objetivo es estimar los coeficientes de Regresion de acuerdo al criterio de Mni-
mos Cuadrados.
Notaci
on
Sean:
Zk :Un vector de q-componentes definido como Zk = (Z1k , Z2k , ..., Zqk )0 .
Z: Una matriz de orden qxN
yN N x1
DE LOS COEFICIENTES DE REGRESION
5.7. ESTIMACION 79
X 1 X
B=( Zk Z0 k ) Zk yk
U U
Ejemplo 1
Verificaci
on Z = (Z1 , Z2 , ..., Zn )
Z1
Z2
ZZ 0 = (Z1 , Z2 , ..., Zn )1xN
...
ZN N x1
= Z12 + Z22 + ... + ZN2
X
= Zk2
U
80 CAPITULO 5. ESTIMACION
DE PARAMETROS
DIFERENTES AL TOTAL
y1
y2
Zy = (Z1 , Z2 , ..., Zn )1xN
...
yN N x1
= Z1 y 1 + Z2 y 2 + ... + ZN y N
X
= Zk y k
U
P
Zk yk
B = PU 2
U Zk
Ejemplo 2
1 1 ... 1 B1
Z= B=
Z1 Z2 . . . ZN B2
P P P
N ( U Zk y k ) ( U Zk )( U y k )
B2 =
N ( U zk2 ) ( U Zk )2
P P
B1 = yU B2 zU
5.7.1. Estimaci
on de los coeficientes de Regresi
on en el Contexto de
Muestreo
El vector de parametros B se puede redefinir en terminos de totales poblacio-
nales.
Sean:
P
tjj 0 = U Zjk Zj 0 k = tj 0 j
DE LOS COEFICIENTES DE REGRESION
5.7. ESTIMACION 81
X Zk Z0 X Zk y
k k
T= t=
S
k S
k
Por lo tanto:
X Zk Z0 1 X Zk y
1t = (
=T
B k
) ( k
)
S
k S
k
es un Estimador No Insesgado para B.
de donde B
Resultado 1
es un estimador aproximadamente insesgado de B.
B
La matriz de Varianzas y covarianzas aproximada viene dada por:
AV(B) = T1 VT1
Zj 0 l El
U kl ( k )( l )
PP Zjk Ek
donde V es una matriz simetrica qxq con elementos vjj 0 =
con Ek = y k Z0k B.
Un estimador de la matriz de Varianzas y Covarianzas es:
X Zk Z0 1 X Zk Zk 1
V (B) = (
k
) V ( )
S
k S
k
donde X X kl Zjk ek Zj 0 l el
jj 0 =
V
( )( )
kl k l
S
con ek = y k Z0k B