Tema 6 Slides
Tema 6 Slides
Tema 6 Slides
César Alonso
UC3M
Y = β0 + β1 X1 + β2 X2 + + βK XK + ε
Si se cumple que
E (εjX1 , X2 , . . . , XK ) = 0, 8X1 , X2 , . . . , XK ,
β0 = E (Y ) β1 E (X ) β1 = C (X , Y )/V (X ).
Sin embargo, X se mide con error, de modo que observamos
X = X + v1 , siendo v1 el error de medida.
Sustituyendo X = X v1 , tenemos:
Y = β0 + β1 X + ( ε β v 1)
| {z1 }
u
donde C (u, X ) 6= 0 ) X es endógena.
César Alonso (UC3M) ECONOMETRIA. Tema 6 4 / 70
Endogeneidad
log(salario ) = β0 + β1 educ + u,
Ejemplo 3: Simultaneidad
Es bastante habitual que las realizaciones de distintas variables
económicas estén relacionadas entre sí.
Esto supone que la ecuación de la variable dependiente en que
estamos interesados forma parte de un sistema de ecuaciones
simultáneas:
algunas variables que aparecen en el lado derecho de la ecuación de
interés aparecen como variables dependientes en otras ecuaciones, y
viceversa.
Y = β0 + β1 X + ε (1)
1
p lim n ∑i xi εi C (X , ε )
= β1 + 1
= β1 + 6 = β1
n ∑i xi
p lim 2 V (X )
con: yi = Yi Y , xi = Xi X.
César Alonso (UC3M) ECONOMETRIA. Tema 6 11 / 70
Variables instrumentales
De…nición: variables instrumentales (VI)
En el modelo:
Y = β0 + β1 X + ε (2)
donde C (X , ε) 6= 0,
C (Z , Y ) = β1 C (Z , X ) + C (Z , ε )
C (Z , Y )
β1 =
C (Z , X )
C (Z , Y )
β0 = E (Y ) β1 E (X ) = E (Y ) E (X )
C (Z , X )
e SYZ ∑ zi yi
β1 = = i
SXZ ∑i zi xi
e
β0 = Y e β1 X
con: yi = Yi Y , xi = Xi X , zi = Zi Z.
X = π0 + π1 Z + v ,
H0 : π 1 = 0 frente a H1 : π 1 6= 0
b (e e2 Sz2
σ e2
σ
seβ2 V β1 ) = 2
= 2 S2
,
1 nSZX n rZX X
donde
SZX
rZX =
SZ SX
es el coe…ciente de correlación muestral entre Z y X (que mide el
grado de relación lineal entre X y Z en la muestra).
Si ρZX = 10% = 0.01, V (e β1 ) ' 100V b β1 , y por tanto seβ ' 10sbβ .
1 1
Incluso con una correlación relativamente alta, ρZX = 50% = 0.5,
V (e
β ) ' 4V b
1 β , y por tanto se ' 2sb .
1 β1 β1
César Alonso (UC3M) ECONOMETRIA. Tema 6 20 / 70
Variables instrumentales
La varianza del estimador de VI
Y = β0 + β1 X + ε.
V ( ε jZ ) = σ 2 = V ( ε ),
e
β1 β1
e N (0, 1)
seβ
1
b (e e2 Sz2
σ
seβ2 V β1 ) = 2
1 nSZX
e Sz
σ
) seβ = p
1 nSZX
y donde:
e2 =
σ 1
n ∑ eε2i ,
i
siendo eεi el residuo de la estimación de VI:
eεi = Yi e
β0 + e
β1 Xi = yi e
β1 xi
Esto permite construir intervalos de con…anza y realizar contrastes de
hipótesis.
César Alonso (UC3M) ECONOMETRIA. Tema 6 23 / 70
Variables instrumentales
Bondad del ajuste con variables instrumentales
C (Z , ε )
p lim e
β1 = β1 +
C (Z , X )
C (X , ε )
p lim b
β1 = β1 +
V (X )
Donde
LBWGHT = logaritmo del peso del bebé al nacer,
MALE = variable binaria que vale 1 si el bebé es varón y 0 en otro caso,
PARITY = orden de nacimiento (entre sus hermanos) del bebé,
LFAMINC = logaritmo de la renta familiar en miles de dólares,
PACKS = número medio de cajetillas diarias fumadas por la madre
durante el embarazo.
Puede que PACKS esté correlacionado con otros hábitos de salud y/o
con un buen cuidado prenatal ) PACKS y el término de error podrían
estar correlacionados.
Posible variable instrumental para PACKS: precio medio de los
cigarrillos en el Estado de residencia (CIGPRICE).
Supondremos que CIGPRICE no está correlacionado con el término de
error (aunque las ayudas estatales a la salud podrían estar
correlacionadas con los impuestos al tabaco).
La teoría económica sugiere que C (PACKS,CIGPRICE) < 0.
Sea el modelo:
Y = β0 + β1 X + ε donde C (X , ε) 6= 0,
C (Z1 , ε) = 0, C (Z2 , ε) = 0,
C (Z1 , X ) 6= 0, C (Z2 , X ) 6= 0.
b0, π
Sean π b1, πb 2 los estimadores MCO de dicha forma reducida.
Los valores ajustados de X a partir de dichas estimaciones son:
b =π
X b0 + π
b 1 Z1 + π
b 2 Z2 .
b (de ahí el
2a Etapa: Se estima por MCO la regresión de Y sobre X
nombre de MC2E):
b +u
Y = β0 + β1 X
b.
Dicho estimador equivale a estimar β0 y β1 por VI usando Z = X
César Alonso (UC3M) ECONOMETRIA. Tema 6 38 / 70
Generalización: el estimador de MC2E
Modelo simple
Aunque en ambos casos los coe…cientes son los mismos, los errores
estándar al obtener MC2E secuencialmente son incorrectos.
La razón es que el término de error de la segunda etapa, u, incluye v ,
pero los errores estándar comprenden la varianza de ε solamente.
La mayoría de los paquetes econométricos tienen instrucciones
especiales para llevar a cabo MC2E, por lo que no es preciso realizar
las dos etapas secuencialmente.
Y = β0 + β1 X1 + β2 X2 + ε
donde:
E (ε) = 0, C (X1 , ε) = 0,
C (X2 , ε) 6= 0.
Es decir: X1 es una variable exógena
pero X2 es una variable endógena.
C (Z , ε) = 0.
X2 = π 0 + π 1 X1 + π 2 Z + v .
Y = β0 + β1 X1 + β2 X2 + β3 X3 + ε
X1 = π 10 + π 11 X3 + δ11 Z1 + δ12 Z2 + v1 ,
X2 = π 20 + π 21 X3 + δ21 Z1 + δ22 Z2 + v2 ,
Y = β0 + β1 X + ε
H0 : C (X , ε) = 0 (exogeneidad)
H1 : C (X , ε) 6= 0 (endogeneidad)
X = π0 + π1 Z + v ,
C (X , ε ) = C ( π 0 + π 1 Z + v , ε ) = C (v , ε ) )
C (X , ε ) = 0 , C (v , ε ) = 0
v + ξ0
Y = β0 + β1 X + αb (5)
con vb = X (πb0 + π
b 1 Z ) (residuo MCO de la forma reducida), se
estima por MCO.
La hipótesis nula es que X es exógena, es decir: H0 : α = 0.
Por tanto, si rechazamos que α es cero en el modelo (5),
concluiremos que X es endógena.
Generalización:
El contraste de Hausman para el caso de r variables potencialmente
endógenas consistiría en:
estimar las r formas reducidas correspondientes para cada una de
dichas variables,
obtener los residuos de cada forma reducida,
incluir como r regresores adicionales cada uno de estos residuos en el
modelo de interés,
y contrastar la signi…cación conjunta de dichos residuos mediante el
estadístico W 0 :
SRR SRS
W0 = n e χ2r
SRS
donde
SRR es la suma de los cuadrados de los residuos del modelo original sin
los residuos de las formas reducidas,
SRS es la suma de los cuadrados de los residuos del modelo ampliado
que incluye los residuos de cada una de las formas reducidas como
regresores adicionales con dichos residuos
r es el número de variables potencialmente endógenas.
Si se concluye que los residuos de las formas reducidas son
conjuntamente signi…cativos,
ello indica que al menos una de las variables explicativas
potencialmente endógenas lo es en realidad.
Ejemplo
Como ilustración, supongamos que tenemos el modelo
Y = β0 + β1 X1 + β2 X2 + β3 X3 + ε
X1 = π 10 + π 11 X3 + δ11 Z1 + δ12 Z2 + v1 ,
X2 = π 20 + π 21 X3 + δ21 Z1 + δ22 Z2 + v2 .
Y = β0 + β1 X1 + β2 X2 + β3 X3 + α1 vb1 + α2 vb2 + ξ 0 ,
Y = β0 + β1 X1 + β2 X2 + β3 X3 + ε,
Sea la ecuación:
ln(salario) = γ0 + γ1 educ + u
con u = β2 cap + ε
)γ b 1 será un estimador inconsistente de β1 .
Si disponemos de una variable instrumental para educ podremos
estimar por VI.
ln(\
salario) = 0.286 + 0.083 educ
(0.120) (0.009)
[
educ = 9.799 + 0.282 educp
(0.198) (0.021)
R 2 = 0.196
es decir, se rechaza H0 : π 1 = 0.
Por tanto, la educación de la mujer (educ) está signi…cativamente
correlacionada con la educación del padre (educp).
Estimación de VI:
ln(\
salario) = 0.363 + 0.076 educ
(0.289) (0.023)
Contraste de Hausman
A partir de la forma reducida, generamos la variable vb como el residuo
de dicha ecuación estimada:
ln(salario) = β0 + β1 educ + αb
v + e,
obteniendo:
ln(\
salario) = b
β0 + b
β1 educ + 0.007 vb + b
e
(0.024)
b
υ = educ (8.976 + 0.183 educp + 0.183 educm),
ln(salario) = β0 + β1 educ + αb
υ + e,
obteniendo:
ln(\
salario) = b
β0 + b
β1 educ + 0.0107 b
υ+b
e
(0.022)
Contrastamos H0 : α = 0 (educ es exógena).
t = 0.0107/0.022 ' 0.5.
) No se rechaza la exogeneidad de educ.
César Alonso (UC3M) ECONOMETRIA. Tema 6 64 / 70
Ejemplo: ecuación de salarios
Contraste de Sargan
e = ln(salario)
u (0.396 + 0.074 educ)
nRue2 = 0.1008,
que tiene un valor muy bajo para una distribución aproximada χ21 , con
lo que no rechazamos la hipótesis nula de no correlación de los
instrumentos con el término de error del modelo.
En consecuencia, no hay evidencia en contra de la validez de los
instrumentos.