ECONOMETRIE
ECONOMETRIE
ECONOMETRIE
Prsentation du problme: On considre la fonction de production suivante deux facteurs, le travail L et le capital K , correspondant une technologie de type Cobb-Douglas: Y (L, K ) = AL K (1)
o et sont des rels compris entre 0 et 1. Soit un chantillon {(yi , i , ki ) , i = 1, ..., n} dobservations indpendantes de logarithmes doutputs et dinputs de n entreprises. On suppose que yi = a + li + ki + ui , (2)
o les ui sont iid et normaux desprance nulle et de variance 2 . On supposera de plus ui orthogonal li et ki . Donnes numriques : n = 1000 P Pi i = 500 Pi ki = 490 i = 1490 Pi y2 Pi i2 = 330 = 320 Pi ki 2 y = Pi i 3200 Pi i yi = 800 i ki yi = 770 Questions: 1. Justier lquation (2). Interprter en particulier le sens de la variable ui . Le fait de la traiter comme une variable alatoire signie-t-il que la valeur de ui est le produit du hasard pour lentreprise i? 1
o y, X, b et u sont des matrices que lon dterminera et dont on indiquera les dimensions. b de b en fonction de y et de X. 3. Donner lexpression de lestimateur des MCO b y ei = yi y, ei =
i
4. Estimation des coecients: Dans cette question, on cherche estimer les coeb et b cients b, a. On centre les variables du problme. Pour cela, on dnit : , o y, et k sont les moyennes arithmtiques de yi , et ki dans lchantillon. e e (a) Dduire du modle (2) le modle des variables y ei , i , ki .
i
et e ki = ki k,
e+u eb e=X e. y
(4)
Interprter cette hypothse. e 0X e , ainsi que son inverse, sachant que lhypothse (5) est (d) Calculer la matrice X vrie. En dduire lestimateur des MCO des coecients de la rgression de y ei e e sur i et ki sans constante. (f) Application numrique. b. 5. Signicativit des coecients: On teste ici la signicativit de b et
eie ki =
X
i
( i )(ki k ) = 0.
(5)
(e) En dduire, par lapplication du thorme de rgression partitionne, lestimateur des MCO des coecients de la rgression de yi sur i et ki avec constante.
(b) Donner lexpression de la somme des carrs des rsidus, SCR, en fonction de yi , b. En dduire lexpression de lestimateur y , i , , ki , k , b et b2 . Application numrique. (c) Donner lexpression de b2 b2 b2 , i , , ki et k . Application en fonction de et numrique. b 10% et 5% prs. Conclusion? (d) Tester la signicativit de b et de 2
6. Test de lhypothse de rendements constants: On teste lhypothse nulle suivante (H0 ) : + = 1 Contre lalternative : (Ha ) : + 6= 1 (a) Ecrire le modle contraint associ H0 , modle dans lequel nintervient plus. Quelles sont les variables dpendantes et indpendantes de ce nouveau problme? (b) Calculer la somme des carrs des rsidus du modle contraint SCRc . Application numrique : On vriera que c ' 0.594. (c) Calculer alors la statistique de Fischer associe au test de rendements constants. Tester H0 5% prs. Conclusion ?
2
2.1
On lance un grand nombre de fois une pice de monnaie dsquilibre, dont la probabilit dobtenir "face" est gale [0, 1]. 1. On modlise le problme par le modle suivant: y = + , o y est la ralisation du lancer (y = 0 si "pile", y = 1 si "face"), et est desprance nulle. Que vaut le scalaire ? Dessiner la fonction de rpartition de . Sa loi est-elle normale? . Prciser les hypothses ("naturelles") que 2. Calculer lestimateur des MCO de : vous faites sur les rsidus. lorsque le nombre de lancers tend vers +? Vers quelle valeur converge 3. Donner lexpression de la variance de en fonction de . (NB: on pourra noter 4. Dduire de la question prcdente la densit asymptotique de n le nombre de lancers).
2.2
On dispose dun chantillon {(yi , x1i , x2i ) , i = 1, ..., n} dobservations indpendantes. 1. On suppose tout dabord que le modle de yi sachant x1i , x2i est yi = + 1 x1i + ui , (6)
avec E (ui |x1i , x2i ) = 0. On cherche mesurer les consquences de lintroduction dune seconde variable explicative, x2i . b1 et b2 des coecients de x1i et x2i dans la (a) Calculer les estimateurs des MCO rgression de yi sur x1i et x2i . b est asymptotiquement quivalent lestimateur des MCO de (b) Montrer que 1 la rgression de yi sur x1i sans x2i . Ces deux estimateurs sont-ils pour autant identiques? 2. On suppose maintenant que le vrai modle est yi = + 1 x1i + 2 x2i + vi avec E (vi |x1i , x2i ) = 0. (a) Poser ui = 2 x2i + vi et calculer E (ui |x1i , x2i ). A quelle condition E (ui |x1i , x2i ) = 0? 4 (7)
(b) On suppose dabord que x1 et x2 sont orthogonaux (cov (x1 , x2 ) = 0). Montrer que lestimateur des MCO du coecient de x1i dans la rgression de yi sur x1i sans x2i est convergent mais moins ecace (asymptotiquement moins prcis) que lestimateur des MCO du coecient de x1i dans la rgression de yi sur x1i et x2i . (c) Si x1 et x2 sont corrls, montrer que lestimateur des MCO du coecient de x1i dans la rgression de yi sur x1i sans x2i est non convergent (asymptotiquement biais).
2.3
On cherche tester linuence du sexe sur le salaire. Soit {w1i , i = 1, ..., T1 } un chantillon de salaires dhommes et {w2i , i = 1, ..., n2 } un chantillon de salaires de femmes. On suppose les observations iid. Pour cela, on divise le panel en deux sous-chantillons, femmes (1, taille n1 ) et hommes (2, taille n2 ). On considre alors les deux modles suivants Le modle non contraint scrit : w1i = 1 + u1i , w2i = 2 + u2i , Eu1i = 0, Eu2i = 0,
o 1 et 2 ne sont pas supposs gaux a priori. Le modle contraint impose lgalit des coecients 1 et 2 : H0 : 1 = 2 . Donnes numriques: n1 = 32728 n2 = 35144 P 8 Pi w1i = 2.11 10 8 i = 2.865 10 Pi w2 2 12 i = 1.66 10 Pi w1 2 12 i w2i = 2.84 10 b1 = 916 b2 = 1266 Questions: 1. On empile les deux chantillons pour former lchantillon {wi , i = 1, ..., n} o n = n1 + n2 et w1i , i = 1, ..., n1 , wi = w2i , i = n1 + 1, ..., n, (a) Ecrire le modle de wi sous la forme: wi = 1 Si + 2 (1 Si ) + ui , o lon prcisera Si et ui . 5 i = 1, ..., n (8)
2. Le test distance nie (rappels de licence). (8) sont iid et normaux, de variance Vui = 2 .
(c) Montrer que lestimateur des MCO de 1 (resp. de 2 ) dans la rgression de wi sur Si et 1 Si est identique lestimateur des MCO de 1 dans la rgression de w1i (resp. de w2i ) sur la constante 1. Expliciter b 1 et b2. On suppose les rsidus du modle
(a) Lhypothse Vui = 2 pour tout i = 1, ..., n vous parat-elle discutable? (b) Ecrire le modle non contraint sous forme matricielle. (c) Montrer que la somme des carrs des rsidus non contraints SCRnc scrit trs simplement en fonction des sommes des carrs des rsidus u1 et u2 . La calculer. nc Montrer de plus que SCR suit un 2 dont on prcisera le nombre de degrs de 2 libert. (d) Montrer que, sous lhypothse dabsence de changement structurel que lon prcisera, lestimateur ( b1, b 2 ) suit une loi normale dont on calculera la moyenne et la variance.
(e) Exprimer la dirence SCRc SCRnc en fonction de n1 , n2 , et de la dirence b1 b2. (f) En dduire que cette quantit, convenablement normalise, suit un 2 un degr de libert. Interprter.
(g) Calculer la statistique de Fischer associ au problme. Tester 5% lgalit entre 1 et 2 . Conclusion? 3. Le test asymptotique. ceux-ci restant iid. On abandonne ici lhypothse de normalit des rsidus,
(b) Sous quelle quant au comportement asymptotique de la statistique Pn hypothse n1 1 S = n i=1 Si = n cet estimateur est-il convergent? Interprter. (c) Sous ces hypothses, montrer que L n\ 1 2 N
n
0,
2 p (1 p)
o p = ESi . Pour cela, montrer successivement que: i. S p. n 2 P 2 P n 1 ii. n S S = S S p (1 p) . i i=1 n 1 Pn L iii. n n i=1 Si S (ui u) N (0, 2 p (1 p)) .
n P
(e) Tester alors labsence de changement structurel, 5%, laide dun test de Student (asymptotique).
3
3.1
Le Modle Htroscdastique
Test dgalit de deux moyennes (suite de (2.3))
2 On suppose mantenant que Vu1i = 2 1 et Vu2i = 2 avec 1 et 2 quelconques. On estime 1 et 2 sparment sur les chantillons de lles et de garons.
b2 2 =
n1 1 X P = (w1i b 1 )2 2 1, n n1 i=1 1
n1 1 X P (w12 b 2 )2 2 2. n2 n2 i=1
L 2 n1 ( b1 b 2 ) N 0, 2 1 + k 2 .
n1
b1 b2 L T =q 2 N (0, 1) n 1 1 2 + n2 n1 2 b2 P b2 2 1 + 2 n1 n2 n1 np (1 p)
si 1 = 2 = .
N (0, 1).
3.2
Un test de Goldfeld-Quandt
Dans cet exercice, on cherche quantier linuence du diplme sur le salaire. On considrera donc le modle linaire suivant : wi = xi + + ui O xi repre le niveau dducation de lindividu i. On supposera les rsidus ui inid et orthogonaux aux variables explicatives. On teste lhtroscdasticit des rsidus en divisant lchantillon en deux sous-chantillons I1 et I2 correspondant aux "non-diplms" (niveau infrieur au bac) et aux "diplms" (au moins le bac). On retire ensuite de ces deux sous-chantillons une proportion des individus telle que tous deux aient la mme taille. On calcule ensuite les sommes des rsidus des deux sous-modles, soit SR1 et SR2 .
2 suit, sous lhypothse dhomoscdasticit, une loi de Fisher dont on 1. Montrer que SR SR1 prcisera le nombre de degrs de libert.
2. Tester lhypothse dhomoscdasticit aux niveaux 1%, 5% et 10%. Quen dduire ? 3. On considre alors le modle : ln(wi ) = xi + + ui . Justier la forme choisie: pourquoi utilise-t-on le logarithme? 4. Tester lhypothse dhomoscdasticit sur ce modle. Conclusion ? (9)
3.3
On value lerreur qui est faite lorsque lon estime un modle linaire htroscdastique par les MCO. On considre le modle htroscdastique : yi = a + bxi + ui , (10)
o la matrice de variance-covariance des ui est diagonale, gale 2 diag ( 1 , ..., n ). On suppose que les poids j sont positifs, et somment 1. 1. Calculer bMCO . Est-il sans biais? Convergent? 2. Mmes questions pour bMCP , lestimateurs des Moindres Carrs Pondrs du paramtre b. bMCP . 3. Calculer les variances de bMCO et 4. Montrer que bMCP est plus prcis. 5. On calcule un estimateur de la variance de bMCP par la mthode des MCP. Montrer que cet estimateur nest pas biais. 6. On calcule maintenant un estimateur de la variance de bMCO par les MCO. Montrer que cet estimateur est biais. Dans quelle direction? 9
3.4
Observations Groupes
Soit un chantillon dobservations iid {(yi , di ), i = 1, ..., N }, avec yi R et di {1, ..., J }. La variable di est une variable discrte qui indique un groupe social dappartenance de lindividu i (les diplms par opposition aux non diplms, direntes PCS, etc.). Chaque groupe social j {1, ..., J } est caractris par un vecteur de constantes zj RK (revenu moyen, ge moyen, etc.). Pour tout j {1, ..., J }, on note Nj le nombre dindividus i dans le groupe j et y j la moyenne de yi dans le groupe j . Enn, j i = 1 {di = j } dnote la variable j indiquant si le groupe dappartenance est le groupe j ( i = 1 si di = j , = 0 sinon). b = ( b1 , ..., bJ )0 lestimateur des MCO de la rgression de yi sur le vecteur xi = 1. Soit 1 J 0 ( i , ..., i ) . (a) Remplacer les ? dans les deux quations suivantes par lexpression approprie: Nj
N X = ?
yj =
PN
i=1
(b) Interprtez gomtriquent le systme des quations normales dnissant lestimateur des MCO: N X b = 0. xi yi x0i
i=1
i=1 P N
?yi
i=1 ?
(11)
o zdi =
o Nj est le nombre dindividus i appartenant au groupe j . (b) Combien y-a-til dquations et de variables dans le systme (12)? (c) Montrer que
(a) Montrer que les quations normales dnissant lestimateur des MCO de a et b scrivent: P 0b J Nj y j b a z b =0 j j =1 (12) 0b PJ Nj zj y j b a z b = 0 j j =1
(13) (14)
j = 1, ..., J.
(15)
(a) Montrer que lquation (15) se dduit de lquation (11) pour un choix de vj que vous expliciterez.
J (b) Montrer que E (vj |X ) = 0 o X = ( 1 i , ..., i )i=1,...,N .
2 . Nj
(e) Calculer lestimateur des MCO de la rgression de y j sur 1 et zj . (f) Calculer lestimateur des MCG et montrer que cest le mme estimateur que celui obtenu dans la question 2c.
11
4
4.1
o xi reprsente le niveau dducation de lindividu i, et yi le logarithme de son salaire. On sintresse aux ventuels problmes dendognit poss par cette formulation. 1. Pour mettre ces problmes en vidence, on postule dans cette question lexistence dune caractristique inobserve, zi , qui inuence la fois ui et xi . Soit : ui = bzi + i , xi = + zi + ei . (a) Interprter ce modle structurel. (b) En supposant i et ei non corrls et de moyenne nulle, dterminer le biais asymtotique de lestimateur des MCO bMCO . Montrer quil est vraisemblablement positif. (c) On calcule empiriquement le biais de b. Quelle mthode peut-on utiliser? On trouve alors un biais signicativement ngatif. 2. On interprte le paradoxe des questions prcdentes en postulant la prsence derreurs de mesure. On suppose que le vrai modle scrit :
yi = a + bx i + ui , o yi est le salaire mesur par yi avec erreur: + i, yi = yi
et x i le vrai niveau dducation mesur avec erreur par xi : xi = x i + i . On suppose les erreurs de mesure i et i non corrles entre elles, iid et non corrles avec x i. (a) Soit b b lestimateur des MCO du coecient de xi dans la rgression de yi sur xi avec constante. Exprimer le biais asymptotique sur b et montrer que lerreur de mesure biaise lestimateur vers 0. (b) Soit b c lestimateur des MCO du coecient de yi dans la rgression de xi sur yi avec constante. Exprimer le biais asymptotique de 1/b c sur b. Montrer que le biais est positif.
(c) En dduire que lon peut obtenir un encadrement du vrai rendement de lducation, et discuter la prcision de cet encadrement. Montrer en particulier que 1/b c reste biais mme lorsquil ny a pas derreur de mesure. 12
4.2
La variable yi reprsente le nombre dheures travailles par lindividu i dans la semaine prcdant lenqute, et xi est le salaire horaire de ce mme individu. 1. Quelles sont les deux interprtations possibles du rsidu ui vues en cours. Pour quelle raisons, dans lventualit dune interprtation causale de cette relation, la variable xi est-elle susceptible dtre corrle au rsidu ui ? 2. On suppose dans cette question que xi est endogne dans lquation (16). Montrer qualors lestimateur des MCO b de b est biais, et calculer son biais en fonction de xi et ui . Sattend-on un biais positif ou ngatif? Justier. 3. Parmi les variables suivantes, lesquelles peut-on rejeter immdiatement comme ntant pas des instruments convenables pour le modle (16) : indicatrice de temps partiel, profession de lindividu, rgion de rsidence, diplme, salaire hebdomadaire. Justier chacune de vos armations. 4. On retient dans cette question et la suivante la profession des parents comme instrument. Expliquer comment on obtient lestimateur des doubles moindres carrs de b, associ au modle (16) et linstrument considr (que lon pourra noter zi pour les besoins de lexplication). On eectue le calcul de b2MC sur un chantillon de 10000 individus. La rgression augmente de yi sur xi , v bi et la constante donne : o les carts-types sont entre parenthse. Que reprsente la variable vi ? Donner la moyenne et lcart-type de b2MC . Tester ensuite lexognit de xi pour le modle (1) 5%. Dans quel sens lestimateur des MCO est-il biais? Commenter. 5. Peut-on tester la validit de linstrument "profession des parents" partir des informations contenues dans lnonc ? Comment pourrait-on sy prendre pour la tester? Expliquer. 6. On sintresse maintenant lventuelle htroscdasticit du modle (16). Expliquer pourquoi la variance conditionnelle V(yi |xi ) est vraisemblablement monotone en xi . Quelle mthode peut-on appliquer pour tester lhtroscdasticit du modle? 7. On suppose le modle (16) htroscdastique. On instrumente alors par la profession des parents, comme dans la question 4. Le coecient b2MC est-t-il convergent? Que dire de son cart-type? 8. Donner une mthode permettant dliminer asymptotiquement le biais mis en vidence la question prcdente. Expliquer son fonctionnement. 13 bi + 14, y i = 174xi 204v
(12) (12) (3)
9. Daprs les conclusions de lexercice, quel eet, revenu ou substitution, est dominant dans lchantillon? Proposer une autre forme pour le modle (16) qui permette de prendre en compte ces deux eets simultanment.
4.3
Soit un chantillon dobservations iid {(yi , xi ), i = 1, ..., N }, avec yi R, xi R. On suppose quil existe une variable di {1, ..., J }, inobserve, qui partitionne les individus en J groupes. La variable xi est la taille du pre de lindividu i et yi est sa propre taille. En rgressant yi y sur xi x le statisticien Galton a trouv un coecient infrieur un, phnomne quil a quali de rgression vers la moyenne. En ralit, il sagit dun artefact statistique quon va chercher comprendre. Soit z1 , ..., zJ R. On suppose vri le modle suivant: yi y = zdi + ui , xi x = zdi + vi , o ui et vi sont deux perturbations de moyennes nulle et de variances constantes non nulles conditionnellement di : E (ui |di ) = 0 et V (ui |di ) = 2 u, 2 E (vi |di ) = 0 et V (vi |di ) = v . 1. Calculer E (yi y |di = j ) et E (xi x|di = j ). 2. Interprtez zj . Quelle justication donner au fait que lon suppose que cest le mme zj qui apparat dans les deux quations? 3. Calculer lestimateur des MCO b b du coecient de la rgression sans constante de yi y sur xi x.
5. Les conomistes de la croissance ont souvent rgress le taux de croissance moyen du PIB (sur une priode donne) sur le PIB de dbut de priode: ln P IBi1 ln P IBi0 = a + b ln P IBi0 + ui pour un chantillon de pays i = 1, ..., N . Une estimation ngative du coecient b est souvent interprte comme le signe dune convergence vers un niveau de PIB commun. Montrer laide du modle prcdent quune telle interprtation peut tre fallacieuse.
14
5
5.1
Equations simultanes
Modle de Haavelmo
On considre le modle dquilibre gnral form des deux quations suivantes: c = y + + u, y = c + i, o y est la production, c la consommation et linvestissement i est considr comme exogne. 1. Interprter ces deux quations. 2. Exprimer les formes rduites de ce systme. 3. Calculer la limite en probabilit de b MCO , lestimateur de par les MCO.
4. Quelles remarques pouvez-vous faire sur lestimation des modles dquilibre gnral. Proposez une mthode destimation convergente des paramtres.
5.2
Ore et demande
On estime dans cet exercice un modle Ore/Demande. Soit : Si (pi , vi ) = + pi + vi , Di (pi , ui ) = a + bpi + ui . On suppose de plus que les rsidus suivent une loi normale bivarie dont les paramtres sont : E (ui ) = E (vi ) = 0, V (ui ) = 2 u ; V (vi ) = 2 v ; Cov (ui , vi ) = u v .
1. La loi conditionnelle vi |ui est normale. Calculer sa moyenne et sa variance. En dduire par symtrie la loi de ui |vi . 2. Calculer la loi marginale du prix dquilibre pi . 3. Calculer E (ui |pi ) et E (vi |pi ). 4. Vrier que : a + bpi + E (ui |pi ) = + pi + E (vi |pi )
15
5.3
Identication
1. Soit le systme dquations simulatanes : y1t = a1 + b1 y2t + c1 x1t + u1t y2t = a2 + b2 y1t + c2 x2t + u2t avec u1t et u2t corrls. (a) Ecrire les formes structurelle et rduite correspondantes. (b) Que veut dire : "les paramtres du modle sont identis." Donner la dnition. (c) A laide de la condition dordre, dire si les quations sont identiables. (d) Montrer laide de la forme rduite que les paramtres sont en eet identis. 2. Soit le modle : y1t = a1 + b1 y2t + c1 x1t + u1t y2t = a2 + c2 x1t + u2t
(a) La condition dordre reste-t-elle satisfaite pour chaque quation ? (b) Quels paramtres ou fonctions des paramtres sont identiables?
16