Econometrie
Econometrie
Econometrie
FACULTATEA DE MANAGEMENT
PROIECT ECONOMETRIE
STUDENT:
Mocanu Ion
Grupa 131, Seria B
Profesor coordonator:
Cristache Silvia-Elena
Bucureti
-2015-
Cuprins
Problema A
nregistrai pentru perioada 2001-2013, valorile specifice ale unei perechi de caracteristici
(X i Y) ntre care exist o legtur logic. Datele prezentate sub forma tabelar fac parte din
lucrare.
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile, conform
teoriei economice); cu sursele bibliografice inserate in text ca note de subsol si cu un stadiul
cunoasterii de o pagina despre domeniul ales.
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
2.2- Reprezentarea grafic a modelului legturii dintre variabile
3. Estimarea parametrilor modelului i interpretarea acestora
3.1- Estimarea punctual a parametrilor
3.2- Estimarea parametrilor prin interval de ncredere
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1- Testarea semnificaiei corelaiei
4.2- Testarea parametrilor unui model de regresie simplu
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie simplu i
interpretarea rezultatelor
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
6.2- Testarea liniaritii modelului propus
6.3- Testarea normalitii erorilor
6.4- Testarea ipotezei de homoscedasticitate
6.5- Testarea ipotezei de autocorelare a erorilor
7.
Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare
nregistrat (inclusiv interval de ncredere) pentru toate variantele cunoscute.
Rezolvarea problemei A de exemplificat att n Excel si apoi in Word trecute toate rezultatele cu
indicatori, relatii de calcul, interpretare.
Problema B
1. Definirea modelului de regresie multipl liniar
1.1- Forma, variabilele, parametrii modelului de regresie multipl
1.2 -Reprezentarea grafic a modelului legturii dintre variabile
2. Estimarea parametrilor modelului i interpretarea acestora
2.1- Estimare punctual a parametrilor
2.2- Estimarea parametrilor prin interval de ncredere
3. Testarea semnificaiei corelaiei i a parametrilor regresiei modelului de regresie multipl
3.1- Testarea semnificaiei corelaiei multipl
3.2- Testarea parametrilor modelului de regresie multipl
4.
Date
1.
x
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
x
64
66
68
68
77
85
97
108
107
101
13733
18228
20119
20593
21716
22019
27734
28535
29369
31668
y
1196
1593
1994
2510
2789
3078
3575
4389
4304
4445
2011
2012
2013
99
96
93
30549
36932
32523
4727
4911
5016
y - Castigul salarial nominal mediu brut lunar din domeniul intermedierilor financiare (variabila dependenta)
x - Numarul mediu al salariatilor care se ocupa de intermedieri financiare (variabila independenta)
x - Numarul absolventilor liceelor economice si administrative (varaibila independenta)
In sens larg, intermedierea financiara este procesul prin care fondurile atrase de la cei care
economisesc sunt puse la dispozitia celor care au nevoie de fonduri pentru diferite tipuri de
investitii (de exemplu: companii care doresc sa cumpere utilaje si echipamente, un fermier care
vrea sa cumpere mai mult pamant, un guvern care doreste sa finanteze constructia de drumuri).
Cei care economisesc sunt persoane fizice sau juridice care, in anumite perioade de timp,
cheltuiesc mai putini bani decat primesc/incaseaza. Fondurile economisite pot fi disponibile pe
termen scurt, mediu si lung. In acelasi timp, exista persoane, firme, organizatii care intr-o
anumita perioada sunt nevoite sa cheltuiasca mai mult decat incaseaza in mod normal
(inregistrand un deficit de fonduri).
Cod CAEN : 64
In aceasta categorie sunt incluse:
1. activitatea de obtinere si redistribuire a fondurilor, altele decat In scopul asigurarilor, sau
al asigurarii fondului de pensii sau al asigurarilor sociale de stat
2. intermedieri monetare ale institutiilor monetare, altele decat banca nationala (activitati
bancare), inclusiv activitatile bancilor de stabilire a scontului. Tot In aceasta clasa se
includ si activitatile caselor de economii, precum si ale institutiilor specializate pentru
acordarea creditelor pentru locuinte, care accepta depuneri (detin depozite).
3. creditul pe baza de contract (leasing financiar). Termenul acopera durata de functionare
pentru un bun, timp In care contractantul beneficiaza de toate avantajele oferite de
utilizarea acestuia, asumadu-si toate riscurile de proprietate. Bunurile pot fi sau nu
transferate.
4. intermedieri financiare, In principal legate de cei care fac Imprumuturi cu institutii
neimplicate In intermedieri monetare, inclusiv acordarea de credite pentru consum si cu
termen lung, pentru finantarea activitatilor economice, precum si Imprumuturile de bani
acordate In afara sistemului bancar. Se include In aceasta clasa si acordarea de credite
pentru cumpararea de locuinte de catre institutii specializate care nu percep depuneri,
precum si cooperativele de credit si CAR.
5. alte servicii de intermedieri financiare care sunt legate In principal de distribuirea
fondurilor, altele decat cele care fac obiectul Imprumuturilor, cum sunt: serviciile
companiilor de investitii, serviciile pentru distribuirea fondurilor de investitii pentru micii
proprietari, serviciile de mediere neincluse In alte categorii.
6. activitatile de gestionare si supervizare a pietelor financiare, altele decat cele realizate de
institutiile publice si activitatile bursei de valori si ale altor institutii care reglementeaza
sau supervizeaza activitatile pietelor financiare, inclusiv activitatile burselor de comert de
marfuri.
Salariul reprezinta pretul pietei fortei de munca si se formeaza in urma confruntarii cererii cu
oferta de forta de munca. Salariul reprezinta suma de bani primita de un salariat pentru munca
depusa. In situatia in care cererea de forta de munca este egala cu oferta de forta de munca,apare
salariul de echilibru(ca si pe piata bunurilor si a serviciilor,unde apare pretul de echilibru).In
situatia in care cererea de forta de munca se mareste,salariul creste.
Oferta de munc se msoar, de regul, prin numrul persoanelor apte de munc i care doresc s
munceasc, indiferent dac au sau caut un loc de munc. Aceasta mai este cunoscut sub
denumirea de for de munc sau populaie activ (disponibil).
Populaie total = Populaie apt + Populaie inapt
Populaie apt = Populaie activ + Populaie apt inactiv
Populaie activ = Populaie ocupat + omeri
Populaia inapt este format din persoane care nu au vrsta legal pentru a desfura o
activitate salariat i din persoane care, dei au vrsta legal, nu pot munci datorit unor
dizabiliti fizice i/sau psihice. Populaia apt inactiv cuprinde femei casnice, militari n
termen, elevi i studeni, precum i persoane care pot munci, dar nu o fac deoarece au alte
venituri dect cele provenind din munc (din nchirierea locuinelor, moteniri etc.). Populaia
activ cuprinde persoane care au sau caut un loc de munc, iar populaia ocupat este format
din persoane care au un loc de munc.
Absolventilor de liceu se incadreaza in populatia apta inactiva sau populatia activa depinde de
alegerea fiecarui absolvent in parte.
2.
2.1 Legaturile care exista intre doua variabile statistice pot fi studiate folosind doua tehnici:
regresia si corelatia. Exista trei scopuri principale, atunci cand analizam legaturile dintre
variabile statistice:
-
Definim modelul unifactorial de regresie printr-o relatie matematica construita pe baza teoriei
economice, care presupune ca fenomenul economic Y (fenomenul efect) este rezultatul actiunii a
doua categorii de factori:
(x, y) reprezinta valorile numerice ale variabilelor cauza (X) si efect (Y), inregistrate la
nivelul unitatii statistice i;
si reprezinta parametrii ecuatiei de regresie
reprezinta punctul de intersectie al dreptei de regresie cu axa Oy;
reprezinta panta dreptei, se mai numeste si coeficient de regresie si arata cu cate
unitati de masura se modifica Y daca X se modifica cu o unitate de masura;
reprezinta componenta reziduala (eroare aleatoare) pentru unitatea statistica i.
Y- variabila dependenta
X- variabila independenta
Castigul mediu(y)
Linear (Castigul
mediu(y))
Linear (Castigul
mediu(y))
2000
1000
0
60
80
100
120
Din corelograma se observa c legatura dintre castigul salarial nominal mediu brut lunar din
domeniul intermedierilor financiare i numarul mediu al salariatilor care se ocupa de intermedieri
financiare este una directa si puternica.
3.
TOTAL
=-2924.8 +
73.118x
xy
64
1196
4096
76544
1754.752
66
1593
4356
105138
1900.988
68
1994
4624
135592
2047.224
68
2510
4624
170680
2047.224
77
2789
5929
214753
2705.286
85
3078
7225
261630
3290.23
97
3575
9409
346775
4167.646
108
4389
11664
474012
4971.944
107
4304
11449
460528
4898.826
101
4445
10201
448945
4460.118
99
4727
9801
467973
4313.882
96
4911
9216
471456
4094.528
93
112
9
5016
8649
466488
3875.174
44527
101243
4100514
44527.822
Am realizat toate acele calcule din tabelul de mai sus pentru a realiza estimarea punctuala a
parametrilor prin intermediul M.C.M.M.P.
||
||
||
||
y x
i=1
n
b^=
i=1
n
n x y
y x
i=1
i=1
n
i=1
=2924.833
x xn y
i=1 n i=1 x
b^ =
=73.117
1
n x
i=1
i=1
n n
xx
i=1
n
i=1
x x
i=1
i=1
(y-)
(x-x
312203.7 521
975
94856.60 434
814
2832.794 355
176
214161.6 355
262
7008.033 96.9
796
45041.57 3.40
29
351229.2 103
813
339823.7 447
071
353817.9 406
703
228.5539 200
24
170666.4 147
819
666626.5 83.7
268
1301483. 37.8
962
3859980. 319
916
Coeficientul de corelatie liniara simpla arata ca intre salariul mediu si castigul mediu exista o
legatura directa puternica .
Etapa 1
Etapa 2
Etapa 3
H: r=0
H: r0
Folosim testul t student
tcritic=t(,n-k1)=2,201
Am ales t=2.201 din tabelul repartitiei Student pentru un prag de semnificatie = 0.05 si n-k-1=11
grade de libertate.
Deoarece testul a aratat ca avem un coeficient de corelatie semnificativ, rezulta ca acesta descrie
corect intensitatea legaturii dintre variabile.
4.2 Testarea parametrilor unui model de regresie simplu
Deoarece ambii parametrii sunt semnificativi din punct de vedere statistic, rezulta ca avem un
argument in favoarea folosirii modelului de regresie in previzionarea valorii castigului mediu.
regresie simplu i
Multiple R=0.903 arata ca intre salariul mediu si castigul mediu exista o legatura directa
puternica.
R square=0.8156 ne arata ca 81.56% din variatia variabilei y este explicata de variabila
independeta x.
Pentru a verifica daca un model de regresie este valid si poate folosit se foloseste analiza de
varianta(ANOVA). Pentru ca modelul sa conduca la reconstruirea valorilor empirice prin valorile
teoretice, se foloseste testul F. In cazul nostru, valoarea calculate este 48.65 este semnificativa,
deci modelul este validat ca fiind acceptabil.
6.
Etapa 6 Reprezinta luarea decizei : Fcalc> F critic Rezulta ca R este diferit de 0(este
semnificativ statistic), asadar putem spune cu o probabilitate de 95% ca modelul descrie corect
dependenta dintre salariul mediu si castigul mediu.
Asadar ipoteza liniaritatii este acceptata.
Avand in vedere rezultatul testului Durbin Watson=0.403 putem spune ca erorile sunt
autocorelate pozitiv.
7.
Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare
nregistrat (inclusiv interval de ncredere) pentru toate variantele cunoscute.
Dupa estimarea valorii variabilei dependente daca valoarea variabilei independete creste cu 10%
am stabilit un interval de incredere [3155.92;5954.42]
Problema B
1. Definirea modelului de regresie multipl liniar
1.1- Forma, variabilele, parametrii modelului de regresie multipl
1.2 -Reprezentarea grafic a modelului legturii dintre variabile
Metoda regresiei multiple este generalizat prin teoria modelului liniar general, n care se
permit mai multe variabile dependente simultan i, de asemenea, variabile factoriale care nu sunt
independente liniar.
1.1- Forma, variabilele, parametrii modelului de regresie multipl
Clasa modelelor liniare poate fi exprimat prin y = x + unde
y este variabila dependent (explicat, endogen, rezultativ),
x este vectorul variabilelor independente (explicative, exogene), de dimensiune 1p,
este vectorul coeficienilor, de dimensiune p1, parametrii modelului,
este o variabil, interpretat ca eroare (perturbare, eroare de msurare etc.).
Cu alte cuvinte, y = x+x++x+ care exprim relaia liniar dintre y i x.
Observaii.
Liniaritatea relaiei se refer la coeficieni i nu la variabile. Astfel, modelul
y=ax+a(x) +a1/(x)+
este tot un model liniar.
2. Considernd c x este constant egal cu 1, se obine un model liniar care include un termen
constant (termenul liber al modelului).
3. Pentru p = 2 i x 1 se obine modelul liniar simplu, dreapta de regresie.
4. Utilitatea principal a unui model liniar este aceea a prediciei valorii lui y din valorile
cunoscute ale variabilelor x. Presupunem c avem un set de n observaii efectuate asupra
variabilelor implicate n model. Prin urmare dispunem de (x, x, . . . . , xp, y), i = 1, 2, . . . , n.
Notnd cu y vectorul de tip n1 avnd drept componente valorile msurate pentru variabila y, cu
X matricea (xij)np a valorilor msurate pentru variabilele x i cu vectorul de tip n1 avnd
drept componente valorile erorilor, modelul se rescrie n relaia matriceal: y = X +
Aspecte cheie n fundamentarea regresiei multiple
(1) n cazul regresiei simple, linia de regresie "cauta" cea mai buna traiectorie pentru a minimiza
eroarea de estimare. Aceasta este definita printr-o metoda care asigura cea mai mica suma a
patratelor distantelor dintre variabila "predictor" si variabila "criteriu". n mod natural, acest
deziderat este asigurat de marimea coeficientului de corelatie Pearson dintre cele doua variabile.
Cu ct corelatia este mai mare, cu att norul de puncte se apropie mai mult de linia de regresie, la
limita, pentru o corelatie de 1, punctele respective se plaseaza chiar pe dreapta de regresie.
(2) Un alt aspect important contextul regresiei multiple este multicoliniaritatea. Acesta este un
concep opus ortogonalitatii si exprima nivelul corelatiei dintre variabilele independente.
Informatia mpartasita n comun de variabilele independente reduce contributia lor la explicarea
variatiei variabilei dependente. Cu alte cuvinte, cu ct acestea coreleaza mai intens ntre ele cu
att corelatia multipla cu variabila dependenta (criteriu) este mai mica. n plus,
multicoliniaritatea amplifica variabilitatea coeficientilor de regresie, fapt care are ca efect o
imprecizie mai mare a predictiei. Din acest motiv, analiza de regresie trebuie precedata de
evaluarea multicoliniaritatii.
3) O importanta deosebita prezinta alegerea modelului de analiza care sa permita selectarea unui
set de predictori avnd maximum de putere de predictie asupra variabilei criteriu. Scopul nu este
acela de a aduna informatie de la toate variabilele disponibile ci doar de la acelea care aduc
contributia cea mai consistenta. O prima recomandare, cu caracter preliminar, este aceea de a
avea n vedere un anumit raport ntre numarul de subiecti si numarul variabilelor independente.
Acest raport este cifrat la valoarea 15/1, adica pentru un esantion de 150 de subiecti se poate
miza pe cel mult 10 variabile independente.
1.2 Reprezentarea grafica a modelului legaturii dintre variabile
Castigul mediu(y)
Linear (Castigul
mediu(y))
2000
Linear (Castigul
mediu(y))
1000
0
60 70 80 90 100 110 120
Numar mediu de salariati
4000
Castigul mediu(y)
Castigul mediu
3000
2000
1000
0
10000 20000 30000 40000
Numarul de absolveni
Din corelograma se observa c legatura dintre castigul salarial nominal mediu brut lunar din
domeniul intermedierilor financiare si numarul absolventilor liceelor economice si
administrative este una directa si puternica.
2. Estimarea parametrilor modelului i interpretarea acestora
2.1- Estimare punctual a parametrilor
2.2- Estimarea parametrilor prin interval de ncredere
Am realizat tabelul de mai sus pentru a afla prin M.C.M.M.P coeficientii ecuatiei de regresie
multipla.
b1 reprezinta valoarea(23.85) cu care creste castigul mediu daca numarul de salariati creste cu o
unitate.
b2 reprezinta valoarea(0.1405) cu care creste castigul mediu daca numarul de absolventi creste cu o
unitate.
Intrucat testul F calculate este mai mare decat F critic se respinge ipoteza nula si se accepta
ipoteza alternativa, asadar R este semnificativ statistic.
3.2- Testarea parametrilor modelului de regresie multipl
Deoarece toti cei 3 parametrii sunt semnificativi din punct de vedere statistic, rezulta ca avem un
argument in favoarea folosirii modelului de regresie in previzionarea valorii castigului mediu.
4. Aplicarea analizei de tip ANOVA pentru validitatea modelului de
interpretarea rezultatelor
regresie multipl i
Deoarece valorile absolute ale variabilei reziduale u sunt mai mici decat valoarea
calculata, vom accepta ipoteza de normalitate a valorilor variabilei reziduale.
5.4 Testarea ipotezei de homoscedasticitate
Pentru testarea homoscedasticitatii vom folosi Testul White
H0: 1 =2 =3=4=5=6= 0
(nu exist heteroscedasticitate, ci exist
homoscedasticitate)
H1: ( ) i0, i=1,2 (exist heteroscedasticitate)
Pentru a aplica testul White se construieste o regresie auxiliara:
Regiunea critica
Calcularea testului
si luarea decizei
Deoarece testul W are valoarea 6.353 respingem ipoteza nula si acceptam ipoteza
alternativa, adica erorile sunt heteroscedastice.
sau
Interpretare: Pentru o probabilitate de 95% avem suficiente dovezi pentru a afirma ca intre mediile celor
doua populatii exista diferente semnificative statistic
Bibliografie
Sursele de unde sunt luate datele statistice, teoria privind regresia si teoria
economica:
Y (4.9) 2001-2006 ASR - 2007 pag 242
2007-2008 ASR 2009 pag 298
2009-2010 ASR 2011 pag 148
2011-2012 ASR 2013 pag 164
2013 ASR 2014 pag 176
X1 (3.11) 2001-2006 ASR - 2007 pag 132
2007-2008 ASR 2009 pag 136
2009-2010 ASR 2011 pag 104
2011-2012 ASR 2013 pag 110
2013 ASR 2014 pag 120
* Teorie i practic econometric; Virgil Voineagu, Emilia ian, Radu erban; Editura
Meteor Press; capitolul 4, pag 165,166
http://www.scrigroup.com/finante/INTERMEDIEREA-FINANCIARA94454.php
http://www.rocaen.ro/codul-caen/intermedieri-financiare/
https://lectiadeeconomie.ro/index.php/piata-muncii
http://econb.ro/site/16.Piata%20fortei%20de%20munca.htm
http://www.revistadestatistica.ro/wp-content/uploads/2014/02/RRS_01_2013_a2_ro.pdf