Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Felipe Galvao Do o

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 11

FELIPE GALVAO DO O ----- 201951251581

LISTA 3 - TRABALHO METODOS PREDITIVOS

1) A partir de informações sobre gastos mensais com alimentação (Y, em R$ 1.000),


renda mensal (X1, em R$ 1.000) e distância ao supermercado (X2, em km) de doze
famílias.

y x1 x2
0,41 1 2
0,21 2 3
0,32 2 3
0,6 3 2
0,7 4 2
0,8 4 3
0,81 3 2
0,9 4 4
0,95 5 4
0,98 5 3
0,81 4 3
0,92 5 4

a) Faça um modelo de regressão linear e apresente a equação estimada.


b) Interprete os coeficientes da regressão em (a).
c) Analise os outputs do modelo (R2 , estatística F e estatísticas t).
d) Analise os pressupostos do modelo de regressão utilizando o software Gretl.
Interprete as hipóteses e os resultados dos testes realizados.\

Modelo 1: MQO, usando as observações 1-12


Variável dependente: y

Coeficiente Erro Padrão razão-t p-valor


const 0.154953 0.146067 1.061 0.3164
x1 0.190935 0.0349108 5.469 0.0004 ***
x2 −0.0419626 0.0578612 −0.7252 0.4867

Média var. dependente 0.700833 D.P. var. dependente 0.259736


Soma resíd. quadrados 0.141406 E.P. da regressão 0.125346
R-quadrado 0.809450 R-quadrado ajustado 0.767105
F(2, 9) 19.11584 P-valor(F) 0.000575
Log da verossimilhança 9.618915 Critério de Akaike −13.23783
Critério de Schwarz −11.78311 Critério Hannan-Quinn −13.77642
A)

Y = 0,1549 + 0,190*X1 - 0,041*X2

B)

A variável x1 possui influencia positiva, já a variável x2 possui influencia negativa para


explicar o comportamento dos gastos mensais com alimentação.
• Para cada aumento 1.000 reais na renda mensal, os gastos com alimentação
aumenta em 1.909 reais
• Para cada aumento de 1km na distancia ao supermercado, os gastos com
alimentação diminuem em 41,96 reais
• Já se as variáveis forem 0, o gasto médio mensal seria de 154 reais

C)

R2 = 80,94% ou seja, 80,94% de y é explicado pelas variáveis x.

TESTE F

H0: b1=b2=0
H1: existe pelo menos 1 coef ang diferente de 0

P-valor = (0,00057<0,05), então há evidencia p/ rejeição ho. Portanto, o modelo é


significativo.

TESTE T

H0: B0 = 0
H1: B0 dif de 0

P-valor (0,3164>0,05), não rejeita ho, portanto não podemos afirmar que o coef linear
é significativo.

H0: b1 = 0
H1: b1 dif 0

P- valor (0,00039<0,05), Entao rejeita ho, portanto o coef angular x1 é significativo.


H0: b2 = 0
H1: b2 dif 0

P valor (0,4867>0,05), Entao não rejeita ho, portanto não podemos afirmar que coef
angular x2 é significativo.

D)
Distribuição de frequência para residual, observações 1-12
número de classes = 5, média = -3.70074e-17, desvio padrão = 0.125346

intervalo pt. médio frequência rel. acum.

< -0.15505 -0.20093 1 8.33% 8.33% ***


-0.15505 - -0.063271 -0.10916 2 16.67% 25.00% ******
-0.063271 - 0.028505 -0.017383 6 50.00% 75.00% ******************
0.028505 - 0.12028 0.074393 0 0.00% 75.00%
>= 0.12028 0.16617 3 25.00% 100.00% *********

Teste para a hipótese nula de distribuição normal:


Qui-quadrado(2) = 0.123 com p-valor 0.94053

Normalidade dos resíduos

H0: os resíduos seguem uma distribuição normal


H1: os resíduo não seguem uma distribuição normal
Como o p-valor (0,94053) > 0,05, não rejeita a ho. Portanto, os resíduos seguem uma
dist normal.

Teste de White para a heteroscedasticidade


MQO, usando as observações 1-12
Variável dependente: uhat^2

coeficiente erro padrão razão-t p-valor


--------------------------------------------------------
const 0.0682962 0.0626430 1.090 0.3174
x1 0.0137859 0.0166190 0.8295 0.4386
x2 −0.0550924 0.0457527 −1.204 0.2739
sq_x1 0.00300843 0.00428474 0.7021 0.5089
X2_X3 −0.0146777 0.0103431 −1.419 0.2057
sq_x2 0.0189459 0.0117115 1.618 0.1569

R-quadrado não-ajustado = 0.587328

Estatística de teste: TR^2 = 7.047930,


com p-valor = P(Qui-quadrado(5) > 7.047930) = 0.217100

Heterocedasticidade
H0: Ausencia de heterocedasticidade ( resíduos são homocedasticos)
H1: Presenca de heterocedasticidade (resíduos são heterocedasticos)

Como o p-valor (0,2171)>0,05, Não rejeita h0. Portanto, os resíduos são


homocedasticos.

Fatores de Inflacionamento da Variância (VIF)


Valor mínimo possível = 1,0
Valores > 10,0 podem indicar um problema de colinearidade

x1 1.474
x2 1.474

VIF(j) = 1/(1 - R(j)^2), onde R(j) é o coeficiente de correlação múltipla


entre a variável j e a outra variável independente

Diagnósticos de colinearidade de Belsley-Kuh-Welsch:

proporções de variância

lambda cond const x1 x2


2.912 1.000 0.007 0.009 0.005
0.060 6.979 0.408 0.760 0.012
0.028 10.143 0.585 0.231 0.983

lambda = Autovalores inversa da matriz de covariância (smallest is 0.028305)


cond = índice de condição
nota: as colunas de proporção da variância somam 1

De acordo com BKW, cond >= 30 indica uma quase dependência linear "forte", e
cond
entre 10 e 30 indica que é "moderadamente forte". Estimativas de parâmetros
cuja
variância está principalmente associada a valores problemáticos de cond podem
ser
consideradas problemáticas.

Quantidade de índices de condição >= 30: 0

Quantidade de índices de condição >= 10: 1


Proporções de variância >= 0,5 associadas com cond >=10:

const x2
0.585 0.983

Multicolinearidade (VIF)

Como o VIF das variáveis (1,4740) é inferior a 10, indica ausência de


multicolinearidade.
Modelo 2: MQO, usando as observações 1-12
Variável dependente: uhat1

Coeficiente Erro Padrão razão-t p-valor


const 0.00000 0.146067 −8.420e-15 1.0000
x1 0.00000 0.0349108 1.436e-15 1.0000
x2 0.00000 0.0578612 6.029e-15 1.0000

Média var. dependente 0.000000 D.P. var. dependente 0.113380


Soma resíd. quadrados 0.141406 E.P. da regressão 0.125346
R-quadrado 0.000000 R-quadrado ajustado -0.222222
F(2, 9) 0.000000 P-valor(F) 1.000000
Log da verossimilhança 9.618915 Critério de Akaike −13.23783
Critério de Schwarz −11.78311 Critério Hannan-Quinn −13.77642

As Variáveis explicativas não são correlacionadas com os resíduos.


2) A tabela a seguir, apresenta informações de faturamento (y), investimentos (x1) e
horas-máquina (x2) coletados pela Empresa ABC, entre janeiro/2018 a julho/2019.
Assim, realize uma análise de regressão linear múltipla para explicar o comportamento
de y em função de x1 e x2.

Horas
Faturamento Investimento Máquina
Período Meses
(y) (x1) (HM)
(x2)

jan/18 1 115.121 2.650 46


fev/18 2 111.834 2.730 33
mar/18 3 121.378 2.451 59
abr/18 4 92.999 1.510 60
mai/18 5 109.330 2.075 59
jun/18 6 131.614 2.936 62
jul/18 7 117.688 2.342 72
ago/18 8 105.951 2.196 51
set/18 9 95.186 2.318 38
out/18 10 84.096 1.679 44
nov/18 11 101.169 2.073 53
dez/18 12 108.153 1.980 71
jan/19 13 102.800 1.896 74
fev/19 14 103.619 2.016 44
mar/19 15 128.325 2.705 72
abr/19 16 87.296 1.533 57
mai/19 17 93.653 2.365 33
jun/19 18 121.078 2.699 45
jul/19 19 123.032 2.700 44

Com base nas informações, responda as seguintes perguntas (adote nível de


significância α=0,05):
a. Expresse a equação estimada do modelo de regressão múltipla e apresente os
outputs do Gretl.
b. Analise os outputs do modelo (R2 , R2 ajustado, estatística F e estatísticas t).
c. Análise a significância dos coeficientes estimados. Quais variáveis foram
significativas? Interprete os coeficientes.
d. Analise todos os pressupostos do modelo de regressão (apresente todos os outputs
do software Gretl). Indique as hipóteses (nula e alternativa) dos testes, bem como
interprete os resultados.
Modelo 3: MQO, usando as observações 1-19
Variável dependente: Faturamentoy

Coeficiente Erro Padrão razão-t p-valor


const 13931.8 7848.22 1.775 0.0949 *
Investimentox 29.9420 2.50641 11.95 <0.0001 ***
HorasMAquinaH 498.015 81.2780 6.127 <0.0001 ***
Mx

Média var. dependente 108122.2 D.P. var. dependente 13743.04


Soma resíd. quadrados 3.13e+08 E.P. da regressão 4425.963
R-quadrado 0.907807 R-quadrado ajustado 0.896283
F(2, 16) 78.77464 P-valor(F) 5.22e-09
Log da verossimilhança −184.8369 Critério de Akaike 375.6737
Critério de Schwarz 378.5071 Critério Hannan-Quinn 376.1533

A)

Y = 13.931,8 + 29,94*X1 + 498,01*X2

B)

As variáveis x1 e x2 tem influencia positiva para explicar o comportamento do


faturamento.

• Para cada aumento de 1 real em investimento há um aumento de 29,94 reais


no faturamento
• Para cada aumento de 1 hora de maquina, há um aumento de 498,01 reais no
faturamento
• Já se as variáveis forem 0, o faturamento médio é de 13.931,82 reais.

C)

R2 = 90,78% ou seja , 90,78% de y é explicado pelas variáveis.


TESTE F

H0: b1=b2=0
H1: existe pelo menos 1 coef ang diferente de 0

P-valor = (0,000...<0,05), então há evidencia p/ rejeição ho. Portanto, o modelo é


significativo.

TESTE T

H0: b0 = 0
H1: b0 dif 0

P valor (0,09489 > 0,05), Então, não rejeita ho, portanto não podemos afirmar que
coef linear é significativo.

H0: b1 = 0
H1: b1 dif 0

P- valor (0,000 ... < 0,05), Então rejeita ho, portanto o coef angular x1 é significativo.

H0: b2 = 0
H1: b2 dif 0

P- valor (0,000 ... < 0,05), Então rejeita ho, portanto o coef angular x1 é significativo.
D)

Distribuição de frequência para residual, observações 1-19


número de classes = 7, média = 6.89301e-12, desvio padrão = 4425.96

intervalo pt. médio frequência rel. acum.

< -6281.4 -7526.2 2 10.53% 10.53% ***


-6281.4 - -3791.8 -5036.6 1 5.26% 15.79% *
-3791.8 - -1302.2 -2547.0 3 15.79% 31.58% *****
-1302.2 - 1187.4 -57.436 7 36.84% 68.42% *************
1187.4 - 3677.0 2432.2 0 0.00% 68.42%
3677.0 - 6166.6 4921.8 4 21.05% 89.47% *******
>= 6166.6 7411.4 2 10.53% 100.00% ***

Teste para a hipótese nula de distribuição normal:


Qui-quadrado(2) = 0.012 com p-valor 0.99402

Normalidade dos resíduos

H0: os resíduos seguem uma distribuição normal


H1: os resíduo não seguem uma distribuição normal
Como o p-valor (0,99402) > 0,05, não rejeita a ho. Portanto, os resíduos seguem uma
dist normal.

Teste de White para a heteroscedasticidade


MQO, usando as observações 1-19
Variável dependente: uhat^2

coeficiente erro padrão razão-t p-valor


------------------------------------------------------------------------
const 6.50443e+07 2.47131e+08 0.2632 0.7965
Investimentox 101044 134872 0.7492 0.4671
HorasMAquinaHMx −4.88740e+06 4.84533e+06 −1.009 0.3315
sq_Investimentox −30.8187 26.2872 −1.172 0.2621
X2_X3 538.963 1074.50 0.5016 0.6243
sq_HorasMAquinaH~ 27312.7 31125.0 0.8775 0.3961

R-quadrado não-ajustado = 0.342436

Estatística de teste: TR^2 = 6.506285,


com p-valor = P(Qui-quadrado(5) > 6.506285) = 0.260022

Heterocedasticidade

H0: Ausencia de heterocedasticidade ( resíduos são homocedasticos)


H1: Presenca de heterocedasticidade (resíduos são heterocedasticos)

Como o p-valor (0,260022)>0,05, Não rejeita h0. Portanto, os resíduos são


homocedasticos
Fatores de Inflacionamento da Variância (VIF)
Valor mínimo possível = 1,0
Valores > 10,0 podem indicar um problema de colinearidade

Investimentox 1.040
HorasMAquinaHMx 1.040

VIF(j) = 1/(1 - R(j)^2), onde R(j) é o coeficiente de correlação múltipla


entre a variável j e a outra variável independente

Diagnósticos de colinearidade de Belsley-Kuh-Welsch:

proporções de variância

lambda cond const Investim~ HorasMAq~


2.937 1.000 0.002 0.004 0.006
0.052 7.496 0.005 0.241 0.573
0.011 16.411 0.993 0.755 0.421

lambda = Autovalores inversa da matriz de covariância (smallest is


0.0109045)
cond = índice de condição
nota: as colunas de proporção da variância somam 1

De acordo com BKW, cond >= 30 indica uma quase dependência linear "forte", e
cond
entre 10 e 30 indica que é "moderadamente forte". Estimativas de parâmetros
cuja
variância está principalmente associada a valores problemáticos de cond podem
ser
consideradas problemáticas.

Quantidade de índices de condição >= 30: 0

Quantidade de índices de condição >= 10: 1


Proporções de variância >= 0,5 associadas com cond >=10:

const Investim~
0.993 0.755

Multicolinearidade (VIF)

Como o VIF das variáveis (1,040) é inferior a 10, indica ausência de multicolinearidade.
Modelo 2: MQO, usando as observações 1-19
Variável dependente: uhat1

Coeficiente Erro Padrão razão-t p-valor


const −4.07210e- 7848.22 −5.189e-14 1.0000
10
Investimentox 1.20342e-13 2.50641 4.801e-14 1.0000
HorasMAquinaH 2.66550e-12 81.2780 3.279e-14 1.0000
Mx

Média var. dependente 6.70e-12 D.P. var. dependente 4172.838


Soma resíd. quadrados 3.13e+08 E.P. da regressão 4425.963
R-quadrado 0.000000 R-quadrado ajustado -0.125000
F(2, 16) 0.000000 P-valor(F) 1.000000
Log da verossimilhança −184.8369 Critério de Akaike 375.6737
Critério de Schwarz 378.5071 Critério Hannan-Quinn 376.1533

As Variáveis explicativas não são correlacionadas com os resíduos.

Você também pode gostar