Regressao Linear Multipla
Regressao Linear Multipla
Regressao Linear Multipla
Uma Prova
Trabalhos semanais
Trabalho final: Cada aluno deverá
apresentar um seminário e um
trabalho escrito sobre aplicações de
técnicas da estatística multivariada em
sua tese.
Recursos computacionais
http://www.ufrrj.br/institutos/it/deng/varella/
multivariada.htm
Modelos Lineares
(revisão)
Y f X 1 , X 2 , , X p ,
Y representa a resposta;
X1,X2,..., Xp são as variáveis estudadas;
ε representa outro conjunto de variáveis não
consideradas no estudo;
Requisitos da função f
Y , ~ N , 2
Este modelo é definido como Modelo Linear de
Gauss-Markov-Normal.
A superfície de resposta
É a superfície gerada pelos valores da
variável de resposta. O modelo linear para
uma única variável de resposta ‘Y’ com ‘p’
variáveis preditoras é:
Yi 0 1 X 1i 2 X 2i p X pi ei
i 1,2 , , n.
Yi = superfície de resposta
n = número de observações;
p = número de variáveis preditoras.
O modelo linear é a chave do negócio, isto é,
tem inúmeras aplicações na estatística
multivariada.
Conseqüências da estimação
posto X ' X p 1
p é o número de variáveis preditoras
estudas no modelo.
Conseqüências da estimação
Y X é o modelo linear
O erro da modelagem
O erro do modelo na forma matricial é:
Y X
Modelo de regressão
Ŷi ˆ 0 ˆ 1 X 1i ˆ 2 X 2i ˆ p X pi , i 1,2, , n.
Z Y X
2
Minimização da função Z
Z Y X
2
Z Y X Y X
'
Diferenciando a função Z
Z Y ' Y 2 ' X ' Y ' X ' X
O beta chapéu
Assim é chamado o vetor estimador
dos parâmetros de beta.
O vetor beta chapéu é determinado
resolvendo-se o sistema de equações
normais:
X' X X' Y
ˆ 1
Conseqüências da estimação
O modelo que estamos estudando é o
Linear de Gauss-Markov-Normal.
Y X , ~ N , 2
Y X este é o erro do modelo
Conseqüências da estimação
Yi X1i X2i
1,5 0 0
6,5 1 2
10,0 1 4
11,0 2 2
11,5 2 4
16,5 3 6
Fonte: Apostila de INF 664 Modelos Lineares. Adair José Regazzi,UFV,
Viçosa, 2002.
Prática 1
1,5
6 ,5
1 1 1 1 1 1 57
10 ,0
X ' Y 0 1 1 2 2 3
111
11,0 220
0 2 4 2 4 6
11,5
16 ,5
Prática 1
B̂0 6 9 18 1 57 2
11 3
1
B̂ 9 19 36
18 36 76 220 1
B̂2
Posto da matriz
Determinante da matriz
Autovalores da matriz
Análise de Variância da
Regressão Linear
Análise de variância da
regressão linear
A análise de variância da regressão é a
estatística utilizada para testar os
regressores. A hipótese nula é que todos os
regressores são iguais e zero. Caso isso não
ocorra o resultado da análise é significativo,
isto é, rejeita-se a hipótese nula.
A análise de variância não testa o intercepto.
H 0 : 1 2 p 0
Algumas Pressuposições do
Modelo
Beta chapéu é um estimador não
tendencioso:
ˆ
A esperança do erro do modelo é zero e a
esperança da variância dos erros é
constante:
e V I 2
Variâncias e Covariâncias do Vetor
Estimador dos Parâmetros
O vetor estimador dos parâmetros é beta
chapéu:
A covariância deste vetor é:
ˆ ˆ ˆ
Cov ( ) [( ) ( ) ] (X' X)
' 1 2
ˆ
Cov( ) ( X ' X ) ˆ
1 2 ˆ
Cov( ) ( X ' X ) s
1 2
n 2
SQ Re s Yi Ŷi
i 1
i 1 n
SQTotal Y' Y c 1
c Y ' u u' Y
n
u é um vetor de 1’s de dimensão n x 1.
Soma de Quadrado da Regressão
n 2
SQ Re g Ŷi Y
i 1
ˆ 1
SQ Re g ' X ' Y Y ' u u' Y
n
Esquema da análise de variância
da regressão
Causa de
GL SQ QM F
variação
Regressão p ˆ ' X ' Y c SQReg/p QM Re g
QM Re s
Resíduo n-p-1 Y ' Y ˆ ' X ' Y SQRes/n-p-1
ˆ i i
t , associado a (n - p - 1) gl.
s( ˆ i )
H0 : c'
c’ é uma matriz com m linhas e p+1 colunas
c' [c 0 c1 c 2 c p ]
θ é um vetor m-dimensional de constantes
conhecidas.
1
2
m
Estatística F usada para testar a
hipótese H0:c’=θ
Estatística de Wald
Para teste F simultâneo dos parâmetros
ˆ
(C' )' [C' (X' X) C] (C' ˆ )
1 1
F(H 0 )
mˆ 2
Posto [c’]=m=2
2
0 1 0 3 ˆ 3 0 3
ˆ
c' 3 c'
0 0 1 1 1
1 0 1
Exemplo: testar a hipótese
H0:1=2=0
1 1 132 54
c' ( x ' x ) c
240 54 33
33 54
1 1
c' ( x ' x ) c
54
6 6
132
6 6
33 54
3
3 1 6 6
1 125,50
54 132
6 6
Exemplo: testar a hipótese
H0:1=2=0
y' y ˆ ' x ' y 3,00
ˆ s QMR
2 2
1,00
n p 1 6 2 1
125,50
F(H 0 ) 62,75 F1% (2 ; 3) 30,82
**
2 (1,00)
c' ˆ c'
t , associado a (n - p - 1) gl.
Vˆ (c' ˆ )
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Parameter Standard
Variable Label DF Estimate Error t Value Pr > |t|
1 0 -16.4019 16.4019
2 0 -3.4152 3.4152
3 0 19.8021 -19.8021
4 30.0000 30.9970 -0.9970
5 30.0000 68.5033 -38.5033
6 30.0000 47.8805 -17.8805
7 60.0000 67.1267 -7.1267
8 60.0000 99.6748 -39.6748
9 60.0000 61.1820 -1.1820
10 90.0000 68.4044 21.5956
11 90.0000 65.1605 24.8395
12 90.0000 78.0660 11.9340
13 120.0000 97.4010 22.5990
14 120.0000 116.5953 3.4047
15 120.0000 99.0235 20.9765
Y X1 X2
1,5 0 0
6,5 1 2
10 1 4
11 2 2
11,5 2 4
16,5 3 6
Programa SAS
Resumo do Stepwise
Valores preditos
Regressão entre predito e
observado
Validação da predição