Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

PRO3200 - 2024.2 - Aulas 21 e 22 - Análise de Regressão Simples

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 61

PRO 3200 - Estatı́stica

Regressão Simples

Lucas L. Oliveira e Profas. Linda Lee Ho e Celma de Oliveira Ribeiro


2024

Departmento de Engenharia de Produção


Universidade de São Paulo

1
Outline

Introdução

Modelo de regressão simples

Estimando os parâmetros da regressão simples

Decomposição dos desvios

Distribuições amostrais dos estimadores dos parâmetros

IC para uma média e uma futura observação

Coeficiente de correlação

Análise dos resı́duos

Regressão não linear - transformação linear

2
Introdução
Introdução

Em muitas situações coletamos da mesma unidade amostral duas variáveis


quantitativas: X e Y . Uma delas é a variável de interesse, geralmente denotada por Y
e uma variável auxiliar denotada por X

Sujeito 1 2 ... n
X X1 X2 ... Xn
Y Y1 Y2 ... Yn

E quer propor um modelo que relacione Y com X. Algumas perguntas que surgem:
Que tipo de modelo devemos ajustar?

• Linear?
• Quadrático?
• Cúbico?
• Exponencial?
• ...

3
Regressão simples

Para explorar este assunto, considere um


exemplo que quer determinar a altura a
partir do peso de pessoas. Os dados
coletados estão na tabela abaixo.
Pessoa Altura (cm) Peso (kg)
1 174 73
2 161 66
3 170 70
4 180 94
5 182 79
6 164 72
7 156 62
8 168 72
9 176 90
10 175 80
Um modo naive para começar é fazer o
gráfico de dispersão entre as duas variáveis
para identificar como elas estão
relacionadas

4
Modelo de regressão simples
Regressão Simples

Identificada uma possı́vel relação linear, vamos listar as suposições consideradas:


• Modelo linear descrito por:

yi = β0 + β1 xi + ei ,

• ei ∼ N(0, σ 2 ), condição de homocedasticidade e E (Y |x) = β0 + β1 x


• Yi , independente de Yj , i 6= j
• X , variável auxiliar, sem erro.

5
Regressão simples

No modelo, β0 é chamado de coeficiente linear e β1 , coeficiente angular.


Interpretação dos coeficientes:

• β1 - aumento médio da resposta Y para cada unidade de X


• β0 - o valor da resposta Y quando a variável auxilar X = 0.

Por exemplo: um modelo de regressão foi ajustado entre Y = Preço de ação WSD e
X , ı́ndice Bovespa, obtendo: Y = −5.57 + 0.93X
Para cada ponto que o Ibovespa cresce, o preço da ação aumenta em média de R$0.93.

6
Estimando os parâmetros da
regressão simples
Regressão simples

Dado um conjunto de dados

Sujeito 1 2 ... n
X X1 X2 ... Xn
Y Y1 Y2 ... Yn

e o modelo
yi = β0 + β1 xi + ei ,

Temos n equações e n + 2 incógnitas: β0 , β1 , e1 , . . . , en . O critério que minimize a


soma dos erros ao quadrado será utilizado para determinar os coeficientes α e β.
Erro é dado por
ei = yi − (β0 + β1 xi )

E a soma dos erros ao quadrado:


n
X n
X
f (β0 , β1 ) = ei2 = [yi − (β0 + β1 xi )]2
i=1 i=1

7
Regressão simples

Derivando f (β0 , β1 ) em relação a β0 e β1 e igualando a zero, as soluções do sistema


são:

Pn
xi yi − nxy
β̂1 = Pi=1
n 2 2
i=1 xi − nx
e
β̂0 = y − β̂1 x

A previsão de resposta y para um dado xi pelo modelo da regressão é:

ŷi = β̂0 + β̂1 xi

Substituindo β̂0 , temos


ŷi = y + β̂1 (xi − x)

Note que a previsão de resposta y , ŷ , é

• Maior que y se xi > x


• Menor que y se xi < x
• Igual a y se xi = x

8
Avaliação do modelo de regressão

Veremos agora se o modelo linear postulado é adequado ou não dadas as suposições


feitas.
Para julgar a vantagem do modelo mais complexo (este Yi = β0 + β1 Xi + ei ), vamos
comparar com um modelo mais simples Yi = µ + ei .
No modelo yi = β0 + β1 xi + ei , temos o resı́duo de:

êi = yi − ŷi = yi − (β̂0 + β̂1 xi )

Resı́duos ”pequenos” é uma indicação de que o modelo é ”bom”. Assim para julgar se
este resı́duo é ”pequeno” deve-se compará-lo com o resı́duo do modelo mais simples
yi = µ + ei , que é:

êi = yi − y

9
Regressão simples

Como temos vários êi ’s, é preferı́vel empregar um único número como ”a soma de
quadrados dos erros ao quadrado” . Do modelo mais simples temos:
n
X n
X
SQT = êi2 = (yi − y )2
i=1 i=1

e do modelo mais complexo


n
X n
X n
X
SQRes = êi2 = (yi − ŷi )2 = [yi − (β̂0 + β̂1 xi )]2
i=1 i=1 i=1

10
Regressão simples

Vamos considerar um exemplo com n = 20 que resultou SQT = 1373 e SQRes = 563.
Como compará-los?

• A comparação direta destes números não parece justa.


• O número de parâmetros do modelo mais complexo é maior do que o modelo
mais simples.

Vamos considerar então as variâncias residuais:

• Modelo simples, apenas um parâmetro - S 2 = SQT


n−1
= 1373/19 = 72.26, S = 8.50
• Modelo mais complexo, 2 parâmetros - Sr2 = SQRes
n−2
= 563/18 = 31.28, Sr = 5.59

Os números sugerem que modelo mais complexo produziu uma redução mais
significativa nos resı́duos.

11
Decomposição dos desvios
Regressão simples

Pela Figura 1, podemos observar que

(yi − y ) = (yi − ŷi ) + (ŷi − y )

A parcela (ŷi − y ) mede o quanto ”o


modelo mais complexo” está longe do
modelo mais simples.
Quanto ”maior” for esta parcela, é indı́cio
que o modelo mais complexo deva ser
melhor que o modelo simples e
consequente deve diminuiu a segunda
parcela (yi − ŷi )

Figure 1: Decomposição dos desvios

12
Regressão simples

Pode-se demonstrar que


n
X n
X n
X
(yi − y )2 = (yi − ŷi )2 + (ŷi − y )2
i=1 i=1 i=1

Temos então : SQT=SQRes+ ni=1 (ŷi − y )2


P

A parcela ni=1 (ŷi − y )2 , que será denotada por ”Soma de Quadrados devido ao
P

modelo de regressão (SQReg)” mede o quanto ”o modelo mais complexo” está ”longe”
do modelo mais simples .
Então SQReg = ni=1 (ŷi − y )2 que pode reescrita como
P

n
X
SQReg = β̂12 (xi − x)2
i=1

Note que quanto maior for β̂1 , maior vai ser a redução da SQRes.

13
Regressão simples

Como estes números, também usual


calcular o coeficiente de determinação
definido como
SQReg
R2 =
SQT

para avaliar qualitativamente o ”lucro” em


usar o modelo de regressão.
No exemplo, obtemos

SQReg 1373 − 563


R2 = = = 0.59
SQT 1373

Note que o uso apenas do R 2 para avaliar


a adequação do modelo de regressão pode
levar a conclusão equivocada. Vide um Figure 2: Avaliação equivocada
exemplo ilustrado na Figura 2

14
Regressão simples

Como na análise de variância, as somas de quadrados podem ser organizadas numa


tabela

FV SQ G.L. QM Estatı́stica
2
Sreg
Regressão SQReg 1 2
Sreg = SQReg F = 2
Sr
Resı́duo SQRes n−2 SQRes/(n − 2) = Sr2
Total SQT n−1 SQT /(n − 1) = S 2
Table 1: Tabela Anova - Modelo de regressão

Veremos adiante qual a hipótese testada com a estatı́stica F desta tabela.

15
regressão simples

Pela Tabela temos que vale sempre a igualdade:

SQT = SQReg + SQRes

OU seja, sempre haverá uma redução ”numérica” dos resı́duos quando um modelo de
regressão for usada, mas esta redução faz compensar o uso do modelo de regressão?
Se a redução for ”pequena”, os modelos (complexo e simples) seriam praticamente
equivalentes e isto ocorre quando a inclinação β for zero ou pequena.
Ou seja, precisamos testar H0 : β1 = 0

16
Distribuições amostrais dos
estimadores dos parâmetros
Regressão simples

Para fazer o teste H0 : β1 = 0 precisamos estudar as propriedades do seu estimador β̂


e identificar a distribuição de β̂1 com as suposições feitas. Convém lembrar que
Pn
xi yi − nxy
β̂1 = Pi=1
n 2 2
i=1 xi − nx

Pode-se demonstrar que


E (β̂1 ) = β1
σ2
Var (β̂1 ) = Pn 2
i=1 (xi − x)

Demonstração detalhada, ver Bussab & Morettin

17
Regressão simples

Qual a distribuição de β̂1 ?


Como ei ∼ N(0, σ 2 ), yi ∼ N(β0 + β1 xi , σ 2 ) e β̂1 é uma combinação linear de variáveis
normais (é uma função de yi s), segue que

σ2
 
β̂1 ∼ N β1 , P n 2
i=1 (xi − x)
e v
u n
(β̂1 − β1 ) u X
t (xi − x)2 ∼ N(0, 1)
σ i=1

18
Regressão simples

Para testar H0 : β1 = 0 x H1 : β1 6= 0 a estatı́stica seria


v
u n
β̂1 uX
t (xi − x)2 ∼ N(0, 1)
σ i=1

se σ 2 fosse conhecida, mas em situações de modelo de regressão ela é estimada por


σ̂ 2 = Sr2 . Segue que a estatı́stica para testar a hipótese é:
v
u n
β̂1 uX
t(β̂1 ) = t (xi − x)2 ∼ t-Student com (n-2) graus de liberdade
Sr i=1

Selecionado o erro do tipo I igual a α, o critério de decisão: rejeitar H0 se


|β̂1 | > tα/2 qPn Sr
i=1
(xi −x)2

tα/2 um valor tabelado da distribuição t-Student com (n-2) graus de liberdade

19
Regressão Simples

Note que
n 2
β̂12 X Sreg
t(β̂1 )2 = 2
(xi − x)2 = 2
Sr i=1 Sr

exatamente igual ao valor que estatı́stica F que apareceu na Tabela 1.


Ou seja testar H0 , podemos usar a estatı́stica t(β̂1 ) ou a estatı́stica F da Tabela 1.
Neste caso, rejeitar H0 se F > Fc , Fc , um valor tabelado da distribuição F com 1 e
n − 2 graus de liberdade no numerador e denominador, fixado um valor do erro do tipo
α.

20
Regressão simples

Agora iremos obter um IC para β1 . Lembrando que

v
u n
(β̂1 − β1 ) u X
t (xi − x)2 ∼ N(0, 1)
σ i=1

se σ for conhecida. Substituindo-o pelo seu estimador Sr2 , segue

v
u n
(β̂1 − β1 ) u X
t (xi − x)2 ∼ t − Student com (n-2) graus de liberdade
Sr i=1

Escolhido um nı́vel de confiança de 1 − α, um intervalo de confinça para β1 é dado por

Sr
β̂1 ± tα/2 pPn
i=1 (xi − x)2

21
Um exemplo

Considerem os dados da octanagem da gasolina em função da % de aditivo

Table 2: Dados de octanagem da gasolina

Porcentagem de aditivo (%) Octanagem da gasolina (IAD)


1 80.5
2 81.6
3 82.1
4 83.7
5 83.9
6 85.0

Os dados foram inseridos no Excel que produziu a reta de regressão:


Y=79.7+0.8857X e esta tabela de Anova.
Fonte de Variação Graus de liberdade SQ QM Fcalc F tabelado
Regressão 1 13,7286 13,7286 156.3 Fα=2.5% =12.22
Resı́duos 4 0.3514 0.0879
Total 5 14.08

22
Exercı́cio

a - Interprete os coeficientes do modelo obtido


b - Qual o coeficiente de determinação do modelo ajustado
c -Teste se octanagem da gasolina pode ser vista como uma função linear da % de
aditivo, use erro tipo I de 2.5%.
d - Obter um IC para coeficiente angular com nı́vel de confiança de 95%.

23
Solução

a - Interprete os coeficientes do modelo obtido


Para cada porcentagem de aditivo acrescida, aumenta em média 0.8857 a octanagem
da gasolina
b - Qual o coeficiente de determinação do modelo ajustado
SQReg 13.7286
R2 = SQT
= 14.08
= 0.975
c -Teste se octanagem da gasolina pode ser vista como uma função linear da % de
aditivo, use erro tipo I de 2.5%.
Hipóteses nula e alternativa: H0 : β1 = 0; H1 : β1 6= 0
Fcalc > Fcritico , rejeita a hipótese nula

24
Solução

d - Obter um IC para coeficiente angular com nı́vel de confiança de 95%. Convém


lembrar que
Sr
β̂1 ± tα/2 pPn
2
i=1 (xi − x)

Pn Pn 13.7286
e SQReg = β̂12 i=1 (xi − x)2 = 13.7286 → i=1 (xi − x)2 = 0.88572
= 17.5.
Assim o IC para β1 será √
0.0879
0.8857 ± 2.776 √
17.5
com tα/2 = 2.776, um valor da t-Student com 4 graus de liberdade

25
Regressão Simples

Agora iremos estudar as propriedade de β̂0 , lembrando que β̂0 = y − β̂1 x.


Pn
x2
Pode-se demonstrar que E (β̂0 ) = β0 e Var (β̂0 ) = σ 2 Pn i=1 i
n i=1 (xi − x)2
Segue que s P
β̂0 − β0 n ni=1 (xi − x)2
Pn 2
∼ N(0, 1), se σ 2 conhecido
σ i=1 xi
e s P
β̂0 − β0 n ni=1 (xi − x)2
Pn 2
∼ t − Student com (n-2) graus de liberdade
Sr i=1 xi

r Pn
x2
Um IC para β0 com nı́vel de confiança 1 − α é dado por β̂0 ± tα/2 Sr n
Pn i=1 i 2
(x −x)
i=1 i

26
IC para uma média e uma futura
observação
Regressão simples

Em geral tem interesse em obter uma estimativa da média da resposta ou estimar o


valor de resposta para um dado valor x∗ . Em ambos casos a estimativa pontual é

µ̂(x ∗ ) = ŷ ∗ = β̂0 + β̂1 x ∗

No entanto, os intervalos de confianças são distintos. Para o primeiro caso, pode


mostrar que
(x ∗ − x)2
  
1
ŷ ∗ ∼ N β0 + β1 x ∗ , σ 2 + Pn 2
n i=1 (xi − x)

Substituindo σ 2 pelo seu estimador Sr2 segue que um IC para µ(x ∗ ) com nı́vel de
confiança de 1 − α é dado por
s
(x ∗ − x)2

1
ŷ ∗ ± tα/2 Sr + Pn 2
n i=1 (xi − x)

27
Regressão simples

Uma futura observação dado um valor de x ∗ pode ser escrita como:

Y ∗ = µ(x ∗ ) + e ∗

cujo estimador é:


Ŷ ∗ = µ̂(x ∗ ) + e ∗

e
Var (Ŷ ∗ ) = Var (µ̂(x ∗ )) + Var (e ∗ )

ou seja

(x ∗ − x)2 (x ∗ − x)2
   
1 1
Var (Ŷ ∗ ) = σ 2 + Pn 2
+ σ2 = σ2 1+ + Pn 2
n i=1 (xi − x) n i=1 (xi − x)

Substituindo σ 2 pelo seu estimador Sr2 segue que um IC para futura observação no
nı́vel (x ∗ ) com nı́vel de confiança de 1 − α é dado por
s
(x ∗ − x)2

∗ 1
ŷ ± tα/2 Sr 1+ + Pn 2
n i=1 (xi − x)

28
Exercı́cio

Utilizando os dados da Tabela 2 construa um intervalo de confiança de 95% para a


média da octanagem quando a porcentagem de aditivo for 5.5%.
Pelo modelo de regressão, Ŷ = 84.57
r
(5.5−3.5)2
 
84.57 ± 2.776 0.0879 15 + 17.5
= [84.03; 85.11]

Você afirmaria, com 95% de confiança, que em um novo teste onde se coloca 4.5% de
aditivo na gasolina o valor da octanagem estará entre 84 e 86 ?
Pelo modelo de regressão, Ŷ = 83.69
r
(4.5−3.5)2
 
83.69 ± 2.776 0.0879 1 + 15 + 17.5
= [82.76; 84.64]

Não, não estará entre 84 e 86 mas entre 82.76 e 84.64

29
Coeficiente de correlação
Coeficiente de correlação

O coeficiente de correlação amostral foi


apresentado como uma medida resumo de
associação entre 2 variáveis quantitativas.
Convém relembrar que o coeficiente de
correlação amostral entre (X,Y) é dado por
Pn
i=1 Xi Yi − nX Y
r = q
2 P 2
( i=1 Xi − nX )( ni=1 Yi2 − nY )
Pn 2

Veremos agora como fazer inferência.

30
Coeficiente de correlação

(
H0 : ρ = 0
Teste de hipótese para existência de correlação pode ser escrito como
H1 : ρ 6= 0
p
r (n − 2)
É possı́vel mostrar que W = √ ∼ t − Student com n-2 graus de liberdade
1 − r2
Regra de decisão:

• fixado erro do tipo I, rejeita H0 se |W | > tα/2 ,


• tα/2 , um valor tabelado da distribuição t-Student com (n-2) graus de liberdade.

Note que os numeradores de r e β̂1 são exatamente iguais


Ou seja testar H0 : ρ = 0 equivale a testar H0 : β1 = 0.

31
Coeficiente de correlação

A estatı́stica W só pode ser usada para testar a hipótese H0 : ρ = 0. Em algumas


situações tem interesse em testar H0 : ρ = ρ0 6= 0
 
1 (1 + r )
Seja V = ln , pode demonstrar que assintoticamente
2 (1 − r )
   
1 (1 + ρ) 1
V ∼N ln ,
2 (1 − ρ) n−3

ou seja sob H0


  
1 (1 + ρ0 )
Zv = n − 3 V − ln ∼ N(0, 1)
2 (1 − ρ0 )

Regra de decisão: Fixado erro do tipo I, rejeita H0 : se

|Zv | > zα/2

32
Coeficiente de determinação e coeficiente de correlação - regressão simples

Esta relação vale apenas para o modelo de regressão simples:


”O quadrado do coeficiente de correlação é exatamente igual ao coeficiente de
determinação.”

33
Um exemplo interessante - Fonte:Wikipidea

Quarteto de Anscombe - 4 conjuntos


de dados
De cada conjunto calcule:
• Média de Y e X;
• Variância de Y e X;
• Coeficiente de correlação;
• Ajuste uma regressão linear;
• Calcule o coeficiente de
determinação;

34
Quarteto de Anscombe

Das estatı́sticas calculadas o que pode-se observar?

35
Quarteto de Anscombe

Das estatı́sticas calculadas o que pode-se observar?


As estatı́sticas descritivas dos 4 conjuntos apresentam valores muitos similares.

Estatı́stica Valor
Média de x 9
Variância de x 11
Média de y 7,50
Variância de y 4,125
Correlação entre x e y 0,816
Reta de regressão linear y = 3.00 + 0.500x
Coef. de determinação: R 2 0.67

35
Quarteto de Anscombe

Agora faça os gráficos de dispersão


O que vc observou? E o que concluiu?

36
Quarteto de Anscombe

Agora faça os gráficos de dispersão


O que vc observou? E o que concluiu?

36
Quarteto de Anscombe

Os conjunto de dados foram construı́dos em 1973 pelo estatı́stico Francis Anscombe,


Objetivo: demonstrar tanto a importância de se visualizar os dados antes de
analisá-los, quanto o efeito dos outliers e outras observações influentes nas
propriedades estatı́sticas.
Anscombe, F. J. (1973). Graphs in Statistical Analysis. American Statistician. 27 (1):
17–21.

37
Análise dos resı́duos
Análise dos resı́duos

Ao ajustar um modelo de regressão, várias suposições são feitas.


Com os resı́duos, vários gráficos podem ser construı́dos para verificar se suposiçòes
foram violadas ou não. Antes disto vamos definir alguns tipos de resı́duos que existem.

• O resı́duo ”bruto” é diferença entre o valor observado e o ajustado com o modelo


de regressão, ou seja êi = yi − ŷi .
• Além destes, podemos ter os resı́duos padronizados que consiste em padronizar
êi
os resı́duos ”brutos”, ou seja zi = . Espera-se ter poucos |zi | > 3
Sr

ATENÇÃO: No livro do Devore, os resı́duos definidos como padronizados, na


verdade, são os resı́duos ”estudantizados” (em ingles studentized residuals).
Alguns gráficos podem ser construı́dos:

• Plotar êi ou zi versus x


• Plotar êi ou zi versus ŷi
• Plotar yi versus ŷi
• Gráfico Q-Q plot normal dos êi ou zi

38
Análise dos resı́duos

Gráficos dos resı́duos podem ser construı́dos para verificar:


• Adequação do modelo linear
Análise : gráfico de dispersão ou gráfico dos resı́duos
• Normalidade dos erros
Análise: gráfico de probabilidades ou teste de Kolmogorov Smirnov ou
Anderson-Darling ou Shapiro-Wilks

39
Análise dos resı́duos

• Erros independentes e identicamente distribuı́dos Análise: resı́duos devem ter


distribuição aleatória em torno da reta. Não devem ser correlacionados uns com
os outros
• Homocedasticidade
Análise: Gráfico dos resı́duos

40
Análise dos resı́duos

Na Figura abaixo, algumas transgressões das suposições empregadas no modelo de


regressão podem ser observadas pelos gráficos como não normalidade, modelo não
linear, não homocedasticidade, presença de outliers. Apenas: o caso (a) é a situação
ideal, os demais apresentam transgressões. Associar cada caso com o tipo de
transgressão.

41
Exercı́cios

Observe a evolução no tempo do PIB per capita da China (em US$). Observe o
comportamento dos dados. Ajuste um modelo linear e, usando ANOVA, teste a
hipótese da regressão ser significativa para um nı́vel de 1%. Interprete os coeficientes
obtidos.
Ano 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
PIB 1753 2099 2695 3471 3838 4561 5634 6338 7078 7684 8069 8123

Observe a evolução no tempo do PIB per capita dos Estados Unidos. Ajuste um
modelo linear e estime o valor do PIB per capita para 2020. Construa um intervalo de
confiança (95%) para o valor previsto.
Ano 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
PIB 44308 46437 48062 48401 47002 48374 49791 51450 52787 54599 56207

42
Saı́da Excel - PIB per capital da China

Atenção: foi feita uma transformação dos valores de X: 2005 = 0.

43
Saı́da Excel - PIB per capital da USA

Atenção: foi feita uma transformação dos valores de X: 2005 = 0.

44
PIB USA

Previsão para 2020 (X*=15) é dada por: Ŷ2020 = 44346.91 + 1101.85 × 15 = 60874.66
IC a 95%: s
(x ∗ − x)2

∗ 1
ŷ ± tα/2 Sr + Pn 2
n i=1 (xi − x)
com
√ Pn
n = 12; t = 2.228; Sr = 127865.57; x∗ = 15; X = 5.5; i=1 (xi − x)2 = 143

45
PIB USA- análise dos resı́duos

46
Exercı́cios

Observe o PIB per capita e o consumo de eletricidade per capita dos paı́ses indicados.
Paı́s GDP per capita (US$) Electricity consumption per capita (kWh)
Haiti 830 39
Russian Federation 14126 6603
South Africa 6480 4229
China 7684 3927
Netherlands 52157 6713
Brazil 12027 2601
Chile 14817 3912
Uruguay 16738 3068
Germany 47903 7035
Italy 35397 5002
France 42955 6938
United Kingdom 46412 5130
Sweden 59180 13480
United States 54599 12987
Japan 38096 7820

Faça um diagrama de dispersão. Calcule o coeficiente de correlação.


Ajuste um modelo de regressão entre eletricidade consumida per capita e PIB per
capita. Teste a hipótese da regressão ser significativa com nı́vel de 1%
Calcule o Coeficiente de determinação;
Determine um Intervalo de confiança (95%) para coeficiente angular;
Determine um intervalo de confiança (95%) para um paı́s com PIB per capita de
35000.

47
Exercı́cios

Ajuste um modelo de regressão empregando os dados da figura abaixo. Verifique o


ajuste do modelo com nı́vel de 5%

48
Regressão não linear - transformação
linear
Regressão não linear

Apresentamos até agora modelo de regressão linear.


No entanto existem os modelos de regressão não linear simples.
Iremos abordar apenas os casos onde é possı́vel usar transformações para linearizá-los.
Um modelo probabilı́stico relacionando Y à X é intrinsecamente linear se através de
uma transformação em Y e/ou X, pode ser reduzido à um modelo linear

Y ∗ = β0 + β1 X ∗

com Y ∗ = f (Y ) e X ∗ = g (X ). Na Tabela abaixo, estão alguns casos, identificando a


função utilizada para linear a variável resposta e/ou auxiliar.

49
Exercı́cio

A equação de Taylor expressa o tempo de vida de uma ferramenta y como função do


tempo de corte x através do modelo y = αx β . Dados experimentais coletados:
X 600 600 600 600 500 500 500 500 400 400 400 400
Y 2.35 2.65 3 3.6 6.4 7.8 9.8 16.5 21.5 24.5 26 33
Utilize uma transformação e obtenha um estimador para α e β
Avalie a qualidade o modelo de regressão dos dados transformados.
Faça uma análise dos resı́duos.

50

Você também pode gostar