Modelos Lineares Generalizados - Apostila Gauss Cordeiro
Modelos Lineares Generalizados - Apostila Gauss Cordeiro
Modelos Lineares Generalizados - Apostila Gauss Cordeiro
10 de julho de 2007
ii Gauss M. Cordeiro & Clarice G.B. Demetrio
Prefacio
Este livro e resultante de varios anos de lecionamento de cursos e minicursos desses
modelos e tem como objetivo apresentar nocoes introdutorias de Modelos Lineares
Generalizados e algumas aplicacoes. Enumerar as pessoas a quem devemos agradeci-
mentos e uma tarefa difcil, pois sao muitos aqueles que contriburam de forma direta
ou indireta para a elaboracao deste material. A Eduardo Bonilha, funcionario do De-
partamento de Ciencias Exatas da ESALQ/USP, agradecemos o auxlio na digitacao.
Agradecemos a todos que nos ajudaram lendo versoes anteriores cuidadosamente e
dando sugestoes muito proveitosas. Agradecemos, tambem, ao CNPq, a CAPES e
a FAPESP por financiamentos de projetos que trouxeram contribuicoes importantes
para a elaboracao deste livro.
Finalmente, assumimos total responsabilidade pelas imperfeicoes e solicita-
mos aos leitores que nos apresentem crticas e sugestoes para uma futura edicao
revisada.
Gauss Moutinho Cordeiro
Clarice Garcia Borges Demetrio
Piracicaba, 10 de julho de 2007
Sumario
3 Estimacao 35
3.1 O algoritmo de estimacao . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Estimacao em modelos especiais . . . . . . . . . . . . . . . . . . . . . 41
3.3 Resultados adicionais na estimacao . . . . . . . . . . . . . . . . . . . 43
3.4 Selecao do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4 Metodos de Inferencia 49
4.1 Distribuicao dos estimadores dos parametros . . . . . . . . . . . . . . 49
4.2 Funcao desvio e estatstica de Pearson generalizada . . . . . . . . . . 55
4.3 Analise do desvio e selecao de modelos . . . . . . . . . . . . . . . . . 65
4.4 Estimacao do parametro de dispersao . . . . . . . . . . . . . . . . . . 69
iii
iv Gauss M. Cordeiro & Clarice G.B. Demetrio
4.5 Selecao da funcao de ligacao . . . . . . . . . . . . . . . . . . . . . . . 72
5 Resduos 75
5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2 Tecnicas para a verificacao do ajuste de um modelo . . . . . . . . . . 76
5.3 Analise de resduos e diagnostico para o modelo classico de regressao 77
5.3.1 Tipos de resduos . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.3.2 Estatsticas para diagnosticos . . . . . . . . . . . . . . . . . . 80
5.3.3 Tipos de graficos . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4 Analise de resduos e diagnostico para modelos lineares generalizados 90
5.4.1 Tipos de resduos . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.4.2 Tipos de graficos . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.4.3 Resduos de Pearson estudentizados . . . . . . . . . . . . . . . 98
5.5 Verificacao da funcao de ligacao . . . . . . . . . . . . . . . . . . . . . 101
5.6 Verificacao da adequacao da funcao de variancia . . . . . . . . . . . . 104
Famlia Exponencial de
Distribuicoes
1.1 Introducao
Muitas das distribuicoes conhecidas podem ser reunidas em uma famlia de-
nominada famlia exponencial de distribuicoes. Assim, por exemplo, pertencem a
essa famlia as distribuicoes normal, binomial, binomial negativa, gama, Poisson,
normal inversa, multinomial, beta, logartmica, entre outras. Essa classe de dis-
tribuicoes foi proposta independentemente por Koopman, Pitman e Darmois atraves
do estudo de propriedades de suficiencia estatstica. Posteriormente, muitos ou-
tros aspectos dessa famlia foram descobertos e tornaram-se importantes na teoria
moderna de Estatstica. O conceito de famlia exponencial foi introduzido na Es-
tatstica por Fisher mas os modelos da famlia exponencial apareceram na Mecanica
Estatstica no final do seculo XIX e foram desenvolvidos por Maxwell, Boltzmann e
Gibbs. A importancia da famlia exponencial de distribuicoes teve maior destaque,
na area dos modelos de regressao, a partir do trabalho pioneiro de Nelder e Wed-
derburn (1972) que definiram os modelos lineares generalizados. Na decada de 80,
esses modelos popularizaram-se, inicialmente, no Reino Unido, e, posteriormente,
nos Estados Unidos e na Europa.
1
2 Gauss M. Cordeiro & Clarice G.B. Demetrio
d`()
e, portanto, a funcao escore U = U () = resulta em U = x b0 ().
d
E facil verificar das propriedades da funcao escore, E(U ) = 0 e Var(U ) =
2
E d `()/d2 (esta ultima igualdade e a informacao de Fisher), que
Tem-se, entao,
m
f (y; ) = exp log + y log + (m y) log(1 )
y
m
= exp y log + m log(1 ) + log ,
1 y
M (t; , ) = E etY = exp 1 [b(t + ) b()] . (1.7)
8 Gauss M. Cordeiro & Clarice G.B. Demetrio
Prova: A prova sera feita apenas para o caso de variaveis aleatorias contnuas.
Lembrando-se que
Z
f (y; , )dy = 1,
entao,
Z
exp 1 [y b()] + c(y, ) dy = 1,
obtendo-se
Z
exp 1 y + c(y, ) dy = exp 1 b() . (1.8)
Logo,
Z
tY
M (t; , ) = E e = exp(ty)f (y)dy
Z
= exp 1 [(t + )y b()] + c(y, ) dy
Z
1
= 1
exp 1 (t + )y + c(y, ) dy
exp [ b()]
1 1
M (t; , ) = exp b(t + )
exp 1 b()
ou ainda,
M (t; , ) = exp 1 [b(t + ) b()] ,
demonstrando (1.7).
d`
U= = 1 [y b0 ()]
d
d2 `
U0 = = 1 b00 ().
d2
Logo,
entao,
Exemplo 1.7: Considere o Exemplo 1.5 e obtenha (t) e M (t). Tem-se que
= 1, = log[/(m )] e b() = m log(1 ) = m log(1 + e ).
Logo, usando-se a f.g.c. (1.9), vem
(t) = m log(1 + et+ ) log(1 + e )
m m
1 + et+ m t
= log = log + e .
1 + e m m
Assim, a f.g.m. e
m
(t) m
M (t) = e = + et .
m m
(y; , ) = exp {1 [t(y) b()] + c(y, )}. Esse fato e comprovado com os
tres exemplos que se seguem.
13
14 Gauss M. Cordeiro & Clarice G.B. Demetrio
iii) a ligacao entre os componentes aleatorio e sistematico e feita atraves de uma
funcao adequada como, por exemplo, logartmica para os modelos log-lineares,
chamada funcao de ligacao.
Y = + ,
(a) modelo classico de regressao multipla (Legendre, Gauss, incio do seculo XIX)
e modelo de analise de variancia para experimentos planejados (Fisher, 1920 a
1935) com o erro aleatorio tendo distribuicao normal;
(c) modelo probito (Bliss, 1935) para o estudo de proporcoes, envolvendo a dis-
tribuicao binomial;
(d) modelo logstico (Berkson, 1944; Dyke e Patterson, 1952; Rasch, 1960; Cox,
1970) para o estudo de proporcoes, envolvendo a distribuicao binomial;
Tabela 2.1: Numero de insetos mortos (yi ) de (mi ) insetos que receberam a dose di
de rotenone
Dose (di ) mi yi pi
0,0 49 0 0,00
2,6 50 6 0,12
3,8 48 16 0,33
5,1 46 24 0,52
7,7 49 42 0,86
10,2 50 44 0,88
* *
0.8
0.6
Observed proportions
*
0.4
*
0.2
*
0.0
*
0 2 4 6 8 10
Dose
Figura 2.1: Grafico de dispersao das proporcoes (pi ) versus doses (di ) de rotenone,
referentes a Tabela 2.1
0.4
0.10
0.3
0.08
0.06
f(dose)
f(dose)
0.2
0.04
0.1
0.02
0.00
0.0
5 10 15 20 25 30 35 5 10 15 20 25 30 35
dose dose
0.4
1.0
0.8
0.3
0.6
f(dose)
0.2
0.4
0.1
0.2
0.0
0.0
LD50
5 10 15 20 25 30 35 5 10 15 20 25 30 35
dose dose
que essa curva sigmoide se transforme em uma reta e, assim, procedimentos comuns
de regressao possam ser usados para se estimarem os parametros. A Figura 2.4
mostra as distribuicoes, e suas correspondentes curvas sigmoides, mais comumente
usadas, cujas expressoes e respectivas transformacoes lineares sao apresentadas, a
seguir.
0.4
1.0
Normal Probit
Logstica Logit
Gumbel Cloglog
0.8
0.3
F(Propores de insetos mortos)
0.6
0.2
0.4
0.1
0.2
0.0
0.0
0 2 4 6 8 10 0 2 4 6 8 10
dose dose
U
e, portanto, com Z = N(0, 1),
1
i = P(U di ) = P Z + di = P(Z 1 + 2 di )
i = (1 + 2 di ),
probit(i ) = 1 (i ) = 1 + 2 di .
2 e1 +2 u
fU (u; 1 , 2 ) = .
(1 + e1 +2 u )2
Logo,
e1 +2 di
i = P(U di ) = F(di ) =
1 + e1 +2 di
22 Gauss M. Cordeiro & Clarice G.B. Demetrio
e uma funcao nao-linear em um conjunto linear de parametros, sendo linearizada por
i
logit(i ) = log = 1 + 2 di .
1 i
fU (u; 1 , 2 ) = 2 exp 1 + 2 u e1 +2 u .
Logo,
log[ log(1 i )] = 1 + 2 di .
ii) as variaveis explanatorias entram na forma de uma soma linear de seus efeitos
sistematicos, ou seja,
2
X
i = xij j = xTi ,
j=1
modelo probito: i = mi (1 + 2 di );
e1 +2 di
modelo logstico: i = mi ;
1 + e1 +2 di
modelo complemento log-log: i = mi {1 exp[ exp(1 + 2 di )]}.
b) Ensaios de diluicao
E pratica comum, o uso dos ensaios de diluicao para se estimar a concen-
tracao de um organismo (numero por unidade de volume, de area, de peso etc.)
em uma amostra. Quando a contagem direta nao e possvel, mas a presenca ou
ausencia do organismo em sub-amostras pode ser detectada (Ridout e Fenlon, 1998)
pode-se, tambem, estimar . Em geral, registrar a presenca, ou ausencia, fica mais
economico do que fazer a contagem. Por exemplo, pode-se detectar se uma deter-
minada bacteria esta presente, ou nao, em um lquido por um teste de cor, ou se
um fungo esta presente, ou nao, em uma amostra de solo, plantando-se uma planta
susceptvel nesse solo e verificando se a planta apresenta sintomas da doenca. Esse
metodo esta baseado na suposicao de que o numero de indivduos presentes segue
24 Gauss M. Cordeiro & Clarice G.B. Demetrio
uma distribuicao de Poisson, o que e uma suposicao forte e e importante verificar se
e verdadeira. Por exemplo, a distribuicao espacial de um fungo no solo esta longe
de ser aleatoria e pode ser que o numero de indivduos em diferentes amostras desse
solo nao siga a distribuicao de Poisson.
Nos ensaios de diluicao, a solucao original e diluda progressivamente e
na i-esima diluicao sao feitas as contagens (Exemplo 2.2) ou, entao, sao testadas
mi sub-amostras das quais Yi apresentam resultado positivo para a presenca do
organismo (Exemplo 2.3). Seja i o volume da amostra original que esta presente
em cada uma das sub-amostras na i-esima diluicao. Em geral, mas nem sempre, sao
usadas diluicoes iguais, tal que os i0 s ficam em progressao geometrica.
Diluicao Contagens
0,3162 13 14 17 22
0,1778 9 14 6 14
0,1000 4 4 3 5
0,0562 3 2 1 3
0,0316 2 1 3 2 2
Fonte: Ridout (1990), notas de aula
Exemplo 2.3: A Tabela 2.3 mostra os dados de um ensaio de diluicao realizado para
determinar o numero de esporos de Bacillus mesentericus por grama (g) de farinha
de batata (Fisher e Yates, 1970). Uma suspensao lquida foi preparada e sujeita a
sucessivas diluicoes para que resultassem solucoes com 4, 2, ..., 1/128g de farinha
Modelos Lineares Generalizados 25
por 100ml de solucao. Para cada diluicao foram tomadas cinco amostras de 1ml e
foi contado o numero de amostras com esporos.
Tabela 2.3: Numeros de amostras (Y ) que contem esporos em cinco amostras, para
diferentes quantias (g) de farinha de batata em cada diluicao.
Assim, se forem feitas contagens dos indivduos apos a diluicao, tem-se que
essa expressao, pode ser linearizada, usando-se a funcao logartmica, ou seja,
Logo,
ii) as variaveis explanatorias entram na forma de uma soma linear de seus efeitos,
ou seja,
2
X
i = xij j = xTi ,
j=1
c) Tabelas de contingencia
Dados de contagens sao oriundos da simples contagem de eventos (por
exemplo, numero de brotos por explante), ou entao, da frequencia de ocorrencias em
varias categorias e que dao origem as tabelas de contingencia. Sejam os exemplos
que se seguem.
caso em que o numero total de frutos com broca e uma variavel aleatoria e, por-
tanto, pode ser estudada pela distribuicao de Poisson. A hipotese a ser testada e
a da homogeneidade, isto e, a proporcao de frutos sadios e a mesma para todos os
inseticidas.
Novamente, tem-se:
ii) as variaveis explanatorias entram na forma de uma soma linear de seus efeitos,
ou seja,
= X,
ij = g(ij ) = log ij .
2.3 Definicao
Os modelos lineares generalizados podem ser usados quando se tem uma
unica variavel aleatoria Y associada a um conjunto de variaveis explanatorias
x1 , . . . , xp . Para uma amostra de n observacoes (yi , xi ) em que xi = (xi1 , . . . , xip )T
e o vetor coluna de variaveis explanatorias, o MLG envolve os tres componentes:
E(Yi ) = i , i = 1, . . . , n,
sendo b() e c() funcoes conhecidas. Conforme foi visto na Secao 1.4
E(Yi ) = i = b0 (i )
e
Var(Yi ) = b00 (i ) = Vi ,
i = g(i ), (2.7)
Deve ser lembrado, porem, que embora as funcoes de ligacao canonicas levem
a propriedades estatsticas desejaveis para o modelo, principalmente, no caso de
amostras pequenas, nao ha nenhuma razao a priori para que os efeitos sistematicos
do modelo devam ser aditivos na escala dada por tais funcoes. Para o modelo classico
de regressao, a funcao de ligacao e a identidade, pois o preditor linear e igual a media.
Essa funcao de ligacao e adequada no sentido em que ambos, e , podem assumir
valores na reta real. Entretanto, certas restricoes surgem quando se trabalha, por
exemplo, com a distribuicao de Poisson em que > 0 e, portanto, a funcao de
ligacao identidade nao deve ser usada, pois podera assumir valores negativos,
dependendo dos valores obtidos para . Alem disso, dados de contagem dispostos
em tabelas de contingencia, sob a suposicao de independencia, levam, naturalmente,
34 Gauss M. Cordeiro & Clarice G.B. Demetrio
a efeitos multiplicativos cuja linearizacao pode ser obtida atraves da funcao de ligacao
logartmica, isto e, = log e, portanto, = e (conforme visto na Secao 2.2 ).
Aranda-Ordaz (1981) propos a famlia de funcoes de ligacao para analise de
dados na forma de proporcoes dada por
(1 ) 1
= log ,
sendo uma constante desconhecida e que tem como casos particulares o modelo
logstico para = 1 e o complemento log-log para 0.
Uma famlia importante de funcoes de ligacao, principalmente para dados
com media positiva, e a famlia potencia especificada por
1 6= 0
log =0
ou entao,
6= 0
log = 0
Estimacao
3.1 O algoritmo de estimacao
A decisao importante na aplicacao dos MLG e a escolha do trinomio: dis-
tribuicao da variavel resposta matriz modelo funcao de ligacao. A selecao
pode resultar de simples exame dos dados ou de alguma experiencia anterior. Ini-
cialmente, considera-se esse trinomio fixo para se obter uma descricao adequada dos
dados atraves das estimativas dos parametros do modelo. Muitos metodos podem ser
usados para estimar os parametros 0 s, inclusive o qui-quadrado mnimo, o Bayesiano
e a estimacao-M. O ultimo inclui o metodo de maxima verossimilhanca (MV) que
tem muitas propriedades otimas, tais como, consistencia e eficiencia assintotica.
Neste livro, considera-se apenas o metodo de MV para estimar os parametros
lineares 1 , . . . , p do modelo. O vetor escore e formado pelas derivadas parciais de
primeira ordem do logaritmo da funcao de verossimilhanca. O logaritmo da funcao de
verossimilhanca como funcao apenas de (considerando-se o parametro de dispersao
conhecido) dado o vetor y e definido por `() = `(; y) e usando-se a expressao
(2.4) tem-se
n n
1X X
`() = [yi i b(i )] + c(yi , ), (3.1)
i=1 i=1
p
X
1
em que i = q(i ), i = g (i ) e i = xir r . Da expressao (3.1) pode-se calcular,
r=1
`()
pela regra da cadeia, o vetor escore U() = de dimensao p, com elemento
35
36 Gauss M. Cordeiro & Clarice G.B. Demetrio
n
`() X d`i di di i
tpico Ur = = , pois
r i=1
d i d i d i r
`() = f (1 , 2 , . . . , i , . . . , n )
R
i = Vi1 di = q( i )
i = g 1 (i ) = h( i )
Pp
i = r=1 xir r
di
e, sabendo-se que i = b0 (i ) e = Vi , tem-se
di
n
1X 1 di
Ur = (yi i ) xir (3.2)
i=1 Vi di
para r = 1, . . . , p.
A estimativa de maxima verossimilhanca (EM V ) do vetor de parametros
e obtida igualando-se Ur a zero para r = 1, . . . , p. Em geral, as equacoes Ur = 0,
r = 1, . . . , p, nao sao lineares e tem que ser resolvidas numericamente por processos
iterativos do tipo Newton-Raphson.
O metodo iterativo de Newton-Raphson para a solucao de uma equacao
f (x) = 0 e baseado na aproximacao de Taylor para a funcao f (x) na vizinhanca do
ponto x0 , ou seja,
f (x) = f (x0 ) + (x x0 )f 0 (x0 ) = 0,
obtendo-se
f (x0 )
x = x0
f 0 (x0 )
ou, de uma forma mais geral,
f (x(m) )
x(m+1) = x(m) ,
f 0 (x(m) )
sendo x(m+1) o valor de x no passo (m + 1), x(m) o valor de x no passo m, f (x(m) ) a
funcao f (x) avaliada em x(m) e f 0 (x(m) ) a derivada da funcao f (x) avaliada em x(m) .
Modelos Lineares Generalizados 37
Considerando-se que se deseja obter a solucao do sistema de equacoes U =
U() = `()/ = 0 e, usando-se a versao multivariada do metodo de Newton-
Raphson, tem-se
(m+1) = (m) + (J(m) )1 U(m) ,
K = 1 XT WX,
ou, ainda,
ou
e os pesos
(m) 1
wi = (m) (m)
;
V (i )[g 0 (i )]2
3) calcular
voltar ao passo (1) com (m) = (m+1) e repetir o processo ate obter a convergencia,
definindo-se, entao, = (m+1) .
Dentre os muitos existentes, um criterio para verificar a convergencia poderia
ser
p
!2
X r
(m+1)
r
(m)
(m)
< ,
r=1 r
tomando-se para um valor suficientemente pequeno. Em geral, esse algoritmo e
robusto e converge rapidamente (menos de 10 iteracoes sao suficientes).
Deve-se tomar cuidado se a funcao g() nao e definida para alguns valores
yi . Por exemplo, se a funcao de ligacao for dada por
= g() = log
XT y = XT . (3.6)
42 Gauss M. Cordeiro & Clarice G.B. Demetrio
Cov( c 1 ,
d ) = (XT WX) (3.7)
r 1, 96Var(r )1/2 .
c 1 XT .
Cov() = X(XT WX) (3.8)
c 1 XT G1 .
d ) = G1 X(XT WX)
Cov(
d i , j ) = zij
Corr( ,
(zii zjj )1/2
dos preditores lineares estimados, 1 , . . . , n , sao resultados aproximados que depen-
dem fortemente do tamanho da amostra. Entretanto, sao guias uteis de informacao
Modelos Lineares Generalizados 45
sobre a confiabilidade e a interdependencia das estimativas dos preditores lineares,
e podem, tambem, ser usados para obtencao de intervalos de confianca aproxima-
dos para esses parametros. Para alguns MLG, e possvel achar uma forma fechada
para a inversa da matriz de informacao e, consequentemente, para as estruturas de
covariancia assintotica das estimativas de , e .
Frequentemente, nos modelos de analise de variancia, admite-se que os dados
sao originados de populacoes com variancias iguais. Em termos de MLG, isso implica
no uso de uma funcao de ligacao g(), tal que W, nao depende da media e, portanto,
que a matriz de informacao seja constante. Nesse caso, pelo menos, assintoticamente,
a matriz de covariancia das estimativas dos parametros lineares e estabilizada.
Essa funcao de ligacao e denominada estabilizadora e implica na constancia
da matriz de pesos do algoritmo de estimacao. A funcao de ligacao estabilizadora
pode ser obtida como solucao da equacao diferencial d/d = kd/d, sendo que
k e uma constante arbitraria. Por exemplo, para os modelos gama e Poisson, as
solucoes dessa equacao sao o logaritmo e a raiz quadrada, respectivamente. Para as
funcoes de ligacao estabilizadoras, e mais facil obter uma forma fechada para a matriz
de informacao, que depende inteiramente da matriz modelo, isto e, do desenho do
experimento.
Em muitas situacoes, os parametros de interesse nao sao aqueles basicos dos
MLG. Seja = (1 , . . . , q )T um vetor de parametros, em que i = hi (), sendo as
funcoes hi (), i = 1, . . . , q, conhecidas. Supoe-se que essas funcoes, em geral, nao-
lineares, sao suficientemente bem comportadas. Seja a matriz q p de derivadas
D = {hi /j }. As estimativas 1 , . . . , q podem ser calculadas diretamente de
i = hi (), para i = 1, . . . , q. A matriz de covariancia assintotica de e igual a
D(XT WX)1 DT e deve ser estimada no ponto .
Considere, por exemplo, que apos o ajuste de um MLG, tenha-se interesse
em estudar as estimativas dos parametros s definidos por um modelo de regressao
assintotico em tres parametros 0 , 1 e 2
r = 0 1 2zr , r = 1, . . . , q.
46 Gauss M. Cordeiro & Clarice G.B. Demetrio
A matriz D de dimensoes q 3 e igual, portanto, a
1 2z1 1 2z1
log 2
D = .
z z
1 2 q 1 2 q log 2
(c) adicionando (ou retirando) vetores colunas independentes a partir de uma ma-
triz basica original.
Metodos de Inferencia
4.1 Distribuicao dos estimadores dos parametros
No modelo classico de regressao em que a variavel resposta tem distribuicao
normal e a funcao de ligacao e a identidade, as distribuicoes dos estimadores dos
parametros e das estatsticas usadas para verificacao do ajuste do modelo aos da-
dos podem ser determinadas exatamente. Em geral, porem, a obtencao de dis-
tribuicoes exatas e muito complicada e resultados assintoticos sao usados. Esses
resultados, porem, dependem de algumas condicoes de regularidade e do numero
de observacoes independentes mas, em particular, para os MLG essas condicoes sao
satisfeitas (Fahrmeir e Kaufmann, 1985).
A ideia basica e que se e um estimador consistente para um parametro
e Var() e a variancia desse estimador, entao, para amostras grandes, tem-se:
i) e assintoticamente imparcial;
ii) a estatstica
Zn = q Z quando n , sendo que Z N(0, 1)
Var()
( )2
Zn2 = Z 2 quando n , sendo que Z 2 21 .
Var()
49
50 Gauss M. Cordeiro & Clarice G.B. Demetrio
( )T V1 ( ) 2p ,
U() = U() K( ) = 0,
= K1 U(), (4.2)
E( ) = K1 E[U()] = 0 E() = ,
( )T K( ) 2p (4.3)
Np (, K1 ), (4.4)
ou seja, tem distribuicao assintotica normal pvariada, que e a base para a constru-
cao de testes e intervalos de confianca para os parametros lineares de um MLG. Para
modelos lineares com variaveis respostas com distribuicao normal, (4.3) e (4.4) sao
distribuicoes exatas. Fahrmeir e Kaufmann (1985), num artigo bastante matematico,
desenvolvem condicoes gerais, que garantem a consistencia e normalidade assintotica
do estimador de MV nos MLG.
Para amostras pequenas, como citado em i), o estimador e viesado e torna-
se necessario computar o vies de ordem n1 que pode ser apreciavel. Tambem, para
n nao muito grande, como visto em ii), a estrutura de covariancia das estimativas de
MV dos parametros lineares difere de K1 . Uma demonstracao rigorosa dos resulta-
dos assintoticos (4.3) e (4.4) exige argumentos do teorema central do limite adaptado
ao vetor escore U() e da lei fraca dos grandes numeros aplicada a matriz de in-
formacao K. Pode-se, entao, demonstrar, com mais rigor, a normalidade assintotica
de , com media igual ao parametro verdadeiro desconhecido, e com matriz de co-
c 1 em que W
variancia consistentemente estimada por K1 = (XT WX) c e a matriz
de pesos W avaliada em .
Para as distribuicoes binomial e de Poisson = 1. Se o parametro de
dispersao for constante para todas as observacoes e desconhecido afetara a matriz
Modelos Lineares Generalizados 53
d r ) e o valor de r,r em .
em que r,r = Var(
A correlacao rs entre as estimativas r e s segue como
d r,s
rs = Corr(r , s ) = ,
r,r s,s
XT X = XT y
Modelos Lineares Generalizados 55
= 2 (XT X)1 ,
( )T K( ) 2p ,
Sp = 2(`n `p ),
58 Gauss M. Cordeiro & Clarice G.B. Demetrio
n
Dp 2X
Sp = = [yi (i i ) + b(i ) b(i )], (4.6)
i=1
sendo que d2i mede a diferenca dos logaritmos das funcoes de verossimilhanca obser-
vada e ajustada, para a observacao i correspondente, e e chamado componente do
desvio. A soma deles mede a discrepancia total entres as duas funcoes de verossi-
milhanca na escala logartmica. E portanto, uma medida da distancia dos valores
ajustados 0 s em relacao aos dados observados y 0 s, ou de forma equivalente, do mo-
delo corrente em relacao ao modelo saturado. Verifica-se que o desvio equivale a uma
constante menos duas vezes o maximo do logaritmo da funcao de verossimilhanca
para o modelo corrente, isto e,
ou ainda,
n
X
yi mi yi
Sp = 2 yi log + (mi yi ) log .
i=1
i mi i
que pode ainda ser simplificada em alguns casos especiais. Se algum componente e
igual a zero, segundo Paula (2004), pode-se substituir Dp por
Xn
yi
Dp = 2c(y) + 2 log i + ,
i=1
i
Modelos Lineares Generalizados 61
sendo c(y) uma funcao arbitraria, porem limitada. Pode ser usada, por exemplo, a
Xn
yi
expressao c(y) = .
i=1
1 + y i
Na Tabela 4.1 apresentam-se as funcoes desvios para os principais modelos.
Modelo Desvio
n
X
Normal Dp = (yi i )2
i=1
X n
yi mi yi
Binomial Dp = 2 yi log + (mi yi ) log
i=1
i mi i
Xn
yi
Poisson Dp = 2 yi log (yi i )
i=1
i
Xn
yi i + k
Binomial negativo Dp = 2 yi log + (yi + k) log
i=1
i yi + k
n
X
i yi i
Gama Dp = 2 log +
i=1
yi i
n
X (yi i )2
Normal Inverso Dp =
i=1
yi 2i
Quanto melhor for o ajuste do MLG aos dados tanto menor sera o valor do
desvio Dp . Assim, um modelo bem ajustado aos dados, tera uma metrica ||y ||
pequena, sendo essa metrica definida na escala da funcao desvio.
Uma maneira de se conseguir a diminuicao do desvio e aumentar o numero
de parametros, o que, porem, significa um aumento do grau de complexidade na
interpretacao do modelo. Na pratica, procuram-se modelos simples com desvios
moderados, situados entre os modelos mais complicados e os que se ajustam mal
aos dados. Para testar a adequacao de um MLG, o valor calculado do desvio com
n p graus de liberdade, sendo p o posto da matriz do modelo, deve ser comparado
com o percentil de alguma distribuicao de probabilidade de referencia. Para o mo-
delo normal com funcao de ligacao identidade, assumindo-se que o modelo usado e
62 Gauss M. Cordeiro & Clarice G.B. Demetrio
verdadeiro e que 2 e conhecido, tem-se o resultado exato
Dp
Sp = 2np .
2
Entretanto, para modelos normais com outras funcoes de ligacao, esse re-
sultado e apenas uma aproximacao. Em alguns casos especiais, com delineamentos
experimentais simples, considerando-se as distribuicoes exponencial (caso especial da
gama) e normal inversa, tambem, podem ser obtidos resultados exatos. No geral,
porem, apenas alguns resultados assintoticos estao disponveis e, em alguns casos, o
desvio, nao tem distribuicao 2np , nem mesmo assintoticamente. O desvio corrigido
por uma correcao de Bartlett proposta para os MLG por Cordeiro (1983, 1987, 1995)
tem sido usado para melhorar a sua aproximacao pela distribuicao 2np de referencia.
Com efeito, o desvio modificado Sp = (np)Sp /E(Sp ), em que a correcao de Bartlett
e dada por (n p)/E(Sp ) quando E(Sp ) e determinado ate termos de ordem O(n1 ),
sendo E(Sp ) o valor de E(Sp ) avaliada em , e melhor aproximado pela distribuicao
2np de referencia do que o desvio Sp , conforme comprovam os estudos de simulacao
de Cordeiro (1993).
Assumindo-se que o modelo usado e verdadeiro, para a distribuicao binomial,
quando n e fixo e mi , i (nao vale quando mi i (1 i ) permanece limitado)
e para a distribuicao de Poisson, quando i , i, tem-se que (lembre-se que
= 1):
Sp = Dp 2np .
Sp 2np quando 0,
Sp = 1 Dp 2np; ,
sendo V (i ) a funcao de variancia estimada sob o modelo que esta sendo ajustado
aos dados.
Xp2 SQRes
Para respostas com distribuicao normal, 2
= e, entao,
2
Xp2 2 2np ,
Exemplo 4.4: Considere os dados do Exemplo 2.1 da Secao 2.2. A variavel resposta
tem distribuicao binomial, isto e, Yi B(mi , i ). Adotando-se a funcao de ligacao
logstica (canonica) e o preditor linear dado por uma regressao linear simples, isto e,
i
i = log = 0 + 1 di ,
m i i
c ).
Xp2 = (z )T W(z
Sq Sp = 1 (Dq Dp ) 2pq ,
(Dq Dp )/(p q)
F = Fpq,nm .
Para a distribuicao normal, tem-se
i
i = log = 0 + 1 di ,
m i i
dois modelos encaixados podem ser propostos para a analise desses dados, a saber:
a) o modelo nulo: i = 0 e
Tabela 4.3: Desvios e X 2 residuais obtidos para dois modelos encaixados ajustados
aos dados da Tabela 2.1.
Modelo g.l. Desvios X2
i = 0 5 163,74 135,70
i = 0 + 1 di 4 10,26 9,70
Tabela 4.4: Analise do Desvio, considerando o modelo logstico linear ajustado aos
dados da Tabela 2.1.
Causa de Variacao g.l. Desvios Valor p
Regressao linear 1 153,48 < 0, 0001
Resduo 4 10,26
Total 5 163,74
21;0,05 = 3, 84; 21;0,01 = 6, 64
*
*
0.8
0.6
Proporo
*
0.4
*
0.2
*
0.0
0 2 4 6 8 10
Dose
Figura 4.1: Valores observados e curva ajustada pelo modelo logstico linear aos
dados da Tabela 2.1
## Grafico de dispers~
ao
plot(dose,y/m, xlab="Dose", ylab="Proporc~
oes observadas", pch="*")
## Analise do desvio
resp<-cbind(y,m-y)
Rotenon1<-glm(resp~1, family=binomial)
Rotenon2<-glm(resp~dose, family=binomial)
summary(Rotenon2)
anova(Rotenon1, Rotenon2, test="Chisq")
## Grafico
plot(c(0,10.2), c(0,1), type="n", xlab="Dose", ylab="Proporc~
ao")
points(dose,y/m,pch="*")
x<-seq(0,10.2,0.2)
lp<-predict(Rotenon2,data.frame(dose=x))
pe<-exp(lp)/(1+exp(lp))
lines(x,pe,lty=1)
X n n
X dc(yi , )
`(, )
U = = 2 [yi i b(i )] + .
i=1 i=1
d
em que o desvio Dp e dado na Tabela 4.1 e (r) = d log (r)/dr e a funcao digama
(funcao psi). Uma aproximacao para obtida de (4.11) foi dada por Cordeiro e
McCullagh (1991) para valores pequenos de
2Dp
= 1/2 .
2Dp
n 1 + 1 + 3n
g(; )
em que D(; ) = e uma matriz de dimensoes n r que depende de
e . Seja 0 a EMV de obtida do ajuste do modelo g(; (0) ) = X e 0 =
g 1 (X 0 ; (0) ). Estima-se D(; (0) ) por D(0) = D(0 ; (0) ).
Se a expansao (4.12) for adequada, pode-se considerar a estrutura linear
(0)
g(; ) = X D (0)
+ D(0) (0) (4.13)
Resduos
5.1 Introducao
A escolha de um modelo linear generalizado envolve tres passos:
75
76 Gauss M. Cordeiro & Clarice G.B. Demetrio
Na pratica, em geral, ha uma combinacao dos diferentes tipos de falhas.
Assim, por exemplo, a deteccao de uma escolha errada da funcao de ligacao pode
ocorrer porque ela esta realmente errada ou porque uma ou mais covariaveis estao na
escala errada ou devido a presenca de alguns pontos discrepantes. Isso faz com que
a verificacao da adequacao de um modelo para um determinado conjunto de dados
seja um processo realmente difcil.
Maiores detalhes podem ser vistos em Atkinson (1985), Atkinson et al.
(1989), Cordeiro (1986), McCullagh e Nelder (1989), Francis et al. (1993) e Paula
(2004).
- inclusao de uma funcao de ligacao g() em uma famlia maior g(, ), sendo
um exemplo a famlia de Aranda-Ordaz (1981);
- os resduos ordinarios ri = yi i ;
Pn
- a variancia residual estimada, 2 = s2 = QM Res = i=1 (yi i )2 /(n p);
ri = yi i .
e, portanto,
1 x2 1 (Xi X)2
hii = + Pn i 2 = + Pn 2 , elementos da diagonal de H e
n i=1 xi n i=1 xi
1 xi x j 1 (Xi X)(Xj X)
hij = + Pn 2 = + Pn 2 , elementos fora da diagonal de H,
n i=1 xi n i=1 xi
o que mostra que a medida que X se afasta de X o valor de hii aumenta e que seu
valor mnimo e 1/n. Esse valor mnimo ocorre para todos os modelos que incluem
uma constante. No caso em que o modelo de regressao passa pela origem, o valor
mnimo de hii e 0 para uma observacao Xi = 0. O valor maximo de hii e 1, ocorrendo
quando o modelo ajustado e irrelevante para a predicao em Xi e o resduo e igual a
0. Sendo H uma matriz de projecao, tem-se H = H2 e, portanto,
n
X X
hii = h2ij = h2ii + h2ij
j=1 j6=i
Pn
concluindo-se que 0 hi 1 e j=1 hij = 1. Alem disso,
n
X
T 1 T T 1 T
r(H) = tr[X(X X) X ] = tr[(X X) X X] = tr(Ip ) = hii = p,
i=1
b) DFBeta
E importante quando o coeficiente de regressao tem um significado pratico.
Mede a alteracao no vetor estimado ao se retirar o i-esimo ponto da analise. E
dado por
ri
DF Beta(i) = (i) = (XT X)1 xTi .
(1 hii )
Nao tem interpretacao simples. Cook e Weisberg (1982) propuseram curvas
empricas para o estudo dessa medida.
c) DFFitS
Mede a alteracao provocada no valor ajustado pela retirada da observacao
i. E dada por
ou, ainda,
21 12
hii ri hii
DF F itS(i) = 1 = rsei
1 hii s(i) (1 hii ) 2 1 hii
hii
sendo o quociente , chamado potencial de influencia, uma medida da distancia
1 hii
do ponto X em relacao as demais observacoes. Belsley et al. (1980) (p. 28) sugerem
p
que valores absolutos excedendo 2 p/n podem identificar observacoes influentes.
d) Distancia de Cook
84 Gauss M. Cordeiro & Clarice G.B. Demetrio
" #2
( (i) )T (XT X)( (i) ) hii ri2 ri hii
D(i) = = = 1
ps2 (1 hii )2 ps2 (1 hii ) 2 s p(1 hii )
ou, ainda,
hii rsi2i
D(i) = .
p (1 hii )
f) Graficos de ndices
Servem para localizar observacoes com resduos, hii (leverage), distancia
de Cook modificada etc, grandes.
e, portanto,
= (XT X)1 XT y (XT X)1 XT U
e
U T (I H)y U T (I H)(I H)y uT r
= = =
U T (I H)U U T (I H)(I H)U uT u
que e o coeficiente angular de uma reta que passa pela origem sendo r = y X =
(IH)y os resduos de y ajustado para X e u = (IH)U os resduos de U ajustado
para X.
O grafico da variavel adicionada (added variable plot) de r versus u ,
portanto, tem coeficiente angular (diferente do grafico de r versus U ) e e obtido a
partir dos resduos ordinarios da regressao de y como funcao de todas as covariaveis,
Modelos Lineares Generalizados 87
exceto U = xj , versus os resduos ordinarios da regressao de U = xj como funcao das
mesmas covariaveis usadas para modelar y. Assim, por exemplo, para um modelo
com 3 covariaveis, o grafico da variavel adicionada para x3 e obtido a partir de
= 0 + 1 x1 + 2 x2 r = y
e
x3 = 00 + 10 x1 + 20 x2 u = x3 x3 .
Esse grafico tem, tambem, o nome de Q-Q plot, por relacionar os valores de
um quantil amostral (d(i) ) versus os valores do quantil correspondente da distribuicao
normal (zi ).
Modelos Lineares Generalizados 89
A construcao do grafico semi-normal de probabilidades (half normal plot)
e o resultado do conjunto de pontos obtidos por valores |d|(i) versus zi em que zi =
1 (i + n 0, 125)/(2n + 0, 5).
McCullagh e Nelder (1989) sugerem o uso do grafico normal de probabili-
dades para resduos e o grafico semi-normal de probabilidades (half normal plot)
para medidas positivas como e o caso de hii (medida de leverage) e da distancia de
Cook modificada. No caso do grafico normal de probabilidades para resduos, espera-
se que na ausencia de pontos discrepantes, o aspecto seja linear, mas nao ha razao
para se esperar que o mesmo aconteca quando sao usados hii ou a distancia de Cook
modificada. Os valores extremos aparecerao nos extremos do grafico, possivelmente
com valores que desviam da tendencia indicada pelos demais.
Para auxiliar na interpretacao do grafico semi-normal de probabilidades
(half normal plot), Atkinson (1985) propos a adicao de um envelope simulado.
Esse grafico e obtido, seguindo-se os passos:
i) ajuste um determinado modelo a um conjunto de dados e obtenha d(i) ,
os valores absolutos ordenados de uma certa estatstica de diagnostico (resduos,
distancia de Cook, hii (leverage) etc);
ii) simule 19 amostras da variavel resposta, usando as estimativas obtidas
apos um determinado modelo ser ajustado aos dados e os mesmos valores para as
variaveis explanatorias;
iii) ajuste o mesmo modelo a cada uma das 19 amostras e calcule os valores
absolutos ordenados da estatstica de diagnostico de interesse, dj(i) , j = 1, . . . , 19,
i = 1, . . . , n;
iv) para cada i, calcule a media, o mnimo e o maximo dos dj(i) ;
v) coloque em um grafico as quantidades obtidas no item anterior e d(i)
versus zi .
Esse envelope e tal que sob o modelo correto as quantias (resduos, lever-
age, distancia de Cook etc) obtidas a partir dos dados observados caem dentro do
90 Gauss M. Cordeiro & Clarice G.B. Demetrio
envelope. Demetrio e Hinde (1997) apresentam um conjunto de macros que permitem
fazer esses graficos para uma grande variedade de modelos, usando o software GLIM.
o que e equivalente a substituir X por W1/2 X. Note-se que, agora H depende das
variaveis explicativas, da funcao de ligacao e da funcao de variancia, tornando mais
difcil a interpretacao da medida de leverage. Pode ser mostrado que
V1/2 ( u)
= HV1/2 (Y ),
sendo V = diag{V (i )}. Isso mostra que H mede a influencia em unidades estuden-
tizadas de y sobre .
Modelos Lineares Generalizados 91
Ri = hi (yi , i ), (5.2)
ii) Ri versus i ;
iii) Ri versus i;
ri = yi i .
b) Resduos de Pearson
O resduo mais simples e o de Pearson, definido por
yi i
riP = 1/2
. (5.3)
Vi
c) Resduos de Anscombe
Anscombe (1953) apresenta uma definicao geral de resduo, atraves de uma
transformacao N (yi ) da observacao yi , escolhida visando torna-lo tal que sua dis-
tribuicao esteja, o mais proximo possvel, da distribuicao normal. Barndorff-Nielsen
R
(1978) demonstra que, para os MLG, N (.) e dada por N () = V 1/3 d. Como
N 0 ()(V /)1/2 e a aproximacao de primeira ordem para o desvio padrao de N (y),
o resduo de Anscombe, visando a normalizacao e a estabilizacao da variancia, e
expresso por
N (yi ) N (i )
Ai = 1/2
. (5.4)
N 0 (i )Vi
94 Gauss M. Cordeiro & Clarice G.B. Demetrio
Da definicao do resduo de Anscombe, conclui-se que a transformacao apli-
cada aos dados para normalizar os resduos e a mesma que aplicada as medias dos
dados e normaliza a distribuicao de .
Para os modelos de Poisson, gama e normal inverso, os resduos de Anscombe
sao facilmente obtidos de (5.4) como 3(y 2/3 2/3 )/(21/6 ), 3(y 1/3 1/3 )/1/3 e
(log y log )/1/2 , respectivamente. Para o modelo binomial B(m, ), (5.4) reduz-se
1/2 R
a Ai = mi [N (yi ) N (i )]/[i (1 i )]1/6 , em que N () = [(1 )]1/3 d. Cox
e Snell (1968) calculam esse resduo atraves da funcao beta incompleta.
0 yi i
riP = q , (5.5)
V (i )(1 hii )
e) Componentes do desvio
Os resduos podem, tambem, ser definidos como iguais as razes quadradas
dos componentes do desvio com sinal dado pelo sinal de yi i . Tem-se,
riD = sinal(yi i ) 2{v(yi ) v(i ) + q(i )(i yi }1/2 , (5.6)
em que a funcao v(x) = xq(x) b(q(x)) e definida em termos das funcoes b() e q()
dadas na Secao 1.3.
O resduo riD representa uma distancia da observacao yi ao seu valor ajus-
tado i , medida na escala do logaritmo da funcao de verossimilhanca. Tem-se
X n
2
Dp = riD . Um valor grande para riD indica que a i-esima observacao e mal
i=1
ajustada pelo modelo. Pregibon (1979) demonstra que, se existe uma transformacao
hi que normaliza a distribuicao do resduo Ri = hi (yi , i ), entao as razes quadradas
Modelos Lineares Generalizados 95
dos componentes do desvio sao resduos que exibem as mesmas propriedades in-
duzidas por essa transformacao. Assim, os resduos riD podem ser tratados, aproxi-
2
madamente, como variaveis aleatorias normais e, consequentemente, riD como tendo,
aproximadamente, distribuicao 21 .
Para os modelos de Poisson, gama, binomial e normal inverso, os
resduos definidos como as razes quadradas dos componentes do desvio, tem
as formas respectivas: {2 [y log(y/) + y]}1/2 , {2[log(/y) + (y )/]}1/2 ,
(2m{y log(y/) + (1 y) log[(1 y)/(1 )]})1/2 e (y )/(y 1/2 ), em que re-
presenta o sinal de (y ).
As vantagens do resduo (5.6) sao: i) nao requer o conhecimento da funcao
normalizadora; ii) computacao simples apos o ajuste do MLG; iii) e definido para
toda observacao e, mesmo para observacoes censuradas, desde que essas fornecam
uma contribuicao para o logaritmo da funcao de verossimilhanca.
0 riD
riD = p .
1 hii
0
Os resduos riD sao, entao, definidos a partir de (5.6).
Os resduos de Pearson, de Anscombe e componentes do desvio dados em
(5.3), (5.4) e (5.6), respectivamente, sao os mais importantes nas aplicacoes dos
MLG.
No modelo normal, nenhuma distincao e feita entre esses tres tipos de
resduos. Para modelos bem ajustados, as diferencas entre riD e riP devem ser pe-
quenas. Entretanto, para os modelos mal-ajustados e/ou para observacoes aber-
rantes, podem ocorrer diferencas consideraveis entre esses resduos. Embora os
resduos, definidos por (5.4) e (5.6), apresentem formas bem diferentes para mo-
delos nao-normais, os seus valores, dados y e , sao similares. Admite-se que = cy,
em que c e um real qualquer. Seja A/D o quociente entre os dois resduos: de
Anscombe (A) e aquele, definido como a raiz quadrada do componente do desvio
96 Gauss M. Cordeiro & Clarice G.B. Demetrio
(D). Para os modelos de Poisson, gama e normal inverso esse quociente e igual
a 3(1 c2/3 )/(2 2)c1/6 (c 1 log c)1/2 ; 3(1 c1/3 )c1/6 / 2(c log c + 1 c)1/2 e
c1/2 log c/(c 1), respectivamente, em que = +1(1) quando c < 1(> 1).
A Tabela 5.1 apresenta valores do quociente A/D para esses tres mode-
los. Dessa tabela, conclui-se que esses dois resduos sao, aproximadamente, equiva-
lentes. Essa equivalencia poderia ainda ser vista por expansoes em serie de Taylor.
McCullagh e Nelder (1989) comparam os resduos de Pearson, de Anscombe e como
componentes do desvio para o modelo de Poisson.
Definindo-se uma distribuicao teorica conveniente para os resduos, podem-
se aplicar as diversas tecnicas analticas e graficas para detectar desvios do modelo
sob pesquisa.
Tabela 5.1: Relacao A/D entre o resduo de Anscombe e o definido como a raiz
quadrada da componente do desvio, para tres modelos.
1987).
f) Graficos de ndices
Servem para localizar observacoes com resduo, leverage (hii ), distancia
de Cook modificada etc, grandes.
c 1 XT Wz,
= (XT WX) c
c
z = (I ZW)z.
c 1/2 (z )] I H.
Cov[W
A conclusao pratica importante e que para uma analise mais cuidadosa dos
graficos i), i), i) e iv), descritos na Secao 5.4.1, devem-se usar os resduos de
0
Pearson estudentizados riP definidos em (5.5), em que o denominador e [V (i )(1
hii )]1/2 ao inves de V (i )1/2 .
Exemplo 5.2: Considere os dados do Exemplo 2.1. A variavel resposta tem dis-
tribuicao binomial, isto e, Yi B(mi , i ). Adotando-se a funcao de ligacao logstica
(canonica) e os preditores lineares dados por
i
i = log = 1 + 2 di ,
mi i
e
i
i = log = 1 + 2 di + ui ,
m i i
sendo ui = i2 , usa-se a diferenca de desvios para testar a adequacao da funcao de
ligacao, obtendo-se os resultados da Tabela 5.2. Verifica-se que se rejeita a hipotese
H0 : = 0, ao nvel de 5% de probabilidade, indicando que a ligacao logstica nao e
adequada. A estimativa para e = 0, 2087 com erro padrao 0,0757.
A Figura 6.1 mostra os graficos de dispersao das variaveis duas a duas para
os dados observados sem transformacao e com transformacao logartmica. Pode-se
ver que existe uma relacao mais forte entre volume e diametro a altura do peito, do
que entre volume e altura. Alem disso, que a variavel altura tem variabilidade maior
do que a variavel diametro a altura do peito.
As Tabelas 6.2 e 6.3 mostram os resultados obtidos para a analise dos da-
dos sem transformacao e com transformacao logartmica. Verifica-se que existem
evidencias, ao nvel de 1% de probabilidade, que os efeitos tanto de diametro a al-
tura do peito como de altura sao significativos, sendo que o efeito de diametro a
altura do peito e maior que o de altura, tanto para o caso de dados nao transforma-
dos como para transformados. Ha necessidade, porem, de um estudo mais detalhado,
105
106 Gauss M. Cordeiro & Clarice G.B. Demetrio
Tabela 6.1: Medidas de diametro a 4,5 pes acima do solo (D, polegadas) e altura
(H, pes) de 21 cerejeiras (black cherry) em pe e de volume (V , pes cubicos) de
arvores derrubadas
Amostra D H Y Amostra D H Y
1 8,3 70 10,3 17 12,9 85 33,8
2 8,6 65 10,3 18 13,3 86 27,4
3 8,8 63 10,2 19 13,7 71 25,7
4 10,5 72 16,4 20 13,8 64 24,9
5 10,7 81 18,8 21 14,0 78 34,5
6 10,8 83 19,7 22 14,2 80 31,7
7 11,0 66 15,6 23 14,5 74 36,3
8 11,0 75 18,2 24 16,0 72 38,3
9 11,1 80 22,6 25 16,3 77 42,6
10 11,2 75 19,9 26 17,3 81 55,4
11 11,3 79 24,2 27 17,5 82 55,7
12 11,4 76 21,0 28 17,9 80 58,3
13 11,4 76 21,4 29 18,0 80 51,5
14 11,7 69 21,3 30 18,0 80 51,0
15 12,0 75 19,1 31 20,6 87 77,0
16 12,9 74 22,2
Modelos Lineares Generalizados 107
3.0
20
18
2.8
16
2.6
D logD
14
2.4
12
10
2.2
8
4.45
85
80
4.35
H logH
75
4.25
70
65
4.15
70
4.0
60
50
3.5
V logV
40
3.0
30
20
2.5
10
8 10 12 14 16 18 20 10 20 30 40 50 60 70 2.2 2.4 2.6 2.8 3.0 2.5 3.0 3.5 4.0
E comum supor que a producao media de gordura Yi tem distribuicao com media
i ti eti
o que mostra a necessidade do uso de funcao de ligacao logartmica. Pode-se supor ainda
que Yi N(i , 2 ), isto e,
Yi = i + i = ti eti + i
em que i N(0, 2 ).
Entretanto, na pratica e comum supor que log(Yi ) N(log i , 2 ), isto e,
em que i N(0, 2 ).
A Figura 6.2 mostra que usar a distribuicao normal com funcao de ligacao
logartmica da um melhor ajuste do que fazer transformacao logartmica dos dados e usar
distribuicao normal com funcao de ligacao identidade. Necessaria se faz a complementacao
com analise de resduos e diagnosticos. O programa em R encontra-se no Apendice.
Modelos Lineares Generalizados 111
* Observed
0.8
Log transformation
Log link
*
* * **
0.6
** *
* ***
0.4
* *
* ** * ****
*
0.2
* *
*
*
**
0.0 **
0 5 10 15 20 25 30 35
Weeks
A Figura 6.3 mostra os graficos de dispersao das variaveis duas a duas para os
dados observados e considerando o logaritmo e o inverso da variavel resposta. Verifica-se
que existe uma relacao nao-linear entre IM e as variaveis explanatorias TCI e RN. Essa
relacao nao-linear diminui, porem, nao desaparece quando se usa o logaritmo da variavel
resposta. Entretanto, a transfomacao 1/IM parece linearizar a relacao com as variaveis
explanatorias. Nota-se, contudo, a presenca de heterogeneidade de variancias em todos
os casos, pincipalmente relacionada a variavel RN. A relacao entre TCI e RN nao parece
muito forte e mostra uma variabilidade grande. Portanto, espera-se de antemao uma falta
de ajuste do modelo com distribuicao normal.
112 Gauss M. Cordeiro & Clarice G.B. Demetrio
IM TCI RN IM TCI RN
5482 1.629 82.17 4046 1.423 109.40
5749 1.517 88.80 5495 1.356 111.36
6043 1.331 87.94 5173 1.244 105.50
5679 1.181 85.28 4576 1.046 97.60
5605 1.315 82.06 4265 1.091 96.39
5565 1.217 86.49 5474 1.091 106.01
5610 1.177 82.62 6345 1.300 100.01
5309 1.135 78.30 4330 1.380 91.70
4804 1.434 78.34 5034 1.354 104.02
4872 1.306 87.11 5614 1.314 108.26
5071 1.209 85.77 6015 1.452 101.05
4646 1.156 80.91 4630 1.499 97.02
3824 1.740 75.88 4725 1.626 101.71
3651 2.004 83.65 5221 1.467 103.80
3907 1.957 82.80 5976 1.441 101.30
4044 1.959 80.10 5230 1.421 99.90
3155 1.971 79.10 6007 1.388 106.90
3406 2.015 87.59 7328 1.340 108.92
3730 2.024 87.19 6914 1.305 106.01
3623 2.027 85.94 6049 1.283 104.01
3094 2.036 84.55 7087 1.279 109.66
3016 2.219 92.47 8023 1.075 115.30
3132 2.201 95.23 11814 0.957 116.45
3925 2.131 94.44 12065 0.942 113.92
3352 2.013 90.69 13651 0.955 116.09
2760 2.023 99.48 11917 0.951 115.67
3661 1.991 102.87 12030 0.970 114.93
4270 1.924 101.15 10738 0.980 111.63
3565 1.832 97.65 12478 0.995 118.06
3610 1.792 106.21 14235 1.012 122.90
3987 1.914 103.45 15837 1.030 120.69
3888 1.789 101.10 13150 1.049 116.90
3516 1.692 97.72 15405 1.067 123.85
3349 1.657 105.78 16930 1.086 126.37
3776 1.643 105.84 15873 1.106 122.55
3963 1.607 98.87 13415 1.126 118.11
3548 1.557 95.01 14591 1.147 125.74
Modelos Lineares Generalizados 113
10000 16000
IM
4000
8.0 8.5 9.0 9.5
logIM
0.00025
invIM
0.00005
2.2
1.8
TCI
1.4
1.0
120
RN
100
80
4000 10000 16000 0.00005 0.00025 80 100 120
2
1
valor observado
resduos
0
8000
6000
1
4000
2
2000 4000 6000 8000 10000 12000 2000 4000 6000 8000 10000 12000
Normal(identidade) Normal(identidade)
2
2
1
1
resduos
resduos
0
0
1
1
2
1.0 1.2 1.4 1.6 1.8 2.0 2.2 80 90 100 110 120
TCI RN
2000
0.2
1000
2000
0.0
Residuo
Residuo
Residuo
0
0
1000
0.2
2000
2000
0.4
3000
4000
2 1 0 1 2 2 1 0 1 2 2 1 0 1 2
E importante notar que o desvio para modelos com distribuicoes contnuas de-
pende da escala dos dados como mostra a Tabela 6.6, nao servindo, portanto, como es-
Modelos Lineares Generalizados 115
tatstica para verificacao de ajuste. No caso da distribuicao normal, os desvios residuais
sao chamados de Somas de Quadrados Residuais. Verifica-se, tambem, que a estatstica
AIC depende da escala da variavel resposta (IM ou log(IM)).
Tabela 6.6: Resumo do ajuste do modelo linear generalizado normal para diferentes
funcoes de ligacao.
Variavel resposta F. de Ligacao Desvio Residual AIC
IM 315765900 2109 1347,7
log(IM) 4,0 0,2382 2,6
IM log 146543227 1436,7 1290,9
Tabela 6.7: Resumo do ajuste do modelo linear generalizado gama para diferentes
funcoes de ligacao.
F. de Ligacao Desvio AIC
1/ 0,0307 2,294 1240,9
log 0,0524 3,908 1280,6
0,0892 6,191 1315,0
Modelos alternativos podem ser usados, supondo-se que IMi G(i , ) com as
funcoes de ligacao canonica (inversa), logartmica e identidade. A Tabela 6.8 mostra um
resumo, considerando o ajuste para esses tres casos. Ve-se que o modelo com menor AIC
e aquele com distribuicao gama e funcao de ligacao canonica (inversa). Entretanto, seria
interessante completar com estudos de simulacao e testes bootstrappara a escolha do
melhor modelo.
A Figura 6.6 mostra os graficos dos valores ajustados versus valores observados e os
graficos normais de probabilidade desses tres modelos fazendo-se suposicao de distribuicao
gama para a variavel resposta com funcoes de ligacao inversa, identidade e logartmica,
confirmando o modelo escolhido.
Outros estudos referentes a pontos discrepantes e/ou influentes sao necessarios.
Um resumo das estatsticas para o modelo escolhido encontra-se na Tabela 6.8.
Gamma(inversa) Gamma(identity) Gamma(log)
16000
16000
16000
14000
14000
14000
12000
12000
12000
valor observado
valor observado
valor observado
10000
10000
10000
8000
8000
8000
6000
6000
6000
4000
4000
4000
4000 6000 8000 10000 12000 14000 4000 6000 8000 10000 4000 6000 8000 10000 12000
0.4
0.6
0.4
0.4
0.2
0.2
0.2
0.0
Residuo
Residuo
Residuo
0.0
0.0
0.2
0.2
0.2
0.4
0.4
0.4
2 1 0 1 2 2 1 0 1 2 2 1 0 1 2
Figura 6.6: Importacao - Graficos dos valores ajustados versus valores observados,
supondo-se distribuicao gama
Tabela 6.8: Resumo do ajuste do mlg gama com funcao de ligacao inversa log(1/).
Parametro Estimativa e.p. t Pr(>|t|)
(Intercepto) 2.587e-04 4.372e-05 5.917 1.05e-07 ***
TCI 1.413e-04 1.320e-05 10.699 < 2e-16 ***
RN -2.729e-06 2.891e-07 -9.439 3.64e-14 ***
Captulo 7
p 1 p
logit(p) = log = 0 + 1 p p = (log 0 ), logstico;
1p 1 1p
117
118 Gauss M. Cordeiro & Clarice G.B. Demetrio
1
probit(p) = 1 (p) = 0 + 1 p p = [1 (p) 0 ], probit;
1
1
log[ log(1 p)] = 0 + 1 p p =
{log[ log(1 p)] 0 }, clog-log e
1
1 (1 p) 1 1 (1 p)
log = 0 + 1 p p = log 0 , Aranda-Ordaz
(1 p) 1 (1 p)
(1981).
g(0 , 1 ) g(0 , 1 )
g(0 , 1 ) = g(0 , 1 ) + (0 0 ) |(0 ,1 ) +(1 1 ) |(0 ,1 ) ,
0 1
!
g(0 , 1 ) g(0 , 1 ) 1 F 1 (p) 0
em que T = |(0 ,1 ) , |(0 ,1 ) = , .
0 1 1 12
Logo,
d p ) = T V = 1 {Var(
Var( d 0 ) + p2 Var(
d 1 ) + 2p Cov(
d 0 , 1 )}.
2
1
[1 p + 0 F 1 (p)]2
N(0, 1).
Var(0 ) + 2p Cov(0 , 1 ) + p2 Var(1 ))
Logo, um intervalo de confianca para p pode ser obtido como a solucao da in-
equacao
[1 p + 0 F 1 (p)]2 2
< z/2 ,
Var(0 ) + 2p Cov(0 , 1 ) + p2 Var(1 )
sendo que os limites do intervalo de confianca serao dados pelas razes da correspondente
equacao de segundo grau. No caso de razes complexas, o intervalo nao existira. Em geral,
120 Gauss M. Cordeiro & Clarice G.B. Demetrio
os resultados sao semelhantes aos obtidos pelo metodo delta. Uma outra alternativa e o
metodo baseado na razao de verossimilhancas, que nao sera tratado aqui.
Exemplo 7.1: Usando-se os dados do Exemplo 4.5, e calculando-se a dose letal que
mata 50% dos insetos e os intervalos de confianca com um coeficiente de confianca de 90%
de probabilidade, pelos 3 metodos obtiveram-se os resultados:
3, 226
i) dose letal: 50 = = 5, 33;
0, 6051
para j = 1, . . . , k. O ajuste desses modelos aos dados e testado atraves das diferencas dos
desvios residuais. No caso em que existem evidencias de que o modelo de retas paralelas
(p)
ajusta-se bem aos dados, tem-se, entao, que a dose efetiva (j ) para 100p% dos indivduos
e obtida a partir de:
p (p)
logit(p) = log = j + j , j = 1, . . . , k.
1p
Portanto, para j 6= j 0 , tem-se
j j 0 (p) (p)
= j 0 j .
Modelos Lineares Generalizados 121
Se x = log(d), entao,
(p) (50)
j j 0 dj j j 0 DEj 0
= log (p)
= log jj 0 jj 0 = = (50)
dj DEj
Consideracoes
Variavel resposta: Yi numero de insetos mortos em amostras de tamanho mi = 20
Distribuicao: Binomial
122 Gauss M. Cordeiro & Clarice G.B. Demetrio
Parte sistematica: completamente casualizado, modelos de regressao.
Objetivo: determinacao de doses letais.
A Tabela 7.2 apresenta os desvios residuais, estatsticas X 2 e seus respectivos
numeros de graus de liberdade (g.l.) e a Tabela 7.3, a Analise de desvios.
Ve-se que existem evidencias de que o modelo com preditor linear com dois fatores,
sexo (com dois nveis, j = 1, 2) e dose (com 6 nveis, k = 1, . . . , 6, em princpio sem levar
em consideracao o fato de serem quantitativos), ajusta-se bem aos dados, enquanto que os
modelos mais simples, nao.
Pela Tabela 7.3 verifica-se que ha evidencias para efeito significativo de sexo e de
dose. Note-se, ainda, que os desvios para sexo ignorando dose e, para sexo ajustado para
dose, sao diferentes devido a nao ortogonalidade por se estar considerando a distribuicao
binomial. O mesmo ocorre para dose ignorando sexo e, para dose ajustada para sexo.
Modelos Lineares Generalizados 123
Pode-se, ainda, tentar uma simplificacao desse modelo, considerando que dose e um fator
quantitativo. Se for usado como preditor linear um polinomio com x = dose, verifica-se
que ha necessidade de grau 3. Como, porem, as doses estao em progressao geometrica e
conveniente usar como variavel regressora x = log2 (dose), considerando-se os modelos de
retas concorrentes, paralelas, com intercepto comum e coincidentes. Os resultados para o
desvio e a estatstica X 2 residuais estao apresentados na Tabela 7.4.
Pela Tabela 7.4, ve-se que existem evidencias que os modelos com retas concor-
rentes, paralelas e com intercepto comum ajustam-se bem aos dados. Tem-se, ainda, que
as diferencas de deviances entre os modelos com retas paralelas e retas concorrentes (6,76 -
4,99 = 1,77) e entre os modelos com intercepto comum e retas concorrentes (5,04 - 4,99 =
0,05), ambas com 1 grau de liberdade, nao sao estatisticamente significativas. Utilizando de
parcimonia e facilidade de interpretacao opta-se pelo modelo de retas paralelas. A Tabela
7.5 traz a analise de desvios para o modelo escolhido.
*
*
0.8
+
Proportions
*
0.6
+
+
*
0.4
+
0.2
*
+
+*
0.0
1 2 5 10 20
log(dose)
Figura 7.1: Cypermetrin - Proporcoes observadas e curvas ajustadas
Verifica-se que as femeas sao mais resistentes, pois para matar 100p% das femeas
ha necessidade de uma dose 2 vezes maior do que para matar 100p% dos machos. Pode-se
verificar que a dose letal para p = 0, 9 para as femeas esta fora do intervalo estudado o
que e perigoso pois acima da dose 32 nao se sabe se o comportamento sera o mesmo. Se
o interesse estiver na estimacao dessa dose ha necessidade de se aumentar a amplitude
de doses para femeas em um novo experimento. Necessaria se faz ainda uma analise de
Modelos Lineares Generalizados 125
residuos e diagnosticos. A Figura 7.1 mostra o grafico das curvas ajustadas e os valores
observados. O programa em R encontra-se no Apendice.
Inseticida log(Doses)
2,00 2,64 3,48 4,59 6,06 8,00
DDT 3/50 5/49 19/47 19/50 24/49 35/50
-BHC 2/50 14/49 20/50 27/50 41/50 40/50
DDT + -BHC 28/50 37/50 46/50 48/50 48/50 50/50
Consideracoes
Variavel resposta: Yi numero de insetos mortos em amostras de tamanho mi
Distribuicao: Binomial
Parte sistematica: completamente casualizado, modelos de regressao.
Objetivo: determinacao de doses letais e comparacao de inseticidas.
Pela Tabela 7.8 verifica-se que ha evidencias para efeito significativo de inseticida
e de dose. Note-se, ainda, que os desvios para inseticida ignorando dose e, para inseticida
ajustado para dose, sao diferentes devido a nao ortogonalidade por se estar considerando
a distribuicao binomial. O mesmo ocorre para dose ignorando inseticida e, para dose ajus-
tada para inseticida. Pode-se, ainda, tentar uma simplificacao desse modelo, considerando
que dose e um fator quantitativo. Se for usado como preditor linear um polinomio com
x = log(dose), considerando-se os modelos de retas concorrentes, paralelas, com inter-
cepto comum e coincidentes. Os resultados para o desvio e a estatstica X 2 residuais estao
apresentados na Tabela 7.9.
Pela Tabela 7.9, ve-se que existem evidencias que os modelos com retas concor-
rentes e paralelas ajustam-se bem aos dados. Tem-se, ainda, que a diferenca de desvios
entre os modelos com retas paralelas e retas concorrentes com 2 graus de liberdade, nao
Modelos Lineares Generalizados 127
pi
-BHC: log = 4, 5553 + 2, 6958 log(dosei )
1 pi
pi
DDT + -BHC: log = 1, 4248 + 2, 6958 log(dosei )
1 pi
50 ) = 4, 5553 = 1, 69 LD50 = 5, 42
-BHC: log(LD
2, 6958
128 Gauss M. Cordeiro & Clarice G.B. Demetrio
50 ) = 1, 4248
DDT + -BHC: log(LD = 0, 53 LD50 = 1, 70
2, 6958
e as potencias relativas
4, 16
da mistura em relacao ao DDT: = 2, 45
1, 696
5, 417
da mistura em relacao ao -BHC: = 3, 19,
1, 696
1.0
+
0.8
+
2
+ + *
Logit(proporoes)
0.6
1
proporoes
* +
+ *
0
*
0.4
+
* +
*
* *
+
1
+
0.2
2
*
*
* *
+
0.0
3
2 3 4 5 6 7 8 2 3 4 5 6 7 8
dose dose
Tempo 0 1 2 6 12
Contagem 31 26 19 15 20
Pode-se supor, inicialmente, que Y , o numero de bacterias por area fixa, segue
distribuicao Poisson com media , isto e, Y P(). Alem disso, em geral, espera-se que
a contagem media decresca com o tempo, isto e,
1
i
(tempo)
e, portanto,
log i = 0 + 1 log(tempoi + 0, 1),
sendo a constante 0, 1 adicionada para evitar problemas com o tempo 0. A Tabela 7.7
apresenta os desvios e as estatsticas X 2 residuais e seus respectivos numeros de graus de
liberdade (g.l.) e a Tabela 7.8, a Analise de desvios, considerando-se o modelo logstico.
Pela Tabela 7.12 ve-se que existem evidencias de que o modelo com preditor linear
com log(tempo), ajusta-se bem aos dados, enquanto que o modelo nulo, nao. Pela Tabela
130 Gauss M. Cordeiro & Clarice G.B. Demetrio
7.13 verifica-se que ha evidencias para efeito significativo de regressao linear. A equacao
da curva ajustada e dada por
que pode ser observada na Figura 7.2.1 juntamente com os valores observados. Necessaria
se faz ainda uma analise de resduos e diagnosticos. O programa em R encontra-se no
Apendice.
*
30
*
25
Counts
20
*
*
15
0 2 4 6 8 10 12
Time in months
Figura 7.3: Concentracoes de bacterias por area fixa: valores observados e curva
ajustada
Modelos Lineares Generalizados 131
B
A 1 2
1 y11 y12 y1.
2 y21 y22 y2.
m.1 y.2 y..
Uma forma de se medir a associacao entre os fatores A e B e por meio da razao
das chances, dada por:
y11 y22
Razao de chances observada = =
y12 y21
O interesse, em geral, esta em se saber se o valor obtido nao difere, estatisticamente, de 1,
isto e, no teste da hipotese H0 : = 1. Isso corresponde, ao teste de independencia para
tabelas de contingencia, como sera mostrado a seguir.
Pode-se supor, inicialmente, que Yij sao variaveis aleatorias com distribuicao
Poisson de media ij . Em geral, as distribuicoes marginais de A e B nao sao de interesse.
Os modelos de interesse, portanto, sao: o modelo de independencia e o modelo saturado.
ou ainda,
log ij = + A B
i + j i, j = 1, 2
com A B
1 = 1 = 0, isto e, com preditor linear log(ij ) conforme o quadro que se segue.
B
A 1 2
1 + B
2
2 + A A B
2 + 2 + 2
132 Gauss M. Cordeiro & Clarice G.B. Demetrio
Verifica-se que o logaritmo da razao das chances e dado por
e, portanto,
y2. y.2
log y.. = + log(1 + ) + log(1 + )
y1. y.1
y.. y..
= + log( ) + log( )
y1. y1.
implicando em
y1. y.1 y1. y.1
= log(y.. ) = log( ),
y.. y.. y..
isto e,
y1. y.1
e = 11 = y.. = y.. 1. .1 (independencia)
y.. y..
De forma semelhante, obtem-se
B B y1. y.1 y.2
12 = e+2 = e e2 = y..
y.. y.. y.1
y1. y.2
= y.. = y.. 1. .2
y.. y..
log ij = + A B AB
i + j + ij i, j = 1, 2
com A B AB AB
1 = 1 = 1j = i1 = 0, isto e, preditor linear log(ij ) conforme quadro que se
segue
Modelos Lineares Generalizados 133
B
A 1 2
1 + B
2
2 + A A B AB
2 + 2 + 2 + 22
246 32
Razao de chances observada = = = 1, 01
458 17
Ve-se que existem evidencias que o modelo de independencia ajusta-se bem aos
dados. Como esperado o modelo de interacao (saturado) tem desvio e estatstica X 2 iguais
a zero. As estimativas dos parametros do modelo saturado sao:
134 Gauss M. Cordeiro & Clarice G.B. Demetrio
Nota-se que agora o logaritmo da razao de chances e zero. Pela Tabela 7.14 tem-
se que a diferenca de desvios e 0, 00125 (p = 0, 9117), nao significativa, isto e, existem
evidencias para nao se rejeitar a hipotese que a razao de chances e igual a 1, isto e, nao ha
associacao entre sexo do inseto e preferencia por cor de armadilha adesiva.
Modelos Lineares Generalizados 135
APENDICE
# Libraries needed #
library(MASS)
library(car)
# Minitab Cherry Tree Data
# ========================
# Volume of usable wood in 31 black cherry trees from
# Minitab Student Handbook (1985), Ryan, Joiner and Ryan.
# D = diameter at 4.5 ft from ground (inches)
# H = height (feet)
# V = volume (cubic feet)
##trees<-read.table("Tree.dat", header=TRUE)
##require(trees)
data(trees, package=datasets)
data() # lists all datasets
attach(trees)
D<-trees[,1]
H<-trees[,2]
V<-trees[,3]
# first examine the data
par(mfrow=c(2,3))
hist(D, main="Girth")
hist(H, main="Height")
hist(V, main="Volume")
boxplot(D, main="Girth")
boxplot(H, main="Height")
boxplot(V, main="Volume")
136 Gauss M. Cordeiro & Clarice G.B. Demetrio
#Scatterplot
pairs(trees)
plot(trees)
scatterplot.matrix(trees) # uses library(car)
## Fitted models ##
mod1<-lm(V~1)
mod2<-lm(V~D)
summary(mod2)
mod3<-lm(V~H)
summary(mod3)
mod4<-lm(V~D+H)
summary(mod4)
anova(mod1, mod4)
anova(mod1, mod2, mod4)
anova(mod1, mod3, mod4)
#################################################
# A set of four plots for diagnostics #
#################################################
n<-dim(trees)[1] # number of data
par(mfrow=c(2,2))
# Observed against fitted values #
plot(fitted(mod4),V)
identify(fitted(mod4),V) #click on the point, use ESC in R to esc
# abs(DFFitS) vs index #
plot(abs(dffits(mod4)))
abline(3*sqrt(mod4$rank/mod4$df.residual),0,lty=2)
identify(1:n,abs(dffits(mod4))) #click on the point, use ESC in R to esc
Modelos Lineares Generalizados 137
## Fitted models ##
mod1<-lm(logV~1)
mod2<-lm(logV~logD)
summary(mod2)
mod3<-lm(logV~logH)
summary(mod3)
mod4<-lm(logV~logD+logH)
summary(mod4)
anova(mod1, mod4)
anova(mod1, mod2, mod4)
anova(mod1, mod3, mod4)
#################################################
# A set of four plots for diagnostics #
#################################################
138 Gauss M. Cordeiro & Clarice G.B. Demetrio
n<-dim(trees)[1] # number of data
par(mfrow=c(2,2))
# Observed against fitted values #
plot(fitted(mod4),V)
identify(fitted(mod4),V)
# abs(DFFitS) vs index #
plot(abs(dffits(mod4)))
abline(3*sqrt(mod4$rank/mod4$df.residual),0,lty=2)
identify(1:n,abs(dffits(mod4)))
fatyield.dat<-scan(what=list(yield=0))
0.31 0.39 0.50 0.58 0.59 0.64
0.68 0.66 0.67 0.70 0.72 0.68
0.65 0.64 0.57 0.48 0.46 0.45
0.31 0.33 0.36 0.30 0.26 0.34
0.29 0.31 0.29 0.20 0.15 0.18
0.11 0.07 0.06 0.01 0.01
fatyield.dat$week=1:35
attach(fatyield.dat)
lweek<-log(week)
plot(weeks,yield, pch="*", xlab="Weeks", ylab="Fat yield (kg/day)",
main="Figura 1. Observed fat yield (kg/day) for each week")
mod1<-glm(resp~1, family=binomial)
1-pchisq(deviance(mod1), df.residual(mod1))
print(X2<-sum(residuals(mod1, pearson)^2))
1-pchisq(X2, df.residual(mod1))
mod2<-glm(resp~d, family=binomial)
1-pchisq(deviance(mod2), df.residual(mod2))
print(X2<-sum(residuals(mod2, pearson)^2))
1-pchisq(X2, df.residual(mod2))
mod3<-glm(resp~insecticid, family=binomial)
1-pchisq(deviance(mod3), df.residual(mod3))
Modelos Lineares Generalizados 149
print(X2<-sum(residuals(mod3, pearson)^2))
1-pchisq(X2, df.residual(mod3))
mod4<-glm(resp~insecticid+d, family=binomial)
1-pchisq(deviance(mod4), df.residual(mod4))
summary(mod4)
print(X2<-sum(residuals(mod4, pearson)^2))
1-pchisq(X2, df.residual(mod4))
anova(mod4, test="Chisq")
mod5<-glm(resp~insecticid+ldose-1, family=binomial)
1-pchisq(deviance(mod5), df.residual(mod5))
summary(mod5, test="Chisq")
print(X2<-sum(residuals(mod5, pearson)^2))
1-pchisq(X2, df.residual(mod5))
anova(mod1, mod2, mod4, test="Chisq")
anova(mod1, mod3, mod4, test="Chisq")
mod6<-glm(resp~ldose/insecticid, family=binomial)
1-pchisq(deviance(mod6), df.residual(mod6))
summary(mod6)
mod7<-glm(resp~ldose, family=binomial)
1-pchisq(deviance(mod7), df.residual(mod7))
print(X2<-sum(residuals(mod7, pearson)^2))
1-pchisq(X2, df.residual(mod7))
mod8<-glm(resp~insecticid*ldose-insecticid, family=binomial)
1-pchisq(deviance(mod8), df.residual(mod8))
print(X2<-sum(residuals(mod8, pearson)^2))
1-pchisq(X2, df.residual(mod8))
mod9<-glm(resp~insecticid+ldose, family=binomial)
1-pchisq(deviance(mod9), df.residual(mod9))
print(X2<-sum(residuals(mod9, pearson)^2))
1-pchisq(X2, df.residual(mod9))
summary(mod9)
150 Gauss M. Cordeiro & Clarice G.B. Demetrio
anova(mod9, test="Chisq")
mod10<-glm(resp~insecticid*ldose, family=binomial)
1-pchisq(deviance(mod10), df.residual(mod10))
summary(mod10)
print(X2<-sum(residuals(mod10, pearson)^2))
1-pchisq(X2, df.residual(mod10))
par(mfrow=c(1,2))
plot(tim, count, xlab="Time in months", ylab="Counts")
plot(ltime,lcount, xlab="Log(time in months)", ylab="Log(counts)")
par(mfrow=c(1,1))
# 2 by 2 table - Traps
y <- c(246, 17, 458, 32)
armcor <- factor(c(1, 1, 2, 2))
sexo <- factor(c(1, 2, 1, 2))
Agresti, A. (2002). Categorical Data Analysis. John Wiley & Sons, New York, second
edition.
Aitkin, M.; Francis, B.; Hinde, J. (2005). Statistical modelling in GLIM 4. Oxford Univer-
sity Press, Oxford.
Anscombe, F. J. (1964). Normal likelihood functions. Ann. Inst. Statist. Math., 16, 119.
Ashton, W. D. (1972). The Logit Transformation with Special Reference to its Uses in
Bioassay. Griffin, London.
Atkinson, A. C. (1981). Robustness, transformations and two graphical displays for outly-
ing and influential observations in regression. Biometrika, 68, 1320.
Atkinson, A. C.; Davison, A. C.; Nelder, J. A.; OBrien, C. M. (1989). Model Checking.
Imperial College, London.
155
156 Gauss M. Cordeiro & Clarice G.B. Demetrio
Belsley, D. A.; Kuh, E.; Welsch, R. E. (1980). Regression diagnostics: identifying influential
data and sources of collinearity. John Wiley, New York.
Bliss, C. I. (1935). The calculator of the dosage-mortality curve. Ann. Appl. Biol., 22,
134167.
Collet, D. (2002). Modelling binary data. Chapman and Hall, London, second edition.
Cook, R. D.; Weisberg, S. (1982). Residuals and influence in regression. Chapman and
Hall, London.
Cordeiro, G. M. (1983). Improved likelihood ratio statistics for generalized linear models.
J. Roy. Statist. Soc. B, 45, 401413.
Cordeiro, G. M. (1993). Bartlett corrections and bias correction for two heteroscedastic
regression models. Communications in Statistics, Theory and Methods, 22, 169188.
Cordeiro, G. M.; Cribari-Neto, F.; Aubin, E. Q.; Ferrari, S. L. P. (1995). Bartlett correc-
tions for one-parameter exponential family models. Journal of Statistical Computation
and Simulation, 53, 211231.
Cox, D. R. (1972). Regression models and life tables (with discussion). J. R. Statist. Soc.
B, 74, 187220.
Demetrio, C. G. B.; Hinde, J. (1997). Half normal plots and overdispersion. GLIM Newslet-
ter, 27, 1926.
Dyke, G.; Patterson, H. (1952). Analysis of factorial arrangements when the data are
proportions. Biometrics, 8, 112.
Fahrmeir, L.; Kaufmann, H. (1985). Consistency and asymptotic normality of the max-
imum likelihood estimator in generalized linear models. The Annals of Statistics, 13,
342368.
158 Gauss M. Cordeiro & Clarice G.B. Demetrio
Fahrmeir, L.; Tutz, G. (1994). Multivariate Statistical Modelling based on Generalized
Linear Models. Springer-Verlag, New York.
Feigl, P.; Zelen, M. (1965). Estimation of exponential survival probabilities with concomi-
tant information. Biometrics, 21, 826838.
Firth, D. (1991). Generalized linear models. In Hinkley, D.; Reid, N.; Snell, E., editors,
Statistical Theory and Modelling, pages 5582. Chapman & Hall.
Fisher, R. (1935). The case of zero survivors (appendix to bliss, c.i. (1935)). Ann. Appl.
Biol., 22, 164165.
Fisher, R.; Yates, F. (1970). Statistical Tables for Biological, Agricultural and Medical
Research. Oliver and Boyd, Edinburgh.
Francis, B.; Green, M.; Payne, C. (1993). The GLIM system generalized linear iteractive
modelling. New York.
Gasser, M. (1967). Exponential survival with covariance. Journal of the American Statis-
tical Association, 62, 561568.
Haberman, S. (1970). The general log-linear model. PhD dissertation. Univ. of Chicago
Press, Chicago, Illinois.
Haberman, S. (1974). The analysis of frequence data. Univ. of Chicago Press, Chicago,
Illinois.
Jorgensen, B. (1987). Maximum likelihood estimates and large samples inference for gene-
ralized linear and nonlinear regression models. Biometrika, 70, 1928.
Modelos Lineares Generalizados 159
Lee, Y.; Nelder, J. A.; Pawitan, Y. (2006). Generalized Linear Models with Random Effects.
Unified Analysis via H-likelihood. Chapman & Hall/CRC, London.
Martin, J. T. (1942). The problem of the evaluation of rotenone-containing plants. vi: The
toxicity of 1-elliptone and of poisons applied jointly, with further observations on the
rotenone equivalent method of assessing the toxicity of derris root. Annals of Applied
Biology, 29, 6981.
McCullagh, P.; Nelder, J. A. (1989). Generalized Linear Models. Chapman and Hall,
London, second edition.
McCulloch, C. E.; Searle, S. R. (2000). Generalized, Linear, and Mixed Models. John
Wiley & Sons, New York.
Molenberghs, G.; Verbeke, G. (2005). Models for discrete longitudinal data. Springer-
Verlag, New York.
Morgan, C. N. (1992). Analysis of Quantal Response Data. Chapman and Hall, London.
Pregibon, D. (1980). Goodness of link tests for generalized linear models. Appl. Statist.,
29, 1524.
R Development Core Team (2006). R: A Language and Environment for Statistical Com-
puting. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.
Rasch, G. (1960). Probabilistic Models for Some Intelligence and Attainment Tests. Dan-
marks Paedogogiske Institut, Copenhagen.
Ridout, M. S. (1990). Using Generalized Linear Models to Analyze Data from Agricul-
tural, and Horticultural Experiments. Departamento de Matematica e Estatstica da
ESALQ/USP, Piracicaba (nao publicado).
Ryan, B. F.; Joiner, B. L.; Ryan Jr., T. A. (1976). Minitab Student Handbook. Duxbury
Press, New York.
Silveira Neto, S.; Nakano, O.; Barbin, D.; Villa Nova, N. (1976). Manual de Ecologia dos
Insetos. Ed. Agronomica Ceres, Sao Paulo.
Weisberg, S. (2005). Applied linear regression. John Wiley, New York, third edition.
Wilks, S. (1938). The large sample distribution of the likelihood ratio for testing composite
hypotheses. Ann. Math. Statist., 9, 6062.
Modelos Lineares Generalizados 161
Zippin, C.; Armitage, P. (1966). Use of concomitant variables and incomplete survival
information in the estimation of an exponential survival parameter. Biometrics, 22,
665672.