Análise Multinível
Análise Multinível
Análise Multinível
FACULDADE DE MEDICINA
PROGRAMA DE PS-GRADUAO EM EPIDEMIOLOGIA
TESE DE DOUTORADO
ANLISE DE DADOS EPIDEMIOLGICOS INCORPORANDO
PLANOS AMOSTRAIS COMPLEXOS
TESE DE DOUTORADO
ANLISE DE DADOS EPIDEMIOLGICOS INCORPORANDO
PLANOS AMOSTRAIS COMPLEXOS
BANCA EXAMINADORA
AGRADECIMENTOS
Gostaria de expressar todo meu carinho e meu agradecimento a tantas pessoas que
me acompanharam nessa caminhada e que foram muito importantes para a concluso
desta tese. Meu agradecimento, meu carinho por cada um enorme, mesmo no
conseguindo expressar to bem pelas palavras.
SUMRIO
ABREVIATURAS E SIGLAS ........................................................................ 8
RESUMO ......................................................................................................... 10
ABSTRACT..................................................................................................... 12
LISTA DE QUADROS.................................................................................... 14
LISTA DE TABELAS ..................................................................................... 16
LISTA DE FIGURAS ...................................................................................... 17
1. APRESENTAO ...................................................................................... 18
2. INTRODUO ........................................................................................... 19
3. REVISO DE LITERATURA .................................................................... 22
3.1 AMOSTRAGEM ....................................................................................... 22
3.1.1 Tipos de amostragem aleatria ............................................................... 23
3.1.2 Erro amostral........................................................................................... 29
3.2
ESTIMAO
DE
PARMETROS
CONSIDERANDO
AMOSTRAGEM COMPLEXA............................................................. 31
ABREVIATURAS E SIGLAS
AAS
AC
Amostragem complexa
ACO
AE
Amostragem estratificada
AS
Amostragem sistemtica
BRR
CCI
CDC
Design effect
EP
Erro padro
EPA
EQM
ERG
ESCA
FCF
IBGE
IGLS
IID
IMC
INPE
MCBS
MEPS
ML
Maximum Likelihood
MPV
Mxima Pseudo-Verossimilhana
NCHS
NHIS
PNDS
PPT
PPV
REML
RIGLS
SAEB
SUGI
UBS
UFA
UPA
UPAs
USA
10
RESUMO
11
12
ABSTRACT
13
coefficients in the final models was similar in the two approaches, but there was a
difference in one of the coefficients in weighted analysis.
Conclusions: Results of the two studies showed that sampling design complexity
should be incorporated into data analysis. Research questions seem to be a
determinant factor in the choice of either a complex sample or a multilevel model
approach.
Key words: Complex sample; design effect; multilevel model.
14
LISTA DE QUADROS
ARTIGO 1
Quadro 1 Distribuio dos participantes e dos municpios por estrato na
campanha e na busca ativa.......................................................... 81
Quadro 2 Comandos utilizados para ajuste da regresso de Poisson no
STATA 9.0.................................................................................. 86
ARTIGO 2
Quadro 1 Comandos utilizados para ajuste da regresso no STATA 9.0
considerando a abordagem da amostragem complexa................ 122
Quadro 2 - Comandos utilizados para ajuste da regresso no SAS 9.1.3 e
MLwiN 2.02 considerando a abordagem da amostragem de
modelos multinvel ..................................................................... 123
ANEXO A
Quadro A.1 Comando para diferentes tcnicas de anlise de dados no
STATA 9.0.................................................................................. 131
Quadro A.2 Comando para diferentes tcnicas de anlise de dados no
SAS 9.1.3 .................................................................................... 132
Quadro A.3 Comando para diferentes tcnicas de anlise de dados no
SPSS 15....................................................................................... 133
Quadro A.4 Comando para diferentes tcnicas de anlise de dados no
EPI INFO 3.4.3 ........................................................................ 134
Quadro A.5 Comando para diferentes tcnicas de anlise de dados no R .... 134
15
ANEXO C
Quadro C.1 Comando para modelagem multinvel com 2 nveis com
desfecho contnuo no SAS 9.1.3 ................................................ 137
Quadro C.2 Comando para modelagem multinvel com 2 nveis com
desfecho contnuo no MLwiN 2.02 ............................................ 138
16
LISTA DE TABELAS
ARTIGO 1
Tabela 1. Estimativas pontuais, erros padres, intervalos de confiana e
efeitos do plano amostral para as variveis: sexo, idade, IMC,
glicemia e CDGLN, considerando-se os diferentes
componentes dos plano amostral..................................................... 94
Tabela 2. Contribuies relativas dos cmponentes do plano amostral nos
coeficientes de regresso de Poisson para a varivel resposta
CDGLN ........................................................................................... 95
Tabela 3. Razo de prevalncia (RP) e intervalo de confiana (IC)
segundo o plano amostral simples e complexo ............................... 96
Tabela 4. Contribuies relativas dos componentes do plano amostral
associadas ao teste de comparao de mdias da glicemia entre
sexo e entre faixa etria .................................................................. 96
ARTIGO 2
Tabela 1. Estimativas de mdia, proporo, intervalos de 95% de
confiana e efeito do plano amostral para as variveis da
pesquisa considerando amostragem complexa e amostragem
aleatria simples (AAS) .................................................................. 124
Tabela 2. Estimativas, erro padro e nvel de significncia dos
coeficientes de regresso linear para o desfecho escore-ps na
abordagem da amostragem complexa, sem ponderao.................. 125
Tabela 3. Estimativas, erro padro e nvel de significncia dos
coeficientes de regresso linear para o desfecho escore-ps na
abordagem da amostragem complexa, com ponderao ................. 126
Tabela 4. Estimativas, erro padro e nvel de significncia dos
coeficientes de regresso linear para o desfecho escore-ps na
abordagem da anlise multinvel, sem ponderao ......................... 127
Tabela 5. Estimativas, erro padro e nvel de significncia dos
coeficientes de regresso linear para o desfecho escore-ps na
abordagem da anlise multinvel, com ponderao......................... 128
17
LISTA DE FIGURAS
ARTIGO 1
Figura 1 Processo de amostragem................................................................. 82
ARTIGO 2
Figura 1 Esquema amostral do estudo ......................................................... 103
18
1. APRESENTAO
19
2. INTRODUO
20
21
22
3. REVISO DE LITERATURA
3.1 AMOSTRAGEM
23
24
i = 1 (1
1 n
) , i = 1,..., N
N
i =
n
, i = 1,..., N
N
Amostragem estratificada
25
2.
3.
4.
5.
Amostragem sistemtica
26
unidades primrias
27
28
Amostragem complexa
Estratificao;
Conglomerao;
Probabilidades variveis.
29
30
A diferena entre o valor amostral e o parmetro pode ser afetada por outro
tipo de erro, o erro no amostral, devido a outros fatores que no o plano amostral,
como por exemplo, inadequaes de mensurao, entrevistas, codificao, entre
outras. Nas pesquisas tenta-se minimizar esses erros, os quais podem ocorrer at na
pesquisa de todas as unidades populacionais, isto , no por processo de amostragem.
A seguir, apresentam-se algumas possveis ocorrncias de erros no amostrais
(Bolfarine e Bussab, 2005):
A. Unidades perdidas (falta de resposta)
i. Falta de resposta total:
a. Falta de contato com a unidade;
b. Recusa;
c. Abandono durante a pesquisa;
d. Incapacidade em responder;
e. Perda de documento;
ii. Falta de resposta parcial:
a. Recusa em questes sensveis (ex: renda);
b. Incompreenso;
c. Dados incoerentes;
B. Falhas na definio e administrao
i. Sistemas de referncia:
a. Erros de omisso (cobertura incompleta), excluso de
elementos de interesse. Resulta de diferenas entre as
diversas populaes;
b. Incluso de elementos no sorteados ou de outras populaes
31
32
Estimao do Total
33
h = 1,..., L
i = 1,..., N h
estratos,
UPAs
no
estrato
Nh
M = M hi
h =1 i =1
Y = Yhij
h =1 i =1 j =1
nh
m = mhi
h =1 i =1
34
nh
mhi
Y = whij y hij
h =1 i =1 j =1
Nh
.
nh
nh mhi
M = whij
h =1 i =1 j =1
O estimador da varincia de Y :
l
n nh
V (Y ) = (1 f h ) h ( y hi y h ) 2
nh 1 i =1
h =1
y hi = whij y hij
j =1
nh
y
i =1
hi
nh
.
Nh
35
Mtodos de re-amostragem
36
37
Efeito do conglomerado
38
2 = E2 + D2
em que:
39
1
a 1. No caso de mxima
m 1
1
.
m 1
EPA = 1 + CCI (m 1)
Efeito do estrato
40
41
42
43
<1
Superestimada
=1
>1
Subestimada
44
45
46
47
48
Dados de 19.127 indivduos da NHIS (National Health Interview Survey 1994) foram utilizados por Rodgers-Farmer e Davis (2001) para apontar estimativas
pontuais viesadas, erros padres subestimados e testes de significncia com decises
errneas quando utilizam-se rotinas tradicionais nos aplicativos tradicionais para
analisar dados sob amostragem complexa. Ajustaram modelo de regresso mltipla
em cinco estratgias: (1) assumindo AAS, (2) assumindo AAS e pesos amostrais, (3)
assumindo AAS e pesos normalizados (4) assumindo peso amostral e um nico
estrato com reposio, isto , somente o efeito dos conglomerados, e (5)
considerando peso amostral e delineamento complexo (com reposio). Os trs
primeiros casos foram executados no SPSS e os dois ltimos no SUDAAN.
Comparando as duas primeiras estratgias, obteve-se diferena entre os
coeficientes e erros padres: os erros padres foram menores considerando pesos,
pois as rotinas tradicionais subestimam as varincias das estatsticas ponderadas. Na
terceira anlise, resultou uma suave reduo no erro da varincia estimada,
comparada com a estratgia 1. A quarta anlise apresentou erros padres alterados,
valor de p alterado e coeficientes iguais, comparando com a estratgia 3, com EPA
maiores que 1 para todos os coeficientes, mostrando que os erros padres foram
subestimados quando se considerou AAS. Ainda, os autores afirmam que
desconsiderar o delineamento quando o efeito do delineamento maior que 2 resulta
em uma significativa subestimao do erro padro. Na estratgia 5, comparada
estratgia 4, os coeficientes no so diferentes, mas os erros padres so e,
conseqentemente, o valor de p. Neste caso, uma varivel independente mostrou-se
no significativa no modelo, sendo que nas outras quatro estratgias esta varivel foi
49
50
51
52
STATA v.9
No presente estudo foram utilizados o STATA v.8 e o STATA v.9. Nas duas
verses do programa, usado o prefixo svy nos comandos referentes ao tratamento
de dados de amostragem complexa, permitindo incorporar caractersticas como
estratificao, conglomerao e peso amostral. O STATA v.8 permite analisar
somente o primeiro estgio da amostragem porm, o STATA v.9 permite analisar
vrios estgios.
Verso
Mantenedora
Pgina na internet
atual
STATA
v. 10
Stata Corporation
http://www.stata.com/
SAS
v. 9.1.3
http://www.sas.com/technologies/an
alytics/statistics/index.html
SPSS
v. 16
SPSS Inc.
http://www.spss.com/complex_samp
les/
SUDDAN
v. 9.0.3
WesVar
v. 5.1
WESTAT
EPI INFO
v. 3.4.3
http://www.westat.com/wesvar/
and
Prevention
R
v. 2.6.1
R Foundation
v.3.6-13a
a
http://www.r-project.org/
53
comparam
aplicativos
disponveis
nas
respectivas
pocas.
Com
54
para a utilizao correta dos dados de pesquisas como as que o IBGE produz.
Ressaltaram que estes dados provm de populao finita, envolvendo diferentes
caractersticas, como
55
56
57
58
STATA, SUDAAN e SAS foram usados por Chantala (2006) para anlise de
regresso mltipla obtendo-se os mesmos resultados para os coeficientes de
regresso e seus erros padres.
59
60
A seguir ser apresentado o modelo multinvel com dois nveis para desfecho
contnuo por ser este o utilizado no presente trabalho, utilizando a notao comum
introduzida em Zanini (2007), Goldstein (2003) e Snijders e Boskers (1999).
Nos modelos com dois nveis ocorrem n j unidades do nvel 1 para cada
unidade j ( j = 1,2,... J ) do nvel 2. Os modelos para o nvel 1 so desenvolvidos
separadamente em cada unidade do nvel 2, considerando a possibilidade de variao
dos interceptos e das inclinaes:
Yij = 0 + 1 X ij + u 0 j + e0 ij
em que:
Yij : desfecho do i-sima unidade do nvel 1, agrupada na j-sima unidade do nvel 2;
X ij : varivel preditora medida na i-sima unidade do nvel 1, agrupada na j-sima
unidade do nvel 2;
61
u20
I (Yij | X ij ) = 2
u 0 + e20
Yij = 0 j + 1 j X 1ij + e0 ij
0 j = 0 + u0 j
1 j = 1 + u1 j
62
em que:
0 2
u 0 j
u 0 u1
e Var(e0ij ) ~ N (0, e20 )
Var ~ N , u 0
2
u
0 u1u 0 u1
ij
63
u j =
n j u20
n j
2
u0
2
eo
~
yj
64
disponibilizados por: Pretto (2003) e Singer (1998) no caso do SAS Institute (2004)
e, Rasbash et al. (2005), Ferro (2003) e Barros (2001) no caso do MLwiN.
65
66
estas frmulas consideram a variao dentro dos grupos, mas no entre os grupos
(Ukoumunne et al., 1999). Da mesma forma, os mtodos tradicionais de tratamento
estatstico dos dados no so apropriados para estudos com conglomerados, pois
assumem que os indivduos so independentes. Assim, os erros padres do efeito da
interveno tendem a ser subestimados, resultando em intervalos de confiana mais
estreitos e valores p (significncia) menores.
Segundo Donner e Klar (1994), a anlise de desfecho contnuo de um
delineamento randomizado em grupo pode ser realizada usando modelos mistos, com
o objetivo de verificar o efeito do tratamento. Covariveis para tratamento, estratos e
medida baseline podem ser includas no modelo misto.
Veugelers e Fitzgerald (2005) utilizaram modelos multinvel para avaliar o
efeito de um programa de preveno de obesidade infantil em escolas. O estudo
realizou-se em 2003, incluindo 5.200 estudantes de cinco sries em 282 escolas. Os
dados foram analisados por regresso logstica multinvel, considerando a escola
como fator contextual (nvel 2), para variveis de desfecho binrias no nvel 1, e
tambm foram utilizados modelos de regresso linear multinvel para desfechos
contnuos do nvel 1.
67
4. OBJETIVOS
Este trabalho tem por objetivo descrever e comparar mtodos para tratamento
de dados provindos de planos amostrais complexos, freqentemente utilizados em
estudos epidemiolgicos, atravs de duas abordagens: amostragem complexa e
modelo multinvel.
68
5. REFERNCIAS BIBLIOGRFICAS
(1)
(2)
(3)
Mplus
Web
Notes:
No
8.
Em:
http://www.statmodel.com/download/webnotes/MplusNote81.pdf, acesso em
27/03/2007.
(4)
(5)
(6)
(7)
(8)
Berglund PA, Arbor A. Analysis of complex sample survey data using the
SURVEYMEANS and SURVEYREG procedures and macro coding.
Proceedings of the SAS users group international 27. 14-17/04/2002. Orlando.
Florida.
(9)
69
(10) Brogan DJ. Pitfalls of using standard statistical software packages for sample
surveys
data.
Em:
http://www.fas.harvard.edu/~stats/survey-
acesso
em
25/09/2003.
(15) Chambers RL, Skinner CJ. Analysis of Survey Data. Chichester: John Wiley;
2003.
(16) Chantala
K.
Guidelines
for
analysing
add
health
data.
Em:
http://www.cpc.unc.edu/projects/addhealth/files/wt_guidelines.pdf, acesso em
17/09/2007.
(17) Chantala K, Blanchette D, Suchindran CM. Software to compute sampling
weights
for
multilevel
analysis.
Em:
http://www.cpc.unc.edu/restools/data_analysis/ml_sampling_weights/Compute
%20Weights%20for%20Multilevel%20Analysis.pdf, acesso em 17/01/2008.
(18) Chantala K, Tabor J. Strategies to perform a design-based analysis using the
add
health
data.
http://www.cpc.unc.edu/projects/addhealth/files/weight1.pdf,
20/09/2003.
Em:
acesso
em
70
(19) Ciol MA, Hoffman JM, Dudgeon BJ, Shumway-Cook A, Yokston KM, Chan
L. Understanding the Use of Weights in the Analysis of Data From Multistage
Surveys. Archives of Physical Medicine Rehabilitation 2006;87:299-303.
(20) Cochran W. Sampling Techniques. New York: John Wiley; 1977.
(21) Cohen SB. An evaluation of alternative PC-based software packages developed
for the analysis of complex survey data. The American Statistician 1997;
51(3):285-92.
(22) Cordeiro R. Efeito do desenho em amostragem de conglomerado para estimar a
distribuio de ocupaes entre trabalhadores. Revista de Sade Pblica 2001;
35(1):10-5.
(23) Donner A, Klar N. Cluster randomization trials in epidemiology: theory and
application. Journal of Statistical Planning and Inference 1994;42(1-2): 37-56.
(24) Egede LE. Lifestyle modification to improve blood pressure control in
individuals with diabetes. Diabetes Care 2003; 26(3):602-7.
(25) Egede LE. Diabetes, Major Depression and Functional Disability Among U.S.
Adults. Diabetes Care 2004; 27(2): 421-8.
(26) Epi-Info, Center for Disease Control and Prevention. Version 6.0.3
(27) Ferro ME, Beltro KI, Santos DP. Modelo de regresso multinvel: aplicao
ao estudo do impacto da poltica de no-repetncia no desempenho escolar dos
alunos da 4 srie. Pesquisa e Planejamento Economico 2002; 32(3).
(28) Figueiredo CC. Anlise de Regresso Incorporando o Esquema Amostral.
Dissertao de mestrado em Estatstica. Universidade de So Paulo; 2004.
(29) Giatti L, Barreto SM. Situao do indivduo no mercado de trabalho e
iniqidade em sade no Brasil. Revista de Sade Pblica 2006;40(1):99-106.
(30) Goldstein H. Multilevel statistical models. 3 ed. Edward Arnold; 2003.
(31) Gossett JJ, Simpson P, Parker JG, Simon WL. How complex can complex
survey analysis be with SAS. Proceedings of the SAS users group international
27. 14-17/04/2002. Orlando. Florida.
71
72
(44) Kreuter F, Valliant R. A survey on survey statistics: what is done and can be
done in Stata. The Stata Journal 2007;7(1):1-21.
(45) Lee R. Strengths and Limitations of Using SUDAAN, Stata and WesVarPC for
Computing Variances from NCES Data Sets. National Center for Education
Statistics 2000. Em: http://nces.edu.gov/pubs2000/200003.pdf, acesso em
18/01/2007.
(46) Lehtonen R, Pahkinen E. Practical Methods for Design and Analysis of
Complex Survey. 2 ed. Chichester. England: John Wiley & Sons Ltd; 2004.
(47) Lehtonen R, Djerf K, Hrknen T, Laiho J. Design-based and model-based
methods in analysing complex health survey data: a case study. Proceedings of
Statistics Canada Symposium. 2002
(48) Leite PGPG, Silva DBN. Anlise da situao ocupacional de crianas e
adolescentes nas regies sudeste e nordeste do Brasil utilizando informaes da
PNAD 1999. Proceedings XIV Encontro Nacional de Estudos Populacionais.
4-8/11/2002. Ouro Preto. Minas Gerais.
(49) Lemeshow S, Letenneur L, Dartigues JF, Lafont S, Orgogozo JM, Commenges
D. Illustration of analysis taking into account complex survey considerations:
the association between wine consumtion and dementia in the PAQUID study.
American Journal of Epidemiology 1998;148(3):298-306.
(50) Lemeshow S, Cook ED. Pratical considerations in the analysis of complex
sample survey data. Revue d'epidmiologie et de sant publique 1999;47:47987.
(51) Lumley T. Analysis of complex survey samples. Journal of Statistical Software
2004;9(8):1-19.
(52) Lumley T. The survey package. Manual survey R Em: http://cranr.c3sl.ufpr.br/, acesso em 18/02/2008.
(53) Moraes AB. Baixo peso de nascidos vivos no Rio Grande do Sul, Brasil: uma
anlise estatstica multinvel. Tese de doutorado em Epidemiologia. Faculdade
de Medicina. Universidade Federal do Rio Grande do Sul; 2007.
73
(54) MLwiN, version 2.02. Multilevel Models Project, c. 2000. London: Institute of
Education, University of London.
(55) Mundstock EC. Amostragem I. Cadernos de Matemtica e Estatstica. Srie B
Instituto de Matemtica. Universidade Federal do Rio Grande do Sul. 2005.
(56) Natarajan S, Lipsitz SR, Fitzmaurice GM, Moore CG, Gonin R. Variance
estimation in complex survey sampling for generalized linear models. Applied
Statistics 2008;57(1):75-87.
(57) Neuhaus JM, Segal MR. Design effects for binary regression models fitted to
dependent data. Statistics in Medicine 1993;12:1259-68.
(58) Oliveira MMC. Presena e extenso dos atributos da ateno primria sade
entre os servios de ateno primria em Porto Alegre: uma anlise agregada.
Dissertao de mestrado em Epidemiologia. Faculdade de Medicina.
Universidade Federal do Rio Grande do Sul; 2007.
(59) Prez MC, Utra IB, Len AA, Roche RG, Sagu KA, Rosa MC, et al.
Estimationes usadas en diseos muestrales complejos: aplicaciones en la
encuesta de salud cubana del ao 2001. Revista Panamericana de Salud Publica
2004;15(3):176-84.
(60) Pessoa DGC, Silva PLN. Anlise de dados amostrais complexos. So Paulo:
ABE-Associao Brasileira de Estatstica; 1998.
(61) Pfeffermann D. The use of sampling weights for survey data analysis.
Statistical Methods in Medical Research 1996;5:239-61.
(62) Pfeffermann D, Skinner C, Goldstein H, Holmes DJ, Rasbash J. Weighting for
unequal selection probabilities in multilevel models. Journal of the Royal
Statistical Society 1998;60(Srie B):23-40.
(63) Pretto K. Modelos multinveis: caracterizao e aplicao.
Monografia
74
75
76
(87) Vasconcellos MTL, Silva PLN, Szwarcwald CL. Sampling design for the
World Health Survey in Brazil. Cadernos de Sade Pblica 2005;21(Sup):8999.
(88) Veugelers PJ, Fitzgerald AL. Effectiveness of school programs in preventing
childhood obesity: a multilevel comparison. American Journal of Public Health
2005;95(3):432-5.
(89) Vieira MT. Um estudo comparativo das metodologias de modelagem de dados
amostrais complexos - uma aplicao ao SAEB 99. Dissertao de mestrado
em Cincia da Engenharia Eltrica. Pontifcia Universidade Catlica do Rio de
Janeiro; 2001.
(90) Vieira MT. Amostragem Repetida no Tempo: o uso de painis. IBGE - Rio de
Janeiro/RJ: 1 Escola de Amostragem e Metodologia de Pesquisa; 2007.
(91) Wang ST, Yu ML, Lin LY. Consequences of analysing complex survey data
using inappropriate analysis and software computing packages. Public Health
1997;111:259-62.
(92) Wang MQ. Research notes: analysis of data from complex survey designs.
American Journal of Health Behavior 2001;25(1):72-4.
(93) Zanini RR. Modelos multinveis aplicados ao estudo da mortalidade infantil no
Rio Grande do Sul, Brasil, de 1994 a 2004. Tese de doutorado em
Epidemiologia. Faculdade de Medicina. Universidade Federal do Rio Grande
do Sul; 2007.
(94) Zhang F, Salvucci S, Cohen M. Multilevel Linear Regression Analysis of
Complex
Survey
Data.
Em:
http://www.amstat.org/sections/srms/Proceedings/papers/2000_029.pdf, acesso
em 10/04/2006.
77
6. ARTIGOS
78
6.1 ARTIGO 1
IMPACTO DO PLANO AMOSTRAL COMPLEXO NAS ESTIMATIVAS DE
COEFICIENTES DE REGRESSO DE POISSON EM UM ESTUDO
EPIDEMIOLGICO
1, 3
1, 2
Joo Riboldi
Elsa Mundstock
1, 2
79
RESUMO
80
ABSTRACT
Introduction: Many epidemiological studies use complex sampling designs and may
simple random sampling were compared, but there was a great difference in standard
errors. The same was found for estimates of Poisson regression coefficients that were
less affected by sampling design.
Conclusion: Results showed differences in the standard errors of means, proportions
and Poisson regression coefficients between complex and simple random sampling,
which indicates that sample design complexity should be incorporated into data
analysis.
81
INTRODUO
82
MTODOS
Nmero de
Nmero de
Nmero de
Nmero de
Peso
participantes
participantes
municpios
municpios
amostral
na campanha
selecionados
na regio
selecionados
do
na busca ativa
na busca
indivduo
(amostra)
ativa
(amostra)
1.162.303
298
417
3874,343
NE
6.276.269
1.378
1.688
14
4483,049
CO
1.522.295
293
426
5074,317
SE
9.440.561
2.012
1.640
21
4495,505
3.668.477
925
1.130
4076,052
Total
22.069.905
4.906
5.301
50
83
estgio, foram pesquisados 50 municpios. O nmero de municpios para compor a
amostra em cada regio definiu-se proporcionalmente ao nmero de indivduos
participantes (exames realizados) na campanha, conforme Quadro 1. Os municpios
foram selecionados com probabilidade proporcional ao nmero de indivduos
participantes na campanha.
No segundo estgio, selecionou-se uma unidade bsica de sade (UBS) em cada
municpio, com probabilidade proporcional ao nmero de participantes na campanha de
cada UBS. No terceiro estgio, foram selecionados 100 participantes em cada UBS com
igual probabilidade (Figura 1).
84
delineamento, possibilitando a anlise que incorpora o delineamento amostral
complexo.
Os conglomerados do primeiro estgio de amostragem, neste estudo, so os
municpios ou unidades primrias de amostragem (UPA). No segundo estgio de
amostragem, dentro de cada municpio foi selecionada uma unidade bsica de sade ou
unidade secundria de amostragem (USA). Assim, foram utilizadas somente as UPAs
para estimao da varincia no STATA 9.08.
O peso de cada indivduo na amostra composto pelo produto dos pesos das
unidades amostrais em cada estgio. A probabilidade do k - simo indivduo do estrato
h pertencer amostra definida pelo produto das probabilidades de seleo em cada
estgio:
h1 =
u hi M hij
nh .M hi
100
, h2 =
, h3 =
Mh
M hi
M hij
em que:
85
u hi : nmero de unidades bsicas de sade selecionadas no municpio i do
estrato h ;
M hij : nmero de indivduos da unidade bsica de sade j no municpio i do
estrato h .
Ento:
hk = h1. h 2 . h3
hk =
nh .M hi u hi M hij 100
.
.
Mh
M hi M hij
hk =
100 nh
Mh
whk =
hk
86
(considera apenas o conglomerado, excluindo estratos e pesos amostrais), AE (considera
apenas o estrato, excluindo conglomerado e pesos amostrais), AP (considera apenas
peso amostral, excluindo conglomerados e estratos).
Estimativas para mdia e proporo, erros padres, intervalos de 95% de
confiana para as variveis da pesquisa foram obtidas para cada uma das cinco
estratgias de anlises.
Foi ajustado um modelo de regresso de Poisson com varincia robusta para a
varivel glicemia em jejum (CDGLN) dicotomizada (no diabetes, provvel ou muito
provvel diabetes) em funo do sexo, da idade (40 a 49 anos, 50 anos ou mais) e do
ndice de massa corporal (menos que 25 Kg/m2, 25 Kg/m2 a 29,99 Kg/m2, 30 Kg/m2 ou
mais) considerando AAS, AC e cada componente isoladamente (ACO, AE, AP). O
mtodo de estimao utilizado foi o de mxima pseudo-verossimilhana (MPV) com
linearizao por srie de Taylor.
Utilizou-se a deviance para verificar o ajuste global do modelo na AAS. O teste
de Wald ajustado8 foi utilizado para avaliar a significncia global dos demais modelos.
Para avaliar a diferena nos valores das estimativas de variabilidade usou-se o
EPA (efeito do plano amostral ou DEFF design effect) proposto por Kish (1965)9. O
EPA obtido pela razo entre a varincia estimada considerando o plano efetivamente
utilizado e a varincia estimada considerando uma AAS.
As anlises foram realizadas no aplicativo STATA 9.08, o qual possui rotinas
que incorporam o delineamento amostral complexo. Os comandos utilizados para
regresso de Poisson esto apresentados no Quadro 2.
87
Comando
componente
AAS1
Complexo2
Conglomerado
Estrato
Peso amostral
, irr foi adicionado no final da segunda linha do comando para obter a razo de prevalncia
RESULTADOS
88
60,11), que o IMC mdio de 26,79 (IC95%: 26,58 26,99) e que 19,71% (IC95%:
16,89 - 22,52) dos indivduos so classificados como apresentando diabetes provvel
ou muito provvel diabetes.
Observa-se que no h praticamente diferena na estimativa pontual da
proporo do sexo feminino na populao entre AAS (56,91%) e AC (56,93%). Porm,
a variabilidade associada estimativa mais afetada, obtendo-se um erro padro na
AAS de 0,71% e na AC de 1,27%, resultando num intervalo de confiana mais amplo
na AC.
Os erros padres da idade mdia, IMC mdio, glicemia mdia e proporo de
CDGLN so subestimados quando foi ignorado o plano complexo. O erro padro da
glicemia mdia sofreu o maior impacto aumentando de 1,0141 na AAS para 3,2638 na
AC o que ocasionou o alto valor de EPA (10,34).
Quando o conglomerado foi considerado isoladamente o EPA variou de 3,22 a
9,75; quando o estrato foi considerando isoladamente, o EPA foi igual a 1,00 para todas
as variveis. Nos resultados da anlise considerando o peso isoladamente, observa-se a
diferena na estimativa pontual da mdia e proporo em relao AAS, porm no
houve diferena nos erros-padres.
Na Tabela 2, apresentam-se os resultados da modelagem observando-se
pequenas diferenas nas estimativas dos coeficientes de regresso de Poisson entre as
anlises considerando AAS e AC. Contudo, h diferenas acentuadas nas estimativas de
variabilidade. Na anlise da componente estrato isoladamente, os resultados so
similares AAS, sem diferena entre as estimativas pontuais e de variabilidade. No
entanto h um aumento no erro-padro dos coeficientes na anlise da componente
conglomerado e diferena nos coeficientes na anlise da componente peso comparada
AAS.
89
O impacto do plano amostral complexo maior para as estimativas de mdia e
proporo do que para os coeficientes de regresso de Poisson. Os EPAs para mdia e
proporo variam de 2,13 a 10,34 (Tabela 1) e os coeficientes de regresso de Poisson
variam de 1,00 a 1,34 (Tabela 2).
Os intervalos de confiana para as razes de prevalncia das variveis em
anlise so mais estreitos quando se ignora o plano complexo (Tabela 3).
Percebe-se o impacto do plano amostral complexo no teste de comparao de
mdias da glicemia entre os sexos (Tabela 4). O teste significativo (p = 0,034)
considerando AAS e torna-se no significativo (p = 0,086) na AC e quando se avalia
isoladamente a componente conglomerado (p = 0,090). No se percebe impacto nas
significncias quando se avalia a componente estrato e a componente peso amostral
isoladamente.
DISCUSSO
90
proporo so semelhantes, explicado pelo peso atribudo a cada elemento da amostra
foi o mesmo dentro de cada estrato. Korn e Graubard10 descrevem que as estimativas
considerando a AAS so similares s obtidas ao considerar a ponderao, quando os
pesos amostrais tm pouca variabilidade.
O plano amostral com probabilidade proporcional ao tamanho (PPT) produz
fraes desiguais de seleo em cada estgio, e o produto das fraes parciais produz
uma frao final igual associada a cada unidade de terceiro estgio, se a seleo no
primeiro estgio de amostragem for PPT e no ltimo estgio for AAS com tamanhos
iguais11, dentro de cada estrato, como o caso deste estudo.
Os achados mostram que as estimativas pontuais somente diferiram quando o
peso amostral foi considerado na anlise, tanto na estimativa de mdia e proporo
como na estimativa dos coeficientes de regresso. Isso relatado na literatura (Pessoa e
Silva11, Brogan12, Leite e Silva13, Silva et al.14). Quando se tem grande variabilidade nos
pesos, o impacto nas estimativas pontuais ser considervel e afetar ainda mais as
estimativas de variabilidade15, portanto, a incorporao dos pesos fortemente
recomendada. Kreuter e Valliant3 apontam que as estimativas obtidas quando se
desconsideram os pesos amostrais no so vlidas para toda a populao.
A diferena nas estimativas de variabilidade percebida nos erros padres e nos
intervalos de confiana. Quando se compara a AAS e AC verificaram-se alteraes em
todos os intervalos de confiana, observando-se amplitudes maiores na AC. Nas
estimativas de mdia e proporo da AC os erros padres foram todos maiores em
relao a AAS e nas estimativas dos coeficientes de regresso de Poisson os EPAs
foram menores. Esses achados so consistentes com estudos de Prez et al.16, RodgersFarmer e Davis17, Guilln et al.18, Heeringa e Liu19.
91
Da mesma forma, quando incorporou-se somente o conglomerado na anlise de
dados, as estimativas pontuais foram iguais aos resultados da AAS, porm, os erros
padres foram maiores. Estes resultados so consistentes com o estudo de Sousa e
Silva20. Os achados mostram que o conglomerado engloba a variabilidade, pois todos os
EPAs para AC e para o plano por conglomerado so maiores que 1,00 (exceto para
idade foi igual a 1,00 na AC), refletindo o aumento na varincia dos estimadores que
ocorre devido homogeneidade dentro dos conglomerados.
A homogeneidade dentro dos conglomerados torna o plano amostral por
conglomerados menos eficiente21, aumentando o erro padro das estimativas, quando
comparado a AAS, evidenciando-se a necessidade de considerar o plano amostral
complexo na anlise dos dados, principalmente o efeito do conglomerado20. Desejam-se
conglomerados heterogneos dentro de si, porm na prtica isso dificilmente ocorre,
como constatou-se nesse estudo.
De forma diferente, quando se incorporou somente o estrato na anlise de dados,
obtiveram-se estimativas pontuais e de variabilidade muito semelhantes s obtidas com
a anlise considerando AAS. Isso se explica por no se obter estratos homogneos j
que a estratificao foi realizada por facilidade logstica e no com o objetivo de se ter
estratos mais homogneos. No entanto, desconsiderar o efeito da estratificao pode ter
pequeno impacto nas estimativas dos parmetros, mas aumenta o erro padro no caso
dos estratos serem homogneos em relao varivel de estudo. Desta forma,
importante a incorporao do estrato na anlise.
Esse estudo encontrou maior diferena nos erros padres associados mdia e
proporo do que nos erros padres associados aos coeficientes do modelo de regresso
de Poisson, quando comparou-se AC com AAS. Esta mesma constatao foi apontada
nos estudos de Lemeshow et al.22 e Lemeshow e Cook23, embora estes estudos tenham
92
utilizado regresso logstica. No foram encontrados estudos comparando AAS e AC
utilizando regresso de Poisson.
Deve-se considerar uma limitao neste estudo, referente falta de ajuste para
no-resposta, no sentido de refletir exatamente a frao populacional na amostra. Neste
estudo, o peso um fator de expanso utilizado na anlise dos dados que teve o objetivo
de projetar o nmero de indivduos populacionais que cada indivduo da amostra
representa, sendo definido para cada regio (estrato).
Mostrou-se a importncia da incorporao do plano efetivamente utilizado na
pesquisa para se obter concluses corretas. Apesar de algumas diferenas assumirem
pequenas magnitudes quando se compara AAS e AC, parecendo indicar pouco impacto
principalmente nas estimativas pontuais, cabe lembrar que este estudo baseou-se em
apenas um banco de dados. O impacto poder ser maior em outros estudos, conduzindo
a resultados errneos caso o plano amostral efetivamente utilizado na coleta de dados
no seja incorporado na anlise estatstica.
Recomenda-se, portanto, que os pesquisadores incorporem o delineamento
amostral efetivamente utilizado em suas pesquisas, pois atualmente h disponibilidade
de rotinas em aplicativos que permitem incorporar as caractersticas do plano amostral
complexo em diversos tipos de anlise. A concluso deste estudo a de que se podem
obter diferentes concluses sobre erros padres, a significncia e a conseqente incluso
ou no de variveis no modelo conforme o delineamento amostral considerado na
anlise.
93
Colaboradores
REFERNCIAS
Kreuter F, Valliant R. A survey on survey statistics: what is done and can be done
in Stata. The Stata Journal 2007;7(1):1-21.
10
Korn EL, Graubard BI. Epidemiologic studies utilizing surveys: accounting for
the sampling design. American Journal of Public Health 1991;81(9):1166-73
11
Pessoa DGC, Silva PLN. Anlise de dados amostrais complexos. So Paulo: ABEAssociao Brasileira de Estatstica; 1998.
94
12
Brogan DJ. Pitfalls of using standard statistical software packages for sample
surveys
data.
Em:
http://www.fas.harvard.edu/~stats/survey-
14
Silva PLN, Pessoa DGC, Lila MF. Anlise estatstica de dados da PNAD:
incorporando a estrutura do plano amostral. Cincia e Sade Coletiva
2002;7(4):659-70.
15
Ciol MA, Hoffman JM, Dudgeon BJ, Shumway-Cook A, Yokston KM, Chan L.
Understanding the Use of Weights in the Analysis of Data From Multistage
Surveys. Archives of Physical Medicine Rehabilitation 2006;87:299-303.
16
Prez MC, Utra IB, Len AA, Roche RG, Sagu KA, Rosa MC, et al.
Estimationes usadas en diseos muestrales complejos: aplicaciones en la encuesta
de salud cubana del ao 2001. Revista Panamericana de Salud Publica
2004;15(3):176-84.
17
18
19
Heeringa SG, Liu J. Complex sample design effects and inference for mental
health survey data. International Journal of Methods in Psychiatric Research
1997;7(1):56-65.
20
21
22
23
95
TABELAS
Estimativa
Componente
Sexo (feminino)
Erro
IC 95%
EPA
Padro
Proporo
Simples
0,5691
0,0071
[0,5552;0,5830]
Complexo
0,5693
0,0127
[0,5438;0,5948]
3,21
Conglomerado
0,5691
0,0126
[0,5437;0,5946]
3,22
Estrato
0,5691
0,0070
[0,5553;0,5830]
1,00
Peso amostral
0,5693
0,0071
[0,5554;0,5832]
1,00
Mdia
Idade
Simples
59,46
0,1637
[59,1414;59,7832]
Complexo
59,47
0,3177
[58,8349;60,1127]
3,77
Conglomerado
59,46
0,3431
[58,7737;60,1509]
4,39
Estrato
59,46
0,1629
[59,1430;59,7816]
1,00
Peso amostral
59,47
0,1639
[59,1525;59,7951]
1,00
IMC
Mdia
Simples
26,80
0,0697
[26,6665;26,9401]
Complexo
26,79
0,1013
[26,5836;26,9909]
2,13
Conglomerado
26,80
0,1273
[26,5479;27,0589]
3,33
Estrato
26,80
0,0692
[26,6676;26,9392]
1,00
Peso amostral
26,79
0,0693
[26,6513;26,9232]
1,00
Glicemia
Mdia
Simples
168,32
1,0141
[166,3343;170,3106]
Complexo
168,45
3,2638
[161,8912;175,0158]
10,34
Conglomerado
168,32
3,1666
[161,9683;174,6766]
9,75
Estrato
168,32
1,0099
[166,3426;170,3023]
1,00
Peso amostral
168,45
1,0179
[166,4579;170,4490]
1,01
CDGLN (diabetes)
Proporo
Simples
0,1961
0,0057
[0,1850;0,2072]
Complexo
0,1971
0,0140
[0,1689;0,2252]
6,07
Conglomerado
0,1961
0,0140
[0,1689;0,2232]
5,70
Estrato
0,1961
0,0057
[0,1850;0,2072]
1,00
Peso amostral
0,1971
0,0057
[0,1859;0,2082]
1,01
96
Tabela 2. Contribuies relativas dos componentes do plano amostral nos coeficientes de
regresso de Poisson para a varivel resposta CDGLN
Componente
Estimativa
Varivel
Erro
IC 95%
EPA
padro
Simples
Sexoa
-0,0854
0,0580
[-0,1990; 0,0282]
0,141
Idade
0,1538
0,0719
[ 0,0129; 0,2947]
0,032
0,1081
0,0684
[-0,0258; 0,2421]
0,114
0,3093
0,0791
[ 0,1544; 0,4643]
<0,01
-1,8173
0,0857
[-1,9853;-1,6493]
<0,01
-0,0913
0,0608
[-0,2135; 0,0309]
0,139
1,11
Idade
0,1566
0,0719
[ 0,0121; 0,3012]
0,034
1,00
0,1057
0,0787
[-0,0526; 0,2640]
0,186
1,34
0,3092
0,0861
[ 0,1361; 0,4823]
0,001
1,19
-1,8099
0,1135
[-2,0380; -1,5817]
<0,01
1,77
-0,0854
0,0605
[-0,2068; 0,0360]
0,164
1,09
Idade
0,1538
0,0765
[ 0,0003; 0,3073]
0,050
1,13
0,1081
0,0802
[-0,0529; 0,2691]
0,184
1,38
0,3093
0,0855
[ 0,1377; 0,4810]
0,001
1,17
-1,8173
0,1181
[-2,0543;-1,5802]
<0,01
1,90
-0,0852
0,0580
[-0,1991; 0,0282]
0,141
1,00
Idade
0,1538
0,0719
[ 0,0129; 0,2947]
0,032
1,00
0,1081
0,0683
[-0,0258; 0,2421]
0,114
1,00
0,3093
0,0791
[ 0,1543; 0,4643]
<0,01
1,00
-1,8173
0,0856
[-1,9851; -1,6494]
<0,01
1,00
-0,0913
0,0580
[-0,2050; 0,0223]
0,115
1,01
Idade
0,1566
0,0720
[ 0,0155; 0,2978]
0,030
1,01
0,1057
0,0684
[-0,0284; 0,2397]
0,122
1,01
0,3092
0,0791
[0,1542; 0,4642]
<0,01
1,01
-1,8099
0,0858
[-1,9781; -1,6416]
<0,01
1,01
IMC sobrepeso
obeso
Constante
Complexo
Sexoa
b
IMC sobrepeso
obeso
Constante
Conglomerado
Sexoa
b
IMC sobrepeso
obeso
Constante
Estrato
Sexoa
b
IMC sobrepeso
obeso
Constante
Peso amostral
Sexoa
b
IMC sobrepeso
obeso
Constante
a
97
Plano amostral
Simples
Complexo
RP
IC 95%
RP
IC 95%
0,9181
[0,8195;1,0286]
0,9127
[0,8077;1,0313]
Idade
1,1662
[1,0130;1,3428]
1,1696
[1,0122;1,3514]
1,1142
[0,9745;1,2739]
1,1115
[0,9487;1,3021]
1,3625
[1,1669;1,5908]
1,3623
[1,1458;1,6197]
Sexo
a
b
IMC sobrepeso
obeso
a
Mdia EP
Mdia EP
EPA
Masculino
Feminino
Simples
170,8460 1,5249
166,5077 1,3599
0,034
Complexo
171,0449 3,1057
166,5887 3,7598
0,086
1,54
Conglomerado
170,8460 3,1769
166,5077 3,5474
0,090
1,51
Estrato
170,8460 1,5200
166,5077 1,3584
0,034
1,00
Peso amostral
171,0449 1,5309
166,5887 1,3644
0,030
1,01
40 a 49 anos
50 anos ou mais
Simples
163,0613 2,0812
169,8897 1,1600
0,004
Complexo
163,2139 3,7899
170,0113 3,2991
0,007
1,03
Conglomerado
163,0613 3,7403
169,2188 3,2188
0,010
1,16
Estrato
163,0613 2,0782
169,8897 1,1559
0,004
1,00
Peso amostral
163,2139 2,0895
170,0113 1,1641
0,005
1,01
98
6.2 ARTIGO 2
ESTIMATIVAS OBTIDAS POR ABORDAGENS DA AMOSTRAGEM
COMPLEXA E DE MODELOS MULTINVEL: APLICAO EM UM ESTUDO
COM ESCOLARES DE ENSINO FUNDAMENTAL NO MUNICPIO DE
IJU/RS
1, 3
1, 2
Joo RIBOLDI
Elsa MUNDTOCK
1, 2
99
RESUMO
agrupados em nveis ou hierarquias. Para tratar estas estruturas complexas existem duas
principais abordagens: abordagem da amostragem complexa e abordagem de modelos
multinvel. Este estudo tem o propsito de avaliar as duas abordagens para anlise de
dados provindos de estruturas ou delineamentos complexos utilizando dados de um
estudo do desempenho das crianas na avaliao de conhecimento, percepes e crenas
sobre aleitamento materno realizado com escolares da quinta srie do ensino
fundamental, no municpio de Iju/RS.
Mtodo: Trata-se de um estudo aleatorizado, com amostra estratificada por
100
ABSTRACT
according to levels. Two approaches are used to deal with these complex structures: the
complex sample approach, and the multilevel model approach. This study evaluated
these two approaches to complex survey data analysis using the database of a study
about the performance of children in the evaluation of knowledge, perceptions and
beliefs about maternal breastfeeding conducted with fifth graders in Iju, Brazil.
Method: This random study had a stratified cluster sampling design, and its outcome
was a performance score. Estimates of means, proportions and standard errors were
calculated for a simple random sample and for a complex sample. Linear regression
models with and without sample weights were adjusted for the complex sample and
multilevel model approaches.
Results: There was a difference in the p-value of the final model coefficient between
weighted and unweighted analysis in the complex sample approach. There was no
difference in the significance of coefficients between the weighted and unweighted
analyses in the multilevel model approach. The complex sample approach showed
significantly greater standard errors of the regression coefficients than the multilevel
model approach. The coefficient associated with the variable gender was not
significant (p=0.068) in the weighted complex sample approach, but was significant
(p=0.030) in the weighted multilevel model approach.
Conclusion: Differences in standard errors between complex and simple random
sampling showed the need to incorporate the complexity of the sample level into data
analysis. The choice of an adequate approach depends on research questions: when
researchers look for results at both group and individual levels, the choice should be the
multilevel model approach. Otherwise, the complex sample approach should be chosen.
101
INTRODUO
102
pressupem que as observaes so independentes e, na presena de conglomerados,
essa pressuposio falha, pois indivduos dentro de conglomerados geralmente so mais
semelhantes do que indivduos entre conglomerados.
Vieira6 encontrou grandes diferenas entre as estimativas dos erros padres das
estimativas dos parmetros dos modelos ajustados considerando independncia das
observaes utilizando procedimentos computacionais padres, e aquelas obtidas
quando considerou a estrutura do delineamento amostral utilizando procedimentos
computacionais especficos para tratamento de dados de amostragem complexa.
Na anlise multinvel, os fatores so considerados em dois ou mais nveis e a
varivel resposta no nvel individual (nvel 1). Os conglomerados so considerados na
anlise como nveis e estratos so incorporados explicitamente no modelo.
Procedimentos padres de anlise de dados so inadequados, pois estes desconsideram a
estrutura complexa existente na populao. A vantagem do modelo multinvel a
possibilidade de estimao de efeitos intragrupo (efeitos individuais) e entre grupos
(efeitos contextuais) e, ainda possvel modelar a estrutura da varincia em cada um
dos nveis7.
Pessoa e Silva1 e Lehtonen e Pahkinen2 apresentam a anlise multinvel como
uma alternativa de anlise de dados provindos de amostragem complexa. Lehtonen e
Pahkinen2 realizaram estudos na rea da educao para comparar resultados obtidos na
modelagem considerando AAS com os obtidos nas abordagens da amostragem
complexa e da anlise multinvel, observando diferenas tanto para efeitos dos
coeficientes do modelo quanto para a significncia destes coeficientes.
A utilizao de probabilidade desigual de seleo de indivduos num processo de
amostragem deve ser incorporada tanto na abordagem da amostragem complexa1,2
como na de modelos multinvel8, visando evitar a ocorrncia de vcios na estimao dos
103
parmetros do modelo5,9. O motivo principal que procedimentos padres de anlise de
dados consideram os dados como provindos de amostra aleatria simples (AAS), na
qual todos os indivduos tm a mesma probabilidade de serem sorteados. Pfeffermann et
al.10 apresentam uma forma de incorporar pesos no ajuste de modelos hierrquicos para
compensar diferentes probabilidades de incluso das unidades na amostra.
Assis8 ajustou um modelo de regresso linear mltipla para dados obtidos por
amostragem complexa na Pesquisa de Padres de Vida (PPV) do IBGE. Os resultados
indicam diferenas nas estimativas dos parmetros quando se compara a anlise
multinvel sem ponderao e anlise multinvel ponderada pelos pesos amostrais.
Quando so comparadas as estimativas dos erros padres dos coeficientes estimados
para os dois mtodos, as diferenas so ainda maiores.
comum encontrar anlises de dados de amostragem complexa realizadas
inadequadamente, isto , desconsiderando a complexidade da estrutura dos dados,
evidenciando a necessidade de estudos que demonstrem procedimentos corretos para
anlise deste tipo de dados11,12,13.
Desta forma, este estudo tem o propsito de avaliar as duas abordagens
amostragem complexa e modelos multinvel - para anlise de dados provindos de
delineamento complexo, utilizando dados de um estudo com escolares da quinta srie
do ensino fundamental do municpio de Iju, Rio Grande do Sul (RS)14.
104
MTODOS
Delineamento
Trata-se
de
um
estudo
aleatorizado,
com
amostra
estratificada
por
Estratos
1 Estgio: escolas
2 Estgio: turmas
32 Escolas
Pblicas
Urbanas
11 Escolas
Pblicas
Rurais
4 Escolas
Particulares
Urbanas
19 Escolas
Pblicas
Urbanas
9 Escolas
Pblicas
Rurais
2 Escolas
Particulares
Urbanas
9
Controle
10
Experimental
4
Controle
5
Experimental
1
Controle
1
Experimental
105
106
Estratgia de anlise dos dados
107
Nas modelagens para as duas abordagens foram obtidas estimativas dos
coeficientes de regresso, erros-padres e nvel de significncia associados aos
coeficientes, com o principal interesse de verificar se a varivel desfecho escore-ps
difere entre o grupo experimental e o controle. Utilizaram-se como variveis
independentes as caractersticas dos escolares (sexo e idade), escore-pr e tratamento.
Na anlise, considerando amostragem complexa, as escolas foram definidas
como conglomerados (UPA) e tipo de escola, como estratos. Dois modelos de
regresso linear foram obtidos, um considerando pesos amostrais e outro
desconsiderando pesos amostrais. O teste de Wald foi usado para verificar a influncia
de cada varivel e a significncia geral do modelo. O processo de incluso das
variveis iniciou com a incluso da varivel escore-pr (medida baseline), seguida das
variveis sexo, idade e tratamento.
O mtodo de estimao utilizado foi o de mxima pseudo-verossimilhana
(MPV) com linearizao por srie de Taylor, o qual considera os pesos amostrais dos
elementos da amostra18. O efeito do plano amostral complexo foi calculado por
V
()
, onde Vverd () a varincia do estimador considerando o plano
EPA ( )= VERD
V AAS ( )
amostral complexo e VAAS () a varincia pressupondo que a amostra foi coletada a
partir de uma AAS, com o mesmo nmero n de elementos selecionados. Com o EPA
possvel avaliar o impacto no erro padro da estimativa quando se desconsidera o plano
amostral complexo.
O peso amostral do i -simo aluno foi definido por wi =
1hk 2 jhk
, em
108
probabilidade j -sima turma ser sorteada na escola h e i a probabilidade final do
Yij = 0 + 1 X ij + u 0 j + e0 ij
em que:
Yij : desfecho do i-sima unidade do nvel 1, agrupada na j-sima unidade do nvel 2;
X ij : varivel preditora medida na i-sima unidade do nvel 1, agrupada na j-sima
unidade do nvel 2;
109
I (Yij | X ij ) =
u20
u20 + e20
Yij = 0 j + 1 j X 1ij + e0 ij
110
Ento, no nvel 2,
0 j = 0 + u0 j
1 j = 1 + u1 j
em que:
0 2
u0 j
u 0 u1
e Var (e0ij ) ~ N (0, e20 )
Var ~ N , u 0
2
u
0
u1u 0
u1
ij
111
A varincia modelada como uma funo de uma varivel preditora.
Os parmetros foram estimados usando IGLS (Iterative Generalized Least
Squares). Os pesos amostrais foram definidos para cada nvel, sendo o inverso da
probabilidade de seleo das unidades de amostragem em cada nvel, definidos como
w1 e w2 para o nvel 1 e para o nvel 2, respectivamente.
Questes ticas
O projeto (processo nmero 01-429) foi aprovado pelo Grupo de Pesquisa e Psgraduao do Hospital de Clnicas de Porto Alegre e pela Comisso Cientfica e
Comisso de Pesquisa e tica em Sade.
O projeto foi aprovado pela 36 Coordenadoria de Educao do municpio de
Iju, Secretaria Municipal de Educao de Iju e pela direo das escolas particulares
deste municpio. As escolas selecionadas foram previamente visitadas e informadas
sobre a pesquisa, ficando livres a participar ou no da pesquisa. O Termo de
Consentimento Livre e Esclarecido foi enviado aos pais dos escolares antes do incio da
pesquisa.
112
RESULTADOS
113
Abordagem da amostragem complexa
114
modelo com interceptos aleatrios. Neste caso, os coeficientes de regresso so os
mesmos para todas as escolas, mas os interceptos podem variar. Tambm foram
considerados modelos com varincia complexa (intercepto e inclinao aleatrios),
porm no foram significativamente superiores ao modelo com intercepto aleatrio.
Na Tabela 4 encontram-se os resultados para os modelos multinvel ajustados
sem ponderao, observando-se que a mdia geral do escore-ps 15,431. A varincia
residual no nvel de alunos 16,463, enquanto que a varincia residual no nvel de
escola 9,419, obtendo-se um coeficiente de correlao intra-conglomerado (CCI) de
0,3639. Com base no valor de CCI indica-se a necessidade de ajuste de um modelo
multinvel.
O modelo 2 foi ajustado somente com as variveis do nvel 1, obtendo-se todos
coeficientes significativos e CCI de 0,4053. No modelo 3 foram includas as variveis
do nvel 2, sendo o tratamento altamente significativo e o tipo de escola no
significativo. O CCI no modelo 3 0,0238, observando-se que o tratamento contribuiu
muito para a explicar a reduo da variabilidade ao nvel 2 (escolas).
Na Tabela 5 so apresentados os modelos multinvel para a anlise ponderada.
O CCI para o modelo 1 0,3638, sendo a varincia residual do nvel de alunos e do
nvel de escola de 25,736 e 14,719, respectivamente. Nos modelos 2 e 3, todas as
variveis foram significativas ao nvel de 5% de significncia. No modelo 3, a varivel
tipo de escola no contribuiu para a significncia do modelo, sendo retirada. Os CCIs
para o modelo 2 e 3 so 0,4111 e 0,0277, respectivamente, obtendo-se uma reduo
significativa da variabilidade no nvel 2 (escolas) quando o tratamento includo no
modelo 3.
115
Abordagem da amostragem complexa versus abordagem de modelo multinvel
DISCUSSO
116
inviabilizando o trabalho. No presente estudo, incontestvel a maior viabilidade em se
pesquisar crianas em escolas ao invs de residncias.
Apesar
de
existir
recursos
disponveis,
tanto
metodolgicos
quanto
117
apresentadas como apropriadas para tratamento de dados provindos de AC. Estas
metodologias, modelagem multinvel e amostragem complexa, incorporam as
caractersticas
do
delineamento
complexo
como
estratos,
conglomerados
118
Essas diferenas nos resultados entre as duas abordagens se d pelo motivo da
interveno ter sido realizada no nvel de escola (nvel 2). Assim, a varivel de
interveno (tratamento) engloba a varincia desse nvel na modelagem multinvel e
repercute de forma mais acentuada, nas variveis do nvel individual (nvel 1),
produzindo
coeficientes
diferentes
erros-padres
menores,
modificando
119
Assim, os conglomerados so tratados como nveis de hierarquia, as covariveis
so utilizadas para tratar estratos, tratamentos (interveno) e medida baseline no
modelo multinvel32.
Correa5 indicou a necessidade de incorporar pesos na anlise multinvel, quando
a probabilidade de seleo dos indivduos diferente, visando a melhorar a qualidade
das estimativas dos parmetros do modelo. Ento, deve-se estar atento quando unidades
em qualquer nvel da hierarquia so selecionadas com probabilidades desiguais, para
evitar a ocorrncia de vcios na estimao dos parmetros do modelo5,8,17. Pfeffermann
et al.10 apresentaram uma forma de incorporar pesos no ajuste de modelos hierrquicos
para compensar diferentes probabilidades de incluso das unidades na amostra. No
presente trabalho, incorporou-se o peso de cada nvel (escola e alunos) pela opo
disponvel no MLwiN. Cabe salientar, que o peso usado foi o peso bruto.
Chantala et al.15 tem discutido o uso de pesos amostrais em modelos de dois
nveis (modelos mistos). Alertam que a incorporao dos pesos na abordagem
multinvel realizada de forma diferente que na abordagem da amostragem complexa.
Sendo assim, sugere-se comparaes mais acuradas atravs da realizao de
estudos de simulao para comparar a abordagem de amostragem complexa e a
abordagem de modelos multinvel, considerando diferentes planos amostrais e
diferentes tamanhos de amostra para avaliar o efeito dos aspectos da amostragem
(conglomerado, estrato, probabilidade diferente de seleo) nos resultados da
modelagem.
120
REFERNCIAS
121
10 Pfeffermann D, Skinner C, Goldstein H, Holmes DJ, Rasbash J. Weighting for
unequal selection probabilities in multilevel models. Journal of the Royal
Statistical Society 1998;60(Srie B):23-40.
11 Sousa MH, Silva NN. Estimativas obtidas de um levantamento complexo.
Revista de Sade Pblica 2003;37(5):662-70.
12 Kreuter F, Valliant R. A survey on survey statistics: what is done and can be
done in Stata. The Stata Journal 2007;7(1):1-21.
13 Vieira MT. Amostragem Repetida no Tempo: o uso de painis. IBGE - Rio de
Janeiro/RJ: 1 Escola de Amostragem e Metodologia de Pesquisa; 2007.
14 Bottaro SM. Avaliao de Estratgia de Promoo do Aleitamento Materno em
Escolas do Ensino Fundamental. Tese de doutorado em Cincias Mdicas
Pediatria, Faculdade de Medicina. Universidade Federal do Rio Grande do Sul;
2006.
15 Chantala K, Blanchette D, Suchindran CM. Software to compute sampling
weights
for
multilevel
analysis.
Em:
http://www.cpc.unc.edu/restools/data_analysis/ml_sampling_weights/Compute
%20Weights%20for%20Multilevel%20Analysis.pdf, acesso em 17/01/2008.
16 Asparouhov T, Muthen B. Multilevel Modeling of Complex Survey Data.
Proceedings of the Joint Statistical Meeting in Seattle. 08/2006. Seattle.
17 Rabe-Hesketh S, Skrondal A. Multilevel modelling of complex survey data.
Journal of the Royal Statistical Society A 2006;169(4):805-27.
18 Silva PLN, Pessoa DGC, Lila MF. Anlise estatstica de dados da PNAD:
incorporando a estrutura do plano amostral. Cincia e Sade Coletiva
2002;7(4):659-70.
19 Snijders T, Bosker R. An introduction to basic and advanced multilevel
modeling. 1 ed. London: SAGE Publications; 1999.
20 Zanini RR. Modelos multinveis aplicados ao estudo da mortalidade infantil no
Rio Grande do Sul, Brasil, de 1994 a 2004. Tese de doutorado em
Epidemiologia. Faculdade de Medicina. Universidade Federal do Rio Grande do
Sul; 2007.
122
21 StataCorp. STATA, release 9. Stata Corporation. 1985-2005.
22 SAS Institute, Inc. SAS statistical software, release 9.1. Cary, NC: SAS
Institute, Inc, 2002.
23 MLwiN, version 2.02. Multilevel Models Project, c. 2000. London: Institute of
Education, University of London.
24 Utra IB, Prez MC, Marqus LL. Influencia de la estructura de los datos en la
seleccin de los mtodos de anlisis estadsticos. Revista Espaola de Salud
Pblica 2002;76:95-103.
25 Murray DM, Varnell SP, Blitstein JL. Design and analysis of group-randomized
trials: a review of recent methodological developments. American Journal of
Public Health 2004;94:423-32.
26 Ukoumunne OC, Gulliford MC, Chinn S, Sterne JAC, Burney PGJ, Donner A.
Methods in health service research: evaluation of health interventions at area and
organisation level. British Medical Journal 1999;319:376-9.
27 Barros AJD. Modelos multinvel: primeiros passos. Departamento de Medicina
Social. Faculdade de Medicina. Universidade Federal de Pelotas. 2001.
28 Thomas SL, Heck RH. Analysis of large-scale secondary data in higher
education research. Research in Higher Education 2001;42(5):517-40.
29 Hope AD, Shannon ED. A comparison of two procedures to fit multi-level data:
PROC GLM verus PROC MIXED. Proceedings of the SAS users group
international 30. 10-13/04/2005. Philadelphia. Pennsylvania.
30 Ferro ME, Beltro KI, Santos DP. Modelo de regresso multinvel: aplicao
ao estudo do impacto da poltica de no-repetncia no desempenho escolar dos
alunos da 4 srie. Pesquisa e Planejamento Economico 2002; 32(3).
31 Campbell MK, Mollison J, Steen N, Grimshaw JM, Eccles M. Analysis of
cluster randomized trials in primary care: a practical approach. Family Practice
2000;17(2):192-6.
32 Donner A, Klar N. Cluster randomization trials in epidemiology: theory and
application. Journal of Statistical Planning an Inference 1994;42(1-2): 37-56.
123
QUADROS
Comando
Modelo 1
sem ponderao
Modelo 2
sem ponderao
Modelo 3
sem ponderao
Modelo 1
com ponderao
Modelo 2
com ponderao
Modelo 3
com ponderao
124
Quadro 2 Comandos utilizados para ajuste da regresso no SAS 9.1.3 e MLwiN 2.02
considerando a abordagem de modelos multinveis
Modelo
Modelo 1
Comando
proc mixed data=_PROJ_.banco_18_01_atual COVTEST;
sem ponderao
class ESCOLA;
(SAS)
Modelo 2
sem ponderao
(SAS)
Modelo 3
sem ponderao
(SAS)
Modelo 1
com ponderao1
(MLwiN)
Modelo 2
com ponderao1
(MLwiN)
Modelo 3
com ponderao1
(MLwiN)
125
TABELAS
Estimativa (IC95%)
n
AAS
AC
EPA
9 a 11 anos
397
70,766 (66,991-74,542)
72,823 (66,956-78,690)
2,31
12 a 17 anos
164
29,234 (25,458-33,009)
27,177 (21,310-33,044)
Feminino
283
50,446 (46,296-54,596)
51,393 (45,638-57,148)
Masculino
278
49,554 (45,404-53,704)
48,607 (42,852-54,362)
Pblica urbana
386
68,806 (64,960-72,651)
77,740 (68,028-87,452)
7,25
Pblica rural
126
22,460 (18,996-25,924)
11,612 (8,052-15,172)
1,64
49
8,734 (6,391-11,078)
10,648 (0,395-20,901)
14,70
561
12,538 (12,257-12,820)
12,523 (12,073-12,973)
2,31
Idade
Sexo2
1,76
Tipo de escola2
Particular urbana
Escore-pr1
1
mdia; proporo
126
Tabela 2. Estimativas, erro padro e nvel de significncia dos coeficientes de regresso linear
para o desfecho escore-ps na abordagem da amostragem complexa, sem ponderao
Variveis
Intercepto
Escore-pr
Idade
Sexo
Modelo 2
Modelo 3
15,562 (0,664)
14,173 (0,568)
11,004 (0,478)
p<0,0001;EPA=9,50
p<0,0001;EPA=2,57
p<0,0001;EPA=2,15
0,634 (0,058)
0,564 (0,046)
p<0,0001;EPA=1,24
p<0,0001;EPA=1,10
1,288 (0,645)
1,266 (0,365)
p=0,056;EPA=2,49
p=0,002;EPA=1,23
0,894 (0,349)
0,901 (0,380)
p=0,016;EPA=0,82
p=0,025;EPA=1,63
Tratamento
5,781 (0,394)
p<0,0001;EPA=1,81
<0,0001
<0,0001
F(3,25)
F(4,24)
127
Tabela 3. Estimativas, erro padro e nvel de significncia dos coeficientes de regresso linear
para o desfecho escore-ps na abordagem da amostragem complexa, com ponderao
Variveis
Intercepto
Escore-pr
Idade
Sexo
Modelo 2
Modelo 3
15,282 (0,755)
14,136 (0,596)
11,155 (0,526)
p<0,0001;EPA=12,47
p<0,0001;EPA=2,79
p<0,0001;EPA=2,70
0,643 (0,059)
0,585 (0,047)
p<0,0001;EPA=1,33
p<0,0001;EPA=1,29
1,083 (0,716)
1,003 (0,394)
p=0,142;EPA=3,01
p=0,017;EPA=1,43
0,664 (0,341)
0,800 (0,421)
p=0,062;EPA=0,78
p=0,068;EPA=2,10
Tratamento
5,899 (0,431)
p<0,0001;EPA=2,21
<0,0001
<0,0001
F(3,25)
F(4,24)
128
Tabela 4. Estimativas, erro padro e nvel de significncia dos coeficientes de regresso linear
para o desfecho escore-ps na abordagem da anlise multinvel, sem ponderao
Variveis
Modelo 2
Modelo 3
15,431 (0,588)
14,011(0,602)
10,982 (0,369)
p<0,001
p<0,001
p<0,001
0,577 (0,046)
0,564 (0,044)
p<0,001
p<0,001
1,403 (0,348)
1,326 (0,331)
p<0,001
p<0,001
0,912 (0,309)
0,905 (0,299)
p=0,003
p=0,002
Efeitos fixos
Nvel 1
Intercepto
Escore-pr
Idade
Sexo
Nvel 2
Tratamento
5,739 (0,356)
p<0,001
Efeitos aleatrios
Varincia do nvel 1 ( e 0 )
2
Varincia do nvel 2 ( u1 )
2
CCI
-2loglikelihood(IGLS)
16,463 (1,010)
11,874 (0,729)
11,831 (0,725)
p<0,001
p<0,001
p<0,001
9,419 (2,679)
8,093 (2,266)
0,288 (0,240)
p<0,001
p<0,001
p=0,230
0,3639
0,4053
0,0238
3233,105
3057,602
2989,249
129
Tabela 5. Estimativas, erro padro e nvel de significncia dos coeficientes de regresso linear
para o desfecho escore-ps na abordagem da anlise multinvel, com ponderao
Variveis
Modelo 2
Modelo 3
15,381 (0,597)
14,077 (0,500)
11,071 (0,480)
p<0,001
p<0,001
p<0,001
0,584 (0,037)
0,578 (0,038)
p<0,001
p<0,001
1,205 (0,385)
1,130 (0,374)
p<0,001
p=0,003
0,884 (0,398)
0,875 (0,402)
p=0,026
p=0,030
Efeitos fixos
Nvel 1
Intercepto
Escore-pr
Idade
Sexo
Nvel 2
Tratamento
5,823 (0,372)
p<0,001
Efeitos aleatrios
Varincia do nvel 1 ( e 0 )
2
Varincia do nvel 2 ( u1 )
2
CCI
-2loglikelihood(IGLS)
25,736 (1,932)
18,270 (1,626)
18,160 (1,614)
p<0,001
p<0,001
p<0,001
14,719 (1,756)
12,752 (1,798)
0,517 (0,432)
p<0,001
p<0,001
p=0,231
0,3638
0,4111
0,0277
3284,612
3103,430
3035,034
130
Nesta tese fez-se a descrio dos mtodos para tratamento de dados provindos de
planos amostrais complexos, freqentemente utilizados em estudos epidemiolgicos,
atravs de duas abordagens: amostragem complexa e modelo multinvel.
Para ilustrar os mtodos, analisaram-se dois conjuntos de dados j utilizados em
outras pesquisas, sendo que a teoria envolvida nesses dois casos pode ser estendida para
outros casos, tanto na abordagem da amostragem complexa como na abordagem de
modelos multinvel.
De um modo geral, observa-se que as estimativas pontuais de mdia, proporo
e coeficientes de regresso de Poisson so semelhantes entre amostragem complexa e
amostragem aleatria simples, mas h diferenas nos erros padres. As diferenas nos
erros padres da mdia e proporo so maiores do que dos coeficientes de regresso de
Poisson entre amostragem complexa e amostragem aleatria simples.
Desta forma, os resultados analisados e discutidos apontam para a necessidade
da incorporao da complexidade do plano amostral na anlise dos dados pelos
pesquisadores da rea epidemiolgica e de outras reas sempre que o plano amostral
considerado for complexo.
Tambm, mostrou-se que os resultados relativos regresso linear diferem
quanto aos erros padres dos coeficientes entre a abordagem da amostragem complexa e
a abordagem de modelos multinvel, sendo maiores na amostragem complexa.
Pode haver diferenas entre a significncia das variveis entre as modelagens
por amostragem complexa e por multinvel, o que implicaria, na prtica, modelos finais
131
diferentes. Tambm, pode haver diferena da significncia de variveis e, portanto, da
incluso de varives nos modelos entre a anlise ponderada e no ponderada, na
abordagem da amostragem complexa.
Na anlise multinvel os dados analisados no mostraram diferena de
significncia dos coeficientes entre os modelos com ponderao e sem ponderao, mas,
nos casos em que os pesos tiverem maior variabilidade, pode ocorrer diferenas entre
modelos com ponderao e sem ponderao, mostrando a importncia da incorporao
dos pesos amostrais na anlise.
A escolha de qual abordagem a mais apropriada depende da questo de
pesquisa: se o pesquisador deseja resultados tanto no nvel de grupo como individual
deve optar pela abordagem multinvel; caso contrrio, pela abordagem da amostragem
complexa.
Como concluso geral, os estudos apresentados neste trabalho evidenciam a
necessidade de incorporar a complexidade do plano amostral na anlise dos dados.
Sugere-se, para estudos futuros, a aplicao dos mtodos de estimao por reamostragem para obteno dos estimadores na anlise de dados incorporando planos
amostrais complexos. E, ainda, um estudo por simulao comparando a abordagem da
amostragem complexa com a abordagem de modelos multinvel.
132
Quadro A.1 Comando para diferentes tcnicas de anlise de dados no STATA 9.0
Tcnica de anlise
Comando
amostral
svy,
vce(linearized):
regress
svy,
vce(linearized):
logistic
de
ajuste
do
modelo, svylogitgof
svy,
vce(linearized):
poisson
svy,
vce(linearized):
poisson
var_conglomerado = nome da varivel que define conglomerado; var_estrato = nome da varivel que
define estrato; var_peso = nome da varivel que define pesos; var_name = nome da varivel de
pesquisa; var_reposta_name = nome da varivel resposta de pesquisa.
133
Quadro A.2 Comando para diferentes tcnicas de anlise de dados no SAS 9.1.3
Tcnica de anlise
Comando
Regresso logstica
Regresso Poisson
134
Comando
135
Quadro A.4 Comando para diferentes tcnicas de anlise de dados no EPI INFO
3.4.3
Tcnica de anlise
Comando
var_name
var_estrato
STRATAVAR=
WEIGHTVAR=var_peso
PSUVAR=var_conglomerado
Proporo
Regresso logstica
No disponvel
Regresso Poisson
No disponvel
Comando
modelo <glm(var_resposta_name~var_1_name+var_2_name,
data=nome_matriz_dados)
summary(modelo)
logitmodel <- svyglm(I(var_resposta_name == 1)
~var_1_name + var_2_name, design = plano,
family = quasibinomial())
summary(logitmodel)
poissonmodel <- svyglm(I(var_resposta_name ==
1) ~var_1_name + var_2_name, design = plano,
family = quasipoisson())
summary(poissonmodel)
Regresso logstica
Regresso Poisson
136
137
138
ANEXO
COMANDOS
PARA
ANLISE
MULTINVEL
EM
APLICATIVOS
Quadro C.1 Comando para modelagem multinvel com 2 nveis com desfecho
contnuo no SAS 9.1.3
Modelo
Comando
Modelo nulo
Modelo
com
intercepto
139
Quadro C.2 Comando para modelagem multinvel com 2 nveis com desfecho
contnuo no MLwiN 2.02
Modelo
Comando
Modelo
nulo
Modelo
com
intercepto
aleatrio
entre
grupos do
nvel 2
Modelo
com
intercepto
e
inclinao
aleatrios
entre
grupos do
nvel 2
var_reposta_name_nivel1 = nome da varivel resposta de pesquisa; var_name_nivel1 = nome da
varivel explicativa do nvel 1; var_name_nivel 2 = nome da varivel explicativa do nvel 2;
var_grupo_nvel 2 = nome da varivel que define o grupo; var_individuo_nivel1 = nome da varivel
que define o indivduo.
140
NUMQ
NUME
B. Dados da Escola:
1 . Nome da escola
2. Tipo de escola [1] estadual urbana
[2] estadual rural
[3] municipal urbana
[4] municipal rural
[5] particular
TIPE
C. Dados do aluno:
1. Nome do aluno:...............................................................................
2. Idade [___] anos completos
3. Sexo [1] masculino [2] feminino
4. Turma [ ][ ]
5. Turno [1] manh [2] tarde
IDADE
SEXO
TURMA
TURNO
D. Para cada questo, escolha apenas UMA resposta, a que melhor expresse a que sua opinio:
1. Na sua opinio, qual a principal funo das mamas?
MAMA1
141
av, acha que o neto precisa receber tambm gua e chazinho. Na sua opinio:
[1] Dona Teresa est certa, porque todo o beb precisa receber gua e chazinho desde que
nasce.
[2] Marquinhos no precisa de gua ou ch no primeiro ms, mas depois que completar 1 ms
vai precisar tomar gua e chazinho nos intervalos das mamadas no peito.
[3] Marquinhos deve receber chazinho s se tiver clicas.
[4] Marquinhos no precisa de gua ou ch, porque a criana que mama s no peito no precisa
de outros lquidos at os 6 meses.
[5] No sei.
5. Marquinhos agora tem 1 ms de idade, no chupa bico e s mama no peito. Dona Ana e seu MECO1
Paulo levaram Marquinhos ao mdico porque eles acham que Marquinhos chora muito. O
mdico disse que Marquinhos est bem e est crescendo bem. Se voc fosse a me ou o pai de
Marquinhos, o que voc faria em primeiro lugar para ele chorar menos?
[1] Daria bico.
[2] Daria mais colo.
[3] Daria mamadeira com outro leite.
[4] Daria chazinho.
[5] Daria umas palmadas.
[6] No sei.
6. Marquinhos j fez 2 meses e continua mamando s no peito. Os pais esto preocupados HORA1
porque Marquinhos no tem horrio certo para mamar. Mama seguido (8 a 12 vezes por dia) e
acorda noite para mamar. O mdico de Marquinhos constatou que ele est muito bem de
sade. Se voc fosse o mdico, o que diria para os pais de Marquinhos?
[1] normal beb dessa idade no ter horrio para mamar e mamar vrias vezes ao dia.
[2] preciso dar de mamar em horrios regulares (de 3 em 3 horas ou de 4 em 4 horas), para a
criana se disciplinar.
[3] preciso dar gua e chazinho para a criana mamar menos no peito.
[4] Durante o dia, a criana pode mamar quanto quiser, mas noite ela deve se acostumar a no
mamar.
[5] No sei.
7. Marquinhos vai completar 3 meses na semana que vem e ainda mama no peito. Ele est
crescendo bem. Os pais levaram Marquinhos ao mdico para saber quando ele deve comear a ALIA1
receber outros alimentos (suquinhos, frutinhas, sopinhas). O que voc acha que o mdico
respondeu?
[1] Marquinhos j deveria estar comendo outros alimentos.
[2] Marquinhos deve comear a comer outros alimentos quando completar 3 meses.
[3] Marquinhos deve comear a comer outros alimentos quando tiver 4 meses.
[4] Marquinhos deve comear a comer outros alimentos perto dos 6 meses.
[5] Marquinhos s deve comear a comer outros alimentos depois que completar 1 ano de
idade.
[6] No sei.
8. At quanto tempo voc acha que Marquinho deve mamar no peito?
[1] Por 3 meses.
[2] Por 6 meses.
[3] Por 1 ano.
[4] Por 2 anos ou mais.
[5] No sei.
MESES1
9. Marquinhos cresceu, casou-se com Marcela e tiveram uma filha chamada Linda. Marquinhos LINDA1
decidiu com Marcela que a filha seria amamentada no peito. Na sua opinio, qual a melhor
142
GOSTO2
[1] do peito
[2] da mamadeira.
[3] No sei.
11. mais fcil alimentar um beb ...........
FACIL2
DORA2
[1] di.
[2] no di.
[3] No sei.
13. O leite do peito de algumas mulheres..........
FRACOL2
DOEN2
JEITO2
MAGR2
DENT2
143
[2] precisa.
[3] No sei.
18. O beb que mama s no peito nos primeiros 6 meses..................
LEPO2
BICO2
[1] no preciso.
[2] preciso.
[3] No sei.
20. Beb que mama s no peito.......................... entre as mamadas.
ACHA2
COLIC2
[1] preciso.
[2] no preciso.
[3] No sei.
22. Para que uma mulher amamente o seu beb com sucesso............ a participao do pai.
PPAI2
NASC2
TRABA
[1] no possvel.
[2] possvel.
[3] No sei.
25. A amamentao..................... do peito da mulher ficar cado.
PEICA
ESCORE2
ESCORE
TOTAL
144
F. Escolha a resposta e marque com X, quando for pedido explique a sua resposta:
1. Voc mamou no peito?
MAMOU
ERAM
MUEMI
BFAM
BCON
DRUA
PERST
LIVRE
VOUTRO
Quais os outros? ---------------------------------------------------------------4. Nas suas brincadeiras da infncia, as bonecas mamavam no peito?
BRIBO
[ ] Sim.
[ ] No. [ ] No sei.
5. Voc acha que feio dar o peito para o beb na frente de outras pessoas?
[1] Sim
FEIO
6. Se voc (ou sua esposa) tivesse um filho hoje, como gostaria que ele fosse alimentado?
[1] S com leite em p, na mamadeira.
[2] S com leite de vaca (direto da vaca ou de saquinho), na mamadeira.
[3] S com leite do peito.
[4] Com leite do peito e outro leite na mamadeira.
[5] No tenho opinio ainda.
FIMA
145
1.......................................................................................
2.......................................................................................
3.......................................................................................
4. Diga trs coisas no boas da mamadeira:
1.......................................................................................
2.......................................................................................
3.......................................................................................
[ ] madrasta
[ ] pai
[ ] padrasto
[ ] irmos
[ ] com outros.
Quais so as outras pessoas? .......................................................
.....................................................................................................
2. A sua me sabe ler ?
MAE
MADRAS
PAI
PADRAS
IRMAOS
OUTRO
MESLER
MSESC
MPSF
[____] ANOS
MESC
[88] No sei.
PESLER
146
PSECR
PSESC
[88] No sei.
[_____] ANOS
PESC
147
ANEXO E DECLARAO
148
149
150
151
Projeto de Pesquisa
152
SUMRIO
153
1 INTRODUO
154
1.3 Justificativa
2 OBJETIVOS
2.1 Geral
155
2.2 Especficos
3 REVISO DE LITERATURA
156
AMOSTRAGEM
Amostragem o processo pelo qual obtm-se uma ou mais amostras da
populao. Na amostragem seleciona-se uma parte de uma populao para
observ-la com a finalidade de estimar parmetros populacionais. importante que
os
diferentes
procedimentos
amostrais
satisfaam
os
seguintes
critrios
(MUNDSTOCK, 2005):
1) que sejam amostras representativas da populao;
2) que forneam estimativas precisas das caractersticas da populao,
podendo medir sua confiabilidade;
3) que tenham pequeno custo para selecionar a amostra.
157
Unidades amostrais
As unidades amostrais so as unidades observadas com a finalidade de
fazer estimativas. As unidades podem ser pessoas, residncias, hospitais, entre
outras.
Amostragem probabilstica
Na amostragem probabilstica possvel calcular, com antecedncia, a
probabilidade de se obter cada uma das amostras possveis, sendo que todas as
unidades da populao tm probabilidade maior que zero de entrar na amostra.
importante observar que a aleatoriedade no uma caracterstica de uma
determinada amostra, mas sim do processo pelo qual foi obtida.
A seleo probabilstica de amostras exclui fontes humanas de erro, tais
como tendncias conscientes ou inconscientes de selecionar unidades com valores
maiores (ou menores) da varivel de interesse.
Tambm na amostra probabilstica possvel quantificar os erros de
amostragem, ou discrepncias entre as estimativas amostrais e os valores
populacionais que seriam obtidos observando todas as unidades da populao. O
uso de amostragem probabilstica permite que sejam feitas estimativas da
magnitude mdia desses erros. Tambm, permite pr-fixar o tamanho de amostra,
de maneira que a magnitude mdia dos erros de amostragem no ultrapasse um
valor pr-determinado com uma probabilidade pr-determinada.
158
Existem
diferentes
mtodos
de
obteno
de
uma
amostra
Amostragem estratificada
A populao dividida em subpopulaes mutuamente exclusivas chamadas
de estratos. A amostragem estratificada consiste em selecionar amostras em cada
estrato e combinar estas amostras numa nica amostra para estimar parmetros da
populao.
Tem como vantagem o aumento da preciso das estimativas, possibilidade
de obteno de informaes a nvel de estrato e facilidade na coleta de dados, por
razes fsicas ou administrativas.
159
Amostragem sistemtica
Quando uma listagem de indivduos da populao est disponvel, pode-se
selecionar, aleatoriamente, uma unidade amostral entre as k primeiras unidades
populacionais e, a partir da, selecionar as restantes a intervalos fixo em cada k
unidade.
160
TCNICAS
PARA
ESTIMAO
DE
PARMETROS
DE
AMOSTRAGEM
COMPLEXA
coeficiente
de
correlao)
necessitando
de
mais
esforo
161
so
escolhidas
freqentemente
para
ter
conglomerados
162
caracterstica
muito
comum
numa
amostra
complexa
163
164
tamanho da amostra como a soma dos pesos para o tamanho da populao, sendo
que isso no afeta a estimativa pontual da mdia, porm afeta o erro padro,
tornando-o menor do que realmente seria. Desta forma, os resultados dos testes de
hipteses podem ser significativos quando na realidade no seriam (THOMAS e
HECK, 2001). Os autores recomendam o uso de peso relativo.
A importncia de se considerar os pesos amostrais maior quando os
mesmos tm uma correlao inversa com a varivel analisada, j que nesse caso a
estimao no ponderada ser maior que o valor real. Quando os pesos amostrais
tm pouca variabilidade as estimativas pontuais considerando AAS so similares
ao considerar ponderao. Nas anlises considerando-se AAS tambm se
subestima as medidas de variabilidade, sendo que suas magnitudes depende da
magnitude do coeficiente de correlao das variveis analisadas dentro do
conglomerado. Quando a correlao grande, a variabilidade subestimada. A
anlise ponderada uma boa estratgia se o coeficiente de correlao pequeno
(29). As ponderaes podem aumentar ou diminuir o efeito do delineamento das
estimativas, dependendo da correlao dos valores dos pesos com o desvio-padro
da(s) varivel(s) usada na estimao da estatstica (HEERINGA e LIU, 1997).
Para (KORN e GRAUBARD, 1995), a escolha entre anlise ponderada e
no ponderada depende de cada estudo, da escolha entre robustez e eficincia,
isto , vis ou varincia.
O impacto do delineamento deve sempre ser considerado na anlise, porm
difcil identificar qual o aspecto do delineamento mais importante (KORN e
GRAUBARD, 1991). Os autores sugerem que se a diferena entre o nmero de
UPA e o nmero de estratos maior ou igual a 20, ento se considera o efeito do
conglomerado. Caso contrrio mtodos de anlise mais avanados devem ser
usados. O peso amostral deve ser considerado se a ineficincia for menor que
10%. Ainda sugerem sempre a documentao das variveis relacionadas ao
delineamento.
As estimativas pontuais dos parmetros so influenciadas pela ocorrncia
de pesos amostrais distintos, enquanto as estimativas de varincia (preciso) dos
estimadores dos parmetros do modelo so influenciadas tambm pelos efeitos de
estratificao e conglomerados (BROGAN, 2003), (LEITE e SILVA, 2002). O clculo
da varincia das estimativas desempenha papel essencial na realizao da
inferncia analtica permitindo a avaliao da preciso das estimativas, bem como
165
Ainda,
estimativas
pontuais
viesadas
erros-padro
166
regresso quadrtica houve grande diferena nas estimativas pontuais e nos errospadro entre as duas estratgias de anlise.
Detalhando os resultados para PAQUID, percebe-se que, incluindo a
ponderao, a razo de chances similar para as duas estratgias de anlise,
porm o efeito de proteo obtido atravs da tabela cruzada 18% maior na
anlise considerando o delineamento complexo e 12% maior utilizando a regresso
logstica. Para este caso especfico, as estimativas pontuais para as mdias so
pouco menores e os erros-padro so maiores considerando o delineamento
complexo.
A incorporao de pesos pode causar grandes diferenas nos resultados da
anlise entre as duas estratgias (LEMESHOW e COOK, 1999); (LEMESHOW et
al., 1998). (LEMESHOW e COOK, 1999) concluram a partir do estudo que
varincias de estimativas lineares, como para mdia, foram subestimadas quando o
delineamento complexo foi desconsiderado. Porm, os efeitos de delineamento
para coeficientes de regresso no foram to altos quanto para as mdias. Isto
pode ser justificado pela expresso do efeito do delineamento = 1 + ( n 1) x y ,
que depende do produto do coeficiente de correlao intraconglomerado da varivel
dependente y e independente x . J para o caso de estimativas lineares, como a
mdia, somente depende do coeficiente de correlao intraconglomerado de uma
varivel
Tambm,
possvel
que
os
coeficientes
de
correlao
167
168
169
170
no clculo
do testes
171
172
supondo uma AAS (LEITE e SILVA, 2002) (HEERINGA e LIU, 1997). Esta medida
utilizada na fase de planejamento da pesquisa, pois valores elevados do EPA
destacam a importncia da considerao do plano amostral efetivamente utilizado
ao estimar as varincias associadas s estimativas dos parmetros. EPA menor
que 1, indica varincia considerando AAS superestimada, EPA igual a 1 indica que
no h diferena entre as estimativas de varincia e EPA maior que 1 indica
varincia considerando AAS subestimada (PESSOA e SILVA, 1998).
O EPA ampliado (meff-misspecification effect) mais indicado para medidas
analticas, avaliando a tendncia de um estimador usual (consistente), calculado
sob hiptese de IID (independente identicamente distribudos), subestimar ou
superestimar a varincia verdadeira do estimado pontual (LEITE e SILVA, 2002).
Quanto maior o valor do EPA e do EPA ampliado, menor ser a
probabilidade real de cobertura do intervalo de confiana para o parmetro de
interesse, caso o intervalo seja calculado sem considerar o plano amostral da
pesquisa (LEITE e SILVA, 2002).
O EPA um importante indicador para o erro de amostragem, permitindo
avaliar subestimativas ou at superestimativas dos erros padro, utilizando-se as
diferentes caractersticas do delineamento amostral e diferentes mtodos de
estimao (SOUSA e SILVA, 2003). Os resultados do estudo de (SOUSA e SILVA,
2003) demonstraram que os conglomerados influenciaram a preciso das
estimativas, para duas das seis variveis estudadas, com EPA superiores a 1,5,
indicando a importncia de considerar os conglomerados na anlise. Apontam a
possvel existncia de heterogeneidade intraconglomerados para outras variveis,
em que EPA foram inferiores a 1.
Muthen e Satorra apud (RODGERS-FARMER e DAVIS, 2001), colocam que
essencial considerar as caractersticas do delineamento complexo, se o efeito do
delineamento for maior ou igual a 2. Ainda, quando o efeito do delineamento for
maior que 1 e menor que 2, a quantidade que excede 1 uma medida de
ineficincia da amostragem complexa (LaVange et al, em (RODGERS-FARMER e
DAVIS, 2001).
(BARATA et al., 2005) analisaram a representatividade da amostra e a
preciso das estimativas obtidas com o uso da metodologia por conglomerados (30
por 7) proposta pela Organizao Mundial da Sade, utilizando dados do inqurito
realizados em duas cidades de SP, no ano de 2000. Consideraram satisfatria a
173
preciso quando o EPA foi inferior a 2 e a amplitude dos intervalos de confiana foi
inferior a 10%, sendo estes valores utilizados na determinao do tamanho da
amostra.
Um efeito do desenho prximo a 1 significa que, para fins prticos, o grau de
homogeneidade das medidas nos conglomerados pode ser desprezado e que a
estimativa da proporo equivalente que seria obtida em uma AAS
(CORDEIRO, 2001).
O efeito do delineamento pode ser usado para determinar o tamanho efetivo
da amostra, dividindo o tamanho amostral nominal pelo EPA. O tamanho efetivo da
amostra fornece o nmero de elementos que produziriam com equivalente preciso
considerando amostra IID (independente, identicamente distribudo) (CARLSON,
2003).
Dessa forma, o efeito do delineamento importante para corrigir
procedimentos padro de anlise estatstica, por exemplo, no estgio de
delineamento incorporado no clculo do tamanho da amostra (NEUHAUS e
SEGAL, 1993).
SPSS (www.spss.com)
R (www.r-project.org)
174
Pacotes
estatsticos
padro
geralmente
no
consideram
quatro
175
et al., 2000) tambm concluem pela facilidade de incorporar o plano amostral nas
estimativas obtidas pelos programas estatsticos, sendo que isto deve encorajar os
pesquisadores a adotar essa estratgia de anlise.
A diferena entre anlise executada em um software tradicional e um
software que permite incorporar o delineamento amostral utilizando um exemplo no
SUDAAN foi demonstrada por (WANG, 2001). Ainda, demonstra que os
procedimentos disponveis nos softwares para anlise de amostra complexa
necessitam dos parmetros que indicam estgios, estratos, conglomerados,
probabilidade de seleo igual ou desigual, probabilidade proporcional ao tamanho
e amostragem com ou sem reposio.
Softwares para analisar dados de levantamentos amostrais complexos
foram comparados por (SOUSA e SILVA, 2000), avaliando facilidade de aplicao,
eficincia computacional e exatido dos resultados. Utilizaram dados da PNDS
(Pesquisa Nacional sobre Demografia e Sade, 1996), para analisar mdia e
proporo utilizando os softwares CSAMPLE/Epi Info v. 6.04, Stata v. 5 e
WesVarPC v 2.12 (incorporado ao SPSS). Concluram que o Epi Info mais
limitado na disponibilidade de tcnicas de anlise, porm seu uso simples e
gratuito. O Stata e WesVarPC tm diversidade de tcnicas de anlise, porm tem
custo de aquisio. Tambm, que a escolha pelo software depende das
necessidades e volume de anlise.
No Brasil, o primeiro estudo realizado no R foi de (FIGUEIREDO, 2004), que
tem a vantagem de ter o cdigo fonte aberto. Analisou dados obtidos de pesquisas
amostrais complexas, considerando o delineamento complexo e considerando AAS,
utilizando o SUDAAN e a biblioteca ADAC da linguagem R para modelos lineares
de regresso normal e logstica. Foram considerados aspectos tericos e
aplicaes em dados reais.
Oito softwares com capacidade de analisar dados de amostragem complexa
foram analisados por (BROGAN, 2005) de acordo com custo, mtodos de
estimao de varincia, opes de anlise, interface e vantagens/desvantagens.
Destes, 4 so livres. Anlises foram realizadas com dados de Burundi para 5
softwares (STATA, SAS, SUDAAN, WesVar e Epi-Info), obtendo-se resultados
equivalentes para todos quando linearizao por srie de Taylor e replicao
repetida balanceada foi usada.
176
ANLISE MULTINVEL
As metodologias adequadas para a anlise de dados amostrais complexos
podem ser agrupadas em duas abordagens, como comentado por (VIEIRA, 2001):
abordagem agregada, baseando-se na incorporao de pesos e efeitos do plano
amostral no ajuste dos modelos estatsticos e abordagem desagregada,
incorporando efeitos devidos amostragem complexa, utilizando modelos lineares
hierrquicos ou multinvel. No estudo, o autor abordou aspectos tericos das
tcnicas de estimao pontual de parmetros de modelos de regresso e
respectivas varincias. Tambm, discute o pacote SUDAAN na abordagem de
efeito do plano amostral, intervalos de confiana e testes de hipteses. A aplicao
foi realizada com dados do SAEB 1999 (Sistema Nacional de Avaliao da
Educao Bsica).
177
4 METODOLOGIA
178
amostra
aleatria
simples
com
modelagem
179
Banco de dados I
O projeto foi aprovado pelo Comit de tica em Pesquisa da UFRGS e
termo de consentimento informado foi obtido de cada participante da pesquisa.
Banco de dados II
O projeto (processo nmero 01-429) foi aprovado pelo Grupo de Pesquisa e
Ps-graduao do Hospital de Clnicas de Porto Alegre e pela Comisso Cientfica
e Comisso de Pesquisa e tica em Sade.
O projeto foi aprovado tambm pela 36 Coordenadoria de Educao do
municpio de Iju, Secretaria Municipal de Educao de Iju e pela direo das
escolas privadas deste municpio. As escolas selecionadas foram previamente
visitadas e informadas sobre a pesquisa, ficando livre a participar ou no da
pesquisa.
O Termo de Consentimento Livre e Esclarecido foi enviado aos pais dos
escolares antes do incio da pesquisa. A declarao de aceite para realizao do
estudo encontra-se arquivada. A forma de aplicao do termo encontra-se no
Manual do Entrevistador.
5 ASPECTOS OPERACIONAIS
180
5.2 Cronograma
Atividade
Estudo das metodologias de
complex survey e multinvel
Estudo das rotinas nos softwares
e implementao rotinas
Anlise dos dados atravs dos
softwares
Interpretao dos resultados
Apresentao boneco de tese
(maro)
Apresentao tese (abril)
181
6.1 Artigo 1
182
183
INTRODUO
184
MTODOS
185
f = f1 . f 2 . f 3
em que:
186
w=
1
f
RESULTADOS
TABELAS
Varivel
Plano amostral1
Erro
Padro
IC 95%
EPA
Sexoa
Masculino
Simples
Estrato
Conglomerado
Complexo
Feminino
Simples
Estrato
Conglomerado
Complexo
b
Idade
Simples
Estrato
Conglomerado
Complexo
IMCb
Simples
Estrato
Conglomerado
Complexo
1
plano amostral simples considera amostra aleatria simples e plano amostral complexo considera
amostra estratificada, conglomerado e peso;
a
proporo; b mdia.
187
Erro
Padro
IC 95%
EDA
plano amostral simples considera amostra aleatria simples; plano amostral complexo considera
amostra estratificada, conglomerado e peso; plano amostral conglomerado considera apenas o
conglomerado, excluindo estratos e pesos;
homem como categoria de referncia; b 40 a 49 anos de idade como categoria de referncia; c
peso corporal para incremento de um kg
Varivel
OR
Simples
IC 95%
OR
Complexo
IC 95%
Sexo
Idadeb
Pesoc
1
plano amostral simples considera amostra aleatria simples e plano amostral complexo considera
amostra estratificada, conglomerado e peso;
homem como categoria de referncia; b 40 a 49 anos de idade como categoria de referncia; c
peso corporal para incremento de um kg
188
REFERNCIAS
189
6.2 Artigo 2
190
191
INTRODUO
192
MTODOS
Delineamento do estudo
Trata-se de um ensaio clnico randomizado em cluster (amostra estratificada em
cluster) tendo como desfecho o desempenho das crianas na avaliao de conhecimento,
percepes e crenas sobre aleitamento materno.
Populao-alvo
A populao-alvo do estudo constituda de escolares de ambos os sexos,
matriculados na quinta srie das escolas estaduais, municipais e particulares do ensino
fundamental do municpio de Iju/RS.
Amostra
Seleo
Para a seleo da amostra, foram utilizados subgrupos populacionais conglomerados - representados primeiramente pelas escolas e, posteriormente, pelas turmas
de quinta srie existentes nas escolas sorteadas no primeiro estgio. O esquema amostral est
demonstrado na Figura 1.
Levou-se em considerao a proporo de alunos que freqentavam as escolas
estaduais, municipais e particulares, bem como a sua distribuio geogrfica na zona urbana
e zona rural.
A seleo das escolas foi realizada atravs de amostragem aleatria simples e a
seleo das turmas dentro das escolas tambm foi por amostragem aleatria simples, sendo
que quando a escola tinha apenas uma turma, esta teve probabilidade certa de ser includa na
amostra.
Foram considerados elegveis para o estudo todos os alunos que freqentavam a
quinta srie do ensino fundamental de Iju. Foram excludos os alunos que freqentavam a
escola no perodo noturno, os de escolas em que o nmero de alunos matriculados na quinta
srie era inferior a dez e os de turmas com alunos de sries diferentes.
193
ESQUEMA AMOSTRAL
ESTRATOS
Urbana
Particular
Urbana
Pblica
Rural
Pblica
CONGLOMERADOS (1 estgio)
E
S
C
O
L
A
E
S
C
O
L
A
E
S
C
O
L
A
E
S
C
O
L
A
E
S
C
O
L
A
E
S
C
O
L
A
E
S
C
O
L
A
E
S
C
O
L
A
CONGLOMERADOS (2 estgio)
194
Coleta de dados
Num primeiro momento, aplicou-se o questionrio em sala de aula, em todos os
alunos, tanto do grupo controle como do grupo experimental. Logo aps o incio da
interveno foi aplicado novo questionrio (ps-teste) somente no grupo experimental. Aps
trs meses do incio da interveno, o mesmo questionrio aplicado logo aps a interveno
foi novamente aplicado em todas as turmas, tanto do grupo controle como no experimental.
Variveis
Varivel desfecho: desempenho das crianas na avaliao de conhecimento,
percepes e crenas sobre aleitamento materno. Para o presente estudo o desempenho foi
avaliado atravs de um escore.
O questionrio utilizado na pesquisa continha perguntas 25 questes objetivas e 5
descritivas. O escore das questes objetivas variou de zero a 25 pontos
Outras variveis:
Tipo de escola (pblica e particular), procedncia (urbana e rural), turno (manh e
tarde), idade do escolar (em anos completos no dia da aplicao do questionrio), sexo do
escolar (feminino e masculino), escolaridade da me (at 8 anos, de 9 a 12 anos, mais que 12
anos) e escolaridade do pai (at 8 anos, de 9 a 12 anos, mais que 12 anos). Ainda, vivncias
prvias em aleitamento materno: se o escolar fora amamentado; se j havia visto algum
amamentando; se nas brincadeiras de infncia as bonecas mamavam no peito.; se acha feio
dar o peito na frente de outras pessoas; caso tivesse filho agora como alimentaria.
Anlise estatstica
195
Na anlise agregada, isto , anlise por nvel nico, realizada ajustamento para
probabilidade desigual de seleo e observaes no independentes (cluster) e na anlise
desagregada, isto , regresso multinvel, os efeitos do delineamento amostral so
incorporados no modelo analtico (THOMAS e HECK, 2001) (VIEIRA, 2001). Sendo que, a
anlise desagregada eficaz para tratamento de conglomerados, porm ainda necessita ajuste
para probabilidade desigual de seleo (THOMAS e HECK, 2001).
Software estatstico
Sero utilizados o STATA v.9, R v.2.1.1 ou SAS v.8, conforme a disponibilidade de
tcnicas para as anlises propostas.
Reference List
(1) Barata RB, Moraes JC, Antonio PRA, Dominguez M. Inqurito de
cobertura vacinal: avaliao emprica da tcnica de amostragem por
conglomerados proposta pela Organizao Mundial da Sade. Rev Panam
Salud Publica 2005;17(3):184-90.
196
197
198
(28) Kneipp SM, Yarandi HN. Complex sampling designs and statistical issues
in secondary analysis. Western Journal of Nursing Research
2002;24(5):552-66.
(29) Leite PGPG, Silva DBN. Anlise da situao ocupacional de crianas e
adolescentes nas regies sudeste e nordeste do Brasil utilizando
informaes da PNAD 1999. 2002.
(30) Lemeshow S, Letenneur L, Dartigues JF, Lafont S, Orgogozo JM,
Commenges D. Illustration of anlysis taking into account complex survey
considerations: the association between wine consumtion and dementia in
the PAQUID study. American Journal of Epidemiology 1998;148(3):298306.
(31) Wang ST, Yu ML, Lin LY. Consequences of analysing complex survey
data using inappropriate analysis and software computing packages. Public
Health 1997;111:259-62.
(32) Vasconcellos MTL, Protela MC. ndice de massa corporal e sua relao
com variveis nutricionais e scio-econmicas: um exemplo de uso de
regresso linear para um grupo de adultros brasileiros. Cadernos de Sade
Pblica 2001;17(6):1425-36.
(33) Pessoa DGC, Silva PLN. Anlise de dados amostrais complexos. So
Paulo: ABE-Associao Brasileira de Estatstica; 1998.
(34) Neuhaus JM, Segal MR. Design effects for binary regression models fitted
to dependent data. Statistics in Medicine 1993;12:1259-68.
(35) Wang MQ. Research notes: analysis of data from complex survey designs.
American Journal of Health Behavior 2001;25(1):72-4.
(36) Sousa MH, Silva NN. Comparao de software para anlise de dados de
levantamentos complexos. Rev Sade Pblica 2000;34(6):646-53.
(37) Figueiredo CC. Anlise de Regresso Incorporando o Esquema Amostral
[Dissertation] Universidade de So Paulo; 2004.
(38) Brogan D. Sampling error estimation for survey. Household sample surveys
in developing an transition countries.New York: United Nations
Publication; 2005. p. 447-90.
(39) Chantala K, Tabor J. Strategies to perform a design-based analysis using
the add health data. Eletronic Citation 1999 [cited 2003 Sep 20];1-20.
Available from: URL:
http://www.cpc.unc.edu/projects/addhealth/files/weight1.pdf
(40) Vieira MT. Um estudo comparativo das metodologias de modelagem de
dados amostrais complexos - uma aplicao ao SAEB 99 Pontifcia
Universidade Catlica do Rio de Janeiro; 2001.