Amostragem - Cap 1-2
Amostragem - Cap 1-2
Amostragem - Cap 1-2
TÉCNICAS DE AMOSTRAGEM
Organização e elaboração:
Profa. Marina Y. Toma
FAEST/ICEN/UFPA
BELÉM - PARÁ
2024
INTRODUÇÃO AS TÉCNICAS DE AMOSTRAGEM
I. NOÇÕES BÁSICAS
Vantagens da Amostragem
1) Maior rapidez;
2) Menor custo;
3) Maior exatidão.
Amostragem → Probabilística
→ Não Probabilística
Palavras chave:
- Amostra representativa: qualquer elemento da população pode fazer parte da amostra.
- Amostra: Subconjunto de uma população por meio da qual se estabelecem ou estimam
as propriedades e características de interesse da população.
- Amostragem: processo ou ato de construir(selecionar) uma amostra.
- Característica de interesse (variável): propriedade dos elementos da população que se
pretende conhecer.
- Censo: resultado de um levantamento estatístico que visa conhecer a totalidade da(s)
característica(s) individual(is) de uma população.
- Elemento, unidade de análise, unidade elementar ou unidade de observação e/ou
mensuração: suporte do atributo, ou atributos, cuja observação constitui o fim de um
levantamento de dados.
- Erro padrão de um estimador: é o desvio padrão desse estimador.
- Esperança ou valor esperado: valor médio de uma variável aleatória.
- Estimador de um parâmetro de dada população: é toda função de elementos de amostra
oriunda dessa população que mantém para com o parâmetro uma certa relação.
- Estimativa: valor que o estimador assume para dada amostra.
- Intervalo de Confiança: intervalo aleatório que contém a quantidade de interesse com
probabilidade fixada.
- Parâmetro de uma população: é uma função do conjunto de valores dessa população;
uma característica dessa população.
- Plano amostral: protocolo descrevendo os métodos e medidas para execução da
amostragem. Também é usado como sinônimo de Amostragem.
- População amostrada: população da qual foi retirada a amostra.
- População objetivo (alvo): população que se pretende atingir, usualmente estabelecida
nos objetivos da pesquisa.
- Tamanho da amostra: é o número de elementos que a compõem.
- Precisão e Fidedignidade: propriedade que tem um processo de observação de dar
lugar a um conjunto de observações da mesma entidade que apresentam uma
variabilidade maior ou menor.
- Sistema de referência (Frame): lista ou relação das unidades amostrais da população,
por meio da qual é possível selecionar a amostra.
- Unidade Amostral: cada uma das partes disjuntas em que uma população é
exaustivamente composta, para, do conjunto delas se façam extrações a fim de construir
uma amostra, ou estágio de uma amostra. Pode ser um conglomerado de unidades
elementares.
- Validade, Acuracidade ou Exatidão: é a propriedade do processo de medir que é isento
de erro sistemático.
- Viés ou Vício de um estimador de um parâmetro: é a diferença entre o seu valor
esperado e o valor do parâmetro.
Tipos de amostras:
Procedimento de Seleção
Critério do amostrador
Probabilístico Não probabilístico
Objetivo Amostras Probabilísticas Amostras Criteriosas
Subjetivo Amostras quase-aleatórias Amostras intencionais
Medidas de precisão:
Estimador não tendencioso: 𝑉𝑎𝑟(𝜇̂ )
Estimador tendencioso: 𝐸𝑄𝑀 (𝜇̂ ) = 𝑉𝑎𝑟(𝜇̂ ) + (𝑡𝑒𝑛𝑑ê𝑛𝑐𝑖𝑎)2
Em geral, a tendência é pouco significativa se tendência (erro padrão) < 0.1
ERROS: Todo levantamento amostral ou não, está sujeito a produzir diferenças entre o
parâmetro populacional de interesse e o valor da amostra usado para estimá-lo. Este
desvio é chamado de erro de pesquisa, definido como (𝑡 − 𝜃), onde é o parâmetro
populacional de interesse e t a estatística obtida a partir da amostra para estimar o
parâmetro.
Erro amostral: desvio que aparece porque o pesquisador não levantou a população toda.
Para cada amostra possível de um plano acarretaria em um possível desvio. Para a
população toda este desvio seria nulo.
Erros não amostrais: quando o desvio ocorre por fatores independentes do plano
amostral, e que poderiam ocorrer mesmo se a população toda fosse investigada, serão
considerados erros não amostrais. Pode ocorrer em qualquer etapa da pesquisa. Podem
ocorrer: erros ocorridos durante o levantamento dos dados, também chamados de erros
de observação; erros ocorridos em outros momentos.
Deve-se verificar: O momento onde o erro ocorre; o efeito do erro; quais as causas.
Erros de observação: Unidades perdidas; mensuração das observações; efeito do
entrevistador; insuficiência do questionário (redação deficiente); fatores para não
resposta; falta de resposta total; falta de contato com as unidades; recusa; abandono
durante a pesquisa; incapacidade de responder; perda de documentação; recusa em
questões sensíveis (renda); dados incoerentes.
O efeito da falta de resposta depende do volume de não respondentes; diferença de perfil
de respondentes e não respondentes.
Outros fatores importantes: como controlar a qualidade total; controle das fases críticas,
conhecendo as fontes de erros existentes; viés da falta de resposta; viés do respondente
(problemas da aplicação do questionário e sua administração.)
Outros erros não amostrais: sistema de referência (SR) não adequado; cobertura
incompleta; diferença entre SR e população amostrada; inclusão de elementos não
sorteados ou de outras populações.
Exemplo: Considere a população formanda por três domicílios U = {1, 2, 3} e que estão
sendo observadas as seguintes variáveis: nome (do chefe), sexo, idade, fumante ou não,
renda bruta familiar e número de trabalhadores, descrita na Tabela de três domicílios:
Variável Valores Notação
Unidade 1 2 3 i
Nome do chefe Ana, Rui, Eva Ai
Sexo (a) 0 1 0 Xi
Idade 20 30 40 Yi
Fumante (b) 0 1 1 Zi
Renda Bruta Familiar 12 30 18 Fi
Nº de Trabalhadores 1 3 2 Ti
𝟏
ou às vezes, 𝜽(𝐷) = 𝑺𝑿𝒀 = 𝐶𝑜𝑣(𝑋, 𝑌) = 𝑵−𝟏 ∑𝑁
𝑖=1(𝑋𝒊 − 𝜇𝑋 )(𝑌𝒊 − 𝜇)
𝝈𝑿𝒀
e) Correlação populacional: 𝜽(𝑫) = 𝝆𝑿𝒀 =
𝝈𝑿 𝝈𝒀
𝝉 𝝁
f) Razão populacional: 𝜃(𝑫) = 𝝉𝒀 = 𝝁𝒀 = 𝑅
𝑿 𝑿
̅ = 1 ∑ 𝑌𝑖
g) Razão média populacional: 𝜃(𝑫) = 𝑅 𝑁 𝑋 𝑖
AMOSTRA
Definição: uma sequência de n unidades de U, é denominada uma amostra ordenada de
Definição: Seja fi (s) o número de vezes (frequência) que a i-ésima unidade populacional
aparece na amostra s. Seja i a variável binária que indica a presença ou não da i-ésima
1, se 𝑖 ∈ 𝑆
unidade amostra s, isto é, 𝛿𝑖 (𝑠) = {
0, se 𝑖 ∉ 𝑆
Para S temos: S(U) = {(1), (2), (3), (1, 1), (1, 2), (1, 3), (2, 1), ... , (2, 2, 1, 3, 2), ...}
E S2(U) = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)}.
O número de amostras ordenadas com reposição é 𝑁 𝑛 enquanto que o número de
𝑁
amostras sem reposição é dado pelo coeficiente binomial isto é ( ).
𝑛
PLANEJAMENTO AMOSTRAL
O objetivo é apresentar procedimentos amostrais probabilísticos, ou seja, aqueles que
permitem associar a cada amostra uma probabilidade conhecida de ser sorteada. O
modo como essas probabilidades são associadas é que irá definir um planejamento
amostral.
Definição: Uma função P(s) definida em S(U), satisfazendo P(s) 0, para qualquer s
E assim: E A[ H } = PA ( s )h( d s ).
{ s:sS A}
𝐸𝐴 (𝜃̂) = 𝜃
Definição: Viés do estimador ( d s ) , segundo o plano amostral A é dado por:
Expressões úteis:
Soma dos desvios quadráticos: ∑𝑁 2 𝑁 2
𝑖=1(𝑌𝑖 − 𝜇 ) = ∑𝑖=1 𝑌𝑖 − 𝑁𝜇
2
Para os planos que possuem tamanho fixo (os planos AAS com e sem reposição) tem-
𝑉𝑎𝑟𝐴 (𝑓)
se que Var A (n) = 0, implicando em: 𝐶𝑜𝑣𝐴 (𝑓, 𝑓′) = − (*)
(𝑁−1)
A variável aleatória t pode ser expressa em termos das va’s 𝑓𝑖 , como: 𝑡(𝑠) = ∑𝑁
𝑖=1 𝑓𝑖 𝑌𝑖
Para a classe dos planos amostrais simétricos e de tamanho fixo, tem-se que:
N
E A (t ) = E A ( f ) Yi = E A ( f ) . Além disso, usando (*),
i =1
N 1
Var A (t ) = Var A ( f ) Yi 2 − Var A ( f ) Yi Y j =
i =1 N −1 i j
2
N 1 N 2 1 N
= Var A ( f )[ Y − Yi Y j ] = Var A ( f )[ Yi − ( − Yi 2 + N 2 2 )] =
i =1 i N − 1 i j i =1 N − 1 i =1
N N
= Var A ( f ) (Yi − ) = Var A ( f ) NS
2 2
N − 1 i =1
Dado que VarA (t ) = E A (t ) − E A (t ) temos que E A (t ) = VarA (t ) + E A (t ) , e que no
2 2 2
Ou ainda: E A ( s q ) = E A ( f )[ N + N 2 ] = NE A ( f )[ 2 + 2 ]
2 2
E A ( f i ) = E A { E A [ f i | f j ]} e
VarA ( f i ) = E A {VarA [ f i \ f j ]} + VarA { E A [ f i \ f j ]} , i j = 1, 2, ... , N.