Livro Estatistica II
Livro Estatistica II
Livro Estatistica II
mahaluca@gmail.com
Inferncia Estatstica
Em geral, o investigador est interessado em certa(s) caracterstica(s) especfica(s) da populao
em estudo. Define-se ento uma certa varivel X que representar a caracterstica que se
pretende avaliar.
A varivel X poder designar: O nmero de filhos por famlia; O rendimento mensal dos
agregados familiares moambicanos ou de algumas provncias, ou distritos de interesse
econmico:
Plano de Amostragem constitudo por todas as etapas necessrias para seleccionar uma
amostra depois da definio da populao.
Mtodos de Amostragem
Amostragem Estratificada
mahaluca@gmail.com
Inferncia Estatstica
Amostragem Sistemtica
uma variao da amostragem aleatria simples. A sua aplicao requer que a populao seja
ordenada de tal modo que cada um de seus elementos possa ser unicamente identificado pela
posio. Apresentam condies para satisfao desse requisito uma populao identificada a
partir de uma lista que englobe todos os seus elementos, uma fila de pessoas ou um conjunto de
candidatos a um concurso identificado pela ficha de inscrio.
Amostragem Estratificada
Caracteriza-se pela seleco de uma amostra de cada subgrupo da populao considerada.
O fundamento para delimitar os subgrupos ou estratos pode ser encontrados em propriedades
como sexo, idade ou classe social. Muitas vezes essas propriedades so combinadas, o que
exige uma matriz de classificao. Por exemplo quando se compara homem e mulher com
"maior de 18 anos" e menor de 18 anos" resultam quatros extractos: homem menor de 18 anos,
mulher menor de 18 anos, homem maior de 18 anos, mulher maior de 18 anos.
A
amostragem
estratificada
pode
ser
proporcional
ou
no-proporcional.
No primeiro caso, selecciona-se de cada grupo uma amostra aleatria que seja proporcional
extenso de cada subgrupo determinada por alguma propriedade tida como relevante. Este
tipo de amostragem tem como principal vantagem o fato de assegurar representatividade em
Autor: Filipe Mahaluca
mahaluca@gmail.com
Inferncia Estatstica
relao
propriedades
adoptadas
como
critrios
para
estratificao.
mahaluca@gmail.com
Inferncia Estatstica
que no primeiro estgio as unidades amostrais so os estratos e no segundo so as componentes
da populao.
Nota: Nos levantamentos por Amostragem usam-se os Questionrios. Este tpico sera
tratado
2. ESTIMAO DE PARMETROS
Nesta seco introduziremos alguns conceitos aplicados na rea de inferncia Estatstica que
sero dados nos captulos seguintes. A inferncia estatstica inclui assim trs grandes tipos de
aplicao:
1. Estimao pontual;
2. Estimao por intervalos;
3. Testes de Hipteses;
mahaluca@gmail.com
Inferncia Estatstica
Exemplo:
Para estimar o parmetro (mdia da populao) duma populao normal poder-se-ia
utilizar, entre outros estimadores, o estimador:
2.2.1 No Enviesamento
Um estimador diz-se no enviesado (no viciado) se o valor mdio da estimativa (valor
esperado), para todas as amostras possveis do tamanho n, for exactamente igual ao valor real
da populao ou seja se para o parmetro se tem E[] .
Exemplos:
A mdia amostral X e a varincia amostral s 2 so exemplos de estimadores no viciados j
que demonstra que:
E[ X ]
.
E[ s 2 ] 2
mahaluca@gmail.com
Inferncia Estatstica
2.2.2 Eficincia
Um estimador diz-se eficiente, de dentro da classe dos estimadores no viciado ou centrados
tiver a menor varincia. Assim, dados dois estimadores 1 e 2 ambos no viciados, 1 ser mais
eficiente que 2 , se Var (1 ) Var (2 ) .
Exemplo:
De entre os estimadores para a mdia da populao normal, pode se demonstrar que X um
estimador eficiente; pois:
E[ X ]
, Onde designa qualquer outro estimador no viciado para .
Var[ X ] Var[ ]
2.2.3 Suficincia
O estimador diz-se suficiente, se utiliza toda a informao disponvel na amostra, relevante
para estimao de .
Exemplo: Os estimadores Mo e Me so estimadores suficientes para a mdia duma populao
normal .
N
N!
n n! N n !
Exemplo: Se uma populao contm 5 unidades, representadas por A, B, C, D e E,
respectivamente, existem 10 amostras diferentes de tamanho 3, que so.
mahaluca@gmail.com
Inferncia Estatstica
ABC
ABD
ABE
ACD
ACE
ADE
BCD
BCE
BDE
CDE
E as seis amostras ABC, ACB, BAC, BCA, CAB e CBA so consideradas de forma idntica.
mahaluca@gmail.com
10
Inferncia Estatstica
Assim:
Os valores obtidos para cada item nas N unidades que compem a populao so
representados por: y1, y2, y3,..., yN .
E os valores correspondentes na amostra por: y1, y2, y3, ..., yn ou simplismente yi (i =1, 2, ...,n)
Algumas caractersticas
Peso mdio;
duma cidade
Rendimento Total;
Nmero de mulheres;
Amostra
Y y i y1 y 2 ... y N
Total:
i 1
i 1
y1 y 2 ... y n
Mdia
y y 2 ... y N
Y 1
yi
y y 2 ... y n
y 1
i 1
y
i 1
Embora a amostragem seja realizada para diferentes objectivos, geralmente o interesse centras
em quatro caractersticas da populao, nomeadamente:
mahaluca@gmail.com
11
Inferncia Estatstica
2. O total = Y, Por exemplo, o nmero total de moradores dum distrito;
3. A razo entre dois totais ou duas mdias R
Y
X
Y
ou ;
4. A proporo de unidades que pertencem a uma certa classe ou categoria. Por exemplo a
proporo de habitantes do sexo Feminino, a proporo de estudantes dispensados, etc.
O Simbolo ^ usado para indicar a estimativa duma caracterstica da populao obtida atravs
da amostra. Nesta seco ns somente consideraremos as estimativas mais simples:
Estimativa (estimante)
Media da populao Y
Y y mdia da amostra
n
Total da populao Y
Y N y N
y
i 1
n
n
Razo da populao R
y
R
x
y
i 1
n
x
i 1
N
Em Y o factor
a que se multiplica o total da amostra chamado de factor de expanso, ou
n
n
, a razo entre o tamanho da amostra e o tamanho da
N
N
valor de y para todas as amostras e depois achamos a mdias das estimativas. O
n
mahaluca@gmail.com
12
Inferncia Estatstica
Smbolo E denota, mdia de todas possveis amostras, ou seja o valor esperados das mdias
amostrais
Teorema 3.1:
A mdia amostral y um estimador no viciado de Y , isto : E[ X ] Y
Demonstrao: Por definio
Ey
y
N
n
( y1 y 2 ... y n )
n
N!
n!( N n)!
N!
n
(3.1)
N
Onde o somatrio se estende para todas as amostras. Para calcular esta soma, ns
n
determinamos em quantas amostras um dado valor especfico yi aparece. Dado que existem
outras (N-1) unidades para o resto da amostra e (n-1) lugares para preencher na amostra, o
nmero de amostras contendo yi :
N 1
( N 1)!
n 1 (n 1)!( N n)!
Consequentemente,
(y
y 2 ... y n )
( N 1)!
( y1 y 2 ... y N )
(n 1)!( N n)!
De (a) teremos
( N n)!
n!( N _ n)!
( y1 y 2 ... y N )
(n 1)!( N n)! nN!
( y y 2 ... y N )
1
Y
N
Ey
Corolrio 3.1:
Y N y um estimador no viciado do total da populao Y.
(3.2)
mahaluca@gmail.com
13
Inferncia Estatstica
(y
i 1
Y )2
(3.4)
2
N
mostras possveis, ou seja E y Y .
n
Teorema 3.2: A varincia da mdia amostral para Amostragem Aleatria Simples igual a:
V y E y Y
Onde f
S 2 N n S 2
1 f
n
n
n
(3.5)
n
a fraco amostral.
N
S
n
N n / N
S
n
1 f
(3.6)
N 2 S 2 ( N n) N 2 S 2
1 f
V (Y ) E (Y Y ) 2
n
N
n
(3.7)
NS
n
( N n) / N
NS
n
1 f
(3.8)
mahaluca@gmail.com
14
Inferncia Estatstica
Sabemos que para qualquer populao infinita, para uma amostra de tamanho a varincia
da mdia amostral igual a:
V y
( N n)
para a varincia e o factor
N
( N n)
para o desvio padro.
N
Esses factores do-se o nome de factores de correlao da populao finita. Na pratica, o
factor de correco pode ser ignorado sempre que ele no exceder 5% e para muitas
aplicaes mesmo quando for superior a 10%. O efeito da ignorncia do factor da
correco super estima o erro padro do estimador y .
s2
(y
i 1
y) 2
(n 1)
S2
(y
i 1
Y )2
N 1
Nota: Ns tivemos um resultado idntico para populao infinita, onde provamos que
y e do total
da populao Y N y so:
Autor: Filipe Mahaluca
mahaluca@gmail.com
15
Inferncia Estatstica
ss N n s2
v( y ) s
1 f
n N n
2
y
(3.9)
e,
N 2ss N n N 2s2
2
1 f
v(Y ) sY
n N
n
(3.10)
Respectivamente.
Para os erros padro toma-se.
sy
s
s
1 f
sY
Ns
n
1 f
(3.11)
Y y
ts
n
1 f
(3.12)
b) Para o Total:
tNs
Y N y
1 f
n
(3.13)
50
80
90
95
mahaluca@gmail.com
99
16
Inferncia Estatstica
Valor de t corresponte
0.67
1.28
1.64
1.96
2.58
NOTA: Se o tamanho da amostra for menor do que 60, os pontos percentuais acima referidos
so tirados da tabela de distribuio t de Student com (n-1) graus de liberdade, graus
liberdades usados no calcula da varincia s 2 .
Exerccio:
Numa localidade com 250 Famlias (Agregados familiares), fez-se um levantamento por
amostragem com o objectivo de determinar o nmero de crianas com idades compreendias
entre 0 e 14 anos na aldeia independentemente de quem so os pais. Decidiu-se trabalhar com
uma amostra de 80 famlias (AF). A tabela abaixo indica os resultados do inqurito.
# filhos yi
Fi
13
19
15
20
10
mahaluca@gmail.com
17
Inferncia Estatstica
N
y
i 1
N
x
i 1
y
i 1
n
x
i 1
y
x
(3.14)
Exemplos dessa natureza ocorrem, frequentemente, quando a unidade de amostragem (no caso
do AF) e o nosso interesse est no valor mdio da populao por elemento. Os ndices tambm
aparecem em muitas outras aplicaes, como, por exemplo, o ndice de emprstimos para
construes imobilirias no total de emprstimos de um banco, ou o ndice de acres plantadas
com trigo, no total dos acres cultivados de uma fazenda.
Teorema 3.4:
Se as variveis yi e xi so medidas em cada unidade de uma amostra aleatria simples de
tamanho n, que se presume grande, a varincia da razo R y / x , aproximadamente igual
a:
Var R
1 f
nX
(y
Rx i ) 2
N 1
(3.15)
Onde
Y
n
R
o ndice dos valores mdios da populao e f .
N
X
Demonstrao:
mahaluca@gmail.com
18
Inferncia Estatstica
y
y Rx
R R R
x
x
(3.16)
y Rx
R R
X
E y Rx Y R X
E R R
0
X
X
Visto que R
Y
. Isto mostra que a ordem de aproximao usada, ou seja R um estimador
X
no viciado de R .
De (3.16), ns obtemos o seguinte resultado
1
Var ( R ) E ( R R) 2 E ( y R x) 2
X
D Y R X 0.
Assim, podemos calcular Var[R ] aplicando o teorema (2.2) a varincia da mdia da
Amostragem Aleatria Simples.
Como estimativa amostral de
N
(y
i 1
Rx i ) 2
N 1
comum tomar-se
n
(y
i 1
R xi ) 2
n 1
mahaluca@gmail.com
19
Inferncia Estatstica
E para o estimador do erro padro para R o seguinte:
1 f
s( R )
nX
(y
R xi ) 2
(3.17)
n 1
2 R yi xi R 2 xi2
n 1
(3.18)
y jk
k 1
nj
yj
(3.19)
mahaluca@gmail.com
20
Inferncia Estatstica
Assim:
1. y j um estimador no viciado para Y j ;
2. O erro padro para y j igual a
Sj
sy
nj
nj
(3.20)
Nj
Onde
Nj
Sj
2
jk
Y j
N j 1
k 1
(3.21)
nj
(3.22)
Nj
Onde
Nj
sj
2
k 1
jk
yj
n j 1
(3.23)
nj
n
pode ser utilizada em llugar de
, no
N
Nj
calculo do cpf.
mahaluca@gmail.com
21
Inferncia Estatstica
Yj N j y j
(3.24)
N
Yj
n
nj
y
k 1
jk
(3.25)
NS '
n
(Y j )
1
N
n
(3.26)
mahaluca@gmail.com
22
Inferncia Estatstica
S'
Yj
1
2
( yi )
N 1 sec tor j
N
(3.27)
Ns i
n
s Yj
1
N
n
(3.28)
Proporo de unidades em C
Na populao
Na amostra
Na populao
Na Amostra
P = A/N
p = a/n
a
um estimador no viciado da proporo da
n
A
.
N
Var ( p) E ( p P) 2
S 2 N n PQ N n
N N
n N
mahaluca@gmail.com
23
Inferncia Estatstica
Corolrio 1:
Corolrio 2: A varincia de A Np , o estimador do nmero total de unidades na classe/
categoria C, :
N 2 PQ N n
Var ( A )
n N 1
(37)
var( p) s p
2
N n
pq
(n 1)
(3.8)
Demonstrao:
Corolrio: O estimador no viciado da varincia de A Np , estimado do nmero total de
unidades na classe C na populao dada por:
N ( N n)
2
var( A ) s Np
pq
n 1
(3.11)
mahaluca@gmail.com
24
Inferncia Estatstica
Pr p P d
(3.12)
N n PQ
N 1 n
(3.13)
d t
N n PQ
N 1 n
(3.14)
Onde t a abcissa da curva normal que corta a rea nas regio em dois lados.
Resolvendo em relao a n, temos:
t 2 PQ
d2
n
1 t 2 PQ
1 2 1
N d
(3.15)
Para o uso prtico, como estimador aproximado para P, toma-se p na frmula. Se N for grande,
como primeira aproximao para n, toma-se:
n0
t 2 pq pq
V
d2
(3.16)
Onde
d2
= Varincia da populao desejada.
t2
n0
N
mahaluca@gmail.com
25
Inferncia Estatstica
n0
n0
(n0 1)
n
1
1 0
N
N
(3.17)
Pr y Y d
(3.18)
N n S
N
n
(3.19)
Ento
N n S
N
n
d t
(3.20)
tS
d
n 2
1 tS
1
Nd
(3.21)
Como para o caso das propores, toma-se como primeira aproximao para o tamanho da
amostra n o nmero:
2
S2
tS
n0
V
d
Autor: Filipe Mahaluca
(3.22)
mahaluca@gmail.com
26
Inferncia Estatstica
n0
seja grande. Caso seja, ento calculamos
N
n, como
n
n0
n
1 0
N
(3.23)
Se o que se pretende estimar o total da populao Y, com a margem de erro d , toma-se como
a primeira aproximao para n
NS
NtS
n0
V
d
2
(3.24)
mahaluca@gmail.com
27
Inferncia Estatstica
Se s1 for a varincia resultante da primeira amostra, tome unidades adicionais para tornar o
tamanho da amostra igual a:
2
s1
V
2
1 .
n1
(3.23)
2
1 .
n1
(3.24)
V
p1q1
Vn1
(3.25)
p p
V (1 2 p)
pq
(3.26)
mahaluca@gmail.com
28
Inferncia Estatstica
q1
3
1
Cp1 p1 q1 Cp1 n1
(3.27)
A estimativa torna-se:
Cp
P p
q
(3.28)
Nh
mahaluca@gmail.com
29
Inferncia Estatstica
fh
nk
= a fraco amostral no estrato
Nh
Wh
Nh
= O peso do estrato h
N
Nk
Yh
i 1
hi
Nh
nh
yh
i 1
nh
hi
Sh
1 Nh
Yhi Y h
N h 1 i 1
sh
1 nh
y hi y h
nh 1 i 1
mahaluca@gmail.com
30
Inferncia Estatstica
L
y st
na qual
N
h 1
yh
(6.1)
N N1 N 2 ... N L .
A estimativa y st , de modo geral, no o mesmo valor mdio amostral. Esse valor mdio
amostral, y , dado pela frmula:
L
n
h 1
yh
(6.2)
Nh
.
N
evidente que y coincide com y st , desde que em cada estrato se verifique a condio
nh N h
n
N
nh
n
Nh N
ou seja
fh f
(6.3)
mahaluca@gmail.com
31
Inferncia Estatstica
As principais propriedades da estimativa y st
yh
yh
da
populao Y , usa-se:
L
y st
N
h 1
yh
(6.4)
Teorema 6.2: Para a amostragem estratificada, a varincia do estimador y st , sendo este uma
estimativa do valor mdio da populao Y :
L
Var ( y st )
N
h 1
2
h
Var ( y h )
Wh Var ( y h )
2
(6.5)
h 1
Onde
Autor: Filipe Mahaluca
mahaluca@gmail.com
32
Inferncia Estatstica
V Var ( y h ) E y h Y h
(6.6)
Nota Importante: A varincia de y st depende das varincias dos estimadores das mdias Y h
de cada.
Teorema 6.3: Para a amostragem aleatria estratificada, a varincia da estimativa y st
2
L
Sh
1 L
2 S
V ( y st ) 2 N h ( N h nh )
Wh h (1 f h )
nh h1
nh
N h1
(6.8)
nh
forem desprezveis em todos os estratos,
Nh
tem-se:
V ( y st )
1
N2
L
Nh Sh
Wh S h
nh
nh
h 1
h 1
(6.9)
Esta frmula apropriada quando se podem desprezar as correces das para populaes
finitas.
Corolrio 6.3:
No caso em que a repartio proporcional, pode-se substituir nh por seu valor na frmula
(6.8),
nh
nN h
N
mahaluca@gmail.com
33
Inferncia Estatstica
N S N n 1 f
V ( y st ) h h
n N
n
h 1 N
2
W S
h 1
2
h
(6.10)
V y st
S N n Sw
1 f
w
n N
n
2
(6.11)
S
V (Yst ) N n ( N n nn ) h
nh
(6.12)
nh N h
n
N
(6.1)
mahaluca@gmail.com
34
Inferncia Estatstica
V Var y est para um dado custo especfico para a mostra ou para minimizar o custo para um
custo C C0 C h nh
(6.2)
i 1
Onde
C 0 = Custo de contingncias
C h = Custo por unidade em cada estrato e pode variar de unidade por unidade, e para cada
estrato, este custo proporcional ao tamanho da amostra.
Se a amostra alocada ao estrato de tal modo que a varincia do estimador seja mnima, na
condio de que o total oramento disponvel para cobrir a varivel custos fixa e igual a C e
que o custo de amostragem por unidade no estrato h Ch . Essa alocao dada por:
nn
Wh S h / Ch
W S
i 1
/ Ch
N h S h / Ch
N S
L
i 1
/ Ch
(6.3)
A equao (6.3) d nh em termo de n . Se os custos so fixos, ento n pode ser expresso como:
C C0 N h S h /
L
i 1
N S
L
i 1
Ch
Ch
(6.4)
mahaluca@gmail.com
35
Inferncia Estatstica
Se V Var y est
L
Wh S h Wh S h / C h
i 1
n
1 L
2
V Wh S h
N i 1
(6.5)
Onde, Wh N h / N .
nn
WS
N S
L h h L h h
n
Wh S h N h S h
i 1
(6.7)
i 1
CONFECAO DO QUESTIONRIO
Sob a denominao genrica de " formulrio " se inclui toda forma impressa destinada a colecta
de dados, tal como pronturios, formulrios de declarao de imposto de renda, formulrio de
atestado de bito ou questionrio que por sua vez permitem recolher dados ou sirvam para sua
apuraro.
mahaluca@gmail.com
36
Inferncia Estatstica
Os formulrios devem ser planejados cuidadosamente, de tal forma que sejam realmente teis e
que facilitem e no dificultem a obteno de dados. Eles devem ajudar a colectar informaes
de maneira completa e eficiente, permitindo uniformidades nas diferentes observaes e
evitando a colecta de dados inteis ou irrelevantes ao estudo.
1. Formas de aplicao de um questionrio:
I)
Desvantagens:
mahaluca@gmail.com
37
Inferncia Estatstica
O primeiro tem importncia para se decidir sobre os dados que em ultima estncia se recolhero
e o seguro para a adopo do tamanho, forma e tamanho mais conveniente.
O questionrio deve permitir reconhecer duas classes de dados:
I) Dados administrativos ou de Identificao - ajudaro a identificar as unidades em
observao.
II) Dados sobre o problema que se estuda - devem ter o propsito perfeitamente definido a ser
pertinentes ao estudo
Embora seja impossvel dar regras fixas para a correcta elaborao de um questionrio, os
seguintes princpios devem ser usados:
I) Decidir sobre os dados que sero colectados:
Fazer uma lista de todas as informaes que so " desejveis " colectar de acordo com a
finalidade do estudo;
O questionrio deve ser dividido em grupos de questes que denominamos de Blocos .As
questes de um bloco so de um mesmo assunto;
mahaluca@gmail.com
38
Inferncia Estatstica
A Forma
O Tamanho
O Material
A Cor
mahaluca@gmail.com
39
Inferncia Estatstica
Reformular se necessrio
No entanto antes de entramos nos temas especficos introduziremos alguns conceitos necessrios
para compreenso dessas matrias.
Exerccios Resolvidos
Um pesquisador deseja estimar a proporo de ratos nos quais se desenvolve um certo tipo de
tumor quando submetidos a radiao. Ele deseja que sua estimativa no se desvie da proporo
verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.
(a) Quantos animais ele precisa examinar para satisfazer essa exigncia?
z
1
,
6
4
pp
(
1
0
,
2
5
1681
0
,
0
2
Logo, para que o erro cometido na estimao da proporo de ratos nos quais se desenvolve
certo tipo de tumor quando submetidos a radiao seja no mximo 0,02 com probabilidade
igual a 0,90, o pesquisador precisa examinar 1.681 animais.
Autor: Filipe Mahaluca
mahaluca@gmail.com
40
Inferncia Estatstica
(b) Como seria possvel diminuir o tamanho da amostra utilizando a informao adicional de que
em geral esse tipo de radiao no afeta mais que 20% dos ratos?
Se p for no mximo 20%, o tamanho da amostra ser:
2
z
1
,
6
4
p
(
1
p
)
0
,
2
0
*
0
,
8
0
1076
0
,
0
2
Logo, se p for no mximo 20%, para que o erro cometido na estimao da proporo de
ratos nos quais se desenvolve certo tipo de tumor quando submetidos a radiao seja no mximo
0,02 com probabilidade igual a 0,90, o pesquisador precisa examinar 1.076 animais.
Exerccio 02
Antes de uma eleio, um determinado partido est interessado em estimar a proporo de
eleitores favorveis a seu candidato.
(a) Determine o tamanho de amostra necessrio para que o erro cometido na estimao seja de,
z
1
,
2
8
pp
(
1
0
,
2
5
4096
0
,
0
1
Logo, para que o erro cometido na estimao seja de no mximo 0,01, com probabilidade de
80%, o tamanho da amostra teria que ser de 4.096 eleitores.
Autor: Filipe Mahaluca
mahaluca@gmail.com
41
Inferncia Estatstica
(b) Uma amostra piloto revelou que entre 60% e 70% dos eleitores eram favorveis ao
candidato em questo. Com base nessa informao, qual deve ser o tamanho de amostra de
modo que as condies em (a) estejam satisfeitos?
Nesse caso, o mximo de p (1-p) ocorre quando p=0,60. Assim,
2
z
1
,
2
8
p
(
1
p
)
0
,
6
0
*
0
,
4
0
3933
0
,
0
1
ou seja, sabendo que p dever estar entre 0,60 e 0,70, o tamanho da amostra teria que ser
3.933, para que as condies em (a) sejam satisfeitas.
(c) Se na amostra com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores eram
p =0,55
P()= 0,95
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,975, portanto,
z=1,96.
p
(
1)
z
I
C
(
p
;
0
,
9
5
)
0
,
5
5
(
1
0
,
5
5
)
I
C
(
p
;
0
,
9
5
)
0
,
5
5
1
,
9
6
0
,
5
5
0
,
0
1
5
2
0
,
5
3
4
8
;
0
,
5
6
5
2
4
0
9
6
Exerccio 03
Um cientista resolve estimar a proporo p de indivduos com certa molstia numa regio. Ele
deseja que a probabilidade de que a sua estimativa no se desvie do verdadeiro valor de p
por mais que 0,02 seja de pelo menos 95%. Qual deve ser o tamanho da amostra para que
Autor: Filipe Mahaluca
mahaluca@gmail.com
42
Inferncia Estatstica
essas condies sejam satisfeitas? Um outro cientista descobre que a doena em questo est
relacionada com a concentrao da substncia A no sangue e que considerado doente todo
indivduo para o qual a concentrao A menor que 1,488 mg/cm3. Sabe-se que a
concentrao da substncia A no sangue tem distribuio normal com desvio padro 0,4 mg/cm3
e mdia maior que 2,0 mg/cm3. Voc acha que essas novas informaes podem ser utilizadas
pelo primeiro cientista para diminuir o tamanho amostral? Em caso afirmativo, qual seria o novo
tamanho amostral?
= 0,02
P()= 0,95
z tal que A(z) = 0,975 ,z = 1,96
Como no temos uma informao sobre p, devemos usar p=0,5, que maximiza p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
2
z
1
,
9
6
pp
(
1
0
,
2
5
2401
0
,
0
2
O tamanho da amostra deve ser 2.401 indivduos para que as condies acima sejam satisfeitas.
Seja X: concentrao da substncia A no sangue em mg/cm3
X~N (; 0,42), >2.
P = P (estar doente) = P(X<1,488) = P[Z < (1,488-2)/0,4] = P[Z < -1,28] = P[Z >1,28] =
= 1 - P[Z1,28] = 1 A(1,28) = 1 0,9 =0,1.
Assim, segundo um outro cientista, p menor ou igual a 0,10.
A informao acima podem ser utilizada pelo primeiro cientista para reduzir o tamanho da
amostra, pois como o valor de p no mximo 0,1, o valor mximo de p(1-p) atingido quando
p=0,10, e assim:
z
1
,
9
6
p
(
1
p
)
0
,
1
0
*
0
,
9
0
865
0
,
0
2
mahaluca@gmail.com
43
Inferncia Estatstica
Neste caso, a informao do segundo cientista ajuda a reduzir o tamanho de amostra para
aproximadamente 865 indivduos.
Exerccio 04
Um centro de estudos de pesquisa de opinio realizou uma pesquisa para avaliar a opinio dos
telespectadores de uma regio, sobre um certo comentarista desportivo. Para isso entrevistou
380 telespectadores, seleccionados ao acaso da regio, e constatou que 180 desejavam que o
comentarista fosse afastado da TV.
(a) Determine um intervalo de confiana de 90% para p:proporo de telespectadores,
180
p0,473
380
Considerando o coeficiente de confiana =0,90, temos que z tal que A(z)=0,95 e,
portanto, z=1,64.
Assim, o intervalo de confiana para p ser:
p
(
1)
z
I
C
(
p
;
0
,
9
0
)
0
,
4
7
(
1
0
,
4
7
)
I
C
(
p
;
0
,
9
0
)
0
,
4
7
1
,
6
4
0
,
4
7
0
,
0
4
0
,
4
3
;
0
,
5
1
3
8
0
(b) Suponha agora que o centro decida que um intervalo de confiana, com coeficiente de 90%
para p, deve ter comprimento 0,05. Voc acha que os dados do item (a) atingem esse
objetivo? Justifique e comente.
Os dados do item (a) no atingiram o objectivo, j que, o intervalo obtido no item (a) tem
comprimento igual a 0,08.
Autor: Filipe Mahaluca
mahaluca@gmail.com
44
Inferncia Estatstica
Para que o objectivo seja atingido, deveramos ter comprimento 0,05.
Para diminuir o comprimento do intervalo, necessrio diminuir o erro, ou seja,
Comprimento 0,05
= 0,025.
0
,
4
7
(
1
0
,
4
7
)
*
1
,
6
4
0
,
0
2
5
n
=1072.
*
n
Assim, os dados do item(a) atingem os objectivos se o nmero de telespectadores
entrevistados aumentar para 1.072.
Os dados do item (a) no atingem o objectivo, somente se o nmero de telespectadores
entrevistados aumentar para 1072, ou seja:
Comprimento = 0,05
= 0,025.
mahaluca@gmail.com
45
Inferncia Estatstica
Exerccios
1. Seja X1, X2, ..., X6, variveis aleatrias independentes, identicamente distribudas de forma
normal com a mdia, e varincia, 2 . Defina os seguintes estimadores:
X X 2 X 3 3X 5
a) 1 1
5
X X2 X3 X4
b) 2 1
4
2X1 X 2 X 3 X 4
X X2 X3 X4 X5
c) 3
d) 4 1
4
6
X X2 X3 X4 X5
e) 5 1
5
Diga qual desses estimadores no viciado e qual o mais eficiente.
2. Sejam X1 = 25, X2 = 30, X3 = 27, X4 = 35, X5 = 40, as idades dos estudantes duma turma
do DMI (Departamento de Matemtica e Informtica).
a) Com base nesses dados determine a idade mdia da turma.
b) Forme todas as amostras de tamanho trs e calcule as mdias de cada amostra e
comprove que E X e
var[ X ]
2
n
determine E X 1 X 2 e var X 1 X 2 .
mahaluca@gmail.com
46
Inferncia Estatstica
criana
10
11
Idade
15
10
15
20
18
11
20
Escore
95
71
83
91
102
87
93
100
104
94
113
Criana
12
13
14
15
16
17
18
19
20
21
Idade
10
11
11
10
12
42
17
11
10
Escore
96
83
84
102
100
105
57
121
86
100
a) Fazendo o uso da tabela de nmeros aleatrios seleccione uma amostra de tamanho 8. Inicie
a sua leitura da tabela em anexo na linha um, coluna dois. A leitura deve ser feita atravs das
colunas.
b) Com base na sua amostra determine:
6. Numa Biblioteca Privada, os livros esto arrumados em 130 estantes de igual tamanho. Duma
amostra aleatria de 15 estantes deu as seguintes quantidades de livros em cada estante:
28, 23, 25, 33, 31, 18, 22,
21, 28, 25
a) Estimar o valor total de livros dessa biblioteca e o intervalo de confiana dessa estimativa do
total.
b) Suponha agora que o resultado da estimativa no suficientemente correcto e pretendemos ser
95% certos de que a estimativa do do total duma amostra aleatria esteja a 100 de unidades
do valor verdadeiro. Quantas estantes devero ser inclusos na amostra?
mahaluca@gmail.com
47
Inferncia Estatstica
7. Num sector particular duma fbrica foi realizado um inquerido para tentar investigar at que
ponto o absentismo no este ligado com doenas ou frias oficiais. Uma amostra de 500
pessoas, num total de 36000 trabalhadores foi perguntada sobre o nmero de dias que eles
j tinham solicitado para descansar, nos anteriores seis meses.
Os resultados do inqurito foram os seguintes:
No. De dias de licena
No. De trabalhadores
157 192 90
31
18
40\ 0
10
1
mahaluca@gmail.com
48
Inferncia Estatstica
respectivamente. Cada estudante foi perguntado sobre a distncia entre a sua casa e a
universidade. Os resultados amostrais foram os seguintes:
y 1 5.14
y 2 4.90
s12 3.87
s22 4.02
mahaluca@gmail.com
49
Inferncia Estatstica
Tamanho
Nmero
Mdia
Desvio
da farma
de Farmas
de milho
Padro
Nh
Yh
Sh
0- 40
394
5.4
8.3
41-80
461
16.3
13.3
81-120
391
24.3
15.1
121-160
334
34.5
19.8
161-200
169
42.1
24.5
201-240
113
50.1
26.0
241 -
148
63.8
35.2
Total
ou 2010
26.3
mdias
Para uma amostra de 100 farmas, calcule o tamanho da amostra para cada estrato, usando:
a) A alocao proporcional;
b) A alocao ptima
16. Um amostrista pretende seleccionar uma amostra aleatria estratificada e suspeita que os
custos do trabalho de campo sero da forma
C n
h
Estrato
Wh
Sh
Ch
0.4
10
$4
0.6
20
$9
b) Determine o tamanho da amostra necessrio, para esta alocao, de modo que Var y 1.
a) Determine valores de n1 / n e n2 / n que minimizam o custos para dado valor de Var y est .
est
mahaluca@gmail.com
50
Inferncia Estatstica
Seja um estimado de q.
1 2
que contm , e se exigir que a probabilidade do intervalo seja de (1 ) = nvel de
confiana.
Geralmente (1-).100=90%, 95%, 99%, .
Esta tcnica diferencia-se da estimao por ponto, onde se calcula um nico valor (estimativa)
para o parmetro populacional. No caso do intervalo de confiana busca-se um segmento, ou
intervalo 1: 2 que contm o parmetro desconhecido.
Por exemplo, retira-se uma amostra de 500 Moambicanos e calcula-se a mdia de suas alturas
encontrando-se 1,66 m. Logo, uma estimao pontual da verdadeira altura mdia (m) dada
por x =1,66 m. J atravs do intervalo de confiana poder-se-ia encontrar um intervalo, por
exemplo [1,58; 1,68] que, em 95% das vezes, incluiria (a verdadeira altura mdia dos
Moambicanos).
mahaluca@gmail.com
51
Inferncia Estatstica
X ~N(;
Z/2)=1-
Resolvendo -se as duas inequaes para , tem-se o intervalo de confiana para a mdia
populacional () quando a varincia (2) conhecida:
P( X -Z/2
X +Z/2 )
Exemplo:
A durao da vida de uma pea de equipamento tal que = 5 horas.
Foram amostradas 100 dessas peas obtendo-se a mdia de 500 horas. Deseja-se construir um
intervalo de confiana para a verdadeira durao mdia da pea com um nvel de 95%.
Resolucao:
Do problema se tem: = 5; n = 100; X = 500; (1 a).100 = 95%
Z/2=1.96
Autor: Filipe Mahaluca
mahaluca@gmail.com
52
Inferncia Estatstica
Lembre-se que para descobrir a abcissa 1,96, entrou-se na tabela com 0.475= 47.5%, j que a
tabela da faixa central.
Substituindo se os dados na formula:
P(500-1,96.
500+1,96.
) =95%
Efectuando os clculos:
P(499.02500.98)=95%
que o intervalo solicitado.
A interpretao desse resultado dada por:
O intervalo [499,02; 500,98] contm a durao mdia da pea com 95% de confiana. Isto
significa que se forem construdos intervalos dessa mesma maneira, para um grande nmero de
amostras, em 95% dos casos tais intervalos incluiriam.
Para o caso de populaes finitas usa-se a seguinte frmula:
P( X -Z/2
X +Z/2
)=1-
X -Z/2
ERRO DE ESTIMACAO
O intervalo de confiana bilateral tem a forma;
X
Z/2
|.
Como o intervalo de confiana tem centro na mdia amostral, o erro mximo provvel igual a
metade da amplitude do intervalo.
mahaluca@gmail.com
53
Inferncia Estatstica
Como X
Z/2
, pode se escrever X
erro
Logo = Z/2
n= (
)2
mahaluca@gmail.com
54
Inferncia Estatstica
P( X -t/2
X +t/2 )=1-
8.7+2.2622.
)=95%
Ou
P(7.2710.13)=95%
A interpretao desse resultado dada por:
O intervalo [7,27; 10,13] contm a verdadeira mdia com 95% de confiana.
Para o caso de populaes finitas usa-se a seguinte frmula:
Para o caso de populaes finitas usa-se a seguinte frmula:
P( X -t/2
X +t/2
)=1-
mahaluca@gmail.com
55
Inferncia Estatstica
Ento, substituindo-se o valor de 2, e isolando-se 2 obtm-se o seguinte intervalo:
)
P(
Exemplo:
Admita n = 10, S2=4 e que se deseja construir um IC para a varincia a nvel de 90%
Resolucao:
Tem se n=10, S2=4, (1-).100=90% e =(n-1)=(10-1)+9
Consultando-se a tabela de distribuio qui-quadrado:
Logo:
P(
)=90%
P(2,13
)=90%
A interpretao que o intervalo [2,13; 10,81] contm a verdadeira varincia com 90% de
confiana.
P( S.
)=1-
mahaluca@gmail.com
56
Inferncia Estatstica
A interpretao segue o modelo j apresentado.
)
)
Z=
Z/2)=1-
Isolando-se
do denominador, encontra-se:
P(f-Z/2
f+
)=1-
Para amostras grandes (n > 30) pode-se substituir p e q = (1 p) do radicando por f e (1 f).
Assim, o IC para a proporo ser:
)
P(f-Z/2
f+
)=1-
P(f-Z/2
f+
)=1-
mahaluca@gmail.com
57
Inferncia Estatstica
Exemplo: Examinadas 500 peas de uma grande produo encontrou-se 260 defeituosas. No
nvel de 90% construir um IC para a verdadeira proporo de peas defeituosas.
Tem-se: n = 500, p = 260, 1 - a = 90%.
Logo:
f= =
=0.52
Z/2=1.64
Ento, o IC ser:
P(0.52-1.64
(0.52+1.64
=1-
Ou
P(0.483
Ou ainda
P(48.3%
mahaluca@gmail.com
58
Inferncia Estatstica
Teste de Hipteses uma tcnica para se fazer inferncia estatstica. Ou seja, a partir
de um teste de hipteses, realizado com os dados amostrais, pode-se inferir sobre a populao.
No caso das inferncias atravs dos IC, busca-se cercar o parmetro populacional
desconhecido. Aqui formula-se uma hiptese quanto ao valor do parmetro populacional, e pelos
elementos amostrais faz-se um teste que indicar a aceitao ou rejeio da hiptese formulada.
= 40%;
mahaluca@gmail.com
59
Inferncia Estatstica
mahaluca@gmail.com
60
Inferncia Estatstica
b) H0: =1.65m
H1: 1.65m
c) H0: =1.65m
H1: 1.65m
mahaluca@gmail.com
61
Inferncia Estatstica
H1: Uma das alternativas
0 (a)
0 (b)
0 (c)
onde:
X = Media amostral
-t no se rejeita H0
mahaluca@gmail.com
62
Inferncia Estatstica
Resoluo
1) H0: =1.65m
H1: 1.65m
2) = 0,05
Varivel t com 19 graus de liberdade.
3) t/2=2,093
4)
=0,67
5) Como 2,093 tcal 2,093, no se pode rejeitar H0: = 115 com esse nvel de
significncia.
20 (a)
2>20 (b)
2< 20 (c)
2) Fixar . Escolher a varivel qui-quadrado com = (n 1).
3)
4) Com auxlio da tabela 2 determinam-se RA e RC.
5) Clculo do valor da varivel
)
onde:
n = tamanho da amostra;
S2= varincia amostral;
2 = valor da hiptese nula.
Autor: Filipe Mahaluca
mahaluca@gmail.com
63
Inferncia Estatstica
6) Conclusoes:
a) Se 2inf 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup ou 2cal < 2inf rejeita se H0
b) Se 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup rejeita se H0
c) 2ca
4) 2cal=
=17,56
mahaluca@gmail.com
64
Inferncia Estatstica
p<p0 (c)
2) Fixar . Escolher a varivel normal padro: Z.
3) Com auxlio da tabela de distribuio normal padro, determinam-se RA e RC.
Z no se pode rejeitar H0
Z rejeita se H0
Exemplo:
As condies de mortalidade de uma regio so tais que a proporo de nascidos que
sobrevivem at 60 anos de 0,6. Testar essa hiptese ao nvel de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes at 60 anos.
1) H0: p=0.6
H1: p
2) =0.05 e a varivel escolhida, a normal (0;1).
mahaluca@gmail.com
65
Inferncia Estatstica
3) RA e RC
Z/2=1.96
4) Zcal=
=-4,51
5) Como Zcal <-1,96, rejeita se H0, concluindo se, ao nvel de 5% de significncia que
p
22
mahaluca@gmail.com
66
Inferncia Estatstica
13 funcionrios apresentaram uma varincia de 200. Sendo = 0,1, pode-se concluir que a
varincia diferente para os dois programas?
1) H0: 21= 22
H1: 21
22
4) Fcal=
=0.73
Zcal =
5) Conclusoes
Se -Z/2ZcalZ/2 no se pode regeitar H0;
Se Zcal> Z/2 ou Zcal<-Z/2 , regeita se H0.
Autor: Filipe Mahaluca
mahaluca@gmail.com
67
Inferncia Estatstica
Exemplo
Um fabricante de pneus produz dois modelos. Para o modelo A, = 2500 milhas, e para o
modelo B, = 3000 milhas. Um txi testou 50 pneus do modelo A e 40 do modelo B, obtendo
24000 milhas e 26000 milhas de durao mdia dos respectivos modelos. Adoptando-se um
risco = 0,04 testar a hiptese de que a vida mdia dos dois modelos a mesma.
Resolucao:
1) H0: A=B
H1: A B
2) =0.04, a varivel N(0;1)
3) RA e RC
Z/2=2.05
4)
Zcal =
=-3,38
5) Como Zcal <-2,05, rejeita-se H0, concluindo-se com risco de 4% que as mdias dos pneus
so diferentes.
2 Caso: As varincias populacionais so desconhecidas e, admitidas iguais, independentes e
normais.
1) H0: 1=2 ou 1-2=d onde d>0 uma diferena admitida entre as medias.
H1: 1 2 ou 1-2 d
2) Fixar . Escolher a varivel t, com =(n1+n2-2)
3) Com auxlio da tabela da distribuio t, determinam-se RA e RC.
4) Clculo do valor da varivel
mahaluca@gmail.com
68
Inferncia Estatstica
(
tcal =
5) Concluses
Se -t/2tcalt/2 no se pode rejeitar H0;
Se tcal> t/2 ou tcal < -t/2 , rejeita se H0.
Exemplo: Dois tipos de tinta foram testados sob as mesmas condies meteorolgicas. O tipo A
registou uma mdia de 80 com um desvio de 5 em 5 partes. O tipo B, uma mdia de 83 com um
desvio de 4 em 6 partes. Adoptando-se = 0,05 testar a hiptese da igualdade das mdias.
Resolucao:
1) H0: A=B
H1: A B
2) =0,05 e a varivel t com 5+6-2=9 graus de liberdade.
3) RA e RC
t/2=2.2622
4) Sc=
Sc=
Tcal=
=4.47
=-1.12
mahaluca@gmail.com
69
Inferncia Estatstica
27,5 25,6 28,2 26,1 25,0.
Determinar o intervalo de confiana para a mdia populacional aos nveis de significncia
de 5% e 1%.
02) Dados: n=10, x = 112 e s = 11, determinar os intervalos de confiana, para os nveis de
95% e 90%, para a mdia populacional.
03) Um conjunto, composto por 12 animais em experincia, foi alimentado com uma dieta
especial durante certo tempo e verificou-se que os aumentos de peso foram:
25 22 30 26 24 39 32 26 32 33 28 30.
Encontrar os limites de confiana para a mdia, ao nvel de confiana de 90%.
04) Supondo populaes normais, determinar o intervalo de confiana para a mdia dos
seguintes conjuntos de dados (considere = 0,05):
a) 64,9 64,1 63,8 64,0 62,0 61,2 65,9 60,7.
b) 1,19 1,23 1,18 1,21 1,27 1,17 1,15 1,14 1,19 1,20.
05) Numa fbrica, colhida uma amostra de parafusos, foram obtidos os seguintes valores de
dimetro (medidas em mm)
10
11
11
11
12
12
12
12
13
13
13
13
13
13
13
13
13
13
13
13
14
14
14
14
14
15
15
15
16
16
mahaluca@gmail.com
70
Inferncia Estatstica
07) Numa pesquisa de opinio pblica, entre 600 pessoas, 240 responderam que sim a certa
pergunta. Determinar o intervalo de confiana para a percentagem populacional que deve
responder sim, ao nvel de confiana de 95%.
08) Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a fluorao da
gua. Encontrar limites de confiana para a proporo real de habitantes no favorveis
fluorao, para:
a) nvel de confiana de 90% ;
b) nvel de confiana de 95%.
09) Numa cidade, entre 1000 residncias, 288 assinam TV cabo. Determinar o intervalo de
confiana para a proporo de assinantes de TV cabo, nesta cidade, ao nvel de confiana
de 98%.
10) Dada a distribuio a seguir, pede-se para construir o intervalo de confiana para a mdia
ao nvel de 95%
Classes
2,2 6,2
Fi
11) Com uma amostra de 25 elementos de uma populao obtivemos: mdia 8; desvio padro
1,58 e f =60%. Determinar os intervalos de confiana para :
a) a mdia , com = 10% ;
b) a proporo , com = 4% .
mahaluca@gmail.com
71
Inferncia Estatstica
01) Uma amostra de 10 elementos apresentou x = 230. Sabe-se que a varincia da populao
igual a 160. Testar a hiptese de = 218, contra a alternativa 218, ao nvel de
significncia de 10%.
02) Uma indstria produz lmpadas que seguem uma distribuio N (800, 1600) horas. Testar a
hiptese de que = 800, contra a alternativa 800, se uma amostra aleatria de 30
lmpadas teve um tempo mdio de vida de 788 horas e adoptando nvel de 5%.
03) Numa amostra de 20 elementos de uma populao normal obteve-se mdia 42 e desvio
padro 5. Ao nvel de significncia de 5%, testar a hiptese de que a mdia populacional
50, contra a alternativa de ser diferente de 50.
04) Os pesos de certo produto so:
20,21 20,05 20,09 19,90 19,83 20,01 19,90 19,87 kg.
Testar a hiptese de = 20,00, contra 20,00, ao nvel de 5% de significncia.
05) Dada a amostra:
Classes
0 5
5 10
10 15 15 20 20 25
Fi
c) = 14
b) = 13
d) = 16
mahaluca@gmail.com
72
Inferncia Estatstica
09) Medidos os dimetros (em mm) de 32 peas de uma produo, resultou a distribuio
abaixo:
Valores 56,5
56,6
56,7
56,8
56,9
57,0
57,1
57,2
57,3
Fi
10
AMOS. 2
Classes
0 5
5 10
b)
Fi
2
5
Amostr.1
Xi
15
25
Fi
7
4
Amostr.2
Xi
10
30
Fi
5
5
mahaluca@gmail.com
73
Inferncia Estatstica
8 12 3
10 15
14) Numa amostra de 250 elementos verificaram-se 24 sucessos e noutra de 100 elementos
verificaram-se 15 sucessos. Podemos supor idnticas as probabilidades de sucesso nas duas
populaes, ao nvel de 5%?
15) Numa pesquisa com os telespectadores de uma cidade, 60 de 200 homens desaprovam
certo programa, acontecendo o mesmo com 75 de 300 mulheres. Ao nvel de significncia de
10%, h diferena real entre as opinies de homens e mulheres?
16) Dados: n1 = 25, x1 = 8, s1 = 1,58, f1 = 60% para uma certa populao, e para outra
populao: n2 = 31, x2 = 7, s2 = 1,24, f2 = 35%. Testar:
a) H0: 1 = 7,5
H1 : 1 7,5
5%
b) H0 : p1 = 55%
H1 : p1 55%
= 4%
c) H0 : 1 = 2
H1 : 1 2
= 5%
d) H0 : p1 = p2
H1 : p1 p2
= 7%
mahaluca@gmail.com
74
Inferncia Estatstica
02) Suponhamos que se pretenda estimar a renda mdia por famlia numa grande cidade. Com
base em informaes passadas, admite-se que o desvio padro das rendas das famlias de
200,00mt. Qual deve ser o tamanho da amostra, a fim de que o erro de estimativa da renda
mdia seja no mximo de 10,00mt, com probabilidade igual a 96%?
03) Para se estimar a proporo de pessoas interessadas em gua fluorada, qual o tamanho da
amostra, para se estar confiante em 95% de que o erro seja de no mximo 1% ?
04) Um fabricante de peas acredita que aproximadamente 5% de seus produtos so
defeituosos. Se ele deseja estimar a verdadeira percentagem, dentro de 0,5% de erro, com uma
probabilidade de estar certo de 90%, qual o tamanho da amostra a ser tomada?
mahaluca@gmail.com
75
Inferncia Estatstica
INTRODUO
Muitas vezes, na prtica, necessitamos estudar o relacionamento de duas variveis, colectadas
como pares de valores, para resolver questes, como por exemplo:
O sucesso de um emprego pode ser predito com base no resultado de testes:
Quanto maior for a produo, maior ser o custo total.
Quanto maior for a idade de um imvel, menor ser seu preo de venda.
Problemas como esses podem ser estudados atravs uma analise de correlao simples, onde
podemos determinar a fora do relacionamento entre asa duas variveis estudadas.
As variveis estudadas sero: X, denominada de varivel independente, e Y, denominada de
varivel dependente.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o valor
de Y, conhecido um valor de X, atravs de uma frmula matemtica adequada, podemos aplicar
a chamada anlise de regresso simples.
mahaluca@gmail.com
76
Inferncia Estatstica
mahaluca@gmail.com
77
Inferncia Estatstica
Y x u
onde
a bx
Y
onde a= estimador do coeficiente linear;
b= estimador do coeficiente angular;
Pelo MMQ, a reta resultante tem duas caractersticas importantes:
1. A soma dos desvios verticais dos pontos em relao a reta zero.
2. A soma dos quadrados desses desvios mnima.
As frmulas de clculo para a e b so:
sxy
sxx
a y b.x
b
sxy xy
x. y
n
x
sxx x
n
y
syy y
n
mahaluca@gmail.com
78
Inferncia Estatstica
A estimao de Y deve ser feita apenas dentro do intervalo de variao de X originalmente
amostrado. A equao fornece a base de uma estimativa por ponto.
( y Y )
n2
Divide-se por n-2 pois perde-se dois graus de liberdade com as estimativas de
Frmula alternativa
a y b x. y
n2
e duas hipteses
bsicas:
1. a disperso de y a mesma em todos os pontos da recta;
2. a cada ponto, os valores de y so normalmente distribudos em relao recta de
regresso.
[Y tn2; / 2 . u ]
4.6 Intervalo de Predio para a declividade
O erro-padro de b
Autor: Filipe Mahaluca
mahaluca@gmail.com
79
Inferncia Estatstica
x2 n X
b t
n 2 ; / 2
H0: = 0
H1: 0 ou > 0 ou < 0
tc
b 0
~ t n 2 gl
b
mahaluca@gmail.com
80
Inferncia Estatstica
a y b xy n( y )
Amostra: r
y n( y )
r r
mahaluca@gmail.com
81
Inferncia Estatstica
Pode-se elevar o coeficiente de correlao ao quadrado para se obter o coeficiente de
determinao.
Frmula Alternativa para o coeficiente de correlao amostral,
sxy
sxx . syy
4.9 Signific
ncia do coeficiente de correlao
Hipteses:
H0 : 0
H0 : 0
H1 : 0
ou
H1 : 0
H0 : 0
ou
H1 : 0
Se a hiptese nula, ao nvel de significncia , for rejeitada podemos concluir que efetivamente
existe uma relao entre as variveis.
A estatstica de teste
tc
r n2
1 r 2
Exerccios Resolvidos
Exerccio 01
mahaluca@gmail.com
82
Inferncia Estatstica
esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa
relao, uma nutricionista seleccionou 18 mulheres, com idade entre 40 e 79 anos, e observou em
cada uma delas a idade (X) e a massa muscular (Y).
Massa muscular (Y)
Idade (X)
82.0
71.0
91.0
64.0
100.0
43.0
68.0
67.0
87.0
56.0
73.0
73.0
78.0
68.0
80.0
56.0
65.0
76.0
84.0
65.0
116.0
45.0
76.0
58.0
97.0
45.0
100.0
53.0
105.0
49.0
77.0
78.0
73.0
73.0
78.0
68.0
mahaluca@gmail.com
83
Inferncia Estatstica
120
M.muscular
110
100
90
80
70
60
40
50
60
70
80
Idade
No grfico de disperso entre a varivel massa muscular e idade, pode-se observar que h um
forte indcio de relao linear decrescente entre as variveis em estudo. Nota-se que a massa
muscular das pessoas diminui medida que a idade aumenta.
(b) Calcule o coeficiente de correlao linear entre X e Y.
Denotamos as variveis: Y = Massa Muscular e X = Idade n=18
18
X i2 70362
Y 85
X 61,556
i 1
18
S XX X i2 18 X
i 1
18
S YY Yi 2 18 Y
i 1
i 1
18
Y X
i 1
91964
( X i X )(Yi Y )
S XX SYY
Yi 2 133300
18
i 1
18
18
X Y
i 1
i i
18 XY
S XX SYY
91964 18(85)(61,556)
(2157,460)(3250)
-0,837
Segundo o resultado da correlao obtida, pode-se notar que h uma forte correlao linear
entre a varivel massa muscular e idade. Nota-se que medida que a idade da pessoa
mahaluca@gmail.com
84
Inferncia Estatstica
aumenta a massa muscular diminui, o que coerente com o grfico de disperso apresentada
anteriormente.
(c) Ajuste uma recta de regresso para a relao entre as variveis Y: massa muscular
(dependente) e X: idade (independente).
S XY 91964 18(85)(61,556)
-1,027
2157,460
S XX
0 Y 1 X 85 1,027(61,556) 148,218
A recta de regresso estimada da varivel Massa muscular (Y) em funo da Idade (X)
Y 148,218 1,027 X
(d) Considerando a recta estimada dada no item (c), estime a massa muscular mdia de mulheres
com 50 anos.
Exerccio 02
Os dados a seguir correspondem varivel renda familiar e gasto com alimentao (em
unidades monetrias) para uma amostra de 25 famlias.
Renda Familiar (X)
1,5
2,0
10
6,0
10
7,0
mahaluca@gmail.com
85
Inferncia Estatstica
20
10,0
20
12,0
20
15,0
30
8,0
40
10,0
50
20,0
60
20,0
70
25,0
70
30,0
80
25,0
100
40,0
100
35,0
100
40,0
120
30,0
120
40,0
140
40,0
150
50,0
180
40,0
180
50,0
200
60,0
200
50,0
mahaluca@gmail.com
86
Inferncia Estatstica
(a)
familiar
(X).
60
50
40
30
20
10
0
0
100
200
Renda Familiar
(b)
X 83,120 Y 26,660
25
X i2 271934
i 1
25
(c)
S XY
S X SY
X Y
i i
i 1
25
Yi 2 24899,250
i 1
25
Y X
i 1
80774,500
25 XY
0,954
S X SY
S
1 XY
S XX
X Y
i 1
i i
25 X Y
S XX
80774,5 25(83,12)(26,66)
0,256
271934 25(83,12) 2
mahaluca@gmail.com
87
Inferncia Estatstica
e
Y 5,380 0,256X
(d)
monetria da renda familiar ocorre um acrscimo em mdia de 0,256 unidades no gasto com
alimentao.
Exerccio 03
Um pesquisador deseja verificar se um instrumento para medir a concentrao de determinada
substncia no sangue est bem calibrado. Para isto, ele tomou 15 amostras de concentraes
conhecidas (X) e determinou a respectiva concentrao atravs do instrumento (Y), obtendo:
2,0
2,0
2,0
4,0
4,0
4,0
6,0
6,0
6,0
8,0
8,0
8,0
2,1
1,8
1,9
4,5
4,2
4,0
6,2
6,0
6,5
8,2
7,8
7,7
9,6
10,0 10,1
mahaluca@gmail.com
88
Inferncia Estatstica
Diagrama de Disperso
10,5
9,5
8,5
7,5
6,5
5,5
4,5
3,5
2,5
1,5
2
10
(b) Trace no grfico a recta com 45 de inclinao passando pela origem. Como essa reta pode
ser til na avaliao do instrumento?
10
0
0
10
Esta recta til, pois, quanto mais prximos os pontos estiverem nela, maior preciso do
instrumento, j que o ideal Y=X.
mahaluca@gmail.com
89
Inferncia Estatstica
X 6
Y 6,040
15
X i2 660
i 1
15
(X
i 1
X )(Yi Y )
S X SY
15
Yi 2 663,380
i 1
15
Y X
i 1
661,200
0,996
Y 0,160 0,980X
(e) Com base nos itens anteriores tire concluses sobre a eficincia do instrumento.
Com base nos itens anteriores, nota-se que, o instrumento para medir a concentrao de
determinada substncia no sangue encontra-se bem calibrado. Observa-se que existe uma alta
correlao entre as medidas feitas pelo instrumento e a concentrao da determinada
substncia, o que pode ser confirmado nos grficos apresentados anteriormente. Alm disso, a
reta de regresso obtida bem prxima da reta Y=X, indicando grande proximidade entre as
medidas. O mtodo formal para verificar se o instrumento esta bem calibrado testar as
hipteses: (=0,05)
H 0: 1 1
H 1 : 1 1
Estatstica do teste:
1 1
2 / S XX
~
T(15 2)
SobH 0
mahaluca@gmail.com
90
Inferncia Estatstica
R.C. (=0,05)
R.C. {T R :| T | 2,16}
Valores observados
T0bs
0,980 1
/ S XX
2
0.02
0.06984/ 120
0.828
Como T0bs R.C. , ento aceita-se Ho. Ou seja, o instrumento esta bem calibrado.
mahaluca@gmail.com
91
Inferncia Estatstica
Produo X
80
12
44
51
70
11
61
mahaluca@gmail.com
92
Inferncia Estatstica
e) Determine um Intervalo de Predio (90%) para a mdia de Y dado X=10.
4- Pretendendo estudar a relao entre o tempo necessrio a um consumidor para optar e o
nmero de produtos substitutos alternativos expostos a ele, foi observada uma amostra aleatria
de 15 consumidores, da qual resultaram os seguintes dados:
Y
10
10
11
10
12
3600.
620.
mahaluca@gmail.com
93
Inferncia Estatstica
6- Uma populao composta por N=6 pontos (X;Y). So eles:
(1;2) (5;6) (2;4) (2;3) (3;5) (5;10)
a) Determine a recta de regresso populacional;
b) Faa um diagrama de disperso, localize a recta do item anterior e os segmentos que
representam os 6 valores de u. Verifique que a soma de u igual a zero.
7- Uma amostra de residncias seleccionadas aleatoriamente foi observada quanto idade do
imvel X e quanto ao preo de venda. Resultou:
X Y
1 10
2 30
3 40
4 50
5 65
6 70
a) Estime a recta de regresso populacional;
b) Teste, usando o coeficiente angular, se o preo de venda do imvel diminui medida que a
idade cresce. Use 5%.
c) Obtenha e interprete o intervalo de projeco de 95% para o preo de uma casa com 3
anos;
d) Obtenha e interprete o intervalo de projeco de 95% para o preo mdio de uma casa
com 3 anos;
e) Estime os coeficientes de correlao e determinao entre X e Y;
f) necessrio testar a significncia do coeficiente de correlao? Explique.
8- Abaixo, voc encontra 3 afirmaes. Indique, justificando, se so verdadeiras ou falsas:
a) Se entre X e Y o coeficiente de correlao 1, apenas uma dessas variveis exerce
influncia sobre a outra. Isso j no verdade quando o coeficiente de correlao 1.
b) Se o coeficiente angular da recta de regresso nulo, o coeficiente de correlao entre as
mesmas variveis tambm o .
mahaluca@gmail.com
94
Inferncia Estatstica
c) Se o coeficiente angular da recta de regresso positivo, necessariamente o coeficiente de
correlao entre as mesmas variveis tambm o .
9- Para cada um dos casos abaixo teste, a 5%, a significncia do coeficiente angular da recta
de regresso:
a) b=4; b 1; n=12;
b) b=-0,15 b 0,1; n=20;
c) b=0,6 b 0,2; n=50.
10- Para estudar a poluio de um rio, um cientista mediu a concentrao de um determinado
composto orgnico (Y) e a precipitao pluviomtrica na semana anterior (X):
X
0,91 0,10
1,33 1,10
4,19 3,40
2,68 2,10
1,86 2,60
1,17 1,00
a)Existe alguma relao entre o nvel de poluio e a precipitao pluviomtrica?
Informa-se que r= 0,89. Teste sua significncia, ao nvel de 5%. ,
b) Determine a equao de regresso linear. Teste a existncia da regresso, ao nvel de 1 % e
5%.
c)Calcule o coeficiente de correlao linear de Pearson e teste a sua significncia ao nvel de 1
%.
11- Procurando quantificar os efeitos da escassez de sono sobre a capacidade de resoluo
de problemas simples, um agente tomou ao acaso 10 sujeitos e os submeteu a experimentao.
Deixou-os sem dormir por diferentes nmeros de horas, aps o que solicitou que os mesmos
resolvessem os itens "contas de adicionar" de um teste. Obteve, assim, os seguintes dados:
Autor: Filipe Mahaluca
mahaluca@gmail.com
95
Inferncia Estatstica
No de erros - Y
12
10
12
16
14
16
14
20
12
20
16
24
12
24
largura
12
10
15
14
11
16
13
13
10
12
12
10
17
13
15
14
mahaluca@gmail.com
96
Inferncia Estatstica
13- A tabela abaixo mostra a frequncia do pulso mdio em diferentes perodos etrios:
Idade Pulso
2
112
104
100
92
10
88
12
86
14
84
16
80
Promoo
80
90
95
95
100
110
115
10
110
10
120
12
130
15
mahaluca@gmail.com
97
Inferncia Estatstica
e) Teste a existncia da regresso ao um nvel de significncia de 5%.
15- H suspeitas de que a qualidade do remdio depende do tempo de maturao despendido
em sua produo. Para verificar isso, um laboratrio farmacutico colectou os seguintes dados:
Tempo-X
Qualidade - Y
23
31
40
46
52
63
Renda
Poupana
Nmero de
Mdia de Anos de
(10000 mt)
(1000 mt)
Filhos
Estudo da Famlia
10
15
12
70
20
12
mahaluca@gmail.com
98
Inferncia Estatstica
E
80
20
16
100
30
18
20
30
10
60
15
10
15
30
20
40
24
50
30
65
35
70
35
19- Os dados abaixo representam o Consumo (Y) e Renda disponvel (X) num perodo de 14
anos. As variveis so expressas em milhes de meticais.
X 3915,5
Y 3273,4
1150349,73
2
Y 800330,16
XY 959198,36
mahaluca@gmail.com
99
Inferncia Estatstica
c) Qual o consumo esperado para uma renda de 400 milhes de meticais?
d) Calcule o poder explicativo da regresso e interprete-o.
20-Uma empresa est estudando como varia a demanda de certo produto em funo de seu
preo de venda. Para isso levantou as seguintes informaes:
Meses Unidades Vendidas Preo/unidade
(Y)
(X)
248
162
242
167
234
165
216
173
230
170
220
176
213
178
205
180
198
182
195
187
197
190
260
200
mahaluca@gmail.com
100
Inferncia Estatstica
Candidato 1
Candidato 2
Votos brancos
Votos nulos
Total
46.856
41.856
1.468
14.643
108.324
23.587
28.678
1.125
8.410
61.800
10.368
8.965
687
2.564
22.584
21.814
12.128
849
4.887
39.678
1.856
2.569
126
1.356
5.907
5.287
5.679
352
28
11.346
10.876
5.987
238
87
17.188
Cidade
A
B
C
D
E
F
G
mahaluca@gmail.com
101
Inferncia Estatstica
5.2 Definio
Um nmero-ndice uma medida estatstica que serve para comparar grupos de variveis
relacionadas entre si e obter um quadro simples e resumido das mudanas em reas
relacionadas como preos de matrias-primas, preos de produtos acabados, volume fsico de
produo, etc.
5.4 Nmeros-ndices
Consideremos a tabela abaixo, relativa s matrculas efectivadas em certo estabelecimento de
ensino durante o perodo de 1999 a 2004:
TABELA
ANOS
1999
2000
2001
2002
2003
2004
MATRCULA
1050
1150
1200
1400
1560
1700
NMERO-NDICE
100
109,5
I b, c
c
.100
b
mahaluca@gmail.com
102
Inferncia Estatstica
p0 ------- 100
pt ------- p(0, t)
p ( 0, t )
pt
.100
p0
Exemplo: O preo do ventilador em 2002 era de 450,00mt e em 2003 foi para R$ 600,00mt.
Tomando por base o ano de 2002, determinar o preo relativo em 2003.
q(o, t )
qt
.100
qo
Exemplo:
Uma empresa produziu 12 toneladas de ao em 1995 e 17 toneladas em 1996. Tomando como
ano base 1995, a quantidade relativa ser:
mahaluca@gmail.com
103
Inferncia Estatstica
v( o, t )
v t p1q1
.100
vo po q o
Exemplo: Uma empresa vendeu em 1995, 10000 unidades de um artigo ao preo unitrio de
100,00mt. Em 1996 vendeu 20000 unidades do mesmo artigo ao preo unitrio de 120,00mt.
Qual foi o valor relativo da venda em 1996?
p(0, t )
pt
p
300
.100 2002 .100
.100 125
p0
p 2001
240
p( 2002,2003)
p( 2003, 2004)
p(0, t )
pt
p
300
.100 2002 .100
.100 125
p0
p 2001
240
p( 2001, 2003)
mahaluca@gmail.com
104
Inferncia Estatstica
p( 2001, 2004)
Exemplo: No exemplo anterior, considerar 2001 como ano base, determinar os relativos em
cadeia, em porcentagem.
Anos
2001
2002
2003
2004
Relativos
100
125
150
225
ndice (%)
200
150
100
50
0
2001
2002
2003
2004
Ano
I p 0 ,t
pt
i 1
n i
p0
i 1
.100
mahaluca@gmail.com
105
Inferncia Estatstica
Iq
0 ,t
I v 0 ,t
qt
i 1
n i
q0
i 1
.100
i i
ptqt
i 1
n i i
p 0q 0
i 1
.100
Exemplo: Uma famlia efectuou duas compras num supermercado em duas pocas diferentes. Os
preos e as quantidades dos produtos adquiridos encontram-se na tabela abaixo:
2003
2003
2004
2004
Produtos
Preo
Quantidade
Preo
Quantidade
1 - carne ( kg )
4,60
0,50
5,20
0,60
2 - leite ( l )
0,80
10
0,90
14
3 - ovos (dz )
1,20
1,40
Total
6,60
12,5
7,50
18,60
Construir o ndice agregativo simples de preo, de quantidade e de valor para 2004 com base
em 2003.
mahaluca@gmail.com
106
Inferncia Estatstica
w
i
0
p i0 .q i0
n
p i0 .q i0
i 1
Lp 0, t
pt qo
poq o
.100
2003
p
20
28
40
56
15
30
12
Bens
mahaluca@gmail.com
107
Inferncia Estatstica
L'0, t
q t po
q o po
.100
w
i
t
p it .q it
n
p it .q it
i 1
P0, t
ptq t
poq t
.100
2003
20
28
40
56
15
30
12
Bens
mahaluca@gmail.com
108
Inferncia Estatstica
P'0, t
qt pt
qopt
.100
Exerccio: Voc proprietrio de uma padaria, e deseja comparar vendas e preos de 2008
com as vendas e preos de 2007. Os produtos escolhidos, preos e quantidades vendidas esto
apresentados na tabela abaixo.
mahaluca@gmail.com
109
Inferncia Estatstica
Produto
Unidade
Pretzels
2007
2008
Preo
Qtde.
Preo
Qtde.
kg
5,60
0,700
5,90
0,840
Cuca
kg
6,80
1,000
8,10
0,800
Po integral
kg
9,10
0,320
9,90
0,450
Croissant
kg
15,20
0,300
16,30
0,350
Valores (US$)
IPC
1983
207132
100
1984
218937
103,9
1985
228689
107,6
1986
237246
109,6
1987
247093,3
113,6
1988
259915,6
118,3
1989
278894,7
124
1990
303903,3
130,7
1991
317292,4
136,2
1992
319253,2
140,3
1993
325125,4
144,5
1994
341287,2
148,2
1995
354122,3
152,4
1996
369334,2
156,9
Srie deflacionada
mahaluca@gmail.com
110
Inferncia Estatstica
ANEXOS
mahaluca@gmail.com
111
Inferncia Estatstica
DISTRIBUIO DE STUDENT
mahaluca@gmail.com
Inferncia Estatstica
DISTRIBUIO DE FISHER-SNEDECOR PARA = 5%
mahaluca@gmail.com
Inferncia Estatstica
VALORES DE z PARA O NVEL DE SIGNIFICNCIA COM = 5% - TESTE DE DUNCAN
mahaluca@gmail.com
Inferncia Estatstica
DISTRIBUIO DE 2
mahaluca@gmail.com