Apostila Estatistica Descritiva
Apostila Estatistica Descritiva
Apostila Estatistica Descritiva
br
Apostila: Estatística Descritiva – por João Flores Neto
Assunto:
ESTATÍSTICA DESCRITIVA
Autor:
JOÃO FLORES NETO
1
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
A NATUREZA DA ESTATÍSTICA
INTRODUÇÃO
SEC. XVIII : a estatística com feição científica é batizada por GODOFREDO ACHENWALL.
As tabelas ficam mais completas, surgem as primeiras representações gráficas e os cálculos
de probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos
para se tornar " O estudo de como se chegar a conclusão sobre uma população, partindo da
observação de partes dessa população (amostra)".
.MÉTODO ESTATÍSTICO
A ESTATÍSTICA
É uma parte da matemática aplicada que fornece métodos para coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de
decisões.
2
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
2º - PLANEJAMENTO : Como levantar informações ? Que dados deverão ser obtidos ? Qual
levantamento a ser utilizado ? Censitário ? Por amostragem ? E o cronograma de
atividades ? Os custos envolvidos ? etc.
Dados primários: quando são publicados pela própria pessoa ou organização que os haja
recolhido. Ex: tabelas do censo demográfico do IBGE.
Dados secundários: quando são publicados pro outra organização. Ex: quando
determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE.
OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande
risco de erros de transcrição.
Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa
para saber a preferência dos consumidores pela sua marca.
A coleta direta pode ser : contínua (registros de nascimento, óbitos, casamentos, etc.),
periódica (recenseamento demográfico, censo industrial) e ocasional (registro de casos de
dengue).
Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta,
por analogia, por avaliação,indícios ou proporcionalização.
3
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja
possível da aplicação do método estatístico. São divididos em três grupos:
Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma
simples observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A natalidade
na Grande Vitória, O preço médio da cerveja no Espírito Santo, etc.
Fenômenos individuais:são aqueles que irão compor os fenômenos de massa. Ex: cada
nascimento na Grande Vitória, cada preço de cerveja no Espírito Santo, etc.
PARÂMETROS: São valores singulares que existem na população e que servem para
caracterizá-la.Para definirmos um parâmetro devemos examinar toda a população.Ex: Os
alunos do 2º ano da FACEV têm em média 1,70 metros de estatura.
4
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
VARIÁVEL QUALITATIVA: Quando seu valores são expressos por atributos: sexo, cor da
pele,etc.
AMOSTRAGEM
5
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o
acaso na escolha.
Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de
90 alunos de uma escola:
OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-
se muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída
de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas.
Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior,
supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois
estratos (sexo masculino e sexo feminino). Logo, temos:
.AMOSTRAGEM SISTEMÁTICA:
6
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a amostra
pode ser feita por um sistema imposto pelo pesquisador.
Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra
formada por 50 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte
procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 01 a 18, o
qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam
periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado
fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.
.EXERCÍCIOS:
1- Uma escola de 1º grau abriga 124 alunos. Obtenha uma amostra representativa
correspondente a 15% da população, utilizando a partir do início da 5ª linha da Tabela de
números aleatórios.
2- Tenho 80 lâmpadas numeradas numa caixa. Como obtemos uma amostra de 12 lâmpadas
?
4- Mostre como seria possível retirar uma amostra de 32 elementos de uma população
ordenada formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo
seria escolhido para pertencer a amostra, sabendo-se que o elemento 1.420º a ela
pertence ?
SÉRIES ESTATÍSTICAS
De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :
7
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que
nestes documentos as tabelas não serão abertas devido a limitações do editor html".
.SÉRIE ESTATÍSTICA:
Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou
descontínua. Podem ser do tipo temporal, geográfica ou específica.
* Em mil unidades
.b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato
(espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização.
* Em mil unidades
8
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
* Em mil unidades
* Em mil unidades
.GRÁFICOS ESTATÍSTICOSGGG
São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir as tabelas estatísticas.
Características:
9
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico, fornecendo
elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os
gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se,
muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais
revelados pelo gráfico.
Uso indevido de Gráficos: Podem trazer uma idéia falsa dos dados que estão sendo
analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de
construção de escalas.
.1 - Diagramas:
10
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de
apresentar cada barra ou coluna segmentada em partes componentes. Servem para
representar comparativamente dois ou mais atributos.
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos
ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido
em tantos setores quantas são as partes. Os setores são tais que suas áreas são
respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser
empregado quando há, no máximo, sete dados.
Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.
.2 - Estereogramas:
11
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
São gráficos geométricos dispostos em três dimensões, pois representam volume. São
usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo
de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem.
3 - Pictogramas:
12
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
DISTRIBUIÇÃO DE FREQUÊNCIA
Tabela primitiva ou dados brutos:É uma tabela ou relação de elementos que não foram
numericamente organizados. É difícil formarmos uma idéia exata do comportamento do
grupo como um todo, a partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Dados Freqüência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
13
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
52 1
54 1
57 1
58 2
60 2
Total 20
Classes Freqüências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior
de classe (li) e o maior número, limite superior de classe(Li). Ex: em 49 |------- 53... l3= 49 e
L3= 53. O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita. O
dado 53 do ROL não pertence a classe 3 e sim a classe 4 representada por 53 |------- 57.
14
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes
iguais. .......Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2.
n i= nº de classes
3 |-----| 5 3
6 |-----| 11 4
12 |-----| 22 5
23 |-----| 46 6
47 |-----| 90 7
91 |-----| 181 8
182 |-----| 362 9
Obs: Qualquer regra para determinação do nº de classes da tabela não nos levam a uma
decisão final; esta vai depender, na realidade de um julgamento pessoal, que deve estar
ligado à natureza dos dados.
No nosso exemplo: AA/i = 19/5 = 3,8 . Obs:Como h > AA/i um valor ligeiramente superior
para haver folga na última classe. Utilizaremos então h = 4
O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da
classe anterior.
15
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
freqüências relativas: são os valores das razões entre as freqüências absolutas de cada
classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 (100
%).
16
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Sendo fi= freq. simples; xi= ponto médio de classe; fri= freq. simples acumulada; Fi= freq.
relativa e Fri= freq. relativa acumulada. Construa o histograma, polígono de freqüência e
polígono de freq. acumulada:
.Exercício:
Com base na tabela anterior, construa o gráfico da curva polida a partir das freqüências
calculadas:
MEDIDAS DE POSIÇÃO
Introdução
São as estatísticas que representam uma série de dados orientando-nos quanto à posição da
distribuição em relação ao eixo horizontal do gráfico da curva de freqüência.
17
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.
Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica
e biquadrática.
.MÉDIA ARITMÉTICA =
É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
.Dados não-agrupados:
Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14,
13, 15, 16, 18 e 12 kilos, temos, para venda média diária na semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kilos
.Propriedades da média
18
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou
Y= .+ 2 = 14 +2 = 16 kilos
Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou
Y= x 3 = 14 x 3 = 42 kilos
.Dados agrupados:
Nº de meninos freqüência = fi
0 2
1 6
2 10
3 12
4 4
total 34
Como as freqüências são números indicadores da intensidade de cada valor da variável, elas
funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética
ponderada, dada pela fórmula:
19
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
1 6 6
2 10 20
3 12 36
4 4 16
total 34 78
Média Geométrica
20
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
...xi... ...fi...
1 2
3 4
9 2
27 1
total 9
No excel.......=(1^2*3^4*9^2*27^1)^(1/9)........R: 3,8296
Exemplo - Comprovar a 1ª propriedade da média geométrica com os dados { 10, 60, 360 }
.2ª propriedade: Séries que apresentam o mesmo número de elementos com o mesmo
produto têm a mesma média geométrica.
a = {8 e 12,5}.........b = {2 e 50}
ga = 10 ..................... gb = 10
21
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
.4ª propriedade: Quanto maior a diferença entre os valores originais maior será diferença
entre as médias aritmética e geométrica. Veja na tabela abaixo:
a) Média de Relações
g = no excel.............=(2,5*0,5)^(1/2)........R: 1,1180
Obs: Se, para uma determinada empresa, se deseja estabelecer uma relação do tipo
capital/dívida que seja independente da dívida ou do capital das diferentes empresas
envolvidas, é recomendável o uso da média geométrica. Se o que se deseja saber é a
relação capital/dívida de um certo número de empresas, após a consolidação, a cifra correta
será obtida através da média aritmética.
22
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Período Taxa
1995 a 1996 650/500 = 1,3
1996 a 1997 910/650 = 1,4
Resposta: 1,3491
MÉDIA HARMÔNICA
.. ou
..
23
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
A média harmônica é menor que a média geométrica para valores da variável diferentes de
zero.
h< g.. e por extensão de raciocínio podemos escrever :.. h < g<
OBS: A média harmônica não aceita valores iguais a zero como dados de uma série.
A igualdade g= h.= ....só ocorrerá quando todos os valores da série forem iguais.
g = ( .+ h ) /.2
.MÉDIA QUADRÁTICA
24
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
a = { 2 , 3 , 4 , 5 } ....Resp: 3,67
OBS:
• Sempre que os valores de X forem positivos e pelo menos um dado diferente é válida
a seguinte relação: q> > g> h
MODA
Mo é o símbolo da moda.
25
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto
é, o salário recebido pelo maior número de empregdos dessa fábrica.
• Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
• .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então,
que a série tem dois ou mais valores modais.
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o
valor da variável de maior freqüência.
Temperaturas freqüência
0º C 3
1º C 9
2º C 12
3º C 6
A classe que apresenta a maior freqüência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre
os limites da classe modal. O método mais simples para o cálculo da moda consiste em
tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta.
26
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Mo = ( l* + L* ) / 2
onde l* = limite inferior da classe modal e L*= limite superior da classe modal. Exemplo:
Calcule a estatura modal conforme a tabela abaixo.
Resp: a classe modal é 58|-------- 62, pois é a de maior freqüência. l*=58 e L*=62
l*= limite inferior da classe modal..... e..... L*= limite superior da classe modal
Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de
posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a
média aritmética é a medida de posição que possui a maior estabilidade.
MEDIANA
Símbolo da mediana: Md
27
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.
.( n + 1 ) / 2
1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a
mediana
Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor
correspondente.
1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
5º termo = 2
6º termo = 3
28
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Notas:
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência
dos valores extremos, ao passo que a mediana permanece a mesma.
Quando o somatório das freqüências for ímpar o valor mediano será o termo de ordem dado
pela fórmula :.
29
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Como o somatório das freqüências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3....
Quando o somatório das freqüências for par o valor mediano será o termo de ordem dado
pela fórmula :.
Aplicando fórmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2
= 15,5
30
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Exemplo:
Emprego da Mediana
• Quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
• Quando há valores extremos que afetam de maneira acentuada a média aritmética.
• Quando a variável em estudo é salário.
SEPARATRIZES
Além das medidas de posição que estudamos, há outras que, consideradas individualmente,
não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua
característica de separar a série em duas partes que apresentam o mesmo número de
valores.
.QUARTIS
31
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Precisamos portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a série em quatro partes iguais.
{ 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que será =
Q2.
Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais
proporcionados pela mediana ( quartil 2). Para o cálculo do quartil 1 e 3 basta calcular as
medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2).
Q1 = (2+3)/2 = 2,5
Q3 = (9+9)/2 = 9
32
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Assim, temos:
O quartil 2 = Md , logo:
O quartil 1 : E fi / 4 = 10
.O quartil 3 : 3.E fi / 4 = 30
Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65
DECIS
A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da
porcentagem de valores que ficam aquém e além do decil que se pretende calcular. A
33
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais. Assim
sendo,o quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana.
PERCENTIL ou CENTIL
Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma
série em 100 partes iguais. Indicamos: P1, P2, ... , P99. É evidente que P50 = Md ; P25 = Q1
e P75 = Q3.
Dispersão ou Variabilidade:
A média - ainda que considerada como um número que tem a faculdade de representar uma
série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõem o conjunto.
34
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Observamos então que os três conjuntos apresentam a mesma média aritmética = 350/5 =
70
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que
todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o
conjunto Z, pois há menor diversificação entre cada um de seus valores e a média
representativa.
Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta
uma dispersão menor que o conjunto Z.
Amplitude total : É a única medida de dispersão que não tem na média o ponto de
referência.
Quando os dados não estão agrupados a amplitude total é a diferença entre o maior e o
menor valor observado: AT = X máximo - X mínimo.
Quando os dados estão agrupados sem intervalos de classe ainda temos : AT = X máximo -
X mínimo.
Exemplo:
xi fi
0 2
1 6
3 5
4 3
AT = 4 - 0 = 4
Com intervalos de classe a amplitude total é a diferença entre o limite superior da última
classe e o limite inferior da primeira classe. Então AT = L máximo - l mínimo
Exemplo:
Classes fi
4 |------------- 6 6
35
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
6 |------------- 8 2
8 |------------- 10 3
AT = 10 - 4 = 6
A amplitude total tem o inconveniente e só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se
quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou
como uma medida de cálculo rápido sem muita exatidão.
Desvio quartil
Observações:
1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de calcular e de
interpretar. Além do mais, não é afetado pelos valores extremos, grandes ou pequenos,
sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que
não se consideram representativos.
3- Trata-se de uma medida insensível ã distribuição dos itens menores que Q1, entre Q1 e
Q3 e maiores que Q3.
É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das
seguintes medidas de tendência central: média ou mediana. Símbolo = Dm
36
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
As barras verticais indicam que são tomados os valores absolutos, prescindindo do sinal dos
desvios.
= - 0, 2 e Md = - 2
Xi Xi - | Xi - | Xi - Md | Xi - Md |
- 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2
- 3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1
- 2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0
3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5
5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7
E= 16,8 E= 15
37
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Xi f i Xi . f i Xi - | Xi - | | Xi - |.fi
3 2 6 4,7 - 1,7 1,7 3,4
4 2 8 4,7 - 0,7 0,7 1,4
5 3 15 4,7 0,3 0,3 0,9
6 3 18 4,7 1,3 1,3 3,9
E= 10 47 E= 9,6
Dm = 9,6 / 10 = 0,96
Xi fi Md Xi - Md | Xi - Md | | Xi - Md | . f i
3 2 5 -2 2 4
4 2 5 -1 1 2
5 3 5 0 0 0
6 3 5 1 1 1
E= 10 E= 7
Dm = 7 / 10 = 0,70
Obs: Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não
é tão freqüentemente empregado como o desvio-padrão. O desvio médio despreza o fato de
alguns desvios serem negativos e outros positivos, pois essa medida os trata como se
fossem todos positivos. Todavia será preferido o uso do desvio médio em lugar do desvio-
padrão, quando esse for indevidamente influenciado pelos desvios extremos.
DESVIO PADRÃO
38
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Xi
-4 - 0,2 - 3,8 14,44
-3 - 0,2 - 2,8 7,84
-2 - 0,2 - 1,8 3,24
3 - 0,2 3,2 10,24
5 - 0,2 5,2 27,04
E= 62,8
Obs: Quando nosso interesse não se restringe à descrição dos dados mas, partindo da
amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma
modificação, que consiste em usar o divisor n - 1 em lugar de n. A fórmula ficará então:
39
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante
(diferente de zero), o desvio padrão fica multiplicado ( ou dividido) por essa constante.
Exemplo:
Xi f i Xi . f i .fi
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 E= 32,70
Se considerarmos os dados como sendo de uma amostra o desvio padrão seria : a raiz
quadrada de 32,7 / (30 -1) = 1,062
Obs: Nas tabelas de freqüências com intervalos de classe a fórmula a ser utilizada é a
mesma do exemplo anterior.
VARIÂNCIA
A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é
extremamente importante na inferência estatística e em combinações de amostras.
40
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
* EXERCÍCIOS *
Que relação existe entre os desvios padrões dos dois conjuntos de números ?
Que relação existe entre os desvios padrões dos dois conjuntos de números ?
3- Dados os conjuntos de números: A = { -2, -1, 0, 1, 2 } B = { 220, 225, 230, 235, 240 }
Podemos afirmar, de acordo com as propriedades do desvio padrão, que o desvio padrão de
B é igual:
a) ao desvio padrão de A;
Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio
padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor
médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o
seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à
sua dispersão ou variabilidade, quando expressas em unidades diferentes.
41
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Exemplo:
Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor
será o de maior homogeneidade ( menor dispersão ou variabilidade).
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os
pesos.
CVQ = (Q3 - Q1) / (Q3 + Q1) ou [(Q3 - Q1) / (Q3 + Q1)] x 100 para resultado em %.
Desvio quartil Reduzido: Dqr = (Q3 - Q1) / 2Md ou [(Q3 - Q1) / 2Md ] x 100 para
resultado em %.
EXERCÍCIOS
42
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
2- O risco de uma ação de uma empresa pode ser devidamente avaliado através da
variabilidade dos retornos esperados. Portanto, a comparação das distribuições
probabilísticas dos retornos, relativas a cada ação individual, possibilita a quem toma
decisões perceber os diferentes graus de risco. Analise, abaixo, os dados estatísticos
relativos aos retornos de 5 ações e diga qual é a menos arriscada :
3- Um grupo de 85 moças tem estatura média 160,6 cm, com um desvio padrão igual a 5,97
cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão
igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos ? Qual o grupo
mais homogêneo ?
4- Um grupo de 196 famílias tem renda média de 163,8 dólares, com um coeficiente de
variação de 3,3%. Qual o desvio padrão da renda desse grupo ?
6- Numa pequena cidade, 65 famílias tem a renda média de 57,5 dólares e o desvio padrão
de 5,98 dólares. A variabilidade relativa das famílias foi de :
MEDIDAS DE ASSIMETRIA
Introdução:
43
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Coeficiente de assimetria
A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é,
não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse
motivo, daremos preferência ao coeficiente de assimetria de Person:
Escalas de assimetria:
Exercício
MEDIDAS DE CURTOSE
Introdução:
44
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal (ou
mais aguda ou afilada em sua parte superior), ela recebe o nome de leptocúrtica.
Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal (ou mais
achatada em sua parte superior), ela recebe o nome de platicúrtica.
Coeficiente de curtose
obs: este coeficiente está dentro do programa excel (nas funções estatísticas automáticas).
PROBABILIDADE
Introdução:
45
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Experimento Aleatório
São fenômenos que, mesmo repetido várias vezes sob condições semelhantes, apresentam
resultados imprevisíveis. O resultado final depende do acaso.
Exemplo:
Da afirmação "é provável que o meu time ganhe a partida hoje" pode resultar:
Espaço Amostral
Obs: cada elemento do espaço amostral que corresponde a um resultado recebe o nome de
ponto amostral. No primeiro exemplo : cara pertence ao espaço amostral {cara, coroa}.
Eventos
Se considerarmos S como espaço amostral e E como evento: Assim, qualquer que seja E, se
E c S (E está contido em S), então E é um evento de S.
46
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Exercício
Conceito de Probabilidade
OBS: Quando todos os elementos do Espaço amostral tem a mesma chance de acontecer, o
espaço amostral é chamado de conjunto equiprovável.
Exemplos:
47
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento
existe sempre a relação:
p+q=1
Exemplos:
O termo "3 para 2" significa : De cada 5 corridas ele ganha 3 e perde 2. Então p = 3/5
(ganhar) e q = 2/5 (perder).
48
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
3-Uma dado foi fabricado de tal forma que num lançamento a probabilidade de ocorrer um
número par é o dobro da probabilidade de ocorrer número ímpar na face superior, sendo que
os três números pares ocorrem com igual probabilidade, bem como os três números
ímpares. Determine a probabilidade de ocorrência de cada evento elementar:
5- As chances de um time de futebol T ganhar o campeonato que está disputando são de "5
para 2". Determinar a probabilidade de T ganhar e a probabilidade de T perder :
Eventos Independentes
49
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Os dois eventos são mutuamente exclusivos então: P = 1/6 + 1/6 = 2/6 = 1/3
P(ÁS U Copas) = P(ÁS) + P(Copas) - P(ÁS n Copas) = 4/52 + 13/52 - 1/52 = 16/52
Probabilidade Condicional
P (A e B ) = P (A) x P(B/A)
Exemplo: Duas cartas são retiradas de um baralho sem haver reposição. Qual a
probabilidade de ambas serem COPAS ?
P(Copas1) = 13/52
P(Copas2/Copas1) = 12/51
Carta pretas = 26
50
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Cartas vermelhas = 26
EXERCÍCIOS
5- Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas
brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma
bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da 1ª , 2ª e 3ª
urnas serem, respectivamente, branca, preta e verde ?
7- Qual a probabilidade de sair uma figura (rei ou dama ou valete) quando retiramos uma
carta de um baralho de 52 carta ?
8- São dados dois baralhos de 52 cartas.Tiramos, ao mesmo tempo, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma DAMA e um REI,
não necessariamente nessa ordem ?
9- Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de
ambas serem COPAS ou ESPADAS ?
10- Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3
bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta ?
11- Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3
bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta ?
51
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
12- Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3
bolas pretas e 5 bolas verdes. a)Qual a probabilidade de que ambas sejam verdes ? b) Qual
a probabilidade de que ambas sejam da mesma cor ?
É o uso das fórmulas de análise combinatória para o cálculo do número de casos favoráveis
e o número de casos possíveis.
AR 9,3 = 9 x 9 x 9 = 729
AR 9,2 = 9 x 9 = 81
Exemplo: Se mil títulos entram em sorteio com os números de 000 a 999. Qual a
probabilidade:
b - De sair números com a unidade 4 = A10,2 / 1000 = 100 / 1000 = 0,1 ou 10%
Revisão de Fatorial:
5! = 5 x 4 x 3 x 2 x 1 = 120
5! / 3! = 5 x 4 x 3! / 3! = 20
3! x 4! / 5! = 3 x 2 x 1 x 4! / 5 x 4! = 3 x 2 x 1 / 5 = 1,2
Exemplos:
Método tradicional: P(5 espadas) = 13/52 . 12/51 . 11/50 . 10/49 . 9/48 = 0,0005...
Técnica de contagem:
52
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
2- De 20 pessoas que se oferecem para doar sangue 15 possuem sangue tipo B. Qual a
probabilidade de, escolhendo-se 3 pessoas desse grupo todas as 3 escolhidas tenham
sangue tipo B ?
Seja B1, B2, B3...Bk um conjunto de eventos mutuamente exclusivos cuja união forma o
espaço amostral. Seja A outro evento no mesmo espaço amostral, tal que P(A) > 0 .
Então podemos escrever a fórmula da probabilidade total como : P(A) = E P(Bi) . P(A|Bi)
53
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
TEOREMA DE BAYES
Sabemos que:
P(A n Bi) = P(A) . P(Bi|A) logo P(Bi|A) = P(A n Bi) / P(A) então substituindo teremos :
Exemplo:
Certo professor da FACEV 4/5 das vezes vai trabalhar usando um fusca e usando um carro
importado nas demais vezes. Quando ele usa o fusca, 75 % das vezes ele chega em casa
antes das 23 horas e quando usa o carro importado só chega em casa antes das 23 horas
em 60% das vezes. Ontem o professor chegou em casa após às 23 horas. Qual a
probabilidade de que ele, no dia de ontem, tenha usado o fusca ?
Exercício:
Certo aluno da FACEV 3/4 das vezes vai estudar usando um fusca e usando um carro
importado nas demais vezes. Quando ele usa o fusca, 35 % das vezes ele chega em casa
depois das 23 horas e quando usa o carro importado só chega em casa antes das 23 horas
em 0,55 das vezes. Ontem o aluno chegou em casa antes das 23 horas. Qual a
probabilidade em percentual de que ele, no dia de ontem, tenha usado o fusca ?
Resposta: 78 %
DISTRIBUIÇÃO DE PROBABILIDADES
54
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Variável Aleatória
Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um número.
Fica, então, definida uma função chamada variável aleatória.
Ponto Amostral X
(ca,ca) 2
(ca,co) 1
(co,ca) 1
(co,co) 0
Total 4/4 = 1
55
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
1 0,17
2 0,07
3 0,03
Total 1,00
Construímos acima uma tabela onde aparecem os valores de uma variável aleatória X e as
probabilidades de X ocorrer que é a tabela de distribuição de probabilidades.
X P (X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
T o t a l 6/6 = 1
Distribuição Binomial
Vamos imaginar fenômenos cujos resultados só podem ser de dois tipos, um dos quais é
considerado como sucesso e o outro insucesso. Este fenômeno pode ser repetido tantas
vezes quanto se queira (n vezes), nas mesmas condições. As provas repetidas devem ser
independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas. No
decorrer do experimento, a probabilidade p do sucesso e a probabilidade de q (q = 1 - p) do
insucesso manter-se-ão constantes. Nessas condições X é uma variável aleatória discreta
que segue uma distribuição binomial.
P(x) =
56
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
OBS: O nome binomial é devido à fórmula, pois representa o termo geral do desenvolvimento
do binômio de Newton.
Exemplos:
7- Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta
10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles ?
DISTRIBUIÇÃO NORMAL
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a
distribuição Normal.
57
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
3ª - A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.
5ª - Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que
a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as
probabilidades são iguais a 0,5 ou 50%. Cada metade da curva representa 50% de
probabilidade.
Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal
interesse é obter a probabilidade de essa variável aleatória assumir um valor em um
determinado intervalo. Vejamos com proceder, por meio de um exemplo concreto.
Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos
por certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2
cm e desvio padrão = 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor
entre 2 e 2,05 cm ?
Com o auxílio de uma distribuição normal reduzida, isto é, uma distribuição normal de média
= 0 e desvio padrão = 1. Resolveremos o problema através da variável z , onde z = (X - )/
S
Utilizaremos também uma tabela normal reduzida, que nos dá a probabilidade de z tomar
qualquer valor entre a média 0 e um dado valor z, isto é: P ( 0 < Z < z)
Temos, então, que se X é uma variável aleatória com distribuição normal de média e
desvio padrão S, podemos escrever: P( < X < x ) = P (0 < Z < z)
No nosso problema queremos calcular P(2 < X < 2,05). para obter essa probabilidade,
precisamos, em primeiro lugar, calcular o valor de z que corresponde a x = 2,05
58
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Utilização da Tabela Z
Na primeira coluna encontramos o valor até uma casa decimal = 1,2. Em seguida,
encontramos, na primeira linha, o valor 5, que corresponde ao último algarismo do número
1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que
nos permite escrever:
Exercícios:
1- Determine as probabilidades:
e) P( Z < 0,92) =
P(-0,25 < Z < 0) + P(0 < Z < 0,5) = 0,0987 +0,1915 = 0,2902 ou 29,02 %
3- Um teste padronizado de escolaridade tem distribuição normal com média = 100 e desvio
padrão = 10. Determine a probabilidade de um aluno submetido ao teste ter nota :
59
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
b)maior que 80
c)entre 85 e 115
Instrumental Matemático - 01
Arredondamento de dados
Ex: 53,87 passa a 53,9 ; 44,08 passa a 44,1 ; 44,99 passa a 45,0
Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7 ; 76,250002 passa a 76,3
Exemplos:
60
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
Obs: Não devemos nunca fazer arredondamento sucessivos. Exemplo: 17,3452 passa a 17,3
e não para 17,35 e depois para 17,4.
Compensação
Verificamos que houve uma pequena discordância: a soma é exatamente 84,7 quando, pelo
arredondamento, deveria ser 84,8. entretanto, para a apresentação dos resultados, é
necessário que desapareça tal diferença, o que é possível pela prática do que denominamos
compensação, conservando o mesmo número de casas decimais.
Obs: Se a maior parcela é igual ou maior que o dobro de qualquer outra parcela,
"descarregamos" a diferença apenas na maior parcela.
Exercícios:
• 23,40 =
• 234,7832 =
• 45,09 =
• 48,85002 =
• 120,4500 =
• 46,727 =
• 123,842 =
• 45,65 =
• 28,255 =
• 37,485 =
61
www.ResumosConcursos.hpg.com.br
Apostila: Estatística Descritiva – por João Flores Neto
• 46,727 =
• 123,842 =
• 45,65 =
• 28,255 =
• 37,485 =
• 42,3 =
• 123,842 =
• 295 =
• 2995,000 =
• 59 =
62
TABELA DE NÚMEROS ALEATÓRIOS
C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C
6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7
7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0
5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4
8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2
4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4
9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3
3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1
0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3
1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4
2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3
0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2
1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8
9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5
2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1
8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2
2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0
3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0
0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2
1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1
0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2
2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4
9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6
3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8
8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0
3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1
7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3
4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5
7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5
5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4
Análise de variância
f = MQG
MQR
N – 1=(K – 1) + (N – K)
SQT = SQG + SQR
MQG = SQG (K – 1)
A hipótese nula sempre será rejeitada quando f calculado for maior que o valor
tabelado. Da mesma forma, se MQG for maior que MQR, rejeita-se a hipótese nula.
Quadro
Fonte de variação SQ (soma dos quadrados) GDL (g.l) MQ (quadrados médio)
Teste F
Entre Grupos
Dentro dos grupos
Total
Se o teste f indicar diferenças significativas entre as médias, e os níveis forem fixos,
haverá interesse em identificar quais as médias que diferem entre si.
Calcular o desvio padrão das médias;
Postos
Funcionários 1 2 3
1 7 5 8
2 8 6 9
3 7 7 8
4 8 6 9
5 9 5 8
6 7 6 8
7 8 7 9
8 6 5 10
9 7 6 8
10 6 6 9
RESUMO
ANOVA
Fonte da
SQ gl MQ F valor-P F crítico
variação
2,37E-
Entre grupos 36,46667 2 18,23 28,29 3,35
07
Dentro dos
17,4 27 0,64
grupos
Total 53,86667 29
Como f calculado é maior do que o f tabelado, rejeita-se a hipótese nula em prol da
hipótese alternativa ao risco de 5%.
Há diferenças significativas entre os grupos. Observa-se que MQG é muito superior a
MQR, indicando uma forte variância entre os grupos.
3 x Sx
5,9
7,3
8,6
x1 – x2 = - 1,4
x1 – x3 = - 2,7
x2 – x3 = - 1,3
As três diferenças são menores que o Ld, conclui-se portanto que as médias diferem entre si.
Y X
Gastos com combustível Km rodados
Renda Pessoal Anos de estudo
Números de defeitos de peças Horas de treinamentos em qualidade
GASTOS
QUILÔMETROS
(R$)
3203 400
3203 400
2603 340
3105 400
1305 150
804 100
1604 200
2706 300
805 100
1903 200
3203 400
3702 450
3203 400
3203 400
803 100
803 100
1102 130
3202 400
1604 150
1603 200
3203 400
3702 450
3403 440
Estatística de regressão
R múltiplo 0,993064678
R-Quadrado 0,986177454
R-quadrado ajustado 0,985519237
Erro padrão 127,508336
Observações 23
Observando a tabela acima, percebe-se uma forte correlação entre as variáveis, onde
R está muito próximo de 1.
Quilômetros rodados explica 98% da variância de gastos.
Neste exemplo real, objetivava-se mensurar o grau de satisfação dos clientes de uma
empresa distribuidora de software, onde a variável de resposta era a satisfação geral e as
regressoras eram as acima citadas (para um grupo de fatores).
Observa-se que pouca representatividade é exercida por estas variáveis, afinal os
coeficientes pouco se afastam de zero. No entanto o R2 é elevado (0,68), conferindo uma
boa precisão no cálculo.
NUMEROS INDICES
CONCEITO DE RELATIVO
A quantidade total de dinheiro gasto cada ano, em relação a certo ano base, varia de
um ano para outro devido as variações no número de unidades compradas dos diferentes
artigos e igualmente devido a mudanças nos preços unitários de tais artigos. Temos,
portanto, três variáveis em jogo: preço, quantidade e valor, sendo este último o resultado do
produto do preço pela quantidade.
p(o,t) pt
po
Se quisermos expressar em termos percentuais o relativo de preço, bastará
multiplicarmos o quociente acima por 100.
p(o,t) = pt X 100
po
NOTA
Exemplo
O preço de determinando artigo em 1979 foi Cr$ 1,20 e em 1980 subiu para Cr$ 1,38.
Tomando-se por base o ano 1979, determinar o preço relativo em 1980.
Solução
q(o,t) = qt
qo
que representa a variação da quantidade na época t com re1ação a uma época 0 (base).
Exemplo
No ano de 1980 esta empresa aumentou sua produção de 51% em relação a 1979.
O fato de vo,t = Po,t . qo,t é conhecido como propriedade da reversibilidade dos fatores ou
como critério da decomposição das causas.
Exemplo
Uma empresa vendeu, em 1970, 1000 unidades de um artigo ao preço unitário de Cr$
500,00. Em 1971 vendeu 2000 unidades do mesmo artigo ao preço unitário de Cr$ 600,00.O
valor relativo da venda em 1971 foi:
Em 1971, o valor das vendas foi 140% superior ao de 1970, alguns índices agregados
não satisfazem a essa propriedade.
Símbolo: L o,t
n
A expressão 20 pode ser simp1ificada. Lembrando que Σ wio = 1 , podemos escrever
Símbolo: L'o,t
O Índice agregativo proposto por Paasche é, na sua fórmu1a original, uma média
harmônica ponderada de relativos, sendo os pesos calculados com base nos preços e nas
quantidades dos bens na época atual. A base de ponderação no Índice de Paasche e,
portanto, a época atual. O fator de ponderação simbolizado por wi t representa, então, a
participação percentual do dispêndio com o componente i na época atual em re1ação ao
dispêndio total da mesma época simbolicamente,
a) Índice de Preço
Símbolo: Po,t
O índice de preços, segundo o método proposto por Paasche, é definido pela expressão:
n
Substituindo wit pela expressão dada acima e lembrando que Σ wit = 1,
i=1
chegaremos a uma expressão mais simples.
O índice de preço de Paasche indica que o valor das quantidades dos bens adquiridos
na época atual, aos preços dessa mesma época, é igual a Po,t por cento do valor dessas
quantidades aos preços da época básica; ou o valor das quantidades da época atual variou
(P o,t - 100)% como resultado do aumento de preços no período considerado. Esse índice
mede, portanto, a relação entre o dispêndio monetário necessário para adquirir bens nas
quantidades e sistemas de preços da época atual e o dispêndio dado pelas quantidades da
época atual aos preços vigentes na época básica.
Observando a expressão acima pode-se ver que os fatores de ponderação são as
quantidades da época atual. Como a época atual é variável, os pesos, no índice de Paasche,
mudam quando as épocas atuais mudarem, o que o caracteriza.
como um índice agregativo com ponderações variáveis. O índice de Paasche realça a
baixa porque a ponderação é determinada pela época atual.
Uma séria limitação ao uso do índice de preço de Paasche reside no fato de os pesos
variarem em cada período, o que onera substancialmente a pesquisa, no caso de ser difícil
estimar as quantidades na época atual. Esse fato torna proibitivo o emprego do índice de
Paasche quando se deseja montar um índice ponderado para se fazerem comparações
semanais, mensais ou mesmo trimestrais.
b) Índice de Quantidade
Símbolo: P'o,t
O índice de Fischer, também conhecido corno forma ideal, é a média geométrica dos
números-índices de Laspeyres e de Paasche. Sob o aspecto da ponderação, esse índice
envolve os dois sistemas anteriormente adotados. A proposta de Fischer fundamenta-se no
fato de os índices que o compõem não atenderem ao critério de decomposição das causas,
além de um deles tender a superestimar e o outro a subestimar o verdadeiro valor do índice.
Esse verdadeiro valor tenderá a ser um número superior ao fornecido pela fórmula de
Paasche e inferior ao apresentado pela fórmula de Laspeyres, o que acontece com a média
geométrica entre esses dois índices. Entretanto, o índice de Fischer, apesar de ser chamado
de ideal, nisso pode ser considerado "perfeito". A necessidade de modificar pesos, em dada
época comparada, em decorrência do cálculo do índice de Paasche, constitui uma restrição
não desprezível ao seu emprego. Além disso, não parece ser possível determinar
especificamente o que o índice de Fischer mede, bem como estabelecer o verdadeiro valor
de um Índice perfeito, o qual serviria de elemento de referência.
a) Índice de Preço
Símbolo: Io,t
Índice de Quantidade
Símbolo: I'o,t
EXERCÍCIOS
1) Dados:
A 2 4 3 6 6 12
B 1 6 2 4 4 4
C 4 4 1 8 5 16
D 3 6 6 4 6 4
Dados: fictícios
a) Obter um índice de Laspeyres e de Paasche de preço, com base em 1977, para o
período 77/79.
P 77,78= 96,67
P 77,79= 184,64
2) Conjugue as duas séries seguintes de números-índices, usando 1958 como época-base.
dados: fictícios
Resposta: ÍNDICES DE PREÇOS DAS EXPORTAÇÕES LATINO-AMERICANAS