Apostila Estatistica1
Apostila Estatistica1
Apostila Estatistica1
De
Estatística
Valéria da S. C. Shiguti
Brasília 2006
INTRODUÇÃO
1.2. MÉTODO
Existem várias definições para métodos, Lakatos e Marconi (1982:39-40) mencionaram diversas
definições, entre elas:
• Método é o “caminho pelo qual se chega a um determinado resultado...” (Hegemberg, 1976: II-115)
• Método é “um procedimento regular, explícito e passível de ser repetido para conseguirmos alguma coisa,
seja material ou conceitual” (Bunge 1980: 19).
1.3. A ESTATÍSTICA
A definição de estatística não é única, a estatística abrange muito mais do que um simples traçado de
gráficos e cálculos de medidas. Uma definição seria:
A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-
lo, analisá-los interpretá-los e deles extrair conclusões.
Medida de Desobediência
Como coletar dados sobre algo que não se apresente mensurável, como o nível de desobediência do povo? O
psicólogo Stanley Milgran planejou o seguinte experimento: Um pesquisador determinou que um voluntário
acionasse um painel de controle que dava choques elétricos crescentemente dolorosos em uma terceira pessoa.
Na realidade, não eram dados choques e a terceira pessoa era um ator. O voluntário começou com 15 volts e foi
orientado a aumentar os choques de 15 em 15 volts. O nível de desobediência era o ponto em que a pessoa se
recusava a aumentar a voltagem. Surpreendentemente, dois terços dos voluntários obedeceram às ordens
mesmo que o ator gritasse e simulasse um ataque cardíaco.
Texto extraído do livro: Tiola, Mario F. Introdução à Estatística. 7ª ed. Rio de Janeiro – RJ. LTC. 1999.
2
1.6. USOS E ABUSOS DA ESTATÍSTICA
USOS DA ESTATÍSTICA
As Aplicações da estatística se desenvolveram de tal forma que, hoje, praticamente todo o
campo de estudo se beneficia da utilização de métodos estatísticos. Os fabricantes fornecem melhores produtos a
custos menores através de técnicas de controle de qualidade. Controlam-se doenças com o auxilio de análises
que antecipam epidemias. Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas
estatísticas de modificação de tamanho da população. Visando reduzir as taxas de casos fatais, os legisladores
têm melhor justificativas para leis como as que regem a poluição atmosférica, inspeções de automóveis,
utilização de cinto de segurança, etc.
ABUSOS DA ESTATÍSTICA
Não é de hoje que ocorrem abusos com a estatística. Assim é que , há cerca de um século, o
estadista Benjamin Disraeli disse: “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatísticas”. Já
se disse também que “os números não mentem; mas os mentirosos forjam os números” (Figures don’t lie; liars
figure) e que “se torturarmos os dados por bastante tempo, eles acabam por admitir qualquer coisa”. O
historiador Andrew Lang disse que algumas pessoas usam a estatística “como um bêbado utiliza um poste de
iluminação – para servir de apoio e não para iluminar”. Todas essa afirmações se referem aos abusos da
estatística quando os dados são apresentados de forma enganosa. Eis alguns exemplos das diversas maneiras
como os dados podem ser distorcidos.
ª Pequenas amostras
ª Números imprecisos
ª Estimativas por suposição
ª Porcentagens distorcidas
ª Cifras parciais
ª Distorções deliberadas
ª Perguntas tendenciosas
ª Gráficos enganosos
ª Pressão do pesquisador
ª Más amostras
Texto extraído do livro: Tiola, Mario F. Introdução à Estatística. 7ª ed. Rio de Janeiro – RJ. LTC. 1999.
3
1.7. ESTATÍSTICA DEDUTIVA E INDUTIVA
A estatística Indutiva ou inferencial está relacionada a incerteza. Inicia-se no cálculo das Probabilidades
e se desenvolve por todo a área da inferência.
4
UNIDADE I – CONCEITOS INICIAIS EM ESTATÍSTICA
DEFINIÇÕES:
POPULAÇÃO: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em
comum.
RAMOS DA ESTATÍSTICA
TEORIA DA PROBABILIDADE: que proporciona uma base racional para lidar com situações
influenciadas por fatores que envolvem o acaso.
ESTATÍSTICA DESCRITIVA
Tabelas
Coleta Crítica Apresentação Análise
De dados Dos dados Dos dados
Gráficos
5
COLETA DOS DADOS:
A revisão crítica dos dados procede com a finalidade de suprimir os valores estranhos ao levantamento,
os quais são capazes de provocar futuros enganos.
Convém organizarmos o conjunto de dados de maneira prática e racional. Tal organização denomina-se
Série Estatística (que será abordado na próxima unidade). Sua apresentação pode ocorrer por meio de Tabelas
e/ou Gráficos.
TÉCNICAS DE AMOSTRAGEM
PROBABILÍSTICA - São amostragem em que a seleção é aleatória de tal forma que cada elemento tem
igual probabilidade de ser sorteado para a amostra.
TIPOS DE AMOSTRAGEM
Também conhecida por amostragem ocasional, acidental, casual, randômica, etc. A amostragem simples
ao acaso destaca-se por ser um processo de seleção bastante fácil e muito usado. Neste processo, todos os
elementos da população têm igual probabilidade de serem escolhidos, desde o início até completo processo de
coleta.
6
PROCEDIMENTO
1. Devemos enumerar todos os elementos da população
2. Devemos efetuar sucessivos sorteios com reposição até completar o tamanho da amostra (n)
Para realizarmos este sorteio devemos fazer uso das “tábuas de números aleatórios” (veja página
seguinte). Estas apresentam os dígitos de 0 a 9 distribuídos aleatoriamente.
EXEMPLO:
Supor que nós tenhamos uma população com 1.000 elementos, que numeramos de 000 a 999, para
selecionarmos uma amostra aleatória, de 200 elementos, basta escolhermos uma posição de qualquer linha e
extrairmos conjuntos de três algarismos, até completarmos os 200 elementos da amostra. O processo termina
quando for sorteado o elemento 200. Se o número sorteado não existia na população simplesmente não o
consideramos, e prosseguimos com o processo.
AMOSTRAGEM SISTEMÁTICA
Trata-se de uma variação da amostragem simples ao acaso, muito conveniente quando a população está
naturalmente ordenada, como fichas em um fichário, listas telefônicas etc. Requer uma lista dos itens da
população, e, assim, padece das mesmas restrições já mencionadas na aleatória ao acaso. Se os itens da lista não
se apresentarem numa ordem determinada à amostragem Sistemática pode dar uma amostra realmente aleatória.
PROCEDIMENTO
Sejam os seguintes elementos:
¾ N: tamanho da população;
¾ n: tamanho da amostra.
x; x+a;x+2a;...; x+(n-1)a.
AMOSTRAGEM ESTRATIFICADA
No caso de possuir uma população com uma certa característica heterogênea, na qual podemos
distinguir subpopulações mais ou menos homogêneas, denominadas de estratos, podemos usar a amostragem
estratificada.
Estratificar uma população em L subpopulações denominada estratos, tais que:
7
n1 + n2 + ... + nL = n
Onde os estratos são mutuamente exclusivos.
Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada sub-população.
Se as diversas sub-amostras tiverem tamanhos proporcionais ao respectivo número de elementos nos
estratos, teremos a estratificação proporcional.
8
Stevenson, William J. Estatística aplicada à administração. Harper & Row do Brasil, São Paulo, 1986, p.165
9
EXERCÍCIOS
1. População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de indivíduo de um mesmo município, estado ou país.
10
b) Número de filhos de um casal:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
c) Peso de um indivíduo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
d) Altura de um indivíduo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
f) Tipo sangüíneo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
g) Fator RH:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
i) Sexo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
11
j) Resultado da extração da loteria Federal:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
l) Área de um Círculo:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
m) Raça:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
o) Religião:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
q) Estado Civil:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
12
r) Profissão:
i) Qualitativa;
ii) Qualitativa discreta;
iii) Quantitativa contínua;
iv) Quantitativa discreta;
v) Qualitativa contínua.
6. Suponha que existem N = 1.000 fichas de pacientes das quais uma amostra aleatória de n = 20 deve ser
selecionada. Determine que fichas devem ser escolhidas na amostra de tamanho n = 20. Diga que tipo de
amostragem foi feito e como foram selecionadas as fichas.
7. Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que tem duas grandes
cidades e uma zona rural. Os elementos na população de interesse são todos os homens e mulheres do
estado com idade acima de 21 anos. Diga que tipo de amostragem utilizará?
8. Serviço florestal do estado está conduzindo um estudo das pessoas que usam as estruturas de um camping
operado por ele. O estado tem duas áreas de camping, uma localizada nas montanhas e outra localizada ao
longo da costa. O serviço florestal deseja estimar o número médio de pessoas por acampamento e a
proporção de acampamento ocupada por pessoas de fora do estado, durante o fim de semana em particular,
quando se espera que todos os acampamentos estejam ocupados. Sugira um plano amostral e explique
rapidamente como devem ser feitos.
9. Um médico está interessado em obter informação sobre o número médio de vezes em que 15.000
especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter n = 1.600. Que tipo de
amostragem você sugeriria e por que?
10. Um hematologista deseja fazer uma nova verificação de uma amostra de n = 10 dos 854 espécimes de
sangue analisados por um laboratório médico em um determinado mês. Que tipo de amostragem você
sugeriria e por que?
11. Um repórter da revista Business Week obtém uma relação numerada de 1.000 empresas com maiores de
cotações de ações na bolsa. Ele entrevistará 100 gerentes gerais das empresas correspondentes a esta
amostra. Que tipo de amostragem você sugeriria e por que?
“Um relatório patrocinado pela Flórida Citrus Comission concluiu que os níveis de colesterol podem ser
reduzidos mediante ingestão de produtos cítricos”.
Por que razão a conclusão poderia ser suspeita
13. Dada uma população com seis elementos, A, B, C, D, E e F, explique como você faria para obter, dessa
população, uma amostra aleatória simples com três elementos.
13
14. Descreva uma forma de se obter uma amostra sistemática com 10 elementos de uma população com
tamanho 100.
15. Explique a forma de se obter uma amostragem estratificada dos empregados de uma firma, considerando
que existem empregados de escritório, de oficina e representantes da mesma.
16. Imagine que se pretenda fazer um levantamento de opinião pública para verificar se as pessoas são contra ou
a favor do uso gratuito de ônibus pelos idosos. Pense em três maneiras distintas de elaborar uma pergunta
que induza a resposta positiva, outra que induza a resposta negativa e uma outra que não ocorra nenhum tipo
de tendência na resposta.
17. Identifique o tipo de amostragem utilizado para cada uma das situações abaixo:
a. Quando escreveu Woman in Love: A Cultural Revolution, a autora Shere Hite baseou suas
conclusões em 4.500 respostas a 100.000 questionários distribuídos a mulheres.
b. Uma psicóloga da Universidade de Nova York faz uma pesquisa sobre alguns alunos
selecionados aleatoriamente de todas as 20 turmas que participaram desta pesquisa.
d. A empresa Sony seleciona cada 200o CD de sua linha de produção e faz um teste de qualidade
rigoroso.
e. Um cabo eleitoral escreve o nome de cada senador dos EUA em cartões separados, mistura-os
e extrai 10 nomes.
f. Gerente comercial da America OnLine testa uma nova estratégia de vendas selecionando
aleatoriamente 250 consumidores com renda inferior a US$50.000,00 e 250 consumidores com
renda de ao menos de US$50.000,00.
h. Um repórter da revista Business Week Entrevista todo o 50o gerente geral constante da relação
das 1.000 empresas com maior cotação de suas ações.
i. Um repórter da revista Business Week obtém uma relação numerada das 1.000 empresas com
maior cotação de ações na bolsa, utiliza um computador para gerar 20 números aleatórios e
então entrevista gerentes gerais das empresas correspondentes aos números extraídos.
14
UNIDADE II - NORMAS PARA CONSTRUÇÃO DE TABELAS
TABELAS ESTATÍSTICAS
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para
que tenhamos uma visão global da variação das mesmas.
TÍTULO DA TABELA
CORPO
DA
TABELA
RODAPÉ
15
EXEMPLO:
Tabela 1 – Produção de Café Brasil – 1991 a 1995
Anos Produção
(1.000 t)
1991 2.535
1992 2.666
1993 2.122
1994 3.750
1995 2.007
Fonte: IBGE
TÍTULO DA TABELA:
CORPO DA TABELA:
Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas, e as chamadas,
localizadas, de preferência, no rodapé.
a) Fonte – identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos;
b) Notas – é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter geral ou específico de
uma tabela;
c) Chamadas – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota
específica.
SINAL CONVENCIONAL:
A substituição de uma informação da tabela poderá ser feita pelos sinais abaixo:
a) - dado numérico igual a zero;
b) ... Quando não temos os dados;
c) ? Quando temos dúvida na informação;
d) 0 quando o valor for muito pequeno.
16
SÉRIES ESTATÍSTICAS
Introdução
Uma vez que os dados foram coletados, muitas vezes o conjunto de valores é extenso e
desorganizado, e seu exame requer atenção, pois há o risco de se perder a visão global do fenômeno analisado.
Para que isto não ocorra faz-se necessário reunir os valores em tabelas convenientes, facilitando sua
compreensão.
Além da apresentação do conjunto de valores na forma tabulada, tem-se também a forma
gráfica, que por sua vez, representa uma forma mais útil e elegante de representar o conjunto dos valores.
Qualquer que seja a forma de representação do conjunto de valores, desde de que não haja
alterações em seus valores iniciais, quer seja o de caracterização de um conjunto, ou de comparação com outros
semelhantes ou ainda o de previsão de valores possíveis, facilitará sua compreensão de qualquer estudo. É o caso
da série estatística.
Uma série estatística define-se como toda e qualquer coleção de dados estatísticos referidos a
uma mesma ordem de classificação: QUANTITATIVA. Em um sentido mais amplo, SÉRIE é uma seqüência de
números que se refere a uma certa variável.
Caso estes números expressem dados estatísticos a série é chamada de série estatística. Em um
sentido mais restrito, diz-se que uma série estatística é uma sucessão de dados estatísticos referidos a caracteres
quantitativos.
Para diferenciar uma série estatística de outra, temos que levar em consideração três fatores:
¾ SÉRIE TEMPORAL
¾ SÉRIE GEOGRÁFICA
Também denominadas séries territoriais, espaciais ou de localização, esta série apresenta como
elemento ou caráter variável somente o fator local. Assim:
17
VARIÁVEL: o local
FIXO: a época e o fenômeno
¾ SÉRIE ESPECÍFICA
A série específica recebe também outras denominações tais como série categórica ou série por
categoria. Agora o caráter variável é o fenômeno.
VARIÁVEL: o fenômeno
FIXO: a época e o local
¾ DISTRIBUIÇÃO DE FREQÜÊNCIA
Neste caso todos os elementos (época, local e fenômeno) são fixos. Embora fixo, o fenômeno
apresenta-se agora através de graduações, isto é, os dados referentes ao fenômeno que se está representando são
reunidos de acordo com a sua magnitude. Normalmente os problemas de tabulação são enquadrados neste tipo de
série, que iremos estudar com maior detalhe mais adiante neste curso.
Introdução
Do ponto de vista estatístico, estas podem ser consideradas como medidas muito simples que
permitem estabelecer comparações entre diversos grupos.
¾ Proporção
Considere um número de empregados que foi distribuído em quatro repartições de uma certa
empresa de acordo com sua função. Estas repartições são mutuamente exclusivas (cada pessoa somente poderá
ser alocada em uma única repartição) e exaustivas (todas as pessoas deverão ser alocadas).
Em termos simbólicos podemos escrever:
N1 = número de pessoas alocadas na repartição 1
N2 = número de pessoas alocadas na repartição 2
N3 = número de pessoas alocadas na repartição 3
N4 = número de pessoas alocadas na repartição 4
N = N1 + N2 + N3 + N4 = número total de empregados
Neste caso, a proporção de empregados pertencentes à primeira repartição é determinada
N1 N2 N3
mediante o cálculo do quociente ; para as demais repartições segue o mesmo procedimento: , e
N N N
N4
.
N
Note que o valor de uma proporção não pode exceder a unidade, e que a soma de todas as
proporções será sempre igual à unidade. Assim,
N1 N2 N3 N4 N
+ + + = =1
N N N N N
18
Exemplo:
Tabela 01. Número de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos
Não é simples raciocinar em termos absolutos e dizer qual dos dois órgãos públicos conta com
maior número de empregados consultores em suas duas modalidades de expedientes porque o número total de
empregados difere muito entre si. Por outro lado, a comparação direta pode ser estabelecida rapidamente, se os
dados forem expressos em proporções.
A proporção de consultores com tempo integral no órgão público 1 é:
N1 580
= = 0 ,099 ≅ 0 ,1
N 5.820
E no órgão público 2, seguindo o mesmo raciocínio temos:
N1 680
= = 0 ,0528 ≅ 0 ,053
N 12.860
Note que, em números absolutos, estes valores são muito próximos (580 e 680). Entretanto, o
órgão público 2 apresenta uma proporção inferior de consultores com tempo integral.
Analogamente, fazendo os cálculos para ambos os órgãos públicos, têm:
◊ ÓRGÃO PÚBLICO 1
N2 430
◊ Consultores com ½ expediente: = = 0 ,0738 ≅ 0 ,074
N 5.820
N 3 4.810
◊ Carteira assinada: = = 0 ,8264 ≅ 0 ,826
N 5.820
◊ ÓRGÃO PÚBLICO 2
N2 1.369
◊ Consultores com ½ expediente: = = 0 ,1064 ≅ 0 ,106
N 12.860
N 3 10.811
◊ Carteira assinada: = = 0 ,8406 ≅ 0 ,841
N 12860
Assim, temos a seguinte tabela de proporções:
Tabela 02. Proporção de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos
19
EMPREGADO ÓRGÃO PÚBLICO 1 ÓRGÃO PÚBLICO 2
CONSULTOR:
TEMPO INTEGRAL 0,100 0,053
MEIO EXPEDIENTE 0,074 0,106
CARTEIRA ASSINADA 0,826 0,841
TOTAL 1 1
FONTE: Departamento de Recursos Humanos destes Órgãos Públicos
¾ Porcentagem
As porcentagens são obtidas a partir do cálculo das proporções, simplesmente multiplicando-se
o quociente obtido por 100. A palavra porcentagem significa, portanto, “por cem”. Uma vez que a soma das
proporções é igual a 1, a soma das porcentagens é igual a 100, a menos que as categorias não sejam mutuamente
exclusivas e exaustivas.
Exemplo: Utilizando os dados do exemplo anterior e multiplicando as proporções por 100 teremos a seguinte
tabela:
Tabela 03. Percentual de empregados contratados (consultores) e com carteira assinada em dois órgãos públicos
Tabela 4. Faturamento anual das Empresas A e B em 1994 e 1995 dados em números absoluto e relativo
(%)
¾ Razão
A razão de um número A em relação a outro número B define-se como “A dividido por B” A
quantidade precedente é posta no numerador e a seguinte, no denominador.
20
Exemplo: Através de uma pesquisa realizada em uma certa cidade, descobriu-se que, das pessoas entrevistadas,
300 se manifestaram a favor a uma determinada medida adotada pela prefeitura local, 400 contra e 70 eram
indiferentes. Neste caso, a razão daquelas pessoas contra a medida para aquelas a favor foi de:
400 4
ou ou 4:3 ou 1,33 para 1
300 3
E a razão daquelas a favor e contra para aquelas indiferentes foi de:
(400 + 300) ou
70
ou 70:7 ou 10 para 1
70 7
EXERCÍCIOS
1. Uma série estatística é denominada evolutiva quando?
a) O elemento variável é o tempo;
b) O elemento variável é o local;
c) O elemento variável é a espécie;
d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) Os dados são agrupados em subintervalos do intervalo observado.
13. De acordo com as normas para representação tabular de dados, quando o valor de um dado é zero, deve-se
colocar na célula correspondente:
a) Zero (0);
b) Três pontos (...);
c) Um traço horizontal (-)
d) Um ponto de interrogação (?);
e) Um ponto de exclamação (!).
14. De acordo com as normas para representação tabular de dados, quando o valor de um dado é não está
disponível, deve-se colocar na célula correspondente.
a) Zero (0);
b) Três pontos (...);
c) Um traço horizontal (-)
d) Um ponto de interrogação (?);
e) Um ponto de exclamação (!).
22
15. De acordo com as normas para representação tabular de dados, quando o valor de um dado é muito pequeno,
para ser expresso com o número de casa decimais utilizadas ou com a unidade de medida utilizada, deve-se
colocar na célula correspondente.
a) Zero (0);
b) Três pontos (...);
c) Um traço horizontal (-)
d) Um ponto de interrogação (?);
e) Um ponto de exclamação (!).
16. De acordo com as normas para representação tabular de dados, quando há dúvida, na exatidão do valor de
um dado, deve-se colocar na célula correspondente.
a) Zero (0);
b) Três pontos (...);
c) Um traço horizontal (-)
d) Um ponto de interrogação (?);
e) Um ponto de exclamação (!).
18. Para cada tabela abaixo, calcule a proporção e a porcentagem e responda às perguntas:
Tabela 01. Quociente de Inteligência (QI) de uma certa faculdade brasileira
107 |- 122 39
122 |- 137 21
137 |- 152 12
152 |- 167 4
TOTAL 107
23
Tabela 02. Notas de candidatos de um certo concurso público realizado em uma cidade
20|-40 65
40|-60 230
60|-80 160
80|-100 25
TOTAL 500
a) Dado que a nota de corte seja de 60 pontos, qual a proporção/percentual dos candidatos que foram
aprovados?
b) Calcule e interprete as seguintes razões:
i) Candidatos com nota menor que 20 para aqueles com nota de 40 a 60 (exclusive).
ii) Candidatos com nota menor que 40 para aqueles com nota mínima de 60.
iii) Candidatos com nota de 40 a 60 (exclusive) para aqueles com nota igual ou superior a 80.
iv) Candidatos com nota máxima de 40 para aqueles com nota maior ou igual a 60.
v) Candidatos com nota de 20 a 60 (exclusive) para os demais.
NORDESTE 1.546.672
SUDESTE 924.935
SUL 577.723
C.OESTE 1.879.455
TOTAL 8.509.965
a) Qual a região que ocupa a maior área do Brasil e qual é a sua proporção/porcentagem?
b) Calcule e interprete as seguintes razões:
i) Área da região Norte para a da região Nordeste.
ii) Área das regiões Norte e Nordeste para o da região Centro-Oeste.
iii) Área da região Sudeste para o das regiões Sul e Centro-Oeste.
iv) Área da região Norte para as demais.
24
UNIDADE III - NORMAS PARA CONSTRUÇÃO DE GRÁFICOS
¾ Introdução
CABEÇALHO DO GRÁFICO
CORPO DO GRÁFICO
RODAPÉ
25
¾ TIPOS DE GRÁFICOS
q GRÁFICO EM COLUNAS
❖ Conjunto de retângulos dispostos verticalmente separados por um espaço.
Região Efetivo
Administrativa
RA I - Brasília 867
RA III - Taguatinga 443
RA V - Sobradinho 116
RA XIII - Santa Maria 77
RA XVIII - Lago Norte 203
Total 1.706
1.000
900
800
700
600
Efetivo
500
400
300
200
100
0
RA I - Brasília RA III - Taguatinga RA V - Sobradinho RA XIII - Santa Maria RA XVIII - Lago Norte
Região Administrativa
Fonte: Tabela 01
q GRÁFICOS EM BARRAS
26
Tabela 02. Efetivo do CBMDF em Cinco Regiões Administrativas do DF - 1998
Região Efetivo
Administrativa
RA I - Brasília 867
RA III - Taguatinga 443
RA V - Sobradinho 116
RA XIII - Santa Maria 77
RA XVIII - Lago Norte 203
Total 1.706
RA V - Sobradinho
RA III - Taguatinga
RA I - Brasília
0 100 200 300 400 500 600 700 800 900 1.000
Efetivo
Fonte: Tabela 02
27
q GRÁFICO EM SETORES
Muito utilizado quando pretendemos comparar cada valor da série com o total - proporção.
Forma de cálculo:
Total 360o
o
parte x
Tabela 03. Efetivo (valores absoluto e relativo) do CBMDF em Cinco Regiões Administrativas do DF - 1998
FONTE: Banco de Dados do Distrito Federal – 1998
Região Efetivo
Administrativa Absoluto Relativo (%)
RA I - Brasília 867 50,82
RA III - Taguatinga 443 25,97
RA V - Sobradinho 116 6,80
RA XIII - Santa Maria 77 4,51
RA XVIII - Lago Norte 203 11,90
Total 1.706 100,00
o
Efetivo x
RA I - Brasília 867 183,0
RA III - Taguatinga 443 93,5
RA V - Sobradinho 116 24,5
RA XIII - Santa Maria 77 16,2
RA XVIII - Lago Norte 203 42,8
Total 1.706 360,0
28
Gráfico 03.a. Comparativo (percentual) do Efetivo do CBMDF em Cinco Regiões Administrativas do DF –
1998
RA XVIII - Lago
Norte
11,90%
RA XIII - Santa
Maria
4,51%
RA V - Sobradinho
6,80%
RA I - Brasília
50,82%
RA III - Taguatinga
25,97%
FONTE: Tabela 03
RA XVIII - Lago
Norte
11,90%
RA XIII - Santa
Maria
4,51%
RA V - Sobradinho
6,80%
RA I - Brasília
50,82%
RA III - Taguatinga
25,97%
FONTE: Tabela 03
29
q GRÁFICO EM CURVAS / LINHAS
Ano População
1991 17.399
1992 20.971
1993 25.271
1994 30.457
1995 36.703
40.000
35.000
30.000
População
25.000
20.000
15.000
1990 1991 1992 1993 1994 1995 1996
Ano
FONTE: Tabela 04
60.000
50.000
40.000
População
30.000
20.000
10.000
0
1990 1991 1992 1993 1994 1995 1996
Ano 30
FONTE: Tabela 04
q GRÁFICO POLAR / RADAR
Representação por meio de um polígono
Geralmente presta-se para apresentação de séries temporais
1991
40.000
30.000
20.000
1995 1992
10.000
1994 1993
FONTE: Tabela 04
31
EXERCÍCIOS
2. O gráfico mais comumente utilizado quando se deseja evidenciar a participação de um dado em relação ao total
é denominado:
a) Gráfico em barras;
b) Gráficos em colunas;
c) Gráfico em setores;
d) Gráfico pictórico ou pictograma;
e) Gráfico decorativo.
3. Uma representação gráfica comumente encontrada em jornais e revistas que inclui figuras de modo a torná-las
mais atraente é denominada:
a) Gráfico em barras;
b) Gráficos em colunas;
c) Gráfico em setores;
d) Gráfico pictórico ou pictograma;
e) Gráfico decorativo.
33
UNIDADE IV - DISTRIBUIÇÃO DE FREQÜÊNCIA
REPRESENTAÇÃO DA AMOSTRA:
Podemos observar que a estatística tem como objetivo encontrar leis de comportamento para todo o
conjunto, por meio da sintetização dos dados numéricos, sob a forma de tabelas, gráficos e medidas.
4) ROL: É o arranjo dos dados brutos em ordem de freqüências crescente ou decrescente: Assim:
21 21 21 22 22 23 23 23 24 24
25 25 25 25 26 26 26 28 30 31
31 32 33 33 33 34 34 35 35 36
3) AMPLITUDE TOTAL OU RANGE “R” : É a diferença entre o maior e o menor valor observado.
No exemplo: R = 36 - 21 = 15
4) FREQÜÊNCIA ABSOLUTA (Fi): É o número de vezes que o elemento aparece na amostra, ou o número de
elementos pertencentes a uma classe.
No exemplo F(21) = 3.
34
Para a variável contínua:
Seja Xi peso de 100 indivíduos:
CLASSE Fi
45 |- 55 15
55 |- 65 30
65 |- 75 35
75 |- 85 15
85 |- 95 5
∑ 100
6) NUMERO DE CLASSES (K): Não há fórmula exata para o número de classes (arredondar para o inteiro
mais próximo). Soluções:
5, se n < 25
• K=
n , se n ≥ 25
• Fórmula de Sturges: K= 1 + 3,32 log(n)
Onde: n = tamanho da amostra.
EXEMPLO:
Considere o exemplo apresentado no ROL:
R
7) AMPLITUDE DA CLASSE (h): h = (aproximar para o maior inteiro).
K
EXEMPLO:
Considere novamente o exemplo apresentado no ROL:
15
h= ⇒ h = 2,5 ⇒ h = 3
6
35
EXEMPLO:
Considere o exemplo apresentado no ROL:
Classe Fi
21 |- 24 8
24 |- 27 9
27 |- 30 1
30 |- 33 4
33 |- 36 7
36 |- 39 1
TOTAL 30
9) PONTO MÉDIO DA CLASSE (xi): É a média aritmética entre o limite superior (Li) e o inferior da classe
(li).
li + Li
xi =
2
EXEMPLO:
Da tabela acima:
Classe Fi xi
21 |- 24 8 22,5
24 |- 27 9 25,5
27 |- 30 1 28,5
30 |- 33 4 31,5
33 |- 36 7 34,5
36 |- 39 1 37,5
TOTAL 30 -
10) FREQÜÊNCIA ABSOLUTA ACUMULADA (Fac): É a soma das freqüências dos valores inferiores ou
iguais ao valor dado.
Exemplo:
Classe Fi xi Fac
21 |- 24 8 22,5 8
24 |- 27 9 25,5 17
27 |- 30 1 28,5 18
30 |- 33 4 31,5 22
33 |- 36 7 34,5 29
36 |- 39 1 37,5 30
TOTAL 30 - -
36
Fi
11) FREQÜÊNCIA RELATIVA SIMPLES ( fi ): A freqüência relativa de um valor é dada por, f i = , ou
∑ Fi
será a percentagem daquele valor na amostra caso multiplique por 100.
Classe Fi xi Fac fi
21 |- 24 8 22,5 8 0,267
24 |- 27 9 25,5 17 0,300
27 |- 30 1 28,5 18 0,033
30 |- 33 4 31,5 22 0,133
33 |- 36 7 34,5 29 0,233
36 |- 39 1 37,5 30 0,033
TOTAL 30 - - 1,000
Exemplo:
12) FREQÜÊNCIA RELATIVA ACUMULADA (fac): É a soma das freqüências relativas dos valores inferiores
ou iguais ao valor dado.
Exemplo:
13) HISTOGRAMA: É a representação gráfica de uma distribuição de FREQÜÊNCIA por meio de retângulos
justapostos (veja exemplo a seguir).
14) POLÍGONO DE FREQÜÊNCIA: É a representação gráfica de uma distribuição por meio de um polígono.
Exemplo:
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA SIMPLES DA TABELA ACIMA
10
9
8
7
6
5
Fi
4
3
2
1 Clas s es
0
21 24 27 30 33 36 39
37
15) POLÍGONO DE FREQÜÊNCIA ACUMULADA:
Exemplo:
POLÍGONO DE FREQUÊNCIA ACUMULADA DA TABELA ACIMA
30
25
20
Fac
15
10
5
Class es
0
21 24 27 30 33 36 39
38
EXERCÍCIOS
b) A freqüência total
i) 5
ii) 6
iii) 7
iv) 10
v) 50
3. Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivíduos de uma faculdade:
151 152 154 155 158 159 159 160 161 161
161 162 163 163 163 164 165 165 165 166
166 166 166 167 167 167 167 167 168 168
168 168 168 168 168 168 168 168 169 169
169 169 169 169 169 170 170 170 170 170
170 170 171 171 171 171 172 172 172 173
173 173 174 174 174 175 175 175 175 176
176 176 176 177 177 177 177 178 178 178
179 179 180 180 180 180 181 181 181 182
182 182 183 184 185 186 187 188 190 190
Calcule:
a) A amplitude amostral;
b) O número de classes;
c) A amplitude de classes;
d) Os limites de classes;
e) As freqüências absolutas das classes;
f) As freqüências relativas;
g) Os pontos médios das classes;
h) As freqüências acumuladas;
i) O histograma e o polígono de freqüência;
j) O polígono de freqüência acumulada;
k) Faça um breve comentário sobre os valores das alturas desta amostra através da distribuição de frequência.
Milímetros de chuva
144 152 159 160
160 151 157 146
154 145 151 150
142 146 142 141
141 150 143 158
41
UNIDADE V - MEDIDAS DE POSIÇÃO E SEPARATRIZES
MEDIDAS DE POSIÇÃO
As medidas de posição, também chamada de medidas de tendência central, possuem três formas
diferentes para três situações distintas:
MÉDIA ARITMÉTICA
Existem duas médias:
∑x i
ou simplesmente, x =
∑x
x= i =1
n n
Onde n é o número de elementos do conjunto.
Exemplo:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a média aritmética
simples deste conjunto de dados.
3 + 7 + 8 + 10 + 11 39
x= = = 7,8
5 5
Interpretação: o tempo médio de serviço deste grupo de funcionários é de 7,8 anos.
∑x F
i =1
i i
x=
n
Exemplo:
Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10
vendedores de uma agência de automóveis obtendo a seguinte tabela:
42
veículos número de
negociados vendedores xi Fi
(xi) (Fi)
1 1 1
2 3 6
3 5 15
4 1 4
TOTAL 10 26
Portanto:
26
x= = 2,6
10
Interpretação: em média, cada vendedor negociou 2,6 veículos.
∑x F
i =1
i i
x=
n
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina:
ESCORES ALUNOS xi x i Fi
(Fi)
35 |- 45 5 40 200
45 |- 55 12 50 600
55 |- 65 18 60 1.080
65 |- 75 14 70 980
75 |- 85 6 80 480
85 |- 95 3 90 270
TOTAL 58 - 3.610
Portanto,
3610
x= = 62,24
58
Interpretação: o desempenho médio deste grupo de alunos foi de 62,24 pontos nesta disciplina.
43
MODA - Mo
Dentre as principais medidas de posição, destaca-se a moda. É o valor mais freqüente da distribuição.
Exemplo 1:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 8 e 11. Determinar a moda deste
conjunto de dados.
Mo = 8 ⇒ Distribuição unimodal ou modal
Interpretação: o tempo de serviço com maior frequência é de 8 anos.
Exemplo 2:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 3, 7, 8, 8 e 11. Determinar a moda deste
conjunto de dados.
Mo = 3
⇒ Distribuição bimodal
Mo = 8
Interpretação: os tempos de serviço com maior frequência foram de 3 e 8 anos.
Exemplo 3:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a moda deste
conjunto de dados.
não existe Mo ⇒ Distribuição amodal
Interpretação: não existe o tempo de serviço com maior frequência.
Exemplo:
Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10
vendedores de uma agência de automóveis obtendo a seguinte tabela:
veículos número de
negociados vendedores
(xi) (Fi)
1 1
2 3
3 5
4 1
TOTAL 10
44
Portanto, se a maior frequência é Fi = 5, logo Mo = 3.
Interpretação: A quantidade de veículos comercializados no dia com maior frequência foi de três veículos.
Fórmula de Czuber
Procedimento:
a) Identifica-se a classe modal (aquela que possuir maior freqüência) – CLASSE(Mo).
b) Utiliza-se a fórmula:
∆1
Mo = l i + ⋅h
∆1 + ∆ 2
em que:
l i = limite inferior da classe modal
∆ 1 = Fi − Fi,ant
∆ 2 = Fi − Fi,post
h = amplitude da classe modal
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina:
ESCORES ALUNOS
Fi
35 |- 45 5
45 |- 55 12
55 |- 65 18
65 |- 75 14
75 |- 85 6
85 |- 95 3
TOTAL 58
CLASSE(Mo ) ⇒ 55 | −65
6
Mo = 55 + ⋅ 10 = 55 + 6 ⇒ Mo = 61
6+4
onde :
∆ 1 = 18 − 12 = 6
∆ 2 = 18 − 14 = 4
Interpretação: O escore com maior frequência entre o grupo de 58 alunos foi de 61 pontos.
45
MEDIANA - Md
Construído o ROL, o valor da mediana é o elemento que ocupa a posição central, ou seja, é o elemento
que divide a distribuição em 50% de cada lado:
Md
0% 50% 100%
n +1
par, então o valor da mediana será a média das duas observações adjacentes à posição 2
se n =
ímpar, então o valor da mediana será o valor localizado na posição n + 1
2
Exemplo 1:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a mediana deste
conjunto de dados.
5 +1
Como n = 5, então o valor da mediana estará localizado na posição = 3 . Portanto,
2
Md = 8
Interpretação: 50% dos funcionários possuem até oito anos de tempo de serviço, ou, 50% dos funcionários
possuem no mínimo oito anos de tempo de serviço.
Exemplo 2:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10, 11 e 13. Determinar a mediana deste
conjunto de dados.
6 +1
Como n = 6, então o valor da mediana estará localizado na posição = 3,5 . Portanto,
2
8 + 10
Md = =9
2
Interpretação: 50% dos funcionários possuem até nove anos de tempo de serviço, ou, 50% dos funcionários
possuem no mínimo nove anos de tempo de serviço.
46
Exemplo:
Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10
vendedores de uma agência de automóveis obtendo a seguinte tabela:
veículos número de
negociados vendedores Fac
(xi) (Fi)
1 1 1
2 3 4
3 5 9
4 1 10
TOTAL 10 -
Portanto:
10
POS(Md ) = = 5 ⇒ Md = 3
2
Interpretação: 50% dos vendedores comercializaram no máximo três veículos, ou então, metade dos vendedores
comercializou pelo menos três veículos.
Procedimento:
n
1. Calcula-se a posição da mediana: POS(Md ) =
2
2. Pela Fac identifica-se a classe que contém o valor da mediana - CLASSE(Md)
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina:
47
ESCORES ALUNOS Fac
(Fi)
35 |- 45 5 5
45 |- 55 12 17
55 |- 65 18 35
65 |- 75 14 49
75 |- 85 6 55
85 |- 95 3 58
TOTAL 58 -
Portanto,
58
1. POS(Md) = = 29
2
2. CLASSE(Md) = 55 | −65
29 - 17
3. Md = 55 + ⋅ 10 = 55 + 6,67 ⇒ Md = 61,67
18
Interpretação: 50% dos alunos obtiveram escore máximo de 61,67 pontos, ou então, metade dos alunos
obtiveram escore maior que 61,67 pontos..
SEPARATRIZES
QUARTIS
Os quartis dividem um conjunto de dados em quatro partes iguais.
Q1 Q2 = Md Q3
Procedimento:
n
POS(Q i ) = ⋅i
1. Calcula-se a posição do quartil: 4
onde : i = 1,2,3
2. Pela Fac identifica-se a classe que contém o valor do quartil - CLASSE(Qi)
48
3. Utiliza-se a fórmula: POS(Qi ) - Fac,ant
Qi = li + ⋅h
Fi
onde:
li = Limite inferior da classe quartílica
n = Tamanho da amostra ou número de elementos
Fac,ant = Frequência acumulada anterior à classe quartílica
h = Amplitude da classe quartílica
Fi = Freqüência absoluta simples da classe quartílica
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
Portanto,
58
1. POS(Q1 ) = ⋅ 1 = 14,5
4
2. CLASSE(Q1 ) = 45 | −55
14,5 - 5
3. Q1 = 45 + ⋅ 10 = 45 + 7,92 ⇒ Q1 = 52,92
12
Interpretação: 25% dos alunos obtiveram escore máximo de 52,92 pontos, ou então, 75% dos alunos obtiveram
escore maior que 52,92 pontos.
58
1. POS(Q 3 ) = ⋅ 3 = 43,5
4
2. CLASSE(Q1 ) = 65 | −75
43,5 - 35
3. Q 3 = 65 + ⋅ 10 = 65 + 6,07 ⇒ Q 3 = 71,07
14
Interpretação: 75% dos alunos obtiveram escore menor que 71,07 pontos, ou então, 25% dos alunos obtiveram
escore de pelo menos 71,07 pontos.
49
DECIS
São valores que divide a série em dez partes.
D1 D2 D3 D4 D5 D6 D7 D8 D9
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Procedimento:
n
POS(Di ) = ⋅i
1. Calcula-se a posição da medida: 10
onde : i = 1,2,3,4,5,6,7,8,9
2. Pela Fac identifica-se a classe que contém o valor do decil - CLASSE(Di)
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. Calcule o sexto decil.
Portanto,
50
58
1. POS(D 6 ) = ⋅ 6 = 34,8
10
2. CLASSE(D 6 ) = 55 | −65
34,8 - 17
3. D 6 = 55 + ⋅ 10 = 55 + 9,89 ⇒ D 6 = 64,89
18
Interpretação: 60% dos alunos obtiveram escore inferior a 64,89 pontos, ou então, 40% dos alunos obtiveram
escore mínimo de 64,89 pontos.
PERCENTIS
0%.. .10%.. .20%.. .30%.. .40%.. .50%.. .60%.. .70%.. .80%.. .90%.. .100%
São as medidas que dividem a amostra em 100 partes iguais. A fórmula será:
Procedimento:
n
POS(Pi ) = ⋅i
1. Calcula-se a posição da medida: 100
onde : i = 1,2,3,...,98,99
2. Pela Fac identifica-se a classe que contém o valor do percentil - CLASSE(Pi)
POS(Pi ) - Fac,ant
3. Utiliza-se a fórmula: Pi = li + ⋅h
Fi
onde:
li = Limite inferior da classe do percentil
n = Tamanho da amostra ou número de elementos
Fac,ant = Frequência acumulada anterior à classe do percentil
h = Amplitude da classe do percentil
Fi = Freqüência absoluta simples da classe do percentil
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. Calcule o percentil de ordem 23.
52
EXERCÍCIOS
1. Dado o rol do número de erros de impressão da primeira página de um jornal durante 50 dias, obteve-se os
seguintes resultados:
5 5 5 6 6 6 7 7 7 7
7 8 8 8 8 8 8 8 9 9
10 10 10 10 10 11 11 11 11 12
12 12 12 12 12 12 12 12 13 14
14 14 14 14 14 14 15 16 19 22
Classe Fi xi Fac f
i
05 |- 08
08 |- 11
11 |- 14
14 |- 17
17 |- 20
20 |- 23
Total - -
Classes f P.M. Fi fr
0,02
12
62 - 65 0,06
66,5 84
126
36
225
0,15
300
Total - -
classes Fi
2,75 |- 2,80 2
2,80 |- 2,85 3
2,85 |- 2,90 10
2,90 |- 2,95 11
2,95 |- 3,00 24
3,00 |- 3,05 14
3,05 |- 3,10 9
3,10 |- 3,15 8
3,15 |- 3,20 6
3,20 |- 3,25 3
Total 90
Xi 3 4 7 8 12
b) Fi 2 5 8 4 3
Classes 68 - 72 72 - 76 76 - 80 80 - 84
c) Fi 8 20 35 40
Xi 73 75 77 79 81
b) Fi 2 10 12 5 2
Classes 10 - 20 20 - 30 30 - 40 40 - 50
c) Fi 7 19 28 32
Classes 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70
a) Fi 3 8 18 22 24
54
UNIDADE VI - MEDIDAS DE DISPERSÃO
MEDIDA DE DISPERSÃO
As medidas de dispersão indicam se os valores estão relativamente próximos um dos outros, ou
separados em torno de uma medida de posição: a média. Consideraremos quatro medidas de dispersão: Desvio-
médio, Variância, Desvio Padrão e Coeficiente de Variação.
DESVIO-MÉDIO
O desvio-médio analisa a média dos desvios em torno da média.
DM =
∑x i −x
n
onde n é o número de elementos do conjunto.
Exemplo:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar o desvio-médio
deste conjunto de dados.
como x = 7,8
3 - 7,8 + 7 − 7,8 + 8 − 7,8 + 10 − 7,8 + 11 − 7,8 11,2
então DM = = ⇒ DM = 2,24
5 5
Interpretação: em média, o tempo de serviço deste grupo de funcionários se desvia em 2,24 anos em torno dos
7,8 anos de tempo médio de serviço.
DM =
∑x i − x ⋅ Fi
n
Exemplo:
Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10
vendedores de uma agência de automóveis como mostra a tabela abaixo. O cálculo do desvio-médio será:
55
veículos número de
negociados vendedores |xi-média| |xi-média|*Fi
(xi) (Fi)
1 1 1,60 1,60
2 3 0,60 1,80
3 5 0,40 2,00
4 1 1,40 1,40
TOTAL 10 4,00 6,80
como x = 2,6
6,8
então DM = = 0,68
10
Interpretação: em média, a quantidade de veículos negociada de cada vendedor possuiu uma distância de 0,68
em torno dos 2,6 veículos comercializados em média por vendedor.
DM =
∑x i − x ⋅ Fi
n
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. O cálculo do desvio-médio será:
ESCORES ALUNOS
Fi xi |xi-média| |xi-média|*Fi
35 |- 45 5 40 22 111
45 |- 55 12 50 12 147
55 |- 65 18 60 2 40
65 |- 75 14 70 8 109
75 |- 85 6 80 18 107
85 |- 95 3 90 28 83
TOTAL 58 - - 597
Portanto,
como x = 62,24
597
então DM = = 10,29
58
56
Interpretação: Em média, a nota de cada aluno deste grupo teve um distanciamento de 10,29pontos em torno do
desempenho médio deste grupo de alunos foi de 62,24 pontos nesta disciplina.
VARIÂNCIA E DESVIO-PADRÃO
A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores a contar da
média. A fórmula da variância poderá ser calculada de duas formas:
∑ (x − µ)
2
1 (∑ x i )2
= ⋅ ∑ xi −
i
σ 2
= 2
N N N
ou
∑ (x − x)
2
1 (∑ x i )2
⋅ ∑ xi −
i
S 2
= = 2
n -1 n -1 n
Obs: A Segunda fórmula é chamada de “Fórmula Desenvolvida”.
Exemplo:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar o desvio-padrão
deste conjunto de dados.
como x = 7,8
então S 2 =
(3 - 7,8)2 + (7 − 7,8)2 + (8 − 7,8)2 + (10 − 7,8)2 + (11 − 7,8)2 =
38,8
⇒ S 2 = 9,7anos 2
5 −1 4
Interpretação: encontramos então uma variância para o tempo de serviço de 9,7anos2. Para eliminarmos o
quadrado da unidade de medida, extraímos a raiz quadrada do resultado da variância, que chegamos a uma
terceira medida de dispersão, chamada de DESVIO-PADRÃO:
57
∑ (x − µ ) ⋅ Fi
2
1 (∑ x i ⋅ Fi )2
= ⋅ ∑ x i ⋅ Fi −
i
σ 2
= 2
N N N
ou
∑ (x − x ) ⋅ Fi
2
1 (∑ x i ⋅ Fi )2
⋅ ∑ x i ⋅ Fi −
i
S 2
= = 2
n -1 n -1 n
Exemplo:
Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10
vendedores de uma agência de automóveis como mostra a tabela abaixo. O cálculo do desvio-médio será:
como x = 2,6 1 26 2
S = ⋅ 74 −
2
= 0,71veículos
2
6,4 9 10
então S 2 = = 0,71veículos 2
9
⇒ S = 0,71veículos 2 = 0,84veículos
⇒ S = 0,71veículos = 0,84 veículos
2
Interpretação: Portanto, o desvio-padrão do exemplo foi de 0,84 veículos. Ou seja, se calcularmos um intervalo
utilizando um desvio-padrão em torno da média, encontraremos a concentração da maioria dos veículos
negociados por vendedor.
∑ (x − µ ) ⋅ Fi
2
1 (∑ x i ⋅ Fi )2
= ⋅ ∑ x i ⋅ Fi −
i
σ 2
= 2
N N N
ou
∑ (x − x ) ⋅ Fi
2
1 (∑ x i ⋅ Fi )2
⋅ ∑ x i ⋅ Fi −
i
S 2
= = 2
n -1 n -1 n
58
Exemplo:
A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada
disciplina. O cálculo do desvio-médio será:
Interpretação: Portanto, o desvio-padrão do exemplo foi de 12,85 pontos. Ou seja, se calcularmos um intervalo
utilizando um desvio-padrão em torno do escore médio de 62,24 pontos, encontraremos a concentração da
maioria dos alunos dentro deste intervalo de pontuação.
COEFICIENTE DE VARIAÇÃO
Trata-se de uma média relativa à dispersão, útil para a comparação e observação em termos relativos do
grau de concentração em torno da média de séries distintas. É dada por:
σ S
CV = ⋅ 100 OU CV = ⋅ 100
µ x
Classificação da distribuição quanto à dispersão:
¾ DISPERSÇÃO BAIXA: CV ≤ 15%
¾ DISPERSÇÃO MÉDIA: 15% < CV < 30%
¾ DISPERSÇÃO ALTA: CV ≥ 30%
59
Exemplo:
Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio
padrão de R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão
de R$ 1.200,00. Então:
1500
Sexo masculino : CV = ⋅ 100 = 37,5%
4000
1200
Sexo feminino : CV = ⋅ 100 = 40%
3000
Interpretação: Logo, podemos concluir que o salário das mulheres apresenta maior dispersão relativa que a dos
homens. Para obtermos o resultado de C.V basta multiplicarmos por 100.
EXERCÍCIOS
a) ( ) 1,36 c) ( ) 4,54
b) ( ) 18,35 d) ( ) 20,66
60
UNIDADE VII - MEDIDAS DE ASSIMETRIA E DE CURTOSE
MEDIDAS DE ASSIMETRIA
DEFINIÇÃO: grau de deformação de uma distribuição em relação ao eixo de simetria.
Podemos observar os tipos de assimetria abaixo:
a)
⇒ x = Md = Mo
b)
⇒ x < Md < Mo
c)
⇒ Mo < Md < x
Existem várias coeficientes com o objetivo de quantificar tais assimetrias. Estudaremos dois destes
coeficientes que veremos a seguir:
ª COEFICIENTE DE PEARSON
O coeficiente de Pearson é apresentado pela seguinte fórmula:
µ − Mo x − Mo
As = ou As =
σ S
Classificação do coeficiente de Pearson:
As = 0 DISTRIBUIÇÃO SIMÉTRICA
61
ª COEFICENTE DE BOWLEY
Q 3 + Q1 − 2 ⋅ Md
As =
Q 3 − Q1
Classificação do coeficiente de Bowley:
As = 0 DISTRIBUIÇÃO SIMÉTRICA
MEDIDA DE CURTOSE
⇒ CURVA PLATICÚRTICA
⇒ CURVA MESOCÚRTICA
⇒ CURVA LEPTOCÚRTICA
62
Para medir o grau de curtose utilizaremos o coeficiente
Q 3 - Q1
K=
2 ⋅ (P90 - P10 )
EXERCÍCIOS
1. Analisando as curvas abaixo marque a resposta correta.
Q1 = 24,4cm Q3 = 41,2cm
P10=20,2cm P90 = 49.5cm,
63
UNIDADE VIII – INTRODUÇÃO À TEORIA DA PROBABILIDADE
Exemplos:
E1 – lançamento de um dado e observar o número na face superior.
E2 – lançamento de uma moeda e observar o valor na face superior.
E3 – lançamento de um dado e uma moeda, nesta seqüência, observar os valores nas faces superiores.
E4 – um casal deseja ter três filhos e observar o sexo, de acordo com a ordem de nascimentos das crianças.
ESPAÇO AMOSTRAL - S
Definição:
Um espaço amostral é um conjunto de todas as ocorrências possíveis de um determinado experimento
aleatório E.
Exemplos: Considere os experimentos aleatórios apresentados anteriormente:
No E1 - S={1, 2, 3, 4, 5, 6}
No E2 - S={k, c}, onde k=cara, C=coroa.
No E3 - S={1k, 2k, 3k, 4k, 5k, 6k, 1c, 2c, 3c, 4c, 5c, 6c}
No E4 - S={MMM, MMF, MFM, MFF, FMM, FMF, FFM, FFF}
EVENTOS – (qualquer letra maiúscula do alfabeto)
Definição:
Um evento é qualquer subconjunto de ocorrências de um determinado espaço amostral S.
Exemplo: Considere o experimento aleatório E3, com seu respectivo espaço amostral S:
S={1k, 2k, 3k, 4k, 5k, 6k, 1c, 2c, 3c, 4c, 5c, 6c}
Determine os seguintes eventos:
A = ocorrência de valor cara (K)
B = ocorrência de valor par
C = ocorrência de valor coroa (C)
D = ocorrência de valor ímpar
E = ocorrência de número primo
F = ocorrência de valor maior que 4
G = ocorrência de valor menor ou igual a 3
H = ocorrência de valor par ou cara (K)
I = ocorrência de valor par ou ímpar
64
J = ocorrência de valor par e cara (K)
K = ocorrência de valor par e ímpar
L = ocorrência de valor maior que 7
TIPOS DE EVENTOS
• EVENTO CERTO
Definição:
É aquele evento que se igual ao espaço amostral S.
Exemplo: O evento I acima é um evento certo.
EVENTO IMPOSSÍVEL
Definição:
É aquele evento que não possui elemento algum.
Exemplo: Os eventos K e L acima são eventos impossíveis.
EVENTOS COMPLEMENTARES
Definição:
Dois eventos A e B quaisquer são chamados de complementares se:
A∩B = ∅
A∪B = S
65
PROBABILIDADE:
Enfoque Teórico
A probabilidade de ocorrência de um evento A, P(A), é um número real que satisfaz as seguintes
condições:
a) 0 ≤ P(A) ≤ 1
b) P(S) = 1
c) Se A e B são eventos mutuamente exclusivos então P(A∪B) = P(A) + P(B)
d) Se A1, A2, ...,A , ... São mutuamente exclusivos, dois a dois, então:
Principais teoremas:
I) P( A ) = 1 - P(A)
II) Se A é um evento impossível de ocorrer (A=∅), então P(A) = P(∅) =0.
III) Se A e B são eventos quaisquer, então: P(A∪B) = P(A) + P(B) - P(B∩A).
CÁLCULO DA PROBABILIDADE
n(A)
A probabilidade deverá ser calculada a partir da fórmula: P(A) =
n(S)
Exemplo:
Seja o Experimento E o lançamento de um dado e o seu espaço amostral dado por: S = {1, 2, 3, 4, 5, 6}. Qual a
probabilidade do evento A – Números maiores e iguais a 2?
O Evento A pode ser descrito na forma: A ={2, 3, 4, 5, 6}
n(A)
n(A) = 5 e n(S) = 6. Logo a probabilidade do evento A é P(A) = = 5/6.
n(S)
PROBABILIDADE CONDICIONAL
Ilustração:
Seja o experimento aleatório E: lançar um dado e o evento A = {sair o número 3}. Então:
1
P(A) =
6
Seja o evento B = {sair o número impar} = {1, 3, 5}
Podemos estar interessados em avaliar a probabilidade do evento A estar condicionado à ocorrência do evento B,
designado por P(A|B), onde o evento A é o evento condicionado e o evento B o condicionante.
1
Assim P(A|B) =
3
Formalmente a probabilidade condicionada é definida por:
“Dado dois eventos quaisquer A e B, denotaremos P(A|B), por”.
66
P(A ∩ B) n (A ∩ B) ,
P(A B) = =
P(B) n (B)
Com P(B)≠0, pois B já ocorreu.
TEOREMA DO PRODUTO
A probabilidade da ocorrência simultânea de dois eventos quaisquer A e B, do mesmo espaço amostra,
é igual ao produto da probabilidade de ocorrência do primeiro deles pela probabilidade condicional do outro,
dado que o primeiro ocorreu.
Assim:
P(A ∩ B)
P(A B) = ⇒ P(A ∩ B) = P(B) ⋅ P(A B)
P(B)
INDEPENDÊNCIA ESTATÍSTICA
Um evento A é considerado independente de um outro evento B se a probabilidade de A é igual à
probabilidade condicional de A dado B, isto é, se:
P ( A) = P ( A B )
Considerando o teorema do produto podemos afirmar que:
TEOREMA DE BAYES
Suponha que os eventos A1, A2, ...,An formam uma partição de um espaço amostral S; ou seja, os
eventos Ai são mutuamente exclusivos e sua união é S. Seja B outro evento qualquer. Então:
Consequentemente,
Por outro lado, para qualquer i, a probabilidade condicional de Ai dado B é definida como
67
P(Ai\B) = P(A i ∩ B)
P(B)
Nesta equação, usamos (1) para substituir P(B) e P(Ai∩B) = P(Ai)P(B\ Ai) para substituir P(Ai∩B),
obtendo assim o:
Teorema de Bayes: Suponha A1, A2, ...,An ser uma partição de S e B, um evento qualquer. Então, para qualquer
i,
P(A i )P(B \ A i )
P(A i \ B) =
P(A1 )P(B \ A1 ) + P(A 2 )P(B \ A 2 ) + ... + P(A n )P(B \ A n )
Exemplos:
Três máquinas, A, B e C produzem 50%, 30% e 20%, respectivamente do total de peças de uma fábrica.
As percentagens de produção defeituosa destas máquinas são 3%, 4% e 5%. Se uma peça é selecionada
aleatoriamente, ache a probabilidade de ela ser defeituosa. Suponha agora que uma peça selecionada
aleatoriamente seja defeituosa. Encontre a probabilidade de ela ter sido produzida pela máquina A
EXERCÍCIOS
2. Um revendedor de carros tem dois carros, corsas 1996, na sua loja para serem vendidos, interessa-nos saber
quanto cada um dos dois vendedores venderá ao final de uma semana. Como representar “o primeiro vendedor
não vende nenhum carro” e depois “o segundo vendedor vende ao menos um dos carros”.
3. Se A é o evento “Um estudante fica em casa para estudar”. E B é o evento “o estudante vai ao cinema”,
P(A) = 0,64 e P(B) = 0,21. Determine:
P(Ac), P(Bc), P(B/A)
68
7. A probabilidade de três jogadores acertarem um pênalti são respectivamente 2/3, 4/5 e 7/10. Se cada um
cobrar uma única vez, qual a probabilidade de:
a) Todos acertarem
b) Ao menos um acertar
c) Nenhum acertar
9. Sr Ray Moon Dee, ao dirigir-se ao trabalho, usa um ônibus ou o metrô com probabilidade de 0,2 e 0,8, nessa
ordem. Quando toma o ônibus, chega atrasado 30% das vezes. Quando toma o metrô, atrasa-se 20% dos
dias. Se o Sr Ray Moon Dee Chegar atrasado ao trabalho em determinado dia, qual a probabilidade dele
haver tomado um ônibus?
10. Em certo colégio, 5% dos homens e 2% das mulheres tem mais que 1,80m de altura. Por outro lado, 60%
dos estudantes são homens. Se um estudante é selecionado aleatoriamente e tem mais de 1,80m de altura,
qual a probabilidade de que o estudante seja mulher?
69