Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Apostila+1+ok

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 58

UNIVERSIDADE REGIONAL INTEGRADA DO ALTO URUGUAI E DAS

MISSÕES – URI CAMPUS DE FREDERICO WESTPHALEN


DEPARTAMENTO DE ENGENHARIAS E CIÊNCIA DA COMPUTAÇÃO
CURSO DE ENGENHARIA __________________
____ º SEMESTRE

ESTATÍSTICA I

Professora: Eliane Maria Cocco


Aluno (a): _________________________________

Frederico Westphalen, RS
2017

Professora Eliane Maria Cocco


1 CONCEITOS BÁSICOS

1.1 O QUE É ESTATÍSTICA?


A Estatística é uma parte da Matemática Aplicada que dedica-se ao desenvolvimento e ao uso de
métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos
na tomada de decisões. A utilização de técnicas, destinadas à análise de situações complexas ou não, tem
aumentado e faz parte do nosso cotidiano.
Um exemplo muito conhecido e lembrado quando se fala em estatística é o recenseamento. Os
censos existem com o objetivo de conhecer seus habitantes, sua condição socioeconômica, sua cultura,
religião, etc. Portanto, associar estatística a censo é perfeitamente correto do ponto de vista histórico, sendo
interessante salientar que as palavras estatística e estado têm a mesma origem latina: status.
Outro exemplo, as transmissões esportivas. Em um jogo de futebol, o número de escanteios, o
número de faltas cometidas e o tempo de posse de bola são dados fornecidos ao telespectador e fazem com
que a conclusão sobre qual time foi melhor em campo se torne objetiva (não que isso implique que tenha
sido o vencedor...).
A estatística utiliza dados para se adquirir insight e para chegar a conclusões. Nossas ferramentas são
tabelas, gráficos e cálculos, mas as ferramentas são orientadas por maneiras de pensar que equivalem ao bom
senso educado.
Hoje, precisamos nos apropriar de alguns princípios básicos da Estatística, pois é difícil estarmos bem
informados sem uma compreensão dos vários índices governamentais, dos gráficos e às médias publicados
diariamente na imprensa e nas pesquisas de opinião pública. Assim, é necessária a compreensão dos
conceitos básicos da Estatística, bem como as suposições necessárias para o seu uso de forma criteriosa.

A estatística envolve técnicas para coletar, organizar, descrever, analisar e


interpretar dados, ou provenientes de experimentos, ou vindos de estudos
observacionais.

1.2 A ESTATÍSTICA NA ENGENHARIA


Logo após a Revolução Industrial, métodos estatísticos foram incorporados nos processos industriais
para garantir a qualidade dos produtos. Amostras de itens produzidos eram avaliadas sistematicamente para
inferir se o processo estava sob controle. Mais recentemente, a avaliação da qualidade passou a ser feita ao
longo de todo o processo produtivo como forma de corrigir eventuais falhas no sistema assim que elas
aparecessem. Isto levou a um aumento da qualidade do produto final acompanhado de redução de custos,
pois reduziram drasticamente as perdas por defeitos.
Além do acompanhamento estatístico da qualidade, as indústrias costumam fazer experimentos
estatisticamente planejados para encontrar as combinações dos níveis de fatores do processo que levem a
melhor qualidade possível. Na outra ponta, as empresas levantam dados de amostras de consumidores para
realizar pesquisas de marketing direcionadas ou para adequar os produtos aos clientes. O planejamento
dessas amostras e a análise dois dados necessitam de técnicas estatísticas.

Professora Eliane Maria Cocco


Exemplos:
* Engenheiros civis trabalhando no campo de transportes estão preocupados com a capacidade de
sistemas regionais de rodovias. Um problema típico envolveria dados sobre o número de viagens de trailers,
o número de pessoas por moradia e o número de veículos por moradia, com o objetivo sendo a produção de
um modelo de geração de viagens relacionando viagens ao número de pessoas por moradia e ao número de
veículos por moradia. Uma técnica estatística chamada de análise de regressão pode ser usada para construir
esse modelo.
Um engenheiro vai resolver problemas de interesse da sociedade por meio do refinamento de um
produto ou de um processo existente ou projetando um novo produto ou processo que atenda às necessidades
dos consumidores.
Os métodos estatísticos são usados para nos ajudar a entender a variabilidade. Por variabilidade,
queremos dizer que sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo
resultado. Todos nós encontramos variabilidade em nosso dia-a-dia e o julgamento estatístico pode nos dar
uma maneira útil para incorporar essa variabilidade em nossos processos de tomada de decisão. Por exemplo,
considere o desempenho de consumo de gasolina de seu carro. Você sempre consegue o mesmo desempenho
de consumo em cada tanque de combustível? Naturalmente, não na verdade, algumas vezes o desempenho
varia consideravelmente. Essa variabilidade observada no consumo de gasolina depende de muitos fatores,
tais como o tipo de estrada mais usada recentemente (cidade ou interior), as mudanças na condição do
veículo ao longo do tempo (que poderiam incluir fatores como desgaste do pneu ou compressão do motor ou
desgaste da válvula), a marca e/ou número de octanagem da gasolina usada, ou mesmo, possivelmente, as
condições climáticas. Esses fatores representam fontes potenciais de variabilidade no sistema.
Outro exemplo: considere a situação em que selecionamos várias peças de fundição de um processo
de fabricação e medimos uma dimensão crítica(tal como a abertura de pá) em cada peça. Se o instrumento de
medição tem resolução suficiente, as aberturas das pás serão diferentes (haverá variabilidade na dimensão).
Alternativamente, se contarmos o número de defeitos em placas de circuito impresso encontraremos
variabilidade nas contagens, pois algumas placas terão poucos defeitos e outras terão muitos.
A Estatística nos fornece uma estrutura para descrever essa variabilidade e para aprender sobre quais
fontes potenciais de variabilidade são mais importantes ou quais têm o maior impacto no desempenho, por
exemplo, de consumo de gasolina.

1.3 GRANDES ÁREAS DA ESTATÍSTICA


Para fins de apresentação, é usual se dividir a estatística em três grandes áreas, embora não se trate
de ramos isolados:
• Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam coletar, organizar, apresentar,
analisar e sintetizar os dados numéricos de uma população, ou amostra;
• Estatística Inferencial – Processo de se obter informações sobre uma população a partir de resultados
observados na amostra;
• Probabilidade - Modelos matemáticos que explicam os fenômenos estudados pela Estatística em
condições normais de experimentação.
Professora Eliane Maria Cocco
Estatística Descritiva
É a parte mais conhecida. Em geral utilizamos a Estatística Descritiva na etapa inicial da análise
quando tomamos contato com os dados pela primeira vez. Objetivando tirar conclusões de modo informal e
direto, a maneira mais simples seria a observação dos valores colhidos. A finalidade da Estatística Descritiva
é tornar as coisas mais fáceis de entender, de relatar e discutir e tem as seguintes atribuições.
1-A obtenção ou coleta de dados – é normalmente feita através de um questionário ou de
observação direta de uma população ou amostra.
2-A organização dos dados – consiste na ordenação e crítica quanto à correção dos valores
observados, falhas humanas, omissões, abandono de dados duvidosos.
3-A representação dos dados – os dados estatísticos podem ser mais facilmente compreendidos
quando apresentados através de tabelas e gráficos, que permite uma visualização instantânea de
todos os dados.
Quem vê o noticiário, na televisão ou nos jornais, sabe quão frequente é o uso de médias, índices e gráficos
nas notícias.
Exemplo 1 - INPC (Índice Nacional de Preços ao Consumidor). Sua construção envolve a sintetização, em
um único número, dos aumentos dos produtos de uma cesta básica.
Exemplo 2 - Anuário Estatístico Brasileiro. O IBGE publica esse anuário apresentando, em várias tabelas, os
mais diversos dados sobre o Brasil: educação, saúde, transporte, economia, cultura, etc. Embora simples,
fáceis de serem entendidas, as tabelas são o produto de um processo demorado e extremamente dispendioso
de coleta e apuração de dados.
Outros exemplos: a taxa de desemprego, o custo de vida, o índice pluviométrico, a quilometragem
média por litro de combustível, as médias de estudantes.

Inferência Estatística
É o conjunto de métodos para a tomada de decisões, nas situações em que existem incerteza e
variação. Deve-se notar que se tivermos acesso a todos os elementos que desejamos estudar, não é necessário
o uso das técnicas de inferência estatística; entretanto, elas são indispensáveis quando existe a
impossibilidade de acesso a todo o conjunto de dados, por razões de natureza econômica, ética ou física.
Exemplo 1 - Suponha que a distribuição das alturas de todos os habitantes de um país possa ser representada
por uma distribuição normal. Mas não conhecemos de antemão a média da distribuição. Devemos, pois,
estimá-la.
Exemplo 2 - Análise financeira. Os analistas financeiros estudam dados sobre a situação da economia,
visando explicar tendências dos níveis de produção e de consumo, projetando-os para o futuro.
Exemplo 3 - Ocorrência de terremotos. Os geólogos estão continuamente coletando dados sobre a ocorrência
de terremotos. Gostariam de inferir quando e onde ocorrerão tremores, e qual a sua intensidade. Trata-se,
sem dúvida, de uma questão complexa, que exige longa experiência geológica, além de cuidadosa aplicação
de métodos estatísticos.

Professora Eliane Maria Cocco


Probabilidade
O objetivo é compreender, quantificar e modelar os tipos de variações ou fenômenos aleatórios que
encontramos com frequência. Jogos de dados e de cartas, ou o lançamento de uma moeda para o ar, a maioria
dos jogos esportivos enquadram-se na categoria do acaso. A decisão de um fabricante de cola de empreender
uma grande campanha de propaganda visando a aumentar sua participação no mercado, a decisão de parar de
imunizar pessoas com menos de vinte anos contra determinada doença, a decisão de arriscar-se a atravessar
uma rua no meio do quarteirão, todas utilizam a probabilidade consciente ou inconscientemente.

1.4 SOBRE OS DADOS


Os dados são coletados e armazenados eletronicamente, bem como pela observação humana, usando
registros e arquivos tradicionais. Os formatos diferem, dependendo do observador ou do processo de
observação, e refletem preferências pessoais e facilidade de registro.

1.4.1 Indivíduos ou unidade elementar e variáveis


Qualquer conjunto de dados contém informações a respeito de um grupo de indivíduos. A
informação é organizada em variáveis.
Os indivíduos (unidade elementar) são os objetos descritos por um conjunto de dados, podendo ser
pessoas, animais objetos que fazem parte de uma população.
Uma variável é qualquer característica de um indivíduo. Uma variável pode assumir valores
diferentes para indivíduos diferentes.
Dado é o resultado de investigação, cálculo ou pesquisa.
Exemplo - Um banco de dados de estudantes de uma universidade. Os estudantes são os indivíduos descritos
pelo conjunto de dados. Para cada indivíduo, os dados contém os valores de variáveis, tais como data de
nascimento, gênero, habitação, média de notas, etc.
Ao analisarmos dados estatísticos precisamos explorar a situação questionando: Quais os indivíduos?
Quantos indivíduos? Quantas variáveis os dados contém? Em qual unidade de medida cada variável está
registrada? Quais os propósitos dos dados? Esperamos chegar a alguma conclusão? As variáveis são
adequadas aos propósitos pretendidos?

1.4.2 Origem dos dados


Para a realização de observações, é preciso fazer uma coleta de dados. Em engenharia existem três
métodos básicos de coleta de coleta de dados:
a)um estudo retrospectivo: Utiliza dados arquivados. Esses dados podem conter informação relativamente
de pouca utilidade para o problema. Alguns dados relevantes podem ser omitidos. Podem haver erros de
transcrição ou registro, resultando em outliers (valores não-usuais).
b)um estudo de observação: Observa-se o processo perturbando-o tão pouco quanto possível. Ocorrem por
um curto período de tempo. Assim, variáveis que não são rotineiramente medidas podem ser incluídas.

Professora Eliane Maria Cocco


c)um experimento planejado: O engenheiro faz variações deliberadas em variáveis controláveis do sistema.
Observa os dados de saída resultante. Faz uma inferência sobre quais variáveis são responsáveis pelas
mudanças observadas.

1.4.3 Classificação das variáveis


Os procedimentos estatísticos dependem da natureza dos dados ou das observações das variáveis, por
isso é importante saber distinguir os tipos de dados, de variáveis e suas unidades de medida. Quanto a sua
natureza, as observações ou variáveis se classificam em quantitativas discretas e contínuas, qualitativas
nominais e ordinais.
*Variáveis quantitativas: quando seus valores são expressos por números. Esses números podem ser
obtidos por um processo de contagem ou medição. Podem ser de dois tipos:
*variáveis discretas. São aquelas que podem assumir apenas valores inteiros em pontos da reta real.
É possível enumerar todos os possíveis valores. As variáveis discretas resultam, em geral, de contagens: a
quantidade de vendas de uma empresa, número de filhos, número de quartos da casa, número de moradores,
número de irmãos. etc.
*variáveis contínuas. são aquelas que podem assumir qualquer valor num certo intervalo (contínuo)
da reta real. Não é possível enumerar todos os possíveis valores. Os valores contínuos, geralmente, provém
de medições que podem ter grande precisão: idade, o valor das vendas de uma empresa, a estatura dos alunos
de uma série, a renda familiar; extensão da área plantada (em m2 ) , peso, etc.

*Variáveis qualitativas: refere-se às observações não-numéricas e são classificados em nominais e ordinais.


*variáveis nominais. Essas variáveis não têm ordenamento nem hierarquia. Por exemplo, religião,
sexo, raça, cor, esporte preferido, cidade de procedência.
*variáveis ordinais. Essas variáveis são equivalentes aos nominais, porém incluindo uma ordem,
uma hierarquia. Por exemplo, nível de instrução, classe social, semestre de reprovação.

1.4.4 População e amostra


O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e a
análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa. É sobre os dados
da amostra que se desenvolvem os estudos, visando a fazer inferências sobre a população.
População: conjunto de elementos que formam o universo de nosso estudo que são passíveis de ser
observados, sob as mesmas condições.
Amostra: parte dos elementos de uma população.
Num processo de inspeção da qualidade, a população pode ser considerada como o conjunto de todos
os itens que saem da linha de produção; numa pesquisa de mercado, a população é o conjunto de possíveis
consumidores; e assim por diante.
Devemos ter presente que nem sempre o senso oferecerá melhores resultados do que uma amostra.
Uma amostra representativa tem as mesmas características da população de onde foi retirada, é mais rápida
de ser aplicada, concluída, de se obter e utilizar os resultados, além de ter custo menor. Os erros de uma
Professora Eliane Maria Cocco
amostragem podem ser minimizados aplicando técnicas e estabelecendo resultados com estimativas de erro,
por exemplo, um intervalo de confiança.
Podemos atestar confiança na estimativa de uma amostra se os elementos da amostra forem
escolhidos assegurando que todos os participantes que formam a população tenham a mesma oportunidade
ou chance de serem escolhidos. A amostra de uma população retirada dessa forma é denominada amostra
aleatória de tamanho n cujas premissas são:
1-cada unidade elementar da população tem a mesma probabilidade de ser escolhida numa amostra de
tamanho n, sendo que cada unidade elementar será escolhida de forma independente das outras unidades.
2-todas as amostras extraídas possíveis de tamanho n de uma população têm a mesma probabilidade de
serem selecionadas.

1.4.5 Censo ou amostragem


A palavra censo refere-se à pesquisa de todos os elementos da população. Geralmente, realizamos
censo quando:
*a população é pequena;
*as variáveis são fáceis de ser medidas ou observadas; ou
*necessitamos de resultados exatos.
Grande parte das pesquisas científicas ou de resolução de problemas de engenharia é feita por
amostragem, ou seja, observamos apenas um subconjunto de elementos da população. A amostragem é
particularmente interessante quando:
*a população é grande ou infinita;
*as observações ou mensurações têm alto custo;
*as medidas exigem testes destrutivos;
*há necessidade de rapidez.
Em geral, o uso de amostragem levam à redução de custos e tempo. Mas a amostragem precisa ser
feita com critérios, pois pretendemos ter amostras que permitam, a partir de uma análise estatística
apropriada, obter conclusões satisfatórias sobre toda a população.

Professora Eliane Maria Cocco


As técnicas de Amostragem mais comuns são:
A)Amostragem Aleatória Simples (A.A.S.): Na A.A.S., a amostra de tamanho é selecionada ao acaso
dentre os N elementos da população amostral.
Procedimento de sorteio:
1) Um indivíduo é selecionado ao acaso dentre os N possíveis;
2) O segundo indivíduo é selecionado ao acaso dentre os (N – 1) restantes...
3) . . . e assim por diante, até que todos os n indivíduos sejam sorteados. Esse procedimento tem a
característica de ser “sem reposição”, o que significa que: cada indivíduo aparece uma única vez na
amostra.
Na A.A.S. a probabilidade de qualquer indivíduo, ou elemento, da população fazer parte da amostra é igual a
.

Como realizar o sorteio?


i) geração números aleatórios, pelo computador;
ii) tabela de números aleatórios;
iii) globos com bolinhas numeradas;
iv) qualquer outra forma aleatória de escolha que preserve a propriedade de que cada unidade amostral tenha
a mesma chance de ser selecionada.

B) Amostragem Aleatória Estratificada (A.A.E.): Quando a população é muito heterogênea, ou seja,


quando as características observadas variam muito de um indivíduo para outro, é aconselhável subdividir a
população em estratos homogêneos. A população é dividida em k estratos sendo que, uma A.A.S. é aplicada
em cada um dos deles.
Definições:
i) tamanhos dos estratos:

ii) tamanhos das amostras nos estrados:

Sabendo que o tamanho da amostra é , como alocar, ou, determinar o número de indivíduos a serem
selecionados em cada um dos estratos?
Alocação por igual: se se desconfia de que os estratos são todos de tamanhos parecidos, ou
seja, . Então pode-se fazer:
Exemplo: Se o tamanho de uma amostra for n = 56 e, o número de estratos é k = 4, então,

Alocação proporcional ao tamanho do estrato: na alocação proporcional ao tamanho, os tamanhos


das amostras devem seguir a mesma relação de proporcionalidade dos tamanhos dos estratos, ou seja,

Dessa forma, tem-se

Professora Eliane Maria Cocco


Exemplo: Considere uma amostra de tamanho n = 48 a ser selecionada de uma população dividida em 3
estratos, tais que = 40, = 80 e = 120.
Resolução: N = 40 + 80 + 120 = 240
=

=
Portanto, = 8, = 16 e = 24 é a alocação proporcional ao tamanho dos estratos. Esse resultado
significa que se deve selecionar 8 indivíduos do primeiro estrato, 16 do segundo estrato e 24 do terceiro.

C)Amostragem Sistemática: é aplicada de forma sistemática, tendo em mão um sistema de referência de


fácil acesso. Na amostragem sistemática além da facilidade de acesso ao sistema de referência, a informação
a ser coletada também é de fácil acesso.
Exemplos: Fichas de cadastro de assinantes (revistas, provedores de acesso à internet, serviço telefônico,
etc...); cadastro de funcionários; peças numa linha de produção; mudas num canteiro; etc...
Procedimento: com o sistema de referência em mãos
a) determina-se o intervalo de seleção, que é dado por

b) sorteia-se um indivíduo, ou item, dentre os R primeiros da relação;


c) a partir daí, seleciona-se os indivíduos sistematicamente a cada intervalo de tamanho R.

Exemplo: se a população tem tamanho N = 84 e deve-se selecionar uma amostra de tamanho n = 6, então,
tendo-se em mão uma relação com os 84 indivíduos da população:
Resolução: I) divide-se população em 6 seções de tamanho ;

II)seleciona-se aleatoriamente o primeiro indivíduo da amostra dentre os 14 primeiros (por exemplo, o de


número 5);
III) o segundo indivíduo a ser selecionado é o 5 + 14 = 19, ou seja, o 19º. da relação;
IV) o terceiro é o 19 + 14 = 33, ou seja, o 33º. da relação, e assim por diante.
Situações especiais: Se, não for um número exato, devemos fazer uso do arredondamento

EXEMPLOS: a) N = 68 e n = 7 => ≈ 10

b) N = 80 e n = 7 => ≈ 11

* A amostra pode ter uma unidade a mais ou a menos em função do arredondamento.

D)Amostragem de conglomerado: Chamamos de conglomerado um grupamento de elementos da


população. Por exemplo, numa população de domicílios de uma cidade, os quarteirões foram conglomerados
Professora Eliane Maria Cocco
de domicílios. Ao avaliar a qualidade das laranjas de um carregamento, as caixas de laranjas são os
conglomerados.
Esse tipo de amostragem consiste, num primeiro estágio, em selecionar conglomerados de
elementos. Num segundo estágio, ou se observam todos os elementos dos conglomerados selecionados no
primeiro estágio, ou, como é mais comum, se faz nova seleção, tomando amostras de elementos dos
conglomerados extraídos no primeiro estágio. Todas as seleções devem ser aleatórias.

Outras formas de amostragem: Em engenharia é muito comum extrair amostras através da amostragem
acidental ou a esmo. Por exemplo:
a)para avaliar a qualidade em lotes de 1 Kg de pregos, podemos examinar n pregos de cada lote,
extraídos a esmo;
b)para avaliar a qualidade em um carregamento de laranjas, podemos examinar n caixas do
carregamento, extraídas a esmo. Se a unidade observacional é a laranja, em cada caixa podemos extrair, a
esmo, m laranjas.
Em muitas situações, lidamos com populações infinitas. Nesse caso, procuramos realizar as n
observações de forma independente e sob as mesmas condições. Exemplo: para avaliar a qualidade de itens
que saem de uma linha de produção, observa-se um item a cada 15 minutos.
Quando examinamos características de um material contínuo, procuramos sortear - ou escolher a
esmo - as posições em que serão coletadas as amostras. É o caso de se examinar um carregamento de argila
que chega em uma fábrica de cerâmicas.

Determinação do tamanho da amostra: A determinação do tamanho da amostra é, talvez, o grande dilema


dos pesquisadores, pois deve levar em conta um erro tolerável e a probabilidade de se cometer tal erro. O
cálculo do tamanho da amostra será discutido mais adiante. Porém é importante saber que um fator de
determinação do tamanho da amostra é a variabilidade da população em termos da variável em estudo. Por
exemplo, uma amostra de sangue pode ser pequena, pois o sangue é razoavelmente homogêneo em nosso
corpo. Por outro lado, populações com variâncias grandes exigem amostras maiores.

1.4.6 Parâmetro: valor numérico (usualmente desconhecido) que caracteriza uma população (por exemplo, a
média populacional e o desvio-padrão populacional são parâmetros).

1.4.7 Estimativa: valor calculado a partir dos dados obtidos pela amostra para se estimar o valor
desconhecido do parâmetro. Exemplo: média amostral, proporção amostral, variância amostral, etc...

1.4.8 O Erro Amostral O erro amostral é definido como sendo a diferença entre a estimativa obtida para um
parâmetro e o seu verdadeiro valor. É decorrente da variabilidade natural das unidades amostrais (é
aleatório).

Professora Eliane Maria Cocco


Como medir o erro?
A amostra é retirada sem erro?
O erro decorrente da coleta dos dados é chamado de erro não amostral.
Os planejamentos e a execução da pesquisa devem ser feitos com muita cautela para evitar os erros não
amostrais.

EXERCÍCIOS
1)Identifique cada uma das afirmações abaixo como característica de Estatística Descritiva (I) ou Estatística
Inferencial (II):
( ) Ramo que trata da organização, do resumo e da apresentação de dados.
( ) Ramo que trata de tirar conclusões sobre uma população a partir de uma amostra.
( ) É a parte da estatística que, baseando-se em resultados obtidos da análise de uma amostra da
população, procura inferir, induzir ou estimar as leis de comportamento da população da qual a amostra foi
retirada.
( ) Trata da coleta, organização e descrição dos dados
( ) Trata da análise e interpretação dos dados

2)”Hipertensão é doença crônica mais apontada por médicos, segundo estudo: Percentual de mulheres com
doenças crônicas é superior ao de homens. A doença crônica mais apontada por médicos ou profissionais de
saúde, em 2008, foi a hipertensão. O dado faz parte do suplemento de Saúde da Pesquisa Nacional por
Amostra de Domicílios (Pnad) 2008, divulgado nesta quarta-feira (31) pelo Instituto Brasileiro de Geografia
e Estatística (IBGE)". A variável em questão (pressão arterial) é uma variável:
( ) Quantitativa discreta ( ) Qualitativa ( ) Quantitativa contínua
( ) Qualitativa discreta ( ) Qualitativa continua

3)Ao nascerem os bebês são pesados e medidos, para saber se estão dentro das tabelas de peso e altura
esperados. Estas duas variáveis são:
( ) ambas discretas. ( ) contínua e discreta, respectivamente
( ) discreta e contínua, respectivamente. ( ) qualitativas.
( ) ambas contínuas.

4)A utilização dos dados estatísticos tem sua origem na antiga Babilônia, no Egito e no Império Romano,
com dados relativos a assuntos de Estado, tais como nascimentos e mortes. Na Idade Antiga, vários povos já
registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e
social, distribuíam equitativamente terras ao povo, cobravam impostos. Com relação a conceitos básicos de
Estatística podemos afirmar que:
(I) Amostra é o conjunto de todos os resultados, respostas, medidas ou contagens que são de interesse.
(II) População é o conjunto da totalidade dos indivíduos sobre o qual se faz uma inferência.
(III) Amostragem é o processo de escolha da população, o conjunto de técnicas utilizadas para a seleção de
uma população.
( ) Somente a afirmativa (I) é verdadeira.
( ) Somente a afirmativa (II) é verdadeira.
Professora Eliane Maria Cocco
( ) Todas as afirmativas são verdadeiras.
( ) Somente as afirmativas (II) e (III) são verdadeiras.
( ) Somente a afirmativa (III) é verdadeira.

5)A parcela da população convenientemente escolhida para representá-la é chamada de:


( ) variável ( ) amostra
( ) nada podemos afirmar ( ) dados brutos ( ) rol

6)Economia de combustível. Fornecemos a seguir parte de um conjunto de dados que descreve a economia
de combustível (em milhas por galões) para modelos de automóveis de 2002:
M M
Tipo de Número de
Marca e modelo Tipo de veículo MPG na MPG na
transmissão cilindros
cidade estrada
2
Acura NRX Dois assentos Automático 6 17
24
3
Audi A4 Compacto Manual 4 22
31
2
Buick Century Tamanho médio Automático 6 20
29
Caminhonete picape 2
Dodge Ram 1500 Automático 8 15
padrão 20

a)Quais são os indivíduos nesse conjunto de dados?


b)Para cada indivíduo, quais as variáveis fornecidas? Quais delas são categóricas(qualitativa) e quais são
quantitativas?

7)Um estudo médico. Dados de um estudo médico contêm valores de muitas variáveis para cada uma das
pessoas objeto do estudo. Quais das seguintes variáveis são qualitativas e quais são quantitativas?
a) Gênero (feminino ou masculino)
b) Idade (anos)
c) Raça (asiática, negra, branca ou outra)
d) Fumante (sim ou não)
e) Pressão arterial sistólica (milímetros de mercúrio)
f) Nível de cálcio no sangue ( microgramas por mililitro)
g) Cor dos olhos dos alunos
h) Número de defeitos de aparelho de TV
i) Comprimento dos pregos produzidos por uma empresa.
j) O ponto obtido em cada jogada do dado.

8) Uma operadora telefônica pretende saber a opinião de seus assinantes comerciais sobre seus serviços na
cidade de Vargem Alegre. Supondo que há 25037 assinantes comerciais, e a amostra precisa ter no mínimo
800 elementos. Mostre como seria organizada uma amostragem sistemática para selecionar os respondentes

9) Identifique o tipo de amostragem utilizado em cada caso.


a) Ao escalar uma comissão para atuar em determinado projeto, uma empresa decidiu selecionar
aleatoriamente 4 pessoas brancas, 3 pardas e 4 negras.
Professora Eliane Maria Cocco
b)Uma professora escreve o nome de todos os seus alunos em pedaços de papel e coloca em uma caixa.
Depois de misturá-los, sorteia 10 nomes.

c) Um administrador de uma sala de cinema faz uma pesquisa com as pessoas que estão na fila de espera
para comprar ingresso, entrevistando uma pessoa a cada 10 presentes na fila.

10) Avalie, para os casos a seguir, qual é a população e, nesta população, qual a amostra selecionada:
a) Para avaliar a eficácia de uma campanha de vacinação em crianças com idade entre 1 e 2 anos, 192 mães
com filhos nesta idade foram pesquisadas sobre a última vez que vacinaram seus filhos.

b) Para verificar a audiência de um programa do canal 32, alguns telespectadores foram entrevistados com
relação ao canal em que estavam sintonizados no horário do programa.

c) A fim de avaliar a intenção de voto para a eleição presidencial de 2010 no Brasil, 4.205 eleitores foram
entrevistados em todas as unidades da federação.

11)A gigante dos computadores IBM tem 329.373 empregados e 637.133 acionistas. Um vice-presidente
planeja realizar uma sondagem para estudar os números de ações possuídas por acionistas individuais.
a)Os números de ações de acionistas individuais são dados discretos ou contínuos?

b)Se a sondagem é realizada telefonando-se para 20 acionistas selecionados aleatoriamente em cada um dos
50 estados, que tipo de amostragem está sendo usada?

c)caso se obtenha uma amostra de 1000 acionistas, e se calcula o número médio de ações para essa amostra,
o resultado é uma estatística ou um parâmetro?

12)Verdadeiro ou falso:
a) A coleção de todos os carros registrados nos Estados Unidos é um exemplo de população.

b)Os pesos de motociclistas são dados discretos.

c)A seleção de cada 5º nome em uma lista resulta em uma aleatória simples.

d)A idade média de pessoas que respondem a uma sondagem particular é um exemplo de parâmetro.

e)As cores dos olhos são um exemplo de dados ordinais.

f)As classificações de filmes em G, PG-13, e R são dados quantitativos .

13) Arredonde para centésimos:


a)2,456 b) 3,33500 c)1,043001
d) 2,037 e)4,4500

Professora Eliane Maria Cocco


14) Arredonde para milésimos:
a)0,12345 b)2,3451 c) 7,8036
d) 0,0055 e)1,235001

15)Arredonde para um número inteiro:


a)7,8 b)5,5 c)1001,456
d)6,5 e)7,6 f) 8,0599

16) Em uma escola existem 250 alunos, sendo 35 no 1º ano, 32 no 2º, 30 no 3º, 28 no 4º, 35 no 5º, 32
No 6º , 31 no 7º e 27 no 8º ano. Obtenha uma amostra de 40 alunos e preencha o seguinte quadro.
Anos População Cálculo proporcional Amostra
1º 35 6








TOTAL 250 - 40

17) Uma cidade x apresenta o seguinte quadro relativo às suas escolas de Ensino Fundamental:

NÚMERO DE ESTUDANTES
ESCOLAS
Masculino Feminino
A 80 90

B 100 120

C 110 92

D 125 228

E 150 130

F 305 290

Total 870 950

Obtenha uma amostra proporcional estratificada de 120 estudantes.

Professora Eliane Maria Cocco


2 SÉRIES ESTATÍSTICAS

Uma vez coletados os dados, é conveniente reunir os valores em tabelas e/ou em gráficos para facilitar a
compreensão do estudo.

2.1 APRESENTAÇÃO TABULAR


Quando colocamos os dados em uma matriz, as linhas correspondem ao que se observou em cada
elemento pesquisado, enquanto as colunas correspondem às características (variáveis) levantadas. Por
exemplo, na atualização das páginas de um site, podemos querer avaliar o perfil dos indivíduos que acessam
esse site. Então, precisamos levantar, junto a cada indivíduo, algumas de suas características, tais como o
sexo, a idade, o nível de instrução e provedor utilizado. Ao realizar a pesquisa, podemos produzir uma matriz
de dados, da seguinte forma:

No controle de qualidade de uma linha de produção de azulejos, podemos observar algumas


características em azulejos extraídos periodicamente da fase final da linha de produção. Essas características
podem ser: empeno, desvio máximo da dimensão ideal, variações na tonalidade da cor, etc. Considerando
que a última variável produza uma classificação do tipo A, B e C, a matriz de dados pode ser apresentada
como:

Na descrição das variáveis envolvidas na pesquisa, devemos incluir a escala (ou unidade) em que são
mensuradas as variáveis quantitativas, e as categorias (possíveis respostas) das variáveis qualitativas. Sempre
que uma característica puder ser adequadamente medida sob forma quantitativa, é melhor usarmos esse tipo
de mensuração, porque as medidas quantitativas são, em geral, mais informativas do que as qualitativas. Por
exemplo, dizer que o empeno é 8,2 mm é mais informativo do que dizer que o empeno é grande.
A apresentação de dados estatísticos na forma tabular consiste na reunião ou grupamento dos dados
em tabelas ou quadros com a finalidade de apresentá-los de modo ordenado, simples e de fácil percepção e
com economia de espaço.
 Componentes Básicos
Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela, respondendo às
perguntas: O quê? Onde? Quando?
Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.

Professora Eliane Maria Cocco


Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas.
Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus
cruzamentos com as colunas.
Casa ou Célula: Espaço destinado a um só número.
Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as notas ou chamadas
que são esclarecimentos gerais ou particulares relativos aos dados.
Exemplo de tabela
Tabela 2.1 - Número de médicos na população, países selecionados, 1984
País Habitantes por Médico
Chile 1.230
Brasil 1080
França 320
EUA 470
Argentina 370
Fonte: Arango, Héctor G.
Nota: dados do relatório sobre o desenvolvimento mundial 1990, Banco Mundial, FGV.

2.2 DADOS BRUTOS E ROL


Dados brutos: Como o nome já indica, são os dados iniciais obtidos a partir de um levantamento de
estatística. Estes dados, por não terem grande organização, não fornecem muita informação sobre o objeto de
estudo.
Rol: São os dados brutos ordenados em geral, do menor para o maior.

Exemplo: Peso (kg) de 14 blocos de concreto


Dados brutos - 74 58 69 80 74 95 56 74 76 81 60 57 64 62

Em forma de rol - 56 57 58 60 62 64 69 74 74 74 76 80 81 95

2.3 TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS


A distribuição de frequências consiste na organização dos dados de acordo com as
ocorrências dos diferentes resultados observados.
Por exemplo, ao observar a variável sexo, num conjunto de indivíduos, estaremos classificando cada
indivíduo ou na categoria masculino, ou na categoria feminino. A contagem de quantos elementos existem
em cada categoria forma uma distribuição de frequências dos dados dessa variável, que pode ser
representada em uma tabela ou em um gráfico. As frequências podem ser apresentadas de forma absoluta
(número de homens e número de mulheres) ou de forma relativa ( a porcentagem de homens e a porcentagem
de mulheres) ou, ainda, de ambas as formas.
A frequência absoluta ou apenas frequência, de um valor é o número de vezes que uma
determinada variável assume esse valor. Ao conjunto das frequências dos diferentes valores da variável dá-se
o nome de distribuição da frequência (ou apenas distribuição).

Professora Eliane Maria Cocco


Exemplo: Numa pesquisa feita para detectar o número de filhos de empregados de uma multinacional, foram
encontrados os seguintes valores: 1 4 2 5 3 2 0 3 2 1 5 4 2 5 0 3 2 4 2 3 2 3 2 1 4 2 1 3 4 2
Solução:
*Rol (dados em ordem crescente): 0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 5 5 5
*Tabela de Distribuição de Frequências:
Tabela 2.2 - Número de filhos de uma multinacional
Número de filhos (X)
0 2
1 4
2 10
3 6
4 5
5 3
Total 30
Fonte: Dados fictícios

A frequência relativa (fri) é a percentagem relativa à frequência. Para obter a frequência relativa de
categoria, divide-se a frequência dessa categoria pela soma das frequências. O resultado, multiplicado por
100, é uma porcentagem. O total da coluna é escrito entre dois traços horizontais.
Tabela 2.3 - Número de filhos de uma multinacional
Número de filhos (X)
0 2 6,7
1 4 13,3
2 10 33,3
3 6 20,0
4 5 16,7
5 3 10,0
Total 30 100
Fonte: Dados fictícios

A frequência acumulada de um valor, é o numero de vezes que uma variável assume um valor inferior
ou igual a esse valor. Neste caso, deve-se somar em uma coluna á parte a frequência de cada classe com a
das anteriores.
Tabela 2.4 - Número de filhos de uma multinacional
Número de filhos (X)
0 2 6,7 2
1 4 13,3 6
2 10 33,3 16
3 6 20 22
4 5 16,7 27
5 3 10 30
Total 30 100 -
Fonte: Dados fictícios
Professora Eliane Maria Cocco
A frequência relativa acumulada é a percentagem relativa à frequência acumulada. Da mesma
forma, podem ser acumuladas as frequências relativas, com a finalidade de se determinar o percentual de
dados existentes até certa classe. No caso da última classe, assume, obviamente, o valor 1 ou 100%.
Tabela 2.5 - Número de filhos de uma multinacional
Número de filhos (X)

0 2 6,7 2 6,7
1 4 13,3 6 20
2 10 33,3 16 53,3
3 6 20 22 73,3
4 5 16,7 27 90
5 3 10 30 100
Total 30 100 - -
Fonte: Dados fictícios

2.4 DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSE


Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento dessa
variável, analisando a ocorrência de suas possíveis realizações. Quando tivermos uma quantidade muito
grande de elementos que não estejam numericamente organizados, fica difícil averiguarmos em torno de qual
valor tendem a se concentrar os demais, qual o menor, qual o maior, quantos estão abaixo ou acima da
média. Em geral, 5 a 20 intervalos são satisfatórios, e o número de intervalos deve crescer com n.
EX: Numa pesquisa referente às alturas de 40 alunos de uma classe A, obtiveram-se os seguintes dados.
166 160 161 150 162 160 165 167 164 160

162 161 168 163 156 173 160 155 164 168

155 152 163 160 155 155 169 151 170 164

154 161 156 172 153 157 156 158 158 161

Para facilitar ao analista o seu estudo é conveniente que ele agrupe os valores da variável em
intervalos que em Estatística, chamamos de intervalos de classes. Nessa tabela é conveniente, mas não
obrigatório, estabelecer intervalos iguais para todas as classes.
Tabela 2.6 - Alturas de 40 alunos de uma classe A
Classes fi
150Ⱶ154 4
154Ⱶ158 9
158Ⱶ162 11
162Ⱶ166 8
166Ⱶ170 5
170 Ⱶ174 3
Total 40

Professora Eliane Maria Cocco


Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas perdemos em
pormenores. No entanto com a construção dessa nova tabela é preciso realçar o que há de essencial nos
dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística
tem por finalidade específica analisar o conjunto de valores, desinteressando por casos isolados.
Os seguintes componentes são utilizados apenas em distribuição de frequências em classes:
a)Classe: classes de frequência ou, simplesmente, classes são intervalos de variação da variável.
As classes são representadas por i, sendo i = 1, 2, 3, ..., k (onde k a é o número total de classes da
distribuição). No exemplo a distribuição é formada de seis classes (k=6) e a segunda classe (i=2) é o
intervalo154Ⱶ158
b)Limites de classe: Os limites de classe são os extremos de cada classe.
O menor número é o limite inferior da classe ( e o maior número é o limite superior da classe ( ).

Por exemplo, na segunda classe, temos: e


É importante sempre deixar claro se os dados com valores iguais aos dos extremos de classes estão,
ou não, incluídos na classe.
Assim, no intervalos 154Ⱶ158, deixamos claro que o 154 está incluído e o 158 não.
c)Amplitude de um intervalo de classe: é a medida do intervalo que define a classe. Ela é obtida pela
diferença entre os limites superior e inferior dessa classe e é indicada por . Assim
No exemplo
d)Amplitude Total (AT): é a diferença entre o limite superior da última classe ( ) e o limite inferior da

primeira classe ( ).

No exemplo 174 - 150 = 24


e)Amplitude amostral (AA): é a diferença entre o valor máximo e o valor mínimo da amostra

No exemplo AA = 173 - 150 = 23 cm


OBS: a amplitude total não coincide com a amplitude amostral.
f)Ponto médio de uma classe: é o ponto que divide o intervalo de classe em duas partes iguais.
Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos limites da classe (média
aritmética)

No exemplo

g)Frequência simples ou absoluta: é o número de observações correspondentes a essa classe ou a esse


valor. A frequência simples é representada por (leitura: frequência da classe i)

No exemplo

A soma de todas as frequências é representada pelo símbolo do somatório


No exemplo
h)Número de classes (k): corresponde à quantidade de classes, nas quais serão agrupados os elementos do
rol.
Professora Eliane Maria Cocco
Podemos, também utilizar a fórmula de Sturges:

em que k = número de classes;


n = número de elementos do rol (número total de dados).
No exemplo k
i)Amplitude do intervalo: a amplitude é encontrada dividindo a amplitude total pelo número de classes.
No exemplo

Resumindo as etapas para a construção de uma distribuição de frequências por classes


a) Ordenar os dados brutos em forma de rol (ordem crescente)
b) Calcular a amplitude da amostra:
c) Calcular o número de classes e arredondar o valor final para um número inteiro utilizando a regra e
arredondamento: k = 1 + (3,33333.....) • log(n)
d) Calcular o intervalo entre classes:

e) A 1º coluna será a das classes. O menor número dos dados em rol será o limite inferior da primeira classe,
a partir do qual todas as outras classes serão definidas a partir deste número, somando ele ao intervalo entre
classes.

APLICANDO OS CONHECIMENTOS

Exemplo 1 : Os dados a seguir são medidas de força em libras por polegada quadrada de 100 garrafas de
vidro de 1 litro de refrigerante, descartáveis. Essas medidas foram obtidas testando-se cada garrafa até
ocorrer sua quebra. Os dados foram registrados na ordem em que as garrafas foram testadas.
Força de Ruptura em Libras por Polegada Quadrada para 100 Garrafas Descartáveis de 1 Litro de
Refrigerante
265 197 346 280 265 200 221 265 261 278
205 286 317 242 254 235 176 262 248 250
263 274 242 260 281 246 248 271 260 265
307 243 258 321 294 328 263 245 274 270
220 231 276 228 223 296 231 301 337 298
268 267 300 250 260 276 334 280 250 257
260 281 208 299 308 264 280 274 278 210
234 265 187 258 235 269 265 253 254 280
299 214 264 267 283 235 272 287 274 269
215 318 271 293 277 290 283 258 275 251
SOLUÇÃO
1ºPASSO - ordenar no rol
2º PASSO - calcular a amplitude da amostra (AA) = X máx - x mín = 346-176= 170
3º PASSO - Calcular o número de classes k= 1 + (3,33333.....) • log(n)=7,667
4ºPASSO - Calcular o intervalo entre classes h = AA / k = 170/8=21,25

Professora Eliane Maria Cocco


Como o intervalo é um número decimal e estamos trabalhando com números inteiros, vamos
arredondar para 22 usando 8 classes, assim, iniciando os intervalos de classe do limite inferior (176), o
limite superior (352) será muito distante do 346 o que poderá dificultar algumas análises.
Dessa forma podemos utilizar para o limite inferior 170 e para o limite superior 350. Assim a
Amplitude Total (AT) vai ser 180 e podemos usar o intervalo de classe (h) = 20 perfazendo um total de 9
classes (k=9). Esses valores nos dão uma distribuição de frequências razoável para o estudo.
Agora é possível construirmos a tabela de distribuição de frequências. No exemplo, utilizamos na
primeira coluna, os 9 intervalos de classe, na segunda coluna a frequência simples (fi), na terceira coluna a
frequência relativa (fri), na quarta coluna a Frequência acumulada (Fi) e na última coluna a Frequência
relativa acumulada (Fri).
Tabela 2.7 - Distribuição de Frequência para os Dados da Força de Ruptura da tabela anterior
Força de Frequência Frequência Frequência Frequência relativa
ruptura relativa acumulada acumulada

170 Ⱶ 190 2 0,02 2 0,02


190 Ⱶ 210 4 0,04 6 0,06
210 Ⱶ 230 7 0,07 13 0,13
230 Ⱶ 250 13 0,13 26 0,26
250 Ⱶ 270 32 0,32 58 0,58
270 Ⱶ 290 24 0,24 82 0,82
290 Ⱶ 310 11 0,11 93 0,93
310 Ⱶ 330 4 0,04 97 0,97
330 Ⱶ 350 3 0,03 100 1,00
100 1,00

Exemplo 2: As notas de 50 alunos de uma turma de Engenharia foram:


1 2 3 4 5 6 6 7 7 8
2 3 3 4 5 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
2 3 4 5 5 6 7 7 8 9

Preencha a tabela de distribuição de frequência:


Tabela 2.8 - distribuição de frequência das notas de uma turma de Engenharia
Notas fi fri Fi Fri

Total

a)Qual é a amplitude amostral?


b)Qual a amplitude de distribuição?
Professora Eliane Maria Cocco
c)Qual é o número de classes da distribuição?
d)Qual o limite inferior da quarta classe?
e)Qual o limite superior da classe de ordem 2?
f)Qual a amplitude do segundo intervalo de classe?
g)Quantos por cento dos alunos tiveram nota 8 ou acima de 8?
h)Quantos alunos tiraram nota menor que 6?
i)Qual o índice em % de alunos que obtiveram nota menor que 6?
j)Quantos alunos obtiveram nota maior ou igual a 6?

1) ROLhttps://www.youtube.com/watch?v=TKkPrr0a6PE
AJUDA 2) TABELA DE FREQUÊNCIA ABSOLUTA E RELATIVA
https://www.youtube.com/watch?v=BFjROd7DgoQ
COM
3) TABELA DE FREQUÊNCIA ABSOLUTA, RELATIVA, ACUMULADA E
EXCEL? RELATIVA ACUMULUDA https://www.youtube.com/watch?v=Q1aP-NOV53k
(https://www.youtube.com/watch?v=aCug3Jzx3Fw )
(https://www.youtube.com/watch?v=-w0ww9nJouE )
(https://www.youtube.com/watch?v=t2N0lhZj5nA )

EXERCÍCIOS
1) Considere a série Estatística:
SÉRIES ALUNOS %
1ª 546
2ª 328
3ª 280
4ª 120
Total 1.274
Complete-a, determinando as porcentagens com uma casa decimal, arredondando se necessário.

2)Uma escola apresentava, no final do ano, o seguinte quadro:


MATRÍCULAS
SÉRIES
Março Novembro
1ª 480 475
2ª 458 456
3ª 436 430
4ª 420 420
Total 1794 1781
a)Calcule a taxa de evasão por série.
b)Calcule a taxa de evasão da escola.

3) Complete a distribuição abaixo:


X

1 2 2
2 3 5
3 4

Professora Eliane Maria Cocco


4 5
5 6
Total - -

4)Um dado foi jogado 20 vezes, sendo obtidos os seguintes pontos:


1, 5, 6, 5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2
a)Organize os dados em um rol
b)Elabore quadro com a distribuição de frequência absolutas, frequências absolutas acumuladas, frequência
relativas e frequência relativas acumuladas.

5)Uma instituição financeira tem três operadores trabalhando diariamente com opções de ações negociadas na
Bolsa de Valores. A tabela seguinte registra uma amostragem aleatória de tamanho vinte e seis do número diário
de operações fechadas pelo Operador B nos últimos dois anos Construir uma tabela sem classes, com as
frequências simples, acumuladas, relativas. Faça uma análise dos dados obtidos.
14 12 13 11 12 13 16 14 14 15 17 14 11

13 14 15 13 12 14 13 14 13 15 16 12 12

6)O quadro seguinte representa as massas de um conjunto de estudantes. Construa uma organizando os dados
em 6 intervalos de classes, calcule a média de cada classe, calcule a frequência, frequência relativa, frequência
acumulada, frequência relativa acumulada e construa o histograma.
41 41 42 44 46 50 51 54 58 60

41 42 43 45 46 50 52 57 58 60

41 42 43 45 46 50 52 57 58 60

41 42 44 46 50 51 54 58 60 62

7)Considerando as notas de um teste de inteligência aplicado a 55 alunos:


61 64 64 66 66 70 70 73 73 73 102
73 74 75 76 76 76 78 78 78 78 103
79 80 80 81 82 82 83 84 84 85 103
85 85 85 86 86 86 86 86 86 87 103
87 89 90 90 92 92 93 95 98 101 103

Forme uma tabela de distribuição de frequências com intervalos de amplitude 5.


a) Qual a porcentagem de alunos que obtiveram nota inferior a 76?
b) Qual a porcentagem de alunos que obtiveram nota igual ou superior a 94?

8) Construa de uma tabela de Distribuição de Frequências com CLASSES para os dados referentes ao Peso
(kg) de 14 blocos de concreto .
56 57 58 60 62 64 69 74 74 74 76 80 81 95

9) Observando a tabela, que empresa apresentou melhor desempenho, A ou B? Justifique.

Professora Eliane Maria Cocco


10) Considere a tabela bivariável

a) Quantos milionários existiam em 1972?


b) Que percentagem desses milionários eram senhoras?
c) Que percentagem dos milionários tinham menos de 50 anos?
d) Que percentagem dos milionários do sexo feminino, tinham 65 ou mais anos?
e) Que percentagem dos milionários com menos de 50 anos, eram do sexo masculino?

11) Salário de atletas. Na tabela são apresentados um conjunto de dados descrevendo os jogadores da liga
principal de beisebol, no dia de abertura da temporada de 2002.
Jogadores Time Posição Idade Salário

Sosa, Jorge Devil Rays Lançador 24 200.000

Sosa, Sammy Cubs Campo externo 33 15.000.000

Speier, justin Rockies Lançador 28 310.000

Spivey, Junior Diamondbacks Base 27 215.000

a)Quais indivíduos são descritos nesse conjunto de dados?


b)Além dos nomes dos jogadores, quantas variáveis o conjunto de dados contém? Quais destas variáveis são
categóricas e quais são quantitativas?
c)Com base nos dados da tabela, quais são as unidades de medida para cada uma das variáveis quantitativas?

Professora Eliane Maria Cocco


3 GRÁFICOS ESTATÍSTICOS

O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de
produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo,
já que os gráficos falam mais rápido à compreensão que as séries.
A escolha apropriada do gráfico depende da natureza da variável. Os valores de uma variável
categórica são rótulos para as categorias, tais como “masculino” e “feminino”. A distribuição de uma
variável categórica lista as categorias e fornece ou a contagem ou a porcentagem dos indivíduos que caem
em cada categoria.
Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala (crescem
da esquerda para a direita e de baixo para cima). As legendas devem ser a direita ou abaixo do gráfico. A
seguir vemos os principais tipos de gráficos:

3.1Tipos de gráficos
A)Gráfico de setores: Também conhecido como Gráfico de Pizza, este gráfico é usado quando cada valor
representa uma parte de um todo. O gráfico de setores também é usado para apresentar variáveis qualitativas. É
particularmente útil quando o número de categorias não é grande e as categorias não obedecem a alguma ordem
específica. É, então, usado um círculo de raio qualquer, com a área ou ângulo total sendo proporcional ao total
(100%) da série de dados a representar e a área ou ângulo de cada setor circular sendo proporcional a cada dado da
série.
Tabela 2.9 - Distribuição de frequências do provedor usado pelo visitante do site

Provedor Frequência Porcentagem


A 10 25,0
B 17 42,5
C 7 17,5
D 6 15,0
Total 40 100,0

Gráfico1 - Distribuição de frequências do provedor usado pelo visitante do site

QUER SABER MAIS? : https://www.youtube.com/watch?v=pTNtOXO3Qfo

B)Gráfico em barras: As variações quantitativas da tabela são representadas por colunas dispostas
horizontalmente. É usado para representar qualquer tipo de série.

Professora Eliane Maria Cocco


Gráfico2 - Distribuição de frequências do provedor usado pelo visitante do site

C)Gráfico em colunas: As variações quantitativas da tabela são representadas por colunas dispostas
verticalmente. É usado para representar qualquer tipo de série.
Gráfico3 - Distribuição de frequências do provedor usado pelo visitante do site

QUER SABER MAIS?? https://www.youtube.com/watch?v=kE85Gi_0NLk

D)Gráfico em linha: é um dos mais importantes gráficos; representa observações feitas ao longo do tempo.
Tais conjuntos de dados constituem as chamadas séries históricas ou temporais. O gráfico de linhas permite
construir os polígonos de frequência, que em estatística servem para mostrar as frequências absolutas
(relativas) acumuladas. Entretanto, são de extrema utilidade também quando se quer mostrar a evolução
temporal de alguma variável, pois permitem visualizar claramente as diferenças entre um estágio e os
estágios subsequentes. Às vezes as linhas retas que unem as coordenadas dos pontos são substituídas por
curvas ou então por linhas retas ajustadas de acordo com algum critério de proximidade.
Gráfico 4 - Consumo de água de uma residência em um ano

QUER SABER MAIS? https://www.youtube.com/watch?v=ArjZJXEEa9o


Professora Eliane Maria Cocco
E) Dados numéricos: Histograma
Quando tivermos uma situação em que foi realizada uma distribuição de frequências por classes,
podemos apresentar a distribuição de forma gráfica. Tal apresentação se chama histograma.

Tabela 2.10 - Força de Ruptura em Libras por Polegada Quadrada para 100 Garrafas Descartáveis de 1 Litro
de Refrigerante
Intervalo de classe Frequência Frequência Frequência relativa
(psi) relativa acumulada
2 0,02 0,02
4 0,04 0,06
7 0,07 0,13
13 0,13 0,26
32 0,32 0,58
24 0,24 0,82
11 0,11 0,93
4 0,04 0,97
3 0,03 1,00
100 1,00
Para se desenhar um histograma usa-se um eixo horizontal para representar a escala de medida e
traçar as fronteiras dos intervalos de classe. O eixo vertical representa a escala da frequência (ou frequência
relativa). Esse tipo de gráfico é mais utilizado quando os intervalos de classes são de largura igual. Se os
intervalos de classe são de igual largura, então as alturas dos retângulos são proporcionais às frequências.

Gráfico 5 - Força de Ruptura em Libras por Polegada Quadrada para 100 Garrafas Descartáveis de 1 Litro
de Refrigerante

O histograma fornece uma impressão visual da forma da distribuição das medidas, bem como
informação sobre o centro e a dispersão dos dados. O histograma é uma representação gráfica muito útil e
pode dar ao tomador de decisão uma boa compreensão dos dados, e é muito útil na apresentação da forma,
localização e variabilidade dos dados. No entanto, o histograma não permite a identificação dos pontos
individuais de dados, porque todas as observações em uma cela são indistinguíveis.

Professora Eliane Maria Cocco


F)Dados numéricos: Diagrama de Pontos e Diagrama de Dispersão
Quando estamos preocupados com uma das variáveis associadas às unidades observadas os dados
são, em geral, chamados de dados univariados, e os diagramas de pontos fornecem uma apresentação
simples, atraente, que reflete a dispersão, os extremos, o centro e as falhas ou pulos nos dados. Escalona-se
uma linha horizontal, na qual se acomoda a amplitude dos valores dos dados. Plota-se, então, cada
observação como um ponto diretamente acima dessa linha graduada e, quando várias observações têm o
mesmo valor, os pontos são simplesmente empilhados verticalmente naquele ponto da escala.
Tabela 2.11- Dados da Força de Resistência da Soldadora de Fio
Número da Força de resistência Comprimento do fio Altura do molde
observação (y) ( (
1 9,95 2 50
2 24,45 8 110
3 31,75 11 120
4 35,00 10 550
5 25,02 8 295
6 16,86 4 200
7 14,38 2 375
8 9,60 2 52
9 24,35 9 100
10 27,50 8 300
11 17,08 4 412
12 37,00 11 400
13 41,95 12 500
14 11,66 2 360
15 21,65 4 205
16 17,89 4 400
17 69,00 20 600
18 10,30 1 585
19 34,93 10 540
20 46,59 15 250
21 44,88 15 290
22 54,12 16 510
23 56,63 17 590
24 22,13 6 100
25 21,15 5 400

Professora Eliane Maria Cocco


Quando desejamos apresentar conjuntamente resultados para duas variáveis, o equivalente bivariado
do gráfico de pontos se chama diagrama de dispersão. Construímos um sistema retangular de coordenadas,
associando o eixo horizontal a uma das variáveis e o eixo vertical à outra. Plota-se, então, cada observação
como um ponto nesse plano.

Enquanto os diagramas de dispersão mostram a região do plano onde se localizam os pontos dos
dados, bem como a densidade de dados associada a essa região, eles sugerem, também, uma possível
associação entre variáveis. Finalmente, observamos que a utilidade desses gráficos não se limita a pequenos
conjuntos de dados.
Para aumentar a dimensão e apresentar graficamente o padrão de dados conjuntos para três variáveis,
um diagrama de dispersão tridimensional pode ser empregado.

Professora Eliane Maria Cocco


G)O Diagrama Ramo-e-Folhas
Para construir um diagrama ramo-e-folha dividimos cada número encontrado em duas partes: um
ramo, que consiste em um ou mais dígitos líderes, e uma folha, que consiste nos dígitos restantes. Por
exemplo: O valor 76 pode ser dividido no ramo 7 e na folha 6. Em geral, devemos escolher relativamente
poucos ramos em comparação com o número de observações. Uma vez escolhido um conjunto de ramos eles
são listados ao longo da margem esquerda do diagrama e, ao lado de cada ramo, são listadas todas as folhas
que correspondem aos valores dos dados observados na ordem em que se encontram no conjunto de dados.
Ramo Folha Frequência
17 6 1
18 7 1
19 7 1
20 0,5,8 3
21 0,4,5 3
22 1,0,8,3 4
23 5,1,1,4,5,5 6
24 2,8,2,6,8,3,5 7
25 4,0,8,0,0,7,8,3,4,8,1 11
26 5,5,5,1,2,3,0,0,5,3,8,7,0,0,4,5,9,5,4,7,9 21
27 8,4,1,4,0,6,6,4,8,2,4,1,7,5 14
28 0,6,1,0,1,0,0,3,7,3 10
29 4,6,8,9,9,3,0 7
30 7,1,0,8 4
31 7,8 2
32 1,8 2
33 7,4 2
34 6 1
100
Diagrama ramo-e-folha para os dados da força de ruptura de garrafas

H)O gráfico de Pareto


O gráfico de Pareto é um gráfico de barras para dados de contagem. Ele exibe a frequência de cada
contagem no eixo vertical e as categorias da classificação no eixo horizontal. Organizamos, sempre, as
categorias em ordem decrescente da frequência de ocorrência; isto é, a de maior ocorrência fica à esquerda,
seguida pela segunda de maior frequência de ocorrência, e assim por diante.

Professora Eliane Maria Cocco


J)Pictograma
O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao
mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.

Exemplo:
Evolução da frota nacional de carros à álcool de 1979 à 1987

K)Ogivas
A ogiva de frequência é um gráfico de linha que representa a distribuição das frequências
acumuladas. Sendo assim, os valores de interesse são os extremos das classes e suas respectivas frequências
acumuladas.

QUER SABER MAIS? : https://www.youtube.com/watch?v=t2N0lhZj5nA

EXERCÍCIOS
1)Morte entre jovens. As principais causas de morte para jovens com idade entre 15 e 24 anos nos EUA, em
2000, foram: acidentes, 13.616; homicídios, 4.796; suicídios, 3.877; câncer, 1.668; doenças do coração, 931;
problemas congênitos, 425.
a)Construa um gráfico de colunas para apresentar os dados.
b)Que informação adicional você precisaria para construir um gráfico de setores?
c)Faça a adição dessa informação e construa um gráfico de pizza.

2) De 75.200 mortes por acidentes nos EUA, em um ano recente, 43.500 foram causadas por veículos
motorizados, 12.200 por quedas, 6.400 por envenenamento, 4.600 por afogamento, 4.200 por incêndios,
2.900 por ingestão de alimentos ou de um objeto, e 1.400 por armas de fogo (com base em dados do
Conselho de Segurança Nacional). Descrever estes dados através de um gráfico de setores.

3) A cor do seu carro. Apresentamos a seguir a classificação, segundo as cores mais populares, dos veículos
fabricados na América do Norte, para modelos do ano de 2001.

Professora Eliane Maria Cocco


Cor Percentual Cor Percentual
Prateado 21,0% Vermelho-escuro 6,9%
Branco 15,6% Marrom 5,6%
Preto 11,2% Dourado 4,5%
Azul 9,9% Vermelho-claro 4,3%
Verde 7,6% Cinza 2,0%
a)Qual é o percentual de veículos de alguma outra cor?
b)Faça um gráfico de barras para os dados de cor. Seria correto elaborar um gráfico de pizza se
adicionássemos a categoria “outras”?

4)(UFLMG) Uma pesquisa eleitoral estudou a intenção de votos nos candidatos A, B e C, obtendo os
resultados apresentados no gráfico. Coloque V(verdadeiro) ou F(falso) nas afirmativas:

( ) O candidato B pode se considerar eleito.


( ) O número de pessoas consultadas foi de 5400.
( ) O candidato B possui 30% das intenções de voto.
( ) Se o candidato C obtiver 70% dos votos dos indecisos e o
restante dos indecisos optarem pelo candidato A, o candidato C
assume a liderança.
( ) O candidato A ainda tem chances de vencer as eleições.

5) (ENEM) O número de indivíduos de certa população é


representado pelo gráfico abaixo.
Em 1975, a população tinha um tamanho aproximadamente
igual ao de:
(A) 1960
(B) 1963
(C) 1967
(D) 1970
(E) 1980

6) Os dados do gráfico foram coletados por meio da Pesquisa Nacional por Amostra de Domicílios.
Supondo-se que, no Sudeste, 14900 estudantes foram
entrevistados nessa pesquisa, quantos deles possuíam telefone
móvel celular?
a) 5513
b) 6556
c) 7450
d) 8344
e) 9536

Professora Eliane Maria Cocco


7) (ENEM) No gráfico estão representados os gols marcados
e os gols sofridos por uma equipe de futebol nas dez
primeiras partidas de um determinado campeonato.
Considerando que, neste campeonato, as equipes ganham 3
pontos para cada vitória, 1 ponto por empate e 0 ponto em
caso de derrota, a equipe em questão, ao final da décima
partida, terá acumulado um número de pontos igual a:
a) 15
b) 17
c) 18
d) 20
e) 24

ATIVIDADE NO EXCEL

TABELAS DE FREQUÊNCIA SEM CLASSE


1)Elaborar uma tabela de distribuição de frequência sem intervalos de classes para os dados da idade de um
grupo de estudantes de uma Universidade.
25 24 26 21 22 25 23 21 23 23
24 24 21 25 25 26 21 22 25 21
23 24 25 21 21 26 26 22 21 21
24 24 24 23 24 24 23 22 22 23
26 26 23 22 24 22 26 26 22 21
1º PASSO: colocar os dados em um rol
2º PASSO: contar os elementos =CONT.NÚM(intervalo)
3º PASSO: identifique os valores mínimos e máximos com os comandos
=MÍNIMO(intervalo) EX: =MÍNIMO(A1:J5)
=MÁXIMO(intervalo) Ex: =MÁXIMO(A1:J5)
4º PASSO: montar a tabela com as colunas: idade - fi - fri - Fi - Fri
IDADE fi fri Fi Fri

Total

Primeiro preencher a coluna das idades


- comando para fi
=CONT.SE(intervalo;critério). EX: =CONT.SE(A1:$J$5;E8) Obs: o critério é a idade que você quer contar
Se os dados estiverem somente numa coluna coloca-se $ para indicar que a contagem é até aquela célula. Faz
o comando na primeira célula e só arrasta para as demais
Na última linha da tabela fazer o total - comando

- comando para fri


=f1/ *100 Ex: =F8/$F$15*100
Faz o primeiro e só arrasta para os demais

-comando para Fi
1ª célula = fi1
2ª célula = Fi1 + fi2
Arrastar do segundo em diante.
Professora Eliane Maria Cocco
-comandos para Fri
1ª célula = fri1
2ª célula = Fri1 + fri2

4º PASSO: DESAFIO - Elabore mais duas colunas (Fi ↑ e Fri↑) “de baixo para cima”
5º PASSO: faça uma análise (conclusão) dos dados obtidos (pode ser através de um pequeno texto ou em itens)

CONSTRUÇÃO DE GRÁFICOS
1)COM OS DADOS DO EXERCÍCIO 1 CONSTRUA:
gráfico de colunas
gráfico de linhas
gráfico de setores
gráfico de barras
Faça uma análise se eles são gráficos apropriados para a variável quantitativa idade.

Comandos para inserir gráfico


Clicar em uma célula em branco e inserir - escolhe tipo do gráfico -
Com o botão direito - selecionar dados - entradas da legenda ( vão ser os valores do eixo vertical) - adicionar valores da
série (vai no canto direito, clica e escolhe a coluna dos valores que vão estar no eixo vertical, no caso a frequência fi) -
ok -
ainda em selecionar dados - editar - selecionar dados (vai no canto direito, clica e escolhe a coluna dos valores que vão
estar no eixo horizontal, no caso a idade)
Depois é só formatar o gráfico em layout - colocar título, título dos eixos, cor, rótulo, tirar as linhas de grade, etc.
OBS: para gráficos diferentes, mas dos mesmos dados, basta copiar o primeiro gráfico, colar e alterar o tipo de gráfico.

TABELAS DE FREQUÊNCIA COM CLASSE


1) Conhecidas as notas de alunos, elaborar uma tabela de distribuição de frequência com intervalos de
classes.
84 68 33 52 47 73 68 61 54 39
73 77 74 71 81 91 65 55 42 48
57 35 85 88 59 80 41 50 86 66
53 65 76 85 73 60 67 41 89 94
78 56 94 35 45 55 64 74 69 65
1º PASSO: colocar os dados em um rol
2º PASSO: contar os elementos =CONT.NÚM(intervalo)
3º PASSO: identifique os valores mínimos e máximos com os comandos
=MÍNIMO(intervalo) EX: =MÍNIMO(A1:J5)
=MÁXIMO(intervalo) Ex: =MÁXIMO(A1:J5)
4º PASSO: calcular o número de classe k: = =1+3,33333333*LOG10(60)
5º PASSO: calcular o intervalo entre classes h = AT / k
6º PASSO: montar a tabela com as colunas: idade - - fi - fri - Fi - Fri (obs: deixar uma linha em branco entre a linha
indicadora e a linha do início dos dados)
Obs: Uma sugestão usar limite inferior 30 com intervalos de 10 em cada classe.
COMANDOS
-na coluna idade fazer uma coluna para limite inferior e outra para limite superior da classe

Professora Eliane Maria Cocco


IDADE fi fri Fi Fri

30 40

- comando para
=(li + Li)/2 EX: =(D8+E8)/2

- comando para fi
1ª célula =CONT.SE(intervalo;"<"&critério) EX: =CONT.SE(A1:J5;"<"&F8)
2ª célula =CONT.SE(intervalo;"<"&critério da classe) - CONT.SE(intervalo;"<"&critério da classe anterior)

EX =CONT.SE($A$1:$J$5;"<"&F9)-CONT.SE($A$1:$J$5;"<"&F8)
Arrasta da 2ª célula para os demais
Ao final

- comando para fri


=f1/ *100 Ex: =F8/$F$15*100
Faz o primeiro e só arrasta para os demais

-comando para Fi
1ª célula = fi1
2ª célula = Fi1 + fi2
Arrastar do segundo em diante.

-comandos para Fri


1ª célula = fri1
2ª célula = Fri1 + fri2

Depois de preenchida a tabela, transformar em somente uma só célula os dados da idade, colocando entre os limites o

símbolo que indica que o limite inferior é incluído e o superior não. Assim 30 40

7º PASSO: faça uma análise (conclusão) dos dados obtidos (pode ser através de um pequeno texto ou em itens)

CONSTRUÇÃO DE GRÁFICOS
histograma
ogiva
distribuição de frequência

OBS: Antes de inserir os gráfico é importante, na coluna do fi, deixar uma célula em branco no começo e
uma no final.

Comandos para inserir gráfico HISTOGRAMA


Inserir - escolhe tipo do gráfico colunas -
botão direito - selecionar dados - entradas da legenda ( vão ser os valores do eixo vertical) - adicionar -
valores da série (vai no canto direito, clica e escolhe a coluna dos valores que vão estar no eixo vertical, no
caso a frequência fi) - ok -
ainda em selecionar dados - editar - selecionar dados (vai no canto direito, clica e escolhe a coluna dos
valores que vão estar no eixo horizontal, no caso as notas)
Para unir as colunas - clicar com o botão direito em cima das colunas - formatar série de dados e zerar a
largura do espaçamento.
Para formatar eixo x - clicar com o botão direito em cima do eixo - formatar eixo - alinhamento - ângulo
personalizado)
Depois é só formatar o gráfico em layout - colocar título, título dos eixos, cor, rótulo, tirar as linhas de grade,
etc.

Professora Eliane Maria Cocco


Comandos para inserir gráfico OGIVA
Copiar o HISTOGRMA e colar
botão direito - selecionar dados - entradas da legenda ( vão ser os valores do eixo vertical) -editar - valores
da série agora serão os da Frequência acumulada (Fi) - ok
ainda em selecionar dados - editar - selecionar dados (vai no canto direito, clica e escolhe a coluna dos
valores que vão estar no eixo horizontal, no caso o ponto médio das notas ( )
Depois é só formatar o gráfico em layout - colocar título, título dos eixos, cor, rótulo, tirar as linhas de grade,
etc.

Comandos para inserir gráfico DISTRIBUIÇÃO DE FREQUÊNCIA


Copiar o HISTOGRMA e colar
botão direito - selecionar dados - entradas da legenda ( vão ser os valores do eixo vertical) -editar - valores
da série (fi - devemos colocar zero na primeira célula da coluna e na última , que forma deixadas em
branco).
ainda em selecionar dados - editar - selecionar dados (vai no canto direito, clica e escolhe a coluna dos
valores que vão estar no eixo horizontal, no caso o ponto médio das notas ( )- devemos colocar zero na
primeira célula e na última)
Depois é só formatar o gráfico em layout - colocar título, título dos eixos, cor, rótulo, tirar as linhas de grade,
etc.

Professora Eliane Maria Cocco


4 MEDIDAS ESTATÍSTICAS

O estudo que fizemos sobre distribuição de frequência, até agora, permite-nos descrever, de modo
geral, os grupos de valores que uma variável pode assumir. Dessa forma podemos localizar a maior
concentração de valores de uma distribuição, isto é, se ela se localiza mais no início, no meio ou no final, ou
ainda, se há uma distribuição por igual.
Porém para ressaltar as tendências características de cada distribuição, isoladamente, ou em
confronto com outras, necessitamos introduzir conceitos que expressam através de números, que nos
permitam traduzir essas tendências. Esses conceitos são denominados elementos típicos da distribuição e são
as:
A)Medidas de posição (média, mediana, moda);
B)Medidas de variabilidade ou dispersão (amplitude, desvio padrão, variância, coeficiente de
variação);
C)Medidas de assimetria;
D)Medidas de curtose.

4.1 MEDIDAS DE POSIÇÃO


As medidas de posição mais importantes são as medidas de tendência central, que recebem tal
denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores
centrais. Dentre as medidas de tendência central, destacamos: média aritmética; mediana e moda. As
outras medidas são as separatrizes que englobam: a própria mediana; quartis e percentis.

4.1.1 Média aritmética ( )


Média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles.
Seja ( , ) uma amostra de n observações de certa variável aleatória x. A média

aritmética dessas observações é definida por

Sendo: : a média aritmética


: os valores da variável
n : o número de valores
A média é sensível a presença de dados suspeitos ou extremos (dados muito diferentes dos outros
dados da amostra).
A média é um valor único. Ela está posicionada de forma equilibrada entre os valores ordenados da
amostra (os valores da amostra se distribuem ao redor da média).

a) Média para dados não agrupados: quando os dados não estiverem agrupados, realizamos uma média
aritmética simples
EXEMPLOS: 1) Considerando 8 pessoas e que elas possuam, respectivamente R$5,00; R$ 8,00; R$ 14,00;
R$9,00; R$ 12,00; R$ 7,00; R$11,00 e R$15,00. Qual o valor médio por pessoa?

Professora Eliane Maria Cocco


2)Um gerente de supermercado quer estudar a movimentação de pessoas em seu estabelecimento, constata
que 195, 1.002, 941, 768 e 1.283 pessoas entraram no seu estabelecimento nos últimos cinco dias. Descubra
o número médio de pessoas que entraram diariamente neste estabelecimento nos últimos cinco dias.

b)Média para dados agrupados sem intervalos de classe (Média ponderada): Neste caso, as frequências
são números indicadores da intensidade de cada variável e elas funcionam como fatores de ponderação, o

que nos leva a calcular a média aritmética ponderada, dada a fórmula:

EXEMPLOS: 1)Dado o número de peças com defeitos produzidas em 27 dias em certa fábrica, calcule o
número médio de peças com defeitos por dia.
X

0 2
1 4
2 10
3 6
4 5
TOTAL 27

2)Calcule a média aritmética da distribuição:


1 2 3 4 5 6

2 4 6 8 3 1

c)Média para dados agrupados com intervalos de classe: Neste caso convencionamos que todos os
valores incluídos em um determinado intervalo de classe coincide com o seu ponto médio, e determinamos a

média ponderada por meio da fórmula:

Onde, é o ponto médio da classe


EXEMPLOS: 1) A partir dos dados da tabela, calcule a média dos nascidos vivos segundo o peso ao nascer,
em kg.
CLASSES
1,5 Ⱶ 2,0 3
2,0 Ⱶ 2,5 16
2,5 Ⱶ 3,0 31
3,0 Ⱶ 3,5 34
3,5 Ⱶ 4,0 11
4,0 Ⱶ 4,5 4
4,5 Ⱶ 5,0 1
Total
Professora Eliane Maria Cocco
d) Média geométrica (
A aplicação da média geométrica deve ser feita, quando os valores do conjunto de dados considerado
se comportam segundo uma progressão geométrica (P.G.)ou dela se aproximam.
Para a sequência numérica a média geométrica simples, que designaremos por ,
é definida por:

EXEMPLO: Considerando que a população de uma cidade no ano 1990 era de 2 mil habitantes, já no ano
2010 tinha 8 mil habitantes. Qual era a população no ano 2000?

e)Média Geométrica Ponderada (


Para a sequência numérica , afetados de pesos , respectivamente, a
média geométrica ponderada que designaremos por , é definida por:

EXEMPLO: Se X: 1, 2, 5 com pesos 3, 3, 1 respectivamente, então: é?

f)Média Harmônica (
É usada para dados inversamente proporcionais. Ex.: Velocidade Média, Preço de Custo Médio
Para a sequência numérica , a média harmônica simples, que designaremos por ,

é definida por:

EXEMPLO: Um veículo realizou o trajeto de ida e volta entre as cidades A e B (240 km). Na ida ele
desenvolveu uma velocidade média de 80 km/h, na volta a velocidade média desenvolvida foi de 120 km/h.
Qual a velocidade média para realizar todo o percurso de ida e volta?

g) Média Harmônica Ponderada (


Para a sequência numérica , afetados de pesos respectivamente, a
média harmônica ponderada que designaremos por , é definida por:

EXEMPLO: Se X: 6, 4, 8 com pesos 2, 3, 1 respectivamente, então: é?

Professora Eliane Maria Cocco


4.1.2 Mediana (Med ou Md)
A mediana é o número que divide a distribuição em duas partes iguais, em relação à quantidade de
elementos. Isto é, é o valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos
ficam abaixo dela e 50% ficam acima.
Colocados em ordem crescente, a mediana é ou valor que divide a amostra, ou população, em duas
partes iguais.
a) Mediana para dados não agrupados:

* Se “n” for ímpar: Elemento mediano =

EXEMPLO: Seja a amostra: 8, 16, 11, 14, 10, 12, 9

* Se “n” for par: a mediana será a média aritmética dos termos

EXEMPLO: Seja a amostra 8, 16, 11, 14, 10, 12

OBS: A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é
uma das diferenças marcantes entre a mediana e a média
A mediana é menos sensível a presença de valores suspeitos, muito diferentes.
b) Mediana para dados agrupados sem intervalos de classe:
Neste caso devemos identificar a frequência acumulada imediatamente superior à metade da soma
das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada.

* Se “n” for ímpar: Elemento mediano:

EXEMPLO: dada a distribuição, calcule a mediada.


X
1 1
2 3
3 5
4 2
Total

*Se “n” for par: A mediana é a média aritmética dos dois elementos centrais

EXEMPLO: Dada a distribuição, calcule a mediana


X
82 5
85 10
87 15
89 8
90 4
Total

Professora Eliane Maria Cocco


c) Mediana para dados agrupados com intervalos de classe:
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a
mediana.

Fórmula utilizada para o cálculo será:

OBS: O primeiro passo é encontrar o termo mediano

ONDE, - = limite inferior da classe que contém a mediana;

- = Termo mediano;

- = frequência absoluta acumulada "abaixo de" da classe anterior à classe que contém a mediana;

- = frequência absoluta da classe que contém a mediana;

- = amplitude da classe que contém a mediana;


EXEMPLO: Temperatura (Cº) para o derretimento de certo material eletrônico. Calcule a mediana
Temperatura
150 Ⱶ 200 35
200 Ⱶ 250 164
250 Ⱶ 300 31
300 Ⱶ 350 344
350 Ⱶ 400 112
400 Ⱶ450 32
450 Ⱶ 500 10
Total
Fonte: dados fictícios

Comparação entre média e mediana


Em distribuições simétricas, a média e a mediana são iguais. Em distribuições assimétricas, a média
tende a deslocar-se para o lado da cauda mais longa.

Em geral, dado um conjunto de valores, a média é a medida de posição central mais adequada,
quando se supõe que esses valores têm uma distribuição razoavelmente simétrica, enquanto a mediana surge
como uma alternativa para representar a posição central em distribuições muito assimétricas. Muitas vezes,
calculamos ambas as medidas para avaliar a posição central sob dois enfoques diferentes, além de obtermos
uma primeira avaliação sobre a assimetria da distribuição. Para variáveis com distribuições razoavelmente
Professora Eliane Maria Cocco
simétricas, a média é a medida de posição central mais adequada, porque usa o máximo da informação
contida nos dados. A média é calculada usando propriamente a magnitude dos valores, enquanto a mediana
utiliza somente a ordenação dos valores.

4.1.3 Moda (Mo)


É o valor que ocorre com maior frequência na série, ou seja, aquele que mais se repete.
EXEMPLO: Na série 3, 4, 5, 7, 7, 7, 9, 9
 SÉRIE UNIMODAL (TEM UMA ÚNICA MODA)
EXEMPLO: Na série 3, 5, 6, 6, 6, 7, 8
 SÉRIE BIMODAL (OCORREM DUAS MODAS)
EXEMPLO: Na série 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10
 SÉRIE TRIMODAL (OCORREM TRÊS MODAS)
EXEMPLO: Na série 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9
 SÉRIE POLIMODAL (OCORREM QUATRO OU MAIS MODAS)
EXEMPLO: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13
 SÉRIE AMODAL (NÃO EXISTE MODA)
EXEMPLO: Na série 0, 1, 3, 4, 7, 8
a)Moda para dados apresentados em uma distribuição de frequência simples
EXEMPLO:
X
1 13
3 15
6 25
10 8
Total
b)Moda para dados apresentados em uma distribuição de frequência por classes
Nesse caso, a moda pode ser determinada através de vários processos. Dentre eles se destacam:
1º processo) Moda Bruta ( )

Corresponde ao ponto médio da classe modal, ou seja,

onde: é o limite inferior da classe modal;

é o limite superior da classe modal.


EXEMPLO
Classe Intervalo de classe
1 30 Ⱶ 40 5
2 40 Ⱶ 50 10
3 50 Ⱶ 60 8
4 60 Ⱶ 70 2
Total

Professora Eliane Maria Cocco


2º processo) Moda de PEARSON ( )

Utilizada mais especificamente, juntamente com e , para mostrar o comportamento da distribuição,


em relação a concentração ou não de seus elementos.
Utilizando a seguinte fórmula:

Análise: , o que indica uma assimetria à direita, isto é, uma maior concentração à

esquerda (ou em direção aos valores menores).


Utiliza-se a para a análise da assimetria.

a) Assimetria à esquerda: <Med < (concentração à direita ou nos valores maiores);

b) Simétrica: Med = (concentração no centro);

c) Assimetria à direita: Med < (concentração à esquerda ou nos valores menores).

4.1.4 Separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No entanto,
ela apresenta uma outra característica, tão importante quanto a primeira: ela separa a série em dois grupos
que apresentam o mesmo número de valores.
As separatrizes não são medidas de tendência central, mas estão ligadas à mediana relativamente à
sua segunda característica, já que se baseiam em sua posição na série. As separatrizes são os quartis, os
percentis e os decis.
Mediana (Med) divide em duas partes iguais
Quartis ( ) dividem em quatro partes iguais

Decis ( ) dividem em dez partes iguais


Percentis ( ) dividem em cem partes iguais

Relação visual das separatrizes:


Os quartis
Denominamos quartis os valores de uma série
que a dividem em quatro partes iguais.
Há, portanto, três quartis:
a)O primeiro quartil ( ) - valor situado na série de
dados de tal forma que a quarta parte dos dados (25%) é menor do que ele.

Professora Eliane Maria Cocco


b)O segundo quartil ) - evidentemente coincide com a mediana.
c)O terceiro quartil ) - valor situado de tal forma que as três quartas partes (75%) dos termos são
menores que ele.

b) Os percentis
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais.
Indicamos por
É evidente que : , ,

FÓRMULAS PARA CALCULAR QUARTIS, PERCENTIS E DECIS


1º caso: Para dados não agrupados
Quartis: Para saber a posição dos quartis basta fazer: onde k é o número do quartil

Decil: Para saber a posição dos decis basta fazer: onde k é o número do decil

Percentis: Para saber a posição dos percentis basta fazer: onde k é o número do percentil

EXEMPLO: Considere o tempo (anos) de 24 máquinas utilizadas numa indústria. Calcule os Quartis,
17 18 19 20 21 22 23 24 25 26 27 29 32
33 35 38 39 42 44 46 48 50 54 57

2º caso: Para dados agrupados com intervalos de classe:


Usamos a mesma técnica do cálculo da mediana. Mas ao invés de encontrar o termo mediano
, devemos:

Quartis: Para saber a posição dos quartis basta fazer: onde k é o número do quartil

Decil: Para saber a posição dos decis basta fazer: onde k é o número do decil

Percentis: Para saber a posição dos percentis basta fazer: onde k é o número do percentil

FÓRMULA UTILIZADA:

EXEMPLO: Dadas as alturas, calcule os quartis, ,


Estaturas (cm)
150 Ⱶ 154 4
154 Ⱶ 158 9
158 Ⱶ 162 11
162 Ⱶ 166 8
166 Ⱶ 170 5
170 Ⱶ 174 3
Total 40
Fonte: dados fictícios
Professora Eliane Maria Cocco
EXERCÍCIOS
1) Karina comprou 3 canetas por 20 reais cada uma e 2 canetas por 15 reais cada uma. Quanto ela pagou, em
média, por caneta?

2) Uma indústria produz certo produto. Vendeu 3500 unidades desse produto por 30 reais cada um e 8500
unidades por 24 reais cada um. Qual foi o preço médio, por unidade, desse produto?

3) Em uma empresa com 20 funcionários, a distribuição dos salários está representada na tabela a seguir.
Número de funcionários Salário (R$)

11 1.300

6 1.500

3 2.500

Qual é o salário médio dos empregados dessa empresa?

4)Determine a média geométrica simples para os seguintes dados:


a) 6, 12, 24, 48
b) 4, 12, 36

5) Determine a média geométrica ponderada nos seguintes casos:


a) Valores 6, 8, 9 com pesos respectivos 1, 2 e 3.
b) Valores 5, 7, 9 com pesos respectivos 2, 3 e 4.

6) Determine a média harmônica simples:


a) Valores 6, 8, 10.
b) Valores 4, 5, 9.

7) Determine a média harmônica ponderada:


a) Valores 4, 5 e 8, com pesos respectivos 2, 3, 5.
b) Valores 6, 8 e 15, com pesos respectivos 4, 6 e 8.

8) Calcule o valor médio da série:


a) X: 68; 57,5; 60,7; 80
b) Y: 12; 15; 18; 23; 30
c) Z: 3,4; 7,8; 9,23; 12,15.

9) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo:


Classe Intervalo de classe
1 200 Ⱶ 300 10
2 300 Ⱶ 400 20
3 400 Ⱶ 500 30
4 500 Ⱶ 600 12
5 600 Ⱶ 700 8
Calcule o aluguel médio para estas residências.

10) Calcule a mediana da sequência e interprete os valores obtidos.


a) X: 2, 5, 8, 10, 12, 15, 8, 5, 12.
b) Y: 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8.

11) Calcule a mediana da distribuição.

Professora Eliane Maria Cocco


X
2 5
4 20
5 32
6 40
8 2

12)Na tabela é dado o consumo de combustível (milhas por galão) em carros com dois assentos, modelo
2002.
Modelo Cidade Estrada Modelo Cidade Estrada

Acura NSX 17 24 Honda Insight 57 56

Audi TT Quattro 20 28 Honda S2000 20 26

Audi TT Roadster 22 31 Lamborghini Murcielago 9 13

BMW M Coupe 17 25 Mazda Miata 22 28

BMW Z3 Coupe 19 27 Mercedes-Benz SL500 16 23

BMW Z3 Roadster 20 27 Mercedes-Benz SL600 13 19

BMW Z8 13 21 Mercedes-Benz SLK230 23 30

Chevrolet Corvette 18 25 Mercedes-Benz SLK320 20 26

Chrysler Prowler 18 23 Porsche 911 GT2 15 22

Ferrari 360 Modena 11 16 Porsche Boxster 19 27

Ford Thunderbird 17 23 Toyota MR2 25 30

a) Calcule a média do consumo de combustível na estrada e na cidade e compare os resultados.


b) A Honda Insight é um valor atípico que não se assemelha aos outros carros. Ache a média dos 21
carros, omitindo o Insight. Quanto o valor atípico altera a média?
c) Qual a mediana do consumo de combustível em estrada para os 22 carros de dois assentos? Qual é a
mediana dos 21 carros se omitirmos o Honda Insight?

13)Qual o rendimento mediano de 15 pessoas com grau universitários? Os dados são:


25 30 50 55 110 60 50 31 40 30 32 30 35 74 50

14)Descarte o 110 da lista do rendimento dos alunos e encontre a mediana dos 14 rendimentos restantes.

15) Os seguintes valores em quilômetros representam as distâncias percorridas por um motorista em 50 dias
de treinamento:
12,2; 22,3; 19,9; 8,0; 13,7; 11,7; 17,0; 10,8; 3,7; 9,6; 16,8; 8,6; 4,6; 11,7; 9,5;
25,6; 1,1; 2,0; 10,6; 17,8; 21,2; 8,0; 9,8; 14,0; 15,8; 23,3; 12,9; 13,1;
14,1; 18,5; 22,7; 9,9; 14,2; 22,7; 16,9; 27,3; 17,1; 26,5; 19,8; 22,5; 33,8;
29,8; 11,2; 7,8; 27,5; 30,2; 23,2; 10,4; 13,1; 31,3
a) Construa uma distribuição de frequências com limite inferior 0 e amplitude de classe 7.
b) Determine a média aritmética, a mediana, a moda de Pearson.

Professora Eliane Maria Cocco


16) Estudantes de engenharia aprendem que, embora os manuais forneçam a resistência de um material como
um único número, na verdade essa resistência varia de peça para peça. Uma lição fundamental em todas as
áreas de estudo é que a “variação está em toda parte”. A seguir, fornecemos os dados de um típico exercício
de laboratório para estudantes: carga, em libras, necessária para romper pedaços de pinheiro Douglas com 4
polegadas de comprimento e 1,5 polegada quadrada.
332 319 326 265 333 323 330 320 305 327 230 309 327 323
241 302 313 287 319
a) Determine a média aritmética dos dados.
b) Determine a mediana.
c) Determine o termo modal.

17) Complete a tabela e calcule a média e a mediana dos diâmetros de peças apresentadas:
CLASSES
1,810 Ⱶ 1,822 7
1,822 Ⱶ 1,834 14
1,834 Ⱶ 1,846 18

1,846Ⱶ 1,858 7
1,858 Ⱶ 1,870 4

Total

18) Calcule a moda de Pearson para a distribuição abaixo que representa a nota de 60 alunos em uma prova
de Matemática:
CLASSES Número de alunos
0Ⱶ2 5
2Ⱶ4 20

4Ⱶ6 12
6Ⱶ8 20
8 Ⱶ 10 3

Total

19)A tabela representa o número de faltas anuais dos funcionários de uma empresa.
Nº de faltas 0 1 2 3 4 5 6 7 8
Nº empregados 20 42 53 125 84 40 14 3 2
Determine:
a) D3 b) D7 c) P98 d) Q3 e) Q1 f) P10

20)A tabela a seguir contém rendimentos anuais dos funcionários administrativos de uma empresa (em
reais). Observe – a e encontre: a) Q1; b) D3; c)P35;

Classe Intervalo de classe Fi


1 5000 Ⱶ 6000 8
2 6000 Ⱶ 7000 10
3 7000 Ⱶ 8000 16

Professora Eliane Maria Cocco


4 8000 Ⱶ 9000 14
5 9000 Ⱶ 10000 10
6 10000 Ⱶ11000 5
7 11000 Ⱶ12000 2

4.2 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE


Vimos anteriormente que um conjunto de valores pode ser sintetizado, por meio de procedimentos
matemáticos, em poucos valores representativos - média aritmética, mediana e moda. Tais valores podem
servir de comparação para dar a posição de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente
simplificados, é necessário ter-se uma ideia retrospectiva de como se apresentam esses mesmos dados nas
tabelas. Assim, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente o conjunto
de valores.
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são
suficientes para caracterizar totalmente uma sequência numérica.
Se observarmos as seguintes sequências:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 1, 38, 70, 76, 165
Calculando a média aritmética de cada um desses conjuntos, obtemos:

Observamos, então, que os três conjuntos apresentam a mesma média aritmética igual a 70.
Calculando a mediana para os três, dará também o mesmo resultado, ou seja, 70. Assim, pensaríamos que
essas três variáveis são iguais, no entanto, são sequências completamente distintas do ponto de vista da
variabilidade de dados.
Na sequência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor da série.
Na sequência Y, a média 70 representa bem a série, mas existem elementos da série levemente
diferenciados da média 70.
Na sequência Z, existem muitos elementos bastante diferenciados da média 70.
Concluímos que a média 70 representa otimamente a sequência X, representa razoavelmente bem a
sequência Y, mas não representa bem a sequência Z.
Observe que na sequência X os dados estão totalmente concentrados sobre a média 70, não há
dispersão de dados. Na sequência Y, há forte concentração dos dados sobre a média 70, mas há fraca
dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte dispersão de
dados em relação à média 70.
Para qualificar os valores de uma dada variável, ressaltando maior ou menor dispersão ou
variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou
de variabilidade.
Para isso, utilizamos o termo dispersão para indicar o grau de afastamento de um conjunto de
números em relação a sua média, pois ainda que consideremos a média como um número que tem a
faculdade de representar uma série de valores ela não pode por si mesma, destacar o grau de homogeneidade
ou heterogeneidade que existe entre os valores que compõem o conjunto. O nosso objetivo é construir
medidas que avaliem a representatividade da média, para isto usaremos as medidas de dispersão.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de
variação.

4.2.1 Amplitude Total


a)Amplitude total para dados não-agrupados: A Amplitude Total é a diferença entre o maior e o menor
valor observado: AT = x(máximo) - x(mínimo)

Professora Eliane Maria Cocco


EXEMPLO: Para os valores: 40, 45, 48, 52, 54, 62, 70. Temos AT =

b) Amplitude total para dados agrupados sem intervalo de classes: AT = x(máximo) - x(mínimo)
EXEMPLO:
1 2 3 4 5 6
2 4 6 8 3 1

c) Amplitude total para dados agrupados com intervalo de classes: é a diferença entre o limite superior
da última classe e o limite inferior da primeira classe:
EXEMPLO:
AT = L(máximo) - l(mínimo)
CLASSES
1,5 Ⱶ 2,0 3
2,0 Ⱶ 2,5 16
2,5 Ⱶ 3,0 31
3,0 Ⱶ 3,5 34
3,5 Ⱶ 4,0 11
4,0 Ⱶ 4,5 4
4,5 Ⱶ 5,0 1
Total 100

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,
descuidando dos valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas
uma indicação aproximada da dispersão ou variabilidade.
A amplitude é usada quando se quer determinar a amplitude da temperatura em um dia ou ano e no
controle da qualidade.

4.2.2 Variância e desvio padrão


Variância e o desvio padrão são as medidas de dispersão mais utilizadas, pois levam em
consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante
estáveis.
A variância evidencia o quanto os elementos de uma população ou amostra estão perto ou longe da
média. Por meio da variância, se pode dizer que uma determinada população ou amostra é bem comportada
em relação à média, ou seja, a maior parte dos elementos não se distancia muito dela ou, ao contrário, que
essa população ou amostra apresenta características de distanciamento da média.
Quanto mais comportado for um conjunto de elementos, mas significativa será a média, pois ela
representa aproximadamente um maior número de elementos da população ou da amostra analisada.
A variância é definida como sendo o quociente entre a soma dos quadrados dos desvios e o número
de elementos. É classificada em dois tipos:

Variância Populacional ⇨ Onde: é o número de elementos da amostra


N é o número de elementos da população
X é cada elemento
é a média dos valores
Variância Amostral ⇨

PASSOS PARA O CÁLCULO:


1º) Obter a média do conjunto de dados ( )
2º) Obter o desvio de cada entrada ).
3º) Elevar ao quadrado cada desvio )².
4º) Somar os resultados para obter a soma dos quadrados .

Professora Eliane Maria Cocco


5º) Divida o somatório por se for população e por se for uma amostra ou

O desvio padrão é a raiz quadrada positiva da variância. O desvio padrão é a melhor medida para se
analisar o comportamento dos elementos da população ou da amostra, pois está na mesma medida que os
próprios elementos .
Desvio padrão populacional
Desvio padrão da amostral
OBS: Quanto maior o valor do desvio padrão, mais dispersos estão os elementos em torno da
média.
a) Variância e desvio padrão para dados não-agrupados:
EXEMPLO: 1) Calcule a produção média de cada funcionário de uma empresa, a variância e o desvio
padrão. (considerando uma população)

b) Variância e desvio padrão para dados agrupados sem intervalo de classe:

Se população Se amostra

EXEMPLO: calcule o desvio padrão da distribuição amostral


X
0 2
1 6
2 12
3 7
4 3
TOTAL 30

c) Variância e desvio padrão para dados agrupados com intervalo de classe:

Se população Se amostra

Professora Eliane Maria Cocco


EXEMPLO: Calcular o desvio padrão da amostra
Notas
0Ⱶ2 3
2Ⱶ4 5
4Ⱶ6 10
6Ⱶ8 8
8 Ⱶ 10 4
Total 30
ATENÇÃO: “Desvantagem” do uso da variância
No cálculo da variância, quando elevamos ao quadrado a diferença (xi − x) , a unidade de medida da
série fica também elevada ao quadrado.
Portanto, a variância é dada sempre no quadrado da unidade de medida da série. Se os dados são
expressos em metros, a variância é expressa em metros quadrados. Em algumas situações, a unidade de
medida da variância nem faz sentido. É o caso, por exemplo, em que os dados são expressos em litros. A
variância será expressa em litros quadrados.
Logo, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja:
variância não tem interpretação.
Solução: Utilizar o DESVIO PADRÃO como medida.

Interpretação do Desvio Padrão


O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.
É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados da
série. Quando uma curva de frequência representativa da série é perfeitamente simétrica ( X = Md = Mo ),
podemos afirmar que os intervalos:
[x −s , x +s ] contém aproximadamente 68% dos valores da série.
[x − 2s , x + 2s ] contém aproximadamente 95% dos valores da série.
[x − 3s , x + 3s ] contém aproximadamente 99% dos valores da série.

OBS: Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas variações
para mais ou para menos, segundo as três propriedades definidas acima não ocorrem com exatidão.

EXEMPLO: Suponha uma série com média =100 e desvio padrão , podemos interpretar estes valores
da seguinte forma:
* Os valores da série estão concentrados em torno de 100.
*O intervalo [95, 105] contém aproximadamente 68% dos valores da série.
O intervalo [90, 110] contém aproximadamente 95% dos valores da série.
O intervalo [85, 115] contém aproximadamente 99% dos valores da série.

Professora Eliane Maria Cocco


4. 2.3 Coeficiente de variação
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode
ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a
20, o mesmo não pode ser dito.
Para contornar essa e outras dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de
variação (CV).

Onde: s desvio padrão


é a média dos elementos
O coeficiente de variação é um número puro, pois é uma divisão de elementos de mesma unidade.
Portanto, pode ser expresso em percentual.
*Quanto maior o coeficiente de variação mais heterogêneo será o grupo, maior será sua variabilidade.
*Quanto menor o coeficiente de variação mais homogêneo será o grupo, menor será sua variabilidade.

EXEMPLO 1: Os retornos mensais dos investimentos A e B durante os últimos seis meses estão
apresentadas na tabela seguinte. Qual dos dois investimentos apresentou maior dispersão?
A 5% 9% 15% 12% 9% 6%
B 6% 7% 9% 7% 6% 8%

EXEMPLO 2: Um estudo foi realizado por um professor em três turmas, obtendo a média e o desvio padrão
das notas de sua disciplina, conforme a tabela. Qual a turma com menor variabilidade?
TURMA A B C
Média 6,5 8,0 8,0
Desvio padrão 2,2 1,7 2,0

EXERCÍCIOS
1)Calcule a amplitude total dos conjuntos de dados:
a)1, 3, 5, 9 b)20, 14, 15, 19, 21, 22, 20
c)17,9; 22,5; 13,3; 16,8; 15,4; 14,2 d)-10, -6, 2, 3, 7, 9, 10

2)Calcule a amplitude total das distribuições:


a)
1 2 3 4 5 6
2 4 6 8 3 1
b)
1,5 1,6 1,6 1,7 1,7 1,8 1,8 1,9 1,9 2,0 2,0 2,1 2,1 2,2
4 8 12 15 12 8 4

Professora Eliane Maria Cocco


3)Calcule a variância e o desvio padrão da amostra registrada na tabela:
10 15 14 23 21 18 11 12 14 15 23 12 15

4)Calcule a variância e o desvio padrão do Problema anterior considerando como população.

5)Os retornos anuais das ações X e Y durante os últimos cinco anos estão registrados na tabela seguinte.
Qual dos dois retornos tem maior dispersão?
X Y
12% 12%
15% 16%
12% 15%
11% 9%
14% 13%
6)A tabela seguinte registra uma amostra do tempo que os caixas de um banco gastam para realizar as
transações dos clientes. Calcule a média, a variância e o desvio padrão da amostra.
2,5 8,0 4,5 7,5 2,0 11,0 4,0 5,0 8,0 6,5 3,5

7)Duas empresas contrataram dez pessoas com curso superior. O salário inicial nessa companhia é mostrado
a seguir.
Salário inicial na empresa A ( em milhares de dólares)
Salário 41 38 39 45 47 41 44 41 37 42

Salário inicial na empresa B ( em milhares de dólares)


Salário 40 23 41 50 49 32 41 29 52 58

a) Determine a amplitude total dos salários iniciais de cada empresa.


b) Calcule o desvio padrão populacional do salário inicial de cada empresa.
c) Calcule o coeficiente de variação de cada empresa e faça a comparação da variabilidade.

8)Calcule a variância e o desvio padrão para o número de 54 notas fiscais emitidas na mesma data,
selecionadas em uma loja de departamentos. (Amostra)
Consumo por nota
(R$)
0 Ⱶ 50 10
50 Ⱶ 100 28
100 Ⱶ 150 12
150 Ⱶ 200 2
200 Ⱶ 250 1
250 Ⱶ 300 1
Total 54

9)Calcule a variância e o desvio padrão para uma amostra de 70 alunos de uma classe.
Estaturas (cm)
150 Ⱶ 160 2
160 Ⱶ 170 15
170 Ⱶ 180 18
180 Ⱶ 190 18
190 Ⱶ 200 16
200 Ⱶ 210 1
Total 70

10)Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão,
respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.

Professora Eliane Maria Cocco


11)Medidas as estaturas de 1017 indivíduos, obtivemos e . O peso médio desses
mesmos indivíduos é de 52 Kg, com um desvio padrão de 2,3 Kg. Esses indivíduos apresentam maior
variabilidade em estatura ou em peso?

12)Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de
3,3%. Qual o desvio padrão desse grupo?

4.3 MOMENTOS, ASSIMETRIA E CURTOSE


As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no
sentido de proporcionar uma descrição e compreensão mais completa das distribuições de
frequências. Estas distribuições não diferem apenas quanto ao valor médio e à variabilidade, mas
também quanto a sua forma (assimetria e curtose).
Para estudar as medidas de assimetria e curtose, é necessário o conhecimento de certas
quantidades, conhecidas como momentos.

4.3.1 Momentos
São medidas descritivas de caráter mais geral e dão origem às demais medidas descritivas,
como as de tendência central, dispersão, assimetria e curtose. Conforme a potência considerada
tem-se a ordem ou o grau do momento calculado.

a) Momentos simples ou centrados na origem ( )


O momento simples de ordem “r” é definido como:
onde: r é um número inteiro positivo;
para dados não agrupados
= 1;
= média aritmética.
para dados agrupados

b) Momentos centrados na média ( )


O momento de ordem “r” centrado na média, é definido como:

para dados não agrupados

para dados agrupados

c) Momentos abstratos ( )
São definidos da seguinte forma:

Professora Eliane Maria Cocco


4.3.2 Assimetria
Uma distribuição de valores sempre poderá ser representada por uma curva (gráfico). Essa
curva, conforme a distribuição, pode apresentar várias formas. Se considerarmos o valor da moda
da distribuição como ponto de referência, vemos que esse ponto sempre corresponde ao valor de
ordenada máxima, dando-nos o ponto mais alto da curva representativa da distribuição considerada,
logo a curva será analisada quanto à sua assimetria.
-Distribuição simétrica

- Distribuição Assimétrica

Baseando-nos nessas relações entre média e a moda, podemos emprega-las para determinar
o tipo de assimetria. Assim, calculando o calor da diferença:

Se:
⇨ assimetria nula ou distribuição simétrica;
⇨ assimetria negativa ou à esquerda;
⇨ assimetria positiva ou à direita.

EXEMPLO:
DISTRIBUIÇÃO A DISTRIBUIÇÃO B DISTRIBUIÇÃO C
Pesos Pesos Pesos
(Kg) (Kg) (Kg)
2Ⱶ6 6 2Ⱶ6 6 2Ⱶ6 6
6 Ⱶ 10 12 6 Ⱶ 10 12 6 Ⱶ 10 30
10 Ⱶ 14 24 10 Ⱶ 14 24 10 Ⱶ 14 24
14 Ⱶ 18 12 14 Ⱶ 18 30 14 Ⱶ 18 12
18 Ⱶ 22 6 18 Ⱶ 22 6 18 Ⱶ 22 6
Total 60 Total 78 Total 78

Temos:
= = =

Med = Med = Med =

Mo = Mo = Mo =

s= s= s=

Logo: A distribuição ......... é simétrica, pois ...................................................................


A distribuição........... é assimétrica negativa, pois .......................................................
A distribuição .......... é assimétrica positiva, pois ...........................................................

Das distribuições teremos os gráficos:

Professora Eliane Maria Cocco


DISTRIBUIÇÃO A DISTRIBUIÇÃO B DISTRIBUIÇÃO C

a) Coeficiente de assimetria
A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é,
não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo,
daremos preferência ao coeficiente de assimetria de Pearson, dado por:

Se , a distribuição será simétrica;


Se , a distribuição será assimétrica positiva;
Se , a distribuição será assimétrica negativa.

Quando não tivermos condições de calcularmos o desvio padrão podemos usar a seguinte fórmula:

EXEMPLO
1)Considerando as distribuições A, B e C anteriores, calcule o coeficiente de assimetria de cada
uma.

4.3.3 Curtose
Já apreciamos as medidas de tendência central, de dispersão e de assimetria. Falta somente
examinarmos mais uma das medidas de uso comum em Estatística, para se positivarem as
características de uma distribuição de valores: são as chamadas Medidas de Curtose ou de

Professora Eliane Maria Cocco


Achatamento, que nos mostra até que ponto a curva representativa de uma distribuição é a mais
aguda ou a mais achatada do que uma curva normal, de altura média.

-Curva Mesocúrtica (Normal): É considerada a curva padrão.


-Curva Leptocúrtica: É uma curva mais alta do que a normal. Apresenta o topo
relativamente alto, significando que os valores se acham mais agrupados em torno da moda.
-Curva Platicúrtica: É uma curva mais baixa do que a normal. Apresenta o topo achatado,
significando que várias classes apresentam frequências quase iguais.

a) Coeficientes de curtose
Uma fórmula para a medida da curtose é:

Essa fórmula é conhecida como coeficiente percentílico de curtose.


O valor deste coeficiente para a curva normal é 0, 26367...
Assim sendo, ao calcularmos o coeficiente percentílico de curtose de uma distribuição qualquer
teremos:
Se , a curva da distribuição será Mesocúrtica
Se , a curva será Platicúrtica
Se , a curva será Leptocúrtica

EXEMPLO
Considerando as distribuições A, B e C anteriores, calcule os respectivos graus de curtose.

EXERCICIOS
1)Considere os seguintes resultados relativos a três distribuições de frequencia:
DISTRIBUIÇÕES Mo
A 52 52
B 45 50
C 48 46

Determine o tipo de assimetria de cada uma delas

2)Uma distribuição de frequência apresenta as seguintes medidas: , Med = 47,9 e s = 2,12.


Calcule o coeficiente de assimetria.

Professora Eliane Maria Cocco


3)Considerando a distribuição de frequência relativa aos pesos de 100 operários de uma fábrica:
PESOS (kg) 50 Ⱶ 58 Ⱶ 66 Ⱶ 74 Ⱶ 82 Ⱶ 90 Ⱶ 98
Nº DE OPERÁRIOS 10 15 25 24 16 10
Determine o grau de assimetria.

4)Considere as seguintes medidas, relativas a três distribuições de frequência:


DISTRIBUIÇÕES
A 814 935 772 1012
B 63,7 80,3 55,0 86,6
C 28,8 45,6 20,5 49,8
a)Calcule os respectivos graus de curtose
b)Classifique cada uma das distribuições em relação à curva normal.

5)Para o exercício abaixo construa uma tabela de dispersão o suficiente para determinar:
a)As medidas de posição (média aritmética, mediana e moda);
b)As medidas de dispersão (desvio padrão e variância, coeficiente de variação de Pearson),
c)As medidas de assimetria (coeficiente de assimetria, e coeficiente de curtose).
Faça um relatório referente ao comportamento dos dados em função dos resultados obtidos.
0,7 0,7 0,9 1,2 1,3 1,4 1,5 1,5 1,7 1,9
2,0 2,0 2,1 2,4 2,4 2,8 2,8 2,9 3,2 3,3
3,5 3,6 4,1 4,3 4,7 4,7 4,8 5,2 5,3 5,5
6,4 6,8 7,0 7,2 7,2 7,9 8,0 8,7 9,0 9,4
10,7 13,3 15,1 16,8 17,1 19,7 25,3 32,0 32,4 42,1

Professora Eliane Maria Cocco

Você também pode gostar