Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Unidade 1

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 32

Este material foi elaborado com

base em textos de diversos


autores, com o objetivo nico e
exclusivo de ser um apoio
didtico para os alunos.

2014
INTRODUO A ESTATSTICA

A origem da palavra Estatstica est associada palavra latina STATUS (Estado). H


indcios de que 3000 anos A.C. j se faziam censos na Babilnia, China e Egito e at
mesmo o 4o. livro do Velho Testamento faz referncia a uma instruo dada a Moiss,
para que fizesse um levantamento dos homens de Israel que estivessem aptos para
guerrear. Usualmente, estas informaes eram utilizadas para a taxao de impostos ou
para o alistamento militar. O Imperador Csar Augusto, por exemplo, ordenou que se
fizesse o Censo de todo o Imprio Romano.
Contudo, mesmo que a prtica de coletar dados sobre colheitas, composio da
populao humana ou de animais, impostos, etc., fosse conhecida pelos egpcios,
hebreus, caldeus e gregos, e se atribuam a Aristteles cento e oitenta descries de
Estados, apenas no sculo XVII a Estatstica passou a ser considerada disciplina
autnoma, tendo como objetivo bsico descrio dos BENS do Estado.
A palavra Estatstica foi cunhada pelo acadmico alemo Gottfried Achenwall
(1719-1772), que foi um notvel continuador dos estudos de Hermann Conrig (1606-
1681). Gottfried determinou os objetivos da Estatstica e suas relaes com as demais
cincias. Com a Escola Alem as tabelas tornaram-se mais completas, surgiram as
representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser
simples catalogao de dados numricos coletivos para se tornar o estudo de como
chegar a concluses sobre o todo (populao), partindo da observao de partes
desse todo (amostras).
Atualmente, os estudos estatsticos tm avanado rapidamente e, com seus
processos e tcnicas, Tm contribudo para a organizao dos negcios e recursos do
mundo moderno.

O que Estatstica?
A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para
coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos
mesmos na tomada de decises.
A utilizao de tcnicas, destinadas anlise de situaes complexas ou no, tem
aumentado e faz parte do nosso cotidiano. Tome-se, por exemplo, as transmisses

2
esportivas. Em um jogo de futebol, o nmero de escanteios, o nmero de faltas
cometidas e o tempo de posse de bola so dados fornecidos ao telespectador e fazem
com que a concluso sobre qual time foi melhor em campo se torne objetiva (no que
isso implique que tenha sido o vencedor...). O que tem levado a essa qualificao de
nossas vidas no dia a dia?
Um fator importante a popularizao dos computadores. No passado, tratar
uma grande massa de nmeros era uma tarefa custosa e cansativa, que exigia horas de
trabalho tedioso. Recentemente, no entanto, grandes quantidades de informaes
podem ser analisadas rapidamente com um computador pessoal e programas
adequados. Desta forma o computador contribui, positivamente, na difuso e uso de
mtodos estatsticos. Por outro lado, o computador possibilita uma automao que
pode levar um indivduo sem preparo especfico a utilizar tcnicas inadequadas para
resolver um dado problema. Assim, necessria a compreenso dos conceitos bsicos
da Estatstica, bem como as suposies necessrias para o seu uso de forma criteriosa.
Podemos dividir a estatstica em 3 subgrupos:
1. Estatstica Descritiva
2. Probabilidade
3. Inferncia Estatstica

Estatstica Descritiva
A Estatstica Descritiva pode ser definida como um conjunto de tcnicas
destinadas a descrever e resumir dados, a fim de que possamos tirar concluses a
respeito de caractersticas de interesse. Em geral utilizamos a Estatstica Descritiva na
etapa inicial da anlise quando tomamos contato com os dados pela primeira vez.
Objetivando tirar concluses de modo informal e direto, a maneira mais simples
seria a observao dos valores colhidos. Entretanto ao depararmos com uma grande
massa de dados percebemos, imediatamente, que a tarefa pode no ser simples.Para
tentar retirar dos dados informaes a respeito do fenmeno sob estudo, preciso
aplicar algumas tcnicas que nos permitam simplificar a informao daquele particular
conjunto de valores. A finalidade da Estatstica Descritiva tornar as coisas mais fceis
de entender, de relatar e discutir.

3
A mdia industrial Dow-Jones, a taxa de desemprego, o custo de vida, o ndice
pluviomtrico, a quilometragem mdia por litro de combustvel, as mdias de
estudantes so exemplos de dados tratados pela Estatstica Descritiva.

Probabilidade
A Probabilidade pode ser pensada como o teoria matemtica utilizada para
estudar a incerteza oriunda de fenmenos que envolvem o acaso. Jogos de dados e de
cartas, ou o lanamento de uma moeda para o ar enquadram-se na categoria do acaso.
A maioria dos jogos esportivos tambm influenciada pelo acaso at certo ponto. A
deciso de um fabricante de cola de empreender uma grande campanha de
propaganda visando a aumentar sua participao no mercado, a deciso de parar de
imunizar pessoas com menos de vinte anos contra determinada doena, a deciso de
arriscar-se a atravessar uma rua no meio do quarteiro, todas utilizam a probabilidade
consciente ou inconscientemente.

Inferncia Estatstica
Inferncia Estatstica o estudo de tcnicas que possibilitam a extrapolao, a um
grande conjunto de dados, das informaes e concluses obtidas a partir de
subconjuntos de valores, usualmente de dimenses muito menores. Deve-se notar que
se tivermos acesso a todos os elementos que desejamos estudar, no necessrio o
uso das tcnicas de inferncia estatstica; entretanto, elas so indispensveis quando
existe a impossibilidade de acesso a todo o conjunto de dados, por razes de natureza
econmica, tica ou fsica.
Estudos complexos que envolvem o tratamento estatstico dos dados, usualmente
incluem as trs reas citadas acima.

FASE DO TRABALHO ESTATSTICO


1) Definio do Problema
- formulao correta do problema;
- examinar outros levantamentos realizados no mesmo campo (reviso da
literatura);
- saber exatamente o que se pretende pesquisar definindo o problema

4
corretamente (variveis, populao, hipteses, etc.)

2) Planejamento
Determinar o procedimento necessrio para resolver o problema.
- Como levantar informaes;
- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
- Cronograma, Custos, etc.

3) Coleta ou levantamento dos dados


Consiste na obteno dos dados referentes ao trabalho que desejamos fazer.
- Direta - diretamente da fonte;
- Indireta - feita atravs de outras fontes.

4) Apurao dos Dados ou sumarizao


Consiste em resumir os dados, atravs de uma contagem e agrupamento. um
trabalho de coordenao e de tabulao.

5) Apresentao dos dados


a fase em que vamos mostrar os resultados obtidos na coleta e na organizao.
- Tabular (apresentao numrica)
- Grfica (apresentao geomtrica)

6) Anlise e interpretao dos dados


a fase mais importante e tambm a mais delicada. Tira concluses que auxiliam
o pesquisador a resolver seu problema.

Abaixo, esto expostos os passos de um levantamento estatstico.

5
CLASSIFICAO DOS DADOS
Qualquer conjunto de dados, tais como o tempo de uma ligao telefnica, a
velocidade de processamento de um computador, a proporo de participao no
mercado das empresas de um determinado setor, suscetibilidade de empresas a uma
determinada mudana no mercado, opinio dos alunos quanto didtica de um
professor, etc., contm informao sobre algum grupo de indivduos. As possveis
diferenas entre indivduos determinam a variao que est sempre presente na anlise
de dados.
Uma caracterstica que pode assumir diferentes valores de indivduo para
indivduo denominada varivel, pois de outra forma seria denominada constante.

TIPOS DE VARIVEIS
Varivel a caracterstica de interesse que medida em cada elemento da
amostra ou populao. Como o nome diz, seus valores variam de elemento para
elemento. As variveis podem ter valores numricos ou no numricos.
Variveis podem ser classificadas da seguinte forma:

Variveis Quantitativas:
So as caractersticas que podem ser medidas em uma escala quantitativa, ou
seja, apresentam valores numricos que fazem sentido. Podem ser contnuas ou
discretas.
Discretas: Caractersticas mensurveis que podem assumir apenas um nmero finito ou
infinito contvel de valores e, assim, somente fazem sentido valores inteiros.

6
Geralmente so o resultado de contagens. Exemplos: nmero de filhos, nmero de
bactrias por litro de leite, nmero de cigarros fumados por dia.
Contnuas: Caractersticas mensurveis que assumem valores em uma escala
contnua (na reta real), para as quais valores fracionais fazem sentido. Usualmente
devem ser medidas atravs de algum instrumento. Exemplos: peso (balana), altura
(rgua), tempo (relgio), presso arterial, idade.

Variveis Qualitativas (ou categricas):


So as caractersticas que no possuem valores quantitativos, mas, ao contrrio,
so definidas por vrias categorias, ou seja, representam uma classificao dos
indivduos. Podem ser nominais ou ordinais.
Nominais: No existe ordenao dentre as categorias. Exemplos: sexo, cor dos olhos,
fumante/no fumante, doente/sadio.
Ordinais: Existe uma ordenao entre as categorias. Exemplos: escolaridade (1o, 2o, 3o
graus), estgio da doena (inicial, intermedirio, terminal), ms de observao (janeiro,
fevereiro,..., dezembro).

POPULAO E AMOSTRAS
Ao conjunto de entes portadores de, pelo menos, uma caracterstica comum
denominamos Populao estatstica ou universo estatstico.
Esse termo refere-se no somente a uma coleo de indivduos, mas tambm ao
alvo sobre o qual reside nosso interesse. Assim, nossa populao pode ser tanto todos
os habitantes de Vila Velha, como todas as lmpadas produzidas por uma fbrica em
um certo perodo de tempo, ou todo o sangue no corpo de uma pessoa.
Como em qualquer estudo estatstico temos em mente pesquisar uma ou mais
caractersticas dos elementos de alguma populao, esta caracterstica deve estar
perfeitamente definida. E isso se d quando, considerando um elemento qualquer,
podemos afirmar, sem ambiguidade, se esse elemento pertence ou no populao.
Vamos entender que, em Estatstica, a palavra populao tem significado muito
mais amplo do que no vocabulrio leigo. Para o estatstico, todos os valores que uma
varivel pode assumir, nos elementos de um conjunto, constitui uma populao.
Algumas vezes podemos acessar toda a populao para estudarmos

7
caractersticas de interesse, mas em muitas situaes, tal procedimento no pode ser
realizado, por impossibilidade ou inviabilidade econmica ou temporal. Por exemplo,
uma empresa no dispe de verba suficiente para saber o que pensa todos os
consumidores de seus produtos. H ainda razes ticas, quando, por exemplo, os
experimentos de laboratrio envolvem o uso de seres vivos. Alm disso, existem casos
em que a impossibilidade de acessar toda a populao de interesse incontornvel
como no caso da anlise do sangue de uma pessoa ou em um experimento para
determinar o tempo de funcionamento das lmpadas produzidas por uma indstria.
Tendo em vista as dificuldades de vrias naturezas para observar todos os
elementos da populao, tomaremos alguns deles para formar um grupo a ser
estudado. A essa parte proveniente da populao em estudo denominamos amostra.
Uma amostra um subconjunto finito de uma populao.

Os pesquisadores trabalham com amostras. Primeiro, porque as populaes


infinitas s podem ser estudadas atravs de amostras. As populaes finitas muito
grandes tambm s podem ser estudadas atravs de amostras. Finalmente, o estudo
cuidadoso de uma amostra tem mais valor cientifico do que o estudo rpido de toda a
populao.

8
APRESENTAO GRFICA DOS DADOS

Vantagens
a- Causam melhor impresso visual
b- Em conjunto com as tabelas, facilitam a anlise e a interpretao

Desvantagens
a- Demora na confeco
b- Valores arredondados
c- Pequeno nmero de elementos
Corresponde s representaes dos dados sob diferentes formas grficas, a fim
de permitir uma viso rpida e global do fato estudado. De uma maneira geral,
podemos dizer que os grficos devem ser construdos de maneira simples e clara, de tal
sorte que o observador entenda facilmente aquilo que o grfico busca evidenciar.
extremamente importante que o grfico seja construdo com honestidade, buscando
retratar a realidade, observando-se o mximo cuidado no traado quanto na escala.
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais
rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido
compreenso que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de tal
modo que cada elemento da srie seja representado por uma figura proporcional. A
representao grfica de um fenmeno deve obedecer a certos requisitos
fundamentais para ser realmente til:

a. Simplicidade o grfico deve ser destitudo de detalhes de importncia secundria,


assim como de traos desnecessrios que possam levar o observador a uma anlise
morosa ou com erros.
b. Clareza o grfico deve possibilitar uma correta interpretao dos valores
representativos do fenmeno em estudo.
c. Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.

9
Os principais tipos de grficos so os diagramas, os cartogramas e os
pictogramas.

GRFICOS ESPECIAIS PARA DISTRIBUIES DE


FREQUNCIAS

Grficos de COLUNAS ou BARRAS


a representao de uma srie por meio de retngulos, dispostos verticalmente
(em colunas) ou horizontalmente (em barras). Quando em colunas, os retngulos tm a
mesma base e as alturas so proporcionais aos respectivos dados. Quando em barras,
os retngulos tm a mesma altura e os comprimentos so proporcionais aos respectivos
dados. Assim estamos assegurando a proporcionalidade entre as reas dos retngulos e
os dados estatsticos.
um tipo de grfico recomendado para analisar as informaes absolutas de sries
geogrficas, especificativas e ainda algumas sries temporais (estas, com cinco ou
menos datas).

HISTOGRAMA
a representao grfica atravs de retngulos adjacentes onde a base
colocada no eixo das abscissas corresponde aos intervalos das classes, e a altura dada
pela frequncia absoluta das classes. Exemplo:

10
GRFICOS EM COLUNAS OU BARRAS
So representados por retngulos de base comum e altura proporcional
magnitude dos dados. Quando dispostos em posio vertical, dizemos colunas; quando
colocados na posio horizontal, so denominados barras. Embora possam representar
qualquer srie estatstica, geralmente so empregados para representar as sries
especficas.

COLUNAS CONTRAPOSTAS OU OPOSTAS


aquele em que os retngulos so dispostos de maneira oposta entre si, cada
um deles representando um fato qualquer.

COLUNAS COMPOSTAS
aquele em que um retngulo construdo de forma a representar as partes
em que se divide o fato.
Alunos do Grupo Escolar X 1980
1a srie - 400
2 a srie - 300
3 a srie - 200
4 a srie - 100
1000

11
Grfico de LINHA ou CURVA
Este tipo de grfico representa a srie histrica, exclusivamente. Requer, entretanto,
que tal srie apresente um nmero significativo de informaes (5 ou mais), ou melhor,
para 5 ou nmero menor de ocorrncias um outro grfico deve ser construdo, o grfico
de colunas.

POLGONO DE FREQUNCIAS
a representao grfica de uma distribuio de frequncias por meio de um
polgono, onde os pontos so obtidos por perpendiculares traadas a partir dos pontos
mdios das classes, e de altura proporcional a frequncia de cada uma das classes. No
caso da frequncia acumulada, os segmentos perpendiculares so traados a partir dos
limites superiores da classe. Em ambos os casos, o primeiro e o ltimo pontos so
colocados de modo a manter a proporcionalidade do grfico.

GRFICOS LINEARES OU DE CURVAS


So grficos em duas dimenses, baseados na representao cartesiana dos
pontos no plano. Servem para representar sries cronolgicas, sendo que o tempo
colocado no eixo das abscissas e os valores observados no eixo das ordenadas.

12
GRFICOS DE SETORES
O grfico em setores tem finalidade de analisar as informaes percentuais de sries
geogrficas ou especificativas, com poucas ocorrncias (para que ele no se
apresente confuso, dificultando a sua interpretao). A escolha do grfico em
retngulos ou em setores opcional.
So representados por meio de setores em um crculo, e tm a mesma finalidade que
os de colunas compostas, ou seja, representar um fato e todas as partes em que o
mesmo se subdivide.

GRFICOS PICTRICOS
O pictograma constitui um dos processos grficos
que melhor fala ao pblico, pela sua forma ao
mesmo tempo atraente e sugestiva. A
representao grfica consta de figuras. Na
confeco de grficos pictricos temos que utilizar
muita criatividade, procurando obter uma
otimizao na unio da arte com a tcnica. No
utilizado em trabalhos cientficos.
Regras fundamentais para a construo:
a) Os smbolos devem explicar-se por si prprios.
b) As quantidades maiores so indicadas por meio de um nmero maior de smbolos,
mas no por um smbolo maior.
c) Os smbolos comparam quantidades aproximadas, no detalhes minuciosos.
d) Os grficos pictricos s devem ser usados para comparaes, nunca para afirmaes
isoladas.

13
CARTOGRAMAS
So grficos baseados em mapas, utilizados para representar as sries
geogrficas.

TESTE SEU CONHECIMENTO

01. Num curso de iniciao informtica, a distribuio das


idades dos alunos, segundo o sexo, dada pelo grfico
seguinte.
Com base nos dados do grfico, pode-se afirmar que:
a) o nmero de meninas com, no mximo, 16 anos maior que
o nmero de meninos nesse mesmo intervalo de idades.
b) o nmero total de alunos 19.
c) a mdia de idade das meninas 15 anos.
d) o nmero de meninos igual ao nmero de meninas.
e) o nmero de meninos com idade maior que 15 anos maior
que o nmero de meninas nesse mesmo intervalo de idades.

02. Um novo "boom" desponta nas estatsticas dos ltimos vestibulares. Desde o
surgimento de Dolly, a polmica ovelha clonada a partir da clula de um animal adulto,
a carreira de cincias biolgicas recebe cada vez mais candidatos e esta rea firma-se
como a cincia do prximo milnio. O grfico a seguir ilustra o nmero de inscritos nos
ltimos quatro vestibulares que disputaram as vagas oferecidas pela Universidade de
So Paulo (USP) e pelas universidades federais do Rio de Janeiro (UFRJ), de Minas Gerais
(UFMG) e do Rio Grande do Sul (UFRGS).
Com base nessas informaes, julgue os itens seguintes:

14
a) De 1997 a 1998, o crescimento percentual do nmero de inscritos na USP foi maior
que o da UFRGS.
b) Todos os segmentos de reta apresentados no grfico tm inclinao positiva.
c) Durante todo perodo analisado, a UFMG foi a universidade que apresentou o maior
crescimento percentual, mas no o maior crescimento absoluto.
d) Os crescimentos percentuais anuais na UFRJ diminuram a cada ano.

03. (UFRGS) As questes de Matemtica do


Concurso Vestibular da UFRGS de 2004 foram
classificadas em categorias quanto ao ndice de
facilidade, como mostra o grfico de barras. Se esta
classificao fosse apresentada em um grfico de
setores circulares, a cada categoria corresponderia
um setor circular. O ngulo do maior desses setores
mediria
a) 80 b) 120 c) 157 d) 168 e) 172

04. (UFMG) Este grfico representa o


resultado de uma pesquisa realizada com
1000 famlias com filhos em idade escolar.
Considere estas afirmativas referentes s
famlias pesquisadas:

I) O pai participa da renda familiar em


menos de 850 dessas famlias.
II) O pai e a me participam, juntos, da
renda familiar em mais de 500 dessas
famlias.

Ento, CORRETO afirmar que:


a) nenhuma das afirmativas verdadeira.
b) apenas a afirmativa I verdadeira.
c) apenas a afirmativa II verdadeira.
d) ambas as afirmativas so verdadeiras.

05.Em razo da valorizao do Real diante dlar, fomentada por supervit comerciais
consecutivos, muitos produtores no Brasil esto preocupados com a impossibilidade de
manuteno de suas exportaes em 206 e 2007, passando a rever os volumes a serem
produzidos. O grfico abaixo apresenta a evoluo do cmbio real no Brasil versus o
Dlar, considerando-se que neles a taxa corrigida pela IPCA, ndice de Preos ao
Consumidor, e deduzido o CPI, ndice de Preo ao Consumidor americano

15
Como se pode observa pelo grfico, existiram diversos ciclos de cmbio no Brasil no
perodo de 1980 a 2006, com cotaes diferenciadas. O ciclo de maior estabilidade
cambial foi o perodo de;
a) 1982 a 1986 no qual os brasileiros assistiram ao ajuste da economia e ao
crescimento do preo do petrleo importado;
b) 1986 a 1989, no qual foi implantado o Plano Cruzado, com busca de estabilidade
inflacionria e cambial;
c) 1990 a 1991, no qual foi implantado o Plano Collor, tambm com busca de
estabilidade inflacionria e cambial;
d) 1992 a 1994, no qual o Brasil viveu um perodo sem planos econmicos;
e) 1994 em diante, em razo da implantao do Plano Real, com controle da taxa
de cmbio at 1999.

06. Grficos a seguir mostram alteraes do


nmero de passageiros areos e da populao
nos ltimos 30 anos. Comparando-se os dados
dos grficos, pode-se concluir:
a) A populao, no perodo de 1980 a 2000,
teve um decrescimento de 7%.
b) de 1970 a 1980, o aumento do nmero de
passageiros foi aproximadamente o triplo do
aumento da populao no mesmo perodo.
c) de 1990 at hoje, o nmero de passageiros
diminui em 10%.
d) A populao e o nmero de passageiros
aumentaram num mesmo ritmo desde 1970.
e) A mdia aritmtica dos percentuais de crescimento da populao de 1970, at os
dias de hoje, de 23%.

Gabarito 1) D 2) F F F V 3) D 4) C 5) D 6) B

16
Distribuio de Frequncia

Como verificamos, uma srie estatstica especfica, onde os dados encontram-


se dispostos em classes ou categorias juntamente com as frequncias correspondentes.
Desta forma, podemos dividir as distribuies de freqncias em dois tipos:

Tipo A ou Tipo I

Usada para variveis qualitativas ou ento quantitativas discretas com poucos


valores diferentes.
Exemplos: nmero de acidentes de trabalho na Empresa X; quantidade de livros de
estatstica na biblioteca da UFSM.
Eis um exemplo de distribuio de frequncias para varivel discreta (tipo A)
Tabela 1 - Nmero de acidentes de trabalho em pequenas empresas da cidade de
Porto Alegre
Nmero de Acidentes Nmero de Empresas
(Xi) (fi)
0 35
1 20
2 13
3 6
4 4
5 ou mais 2
Total 80

Xi = identifica as categorias em que o fato se subdivide.


fi = corresponde a frequncia absoluta, isto , o nmero de vezes que cada uma das
categorias ocorre.
N = soma dos fi = total de elementos observados na populao.
n = soma dos fi = total de elementos observados na amostra.

Tipo B ou Tipo II

Usada para variveis quantitativas contnuas ou discretas com muitos valores


diferentes. No possvel enumerar todos os valores. Geralmente esta varivel provm
de medies.
Exemplos: peso dos alunos de uma classe; tempo de durao de um transistor; nota de
aproveitamento dos alunos.

17
Eis um exemplo de distribuio de frequncias para varivel contnua (Tipo B)
X = Notas finais de 50 estudantes da disciplina de estatstica
22 46 9 40 57 22 22 13 50 42
35 2 15 41 34 52 32 75 69 44
26 42 60 56 30 3 17 79 45 37
0 12 62 50 45 41 59 11 66 39
43 33 70 50 47 20 36 40 67 29
Ento a distribuio de frequncia ser expressa pela tabela:
Tabela 2 Notas finais dos estudantes da disciplina de Estatstica 2012/2
Notas fi
0 10 4
10 20 5
20 30 6
30 40 8
40 50 12
50 60 7
60 70 5
70 80 3
Total 50
Onde fi a frequncia absoluta das classes

1) Dados Brutos:
Aqueles que no foram numericamente organizados, como o caso das 50 notas dos
alunos.

2) Rol:
o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente.
Portanto, teramos:
0 2 3 9 11 12 13 15 17 20
22 22 22 26 29 30 32 33 34 35
36 37 39 40 40 41 41 42 42 43
44 45 45 46 47 50 50 50 52 56
57 59 60 62 66 67 69 70 75 79

18
3) Limites de Classe:
So os nmeros extremos de cada classe; sendo assim, temos um limite inferior e um
superior. Se o 10 intervalo for notas de 0 at 10, o 0 ser o limite inferior enquanto que
o 10 ser o limite superior desta classe.

4) Intervalo de Classe:
Existem vrias maneiras de apresentarmos o intervalo de classes: iguais ou diferentes
entre si. Porm, sempre que possvel, deveremos optar por intervalos iguais, o que
facilitar os clculos posteriores. Mas mesmo com intervalos iguais, as distribuies
podero apresentar-se da seguinte forma:

0 10: compreende todos os valores entre 0 e 10, exclusive os extremos.


0 10: compreende todos os valores entre 0 e 10, inclusive os extremos.
0 10: compreende todos os valores entre 0 e 10, inclusive o 10 e exclusive o 0.
0 10: compreende todos os valores entre 0 e 10, inclusive o 0 e exclusive o 10.
Como optaremos por este ltimo tipo (0 10), poderemos definir como
intervalo de classe a diferena entre o limite superior e o limite inferior da classe.
Portanto, no exemplo, 10 0 = 10 o intervalo ou amplitude da classe.

5) Amplitude Total ou "Range":


a diferena entre o maior e o menor dado. Em nosso caso, a nota maior 79 a
menor 0; logo, nossa amplitude total 79 0 = 79.
Cumpre observar que, quando no dispusermos dos dados, o clculo da amplitude se
far levando-se em considerao a diferena entre o limite superior da ltima classe e o
limite inferior da primeira classe.

6) Ponto Mdio das Classes (Xi):


a mdia aritmtica entre o limite superior e o limite inferior da classe. Assim, se a
0 + 10
classe for 0 10, teremos: = 5, que ser o ponto mdio da classe.
2

19
7) Nmero de Classes (K):
Quantas classes sero necessrias para representar o fato? Existem vrios critrios que
podem ser utilizados a fim de possuirmos uma ideia do melhor nmero de classes,
porm tais critrios serviro apenas como indicao e nunca como regra fixa, pois
caber sempre ao pesquisador estabelecer o melhor nmero, levando-se em conta o
intervalo de classe e a facilidade para os posteriores clculos numricos. Uma forma
que pode ser utilizada para descobrir o nmero de classes que
k= n

k= n = 50 7

8) Amplitude ou Intervalo de Classes (h)

amplitude total
h=
nmero de classes

Teramos no exemplo: 79/7 = 12

9) Frequncia Relativa da Classe: (Fr)


Corresponde ao quociente entre a frequncia absoluta da classe e o total de elementos.
No exemplo, a frequncia relativa da 7a classe :
fi 5
fri = = = 0,1
N 50

10) Frequncia Acumulada (FA):


Corresponde soma de frequncias de determinada classe com as anteriores. No
exemplo, a frequncia acumulada crescente da 4a classe ser:
f1 + f2 + f3 + f4 = 4 + 5 + 6 + 8 = 23.

HISTOGRAMA E POLGONO

*Histogramas: so constitudos por um conjunto de retngulos, com as bases


assentadas sobre um eixo horizontal, tendo o centro da mesma no ponto mdio da
classe que representa, e cuja altura proporcional frequncia da classe.
*Polgono de frequncias um grfico de anlise no qual as frequncias das
classes so localizadas sobre perpendiculares levantadas nos pontos mdios das classes.

20
J o polgono de frequncia, voc pode obter pela simples unio dos pontos
mdios dos topos dos retngulos de um histograma.
Completa-se o polgono unindo as extremidades da linha que ligam os pontos
representativos das frequncias de classe aos pontos mdios das classes,
imediatamente, anterior e posterior s classes extremas, que tm frequncia nula.

Quando temos uma tabela de varivel qualitativa, um tipo de grfico adequado


para apresentar os resultados corresponde ao grfico de setores, tambm
popularmente conhecido como grfico tipo pizza. Sua construo simples: sabe-se
que o ngulo de 360 equivale a 100% da rea da circunferncia; assim, para obter-se o
ngulo do setor cuja rea representa uma determinada frequncia, basta resolver uma
regra de trs simples, como a apresentada a seguir:

EXEMPLO
1 - Tem-se a seguir o tempo em minutos de reunies em um setor de uma empresa.

a) Construa a distribuio de frequncias absoluta, relativa e acumulada; e


b) Determine o nmero de reunies em que o tempo foi menor do que 50, a partir da
distribuio de frequncias.

21
TESTE SEU CONHECIMENTO

01. Uma indstria embala peas em caixas com 100 unidades. O controle de qualidade
selecionou 48 caixas na linha de produo e anotou em cada caixa o nmero de peas
defeituosas. Obteve os seguintes dados:

2 0 0 4 3 0 0 1 0 0
1 1 2 1 1 1 1 1 1 0
0 0 3 0 0 0 2 0 0 1
1 2 0 2 0 0 0 0 0 0
0 0 0 0 0 0 1 0
Agrupe, por frequncia estes dados.

02. Considere as notas de um teste de inteligncia aplicado a alunos de um


estabelecimento de ensino.:

62 72 74 78 81 84 86 89 94 98
63 72 74 78 81 84 86 90 94 98
64 72 75 78 82 84 86 90 95 99
66 73 75 78 82 85 86 90 95 101
67 73 76 79 82 85 86 91 95 102
68 73 76 80 83 85 86 92 96 103
70 73 76 80 83 85 87 92 96 103
70 73 76 81 83 85 87 92 96 103
71 73 78 81 83 85 88 93 98 105
71 74 78 81 83 86 89 93 98 108

Construa a distribuio de frequncias com intervalo de classes e plote o histograma de


frequncia

03. No quadro a seguir esto apresentadas as velocidades mdias (em km/h) de uma
amostra constituda por 48 motoristas que utilizam diariamente determinada rodovia.

55 78 90 110 70 90 60 100 100 120 110 115


112 77 70 72 58 65 65 60 80 88 90 96
120 120 110 80 87 110 83 96 75 100 120 105
93 95 112 96 98 100 112 60 80 110 90 80

Construir uma tabela na qual constem: classes de velocidades, frequncia, frequncia


relativa, frequncia acumulada e pontos mdios dos intervalos.

22
04. Uma empresa procurou estudar a ocorrncia de acidentes com seus empregados e
realizou um levantamento por um perodo de 36 meses. As informaes apuradas esto
na tabela a seguir:

A porcentagem de meses em que houve menos de 5 empregados acidentados :


a) 50% b) 45% c) 35% d) 33% e) 30%

05. Antes de enviar um lote de aparelhos eltricos para venda, o Departamento de


Inspeo da empresa produtora selecionou uma amostra casual de 32 aparelhos
avaliando o desempenho atravs de uma medida especifica, obtendo os seguintes
resultados:

Construa uma tabela de frequncias.

06. Os pesos dos 40 funcionrios de uma empresa esto abaixo descritos:


69 57 72 54 93 68 72 58 64 62
65 76 60 49 74 59 66 83 70 45
60 81 71 67 63 64 53 73 81 50
67 68 53 75 65 58 80 60 63 53
Determinar:
a) A distribuio de frequncia do tipo B.
b) A distribuio de frequncia acumulada crescente.
c) A distribuio de frequncia porcentual simples.
d) A distribuio de frequncia relativa simples.

23
MEDIDAS DE POSIO

As medidas de posio ou de tendncia central constituem uma forma mais


sinttica de apresentar os resultados contidos nos dados observados, pois representam
um valor central, em torno do qual os dados se concentram. As medidas de tendncia
central mais empregadas so a mdia, a mediana e a moda.

MDIA

Talvez a medida de posio mais importante seja a mdia, ou valor mdio de


uma varivel. A mdia constitui uma medida da posio central dos dados. Se os dados
se referem a uma amostra, a mdia indicada por , se os dados correspondem a uma
populao, a mdia indicada pela letra grega .
A mdia aritmtica de um conjunto de dados a soma de todos eles dividido
pelo nmero deles, expresso por:
Mdia amostral Mdia populacional


Onde: xi so todos os dados da amostra e n Onde: xi so todos os dados da populao e N
o total de amostras. o tamanho da populao.

Exemplo: Calcule a mdia dos dados: 0, 2, 4, 6, 8, 10

MDIA PONDERADA

A frmula anterior para calcular a mdia aritmtica supe que cada observao
tenha a mesma importncia. Apesar desse caso ser o mais geral, h excees. Podemos
considerar casos em que as observaes tenham importncias diferentes.
Nesses casos, devemos ponderar a importncia de cada varivel para calcular a
mdia aritmtica, sendo expressa por:



Onde: xi so todos os dados da amostra e wi o peso de cada amostra.

24
Exemplo: Em uma faculdade a mdia semestral de cada disciplina calculada
considerando as duas mdias bimestrais com peso 3 cada uma um exame final com
peso 4. Se um aluno obtm 8,0 no 1 bimestre, 9,0 no 2 bimestre e 9,6 no exame final
de Estatstica, Qual ser a sua mdia semestral em Estatstica?
O clculo da mdia aritmtica deve levar em conta os pesos desiguais das notas. Assim,
para esse aluno temos:

MEDIANA
A mediana outra medida de posio central de uma varivel. A mediana o
valor intermedirio quando os dados so organizados em ordem crescente.
Da definio de mediana, segue-se que sua caracterstica principal dividir um
conjunto ordenado de dados em dois grupos iguais; a metade ter valores inferiores
mediana, a outra metade ter valores superiores mediana. A mediana de uma
amostra ser indicada por md.
Para calcular a mediana, necessrio primeiro ordenar os valores (comumente)
do mais baixo ao mais alto. Em seguida, conta-se at a metade dos valores para achar a
mediana.
O processo para determinara a mediana o seguinte:
1 Ordenar os valores
2 Se o nmero de dados mpar, a mediana o valor que est no centro da srie.
3 Se o nmero de dados par, a mediana a mdia dos dois valores que esto no
centro da srie.

Exemplo 1: Calcule a mediana dos dados: 3,9,5,7,9,1,9

Exemplo 2: Calcule a mediana dos dados 42,3,9,5,7,9,1,9.

MODA

25
A moda o valor que ocorre com maior frequncia num conjunto. A moda de
uma amostra ser indicada por mo.
Exemplo: Determine a moda dos dados: 0,0,2,5,3,7,4,7,8,7,9,6.

PERCENTIL
Um percentil fornece a informao sobre os dados se distribuem ao longo do
intervalo entre o menor e maior valor. Para dados que no tem muitos valores
repetidos, o p-simo percentil divide os dados em duas partes. Aproximadamente p por
cento das observaes apresentam valores menores que o p-simo percentil;
aproximadamente (100-p) por cento das observaes possuem valores maiores que o
p-simo percentil. O p-simo percentil formalmente definida da seguinte maneira:

PARA CALCULAR O p-SIMO PERCENTIL


Etapa 1: organize os dados em ordem crescente
Etapa 2: calcule um ndice i
I=(p/100)n
Onde p o percentil procurado e n o nmero de observaes.
Etapa 3: a) se i no for inteiro, arredonde-o para cima. O nmero inteiro seguinte maior
que i denota a posio do p-simo percentil.
b) se i for inteiro, o p-simo percentil ser a media dos valores nas posies i e i+1.

Exemplo: Determine o 85 percentil dos dados abaixo:


2710 2755 7850 2880 2880 2890 2920 2940 2950 3050 3130 3325

QUARTIS
Em muitas anlises de estatsticas possvel dividir os dados em quatro partes,
tendo cada parte aproximadamente 25% das observaes. Os pontos de diviso dos
grupos denomina-se quartil e so definidos como:
Q1= o primeiro quartil, ou 25 percentil;
Q2= o segundo quartil, ou 50 percentil;

26
Q3= o terceiro quartil, ou 75 percentil;
Para o clculo do percentil, utilizamos o mesmo princpio do percentil, sendo
que no lugar de p, iremos substituir por 25 para o Q1, 50 para Q2 e 75 para Q3.

Exemplo: Determine os quartis dos salrios:


2710 2755 7850 2880 2880 2890 2920 2940 2950 3050 3130 3325
MEDIDAS DE VARIABILIDADE

A interpretao de dados estatsticos exige que se realize um nmero maior de


estudos, alm das medidas de posio.
O estudo das mdias, medianas e modas so vlidos, mas no so suficientes
para estudos comparativos ou concluses qualitativas.
As medidas de disperso ou variabilidade servem para verificar a
representatividade das medidas de posio e se o conjunto de dados homogneo ou
heterogneo.
Consideremos os seguintes conjuntos de dados:
a) 10 11 11 11 12 12 12 12 13 14 14
b) 1 5 6 9 11 12 12 15 18 21 22
Esses dois conjuntos tm valores iguais para mdia, mediana e moda mas
existem diferenas entre eles, como podemos verificar ao coloc-los num diagrama,
como mostram as figuras abaixo.

A figura um diagrama mostrando a disperso dos dados.


Isto indica que necessitamos de um outro tipo de medida para distinguir os dois
conjuntos de dados. Observando a figura, podemos notar que o primeiro conjunto
apresenta valores concentrados em relao mdia, enquanto que o segundo apresenta

27
valores dispersos (espalhados) em relao mdia. As medidas que tratam desta
caracterstica so chamadas de medidas de disperso.

AMPLITUDE
Amplitude total ou mxima a diferena entre o maior e o menor valor de um
conjunto de dados.
Amplitude = Valor mximo Valor mnimo
Nos dois conjuntos de dados acima temos:
a) Amplitude = 14 10 = 4
b) Amplitude = 22 1 = 21

A amplitude total tem o inconveniente de s levar em conta os dois valores


extremos da srie, descuidando do conjunto de valores intermedirios, o que quase
sempre invalida a idoneidade do resultado. Ela apenas uma indicao aproximada da
disperso ou variabilidade.

VARINCIA
A varincia de um conjunto de dados (amostra ou populao) u ma medida de
VARIABILIDADE ABSOLUTA. Ela mede a variabilidade do conjunto em termos de
desvios quadrados em relao mdia aritmtica. uma quantidade sempre no
negativa e expressa em unidades quadradas do conjunto de dados, sendo de difcil
interpretao.

Varincia populacional: A varincia de uma populao {x1,...,xN} de N elementos a


medida de disperso definida como a mdia do quadrado do desvios dos elementos em
relao mdia populacional . Ou seja, a varincia populacional dada por:

Varincia amostral: A varincia de uma amostra {x1,...,xn} de n elementos definida


como a soma dos quadrados dos desvios de elementos em relao sua mdia
dividido por (n-1). Ou seja, a varincia amostral dada por:

28
Exemplo: Determine a varincia do conjunto de dados abaixo:
2710 2755 7850 2880 2880 2890 2920 2940 2950 3050 3130 3325

DESVIO PADRO
O desvio padro definido como a raiz quadrada positiva da varincia. uma
outra medida de disperso mais comumente empregada do que a varincia, por ser
expressa na mesma unidade de medida do conjunto de dados.

Desvio padro populacional: O desvio padro populacional de um conjunto de dados


igual raiz quadrada da varincia populacional. Desta forma, o desvio padro
populacional dado por:

Desvio padro amostral: O desvio padro amostral de um conjunto de dados igual


raiz quadrada da varincia amostral. Desta forma, o desvio padro amostral dado por:

Exemplo: Determine o desvio padro da amostra anterior.

COEFICIENTE DE VARIAO
Em algumas situaes, podemos estar interessados em uma estatstica descritiva
que indique qual o tamanho do desvio padro em relao mdia. Essa medida
chamada coeficiente de variao e expressa em porcentagem.

29

Ou seja, o coeficiente de variao a relao entre o desvio padro e a mdia.
Em relao os dados de salrio avaliados anteriormente, a mdia da amostra
2.940 e um desvio padro da amostra igual a 165,65, o coeficiente de variao
[(2.940/165,65)*100] = 5,6%. Esse resultado demonstra que o desvio padro 5,6% do
valor da mdia.

30
LISTA DE EXERCCIO

1 Considere os dados brutos que representam a safra, em alqueires, por


rvore, para um conjunto de 40 pessegueiros.
11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3
4,4 6,1 27,5 32,8 18,5 16,4 15,1 6,0
10,7 15,8 25,0 18,2 12,2 12,6 4,7 23,5
14,8 22,6 16,0 19,1 7,4 9,2 10,0 26,2
3,5 16,2 14,5 3,2 8,1 12,9 19,1 13,7
a) Determine o diagrama de frequncia
b) Plote o histograma de frequncia
c) Apresente a mdia, mediana, percentil (80), e os quartis.
d) Determine as medidas de variabilidade (varincia, desvio padro e coeficiente
de variao).

2- Suponhamos que um grupo tenha feito quarenta entrevistas e que uma das
variveis observadas tenha sido Nmero de filhos, conforme tabela abaixo:

N de N de N de N de
Quest. Quest. Quest. Quest.
filhos filhos filhos filhos
1 1 11 1 21 0 31 1
2 0 12 2 22 1 32 0
3 0 13 0 23 1 33 1
4 1 14 2 24 1 34 0
5 0 15 0 25 0 35 1
6 1 16 1 26 1 36 0
7 0 17 2 27 0 37 0
8 1 18 2 28 3 38 0
9 1 19 1 29 0 39 0
1 0 22 0 43 0 24 00

Realize o diagrama de frequncia e determine as medidas de disperso e posio.

31
3- A tabela a seguir registra uma amostra aleatria a quantidade de vendas de
uma empresa. Construa a tabela de distribuio de frequncia.
280 305 320 330 310 340 330 341 369 355 370 360 370
365 280 375 380 400 371 390 400 370 401 420 430

4- O Servio de Recursos Humanos de uma empresa norte-americana chamada


Roth Young relatou que os salrios anuais para os gerentes assistentes de lojas de
departamento variam de US$ 28 000 a US$ 57 000 (National Employment Weekly, 16-
22 de outubro de 1994). Assuma que os seguintes dados so uma amostra dos salrios
anuais de 40 gerentes assistentes de lojas de departamento (os dados so em mil
dlares):
48 35 57 48 52 56 51 44
40 40 50 31 52 37 51 41
47 45 46 42 53 43 44 39
50 50 44 49 55 45 50 42
52 55 46 54 45 41 45 47
a) Qual foi o salrio mais alto e o mais baixo relatados?
b) Use uma amplitude de classe de US$ 5 000 e o limite inferior da 1 classe como US$
30 000 e, monte a tabela de distribuio de frequncias
c) Que porcentagem dos salrios anuais inferior a US$ 35 000?
d) Que porcentagem dos salrios anuais superior ou igual a US$ 50 000?
e) Prepare um histograma de frequncia
f) qual a mdia dos salrios.

5 - As contagens de um time de basketball norte-americano nos ltimos seis


jogos foram: 182, 168, 184, 190, 170 e 174. Usando esses dados como uma amostra,
calcule as seguintes estatsticas descritivas: Amplitude total, Varincia, Desvio-padro,
Coeficiente de variao, Mdia, Mediana e os quartis.

32

Você também pode gostar