Unidade 1
Unidade 1
Unidade 1
2014
INTRODUO A ESTATSTICA
O que Estatstica?
A Estatstica uma parte da Matemtica Aplicada que fornece mtodos para
coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos
mesmos na tomada de decises.
A utilizao de tcnicas, destinadas anlise de situaes complexas ou no, tem
aumentado e faz parte do nosso cotidiano. Tome-se, por exemplo, as transmisses
2
esportivas. Em um jogo de futebol, o nmero de escanteios, o nmero de faltas
cometidas e o tempo de posse de bola so dados fornecidos ao telespectador e fazem
com que a concluso sobre qual time foi melhor em campo se torne objetiva (no que
isso implique que tenha sido o vencedor...). O que tem levado a essa qualificao de
nossas vidas no dia a dia?
Um fator importante a popularizao dos computadores. No passado, tratar
uma grande massa de nmeros era uma tarefa custosa e cansativa, que exigia horas de
trabalho tedioso. Recentemente, no entanto, grandes quantidades de informaes
podem ser analisadas rapidamente com um computador pessoal e programas
adequados. Desta forma o computador contribui, positivamente, na difuso e uso de
mtodos estatsticos. Por outro lado, o computador possibilita uma automao que
pode levar um indivduo sem preparo especfico a utilizar tcnicas inadequadas para
resolver um dado problema. Assim, necessria a compreenso dos conceitos bsicos
da Estatstica, bem como as suposies necessrias para o seu uso de forma criteriosa.
Podemos dividir a estatstica em 3 subgrupos:
1. Estatstica Descritiva
2. Probabilidade
3. Inferncia Estatstica
Estatstica Descritiva
A Estatstica Descritiva pode ser definida como um conjunto de tcnicas
destinadas a descrever e resumir dados, a fim de que possamos tirar concluses a
respeito de caractersticas de interesse. Em geral utilizamos a Estatstica Descritiva na
etapa inicial da anlise quando tomamos contato com os dados pela primeira vez.
Objetivando tirar concluses de modo informal e direto, a maneira mais simples
seria a observao dos valores colhidos. Entretanto ao depararmos com uma grande
massa de dados percebemos, imediatamente, que a tarefa pode no ser simples.Para
tentar retirar dos dados informaes a respeito do fenmeno sob estudo, preciso
aplicar algumas tcnicas que nos permitam simplificar a informao daquele particular
conjunto de valores. A finalidade da Estatstica Descritiva tornar as coisas mais fceis
de entender, de relatar e discutir.
3
A mdia industrial Dow-Jones, a taxa de desemprego, o custo de vida, o ndice
pluviomtrico, a quilometragem mdia por litro de combustvel, as mdias de
estudantes so exemplos de dados tratados pela Estatstica Descritiva.
Probabilidade
A Probabilidade pode ser pensada como o teoria matemtica utilizada para
estudar a incerteza oriunda de fenmenos que envolvem o acaso. Jogos de dados e de
cartas, ou o lanamento de uma moeda para o ar enquadram-se na categoria do acaso.
A maioria dos jogos esportivos tambm influenciada pelo acaso at certo ponto. A
deciso de um fabricante de cola de empreender uma grande campanha de
propaganda visando a aumentar sua participao no mercado, a deciso de parar de
imunizar pessoas com menos de vinte anos contra determinada doena, a deciso de
arriscar-se a atravessar uma rua no meio do quarteiro, todas utilizam a probabilidade
consciente ou inconscientemente.
Inferncia Estatstica
Inferncia Estatstica o estudo de tcnicas que possibilitam a extrapolao, a um
grande conjunto de dados, das informaes e concluses obtidas a partir de
subconjuntos de valores, usualmente de dimenses muito menores. Deve-se notar que
se tivermos acesso a todos os elementos que desejamos estudar, no necessrio o
uso das tcnicas de inferncia estatstica; entretanto, elas so indispensveis quando
existe a impossibilidade de acesso a todo o conjunto de dados, por razes de natureza
econmica, tica ou fsica.
Estudos complexos que envolvem o tratamento estatstico dos dados, usualmente
incluem as trs reas citadas acima.
4
corretamente (variveis, populao, hipteses, etc.)
2) Planejamento
Determinar o procedimento necessrio para resolver o problema.
- Como levantar informaes;
- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
- Cronograma, Custos, etc.
5
CLASSIFICAO DOS DADOS
Qualquer conjunto de dados, tais como o tempo de uma ligao telefnica, a
velocidade de processamento de um computador, a proporo de participao no
mercado das empresas de um determinado setor, suscetibilidade de empresas a uma
determinada mudana no mercado, opinio dos alunos quanto didtica de um
professor, etc., contm informao sobre algum grupo de indivduos. As possveis
diferenas entre indivduos determinam a variao que est sempre presente na anlise
de dados.
Uma caracterstica que pode assumir diferentes valores de indivduo para
indivduo denominada varivel, pois de outra forma seria denominada constante.
TIPOS DE VARIVEIS
Varivel a caracterstica de interesse que medida em cada elemento da
amostra ou populao. Como o nome diz, seus valores variam de elemento para
elemento. As variveis podem ter valores numricos ou no numricos.
Variveis podem ser classificadas da seguinte forma:
Variveis Quantitativas:
So as caractersticas que podem ser medidas em uma escala quantitativa, ou
seja, apresentam valores numricos que fazem sentido. Podem ser contnuas ou
discretas.
Discretas: Caractersticas mensurveis que podem assumir apenas um nmero finito ou
infinito contvel de valores e, assim, somente fazem sentido valores inteiros.
6
Geralmente so o resultado de contagens. Exemplos: nmero de filhos, nmero de
bactrias por litro de leite, nmero de cigarros fumados por dia.
Contnuas: Caractersticas mensurveis que assumem valores em uma escala
contnua (na reta real), para as quais valores fracionais fazem sentido. Usualmente
devem ser medidas atravs de algum instrumento. Exemplos: peso (balana), altura
(rgua), tempo (relgio), presso arterial, idade.
POPULAO E AMOSTRAS
Ao conjunto de entes portadores de, pelo menos, uma caracterstica comum
denominamos Populao estatstica ou universo estatstico.
Esse termo refere-se no somente a uma coleo de indivduos, mas tambm ao
alvo sobre o qual reside nosso interesse. Assim, nossa populao pode ser tanto todos
os habitantes de Vila Velha, como todas as lmpadas produzidas por uma fbrica em
um certo perodo de tempo, ou todo o sangue no corpo de uma pessoa.
Como em qualquer estudo estatstico temos em mente pesquisar uma ou mais
caractersticas dos elementos de alguma populao, esta caracterstica deve estar
perfeitamente definida. E isso se d quando, considerando um elemento qualquer,
podemos afirmar, sem ambiguidade, se esse elemento pertence ou no populao.
Vamos entender que, em Estatstica, a palavra populao tem significado muito
mais amplo do que no vocabulrio leigo. Para o estatstico, todos os valores que uma
varivel pode assumir, nos elementos de um conjunto, constitui uma populao.
Algumas vezes podemos acessar toda a populao para estudarmos
7
caractersticas de interesse, mas em muitas situaes, tal procedimento no pode ser
realizado, por impossibilidade ou inviabilidade econmica ou temporal. Por exemplo,
uma empresa no dispe de verba suficiente para saber o que pensa todos os
consumidores de seus produtos. H ainda razes ticas, quando, por exemplo, os
experimentos de laboratrio envolvem o uso de seres vivos. Alm disso, existem casos
em que a impossibilidade de acessar toda a populao de interesse incontornvel
como no caso da anlise do sangue de uma pessoa ou em um experimento para
determinar o tempo de funcionamento das lmpadas produzidas por uma indstria.
Tendo em vista as dificuldades de vrias naturezas para observar todos os
elementos da populao, tomaremos alguns deles para formar um grupo a ser
estudado. A essa parte proveniente da populao em estudo denominamos amostra.
Uma amostra um subconjunto finito de uma populao.
8
APRESENTAO GRFICA DOS DADOS
Vantagens
a- Causam melhor impresso visual
b- Em conjunto com as tabelas, facilitam a anlise e a interpretao
Desvantagens
a- Demora na confeco
b- Valores arredondados
c- Pequeno nmero de elementos
Corresponde s representaes dos dados sob diferentes formas grficas, a fim
de permitir uma viso rpida e global do fato estudado. De uma maneira geral,
podemos dizer que os grficos devem ser construdos de maneira simples e clara, de tal
sorte que o observador entenda facilmente aquilo que o grfico busca evidenciar.
extremamente importante que o grfico seja construdo com honestidade, buscando
retratar a realidade, observando-se o mximo cuidado no traado quanto na escala.
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou no pblico em geral, uma impresso mais
rpida e viva do fenmeno em estudo, j que os grficos falam mais rpido
compreenso que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de tal
modo que cada elemento da srie seja representado por uma figura proporcional. A
representao grfica de um fenmeno deve obedecer a certos requisitos
fundamentais para ser realmente til:
9
Os principais tipos de grficos so os diagramas, os cartogramas e os
pictogramas.
HISTOGRAMA
a representao grfica atravs de retngulos adjacentes onde a base
colocada no eixo das abscissas corresponde aos intervalos das classes, e a altura dada
pela frequncia absoluta das classes. Exemplo:
10
GRFICOS EM COLUNAS OU BARRAS
So representados por retngulos de base comum e altura proporcional
magnitude dos dados. Quando dispostos em posio vertical, dizemos colunas; quando
colocados na posio horizontal, so denominados barras. Embora possam representar
qualquer srie estatstica, geralmente so empregados para representar as sries
especficas.
COLUNAS COMPOSTAS
aquele em que um retngulo construdo de forma a representar as partes
em que se divide o fato.
Alunos do Grupo Escolar X 1980
1a srie - 400
2 a srie - 300
3 a srie - 200
4 a srie - 100
1000
11
Grfico de LINHA ou CURVA
Este tipo de grfico representa a srie histrica, exclusivamente. Requer, entretanto,
que tal srie apresente um nmero significativo de informaes (5 ou mais), ou melhor,
para 5 ou nmero menor de ocorrncias um outro grfico deve ser construdo, o grfico
de colunas.
POLGONO DE FREQUNCIAS
a representao grfica de uma distribuio de frequncias por meio de um
polgono, onde os pontos so obtidos por perpendiculares traadas a partir dos pontos
mdios das classes, e de altura proporcional a frequncia de cada uma das classes. No
caso da frequncia acumulada, os segmentos perpendiculares so traados a partir dos
limites superiores da classe. Em ambos os casos, o primeiro e o ltimo pontos so
colocados de modo a manter a proporcionalidade do grfico.
12
GRFICOS DE SETORES
O grfico em setores tem finalidade de analisar as informaes percentuais de sries
geogrficas ou especificativas, com poucas ocorrncias (para que ele no se
apresente confuso, dificultando a sua interpretao). A escolha do grfico em
retngulos ou em setores opcional.
So representados por meio de setores em um crculo, e tm a mesma finalidade que
os de colunas compostas, ou seja, representar um fato e todas as partes em que o
mesmo se subdivide.
GRFICOS PICTRICOS
O pictograma constitui um dos processos grficos
que melhor fala ao pblico, pela sua forma ao
mesmo tempo atraente e sugestiva. A
representao grfica consta de figuras. Na
confeco de grficos pictricos temos que utilizar
muita criatividade, procurando obter uma
otimizao na unio da arte com a tcnica. No
utilizado em trabalhos cientficos.
Regras fundamentais para a construo:
a) Os smbolos devem explicar-se por si prprios.
b) As quantidades maiores so indicadas por meio de um nmero maior de smbolos,
mas no por um smbolo maior.
c) Os smbolos comparam quantidades aproximadas, no detalhes minuciosos.
d) Os grficos pictricos s devem ser usados para comparaes, nunca para afirmaes
isoladas.
13
CARTOGRAMAS
So grficos baseados em mapas, utilizados para representar as sries
geogrficas.
02. Um novo "boom" desponta nas estatsticas dos ltimos vestibulares. Desde o
surgimento de Dolly, a polmica ovelha clonada a partir da clula de um animal adulto,
a carreira de cincias biolgicas recebe cada vez mais candidatos e esta rea firma-se
como a cincia do prximo milnio. O grfico a seguir ilustra o nmero de inscritos nos
ltimos quatro vestibulares que disputaram as vagas oferecidas pela Universidade de
So Paulo (USP) e pelas universidades federais do Rio de Janeiro (UFRJ), de Minas Gerais
(UFMG) e do Rio Grande do Sul (UFRGS).
Com base nessas informaes, julgue os itens seguintes:
14
a) De 1997 a 1998, o crescimento percentual do nmero de inscritos na USP foi maior
que o da UFRGS.
b) Todos os segmentos de reta apresentados no grfico tm inclinao positiva.
c) Durante todo perodo analisado, a UFMG foi a universidade que apresentou o maior
crescimento percentual, mas no o maior crescimento absoluto.
d) Os crescimentos percentuais anuais na UFRJ diminuram a cada ano.
05.Em razo da valorizao do Real diante dlar, fomentada por supervit comerciais
consecutivos, muitos produtores no Brasil esto preocupados com a impossibilidade de
manuteno de suas exportaes em 206 e 2007, passando a rever os volumes a serem
produzidos. O grfico abaixo apresenta a evoluo do cmbio real no Brasil versus o
Dlar, considerando-se que neles a taxa corrigida pela IPCA, ndice de Preos ao
Consumidor, e deduzido o CPI, ndice de Preo ao Consumidor americano
15
Como se pode observa pelo grfico, existiram diversos ciclos de cmbio no Brasil no
perodo de 1980 a 2006, com cotaes diferenciadas. O ciclo de maior estabilidade
cambial foi o perodo de;
a) 1982 a 1986 no qual os brasileiros assistiram ao ajuste da economia e ao
crescimento do preo do petrleo importado;
b) 1986 a 1989, no qual foi implantado o Plano Cruzado, com busca de estabilidade
inflacionria e cambial;
c) 1990 a 1991, no qual foi implantado o Plano Collor, tambm com busca de
estabilidade inflacionria e cambial;
d) 1992 a 1994, no qual o Brasil viveu um perodo sem planos econmicos;
e) 1994 em diante, em razo da implantao do Plano Real, com controle da taxa
de cmbio at 1999.
Gabarito 1) D 2) F F F V 3) D 4) C 5) D 6) B
16
Distribuio de Frequncia
Tipo A ou Tipo I
Tipo B ou Tipo II
17
Eis um exemplo de distribuio de frequncias para varivel contnua (Tipo B)
X = Notas finais de 50 estudantes da disciplina de estatstica
22 46 9 40 57 22 22 13 50 42
35 2 15 41 34 52 32 75 69 44
26 42 60 56 30 3 17 79 45 37
0 12 62 50 45 41 59 11 66 39
43 33 70 50 47 20 36 40 67 29
Ento a distribuio de frequncia ser expressa pela tabela:
Tabela 2 Notas finais dos estudantes da disciplina de Estatstica 2012/2
Notas fi
0 10 4
10 20 5
20 30 6
30 40 8
40 50 12
50 60 7
60 70 5
70 80 3
Total 50
Onde fi a frequncia absoluta das classes
1) Dados Brutos:
Aqueles que no foram numericamente organizados, como o caso das 50 notas dos
alunos.
2) Rol:
o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente.
Portanto, teramos:
0 2 3 9 11 12 13 15 17 20
22 22 22 26 29 30 32 33 34 35
36 37 39 40 40 41 41 42 42 43
44 45 45 46 47 50 50 50 52 56
57 59 60 62 66 67 69 70 75 79
18
3) Limites de Classe:
So os nmeros extremos de cada classe; sendo assim, temos um limite inferior e um
superior. Se o 10 intervalo for notas de 0 at 10, o 0 ser o limite inferior enquanto que
o 10 ser o limite superior desta classe.
4) Intervalo de Classe:
Existem vrias maneiras de apresentarmos o intervalo de classes: iguais ou diferentes
entre si. Porm, sempre que possvel, deveremos optar por intervalos iguais, o que
facilitar os clculos posteriores. Mas mesmo com intervalos iguais, as distribuies
podero apresentar-se da seguinte forma:
19
7) Nmero de Classes (K):
Quantas classes sero necessrias para representar o fato? Existem vrios critrios que
podem ser utilizados a fim de possuirmos uma ideia do melhor nmero de classes,
porm tais critrios serviro apenas como indicao e nunca como regra fixa, pois
caber sempre ao pesquisador estabelecer o melhor nmero, levando-se em conta o
intervalo de classe e a facilidade para os posteriores clculos numricos. Uma forma
que pode ser utilizada para descobrir o nmero de classes que
k= n
k= n = 50 7
amplitude total
h=
nmero de classes
HISTOGRAMA E POLGONO
20
J o polgono de frequncia, voc pode obter pela simples unio dos pontos
mdios dos topos dos retngulos de um histograma.
Completa-se o polgono unindo as extremidades da linha que ligam os pontos
representativos das frequncias de classe aos pontos mdios das classes,
imediatamente, anterior e posterior s classes extremas, que tm frequncia nula.
EXEMPLO
1 - Tem-se a seguir o tempo em minutos de reunies em um setor de uma empresa.
21
TESTE SEU CONHECIMENTO
01. Uma indstria embala peas em caixas com 100 unidades. O controle de qualidade
selecionou 48 caixas na linha de produo e anotou em cada caixa o nmero de peas
defeituosas. Obteve os seguintes dados:
2 0 0 4 3 0 0 1 0 0
1 1 2 1 1 1 1 1 1 0
0 0 3 0 0 0 2 0 0 1
1 2 0 2 0 0 0 0 0 0
0 0 0 0 0 0 1 0
Agrupe, por frequncia estes dados.
62 72 74 78 81 84 86 89 94 98
63 72 74 78 81 84 86 90 94 98
64 72 75 78 82 84 86 90 95 99
66 73 75 78 82 85 86 90 95 101
67 73 76 79 82 85 86 91 95 102
68 73 76 80 83 85 86 92 96 103
70 73 76 80 83 85 87 92 96 103
70 73 76 81 83 85 87 92 96 103
71 73 78 81 83 85 88 93 98 105
71 74 78 81 83 86 89 93 98 108
03. No quadro a seguir esto apresentadas as velocidades mdias (em km/h) de uma
amostra constituda por 48 motoristas que utilizam diariamente determinada rodovia.
22
04. Uma empresa procurou estudar a ocorrncia de acidentes com seus empregados e
realizou um levantamento por um perodo de 36 meses. As informaes apuradas esto
na tabela a seguir:
23
MEDIDAS DE POSIO
MDIA
MDIA PONDERADA
A frmula anterior para calcular a mdia aritmtica supe que cada observao
tenha a mesma importncia. Apesar desse caso ser o mais geral, h excees. Podemos
considerar casos em que as observaes tenham importncias diferentes.
Nesses casos, devemos ponderar a importncia de cada varivel para calcular a
mdia aritmtica, sendo expressa por:
Onde: xi so todos os dados da amostra e wi o peso de cada amostra.
24
Exemplo: Em uma faculdade a mdia semestral de cada disciplina calculada
considerando as duas mdias bimestrais com peso 3 cada uma um exame final com
peso 4. Se um aluno obtm 8,0 no 1 bimestre, 9,0 no 2 bimestre e 9,6 no exame final
de Estatstica, Qual ser a sua mdia semestral em Estatstica?
O clculo da mdia aritmtica deve levar em conta os pesos desiguais das notas. Assim,
para esse aluno temos:
MEDIANA
A mediana outra medida de posio central de uma varivel. A mediana o
valor intermedirio quando os dados so organizados em ordem crescente.
Da definio de mediana, segue-se que sua caracterstica principal dividir um
conjunto ordenado de dados em dois grupos iguais; a metade ter valores inferiores
mediana, a outra metade ter valores superiores mediana. A mediana de uma
amostra ser indicada por md.
Para calcular a mediana, necessrio primeiro ordenar os valores (comumente)
do mais baixo ao mais alto. Em seguida, conta-se at a metade dos valores para achar a
mediana.
O processo para determinara a mediana o seguinte:
1 Ordenar os valores
2 Se o nmero de dados mpar, a mediana o valor que est no centro da srie.
3 Se o nmero de dados par, a mediana a mdia dos dois valores que esto no
centro da srie.
MODA
25
A moda o valor que ocorre com maior frequncia num conjunto. A moda de
uma amostra ser indicada por mo.
Exemplo: Determine a moda dos dados: 0,0,2,5,3,7,4,7,8,7,9,6.
PERCENTIL
Um percentil fornece a informao sobre os dados se distribuem ao longo do
intervalo entre o menor e maior valor. Para dados que no tem muitos valores
repetidos, o p-simo percentil divide os dados em duas partes. Aproximadamente p por
cento das observaes apresentam valores menores que o p-simo percentil;
aproximadamente (100-p) por cento das observaes possuem valores maiores que o
p-simo percentil. O p-simo percentil formalmente definida da seguinte maneira:
QUARTIS
Em muitas anlises de estatsticas possvel dividir os dados em quatro partes,
tendo cada parte aproximadamente 25% das observaes. Os pontos de diviso dos
grupos denomina-se quartil e so definidos como:
Q1= o primeiro quartil, ou 25 percentil;
Q2= o segundo quartil, ou 50 percentil;
26
Q3= o terceiro quartil, ou 75 percentil;
Para o clculo do percentil, utilizamos o mesmo princpio do percentil, sendo
que no lugar de p, iremos substituir por 25 para o Q1, 50 para Q2 e 75 para Q3.
27
valores dispersos (espalhados) em relao mdia. As medidas que tratam desta
caracterstica so chamadas de medidas de disperso.
AMPLITUDE
Amplitude total ou mxima a diferena entre o maior e o menor valor de um
conjunto de dados.
Amplitude = Valor mximo Valor mnimo
Nos dois conjuntos de dados acima temos:
a) Amplitude = 14 10 = 4
b) Amplitude = 22 1 = 21
VARINCIA
A varincia de um conjunto de dados (amostra ou populao) u ma medida de
VARIABILIDADE ABSOLUTA. Ela mede a variabilidade do conjunto em termos de
desvios quadrados em relao mdia aritmtica. uma quantidade sempre no
negativa e expressa em unidades quadradas do conjunto de dados, sendo de difcil
interpretao.
28
Exemplo: Determine a varincia do conjunto de dados abaixo:
2710 2755 7850 2880 2880 2890 2920 2940 2950 3050 3130 3325
DESVIO PADRO
O desvio padro definido como a raiz quadrada positiva da varincia. uma
outra medida de disperso mais comumente empregada do que a varincia, por ser
expressa na mesma unidade de medida do conjunto de dados.
COEFICIENTE DE VARIAO
Em algumas situaes, podemos estar interessados em uma estatstica descritiva
que indique qual o tamanho do desvio padro em relao mdia. Essa medida
chamada coeficiente de variao e expressa em porcentagem.
29
Ou seja, o coeficiente de variao a relao entre o desvio padro e a mdia.
Em relao os dados de salrio avaliados anteriormente, a mdia da amostra
2.940 e um desvio padro da amostra igual a 165,65, o coeficiente de variao
[(2.940/165,65)*100] = 5,6%. Esse resultado demonstra que o desvio padro 5,6% do
valor da mdia.
30
LISTA DE EXERCCIO
2- Suponhamos que um grupo tenha feito quarenta entrevistas e que uma das
variveis observadas tenha sido Nmero de filhos, conforme tabela abaixo:
N de N de N de N de
Quest. Quest. Quest. Quest.
filhos filhos filhos filhos
1 1 11 1 21 0 31 1
2 0 12 2 22 1 32 0
3 0 13 0 23 1 33 1
4 1 14 2 24 1 34 0
5 0 15 0 25 0 35 1
6 1 16 1 26 1 36 0
7 0 17 2 27 0 37 0
8 1 18 2 28 3 38 0
9 1 19 1 29 0 39 0
1 0 22 0 43 0 24 00
31
3- A tabela a seguir registra uma amostra aleatria a quantidade de vendas de
uma empresa. Construa a tabela de distribuio de frequncia.
280 305 320 330 310 340 330 341 369 355 370 360 370
365 280 375 380 400 371 390 400 370 401 420 430
32