A Natureza Da Estatística
A Natureza Da Estatística
A Natureza Da Estatística
INTRODUÇÃO
SEC. XVI : surgem as primeiras análises sistemáticas, as primeiras tabelas e os números relativos.
SEC. XVIII : a estatística com feição científica é batizada por GODOFREDO ACHENWALL. As tabelas
ficam mais completas, surgem as primeiras representações gráficas e os cálculos de probabilidades. A
estatística deixa de ser uma simples tabulação de dados numéricos para se tornar " O estudo de como
se chegar a conclusão sobre uma população, partindo da observação de partes dessa população
(amostra)".
.MÉTODO ESTATÍSTICO
MÉTODO EXPERIMENTAL: consiste em manter constante todas as causas, menos uma, que é sofre
variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc.
Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos
consumidores, nível geral de preços de outros produtos, etc.
A ESTATÍSTICA
É uma parte da matemática aplicada que fornece metódos para coleta, organização, descrição, análise
e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
1º - DEFINIÇÃO DO PROBLEMA : Saber exatamente aquilo que se pretende pesquisar é o mesmo que
definir corretamente o problema.
2º - PLANEJAMENTO : Como levantar informações ? Que dados deverão ser obtidos ? Qual
levantamento a ser utilizado ? Censitário ? Por amostragem ? E o cronograma de atividades ? Os
custos envolvidos ? etc.
Dados secundários: quando são publicados pro outra organização. Ex: quando determinado jornal
publica estatísticas referentes ao censo demográfico extraídas do IBGE.
OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de
erros de transcrição.
Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para
saber a preferência dos consumidores pela sua marca.
A coleta direta pode ser : contínua (registros de nascimento, óbitos, casamentos, etc.),
periódica (recenseamento demográfico, censo industrial) e ocasional (registro de casos de dengue).
Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por
analogia, por avaliação,indícios ou proporcionalização.
4º - APURAÇÃO DOS DADOS : Resumo dos dados através de sua contagem e agrupamento. É a
condensação e tabulação de dados.
.FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja possível da
aplicação do método estatístico. São divididos em três grupos:
Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples
observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A natalidade na Grande Vitória, O
preço médio da cerveja no Espírito Santo, etc.
Fenômenos individuais:são aqueles que irão compor os fenômenos de massa. Ex: cada nascimento
na Grande Vitória, cada preço de cerveja no Espírito Santo, etc.
DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar
os métodos estatísticos.
POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma característica comum.
AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirarmos
conclusões sobre a essa população.
PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-
la.Para definirmos um parâmetro devemos examinar toda a população.Ex: Os alunos do 2º ano da
FACEV têm em média 1,70 metros de estatura.
ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da amostra.
Exemplo de classificação dicotômica do atributo: A classificação dos alunos da FACEV quanto ao sexo.
atributo: sexo..........................
VARIÁVEL QUALITATIVA: Quando seu valores são expressos por atributos: sexo, cor da pele,etc.
VARIÁVEL QUANTITATIVA: Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos
resultados possui uma estrutura numérica, trata-se portanto da estatística de variável e se dividem em :
Resp:qualitativa
Resp:quantitativa contínua
Resp:quantitativa contínua
Resp:quantitativa discreta
. Comprimento dos pregos produzidos por uma empresa...
Resp:quantitativa contínua
Resp:quantitativa discreta
AMOSTRAGEM
MÉTODOS PROBABILÍSTICOS
Exige que cada elemento da população possua determinada probabilidade de ser selecionado.
Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a
probabilidade de cada elemento será 1/N. trata-se do método que garante cientificamente a aplicação
das técnicas estatísitcas de inferências. Somente com base em amostragens probabilísticas é que se
podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra.
É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o acaso na
escolha.
É o processo mais elementar e frequentemente utilizado. É equivalente a um sorteio lotérico. Pode ser
realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo
aleatório qualquer, x números dessa sequência, os quais corresponderão aos elementos pertencentes à
amostra.
Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos
de uma escola:
2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e
após mistura retiramos, um a um, nove números que formarão a amostra.
OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito
trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de modo que os
algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas.
Quando a população se divide em estratos (subpopulações), convém que o sorteio dos elementos da
amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao
número de elementos desses estratos.
Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo,
que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino
e sexo feminino). Logo, temos:
.AMOSTRAGEM SISTEMÁTICA:
Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por
50 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: como
900/50 = 18, escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento
sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18.
Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª
casa, 76ª casa, etc.
Algumas populações não permitem, ou tornam extremamente difícil que se identifiquem seus
elementos. Não obstante isso, pode ser relativamente fácil identificar alguns subgrupos da população.
Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode se colhida, e
uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são
quarteirões, famílias, organizações, agências, edifícios etc.
Exemplo:
Num levantamento da população de determinada cidade, podemos dispor do mapa indicando cada
quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher uma
amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões
sorteados.
São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível
generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não
garantem a representatividade da população.
AMOSTRAGEM ACIDENTAL
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se
obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião,
em que os entrevistados são acidentalmente escolhidos.
Exemplos: Pesquisas de opinião em praças públicas, ruas movimentadas de grandes cidades etc.
AMOSTRAGEM INTENCIONAL
De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão
compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja
saber a opinião.
Exemplo: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um
grande salão de beleza e entrevista as pessoas que ali se encontram.
Exemplo: Numa pesquisa sobre o "trabalho das mulheres na atualidade". Provavelmente se terá
interesse em considerar: a divisão cidade e campo, a habitação, o número de filhos, a idade dos filhos,
a renda média, as faixas etárias etc.
.EXERCÍCIOS:
1- Uma escola de 1º grau abriga 124 alunos. Obtenha uma amostra representativa correspondente a
15% da população, utilizando a partir do início da 5ª linha da Tabela de números aleatórios.
2- Tenho 80 lâmpadas numeradas numa caixa. Como obtemos uma amostra de 12 lâmpadas ?
3- Uma população encontra-se dividida em três estratos,com tamanhos, respecivamente, n1= 40, n2=
100 e n3= 60. Sabendo que, ao realizar uma amostragem estratificada proporcional, 9 elementos da
amostra foram retiratos do 3º estrato, determine o número de elementos da amostra.
4- Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada
formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para
pertencer a amostra, sabendo-se que o elemento 1.420º a ela pertence ?
SÉRIES ESTATÍSTICAS
TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de
maneira sistemática.
De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que nestes
documentos as tabelas não serão abertas devido a limitações do editor html".
.
SÉRIE ESTATÍSTICA:
Séries Homógradas: são aquelas em que a variável descrita apresenta variação discreta ou
descontínua. Podem ser do tipo temporal, geográfica ou específica.
a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie
(fenômemo) são elementos fixos. Esta série também é chamada de histórica ou evolutiva.
* Em mil unidades.
b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie)
são elementos fixos. Também é chamada de espacial, territorial ou de localização.
* Em mil unidades
c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série
categórica.
* Em mil unidades
* Em mil unidades
GRÁFICOS ESTATÍSTICOSGGG
São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as
tabelas estatísticas.
Características:
Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico, fornecendo
elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de
análise frequentemente vêm acompanahdos de uma tabela estatística. Inclui-se, muitas vezes um texto
explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico.
Uso indevido de Gráficos: Podem trazer uma idéia falsa dos dados que estão sendo analisados,
chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construção de escalas.
1 - Diagramas:
São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de
séries estatísticas. Eles podem ser :
Quando as legendas não são breves usa-se de preferência os gráficos em barras horizontais. Nesses
gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. A
ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou
categórica.
1.3- Gráficos em barras compostas.
Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada
barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois
ou mais atributos.
São frequentemente usados para representação de séries cronológicas com um grande número de
períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas
flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo
gráfico.
Este gráfico é contruído com base em um círculo, e é empregado sempre que desejamos ressaltar a
participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores
quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos
dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.
Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.
.2 - Estereogramas:
São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas
representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil
de ser interpretado dada a pequena precisão que oferecem.
3 - Pictogramas:
São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem
a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos
deven ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do
fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo:
4- Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de
figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
DISTRIBUIÇÃO DE FREQUÊNCIA
É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus
valores).
Tabela primitiva ou dados brutos:É uma tabela ou relação de elementos que não foram
numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um
todo, a partir de dados não ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Distribuição de frequência sem intervalos de classe:É a simples condensação dos dados conforme
as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de frequência é
inconveniente, já que exige muito espaço. Veja exempo abaixo:
Dados Frequência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
Classes Freqências
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
CLASSE: são os intervalos de variação da variável e é simbolizada por i e o número total de classes
simbolizada por k. Ex: na tabela anterior k=5 e 49 |------- 53 é a 3ª classe, onde i=3.
LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe (li)
e o maior número, limite superior de classe(Li). Ex: em 49 |------- 53... l3= 49 e L3= 53. O símbolo |-------
representa um intervalo fechado à esquerda e aberto à direita. O dado 53 do ROL não pertence a
classe 3 e sim a classe 4 representada por 53 |------- 57.
AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior da última classe e o limite
inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20.
AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e o valor mínimo da
amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19.
PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. .......Ex:
em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2.
n i= nº de classes
3 |-----| 5 3
6 |-----| 11 4
12 |-----| 22 5
23 |-----| 46 6
47 |-----| 90 7
91 |-----| 181 8
182 |-----| 362 9
Obs: Qualquer regra para determinação do nº de classes da tabela não nos levam a uma decisão final;
esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados.
No nosso exemplo: n = 20 dados, então ,a princípio, a regra sugere a adoção de 5 classes.
No nosso exemplo: AA/i = 19/5 = 3,8 . Obs:Como h > AA/i um valor ligeiramente superior para haver
folga na última classe. Utilizaremos então h = 4
No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo a primeira classe será representada por
...... 41 |------- 45. As classes seguintes respeitarão o mesmo procedimento.
O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da classe
anterior.
.Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o
eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de
classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas.
Frequências simples ou absolutas: são os valores que realmente representam o número de dados de
cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição.
Frequências relativas: são os valores das razões entre as frequências absolutas de cada classe e a
frequência total da distribuição. A soma das frequências relativas é igual a 1 (100 %).
Frequência simples acumulada de uma classe:é o total das frequências de todos os valores
inferiores ao limite superior do intervalo de uma determida classe.
Sendo fi= freq. simples; xi= ponto médio de classe; fri= freq. simples acumulada; Fi= freq. relativa e
Fri= freq. relativa acumulada. Construa o histograma, polígono de frequência e polígono de freq.
acumulada:
Obs: uma distribuição de frequência sem intervalos de classe é representada graficamente por um
diagrama onde cada valor da variável é representado por um segmento de reta vertical e de
comprimento proporcional à respectiva frequência.
.Exercício:
Com base na tabela anterior, construa o gráfico da curva polida a partir das frequências calculadas:
MEDIDAS DE POSIÇÃO
Introdução
São as estatísticas que representam uma série de dados orientando-nos quanto à posição da
distribuição em relação ao eixo horizontal do gráfico da curva de frequência.
As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outros
promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática.
As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os
quartis e os percentis.
.MÉDIA ARITMÉTICA =
É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
.Dados não-agrupados:
Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 kilos, temos, para venda média diária na semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kilos
Desvio em relação à média: é a diferença entre cada elemento de um conjunto de valores e a média
aritmética, ou seja:.. di = Xi -
.Propriedades da média
2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma
variável, a média do conjunto fica aumentada ( ou diminuida) dessa constante.
Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou
Y= .+ 2 = 14 +2 = 16 kilos
3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
constante (c), a média do conjunto fica multiplicada ( ou dividida) por essa constante.
Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou
Y= x 3 = 14 x 3 = 42 kilos
.Dados agrupados:
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de
filhos do sexo masculino. Calcularemos a quantidade média de meninos por família:
Nº de meninos frequência = fi
0 2
1 6
2 10
3 12
4 4
total 34
Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam
como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela
fórmula:
Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe
coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:
Média Geométrica
...xi... ...fi...
1 2
3 4
9 2
27 1
total 9
No excel.......=(1^2*3^4*9^2*27^1)^(1/9)........R: 3,8296
1ª propriedade: O produto dos quocientes de cada valor de um conjunto de números pela média
geométrica do conjunto é = 1.
Exemplo - Comprovar a 1ª propriedade da média geométrica com os dados { 10, 60, 360 }
.2ª propriedade: Séries que apresentam o mesmo número de elementos com o mesmo produto têm a
mesma média geométrica.
a = {8 e 12,5}.........b = {2 e 50}
ga = 10 ..................... gb = 10
.4ª propriedade: Quanto maior a diferença entre os valores originais maior será diferença entre as
médias aritmética e geométrica. Veja na tabela abaixo:
a) Média de Relações
g = no excel.............=(2,5*0,5)^(1/2)........R: 1,1180
Obs: Se, para uma determinada empresa, se deseja estabelecer uma relação do tipo capital/dívida que
seja independente da dívida ou do capital das diferentes empresas envolvidas, é recomendável o uso
da média geométrica. Se o que se deseja saber é a relação capital/dívida de um certo número de
empresas, após a consolidação, a cifra correta será obtida através da média aritmética.
Exemplo: Suponhamos que um indivíduo tenha aplicado um capital de R$ 500,00 em 1995. Após um
ano de aplicação, essa importância chegou a R$ 650,00. Reaplicando essa última quantia, ao final de
mais um ano seu montante situava-se em R$ 910,00. Qual a taxa média de aumento de capital ?
Período Taxa
1995 a 1996 650/500 = 1,3
1996 a 1997 910/650 = 1,4
Resposta: 1,3491
MÉDIA HARMÔNICA
.. ou
..
A média harmônica é menor que a média geométrica para valores da variável diferentes de zero.
h< g.. e por extensão de raciocínio podemos escrever :.. h< g<
OBS: A média harmônica não aceita valores iguais a zero como dados de uma série.
A igualdade g= h.= ....só ocorrerá quando todos os valores da série forem iguais.
OBS: Quando os valores da variável não forem muito diferentes, verifica-se aproximadamente a
seguinte relação:
g=( .+ h ) /.2
.MÉDIA QUADRÁTICA
a = { 2 , 3 , 4 , 5 } ....Resp: 3,67
.Média Quadrática Ponderada: Quando os valores da variável estiverem dispostos em uma tabela de
frequências, a média quadrática será determinada pela seguinte expressão:
OBS:
• Sempre que os valores de X forem positivos e pelo menos um dado diferente é válida a seguinte
relação: q> > g> h
• A igualdade entre as médias acima se verifica quando os valores da variável forem iguais
(constantes)
• A média quadrática é largamente utilizada em Estatística, principalmente quando se pretende
calcular a média de desvios ( x - .) , em vez de a média dos valores originais. Neste caso, a
média quadrática é denominada desvio-padrão, que é uma importante medida de dispersão.
MODA
Mo é o símbolo da moda.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário
recebido pelo maior número de empregdos dessa fábrica.
• A moda é facilmente reconhecida: basta, de acordo com deinição, procurar o valor que mais se
repete.
• Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes
que outros.
• .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a
série tem dois ou mais valores modais.
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da
variável de maior frequência.
Temperaturas Frequência
0º C 3
1º C 9
2º C 12
3º C 6
A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos
afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe
modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe
modal. Damos a esse valor a denominação de moda bruta.
Mo = ( l* + L* ) / 2
onde l* = limite inferior da classe modal e L*= limite superior da classe modal.
Resp: a classe modal é 58|-------- 62, pois é a de maior frequência. l*=58 e L*=62
Mo = (58+62) / 2 = 60 cm ( este valor é estimado, pois não conhecemos o valor real da moda).
l*= limite inferior da classe modal..... e..... L*= limite superior da classe modal
Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou
quando a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a
medida de posição que possui a maior estabilidade.
MEDIANA
Símbolo da mediana: Md
De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou
decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.
.( n + 1 ) / 2
Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana
Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor correspondente.
1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
5º termo = 2
6º termo = 3
A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo será a média aritmética do 5º e 6º
termos da série.
Notas:
• Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana
com um dos elementos da série.
• Quando o número de elementos da série estatística for par, nunca haverá coincidência da
mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2
elementos centrais da série.
• Em um série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
• A mediana, depende da posição e não dos valores dos elemntos na série ordenada. Essa é uma
da diferenças marcantes entre mediana e média ( que se deixa influenciar, e muito, pelos
valores extremos). Vejamos:
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores
extremos, ao passo que a mediana permanece a mesma.
Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma
das requências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada.
Exemplo conforme tabela abaixo:
Quando o somatório das frequências for ímpar o valor mediano será o termo de ordem dado fela
fórmula :.
Como o somatório das frequências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo = 3..
.. Quando o somatório das frequências for par o valor mediano será o termo de ordem dado fela fórmula
:.
Aplicando fórmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5
Devemos seguir os seguintes passos: 1º) Determinamos as frequências acumuladas ; 2º) Calculamos
Exemplo:
Emprego da Mediana
• Quando desejamos obter o ponto que divide a dsitribuição em duas partes iguais.
• Quando há valores extremos que afetam de amneira acentuada a média aritmética.
• Quando a variável em estudo é salário.
SEPARATRIZES
Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são
medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica de
separar a série em duas partes que apresentam o mesmo número de valores.
Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana, conhecidas
pelo nome genérico de separatrizes.
.QUARTIS
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Precisamos portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a série em quatro partes iguais.
O método mais prático é utilizar o princípio do cáculo da mediana para os 3 quartis. Na realidade serão
calculadas " 3 medianas " em uma mesma série.
Exemplo1: Calcule os quartis da série: { 5, 2, 6, 9, 10, 13, 15 }
{ 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que será = Q2.
Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela
mediana ( quartil 2). Para o cáculo do quartil 1 e 3 basta calcular as medianas das partes iguais
provenientes da verdadeira Mediana da série (quartil 2).
Q1 = (2+3)/2 = 2,5
Q3 = (9+9)/2 = 9
Assim, temos:
O quartil 2 = Md , logo:
= 40 / 2 =.20........... logo.a classe mediana será 58 |---------- 62
O quartil 1 : E fi / 4 = 10
.O quartil 3 : 3.E fi / 4 = 30
Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65
DECIS
A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da porcentagem de
valores que ficam aquém e além do decil que se pretende calcular. A fómula básica será : k .E fi / 10
onde k é o número de ordem do decil a ser calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo
precisamos de 9 decis para dividirmos uma série em 10 partes iguais.
De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo,o
quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana.
PERCENTIL ou CENTIL
Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma série em
100 partes iguais. Indicamos: P1, P2, ... , P99. É evidente que P50 = Md ; P25 = Q1 e P75 = Q3.
O cálculo de um centil segue a mesma técnica do cálculo da mediana, porém a fórmula será : k .E fi /
100 onde k é o número de ordem do centil a ser calculado.
Dispersão ou Variabilidade:
É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência
central ( média ou mediana ) tomado como ponto de comparação.
A média - ainda que considerada como um número que tem a faculdade de representar uma série de
valores - não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe
entre os valores que compõem o conjunto.
Observamos então que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os
valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há
menor diversificação entre cada um de seus valores e a média representativa.
Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta uma
dispersão menor que o conjunto Z.
Amplitude total : É a única medida de dispersão que não tem na média o ponto de referência.
Quando os dados não estão agrupados a amplitude total é adiferença entr o maior e o menor valor
observado: AT = X máximo - X mínimo.
Quando os dados estão agrupados sem intervalos de classe ainda temos : AT = X máximo - X mínimo.
Exemplo:
xi fi
0 2
1 6
3 5
4 3
AT = 4 - 0 = 4
Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o
limite inferior da primeira classe. Então AT = L máximo - l mínimo
Exemplo:
Classes fi
4 |------------- 6 6
6 |------------- 8 2
8 |------------- 10 3
AT = 10 - 4 = 6
A amplitude total tem o incoveniente e só levar em conta os dois valores extremos da série,
descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer
determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida
de cálculo rápido sem muita exatidão.
Desvio quartil
Também chamado de amplitude semi-interquatílica e é baseada nos quartis.
Observações:
1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de calcular e de
interpretar. Além do mais, não é afetado pelos valores extremos, grandes ou pequenos, sendo
recomendado, por conseguinte, quando entre os dados figurem valores extremos que não se
consideram representativos.
2- O desvio quartil deverá ser usado preferencialmente quando a medida de tendência central for a
mediana.
3- Trata-se de uma medida insensível ã distribuição dos itens menores que Q1, entre Q1 e Q3 e
maiores que Q3.
É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes
medidas de tendência central: média ou mediana. Símbolo = Dm
As barras verticais indicam que são tomados os valores absolutos, prescindindo do sinal dos desvios.
= - 0, 2 e Md = - 2
Xi Xi - | Xi - | Xi - Md | Xi - Md |
-4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2
-3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1
-2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0
3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5
5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7
E= 16,8 E= 15
Xi f i Xi . f i Xi - | Xi - | | Xi - |.fi
3 2 6 4,7 - 1,7 1,7 3,4
4 2 8 4,7 - 0,7 0,7 1,4
5 3 15 4,7 0,3 0,3 0,9
6 3 18 4,7 1,3 1,3 3,9
E = 10 47 E= 9,6
Dm = 9,6 / 10 = 0,96
Xi f i Md Xi - Md | Xi - Md | | Xi - Md | . f i
3 2 5 -2 2 4
4 2 5 -1 1 2
5 3 5 0 0 0
6 3 5 1 1 1
E = 10 E= 7
Dm = 7 / 10 = 0,70
Obs: Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não é tão
frequentemente empregado como o desvio-padrão. O desvio médio despreza o fato de alguns desvios
serem negativos e outros positivos, pois essa medida os trata como se fossem todos positivos. Todavia
será preferido o uso do desvio médio em lugar do desvio-padrão, quando esse for indevidamente
influenciado pelos desvios extremos.
DESVIO PADRÃO
É a medida de dispersão mais geralmente empregada, pois leva em consideração a totalidade dos
valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão
baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como : a
raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S .
E= 62,8
Obs: Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra,
visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que
consiste em usar o divisor n - 1 em lugar de n. A fórmula ficará então:
1ª = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio
padrão não se altera.
2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de
zero), o desvio padrão fica multiplicado ( ou dividido) por essa constante.
Quando os dados estão agrupados (temos a presença de frequências) a fórmula do desvio padrão
ficará :
Exemplo:
Xi f i Xi . f i .fi
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 E= 32,70
Se considerarmos os dados como sendo de uma amostra o desvio padrão seria : a raiz quadrada de
32,7 / (30 -1) = 1,062
Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a mesma do
exemplo anterior.
VARIÂNCIA
A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente
importante na inferência estatística e em combinações de amostras.
* EXERCÍCIOS *
Que relação existe entre os desvios padrões dos dois conjuntos de números ?
Que relação existe entre os desvios padrões dos dois conjuntos de números ?
3- Dados os conjuntos de números: A = { -2, -1, 0, 1, 2 } B = { 220, 225, 230, 235, 240 }
Podemos afirmar, de acordo com as propriedades do desvio padrão, que o desvio padrão de B é igual:
a) ao desvio padrão de A;
Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio padrão de
2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no
entanto, se a média for igual a 20, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego
quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou
variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos
dados em termos relativos a seu valor médio, medida essa denominada de CVP: Coeficiente de
Variação de Pearson (é a razão entre o desvio padão e a média referentes a dados de uma
mesma série).
Exemplo:
Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor será o de
maior homogeneidade ( menor dispersão ou variabilidade).
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.
CVQ = (Q3 - Q1) / (Q3 + Q1) ou [(Q3 - Q1) / (Q3 + Q1)] x 100 para resultado em %.
Desvio quartil Reduzido: Dqr = (Q3 - Q1) / 2Md ou [(Q3 - Q1) / 2Md ] x 100 para resultado em %.
EXERCÍCIOS
2- O risco de uma ação de uma empresa pode ser devidamente avaliado através da variabilidade dos
retornos esperados. Portanto, a comparação das distribuições probabilísticas dos retornos, relativas a
cada ação individual, possibilita a quem toma decisões perceber os diferentes graus de risco. Analise,
abaixo, os dados estatísticos relativos aos retornos de 5 ações e diga qual é a menos arriscada :
3- Um grupo de 85 moças tem estatura média 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro
grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual
é o coeficiente de variação de cada um dos grupos ? Qual o grupo mais homogêneo ?
4- Um grupo de 196 famílias tem renda média de 163,8 dólares, com um coeficiente de variação de
3,3%. Qual o desvio padrão da renda desse grupo ?
5- Uma distribuição apresenta as seguintes estatísticas: S = 1,5 e CVP = 2,9 % . Determine a média da
distribuição:
6- Numa pequena cidade, 65 famílias tem a renda média de 57,5 dólares e o desvio padrão de 5,98
dólares. A variabilidade relativa das famílias foi de :
MEDIDAS DE ASSIMETRIA
Introdução:
Coeficiente de assimetria
A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não
permite a possibilidade de comparação entr as medidas de duas distribuições. Por esse motivo,
daremos preferência ao coeficiente de assimetria de Person:
Escalas de assimetria:
Exercício
MEDIDAS DE CURTOSE
Introdução:
Quando a distribuição apresenta uma curva de frequência mais fechada que a normal (ou mais aguda
ou afilada em sua parte superior), ela recebe o nome de leptocúrtica.
Quando a distribuição apresenta uma curva de frequência mais aberta que a normal (ou mais achatada
em sua parte superior), ela recebe o nome de platicúrtica.
Coeficiente de curtose
obs: este coeficiente está dentro do programa excel (nas funções estatíticas automáticas).
PROBABILIDADE
Introdução:
O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos fenômenos
de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos
fundamentais do cálculo da probabilidades é uma necessidade essencial para o estudo da Estatística
Indutiva ou Inferencial.
Experimento Aleatório
São fenômenos que, mesmo repetido várias vezes sob condições semelhantes, apresentam resultados
imprevisíveis. O resultado final depende do acaso.
Exemplo:
Da afirmação "é provável que o meu time ganhe a partida hoje" pode resultar:
Espaço Amostral
No experimento aleatório "lançamento de uma moeda" temos o espaço amostral {cara, coroa}.
No experimento aleatório "dois lançamentos sucessivos de uma moeda" temos o espaço amostral :
Eventos
Se considerarmos S como espaço amostral e E como evento: Assim, qualquer que seja E, se E c S (E
está contido em S), então E é um evento de S.
Exercício
Conceito de Probabilidade
Chamamos de probabilidade de um evento A (sendo que A está contido no Espaço amostral) o número
real
OBS: Quando todos os elementos do Espaço amostral tem a mesma chance de acontecer, o espaço
amostral é chamado de conjunto equiprovável.
Exemplos:
Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q
a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação:
p+q=1
Exemplos:
2-Calcular a probabilidade de um piloto de automóveis vencer uma dada corrida, onde as suas
"chances", segundo os entendidos, são de "3 para 2". Calcule também a probabilidade dele perder:
O termo "3 para 2" significa : De cada 5 corridas ele ganha 3 e perde 2. Então p = 3/5 (ganhar) e
q = 2/5 (perder).
3-Uma dado foi fabricado de tal forma que num lançamento a probabilidade de ocorrer um número par é
o dobro da probabilidade de ocorrer número ímpar na face superior, sendo que os três números pares
ocorrem com igual probabilidade, bem como os três números ímpares. Determine a probabilidade de
ocorrência de cada evento elementar:
4-Seja S = {a,b,c,d} . Consideremos a seguinte distribuição de probabilidades: P(a) = 1/8 ; P(b) = 1/8 ;
P(c) = 1/4 e P(d) = x . Calcule o valor de x :
5- As chances de um time de futebol T ganhar o campeonato que está disputando são de "5 para 2".
Determinar a probabilidade de T ganhar e a probabilidade de T perder :
6- Três cavalos C1,C2 e C3 disputam um páreo, onde só se premiará o vencedor. Um conhecedor dos 3
cavalos afirma que as "chances" de C1 vencer são o dobro das de C2,e que C2 tem o triplo das
"chances" de C3. Calcule as probabilidades de cada cavalo vencer o páreo:
Eventos Independentes
Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s)
outro(s). Assim, no lançamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa" são
mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos , a probabilidade de que um ou outro se realize é igual à
soma das probabilidades de que cada um deles se realize:
Os dois eventos são mutuamente exclusivos então: P = 1/6 + 1/6 = 2/6 = 1/3
Obs: Na probabilidade da união de dois eventos A e B, quando há elementos comuns, devemos excluir
as probabilidades dos elementos comuns a A e B (elementos de A n B ) para não serem computadas
duas vezes. Assim P(A U B) = P(A) + P(B) - P(A n B)
Exemplo: Retirando-se uma carta de um baralho de 52 cartas, qual a probabilidade da carta retirada ser
ou um ÁS ou uma carta de COPAS ?
P(ÁS U Copas) = P(ÁS) + P(Copas) - P(ÁS n Copas) = 4/52 + 13/52 - 1/52 = 16/52
Probabilidade Condicional
Se A e B são dois eventos, a probabilidade de B ocorrer , depois de A ter acontecido é definida por : P
(B/A), ou seja, é chamada probabilidade condicional de B. Neste caso os eventos são dependentes e
definidos pela fórmula:
P (A e B ) = P (A) x P(B/A)
Exemplo: Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de
ambas serem COPAS ?
P(Copas1) = 13/52
P(Copas2/Copas1) = 12/51
Obs: No exemplo anterior se a 1ª carta retirada voltasse ao baralho o experimento seria do tipo com
reposição e seria um evento independente. O resultado seria:
Carta pretas = 26
Cartas vermelhas = 26
EXERCÍCIOS
4- De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um REI e a do segundo ser o
5 de paus ?
5- Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 nolas brancas, 2
pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada
urna. Qual é a probabilidade de as três bolas retiradas da 1ª , 2ª e 3ª urnas serem, respectivamente,
branca, preta e verde ?
6- De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade
de a primeira carta ser o ÁS de paus e a segunda ser o REI de paus ?
7- Qual a probabilidade de sair uma figura (rei ou dama ou valete) quando retiramos uma carta de um
baralho de 52 carta ?
8- São dados dois baralhos de 52 cartas.Tiramos, ao mesmo tempo, uma carta do primeiro baralho e
uma carta do segundo. Qual a probabilidade de tirarmos uma DAMA e um REI, não necessariamente
nessa ordem ?
9- Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de ambas serem
COPAS ou ESPADAS ?
10- Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas
pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta ?
11- Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas
pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta ?
12- Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas
pretas e 5 bolas verdes. a)Qual a probabilidade de que ambas sejam verdes ? b) Qual a probabilidade
de que ambas sejam da mesma cor ?
É o uso das fórmulas de análise combinatória para o cálculo do número de casos favoráveis e o número
de casos possíveis.
AR 9,3 = 9 x 9 x 9 = 729
AR 9,2 = 9 x 9 = 81
Exemplo: Se mil títulos entram em sorteio com os números de 000 a 999. Qual a probabilidade:
b - De sair números com a unidade 4 = A10,2 / 1000 = 100 / 1000 = 0,1 ou 10%
Revisão de Fatorial:
5! = 5 x 4 x 3 x 2 x 1 = 120
5! / 3! = 5 x 4 x 3! / 3! = 20
3! x 4! / 5! = 3 x 2 x 1 x 4! / 5 x 4! = 3 x 2 x 1 / 5 = 1,2
Exemplos:
Método tradicional: P(5 espadas) = 13/52 . 12/51 . 11/50 . 10/49 . 9/48 = 0,0005...
Técnica de contagem:
2- De 20 pessoas que se oferecem para doar sangue 15 possuem sangue tipo B. Qual a probabilidade
de, escolhendo-se 3 pessoas desse grupo todas as 3 escolhidas tenham sangue tipo B ?
Seja B1, B2, B3...Bk um conjunto de eventos mutuamente exclusivos cuja união forma o espaço
amostral. Seja A outro evento no mesmo espaço amostral, tal que P(A) > 0 .
Então podemos escrever a fórmula da probabilidade total como : P(A) = E P(Bi) . P(A|Bi)
Exemplo: Segundo especialistas esportivos, a probabilidade de que o Flamengo vença o próximo jogo é
estimada em 0,70 se não chover, e só de 0,50 se chover. Se os registros meteorológicos anunciam uma
probabilidade de 0,40 de chover na data do jogo, qual será então a probabilidade desse time ganhar o
próximo jogo ?
TEOREMA DE BAYES
Sabemos que:
P(A n Bi) = P(A) . P(Bi|A) logo P(Bi|A) = P(A n Bi) / P(A) então substituindo teremos :
Exemplo:
Certo professor da FACEV 4/5 das vezes vai trabalhar usando um fusca e usando um carro importado
nas demais vezes. Quando ele usa o fusca, 75 % das vezes ele chega em casa antes das 23 horas e
quando usa o carro importado só chega em casa antes das 23 horas em 60% das vezes. Ontem o
professor chegou em casa após às 23 horas. Qual a probabilidade de que ele, no dia de ontem, tenha
usado o fusca ?
Exercício:
Certo aluno da FACEV 3/4 das vezes vai estudar usando um fusca e usando um carro importado nas
demais vezes. Quando ele usa o fusca, 35 % das vezes ele chega em casa depois das 23 horas e
quando usa o carro importado só chega em casa antes das 23 horas em 0,55 das vezes. Ontem o aluno
chegou em casa antes das 23 horas. Qual a probabilidade em percentual de que ele, no dia de ontem,
tenha usado o fusca ?
Resposta: 78 %
DISTRIBUIÇÃO DE PROBABILIDADES
Apresentaremos neste capítulo três modelos teóricos de distribuição de probabilidade, aos quais um
experimento aleatório estudado possa ser adaptado, o que permitirá a solução de grande número de
problemas práticos.
Variável Aleatória
Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um número. Fica,
então, definida uma função chamada variável aleatória.
Muitas vezes não estamos interessados propriamente no resultado de um experimento aleatório, mas
em alguma característica numérica a ele associada. Essa característica será chamada variável
aleatória.
Ponto Amostral X
(ca,ca) 2
(ca,co) 1
(co,ca) 1
(co,co) 0
Total 4/4 = 1
Construimos acima uma tabela ondem aparecem os valores de uma variável aleatória X e as
probabilidades de X ocorrer que é a tabela de distribuição de probabilidades.
X P (X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
T o t a l 6/6 = 1
Distribuição Binomial
Vamos imaginar fenômenos cujos resultados só podem ser de dois tipos, um dos quais é condiderado
como sucesso e o outro insucesso. Este fenômeno pode ser repetido tantas vezes quanto se queira (n
vezes), nas mesmas condições. As provas repetidas devem ser independentes, isto é, o resultado de
uma não deve afetar os resultados das sucessivas. No decorrer do experimento, a probabilidade p do
sucesso e a probabilidade de q (q = 1 - p) do insucesso manter-se-ão constantes. Nessas condições X
é uma variável aleatória discreta que segue uma distribuição binomial.
P(x) =
OBS: O nome binomial é devido à fórmula, pois representa o termo geral do desenvolvimento do
binômio de Newton.
Exemplos:
1- Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de serem obtidas
3 caras nessas 5 provas.
2- Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A ganhar 4
jogos.
6- A probabilidade de um atirador acertar o alvo é 2/3. Se ele atirar 5 vezes, qual a probabilidade de
acertar exatamente 2 tiros ?
7- Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10% de
peças defeituosas. Qual a probabilidade de serem defeituosos dois deles ?
Distribuição de Poisson
Distribuição de probabilidades aplicada para acontecimentos raros, entretanto o seu maior uso prático é
como aproximação para a distribuição binomial.
Onde:
é a média da distribuição ( n . p)
e representa a constante de valor igual a 2,718
OBS: quando um acontecimento segue a distribuição binomial com um “p” (sucesso) muito pequeno de
tal modo que temos que ter um “n” muito grande para que o sucesso ocorra. Podemos simplificar os
cálculos usando a distribuição de Poisson como aproximação para a distribuição binomial.
Para que os resultados aproximados pela distribuição de Poisson sejam satisfatórios nós só devemos
fazer a substituição da distribuição binomial pela de Poisson quando “n” for maior ou igual a 50 e “p”
menor ou igual a 0,1 ou “p” maior ou igual a 0,9 ( “p” próximo de 0 ou próximo de 1).
EXERCÍCIOS
1 – Se 2% dos fusíveis são defeituosos.Qual a probabilidade de que uma amostra de 400 fusíveis
exatamente 6 sejam defeituosos?
P (x = 6) = 0,1222 ou 12,24%
2 – Se o número de peixes pescados por hora em certo pesqueiro é uma variável que segue a
distribuição de Poisson com média igual a 1,8, achar a probabilidade de que um pescador, pescando
durante uma hora:
3 - Se 4% de passageiros de avião tem problemas com a bagagem. qual a probabilidade de que entre
150 passageiros até 2 passageiros tenham problemas com suas bagagens?
DISTRIBUIÇÃO NORMAL
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição
Normal.
2ª - A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da
média, que recebe o nome de curva normal ou de Gauss.
3ª - A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde
à probabilidade de a variável aleatória X assumir qualquer valor real.
4ª - A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente
do eixo das abscissas sem, contudo, alcançá-lo.
5ª - Como a curva é simétrica em torno da média, a probabilidade de ocorrer valor maior que a média é
igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais
a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade.
Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é
obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo.
Vejamos com proceder, por meio de um exemplo concreto.
Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa
máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão
= 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm ?
Com o auxílio de uma distribuiçào normal reduzida, isto é, uma distribuição normal de média = 0 e
desvio padrão = 1. Resolveremos o problema através da variável z , onde z = (X - )/S
Utilizaremos também uma tabela normal reduzida, que nos dá a probabilidade de z tomar qualquer valor
entre a média 0 e um dado valor z, isto é: P ( 0 < Z < z)
Temos, então, que se X é uma variável aleatória com distribuição normal de média e desvio padrão
S, podemos escrever: P( < X < x ) = P (0 < Z < z)
No nosso problema queremos calcular P(2 < X < 2,05). para obter ees probabilidade, precisamos, em
primeiro lugar, calcular o valor de z que correponde a x = 2,05
Utilização da Tabela Z
Na primeira coluna encontramos o valor até uma casa decimal = 1,2. Em seguida, encontramos, na
primeira liha, o valor 5, que corresponde ao último alagarismo do número 1,25. Na intersecção da linha
e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever:
P (0 < Z < 1,25 ) = 0,3944 ou 39,44 %, assim a probabilidade de um certo parafuso apresentar um
diâmetro entre a média = 2cm e x = 2,05 cm é de 39,44 %.
Exercícios:
1- Determine as probabilidades:
e) P( Z < 0,92) =
f) P(Z > 0,6) =
2- Os salários dos báncarios são distribuídos normalmente, em torno da média R$ 10.000,00, com
desvio padrão de R$ 800,00. Calcule a probabilidade de um bancário ter o salário situado entre R$
9.800,00 e R$ 10.400,00.
P(-0,25 < Z < 0) + P(0 < Z < 0,5) = 0,0987 +0,1915 = 0,2902 ou 29,02 %
3- Um teste padronizado de escolaridade tem distribuição normal com média = 100 e desvio padrão =
10. Determine a probabilidade de um aluno submetido ao teste ter nota :
b)maior que 80
c)entre 85 e 115
Valor esperado de uma variável aleatória ou de função de variável aleatória corresponde à média
ponderada dos valores que esta variável aleatória ou esta função assume, usando-se como pesos para
ponderação, as probabilidades correspondentes a cada valor.
E (x) = ∑ ( xi . pi ) / ∑ pi
Como ∑ pi = 1
E (x) = ∑ ( xi . pi )
Exemplo 1:
X = xi p(xi) xi . p (xi)
1 1/6 1/6
2 1/6 2/6
3 1/6 3/6
4 1/6 4/6
5 1/6 5/6
6 1/6 6/6
∑= 21/6 = 3,5 pontos
Exemplo 2:
Uma instituição vende bilhetes de rifas por R$ 5,00 cada um. Há 10 prêmios no valor de R$ 25,00 e um
prêmio maior no valor de R$ 100,00. Se forem vendidos 200 bilhetes e você comprar um deles qual a
sua expectativa em relação ao sorteio?
X = xi p(xi) xi . p (xi)
0 189/200 0
25 10/200 250/200
100 1/200 100/200
∑= 1,75
Exemplo 3:
Numa empresa, as previsões de despesa para o próximo ano foram calculadas como; R$ 9, 10, 11 , 12
e 13 bilhões. Supondo que as despesas do ano corrente sejam desconhecidas, as seguintes
probabilidades foram atribuídas respectivamente: 30%, 20%, 25%, 5% e 20%.
DISTRIBUIÇÃO DE
PROBABILIDADES
Exemplo 4:
Um jogo consiste no lançamento de 3 moedas ( a moeda não é viciada). Se der tudo cara ou tudo
coroa, o ganho é de R$ 5,00; mas, dando uma ou duas caras, a perda é de R$ 3,00. O resultado
esperado para o jogo, em reais, será:
CA CA CA
CA CA CO
CA CO CA
CA CO CO
CO CA CA
CO CA CO
CO CO CA
CO CO CO
X = xi p(xi) xi . p (xi)
Tudo cara ou tudo coroa = R$ 5,00 2/8 1,25
Uma cara ou duas coroas = - R$ 3,00 6/8 -2,25
∑= -1,00
Instrumental Matemático - 01
Arredondamento de dados
Muitas vezes, é necessário ou conveniente suprimir unidades inferiores às de determinada ordem. Esta
técnica é denominada arredondamento de dados.
1 - Quando o primeiro algarismo a ser abandonado é 0,1,2,3 ou 4, fica inalterado o último algarismo a
permanecer.
Ex: 53,87 passa a 53,9 ; 44,08 passa a 44,1 ; 44,99 passa a 45,0
Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7 ; 76,250002 passa a 76,3
b) Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a ser conservado
só será aumentando de uma unidade se for ímpar.
Exemplos:
Obs: Não devemos nunca fazer arredondamento sucessivos. Exemplo: 17,3452 passa a 17,3 e não
para 17,35 e depois para 17,4.
Compensação
Verificamos que houve uma pequena discordância: a soma é exatamente 84,7 quando, pelo
arredondamento, deveria ser 84,8. entretanto, para a apresentação dos resultados, é necessário que
desapareça tal diferença, o que é possível pela prática do que denominamos compensação,
conservando o mesmo número de casas decimais.
Obs: Se a maior parcela é igual ou maior que o dobro de qualquer outra parcela, "descarregamos" a
diferença apenas na maior parcela.
Exercícios:
• 23,40 =
• 234,7832 =
• 45,09 =
• 48,85002 =
• 120,4500 =
• 46,727 =
• 123,842 =
• 45,65 =
• 28,255 =
• 37,485 =
• 42,3 =
• 123,842 =
• 295 =
• 2995,000 =
• 59 =
C1 C1 C1 C1 C1 C1 C1 C1 C1 C1 C2 C2 C2 C2 C2 C2 C2 C2 C2
C1 C2 C3 C4 C5 C6 C7 C8 C9 C29
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8
L1 4 1 6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4
L2 3 0 7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2
L3 2 2 5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0
L4 1 9 8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4
L5 0 3 4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0
L6 0 8 9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1
L7 8 3 3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2
L8 8 8 0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3
L9 5 4 1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6
L1
6 7 2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0
0
L1
4 4 0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9
1
L1
3 5 1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3
2
L1
2 6 9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2
3
L1
0 1 2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3
4
L1
9 0 8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5
5
L1
7 2 2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0
6
L1
8 9 3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9
7
L1 6 3 0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8
8
L1
5 8 1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5
9
L2
3 4 0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4
0
L2
8 7 2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1
1
L2
1 4 9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2
2
L2
2 7 3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3
3
L2
4 3 8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4
4
L2
5 0 3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5
5
L2
2 5 7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8
6
L2
1 1 4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0
7
L2
0 2 7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8
8
L2
9 1 5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1
9
EXERCÍCIOS
A - Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2 ; outros 3 obtiveram a nota 9,0 ; 5
obtiveram a nota 8,6 ; 1 obteve a nota 7,0 e 1 a nota 8,9. A nota média dos alunos será:
B - Um professor, após verificar que toda a classe obteve nota baixa, eliminou as questões que não
foram respondidas pelos alunos. Com isso, as notas de todos os alunos foram aumentadas de 3 pontos.
Então:
1. ao número - 4
2. ao número 8
3. ao número 0
4. ao número 25
5. ao número 4
1. igual a 15
2. igual a 10
3. igual a 7
4. igual a 3,5
5. não há mediana, pois não existe repetição de valores.
E - Numa pesquisa de opinião, 80 pessoas são favoráveis ao divórcio, 50 são desfavoráveis, 30 são
indiferentes e 20 ainda não têm opinião formada a respeito do assunto. Então a média aritmética será:
F- Segundo o site de VEJA na internet 28% da população brasileira é de origem africana, 32% de
origem portuguesa, 20% de origem italiana e 20% de outras origens. Qual é a moda quanto a origem ?
1. 32%
2. 20%
3. 32% da população.
4. origem portuguesa.
5. não podemos identificar a moda por falta de dados.
G- Numa determinada Escola com 300 alunos 34% deles completam o 2º grau em 3 anos e 66% em 4
anos. Qual o tempo médio de conclusão do 2º grau na referida Escola.
1. 7 anos.
2. 3 e 4 anos.
3. 3,66 anos.
4. 3 ou 4 anos.
5. 3,5 anos.
K- Quando a medida de posição deve ser o valor mais típico da distribuição utilizamos:
1. a média.
2. a mediana.
3. a moda.
4. a média, a moda e mediana.
5. a moda ou a média.
L- Quando desejamos o ponto médio exato de uma distribuição de frequência, basta calcular:
1. o desvio médio.
2. a média.
3. a moda.
4. a mediana.
5. qualquer medida de posição.
M- Considere uma série estatística com 2351 elementos. A posição da mediana é representada pelo:
1. 1175º elemento.
2. 1176º elemento.
3. ponto médio entre o 1175º e o 1176º elemento.
4. 1175,5º elemento.
5. Impossível resolução, pois não há identificação dos elementos.
1 - O SALÁRIO MÉDIO DOS BANCÁRIOS EM 1989, ERA DE 450 DÓLARES. O NÚMERO ÍNDICE DO
IPC NESSE MESMO ANO, FOI IGUAL A 1234,5 E O DE 1986 FOI IGUAL A 783,2 REFERIDOS AO
PERÍODO BASE EM 1977. QUAL O SALÁRIO MÉDIO DOS BANCÁRIOS EM 1989 A PREÇOS
CONSTANTES DE 1986:
RESPOSTA:
US$ 285,49
RESPOSTA:
RESPOSTA :
Devemos acumular os índices registrados em jan, fev e mar (convertendo antes os percentuais em
fatores):
RESPOSTA :
Sendo Y = peso de A
1,058 = 4,12Y + 1 - Y
Y = 0,058 / 3,12
Y = 0,0186
obs: quando transformamos peso decimal para % basta multiplicar por 100
RESPOSTA :
Pt = R$ 17,20
17,20 / Po = 0,64
Po = R$ 26,88
o set/96 = 1299,8
o out/96 = 1250,0
o nov/96 = 1256,9
o dez/96 = 1245,0
o jan/97 = 1324,1
o fev/97 = 1328,0
o mar/97 = 1325,0
o abr/97 = 1345,0
RESPOSTA : O procedimento é simples, basta dividir o nº índice de abr/97 pelo número índice de
out/96:
o set/96 = 1299,8
o out/96 = 1250,0
o nov/96 = 1256,9
o dez/96 = 1245,0
o jan/97 = 1324,1
o fev/97 = 1328,0
o mar/97 = 1325,0
o abr/97 = 1345,0
RESPOSTA : O procedimento é simples, basta dividir o nº índice de MAR/97 pelo número índice
de DEZ/96:
1960 = 100 ; 1961 = 110 ; 1962 = 90 ; 1963 = 120 . COM BASE EM 1960, O ÍNDICE DE 1963
SERÁ:
9- PARA UMA TAXA DE INFLAÇÃO DE 25% QUAL A PERDA PERCENTUAL DO PODER AQUISITIVO
DA MOEDA ?
R: 110 x 112 / 100 = 123,2 123,2 x 115 / 100 = 141,68 141,68 x 125 / 100 = 177,10
Nível de significância 0,10 ou 10% 0,05 ou 5% 0,01 ou 1% 0,005 ou 0,5% 0,002 ou 0,2%
Valores críticos de z -1,28 ou -1,645 ou -2,33 ou -2,58 ou -2,88 ou
Ho = 12 cm
H1 > ou < 12 cm (bilateral)
média amostral = 11,8 cm
média de Ho = 12 cm
tamanho da amostra = 95 (n>30)
desvio padrão populacional = 0,9 cm
Zteste = (11,8-12,0)/((0,9/95^(1/2))
Zteste = -2,166
Ho = 12 cm
H1 > ou < 12 cm (bilateral)
média amostral = 11,8 cm
média de Ho = 12 cm
tamanho da amostra = 95 (n>30)
desvio padrão populacional = 0,9 cm
Zteste = (11,8-12,0)/((0,9/95^(1/2))
Zteste = -2,166
Ho = 12 cm
H1 > ou < 12 cm (bilateral)
média amostral = 12,2 cm
média de Ho = 12 cm
tamanho da amostra = 95 (n>30)
desvio padrão populacional = 0,9 cm
Zteste = (12,2-12,0)/((0,9/95^(1/2))
Zteste = 2,166
Ho = 12 cm
H1 > ou < 12 cm (bilateral)
média amostral = 12,2 cm
média de Ho = 12 cm
tamanho da amostra = 95 (n>30)
desvio padrão populacional = 0,9 cm
Zteste = (12,2-12,0)/((0,9/95^(1/2))
Zteste = 2,166
Nível de significância 0,10 ou 10% 0,05 ou 5% 0,01 ou 1% 0,005 ou 0,5% 0,002 ou 0,2%
Valores críticos de z -1,28 ou -1,645 ou -2,33 ou -2,58 ou -2,88 ou
o Sucessos reais = 50 - 10 = 40
o proporção populacional de sucessos p = 0,85
o proporção populacional de fracassos q = 0,15
o tamanho da amostra = 50
o ponto crítico p/ 5% = -1,645 (unilateral)
Zteste = (38-(50*0,85))/(50*0,85*0,15)^(1/2)
Zteste = -0,9901
o Sucessos reais = 50 - 12 = 38
o proporção populacional de sucessos p = 0,85
o proporção populacional de fracassos q = 0,15
o tamanho da amostra = 50
o ponto crítico p/ 5% = -1,645 (unilateral)
Zteste = (38-(50*0,85))/(50*0,85*0,15)^(1/2)
Zteste = -1,7823
o Sucessos reais = 50 - 12 = 38
o proporção populacional de sucessos p = 0,85
o proporção populacional de fracassos q = 0,15
o tamanho da amostra = 50
o ponto crítico p/ 10% = -1,28 (unilateral)
Zteste = (38-(50*0,85))/(50*0,85*0,15)^(1/2)
Zteste = -1,7823
o Sucessos reais = 50 - 13 = 37
o proporção populacional de sucessos p = 0,85
o proporção populacional de fracassos q = 0,15
o tamanho da amostra = 50
o ponto crítico p/ 1% = -2,33 (unilateral)
Zteste = (37-(50*0,85))/(50*0,85*0,15)^(1/2)
Zteste = -2,1783