Fascículo de Estatística Descritiva 2 Ano Enfermagem 2023

4
Introdução a cadeira de Estatística Descritiva
Nesta unidade, serão abordados temas relacionados ao método estatístico. Oferecer

exemplos de tabelas e gráficos que podem representar, de forma sintética, as
informações obtidas através de processos de pesquisa, são objetivos específicos desta
unidade, que tem o propósito de:
Demonstrar a importância da Estatística na vida diária;
Mostrar como podemos utilizá-la de forma correta;
Ensinar como compor tabelas a partir de dados numéricos;
Ensinar como representar dados numéricos em gráficos.
Esta disciplina servirá de apoio aos estudantes em Enfermagem e Matemática no processo

de tomada de decisão. Ao longo do curso serão apresentado a um leque de métodos
estatísticos, descritivos e inferenciais, com o intuito de facilitar a manipulação e análise
de dadossssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss.
No final do curso, espera-se que os estudantes possuem competências referente à
compreensão do significado de um experimento estatísticos, identificar as variáveis a
serem estudadas que esteja habilitado a reconhecer um gráfico, uma tabela estatística e
fazer uma análise dos dados ali apresentados. Que saiba fazer uma estimação pontual ou
por intervalo de uma média ou proporção populacional que tenha criado uma concepção
aplicada do conceito de teste de hipótese sobre a média e sobre a proporção populacional,
saiba formular tal teste e apresentar conclusões sobre o mesmo.
Nesta cadeira vamos abordar temas como: Natureza e Fundamentos do Método

Estatístico, Amostragem, Distribuição de Dados e de Freqüência, Medidas de Posição,
Medidas de Dispersão, Probabilidade e por último falaremos das Variáveis Aleatórias.
O docente: Beto Francisco André Lourenço

Ano acadêmico: 2022/2023
5
Introdução à Estatística
A Estatística é considerada por alguns autores como Ciência no sentido do estudo de

uma população.
É considerada como método quando utilizada como instrumento por outra Ciência.
A palavra estatística frequentemente está associada à imagem de aglomeração de
números, dispostos em uma imensa variedade de tabelas e gráficos, representando
informações tão diversas quanto nascimentos, mortes, taxas, populações, rendimentos,
débitos, créditos, etc. Isto é devido ao uso comum da palavra estatística como sinônimo
de dados, como, por exemplo, quando falamos das estatísticas de uma eleição,
estatísticas da saúde, estatísticas de acidente de trânsito ou as estatísticas de acidentes de
trabalho.
No sentido moderno da palavra, estatística lida com o desenvolvimento e aplicação de
métodos para coletar, organizar, analisar e interpretar dados de tal modo que a
segurança das conclusões baseada nos dados pode ser avaliada objetivamente por meio
de proposições probabilísticas.
O propósito da estatística não é exclusivo de qualquer ciência isolada. Ao contrário, a
estatística fornece um conjunto de métodos úteis em toda área científica onde haja a
necessidade de se coletar, organizar, analisar e interpretar dados. Estes métodos podem
ser usados tão eficazmente em farmacologia como em engenharia, em ciências sociais
ou em física.
A palavra estatística lembra, à maioria das pessoas, recenseamento. Os censos

existem há milhares de anos e constituem um esforço imenso e caro feito pelos
governos, com o objetivo de conhecer seus habitantes, sua condição socioeconômica,
sua cultura, religião, etc. Portanto, associar estatística a censo é perfeitamente
correto do ponto de vista histórico, sendo interessante salientar que as palavras
estatística e estado têm a mesma origem latina: Status
A estatística é também comumente associada às pesquisas de opinião pública, aos

vários índices governamentais, aos gráficos e às médias publicados diariamente na
imprensa. Na realidade, entretanto, a estatística engloba muitos outros aspectos,
sendo fundamental na análise de dados provenientes de quaisquer processos onde
exista variabilidade.
Conceitos Básicos de Estatística

A Estatística é a ciência que trata da coleta, do processamento e da disposição dos
dados.
A estatística teve acelerado seu desenvolvimento a partir do século XVII, através dos estudos de
BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER,
POISSON e outros que estabeleceram suas características essenciais.
A Estatística tem como OBJETIVO o estudo dos fenômenos coletivos.
Grandes áreas da Estatística

Para fins de apresentação, é usual se dividir a estatística em três grandes áreas, embora
não se trate de ramos isolados:

6
• Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam coletar,

organizar, apresentar, analisar e sintetizar os dados numéricos de uma população, ou
amostra;
• Estatística Inferencial – Processo de se obter informações sobre uma população
a partir de resultados observados na amostra;
• Probabilidade - Modelos matemáticos que explicam os fenômenos estudados
pela Estatística em condições normais de experimentação.
A Estatística é a ciência que trata da coleta, do processamento e da disposição dos dados.
Objetivando o estudo quantitativo e qualitativo dos dados (ou informações), obtidos nos vários
campos da atividade científica, a Estatística manipula dois conjuntos de dados fundamentais: a
"população" e a "amostra".
População (ou Universo)

É o conjunto dos seres, objetos ou informações que interessam ao estudo de um fenômeno
coletivo segundo alguma(s) característica(s). É, portanto, um conjunto definido de informações
relativas a qualquer área de interesse, podendo, quanto ao número de elementos, ser: finita
(tamanho N) ou infinita. Na maioria das vezes não é conveniente, ou mesmo possível, realizar o
levantamento dos dados referentes a todos os elementos de uma população. Portanto,
analisamos parte da população, isto é, uma amostra.
Amostra
É um subconjunto não vazio ou parte da população. Duas considerações devem ser feitas sobre
o estudo amostral dos fenômenos. Uma diz respeito aos cuidados que se deve tomar para
assegurar que a amostra seja representativa da população. Para atender a essa exigência, deve-se
selecionar os elementos de forma aleatória, de modo que todo e qualquer elemento da população
tenha a mesma chance de participar da amostra, a outra diz respeito à precisão dos dados
coletados, buscando minimizar os erros que poderiam induzir a conclusões equivocadas. O
número de elementos de uma amostra é chamado o tamanho da amostra, e denotado por n.
1.2. Importância da Estatística

O mundo está repleto de problemas. Para resolvermos a maioria deles, necessitamos de
informações. Mas, que tipo de informação? Que quantidade de informações? Após obtê-
las, que fazer com elas? A Estatística trabalha com essas informações, associando os
dados ao problema, descobrindo como e o que coletar, assim capacitando o pesquisador
(ou profissional ou cientista) a obter conclusões a partir dessas informações, de tal
forma que possam ser entendidas por outras pessoas. Portanto, os métodos estatísticos
auxiliam o cientista social, o economista, o engenheiro, o agrônomo, o enfermeiro e
muitos outros profissionais a realizarem o seu trabalho com mais eficiência.
Definição : Parâmetro
Uma característica numérica estabelecida para toda uma população é denominada parâmetro.
São valores, geralmente desconhecidos (e que portanto têm de ser estimados), que representam
certas características da população.
Definição : Estimador
É uma característica baseada em observações amostrais e usada para indicar o valor de um

7
parâmetro populacional desconhecido.

Definição : Estimativa
O valor numérico assumido pelo estimador numa determinada amostra.
Exemplo :
No fenômeno coletivo eleição para reitor da UFPB, a população é o conjunto de todos os
eleitores habilitados na Universidade. Um parâmetro é a proporção de votos do candidato A.
Uma amostra pode ser um grupo de 300 eleitores selecionados em toda a UFPB. Um estimador
é a proporção de votos do candidato A obtida na amostra. O valor resultante do estimador, a
proporção amostral, é a estimativa.
Processos Estatísticos de Abordagem
Quando solicitados a estudar um fenômeno coletivo podemos optar entre os seguintes processos
estatísticos:
a) CENSO - avaliação direta de um parâmetro, utilizando-se todos os componentes da
população. Entre as principais características de um Censo, podemos destacar: admite erro
processual zero e tem confiabilidade 100%, caro, lento e quase sempre desatualizado. Nem
sempre é viável.
b) AMOSTRAGEM (INFERÊNCIA) - avaliação indireta de um parâmetro, com base em um
estimador através do cálculo das probabilidades. Entre as principais características, podemos
destacar: admite erro processual positivo e tem confiabilidade menor que 100%, é barata, rápida
e atualizada. É sempre viável.
Conceitos Fundamentais
• Riscos - é a margem de erro motivado pelo fato de investigarmos parcialmente (amostras) o
universo (população).
• População-alvo - é a população sobre a qual vamos fazer inferências baseadas na amostra.
Para que possamos fazer inferências válidas sobre a população a partir de uma amostra, é
preciso que essa seja representativa. Uma das formas de se conseguir representatividade é fazer
com que o processo de escolha da amostra seja, de alguma forma, aleatório. Além disso, a
aleatoriedade permite o cálculo de estimativas dos erros envolvidos no processo de inferência.
Quanto à extração dos elementos, as amostras podem ser:
• Com reposição - quando um elemento sorteado puder ser sorteado novamente;
• Sem reposição - quando o elemento sorteado só puder figurar uma única vez na amostra.
Basicamente, existem dois métodos para composição da amostra: probabilístico e não
probabilístico (intencional).
• O método de amostragem probabilística exige que cada elemento da população possua
determinada probabilidade de ser selecionado. Normalmente, possuem a mesma probabilidade.
Assim, se N for o tamanho da população, a probabilidade de cada elemento será 1/N. Somente
com base em amostragens probabilísticas pode-se realizar inferências sobre a população, a partir
dos parâmetros estudados na amostra. São elas:
• Amostragem Aleatória Simples;
• Amostragem Aleatória Estratificada;
• Amostragem Sistemática;
• Amostragem por Conglomerado.
Por serem as principais técnicas estudadas, serão mais detalhadamente exploradas no.
• Os métodos não probabilísticos são amostragens em que há uma escolha deliberada dos
elementos que compõem a amostra. Não se pode generalizar os resultados das pesquisas para a
população, uma vez que as amostras não probabilísticas não garantem a representatividade da

8
população. São elas:

• Amostragem Acidental;
• Amostragem Intencional;
• Amostragem por Quotas.
Amostragem Acidental - É formada por elementos que vão aparecendo, que são possíveis de se
obter até completar o número de elementos da amostra.
Ex: Pesquisa de opinião, em que os entrevistados são acidentalmente escolhidos.
Amostragem Intencional - É formada por elementos escolhidos por determinado critério, ou
seja, escolhe-se intencionalmente um grupo de elementos que irão compor a amostra.
Amostragem Aleatória Simples

A amostragem aleatória simples é um processo para selecionar amostras de tamanho “n” dentre
as “N” unidades em que foi dividida a população. Sendo a amostragem realizada sem reposição,
que é o caso mais comum, existem (N,n) possíveis amostras, todas igualmente prováveis. As
amostras aleatórias podem ser escolhidas por diversos métodos, inclusive por tabelas de
números aleatórios (TNA) e de computadores para gerar números aleatórios Na prática, a
amostra aleatória simples é escolhida unidade por unidade. As unidades da população são
numeradas de 1 a N. Em seguida, escolhe-se, na tabela de números aleatórios (TNA), (ou por
computador) n números compreendidos entre 1 e N. Esse processo é equivalente a um sorteio
no qual se colocam todos os números misturados dentro de uma urna.
As unidades correspondentes aos números escolhidos formarão a amostra.
Observação:
1. Um exemplo de TNA encontra-se no final da unidade 2.
2. A TNA (Tabela de Números Aleatórios) – consiste em tabelas que apresentam seqüências dos
dígitos de 0 a 9 distribuídos aleatoriamente nas linhas(horizontais) e colunas (verticais). Para
obtermos os elementos da amostra usando a TNA, sorteamos uma linha e uma coluna qualquer
para começarmos a leitura. Por exemplo: escolho 3ª linha 15ª coluna o digito encontrado é 5. A
leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),
verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou
descendente). A opção, porém, deve ser feita antes de iniciado o processo.
Assim, em nossos exercícios, avaliações e trabalhos, utilizaremos sempre a TNA lendo na
vertical, de cima para baixo, considerando sempre as colunas da esquerda para a direita.
Exemplo de utilização da TNA

Procure os 10 primeiros números na TNA começando a leitura na 9ª linha e na 5ª coluna
(lembre-se que cada dígito representa uma coluna).
(Resposta: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3).
3. Para retirar amostras em populações com mais de 10 itens, necessitaremos ler as colunas
quantos dígitos comporem o número total de itens da população. Exemplo: para retirarmos 5
amostras de uma população com 300 itens, temos que ler três colunas para conseguirmos
valores entre 001 e 300. Se o número sorteado superar o número de elementos rotulados,
abandona-se o número sorteado, prosseguindo-se o processo. Considerando 9ª linha e 5ª coluna
temos como resposta : 124,056,094,143,014.
Outras técnicas de amostragem são preferíveis à aleatória simples, pois levam em consideração
a composição da população, facilitando o trabalho de seleção de amostras e aumentando a
precisão.

9
Exemplo:
Vamos obter uma amostra representativa de 8 itens para a pesquisa da estatura de noventa
alunos de uma escola. Utilize a TNA (3ª linha e 8ª Coluna).
Resolução:
• Numeramos os alunos de 01 a 90;
• Iniciamos o processo de sorteio dos itens da amostra na TNA considerando as colunas 8ª e 9ª,
pois 90 são dois dígitos;
• A amostra será os alunos correspondentes aos números: 46, 58, 16, 51, 88, 09, 89, 14.
Amostragem Aleatória Estratificada

Uma amostra estratificada é obtida separando-se as unidades da população em grupos não
superpostos chamados estratos, e selecionando-se independentemente uma amostra aleatória
simples de cada estrato. Existem dois tipos de amostragem estratificada:
• De igual tamanho;
• Proporcional.
No primeiro tipo, sorteia-se igual número de elementos em cada estrato. Esse processo é
utilizado quando o número de elementos por estrato for aproximadamente o mesmo.
No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de
𝑁𝑎 𝑛𝑎 𝑛
calcular o número de amostras por estrato é: 𝑁
= 𝑛
→ 𝑛𝑎 = 𝑁 . 𝑁𝑎
N → Nº de unidades da população
n → Nº de unidades das amostras
Na → Nº de unidades do estrato A
na → Nº de amostras de A
Ex: Calcule o número de amostras por estrato sabendo que a população é de 300 pacientes numa
unidade das amostras de 100 pacientes (10,20,30,40,50,100,150,200,300)
Resolução: Dados: Resolução

𝑁𝑎 𝑛𝑎
𝑛𝑎 = 𝑁
= 𝑛
𝑛
N=300 pac 𝑛𝑎 = . 𝑁𝑎
𝑁
100
n= 100 pac 𝑛𝑎 = 300 . 9
900
𝑁𝑎 = 9 𝑢 𝑛𝑎 = 300 = 3
Ex: Calcule o número de unidade das amostras sabendo que a população é de 100 pacientes num
número de amostras de estrato A de 10 pacientes em unidades de estrato de 20 pacientes por
salas
Resolução: Dados: Resolução

10
𝑁𝑎 𝑛𝑎
𝑛𝑎 = 10 =
𝑁 𝑛
𝑁 . 𝑛𝑎
N=100 pac 𝑛= 𝑁𝑎
100.10
n= 𝑛𝑎 = 20
1000
𝑁𝑎 = 20 𝑢 𝑛𝑎 = = 50𝑢
20
Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam meninas,
vamos obter uma amostra proporcional estratificada de 10%.
Dados: n=2, N=90, na= , Na1=54, Na2=36
Resolução:
• São, portanto, dois estratos (sexo masculino e feminino) e queremos uma amostra de 10% da
população;
• Calcula-se o número de amostras de cada estrato.
Calcula-se a percentagem, pegando o valor da população dividindo pela percentagem em causa.
Sexo População 10% Número de amostras
M 54 5,4 5
F 36 3,6 4
Total 90 9,0 9
• Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90,

meninas. O próximo passo é o mesmo do exemplo anterior.
Amostragem por Conglomerado

Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de
amostragem é um grupo, ou um conglomerado de elementos.
O primeiro passo na amostragem por conglomerado é especificar conglomerados apropriados.
Os elementos em um conglomerado tendem a ter características similares, portanto, o fato de
novas medidas serem tomadas num conglomerado não implica necessariamente aumento de
informação sobre o parâmetro populacional.
Como regra geral, o número de elementos num conglomerado deverá ser pequeno em relação ao
tamanho da população e o número de conglomerados deverá ser razoavelmente grande.
Na amostragem por conglomerado a população é dividida em grupos. E selecionam-se amostras
aleatórias simples de grupos e, então, todos os itens dos grupos (conglomerados) selecionados
farão parte da amostra.
Exemplo:
Em um levantamento da população de uma cidade, podemos dispor do mapa indicando cada
quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher

11
uma amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles
quarteirões sorteados.
Amostragem Sistemática
Quando os elementos da população já se encontram ordenados, não há necessidade de se
construir o sistema de referência. Nesses casos, a seleção dos elementos que constituirão a
amostra pode ser por um sistema imposto pelo pesquisador.
Em geral, para se obter uma amostra sistemática de n elementos de uma população de tamanho
N, K deve ser menor ou igual a N/n. Não é possível determinar K, precisamente, quando o
tamanho da população é desconhecido, mas pode-se supor um valor de k de tal modo que seja
possível obter uma amostra de tamanho n. Em vez da amostragem aleatória simples, pode-se
empregar a amostragem sistemática pelas seguintes razões:
• a amostragem sistemática é mais fácil de se executar e, por isso, está menos sujeita a erros do
entrevistador do que aqueles que acontecem na aleatória simples;
• a amostragem sistemática freqüentemente proporciona mais informações por custo unitário do
que a aleatória simples.
Diretrizes para calcular as amostras:
1º - Estabelecer o intervalo de amostragem K:
K =N/n
OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.
2º - Iniciar aleatoriamente a composição da amostra.
b → inicio (nº de ordem inicial sorteado na TNA).
OBS: 0 < b ≤ K
3º - Composição da Amostra:
1º item →b
2º item →b + K
3º item →b + 2k
Exemplo:
1 – Suponhamos uma rua contendo quinhentos prédios, dos quais desejamos obter uma amostra
formada de vinte prédios. (TNA, 3ªLinha e 5ª Coluna)
Solução:
a) Calcular K (intervalo de amostragem)
b) K=500/20→ K=25
c) b= 12 (valor encontrado na TNA)
d) Composição da amostra
1º item → 12
2º item → 12 + 25 = 37
3º item → 12 + 2.25 = 62
20º item → 12 +19.25 = 487
Dados Estatísticos
Normalmente, no trabalho estatístico, o pesquisador se vê obrigado a lidar com grande
quantidade de valores numéricos resultantes de um censo ou de uma amostragem. Estes valores
numéricos são chamados dados estatísticos.
No sentido da disciplina, a Estatística ensina métodos racionais para a obtenção de informações
a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e
também permitir tomada de decisões, através dos dados estatísticos observados. Desta forma, a

12
estatística pode ser dividida em duas áreas: Estatística Descritiva e Estatística Inferencial.
Estatística Descritiva
É a parte da Estatística que tem por objetivo descrever os dados observados. A Estatística
Descritiva, na sua função de descrição dos dados, tem as seguintes atribuições:
• A obtenção dos dados estatísticos;
• A organização dos dados;
• A redução dos dados;
• A representação dos dados;
• A obtenção de algumas informações que auxiliam a descrição do fenômeno observado.
A obtenção ou coleta dos dados é normalmente feita através de um questionário ou de

observação direta de uma população ou amostra. A organização dos dados consiste na
ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões,
abandono de dados duvidosos, etc. A redução dos dados envolve o entendimento e a
compreensão de grande quantidade de dados através de simples leitura de seus
valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais
experimentado pesquisador. A representação dos dados compreende de técnicas para uma
melhor visualização dos dados estatísticos, facilitando sua compreensão. Por exemplo, os
gráficos, quando bem representativos, tornam-se importantes instrumentos de trabalho. É ainda
atributo da Estatística Descritiva a obtenção de algumas informações que sumarizam os dados,
facilitando a descrição dos fenômenos observados.
Estatística Inferencial (ou Indutiva)
É a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a
partir de uma amostra. Complementando o processo descritivo, a Estatística Indutiva estuda
parâmetros a partir do uso de estimadores usando o cálculo das probabilidades, elemento este
que viabiliza a Inferência Estatística.
Dados ou Variáveis Estatísticas
As informações ou dados característicos dos fenômenos ou populações são denominados
variáveis estatísticas ou simplesmente variáveis. Conforme suas características particulares,
podem ser classificadas da seguinte forma:
• Quantitativas - São aquelas que podem ser expressas em termos numéricos. Em geral são as
resultantes de medições, enumerações ou contagens. São subdivididas em contínuas e
discretas, conforme abaixo:
O Contínuas - são aquelas que podem assumir qualquer valor num certo intervalo de
medida, podendo ser associados ao conjunto dos números reais, ou seja, é um
conjunto não enumerável. Entre outras, enquadram-se nesta categoria as medidas de
tempo, comprimento, espessura, área, volume, peso, velocidade, dosagem de hemoglobina no
sangue, concentração de flúor na água oferecida à população, etc.
O Discretas - quando só podem assumir determinados valores num certo intervalo, ou
seja, é um conjunto finito ou enumerável. Em geral, representam números inteiros resultantes de
processo de contagem, como o número de alunos por sala, de créditos por disciplinas, de
pacientes atendidos diariamente num hospital, etc.
De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a
variáveis discretas. Designamos estas variáveis por letras latinas, em geral, as últimas: X, Y, Z.
• Qualitativas - Nem sempre os elementos de uma população são exclusivamente contáveis.
Muitas vezes, eles podem ser qualificados também segundo algumas de suas características
típicas. Nesses casos, as variáveis podem ser agrupadas em nominais ou ordinais (por
postos)

13
O Nominais - quando puderem ser reunidas em categorias ou espécies com idênticos

atributos. Aqui se incluem os agrupamentos por sexo, área de estudo, desempenho, cor, raça,
nacionalidade e religião.
O Ordinais - quando os elementos forem reunidos segundo a ordem em que aparecem
dispostos numa lista ou rol. São típicas desta forma de agrupamento, variáveis como classe
social, grau de instrução, entre outras.
Em geral, uma mesma população pode ser caracterizada por mais de um tipo de variável. Assim,
os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser
agrupados segundo o sexo ou área de estudo e podem ainda ser classificados segundo as notas
obtidas nas provas prestadas.
Fases do Experimento Estatístico
Em linhas gerais, podemos distinguir no método estatístico as seguintes etapas:
Planejamento
É o trabalho inicial de coordenação no qual define-se a população a ser estudada
estatisticamente, formulando-se o trabalho de pesquisa através da elaboração de questionário,
entrevistas, etc.
A organização do plano geral implica em obter respostas para uma série tradicional de
perguntas, antes mesmo do exame das informações disponíveis sobre o assunto, perguntas que
procuram justificar a necessidade efetiva da pesquisa, a saber:
- "quem", "o que", "sempre", "por que", "para que", "para quando".
Imaginemos, por exemplo, que o Governo do Estado tenha necessidade de obter informações
acerca do desempenho em Matemática dos estudantes matriculados na rede pública de ensino.
O primeiro trabalho da equipe encarregada da pesquisa, será evidentemente, o de obter respostas
para aquelas perguntas. Seriam então:
- Quem deseja as informações?
- O que devemos perguntar no questionário?
- A pesquisa será periódica ou ocasional? Será executada sempre?
- Por que desejam as informações?
- Quando deverá estar concluída a pesquisa?
- Qual a época oportuna para a aplicação dos questionários?
- Para que desejam as informações?
Ainda na fase do planejamento, temos:
• O exame das informações disponíveis: trabalho inicial de coleta de trabalhos ou publicações
sobre o assunto, obtendo-se relatórios sobre atividades semelhantes ou correlatas;
• A Definição do Universo, isto é, saber qual o conjunto a ser pesquisado, distribuindo,
classificando ou agrupando os elementos desse conjunto em subpopulações, para permitir
um trabalho mais fácil, mais lógico, mais racional;
• O tipo de levantamento, Censo ou Amostragem, deverá ser decidido com a devida
antecedência e a necessária análise das vantagens e desvantagens de um e de outro, em virtude
do custo financeiro e do prazo determinado para a conclusão do trabalho.
Coleta de Dados
Após cuidadoso planejamento e a devida determinação das características mensuráveis do
fenômeno coletivamente típico que se quer pesquisar, damos início à coleta dos dados
numéricos necessários à sua descrição.
A coleta dos dados poderá ser feita de diversas formas. A ideal é aquela que maximiza os
recursos disponíveis, dados os objetivos e a precisão previamente estipulados. No seu

14
planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se manifestará,
a frequência de sua ocorrência, e outras particularidades julgadas importantes.
Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poderá ser realizada
mediante respostas a questionários previamente elaborados. Esses questionários podem ser
enviados aos entrevistados para devolução posterior ou podem ser aplicados pelos próprios
pesquisadores ou por entrevistadores externos ou contratados.
Os dados ou informações representativas dos fenômenos ou problema em estudo podem ser
obtidos de duas formas: por via direta ou por via indireta.
1. Por via direta - quando feita sobre elementos informativos de registro obrigatório (p. ex.:
fichas no serviço de ambulatório, nascimentos, casamentos, óbitos, matrículas de alunos etc.)
ou, ainda, quando os dados são coletados pelo próprio pesquisador através de entrevistas ou
questionários. A coleta direta de dados, com relação ao fator tempo, pode ser classificada em:
1.1. Contínua - também denominada registro, é feita continuamente, tal como a de nascimentos
e óbitos, etc. Também são do tipo contínuo o registro de certas doenças, como câncer,
hanseníase, tuberculose e também algumas doenças infecciosas agudas com finalidade de
controle.
1.2. Periódica - quando feita em intervalos constantes de tempo, como os censos(de 10 em 10
anos), os balanços de uma farmácia, etc.;
1.3. Ocasional - quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma
emergência, como no caso de epidemias que assolam ou dizimam seres humanos.
2. Por via indireta - quando é inferida de elementos conhecidos (coleta direta) e/ou
conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo,
podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos via
coleta direta.
Crítica dos Dados
Os dados colhidos por qualquer via ou forma e não previamente organizados são chamados de
dados brutos. Esses dados brutos, antes de serem submetidos ao processamento estatístico
propriamente dito, devem ser "criticados", visando eliminar valores impróprios e erros
grosseiros que possam interferir nos resultados finais do estudo.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas; é interna quando se observa o material
constituído pelos dados coletados. É o caso, por exemplo, da verificação de somas de valores
anotados.
Apuração ou Processamento dos Dados
Uma vez assegurado que os dados brutos são consistentes, devemos submetê-los ao
processamento adequado aos fins pretendidos. A apuração ou processamento dos dados pode ser
manual, eletromecânica ou eletrônica. Os processos e métodos estatísticos a que um conjunto de
dados pode ser submetido serão nosso objeto de estudo nas seções seguintes.
Exposição ou Apresentação dos Dados
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados
sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo
objeto de tratamento estatístico.
No caso particular da estatística descritiva, o objetivo do estudo se limita, na maioria dos casos,
à simples apresentação dos dados, assim entendida a exposição organizada e resumida das
informações coletadas através de tabelas ou quadros, bem como dos gráficos resultantes.
Análise dos Resultados
Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a
partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as

15
fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos
métodos da Estatística Inferencial, que tem por base a indução ou inferência, e tiramos desses
resultados conclusões e previsões.
Estatística Descritiva
A Estatística Descritiva é a parte da estatística que se ocupa com a coleta, crítica, ordenação e
apresentação das informações fundamentais à caracterização e descrição do fenômeno que se
deseja estudar e interpretar. Aqui se trabalhará com alguma característica notável do objeto de
estudo, a qual terá de ser coletada de alguma forma e em algum lugar. Na coleta das
informações deve-se considerar, preferencialmente, toda a população; caso a obtenção de dados
sobre toda a população (censo) seja difícil ou até mesmo impossível (dado o grande número de
elementos ou a sua dispersão no tempo ou no espaço), o estudo poderá ser feito com base numa
amostra representativa.
Distribuições de Frequência
Os dados numéricos, após coletados, são colocados em série e apresentados em tabelas ou
quadros. Quando se estuda uma variável (qualitativa ou quantitativa), o maior interesse do
pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores)
da mesma. Iremos, pois, ver uma maneira de se dispor um conjunto de valores, de modo a se ter
uma boa ideia global sobre esses valores, ou seja, de sua distribuição.
Uma distribuição de frequências pode ser apresentada nas seguintes maneiras:
• Distribuição de Frequências por Valores (variável qualitativa ou quantitativa discreta): É
construída considerando-se todos os diferentes valores ou categorias, levando em consideração
suas respectivas repetições.
• Distribuição de Frequências por Intervalos ou Classes (variável quantitativa): Constroemse
classes de valores, levando em consideração o número de valores que pertencem a cada
classe e quando a variabilidade dos dados é grande. A construção de tabelas de frequências
para variáveis contínuas necessita de certos cuidados.
Informações sobre sexo, curso, idade (anos), procedência, renda familiar, número de disciplinas
matriculado(a), peso (kg) e altura (cm) de 46 alunos matriculados nas disciplinas de Matemática
e Física.
CÁLCULO DAS PROBABILIDADE E ESTATÍSTICA (CPE) - período 97.1 – turma 01
IDAD
RENDA NO. ALTUR
SEX E PROCEDÊNCI PESO
ID CURSO FAMILI DISCIP. A
O (Anos A (kg)
AR MATRIC. (cm)
)
1 Fem Física 19 Interior Média 6 47 156
2 Masc Matem. 18 Capital Média 6 75 167
3 Fem Matem. 18 Outra Região Média 6 61 169
4 Fem Matem. 18 Capital Média 6 56 163

16
6 Fem Matem. 20 Interior Média 6 44 158
12 Masc Matem. 21 Outra Região Média 5 66,5 175
13 Masc Matem. 18 Interior Média 6 78 180
14 Fem Matem. 18 Interior Não Info. 6 46 158
19 Fem Física 23 Outra Região Média 6 53 160
21 Masc Matem. 21 Outra Região Média 6 65 171
22 Masc Matem. 19 Capital Média 6 78,5 180
24 Fem Matem. 17 Interior Média 6 47,5 155
25 Masc Matem. 18 Interior Baixa 6 67,5 175
27 Masc Matem. 17 Interior Não Info. 6 68 169

17
32 Fem Matem. 18 Capital Alta 6 47 167
41 Masc Matem. 18 Interior Baixa 6 60 165
FONTE: Questionário aplicado - aula 24/03/97
Exemplo 1.1 - A tabela 01 apresenta a distribuição de frequência da variável PROCEDÊNCIA,

a partir dos dados do Quadro 1.
Tabela 01 - Frequências e Percentuais dos 46 Estudantes de CPE -
A percentagem se calcula da seguinte forma: valor tido por procedência x percentagem

máxima(100%) e o resultado dividi-se pelo número total da distribuição.
Nº Estudantes Percentual ( fi %)
PROCEDÊNCIA
( Fi )
Capital 20 43,5
Interior 16 34,8
Outra Região 10 21,7
Total 46 100,0
Quadro 1- Informações sobre sexo, curso, idade (anos), procedência, renda familiar, número de
disciplinas matriculado(a), peso (kg) e altura (cm) de 46 alunos matriculados na disciplina.
CÁLCULO DAS PROBABILIDADE E ESTATÍSTICA (CPE) - período 97.1 – turma 01

18
Exemplo 1.2 - A tabela 02 apresenta a distribuição de frequência da variável Nº DE

DISCIPLINAS MATRICULADO(A), a partir dos dados do quadro 1 – (Dados Agrupados sem
Intervalos)
PROCEDÊNCIA
( Fi )
Capital 20 43,5
Interior 16 34,8
Outra Região 10 21,7
Total ou ∑ 46 100,0
OBS.: ∑ ==> letra grega "SIGMA", indica total ou somatório.
Regras Básicas para Elaboração de uma Distribuição de Frequências por Classes ou Intervalos
(Dados Agrupados em Intervalos)
1. Colete n dados referentes à variável cuja distribuição será analisada. É aconselhável que n
seja superior a 50 para que possa ser obtido um padrão representativo da distribuição.
2. Efetua-se um ROL ESTATÍSTICO (ordenação crescente ou decrescente de grandeza) nos
Dados Brutos (aqueles ainda não organizados numericamente).
3. Identifique o menor valor (X min ) e o maior valor (X max ) da amostra.
4. Calcule a AMPLITUDE TOTAL dos dados (AT ):
𝐴𝑇 = 𝑋 max − 𝑋 min
5. Escolhe-se convenientemente o número de classes k (inteiro); 5 ≤ k ≤ 15 , onde podemos

tomar: k ≅ √𝑛 ou k ≅ 1+ 3,3 log(n), se n ≥ 50
𝐴𝑇
6. Calcule o comprimento de cada classe dos dados (h): ℎ 𝐾
É aconselhável construir classes de mesma amplitude.
7. Efetua-se o AGRUPAMENTO EM CLASSES, calculando os limites de cada classe:
1ͣ Classe:
Limite Inferior: 𝐿𝐼1 = 𝑋𝑚𝑖𝑛 Limite Superior: 𝐿𝑆1 = 𝐿𝐼1 + ℎ
2ͣ Classe:
Limite Inferior: 𝐿𝐼2 = 𝐿𝑆1 Limite Superior: 𝐿𝑆2 = 𝐿𝐼1 + ℎ
i-ésima Classe:
Limite Inferior: 𝐿𝐼𝑖 = 𝐿𝑆𝑖−1 Limite Superior: 𝐿𝑆𝑖 = 𝐿𝐼𝑖 + ℎ
Continue estes cálculos até que seja obtido um intervalo que contenha o maior valor da amostra
(X max ) entre seus limites.
8. Construa a tabela de distribuição de frequências.
Uma tabela de distribuição de frequências (por classes ou valores), deverá conter as seguintes

19
colunas:
• Número de ordem de cada classe (i) ou valor;
• Limites de cada classe (no caso da distribuição de frequências por classes)
As classes são fechadas à esquerda e abertas à direita.
As observações iguais ao limite superior da classe i-1, o qual é igual ao limite inferior da
classe i, pertencem à classe i. NOTAÇÃO: |------.
• Ponto Médio
LIi +LSi
𝑝𝑚𝑖 da i-ésima classe é denotado por: pmi = 2
• Tabulação: contagem dos dados pertencentes a cada classe ou a quantidade de vezes que o
valor se repete.
• Frequência simples ou absoluta (Fi ) da i-ésima classe ou do i-ésimo valor
Fi = número de observações da i-ésima classe (ou do i-ésimo valor)
Observe que: ∑ki=1 Fi = n
• Frequência Relativa ( f i ) da i-ésima classe (ou do i-ésimo valor)
f i = número de observações da i-ésima classe (ou do i-ésimo valor) dividido pelo
𝐹𝑖
tamanho da amostra, isto é, 𝑓𝑖 = 𝑛
Observe que a soma de todos os valores de f i deve ser igual a 1, ou seja, ∑ki=1 Fi = 1.
Multiplicando cada f i por 100 obtém-se o percentual da classe (ou valor) correspondente, isto é,
f i % = f i ×100 .
• Existem outros tipos de frequências que também podem ser calculadas:
• Frequência Simples Acumulada (do tipo “abaixo de”): frequência simples acumulada da i-
ésima classe ou valor
𝐹𝑎𝑐𝑖 = 𝐹1 + 𝐹2 + 𝐿 + 𝐹𝑖
• Frequência Relativa Acumulada: frequência relativa acumulada da i-ésima classe ou valor.
𝑓𝑎𝑐𝑖 = 𝑓1 + 𝑓 2 + 𝐿 + 𝑓 𝑖 .
Normas Técnicas para Apresentação Tabular

De um modo geral tem-se a destacar em uma tabela (disposição escrita que se obtém referindo-
se a uma coleção de dados numéricos a uma determinada ordem de classificação) os seguintes
elementos essenciais (obrigatórios) e complementares (não-obrigatórios):
• Elementos essenciais:
• Título: Indicação que precede a tabela e que contém a designação do fato observado, o local e
a época em que foi registrado.
• Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.
• Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas.
• Corpo da tabela: Conjunto de colunas e linhas que contêm as informações sobre a variável em
estudo.
• Fonte: Entidade responsável pela informação.
• Elementos complementares:
Notas: Informações de natureza geral destinadas a conceituar ou esclarecer o conteúdo das
tabelas ou a indicar a metodologia adotada no levantamento ou na elaboração dos dados.
Chamadas: Informações de natureza específica sobre determinada parte da tabela, destinada a
conceituar ou a esclarecer dados.
Sinais Convencionais:Nenhuma casa da tabela deve ficar em branco, apresentando sempre um
símbolo, a saber:

20
• As tabelas apresentadas oficialmente devem atender às normas da ABNT (resolução 886 de

20/10/60).
Exemplo: – Elabore uma tabela de distribuição de frequências (dados agrupados em intervalos)

da variável ALTURA (em cm), dos 46 estudantes de CPE, turma 01 – Período 07.1, usando-se
os dados do Quadro 1.
Solução:
Passo 1: Estabelecer o número de classes: k ≅ √𝑛 → √46 = 6,7 ≅ 7
Passo 2: Amplitude Total:
𝐴𝑇 = 𝑋 max − 𝑋 min →AT = 183 -153 = 30
𝐴𝑇 30
Passo 3: Amplitude das Classes: ℎ = 𝐾
= 7
= 4,28 ≅ 4,3
Passo 4: Para organizar os intervalos, depende da fórmula 𝐿𝑆1 = 𝐿𝐼1 + ℎ

Passo 5: Construção da Tabela de Distribuição de Frequências
Tabela 03 – Distribuição de Frequências das ALTURAS dos 46 Estudantes de CPE.
ALTURA (Xi)
( Fi )
153,0 |----- 157,3 4 8,7

157,3 |----- 161,6 8 17,4
161,6 |----- 165,9 7 15,2
165,9 |----- 170,2 10 21,7
170,2 |----- 174,5 3 6,5
174,5 |----- 178,8 6 13,0
178,8 |----- 183,1 8 17,4
Total ou ∑ 46 100,0
Exemplo: - Elabore uma tabela de distribuição de frequências (dados agrupados em intervalos)

da variável IDADE (em anos) de 33 estudantes de CPE, conforme Dados Brutos abaixo:
DADOS BRUTOS ROL DE DADOS ORDENADOS

22 25 23 22 23 26 25 33 23 35 20 21 22 22 22 22 22 22 23 23
27 24 24 22 24 22 24 21 22 28 23 24 24 24 24 24 24 25 25 25
30 25 28 29 24 25 20 27 34 26 25 26 26 27 27 28 28 29 30 30
36 30 22 34 35 36
Solução:
Passo 1: Estabelecer o número de classes: k = √𝑛 → 𝑘 = √33 =5,7 ≅ 6
Passo 2: Amplitude Total: 𝐴𝑇 = 𝑋 max − 𝑋 min →AT = 36 - 20 = 16
𝐴𝑇 16
Passo 3: Amplitude das Classes: : ℎ = 𝐾
= 6
= 2,66 ≅ 2,7
Passo 4: Construção da Tabela de Distribuição de Frequências

Tabela 04 - Distribuição de Frequências das IDADES de 33 Estudantes de CPE.

21
IDADE (Xi) Fi
20,0 |----- 22,7 8

22,7 |----- 25,4 13
25,4 |----- 28,1 6
28,1 |----- 30,8 3
30,8 |----- 33,5 0
33,5 |----- 36,2 3
Total ou ∑ 33
Exemplo: A Tabela , a seguir, é um exemplo de como calcular os outros tipos de frequências a

partir da Tabela 3
Resolução: A fi, resolve-se dividindo cada número absoluto por número total
𝐹𝑎𝑐1 , resolve-se apartir da Fi, somando desde o primeiro número até o último
𝑓𝑎𝑐1 , resolve-se apartir da 𝐹𝑎𝑐1 , somando desde o primeiro número até o último
LIi +LSi
pmi = 2
, calcula-se somando a cada linha dos limites inferior e superior, dividndor por 2
Freq. Abs Freq. Relativa Freq. Perc Freq. Absol. Freq. Relat Ponto
ALTURA (Xi) ( Fi ) fi ( fi %) Acumulada Acumalda Médio
𝐹𝑎𝑐1 𝑓𝑎𝑐1 𝑝𝑚𝑖
153,0 |----- 157,3 4 0,087 8,7 4 0,087 155,15

157,3 |----- 161,6 8 0,174 17,4 12 0,261 159,45
161,6 |----- 165,9 7 0,152 15,2 19 0,413 163,75
165,9 |----- 170,2 10 0,217 21,7 29 0,630 168,05
170,2 |----- 174,5 3 0,065 6,5 32 0,695 172,35
174,5 |----- 178,8 6 0,130 13,0 38 0,825 176,65
178,8 |----- 183,1 8 0,174 17,4 46 1,000 180,95
Total ou ∑ 46 1,000 100,0
Representação Gráfica de Distribuições de Frequência

O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é
produzir, no investigador ou no público em geral, uma impressão rápida e viva do fenômeno em
estudo. Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência
entre os termos da série (Tabela) e determinada figura geométrica, de tal modo que cada
elemento da série seja representado por uma figura proporcional.
Requisitos
A representação gráfica de um fenômeno deve obedecer aos seguintes requisitos primordiais:
• Simplicidade - indispensável devido à necessidade de levar a uma rápida apreensão do sentido
geral do fenômeno apresentado a fim de não nos perdermos na observação de minúcias de
importância secundária;
• Clareza - o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo;

22
• Veracidade - indispensável qualquer comentário, posto que, se não representa uma realidade,
perde o gráfico sua finalidade.
Os principais tipos de gráficos estatísticos para as distribuições de frequências são os diagramas,
que são gráficos geométricos de, no máximo duas dimensões. Para sua construção, em geral,
fazemos uso só do sistema cartesiano. Dentre os principais tipos de diagramas, destacamos:
Variáveis Qualitativas:
Para representarmos as variáveis qualitativas graficamente usamos os gráficos de Barras,
Colunas, Setores ou Linha.
• Gráfico em Barras ou Colunas: É a representação de uma série por meio de retângulos,
dispostos horizontalmente (em barras) ou verticalmente (em colunas);
• Gráfico de Setores: É o gráfico que representa as partes de um todo, por setores de um
círculo, visando justamente comparar estas partes entre si em relação ao todo.
• Gráfico de Linha: útil na representação de tabelas ou séries que evoluem ao longo do tempo
(séries temporais), possibilitando a identificação de tendências.
Exemplo : Construindo um Gráfico de Barras

25
20
15
10
5
0
Capital Interior Outra Região
Exemplo : Construindo um Gráfico de Setor

Procedência dos Estudantes de CPE - Per. 97.1
Outras
Regiões
22% Capital
Interior 43%
35%
Variáveis Quantitativas
• Discretas:para representarmos as variáveis quantitativas discretas graficamente usamos
gráficos em Barras ou Colunas;
• Contínuas: para representarmos as variáveis quantitativas contínuas graficamente usamos o
Histograma ou o Polígono de Frequências.
Histograma:
É a representação gráfica de uma distribuição de frequências de variável quantitativa contínua
(dados agrupados em intervalos) por meio de retângulos justapostos, centrados nos pontos
médios das classes e cujas áreas são proporcionais às frequências das classes.

23
Exemplo : Construindo um Histograma

12
10
4
2
0
155.15 159.45 163.75 168.05 172.35 176.65 180.95
Altura (cm)
Polígono de Frequência
É a representação gráfica de uma distribuição de frequências de variável quantitativa contínua
(dados agrupados em intervalos) por meio de uma linha poligonal fechada ou polígono, cuja
área total é igual à do histograma.
Exemplo : Construindo um Polígono de Frequências
Distribuição das Alturas dos Estudantes de CPE, Per. 97.1
12
10
8
6
4
2
0
150.85 155.15 159.45 163.75 168.05 172.35 176.65 180.95 185.25
Altura (cm)
Medidas de posição(Média aritmétrica)

Vimos anteriormente a sintetização dos dados sob a forma de tabelas, gráficos e distribuições de
frequências. Aqui, vamos aprender o cálculo de medidas que possibilitem representar um
conjunto de dados (valores de uma variável quantitativa, isto é, informações numéricas),
relativos à observação de determinado fenômeno de forma reduzida.
Estes índices estatísticos são as MEDIDAS DE POSIÇÃO e, dentre as mais importantes,
citamos as Medidas de Tendência Central, que recebem tal denominação pelo fato dos dados
observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas
de tendência central, destacamos:
• Média aritmética ou Média;
• Moda;
• Mediana.
As outras medidas de posição são as SEPARATRIZES, que englobam:
• a mediana;
• os quartis;

24
• os percentis.
Medidas de Tendência Central

Média Aritmética (ou simplesmente MÉDIA)
Notação:
𝑋̅ = a média da amostra ou média amostral
µ = a média da população ou média populacional
(a) Distribuição de Frequências por Valor
Sejam x1, x2,...,xk as medidas da variável de interesse, realizadas para uma amostra de tamanho
n extraída de uma população. Definimos a média da amostra (X ) como:
∑ k ∑k
Xi . Fi i=1 Xi . Fi
̅
X = i=1 ou, simplesmente, ̅
X=
∑k i=1 Fi n
onde:
xi é o i-ésimo valor da variável de interesse;
Fi é a frequência absoluta do i-ésimo valor;
n é o tamanho da amostra.
Exemplo : Determinar a média do seguinte conjunto (amostra) de valores 10 ,8 ,7 ,3 11 ,

̅ = ∑ Xi = X
Logo: X ̅ = ∑ Xi = 3+7+8+10+11 = 7,8
n n 5
Exemplo : Determinar a média do seguinte conjunto (amostra) de valores
8 ,3 ,2 2 ,8 ,5 ,2 ,8 ,5 ,2 ,2 ,8 ,3 ,5 ,8 ,2 ,2 ,2 ,5 ,8 ,
Então: Dados Agrupados sem Intervalos
xi Fi xi × Fi
2 8 16
3 2 6
5 4 20
8 6 48
∑ 20 90
4
∑ki=1 Xi . Fi ∑4i=1 90 90
̅
X= ̅
=X= 4 = = 4,5 e n = ∑ Fi = 20
∑ki=1 Fi ∑i=1 20 20
i=1
(b) Distribuição de Frequências por Classes

Sejam pm1, pm2 ,..., pmk os pontos médios das classes, ocorrendo com frequências F1, F2,...,
Fk , respectivamente, de modo que ∑ki=1 Fi = n
Definimos a média da amostra (𝑋̅ ) como:

25
∑ k ∑k
pmi . Fi i=1 pmi . Fi
̅
X = i=1 ou, simplesmente, ̅
X=
∑k i=1 Fi n
onde:
pmi é o ponto médio da i-ésima classe;
Fi é a frequência absoluta da i-ésima classe;
n é o tamanho da amostra
Vantagens e Desvantagens da Média
É uma medida de tendência central que, por uniformizar os valores de um conjunto de dados,
não representa bem os conjuntos que revelam tendências extremas. Ou seja, é grandemente
influenciada pelos valores extremos (grandes) do conjunto. Além disso, não pode ser calculada
para distribuições de frequências com limites indeterminados (indefinidos).
Propriedades:
1. A soma dos desvios tomados em relação à média é nula, isto é, ∑ni=1(Xi − X ̅ ) = 0.
2. Somando-se ou subtraindo-se uma constante “c” a todos os valores de uma variável, a média
do conjunto fica aumentada ou diminuída dessa constante, isto é, 𝑌𝑖 = 𝑋𝑖 ± 𝑐 ⇒ 𝑌̅ = 𝑋̅ ± 𝑐 .
3. Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante “c”, a
média do conjunto fica multiplicada ou dividida por essa constante, isto é, 𝑌𝑖 = 𝑋𝑖 . 𝑐 ⇒ 𝑌̅ =
𝑋𝑖 𝑋 ̅
𝑋̅. 𝑐 ou 𝑌𝑖 = 𝑐 ⇒𝑌̅ = 𝑐 , para c ≠ 0 .
Exemplo : Utilizando os dados apresentados na Tabela 5, determine a ALTURA MÉDIA dos 33
estudantes de Estatística Vital .
Freq. Absoluta Ponto Médio pmi pmi × Fi

ALTURA (Xi)
Fi
153,0 |----- 157,3 4 155,15 620,60

157,3 |----- 161,6 8 159,45 1275,60
161,6 |----- 165,9 7 163,75 1146,25
165,9 |----- 170,2 10 168,05 1680,50
170,2 |----- 174,5 3 172,35 517,05
174,5 |----- 178,8 6 176,65 1059,90
178,8 |----- 183,1 8 180,95 1447,60
Total ou ∑ 46 - 7747,50
∑k
i=1 pmi . Fi 7747,50
Então: ̅
X= = = 168,42cm
∑k
i=1 Fi 46
Moda
Notação: Mo
Dado um conjunto ordenado de valores. A moda é (são) o(s) valor(es) que ocorre(m) com maior
frequência no conjunto de dados, ou seja é(são) o(s) valor(es) mais frequente(s) do conjunto de
dados.
Exemplo : Determine a moda dos seguintes conjuntos de dados abaixo
a) 2, 2, 3, 3, 5, 5, 8, 8 ⇒ Não existe moda (ou amodal)
b) 2, 2, 3, 5, 5, 5, 8, 8 ⇒ Mo = 5
c) 2, 2, 2, 3, 3, 5, 5, 5, 8 ⇒ Mo = 2 e Mo = 5
Observação:

26
i) A moda de um conjunto de dados pode não existir (figura 1 (a) )

ii) A moda de um conjunto de dados pode não ser única (figura 1 (c) )
Figura 1: Caracterização de Dados quanto à moda
a) b) c)
f f f
Cálculo da Moda em uma Distribuição de Frequências por Classes

Em uma distribuição de frequências com dados agrupados em classes, denominamos classe
modal a classe que possui a maior frequência, e, consequentemente, será esta classe que conterá
a moda.
Exemplo : Utilizando os dados apresentados na Tabela 5, apresentamos o cálculo determine a
ALTURA MODAL (Moda) para dados agrupados em intervalos, a partir da fórmula de Czuber
apresentada na Figura 2.)
Figura 2: Cálculo da moda para dados distribuídos em classes

Solução:
FÓRMULA de CZUBER (interpretação geométrica através de Histograma)
∆2
∆1
Mo classe
∆1
𝑀𝑜 = 𝐿𝑚𝑜 + (∆1+∆2) . ℎ𝑚𝑜 , onde: 𝐿𝑚𝑜 : limite inferior da classe modal,
ℎ𝑚𝑜 : amplitude da classe modal.
∆1 = 𝐹𝑚𝑜𝑑𝑎𝑙 − 𝐹𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
∆2 = 𝐹𝑚𝑜𝑑𝑎𝑙 − 𝐹𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
A Classe modal será o intervalo com maior frequencia absoluta (Fi). Neste caso a classe modal
(4a) será
165,9 |----- 170,2, Lmo = 165 9, hmo = 3,4 , ∆1 = Fmodal - Fanterior = 10 - 7 = 3 e
∆2 = Fmodal - Fposterior = 10-3 =7 .
∆1 3
Daí, 𝑀𝑜 = 𝐿𝑚𝑜 + (∆1+∆2) . ℎ𝑚𝑜 → 𝑀𝑜 = 165,9 + (3+7) . 4,3 = 167,19𝑐𝑚.
Vantagens e Desvantagens da Moda

Não depende de todos os valores do conjunto de dados, podendo mesmo não se alterar com a

27
modificação de alguns deles;

Não é influenciada por valores extremos (grandes) do conjunto de dados
Pode ser calculada para distribuições com limites indeterminados (indefinidos) na maioria dos
casos.
Mediana
Notação: Me
Considere um conjunto de dados ordenado constituído de n valores. A mediana é o valor que
divide o conjunto em duas partes iguais (isto é, em duas partes de 50% cada).
1º Caso: n ímpar
Para a série de valores ordenados em ordem crescente de grandeza (isto é, um rol), a mediana é
o valor central, isto é,
𝑛+1
Me = elemento que está na posição 2
.
2º Caso: n par
Para a série de valores ordenados em ordem crescente de grandeza (isto é, um rol), a mediana é
a média aritmética dos valores centrais, isto é,
𝑛 𝑛
Me = média aritmética entre os elementos das posições 2 𝑒 2 + 1.
3º Caso: Cálculo da Medida em uma Distribuição de Frequências por Classes
No caso de dados agrupados, relembramos que uma distribuição de frequências pode ser
representada por meio de um Histograma. Dizemos então que a mediana será o valor de X
(abscissa) cuja ordenada divide a área total do Histograma em duas partes iguais.
Em uma distribuição de frequências com dados agrupados em classes, denominamos classe
𝑛
mediana a classe que contém o elemento que está na posição e, consequentemente, será esta a
2
classe que conterá a mediana.
a) Cálculo da mediana para dados distribuídos em classes
50% 50%
ou n/2 ou n/2
Md
n
−Facam
onde: Me = LIme + (2 Fme
) . hme
LIme é o limite inferior da classe mediana;

Fme é a frequência absoluta da classe mediana;
Facant é a freq. absoluta acumulada da classe anterior à classe mediana;
hme é a amplitude da classe mediana;
n é o número de observações.
Assim, para dados agrupados em intervalos, a mediana é obtida através de interpolação de
acordo com a fórmula dada na figura 3.
Propriedades da Mediana
1. A mediana não é influenciada por valores extremos (grandes) de uma série ou conjunto de

28
dados;
2. A mediana de uma série de dados agrupados de classes extremas indefinidas pode ser
calculada.
Exemplo : Determinar a ALTURA MEDIANA dos 46 estudantes da turma de CPE, conforme
os dados agrupados na tabela 5.
Classe mediana é a classe que contém o elemento que está na posição n/2 , ou seja, a classe
mediana é a classe que contém o elemento que está na 23ª posição. Logo, a classe mediana será
a 4ª: 165,9 |----- 170,2 (Classe mediana: primeira classe que ultrapassar 50% (n/2) ou mais das
observações)
LI me = 165 9, Fme = 10, hme = 3,4 Fant= 19
n 46
−Facam −19
Então: Me = LIme + (2 ) . hme = 165,9 + ( 2 ) . 4,3 = 165,9 + 1,72 =
Fme 10
167,62cm
Medidas de Dispersão
No item anterior, aprendemos a calcular e entender convenientemente as medidas de posição
representativas de um determinado conjunto de dados, onde destacamos a média, a moda e a
mediana.
Sejam quatro conjuntos A, B, C e D com os seguintes valores:
Conjunto A ====> 7, 7, 7, 7, 7
Conjunto B ====> 5, 6, 7, 8, 9
Conjunto C ====> 4, 5, 7, 9, 10
Conjunto D ====> 0, 5, 10, 10, 10
Para representarmos cada conjunto, podemos calcular a sua respectiva média aritmética,
encontrando ̅̅̅
𝑋𝐴 = ̅̅̅̅
𝑋𝐵 = ̅𝑋̅̅𝐶̅ = ̅̅̅̅
𝑋𝐷 = 7 .
Vemos assim que, apesar de constituídos de valores diferentes, os grupos revelam uma mesma
média aritmética. Observando-os mais detalhadamente, notamos que em cada grupo, isto é,
conjunto de dados, os valores se distribuem diferentemente em relação à média. Necessitamos
assim de uma medida estatística complementar para melhor caracterizar cada conjunto
apresentado.
As medidas estatísticas responsáveis pela variação ou dispersão dos valores de um conjunto de
dados são as medidas de dispersão ou de variabilidade, onde se destacam a amplitude total, a
variância, o desvio padrão e o coeficiente de variação. Em princípio, diremos que entre dois ou
mais conjuntos de dados, o mais disperso (ou menos homogêneo ) é aquele que tem a maior
medida de dispersão.
Amplitude Total
Notação: AT
Medida já apresentada na elaboração de uma distribuição de frequências com dados agrupados
em classes, definida por:
AT = X max - X min ,
onde:
Xmax é o maior valor do conjunto de dados e Xmin é o menor valor do conjunto de dados.

29
Variância
Notação: S² é a variância da amostra ou variância amostral
σ² é a variância da população ou variância populacional
A variância de um conjunto de dados (amostra ou população ) mede a variabilidade do conjunto
em termos de desvios quadrados em relação à média aritmética. É uma quantidade sempre não
negativa e expressa em unidades quadradas do conjunto de dados, sendo de difícil interpretação.
Distribuição de Frequências por valor
Sejam x1, x2,.., xk as medidas da variável de interesse, realizadas para uma amostra de tamanho
n extraída da população considerada. Definimos a variância da amostra (S² ) como:
∑𝑘𝑖=1(𝑝𝑚𝑖 − 𝑋̅)² . 𝐹𝑖
𝑆2 =
𝑛−1
onde:
xi é o i-ésimo valor da variável de interesse;
Fi é a frequência absoluta do i-ésimo valor;
̅
X é a média da amostra;
Observação: A equação acima é utilizada quando nosso interesse não se restringe à descrição
dos dados mas, partindo da amostra, visamos tirar inferências válidas para uma respectiva
população.
Distribuição de Frequências por Classes
Sejam pm1, pm2 ,..., pmk os pontos médios das classes, ocorrendo com frequências F1, F2 ,...,
Fk de
modo que ∑𝑘𝑖=1 𝐹𝑖 = 𝑛 . A variância da amostra (S² ) é definida por como:
pmi2 × Fipmi é o ponto médio da i-ésima classe;
Fi é a frequência absoluta da i-ésima classe;
̅ é a média da amostra;
X
Desvio-Padrão
Notação: S é o desvio-padrão da amostra ou desvio-padrão amostral
σ é o desvio-padrão da população ou desvio-padrão populacional
É uma outra medida de dispersão mais comumente empregada do que a variância, por ser
expressa na mesma unidade do conjunto de dados. Mede a "DISPERSÃO ABSOLUTA" de um
conjunto de valores e é obtida a partir da variância.
Desvio Padrão = √Variância (Raiz quadrada da Variância ).
Assim,
S = √S²
Coeficiente de Variação
É uma medida que expressa a variabilidade em termos RELATIVOS, comparando o desvio-
padrão com a média:
𝑆
𝐶𝑉 = ×100% , sendo que 𝑋̅ ≠ 0 .
𝑋̅
Note que é importante expressar a variabilidade em termos relativos porque, por exemplo, um
desvio-padrão igual a 1 pode ser muito pequeno se a magnitude dos dados é da ordem de 1.000,
mas pode ser considerado muito elevado se esta magnitude for da ordem de 10.
Observe também que o coeficiente de variação é adimensional e por este motivo permite a
comparação das variabilidades de diferentes conjuntos de dados.

30
Comentários sobre as principais Medidas de Tendência Central e Dispersão

1. O conjunto de todos os possíveis elementos de uma determinada pesquisa constitui uma
população estatística. Sua média é a média populacional, usualmente representada pela letra
grega µ . Na grande maioria das situações práticas, a média populacional é desconhecida e deve
ser estimada a partir de dados amostrais. Se a amostra for extraída de forma adequada, a média
amostral 𝑋̅ é uma boa estimativa de µ .
2. Comparando a média e a mediana, temos que a mediana é pouco sensível à presença de
valores muito altos ou muito baixos na amostra, enquanto a média já é muito sensível a esta
situação. Para ilustrar o sentido desta afirmação, vamos considerar os dados abaixo:
5 14 47 61 122 620
A mediana deste conjunto de dados é:
47 + 61
𝑀𝑒 = = 54
2
enquanto que a média é dada por:
5 + 14 + 47 + 61 + 122 + 620
𝑋̅ = = 144,8
6
Observe que a maior observação (620) exerceu uma grande influência sobre a média – somente
este dado é maior do que a média, o que então não sintetiza de forma adequada as informações
contidas na massa de dados. Portanto, neste exemplo, a mediana parece ser a melhor medida
para indicar a localização dos dados.
De modo geral, quando o histograma construído para os dados da amostra é do tipo assimétrico,
devemos preferir a mediana como medida de tendência central.
3. A amplitude, apesar de ser muito fácil de calcular, tem a desvantagem de levar em
consideração apenas os dois valores extremos (máximo e mínimo) da massa de dados,
desprezando os demais.
4. A variância populacional é representada por σ² . Usualmente, a variância populacional é
desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extraída de
forma adequada, a variância amostral S² é uma boa estimativa de σ² .
5. As medidas 𝑋̅ , S² e S tomadas na amostra, denominadas ESTATÍSTICAS, são estimativas
dos PARÂMETROS POPULACIONAIS µ , σ² e σ (supostos desconhecidos).
Exemplo : Utilizando os dados apresentados na Tabela 5, determine a VARIÂNCIA, o
DESVIOPADRÃO e o COEFICIENTE DE VARIAÇÃO DAS ALTURAS dos 46 estudantes de
CPE.
Freq. Absoluta Ponto Médio pmi × Fi pmi² × Fi

ALTURA (Xi)
Fi pmi
153,0 |----- 157,3 4 155,15 620,60 96286,09

157,3 |----- 161,6 8 159,45 1275,60 203394,42
161,6 |----- 165,9 7 163,75 1146,25 187698,44
165,9 |----- 170,2 10 168,05 1680,50 282408,03
170,2 |----- 174,5 3 172,35 517,05 89113,57
174,5 |----- 178,8 6 176,65 1059,90 187231,34
178,8 |----- 183,1 8 180,95 1447,60 261943,22

31
Total ou ∑ 46 - 7747,50 1308075,10
A expressão:
(∑𝑘
𝑖=1 𝑝𝑚𝑖 𝐹𝑖)²
∑𝑘 ̅ ∑𝑘
𝑖=1 𝑝𝑚𝑖 ²𝐹𝑖 −
𝑖=1(𝑝𝑚𝑖 −𝑋 )².𝐹𝑖
𝑆2 = = 𝑛
.
𝑛−1 𝑛−1
Logo,
𝑆 8,44
𝑆 = √𝑆² → 𝑆 = √71,35𝑐𝑚² = 8,44𝑐𝑚 𝑒 𝐶𝑉 = . 100% → 𝐶𝑉 = . 100 = 5,01%
𝑋̅ 168,42𝑐𝑚
Exemplo : Uma fábrica classifica operários de acordo com os graus obtidos em testes de
aptidão. Os dados são apresentados na distribuição de frequência abaixo:
Notas Teste
Aptidão Fi Faci pmi pmi - 𝑥̅ (pmi - 𝑥̅ )² (pmi - 𝑥̅ )².Fi
(Xi)
0 |----- 2 6 6 1 -4,172 17,409 104,454

2 |----- 4 10 16 3 -2,172 4,719 47,193
4 |----- 6 23 39 5 -0,172 0,030 0,684
6 |----- 8 11 50 7 1,828 3,340 36,741
8 |---- 10 8 58 9 3,828 16,650 117,203
Total ou ∑ 58 - - 40,149 306,276
a) Calcule o grau médio obtido pelos operários;

b) O operário que tirar nota acima de 𝑋̅ + 2𝑆 receberá um prêmio. Um operário para receber
esta menção deverá ter tirado quanto?
c) Com base nos dados da tabela, a partir de que nota temos 50% dos operários mais aptos.
Solução:
5
̅ = ∑𝑖=1 𝑝𝑚𝑖 .𝐹𝑖 = 300 = 5,172414
a) O grau médio é dado por: 𝑋
𝑛 58
b) A variância para os dados agrupados é dada pela fórmula:
∑5𝑖=1(𝑝𝑚𝑖 −𝑋̅ )².𝐹𝑖 306,276
𝑆2 = = = 5,373.
𝑛−1 57
Logo o desvio padrão S = 2,318,
Desta forma 𝑋̅ + 2𝑆= 9,808, portanto qualquer operário com nota maior que 9,808 receberá o
premio.
c) A nota acima da qual estão 50% dos operários é chamada nota mediana, a qual é calculada
para dados agrupados em intervalos por:
𝑛 58
(2 − 𝐹𝑎𝑐𝑎𝑛𝑡 ) ( 2 − 16) 26
𝑀𝑑 = 𝐿𝑚𝑑 + . ℎ𝑚𝑑 → 𝑀𝑑 = 4 + .2 = 4 + = 4 + 1,13 = 5,13
𝐹𝑚𝑑 23 23
Exercícios de aplicação

32
1-Considerando a rol abaixo na tabela,calcule:Xi, Fi, Faci, pmi, pmi-x̅, (pmi-x̅)², (pmi-x̅)².Fi, o
grau médio, e variança.
0 0 0 0 0 0 1 1 1 1 1 1
1 1 1 1 1 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 4 4
4 4 4 4 4 5 5 5 5 5 5 6
2-Considere ps dados ordenados em ordem crescente, por colunas, calcule o Xi, Fi, pmi, pmi.Fi,
pmi².Fi, e S.
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
3-Calcule as freqüência absoluta,relativa, absoluta acumulada relativa acumulada ,percentagem

e o ponto médio dos dados abaixo:
Alturas de 50 estudantes do sexo masculino da Univesidade XYZ
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
4-Suponha que o tempo de vida útil de 10 aparelhos de telefone são:

10 29 26 28 15 23 17 25 0 20. Qual a média de vida útil
destes aparelhos e repsenta no gráfico?
5-Nos valores abaixo, qual o valor modal?

3 4 4 5 6 7 8 9 9 9 10 11 12 13
6- Num acampamento infantil, foram obtidas as seguintes estaturas:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
frequencia 6 12 16 13 7
Calcule:
a)A mediana b) A média
Probabilidade
1. Situando a Temática
A teoria das probabilidades é o fundamento para a inferência estatística. O objetivo desta parte é
que o aluno compreenda os conceitos mais importantes da probabilidade.

33
O conceito de probabilidade faz parte do dia-a-dia dos trabalhadores das área das ciências
exatas, ciências biológicas, engenharia, etc., uma vez que seu conceito é frequentemente usado
na comunicação diária. Por exemplo, podemos dizer que um aluno tem chance de 70% de ser
aprovado em uma determinada disciplina. Um professor está 90% seguro de que um novo
método de ensino proporcione uma melhor compreensão pelos alunos. Um engenheiro de
produção afirma que uma nova máquina reduz em 20% o tempo de produção de um bem. Tal
como mostram os exemplos, as pessoas expressam a probabilidade em porcentagem.
Trabalhando com a probabilidade matemática é mais conveniente expressá-la como fração (as
porcentagens resultam da multiplicação das frações por 100).
2. Problematizando a Temática
O conceito de probabilidade é fundamental para o estudo de situações onde os resultados são
variáveis, mesmo quando mantidas inalteradas as condições de sua realização. Por exemplo,
jogando-se um dado, temos seis resultados possíveis de cada vez; a observação do sexo dos
candidatos inscritos num concurso público conduz a dois resultados possíveis - masculino ou
feminino. Em ambos os casos, embora não sejamos capazes de afirmar de antemão que
resultado particular ocorrerá, temos condições de descrever o conjunto de todos os resultados
possíveis do experimento. A sua repetição continuada mostra uma certa regularidade nos
resultados, o que nos permite estudar o experimento, apesar da incerteza nele presente.
Conhecendo a Temática
Espaços Amostrais e Eventos
Antes de passarmos à definição de probabilidade é necessário fixarmos os conceitos de:
experimento aleatório, espaço amostral e evento.
Experimento Aleatório
É o processo da coleta dos dados relativo a um fenômeno que acusa variabilidade em seus
resultados.
Um experimento caracteriza-se como aleatório, em função de poder ser repetido
indefinidamente sob condições, essencialmente inalteradas, e embora não sejamos capazes de
afirmar que resultado ″particular″ ocorrerá, seremos sempre capazes de descrever o conjunto de
todos os possíveis resultados do mesmo.
Espaço Amostral ( Notação: S ou Ω (ômega) )
É o conjunto formado por todos os possíveis resultados de um experimento aleatório.
Eventos ( Notação: A, B. C, ... )
É qualquer subconjunto do espaço amostral.
Operações entre Eventos
Combinações de Eventos
Sejam A e B eventos em um mesmo espaço amostral. Temos as definidas as seguintes
operações entre conjuntos:
• Evento União A ∪ B (lê-se: A união B): o evento união de A e B equivale à ocorrência de A ou
de B ou de ambos. Contém os elementos do espaço amostral que estão em A ou em B ou em
ambos.
• Evento Interseção A ∩ B (lê-se: A interseção B): o evento interseção de A e B equivale à
ocorrência de A e de B, simultaneamente. Contém os elementos do espaço amostral que estão
em A e em B.
• Evento Complementar 𝐴̅ (lê-se: 𝐴̅ evento complementar de A): o evento complementar de A
equivale à não ocorrência do evento A. Contém os elementos do espaço amostral que não estão
em A.
• Eventos Disjuntos ou Mutuamente Exclusivos: dois eventos A e B dizem-se mutuamente
exclusivos ou mutuamente excludentes quando a ocorrência de um deles impossibilita a

34
ocorrência do outro. Os dois eventos não têm nenhum elemento em comum. Exprime-se isto
escrevendo: A ∩ B = ∅
UNIÃO INTERSEÇÃO
A B
EVENTO COMPLEMENTAR EVENTOS DISJUNTOS
A B
O Conceito de Probabilidade
Definição : Uma função P : Ω→R é dita uma “probabilidade” se satisfaz os seguintes axiomas:
i) P(Ω) = 1;
ii) 0 1 ≤ P A ( ) ≤ ;
iii) Sejam A e B eventos em um mesmo espaço amostral. Se A e B forem mutuamente
exclusivos,
então P (A U B) = P(A ) + P(B ) .
Por enquanto, ainda não sabemos calcular a probabilidade de ocorrência de um evento A
“P(A)”. No entanto, vamos enunciar algumas propriedades relacionadas a P(A) que decorrem
das condições acima e que não dependem da maneira pela qual calculamos P(A).
Propriedade de Probabilidade
Sejam A e B eventos em um mesmo espaço amostral:
1. Se ∅ é o evento impossível, então P(∅) = 0 ;
2. Se 𝐴𝑐 é o evento complementar de A, então P(𝐴𝑐 ) = 1- P(A) .
3. Se A e B são dois eventos quaisquer, então P(A ∪ B) = P(A)+ P(B) - P(A ∩ B) ;
4. Se o evento A ⊆ B, então P(A ) ≤ P(B ) .
Probabilidade em Espaços Amostrais Finitos

Seja Ω um espaço amostral associado a um experimento aleatório constituído de N resultados
igualmente prováveis (equiprováveis). Seja A um evento qualquer constituído de r resultados
possíveis ( 0 ≤ r ≤ N ).
A probabilidade de ocorrência do evento A, denotada P(A), é dada por:
𝑛(𝐴) 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑙 𝑎 𝐴 𝑟
𝑃(𝐴) = = =
𝑛(Ω) 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 𝑁
Exemplo : Em uma seleção para uma vaga de engenheiro mecânico de uma grande empresa
verificou-se que dos 100 candidatos 40 tinham experiência anterior e 30 possuíam curso de
especialização. Vinte dos candidatos possuíam tanto experiência profissional como também
algum curso de especialização.
Escolhendo um candidato ao acaso, qual a probabilidade de que:

35
a) Ele tenha experiência ou algum curso de especialização?

b) Ele não tenha experiência anterior nem curso de especialização?
Solução
Vamos definir os seguintes eventos:
A = {O candidato possui experiência anterior}
B = {O candidato possui especialização}
Dados: p(A) = 0,4, p(B) = 0,3 p(A∩B) = 0,2 pede-se as seguintes probabilidades:
a) Ele tenha experiência ou algum curso de especialização
p(A∪B) = p(A) + p(B) – p(A∩B) = 0,4 + 0,3 – 0,2 = 0,5
b) Ele não tenha experiência anterior nem curso de especialização?
P(𝐴𝑐 ∩𝐵𝑐 ) = P((A ∪ B)𝑐 ) = 1- P(A∪B) = 1- [P(A) + P(B) – P(A∩B)] =
= 1 – [0,4 + 0,3 – 0,2] = 1 - 0,5 = 0,5.
Probabilidade Condicional e Independência de Eventos

Dados dois eventos A e B contidos num espaço amostral Ω, muitas das vezes, estamos
interessados na ocorrência de A dado que o evento B tenha ocorrido.
Para dar consistência à ideia de uma probabilidade condicional, suponhamos que uma
organização de pesquisa junto a consumidores tenha estudado os serviços prestados dentro da
garantia por 200 comerciantes de pneus em uma grande cidade, obtendo os resultados
resumidos na tabela seguinte:
Vendedores de Dentro da Garantia

Total
Pneus Bom Serviço Serviço Deficiente
Com marca 64 16 80
Sem marca 42 78 120
Total 106 94 200
Selecionado aleatoriamente um desses vendedores de pneus (isto é, cada vendedor tem

probabilidade de ser selecionado), constatamos que as probabilidades de se escolher um
vendedor de determinada marca (M), um vendedor que presta bons serviços dentro da garantia
(Bs), ou um vendedor de marca determinada e que presta bons serviços dentro da garantia
(M∩Bs) são:
80 106 64
P(M) = 200 = 0,40 P(Bs) = 200 = 0,53 e P (M ∩ Bs) = 200 = 0,32 .
Todas essas probabilidades foram calculadas por meio da definição clássica de probabilidade.
Como a segunda dessas probabilidades P(Bs) é próxima a 0,50 (50%), vejamos o que acontece
se limitamos a escolha a vendedores de uma marca determinada. Isto reduz o espaço amostral às
80 escolhas, correspondentes à 1ª linha da tabela. Temos então, que a probabilidade de se
escolher um vendedor que presta bons serviços (Bs), sabendo (ou dado) que a marca de pneu
64
vendido pelo mesmo é determinada e será de P(Bs | M ) = 80 = 0,80 , tendo-se uma melhora em
relação a P(Bs) = 0,53 . Note que a probabilidade condicional que obtivemos aqui,
P(Bs | M ) = 80,0 pode escrever-se como:

36
64
𝐵𝑠 200 𝑃(𝑀∩𝐵𝑠)
𝑃( ) = 80 =
𝑀 𝑃(𝑀)
200
Generalizando, formulamos a seguinte definição de probabilidade condicional, que se aplica a
dois eventos quaisquer A e B pertencentes a um dado espaço amostral Ω:
Probabilidade Condicional
Se P(B) é diferente de zero, então a probabilidade condicional de A relativa a B, isto é, a
probabilidade de A dado que B ocorreu é denotada por:
𝐴 𝑃(𝐴∩𝐵)
𝑃 (𝐵) = 𝑃(𝐵)
, desde que P(B) >0 .
Teorema da Multiplicação
O resultado a seguir, obtido a partir da definição de probabilidade condicional, fornece a
probabilidade da ocorrência conjunta de dois eventos A e B, isto é, a probabilidade P(A∩B):
P(A∩ B) = P(A) ⋅ P(B| A) ou P(A∩ B) = P(B) ⋅ P(A| B)
dependendo da ordem de ocorrência dos eventos.
Independência de Eventos
Dizemos que dois eventos A e B são independentes, se as probabilidades condicionais P(A | B)
=P(A) e P(B | A) = P(B). Isto equivale, a partir da regra da multiplicação, escrevermos a
ocorrência simultânea de A e B como sendo:
P(A ∩ B) = P(A) ⋅ P(B) .
Exemplo: Uma caixa contém 4 lâmpadas boas e 2 queimadas. Retiram-se, ao acaso, 3 lâmpadas
sem reposição. Calcule a probabilidade dessas 3 lâmpadas serem boas.
Solução: Seja Ai a i-ésima lâmpada é boa, então:
4 3 2 1
P(A1 ∩ A2 ∩ A3) = P (A1) × P(A2 | A1) × P(A3 | A1 ∩ A2) = 6 . 5 . 4 = 4
Exemplo : Sejam A e B dois eventos tais que P(A) = 0,4 e P(A∪B) = 0,7. Seja P(B) = p. Para
que valor de p, A e B serão mutuamente exclusivos? Para que valor de p A e B serão
independentes?
Solução:
A e B são mutuamente exclusivos se A ∩ B = ∅. Logo P(A ∩ B) = 0 , com isso
P(A ∪ B) = P(A) + P(B) ⇒ 0,7 = 0,4 + p ⇒ p = 0,7 – 0,4 = 0,3.
Se A e B são independentes P(A ∩ B) = P(A) × P(B) = 4,0 p . Como
P(A ∪ B) = P(A) + P(B) - P(A ∩ B) temos que: 0,7 = 0,4 + p – 0,4p. Logo, p = 0,5.
Variáveis Aleatórias e Distribuições de Probabilidade

Situando a Temática
Na unidade anterior estudamos alguns fenômenos probabilísticos por meio de espaços amostrais
mais simples. No entanto, em situações práticas mais gerais, é necessário ampliar esses
conceitos para que tenhamos modelos probabilísticos que atendam as necessidades do
problema. A definição do conceito de variável aleatória possibilitará uma maior flexibilidade e
aplicabilidade dos conceitos de probabilidade em problemas diversos.
Problematizando a Temática
Ao estudarmos fenômenos aleatórios tais como, a renda de uma população, o desempenho
escolar de um grupo de alunos, o impacto de uma dieta no peso de animais, etc., desejamos
saber como controlar esses experimentos e tentar extrair conclusões sobre as respostas obtidas.
Neste caso, usaremos uma ferramenta valiosa que são as variáveis aleatórias.
Conhecendo a Temática

37
Quando na prática desejamos investigar algum fenômeno, estamos na realidade interessados em

estudar a distribuição de uma ou mais variáveis relacionadas a este. Assim, por exemplo,
podemos estar interessados em estudar a distribuição das notas de estudantes em uma
determinada disciplina, do grau de instrução, da altura, etc.
O que pretendemos, nesta unidade, é apresentar alguns modelos teóricos de distribuição de
probabilidade, aos quais um experimento aleatório estudado possa ser adaptado, o que permitirá
a solução de um grande número de problemas práticos.
O Conceito de Variável Aleatória e Variáveis Aleatórias Discretas
Definição : Seja E um experimento e Ω um espaço amostral associado a E. Um função X, que
associe a cada elemento ω ∈ Ω um número real, X(ω), é denominada variável aleatória.
Ω Rx
ω1 X X(ω1)
ω2 X(ω2)
ωn X(ωn)
Observação:
1. Cada elemento ω de Ω corresponderá a exatamente um valor;
2. Diferentes valores ω ∈ Ω, podem levar a um mesmo valor de X;
3. Nenhum elemento ω ∈ Ω poderá ficar sem valor de X.
Definição : Seja E um experimento e Ω seu espaço amostral. Seja X uma variável aleatória
definida em Ω e seja Rx seu contradomínio. Seja B um evento definido em relação a Rx, isto é,
B ⊂ Rx. Então, define-se o evento A como
A = {ω ∈ Ω | X (ω) ∈ B} = 𝑋 −1 (B) .
Assim, o evento A será constituído por todos os resultados em Ω para os quais X(ω) ∈ B.
Exemplo : Suponha 2 moedas lançadas e observada a sequência de caras e coroas obtidas.
Considere o espaço amostral associado a este experimento:
Ω = {(Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co)}
Agora, defina uma variável aleatória X = número de caras obtidas no lançamento de 2 moedas.
Assim, temos que X = {0, 1, 2}, visto que X(Co,Co) = 0; X(Ca,Co) = X(Co,Ca) = 1 e X(Ca,Ca)
= 2.
Variáveis Aleatórias Discretas
Denomina-se X uma variável aleatória discreta se o número de valores possíveis de X for um
conjunto de pontos finito ou infinito enumerável. Digamos RX = {x1, x2, . . . , xn , . . . }.
Definição : (Função de Probabilidade) - Seja X uma variável aleatória discreta. A cada possível
resultado xi de X está associado um número pi = P(X = xi), denominado probabilidade da
variável aleatória X assumir o valor xi, satisfazendo as seguintes condições:
a) pi ≥ 0 para todo xi ∈ Rx
b) ∑ pi = p1 + p2 +... + pn +... =1 (a soma das probabilidades é igual a 1).
Definição : (Função de Distribuição de Probabilidade) - Dada uma variável aleatória discreta X,
definimos F(x) a função de distribuição acumulada ou, simplesmente, função de distribuição
(f.d) de X, dada por:
𝑛
𝐹(𝑥𝑖) = 𝑃(𝑋 ≤ 𝑥𝑖) → 𝐹(𝑥𝑖) = ∑ 𝑃(𝑋 = 𝑥𝑖)

𝑖=1
Exemplo 3.2: Considerando o exemplo a cima, denote a função de probabilidade e a função de
distribuição da variável aleatória X.

38
Solução:
Seja X = número de caras obtidas no lançamento de 2 moedas, temos que a variável aleatória X
assume os seguintes valores, X = {0, 1, 2}.
Temos que:
P(Co,Co) = P(X = 0) = ¼ ;
P(Ca,Co) = P(Co,Ca) = P(X = 1) = ½ ;
P(Ca,Ca) = P(X = 2) = ¼ .
Denotamos a função de probabilidade de X por
xi 0 1 2
P(X = xi) 1/4 1/2 1/4
Por conseguinte, a função de distribuição acumulada de X é dada por
xi 0 1 2
F(xi) = P(X ≤ xi) 1/4 3/4 1
Exemplo : Um par de dados é lançado. Seja X a variável aleatória que associa a cada ponto (d1,
d2) de Ω a soma desses números, isto é, X(d1, d2) = d1 + d2. Determine a função de
probabilidade de X.
Solução:
O espaço amostral Ω é formado de 36 pares ordenados, representando as possibilidades no
lançamentos de dois dados Ω = {(1,1), (1,2), ..., (5,6), (6,6)}.
Então, a variável aleatória X = d1 + d2 assume os seguintes valores X = {2, 3, 4, ..., 12}. Por
conseguinte, a função de probabilidade de X obtida, calculando-se:
P (X = 2) = P(d1=1,d2=1) = 1/6 × 1/6 = 1/36
P (X = 3) = P(d1=1,d2=2) + P(d1=2,d2=1) = 1/36 + 1/36 = 2/36
P (X = 12) = P(d1=6,d2=6) = 1/36
Logo, a função de probabilidade de X será representada por
xi 2 3 4 5 6 7 8 9 10 11 12
P(X = xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Variáveis Aleatórias Contínuas

Uma variável aleatória é dita contínua se o seu contradomínio for um intervalo ou uma união de
subintervalos.
Definição : Uma variável aleatória X é contínua se existir uma função f, denominada função
densidade de probabilidade (fdp) de X, que satisfaça as seguintes condições:
1. f (x) ≥ ,0 ∀x ∈ R x ;
+∞
2. ∫−∞ 𝑓 (x)dx = 1;
3. Sejam “a” e “b” quaisquer no intervalo - ∞ < a < b < +∞ , temos que P (a ≤ X ≤ ) =
𝑏
∫𝑎 𝑓 (𝑥)𝑑𝑥 .
Observações

39
• P(a ≤ X ≤ b) representa a área sob a curva da função densidade de probabilidade f(x).

𝑥0
• Para qualquer valor específico de X, digamos x0, P(X = x0) = 0, pois P( X = x) = ∫𝑥0 𝑓 (x) dx
= 0.
• Como a probabilidade de X assumir valores em pontos isolados é nula, temos que
P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a < X < b) .
Definição : A definição de função de distribuição para o caso contínuo é dada por
−𝑥
F(x) = P(X ≤ x) = ∫∞ 𝑓(𝑥)𝑑𝑥 .
Observação: Seja F(x) a função de distribuição acumulada de uma variável aleatória contínua X,
𝑑𝐹(𝑥)
com fdp f(x). Então, 𝑓(𝑥) = 𝑑𝑥
=F '(x) , para todo x no qual F(x) seja derivável.
Exemplo : Suponha que X é uma variável aleatória contínua com a seguinte fdp:
2𝑥, 0 < 𝑥 < 1
𝑓(𝑥) = {
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜
a) Mostre que f(x) é uma fdp;
b) Calcule P(X ≤ ½);
c) Calcule P(X ≤ ½ | 1/3 ≤ X ≤ 2/3)
Solução:
+∞ 1 1 𝑥²
a) Para que f(x) seja uma fdp basta verificar que ∫−∞ 𝑓 (𝑥)𝑑𝑥 = ∫0 2𝑥𝑑𝑥 → 2 ∫0 + 𝑐 = 𝑥2 +
2
𝑐 → 12 = 1
1 1/2 1/2 1/2 𝑥 2 1 2 1
b) 𝑃 (𝑋 ≤ 2) = ∫−∞ 𝑓(𝑥)𝑑𝑥 → ∫0 2𝑥𝑑𝑥 = 2 ∫0 2
+ 𝑐 = 𝑥² + 𝑐 = (2) = 4
c) Aplicando diretamente o conceito de probabilidade condicional, teremos
1
2 1 1 1/2 1 2 1 2
2 𝑃( ≤ 𝑋 ≤ ) ∫1/3 2𝑥𝑑𝑥 𝑥² (2) − (3) 5
𝑃 𝑋≤ 1 ≤𝑋≤ = 3 2 = = = 2 2 =
3 3 1 2 2/3 12
𝑃( ≤ 𝑋 ≤ ) ∫1/3 2𝑥𝑑𝑥 𝑥² (2) − (1)
3 3 3 3
( )
Exemplo : Seja a variável aleatória X com f(x) definida no exemplo a cima, calcule sua função
de distribuição acumulada.
Solução:
0, 𝑥 < 0
𝑥 𝑥
𝐹(𝑥) = ∫ 𝑓 (𝑠)𝑑𝑠 = {∫ 𝑓 (𝑠)𝑑𝑠 = 𝑥 2 , 0 ≤ 𝑥 < 1
−∞ −∞
1, 𝑥≥1
Valor Esperado e Variância de uma Variável Aleatória
Nos modelos probabilísticos que temos considerado, parâmetros podem ser empregados para
caracterizar sua distribuição de probabilidade. Dada uma distribuição de probabilidade, é
possível associar certos parâmetros, os quais fornecem informações valiosas sobre tal
distribuição.
Um dos parâmetros mais importantes é o valor esperado (esperança ou média) de uma variável
aleatória
X, denotado por E(X) ou µ.
Definição : (Valor Esperado ou Média): Seja X uma variável aleatória discreta com possíveis
valores x1, x2, . . . ,xn , ... . Seja p(xi) = P (X = xi ), i = 1, 2, ..., n, ... Então, o valor esperado ou
média da variável aleatória X é definido por:
µ = 𝐸(𝑋) = ∑∞ ∞ ∞
𝑖=1 𝑥𝑖 . 𝑝(𝑥𝑖) , se a série ∑𝑖=1 𝑥𝑖 . 𝑝(𝑥𝑖) convergir, ou seja, ∑𝑖=1|𝑥𝑖| . 𝑝(𝑥𝑖) < ∞
Seja X uma variável aleatória contínua com fdp f(x). O valor esperado de X será definido por
+∞
µ = 𝐸(𝑋) = ∫−∞ 𝑥𝑓(𝑥)𝑑𝑥 = 𝑑𝑥 .

40
Observação: E(X) mede o valor médio de X, sendo expressa na mesma unidade de X.

Exemplo : Considere a variável aleatória definida no exemplo 3.2. Obtemos a E(X) por:
3
1 1 1
𝐸(𝑋) = ∑ 𝑥𝑖 𝑝(𝑥𝑖) = (0. ) + (1. ) + (2. ) = 1
4 4 4
𝑖=1
Isto representa que, ao lançarmos a moeda 2 vezes esperamos que, em média, em um dos
lançamentos apareça “Cara”.
Exemplo: Considere a variável aleatória contínua definida no exemplo 3.4. Obtemos a E(X) por:
1 1 1 𝑥3 2.13 2
E(X )= ∫0 𝑥(2𝑥)𝑑𝑥 = ∫0 𝑥(2𝑥)𝑑𝑥 = 2 ∫0 𝑥 2 𝑑𝑥 = 2. 3
+𝑐 = 3
=3
Um outro parâmetro importante que caracteriza uma variável aleatória é a variância, denotada
V(X) ou σ 2 . A variância de uma variável aleatória é uma medida que dá a idéia de dispersão
dos valores da variável, em relação ao seu valor esperado (média).
Definição : (Variância): Seja uma variável aleatória X (discreta ou contínua) sua variância,
denotada V(X) ou σ², é definida por:
𝜎² = V (X ) = E[(X − µ)² ], onde µ = E(X) é a média de X.
Observações:
• V(X) ≥ 0 e mede a variabilidade ou dispersão de X em torno da sua média µ;
• V(X) é expressa em unidades quadradas (o que torna difícil a sua interpretação);
• O Desvio Padrão σ x = √𝑉(𝑋) mede a dispersão absoluta de X, sendo expressa na mesma
unidade da variável aleatória X.
• A definição de variância de uma variável aleatória (v.a.) X, pode ser re-escrita por:
𝜎² = V (X ) = E(X² ) − [E(X )]² , onde: 𝐸(𝑋 2 ) = ∑∞ 2
𝑖=1 𝑥𝑖 𝑝(𝑥𝑖).
Propriedades Importantes do Valor Esperado

Sejam X uma v.a. e c = constante, então:
1. O valor esperado (média) de uma constante é a própria constante:
E(c) = c
2. Multiplicando-se uma constante por uma variável aleatória X, sua média fica multiplicada por
esta constante:
E(c.X) = c. E(X)
3. Somando ou subtraindo uma constante de uma variável aleatória X, sua média fica somada ou
subtraída desta constante:
E(X ± c) = E(X) ± c
4. Sejam X e Y duas variáveis aleatórias, o valor esperado da soma/subtração de variáveis
aleatórias equivale a soma/subtração dos valores esperados de X e Y:
E(X ± Y) = E(X) ± E(Y)
5. Sejam X e Y duas variáveis aleatórias independentes, temos que:
E(X.Y) = E(X).E(Y).
Propriedades Importantes da Variância
Sejam X uma v.a. e c = constante, então:
1. A variância de uma constante é zero:
V(c) = 0
2. Multiplicando-se uma constante por uma variável aleatória X, sua variância fica multiplicada
pelo quadrado da constante:
V(c.X) = c². V(X)
3. Sejam X e Y duas variáveis aleatórias independentes, a variância da soma/subtração de

41
variáveis aleatórias equivale a soma das variâncias de X e Y:

V(X ± Y) = V(X) + V(Y)
Exemplo : Encontre a variância da variável aleatória X, denotada por
1
𝑓(𝑥) = {𝑏 − 𝑎 , 𝑎 < 𝑥 < 𝑏
0, 𝑐. 𝑐
Temos que, V (X ) = E(X² ) - [E(X )]² . Assim,
𝑏 1 1 𝑥2 𝑏2 −𝑎 2 (𝑎+𝑏)(𝑎−𝑏) 𝑎+𝑏
E(X )= ∫𝑎 𝑥. 𝑏−𝑎 𝑑𝑥 = 𝑏−𝑎 . 2
= 2(𝑏−𝑎) = 2(𝑏−𝑎)
= 2
Além disso,
𝑏 1 1 𝑥3 𝑏3 −𝑎 3 (𝑎−𝑏)(𝑎−𝑏)2 (𝑎−𝑏)(𝑏2 +𝑎2 +2𝑎𝑏) (𝑏2 +𝑎2 +2𝑎𝑏)
E(X² )= ∫𝑎 𝑥 2 . 𝑏−𝑎 𝑑𝑥 = 𝑏−𝑎 . 3
= 3(𝑏−𝑎) = 3(𝑏−𝑎)
= 3(𝑏−𝑎)
= 3
Logo,
2)
(𝑏 2 + 𝑎2 + 2𝑎𝑏) (𝑎 + 𝑏)2 (𝑎 − 𝑏)²
𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 − [𝐸(𝑋)]2 = − =
3 4 12
Experimentos Binomiais e a Distribuição Binomial

Dentre as funções de probabilidade, apresentaremos inicialmente uma distribuição discreta de
grande importância, denominada Distribuição Binomial. Em seguida, faremos estudo de uma
distribuição contínua de grande utilização na teoria da probabilidade, chamada a Distribuição
Normal.
Para utilizar a teoria das probabilidades no estudo de um fenômeno concreto, devemos encontrar
um modelo probabilístico adequado a tal fenômeno. Endentemos por modelo probabilístico
para uma v.a. X, uma forma específica de função de distribuição de probabilidade que reflita o
comportamento de X. As propriedades básicas de um modelo probabilístico devem ser:
• Adequação: O modelo deve refletir adequadamente o mecanismo aleatório que ocasiona
variação nas observações;
• Simplicidade: Utilização, sempre que possível, de hipóteses simplificadoras, de modo que o
modelo se preste à análise estatística, sem sacrifício de adequação;
• Parcimônia de Parâmetros: Um número excessivo de parâmetros prejudicaria a análise
estatística.
Entre 2 modelos que constituam aproximação adequada de um fenômeno, devemos preferir
aquele que apresente o menor número de parâmetros.
Distribuição de Bernoulli
Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado
como sucesso ou fracasso, caso o evento que nos interessa ocorra ou não, respectivamente.
Associe p, a probabilidade de sucesso, ao evento que nos interessa e 1 – p = q, a probabilidade
de fracasso. Definimos, então, a seguinte variável aleatória discreta:
0, 𝑠𝑒 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜
𝑋={
1, 𝑠𝑒 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑠𝑢𝑐𝑒𝑠𝑠𝑜
A distribuição de probabilidade de X é definida por:
xi 0 1
P(X = xi) 1–p p
Verifica-se facilmente que E(X) = p e V(X) = p(1 – p), que são as principais características da
v.a.X.

42
Experimentos Binomiais
Um experimento binomial apresenta quatro propriedades:
1. O experimento consiste em uma sequência de n ensaios idênticos e independentes;
2. Dois resultados são possíveis em cada ensaio. Um é denominado de sucesso e o outro de
fracasso;
3. A probabilidade de um sucesso é denotada por p, e não se modifica de ensaio para ensaio. (O
mesmo se aplica à probabilidade de fracasso q = 1 – p );
4. Os ensaios são independentes;
5. Defina uma variável aleatória Y como sendo o número de sucessos nos n ensaios.
Definição : Dizemos que uma variável aleatória discreta Y = X1 + X2 + ... + Xn, onde cada Xi é
um ensaio de Bernoulli, apresenta distribuição binomial com n provas (ensaios ou tentativas) e
probabilidade p de sucesso, sendo sua função de probabilidade definida por:
𝑃(𝑋 = 𝑘) = (𝑛𝑘)𝑝𝑘 (1 − 𝑝)𝑛−𝑘 , 𝑘 = 0,1, … 𝑛, , pois, para X = k teremos observado k sucessos,
cada um com probabilidade p e consequentemente (n-k) fracassos, cada um com probabilidade
q = 1 – p.
Notação: X ~ B(n, p), equivalente a dizer que X tem distribuição Binomial com parâmetros n e
p.
Propriedades
• E(X) = np
• V(X) = npq
Exemplo : Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as probabilidades
de A ganhar, perder ou empatar sejam as mesmas e permaneçam constantes durante as 6
partidas. Encontre a probabilidade do time A ganhar 4 vezes e calcule a esperança e a variância.
Solução
Seja X = {número de vezes que o time A ganha}
Note que p = 1/3 (vencer) e que q = 2/3 (perder ou empatar). Além disso, n = 6.
1 4 1 4 2 2 20
Logo, 𝑃(𝑋 = 4) = (64) (3) (1 − 1/3)6−4 = 15. (3) . (3) = 243 = 0,08.
Temos também que a esperança (média) de vitórias será E(X ) = np = 6 × 1/2=2 e a
6.1 2 4
variância 𝑉(𝑋) = 𝑛𝑝𝑞 = . = .
3 3 3
Distribuição Normal
A distribuição normal é a mais importante das distribuições contínuas de probabilidade.
Conhecida por alguns leitores como “a curva em forma de sino”, tem sua origem associada aos
erros de mensuração. É sabido que, quando se efetuam repetidas mensurações de determinada
grandeza com um aparelho equilibrado, não se chega ao resultado todas as vezes. Obtém-se, ao
contrário, um conjunto de valores que oscilam, de modo aproximadamente simétrico, em torno
do verdadeiro valor. Construindo um histograma desses valores e o correspondente polígono de
frequências, obtém-se uma poligonal aproximadamente simétrica. A distribuição normal
desempenha, não obstante, um papel preponderante na estatística e os processos de inferência,
nela baseados, têm larga aplicação. Muitas das variáveis quantitativas analisadas em
pesquisas nas diversas áreas de estudo correspondem ou se aproximam da distribuição normal.
Uma distribuição normal caracteriza-se por uma função real f(x) denominada de função
densidade de probabilidade (f.d.p) da v.a X, dado pelo modelo probabilística abaixo e gráfico
correspondente:
1 (𝑥 − 𝜇)²
𝑓(𝑥) = 𝑒𝑥𝑝 {− } , −∞ < 𝑥 < +∞, −∞ < 𝜇 < +∞, 𝜎² > 0
√2𝜋𝜎² 2𝜎²
Propriedades da Curva Normal

43
1. É unimodal, isto é, f(x) tem um ponto de máximo cuja abscissa é x = µ. Esse ponto, situado
no meio da distribuição, é aquele em que coincidem os valores da média, moda e mediana;
2. f(x) é simétrica em relação à média µ;
3. f(x) tem dois pontos de inflexão, cujas abscissas são x = µ - σ e x = µ + σ;
4. O desvio-padrão é dado por σ ( a raiz quadrada positiva da variância σ2);
5. A área total sob a curva normal e acima do eixo horizontal equivale a 1 (o eixo das abscissas
é o eixo dos valores de v.a. X;
6. f(x) tem uma assíntota. A partir do topo, a curva cai gradativamente até formar as caudas que
se estendem indefinidamente, aproximando-se cada vez mais da linha base sem, entretanto,
jamais tocá-la.
7. Fixando-se a média, verifica-se que o achatamento da curva está diretamente ligado ao valor
do desvio padrão σ, ou seja, quanto maior for o desvio padrão mais achatada é a curva, como
pode ser vista na figura abaixo.
Notação: X ∼ N (µ , σ²), ou seja, X tem distribuição normal com média µ e variância σ². Ou
ainda, X ∼ N (µ , σ) , isto é, X tem distribuição normal com média µ e desvio padrão σ.
Distribuição Normal Padrão
O cálculo direto de probabilidades envolvendo a distribuição normal não é um processo
elementar. Notemos, entretanto, que a função de densidade normal depende de dois parâmetros,
µ e σ, de modo que se tabelássemos as probabilidades diretamente a partir dessa função, seriam
necessárias tabelas de dupla entrada para cada valor particular µ = µ0 e σ = σ0, complicando
consideravelmente o problema. Recorre-se, por isso, a uma mudança de variável, transformando
a v.a. X na v.a. Z assim definida:
𝑋−𝜇
Z =
σ
Esta nova variável chama-se variável normal padronizada, ou reduzida, sendo sua média igual a
zero (µ = 0) e o seu desvio padrão é igual um (σ = 1).
𝑋−𝜇 𝐸(𝑋) − 𝜇 𝜇 − 𝜇
E(Z) = E ( )= = =0
σ σ σ
𝑋−𝜇 𝑉(𝑋) − 0 𝜎²
V(Z) = V ( )= = =1
σ σ² σ²
A curva normal padrão conserva as mesmas propriedades listadas anteriormente. Mediante tal
transformação, basta construirmos uma única tabela, a da normal reduzida e, através dela,
obtermos as probabilidades associadas a todas as distribuições N (µ, σ).
A utilidade notável da tabulação pela variável normal padronizada é devida ao fato de que, se X
tiver qualquer distribuição normal N(µ, σ), a tabela da distribuição N(0; 1) pode ser empregada
para calcular probabilidades associadas a X, simplesmente aplicando a transformada para a
variável Z. Consequentemente, temos que:
𝑎−𝜇 𝑏−𝜇 𝑏−𝜇 𝑎−𝜇
P(a ≤ X ≤ b) = P ( σ
≤𝑍≤ σ
) = 𝜃( σ
)− 𝜃( σ
) ,
onde 𝜃(z) = P (Z ≤ z), é a função de distribuição acumulada de N(0; 1).
Exemplo : Os salários médios diário dos operários de uma indústria são distribuídos segundo
uma distribuição normal com média de R$ 50,00 e desvio padrão de R$ 4,00. Encontre a
probabilidade de um operário ter um salário diário abaixo de R$ 52,00.
Solução
Seja X = o salário diário do operários, estamos interessados em encontrar P (X < 52). Assim,
52−𝜇 52−50
P(X < 52) = P (Z < σ
) = 𝑃(𝑍 < 4
) = 𝑃(𝑍 < 0,50) = 𝜃(0,50).
Através da tabela da distribuição normal padrão, obtemos a probabilidade de interesse 𝜃(50,0) =

44
,0 6915.
Logo, pode-se afirmar que a probabilidade de um operário apresentar um salário inferior a R$
52,00 é de 69,15%.
Exercícios
3.1- Cinco por cento dos motoristas de ônibus da cidade HH são mulheres. Suponha que 20
motoristas de ônibus são selecionados aleatoriamente para serem entrevistados sobre as
condições de trabalho. Qual a probabilidade de que nenhum motorista selecionado seja mulher?
Qual a probabilidade de que pelo menos 3 motoristas selecionados sejam mulheres?
3.2- O departamento de Recursos Humanos da empresa FF recebe 25 currículos para diversos
cargos, e espera que a probabilidade de não ocorrer candidatos experientes no grupo seja de
80%. Determine a probabilidade de no máximo 8 currículos recebidos apresentarem candidatos
experientes.
3.3- Uma confecção de roupa masculina suspeita que 35% de sua produção apresenta algum
defeito. Se tal suspeita é correta, determine a probabilidade de que, numa amostra de seis peças,
sejam encontradas: duas peças defeituosas; no mínimo três peças defeituosas; menos que três
peças defeituosas.
3.4- A probabilidade de um atirador acertar o alvo é 2/3. Se ele atirar 5 vezes, qual a
probabilidade de acertar exatamente 2 tiros ?
3.5- Suponhamos que a pressão sangüínea sistólica normal de indivíduos com idade entre 15 e
25 anos é uma variável aleatória com distribuição normal de média 120mmHg e desvio padrão
8mmHg. Nestas condições, calcule a probabilidade de um indivíduo dessa faixa etária, com
pressão sangüínea sistólica normal apresentar pressão:
a) Inferior a 120mmHg; (R: 0,5)
b) Entre 100 e 110mmHg; (R: 0,0994)
c) Acima de 106mmHg; (R: 0,9599)
d) Abaixo de 136mmHg; (R: 0,9772)
e) Para os 20% dos indivíduos que têm as maiores pressões sangüíneas sistólicas, determinar a
menor pressão sangüínea sistólica. (R: 126,72 mmHg)
f) Para os 18% dos indivíduos que têm as menores pressão sangüíneas sistólicas, determinar a
maior pressão sangüínea sistólica. (R: 112,64 mmHg)
3.6- Acredita-se que as vendas aproximadas do creme dental MM sejam normalmente
distribuídas, com uma média de 20.000 tubos por semana e um desvio padrão de 3.000 tubos
por semana. Calcule a probabilidade de que mais de 22.000 tubos sejam vendidos em qualquer
dada semana;
3.7- Os mergulhadores que são membros do Sindicato dos Mergulhadores Profissionais ganham
em média U$ 17 por mergulho de alta profundidade. Considere que os dados disponíveis
indicam que o pagamento seja distribuído normalmente com desvio padrão de U$ 2,25.
a) Qual a probabilidade de que os salários estejam entre U$15,00 e U$20,00 por mergulho;
b) Qual a probabilidade de que os salários sejam menores que U$12,00 por mergulho;
Teoria Elementar da Amostragem

1. Situando a Temática
Amostragem é uma área da Estatística que estuda técnicas de planejamento de pesquisa para
possibilitar inferências sobre uma população a partir do estudo de uma pequena parte de seus
componentes, uma amostra.

45
2. Problematizando a Temática
Ao fazermos uma jarra de suco e adicionamos açúcar desejamos saber se a quantidade de açúcar
foi satisfatória. Para isto, não precisamos tomar toda a jarra de suco, uma colher basta. Da
mesma forma, ao estudarmos um fenômeno probabilístico em uma população não precisamos
investigar toda a população, e sim uma amostra dela. No entanto, algumas questões podem
surgir: como obter essa amostra? qual deve ser o tamanho dessa amostra? Esta unidade tem
como objetivo responder esta e mais algumas questões correlatas.
3. Desenvolvendo a Temática
3.1 Conceitos Básicos
Muitas vezes faz-se necessária a coleta de dados diretamente na origem. Entretanto, quando é
impossível se observar toda a população recorremos às técnicas de amostragem, onde nos
limitamos a uma amostra da população em estudo. Basicamente, nosso objetivo é coletar uma
pequena fração da população de modo que as informações observadas na amostra possam ser
generalizadas para a população. Para que esta generalização seja possível, os integrantes da
amostra devem ser escolhidos adequadamente.
Antes de aprofundarmos nosso discurso, vamos definir alguns termos necessários:
• População Objeto: É a população de interesse sobre a qual desejamos obter informações (ex.:
peças produzidas em uma fábrica);
• População de Estudo: É o conjunto de indivíduos de interesse específico (ex.: peças que
permanecem em estoque);
• Característica Populacional: Aspectos da população que interessam serem medidos ou
observados (ex.: diâmetro da peça)
• Unidade Amostral: Definida de acordo com o interesse do estudo, podendo ser uma peça, um
indivíduo, uma fazenda, etc. Tal escolha deve ser feita no início do estudo;
• Estrutura Amostral ou Amostra: É o conjunto de unidades amostrais (ex.: o conjunto das peças
selecionadas).
É importante ressaltar que existem dois tipos de amostragem, a saber:
• Amostragem Probabilística: É o procedimento através do qual existe uma probabilidade
conhecida e diferente de zero (p) para cada elemento da população ser escolhido para constituir
a amostra;
• Amostragem Não-Probabilística: Quando, no processo de seleção, não existe nenhum
mecanismo probabilístico para selecionar os indivíduos da população para constituir a amostra.
De acordo com a definição de amostragem probabilística, existe a suposição de um sorteio com
regras bem determinadas, cuja realização só será possível se a população for finita e totalmente
acessível. Esse tipo de amostragem é a melhor garantia para se obter uma representatividade da
população pela amostra. Os principais planos de amostragem probabilística são:
1. Amostragem Aleatória (ou Casual) Simples: Neste tipo de plano, supõe-se que todos os
elementos da população tem igual probabilidade de pertencer à amostra, ou alternativamente,
se todas as possíveis amostras, de mesmo tamanho, têm a mesma probabilidade de serem
selecionadas.
Normalmente, consideramos esse tipo de plano amostral quando a população é homogênea.
Esse processo de amostragem pode ser feito com ou sem reposição do elemento amostrado.
Uma técnica que garante esta igual probabilidade é a seleção aleatória de elementos, por
exemplo, através de sorteio.
2. Amostragem Sistemática: Inicia com uma escolha aleatória de um elemento da população e, a
partir deste, usa-se um sistema de seleção para compor o restante da amostra. Por exemplo,
numa listagem de elementos da população, sorteamos um entre os dez primeiros da lista – o 5
elemento. A partir do elemento sorteado, selecionamos um a cada quinze elementos (o 20˚, o

46
35˚ e assim por diante). Este método de amostragem pode ser utilizado quando se quer planejar
um período de tempo para execução da coleta de dados ou quando se deseja cobrir um
determinado período de tempo com a amostra estudada. Também consideramos esse tipo de
plano amostral quando a população é homogênea.
3. Amostragem Estratificada: Na amostragem estratificada a população é dividida em grupos
internamente homogêneos (estratos) e em seguida é selecionada uma amostra aleatória de cada
estrato. Este tipo de amostragem é usado quando o evento estudado numa população tem
características distintas para diferentes categorias que dividem esta população, ou seja, dentro de
cada estrato os elementos são bastantes semelhantes entre si e, entre os estratos eles são
heterogêneos. Assim, a estratificação é apropriada para agrupar os elementos por sexo, faixa
etária, religião, escolaridade ou em populações heterogêneas como rendas, produções agrícolas,
produções industriais, etc.
4. Amostragem por Conglomerados: A população é dividida em pequenas subpopulações, com
elementos internamente heterogêneos, chamadas conglomerados (clusters). Seleciona-se uma
amostra aleatória simples desses conglomerados, e deles selecionam-se aleatoriamente os
elementos que irão compor a amostra. Assim, numa pesquisa sócio econômica pode-se dividir a
cidade em bairros (conglomerados), em seguida obter uma amostra aleatória de bairros e, então
efetuar o levantamento estatístico nas residências dos bairros selecionados. Observe que, no
caso da estratificação, indivíduos serão selecionados em cada estrato, enquanto no caso da
divisão da população em conglomerados, selecionamos apenas parte dos conglomerados.
5. Amostragem por Estágios Múltiplos: Esta estratégia de amostragem pode ser vista como uma
combinação de dois ou mais planos amostrais. Considere por exemplo uma população
estratificada onde o número de estratos é muito grande. Ao invés de obter uma amostra aleatória
de cada estrato, o que poderia ser inviável devido à quantidade de estratos, o pesquisador
poderia optar por selecionar aleatoriamente alguns estratos e em seguida selecionar uma amostra
de cada estrato selecionado. Neste caso, teríamos uma amostragem em dois estágios usando, nas
duas vezes, a amostragem aleatória simples, sendo que no primeiro estágio as unidades
amostrais são os estratos e no segundo são as componentes da população.
É importante ressaltar que certos cuidados dever ser tomados no processo de obtenção de uma
amostra, ou seja, no processo de “amostragem”, pois muitas vezes erros grosseiros e conclusões
falsas ocorrem devido a falhas nesse processo.
3.2 Distribuição Amostral da Média e da Proporção
Na Inferência Estatística, o principal problema é fazer uma afirmação sobre um parâmetro
populacional (média, proporção, variância, etc.) baseado em informações coletadas de uma
amostra, através de um Estimador (média amostral, variância amostral, etc.). No entanto, a
validade de nossa afirmação seria melhor compreendida se soubéssemos o comportamento do
Estimador ao retirarmos todas as amostras possíveis de tamanho n de uma população de
tamanho N. Em outras palavras, estamos interessados em conhecer a distribuição amostral de
um Estimador.
3.2.1 Distribuição da Média Amostral
A distribuição amostral da média X é uma distribuição que mostra as probabilidades de obter os
possíveis valores das médias amostrais. Vamos supor uma população {1, 3, 5} com N=3
elementos e a variável aleatória X assumido o valor do elemento na população, com a seguinte
distribuição de probabilidade:
xi 1 3 5

47
P(X = xi) 1/3 1/3 1/3
Observe que a distribuição acima tem média (valor esperado) e variância dados por:
1+3+5 (1 − 3)² + (3 − 3)² + (5 − 3)² 8
𝐸(𝑋) = µ = = 3 𝑒 𝑉(𝑋) = 𝜎 2 = =
3 3 3
Se retirarmos todas as amostras aleatórias de tamanho n = 2, com reposição, dessa população
obtemos um total de Nn = 32 = 9 amostras com os seguintes resultados:
(1,1) (1,3) (1,5) (3,1) (3,3) (3,5) (5,1) (5,3) (5,5).
Considerando essas 9 possibilidades igualmente prováveis, podemos construir a distribuição
amostral da média para uma amostra de tamanho 2. Para tanto, basta calcular a média de cada
uma dessas amostras obtendo os seguintes valores xi : 1, 2, 3, 2, 3, 4, 3, 4, 5, respectivamente.
Note que, a partir das médias amostrais obtidas nas 9 amostras possíveis, é possível obtermos a
seguinte distribuição amostral para X :
xi 1 2 3 4 5
P(X = xi ) 1/9 2/9 3/9 2/9 1/9
Ainda com respeito à distribuição amostral de X , acima apresentada, observa-se que:

• a sua média (valor esperado) é igual à média da população, ou seja,
1.1 2.2 3.3 4.2 5.1 27
𝐸(𝑋̅) = 𝜇𝑥̅ = ( ) + ( ) + ( ) + ( ) + ( ) = = 3 = 𝜇 ;
9 9 9 9 9 9
• a sua variância é igual à variância da população dividida pelo tamanho da amostra. Temos que:
V(̅ X ) = E(X ̅ ²) − [E( ̅ X )]² .
Logo, 𝐸(𝑋²̅̅̅) = 𝜇 = ( ) + (2².2) + (3².3) + (4².2) + (5².1) = 93 .
1².1
𝑥̅ 9 9 9 9 9 9
8
̅̅̅ = 𝐸(𝑋̅ 2 ) − [𝐸(𝑋̅)]2 = 93 93 93−81 12 4 𝜎²
Assim, V(𝑋) 9
− 32 = 9
−9= 9
= 9
=3= 3
2
= 𝑛
. Tais
relações entre µ e 𝜇𝑥̅ , e σ² e σ 𝜎𝑥̅ ² , observadas no exemplo acima, podem ser generalizadas.
Usando a teoria das probabilidades é possível mostrar que os seguintes resultados gerais são
válidos com relação à distribuição amostral da média. Seja X uma variável aleatória com valor
esperado E(X) = µ e variância V(X) = σ² finita, isto é, 0< σ² < ∞. Seja 𝑋̅ a média desta variável
aleatória, obtida de amostra aleatória de tamanho n, selecionada com reposição. Então, temos
que:
• E(𝑋̅) = 𝜇𝑥̅ = µ ;
𝜎²
• V( 𝑋̅ ) =𝜎²𝑥̅ = 𝑛 .
Além disso, tem-se o resultado conhecido como Teorema Central do Limite: Seja X uma
variável aleatória com valor esperado E(X) = µ e variância V(X) = σ². Para n suficientemente
grande,
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1
𝜎²
apresenta, aproximadamente, uma distribuição normal com média µ e variância , Logo,
𝑛
𝜎 2 𝑋̅−μ
𝑋̅ ≈ 𝑁 (𝜇. 𝑛 ) 𝑒 𝑍 = 𝜎 ≈ 𝑁(0,1).
√𝑛
A distribuição da variável padronizada Z é conhecida por Distribuição Normal Padrão.
Observações

48
𝜎
1) O desvio padrão de 𝑋̅ , denotado por 𝜎𝑥̅ = , é chamado erro padrão da média e descreve a
√𝑛
variabilidade das médias amostrais em torno da verdadeira média populacional µ. Assim,
quanto maior o erro padrão da média, maior será a diferença entre parâmetro µ e sua estimativa
𝜎²
𝑋̅ , calculada a partir da amostra . Quando n é grande 𝑛 decresce, significando que a média
amostral fornecerá uma estimativa mais segura para µ em grandes amostras.
2) Para amostras sem reposição, de população finita, temos a média 𝜇𝑥̅ = E(𝑋̅ ) = µ e
𝜎² 𝑁−𝑛
variância 𝜎²𝑥̅ = 𝑉(𝑋̅ ) = .
𝑛 𝑁−1
, onde N é o total de elementos da população.
3) Para valores grandes de n ( n ≥ 30) a aproximação da distribuição amostral da média X pela
distribuição Normal é considerada satisfatória.
Exemplo 4.1 - Os registros de uma agência de turismo mostram que um turista gastou, durante o
último ano, em média µ = US$800,00, sendo o desvio padrão dos gastos igual a σ = US$80,00.
Ache a probabilidade de que uma amostra de 64 turistas apresente um gasto médio entre
US$770,00 e US$825,00.
Solução: Considere a variável X = gastos (em US$). Embora a distribuição de X não seja
conhecida, como o
tamanho da amostra n = 64 é bastante grande, podemos admitir que a média amostral de X
segue a distribuição Normal com parâmetros
𝜎 80
𝜇𝑥̅ = 𝜇 = 𝜇𝑥̅ = 800 𝑒 𝜎𝑥̅ = = = 10 .
√𝑛 √64
Assim temos que
770−800 𝑋̅−𝜇 825−800
𝑃(770 ≤ 𝑋̅ ≤ 825) = 𝑃 ( ≤ 𝜎 ≤ ) = 𝑃(−3,0 ≤ 𝑍 ≤ 2,5) = 𝑃(𝑍 ≤ 3,0) −
10 10
√𝑛
𝑝(𝑍 ≤ 2,5) = 0,9938 − 0,9925.
Se considerarmos um grande número de amostras, cada uma com 64 turistas, em
aproximadamente 99,25% delas o gasto médio estaria entre US$770,00 e US$825,00.
3.2.2 Distribuição Amostral da Proporção
Se o parâmetro de interesse p representa uma proporção (ou percentagem) de elementos com
certa característica (atributo) na população, então chamamos a estatística correspondente na
amostra de proporção amostral, denotando-a por:
𝑥
𝑃̂ = , onde x = número de elementos da amostra que possuem a característica de interesse.
𝑛
Pode-se mostrar que, sob certas condições, e se n é suficientemente grande, a distribuição da
proporção amostral p ˆ é aproximadamente Normal, com média E( p ˆ ) = p e variância
q
𝑉( 𝑃̂ ) = p . n , onde
q = 1 – p. Dessa forma, temos que
𝑞 𝑃̂−𝑃
𝑃̂ ≈ 𝑁 (𝑃, 𝑝. 𝑛) 𝑒 𝑍 = 𝑞
≈ 𝑁(0,1).
√𝑝.𝑛
No caso de uma população finita de tamanho N e uma amostra sem reposição, recomenda-se o
uso do fator de correção populacional no cálculo da variância de p ˆ , sendo expressa por:
𝑝.𝑞 𝑁−𝑛
𝑉(𝑃̂)= . 𝑛 𝑁−1
Exemplo 4.2 Suponha que de um grande lote de produção, 10% dos itens produzidos
apresentam algum tipo de defeito. Em uma amostra aleatória de tamanho 60, obtida do lote para
inspeção de qualidade, calcule a probabilidade de ter mais de 15% dos itens defeituosos.
Solução:

49
̂
𝑃−𝑝 0,15−0,10
𝑃(𝑃̂ > 0,15) = 𝑃 ( 𝑞 > 0,1.0,9 ) = 𝑃(𝑍 > 1,29) = 1 − 0,9015 = 0,0985.
√𝑝.𝑛 √
60
Se considerarmos um grande número de amostras, cada uma contendo 60 itens, em

aproximadamente 9,85% das amostras a proporção de itens defeituosos seria superior a 15%.
Exercícios
4.1 – Admita que a aceitação de um grande lote de peças ocorra apenas se o comprimento médio
de 10 peças, retiradas aleatoriamente do lote, estiver entre 5 cm e 10 cm. Sabe-se que o
comprimento das peças é uma variável aleatória com distribuição Normal com média µ = 7,5cm
e variância σ² = 20 cm². Calcule a probabilidade do lote ser aceito. (R.: 0,9232)
4.2 – Seja X1, X2, ... , Xn uma amostra aleatória de tamanho n obtida de X ~ N( µ , σ ²). Qual é
a probabilidade da média amostral, X , estar compreendida em cada um dos intervalos
seguintes?
a) µ ± 𝜎𝑥̅ ;
b) µ ± 2𝜎𝑥̅ ;
c) µ ± 3𝜎𝑥̅ ;
𝜎
onde 𝜎𝑥̅ = . Dica: (a) Calcule P(µ - 𝜎𝑥̅ ≤ 𝑋̅ ≤ µ + 𝜎𝑥̅ ).
√𝑛
R.: (a) 0,6826; (b) 0,9544; (c) 0,9974.
4.3 – Considere que o consumo mensal de água por residência em um certo bairro tem
distribuição Normal, com média µ = 10 e desvio padrão σ = 2 (em m³). Para uma amostra
aleatória de 25 dessas residências, qual é a probabilidade da média amostral, X , não se afastar
da média verdadeira, µ, por mais de 1 m³? R.: P( /X - µ/ ≤ 1) = 0,9876.
4.4 - O departamento de compras de uma companhia rejeita rotineiramente remessa de peças se
uma amostra aleatória de tamanho 100, extraída de um grande lote de peças, acusa 10 ou mais
defeituosas. Determinar a probabilidade de um lote ser rejeitado se tem uma percentagem p de
peças defeituosas de: a) 5%; b) 18%. R.: a) 0,011; b) 0,9812.
4.5 - Em um processo de produção, 10% das unidades produzidas são defeituosas. Em uma
amostra aleatória de 100 unidades, ache a probabilidade da proporção amostral de unidades
produzidas com defeito ser: a) inferior a 13%; b) entre 7% e 16%; c) maior que 8%. R.: a)
0,8413; b) 0,8185; c) 0,7486
4.6 – Suponha que a proporção de itens defeituosos em um grande lote de peças seja 0,1. Qual o
tamanho mínimo de uma amostra aleatória de itens a ser retirado do lote para que, com
probabilidade de 0,983, a proporção de itens defeituosos na amostra seja no máximo 0,13? Dica:
Use P( p ˆ ≤ 0,13) = 0,983. R.: n ≅ 450
4.7 – Desejamos coletar uma amostra aleatória de uma variável aleatória X com distribuição
Normal com média desconhecida, µ, e variância σ² = 40. Qual deve ser o tamanho da amostra,
n, para que, com probabilidade 0,92, a média amostral, 𝑋̅ , não se afaste da média da população,
µ, por mais de 2 unidades?
Dica: Use P( /X - µ/ ≤ 2) = 0,92 onde 𝑋̅ - µ = erro amostral da média. R.: n ≅ 31
4.8 - Uma empresa compra canetas esferográficas, em grande quantidade, de um certo
distribuidor. Antes de aceitar os lotes remetidos, a empresa faz testes para verificar a sua
qualidade. Se uma certa remessa apresentar 5% de canetas defeituosas, a remessa será devolvida
ao fabricante. Calcule a probabilidade de que em uma amostra aleatória de 50 canetas, mais do
que 7% apresentem defeitos? R.: 0,2578

50
Referências Bibliográficas
BUSSAB, W.O. e Morettin, P.A. Estatística Básica. São Paulo: Atual, 1987.
FONSECA, J.S. e Martins, G.A. Curso de Estatística. São Paulo: Atlas, 1993.
LAPPONI, J.C. Estatística usando Excel 5 e 6. São Paulo: Lapponi Treinamento e Editora,
1997.
MORETTIN, L.G. Estatística Básica – Vol. 2 – Inferência. São Paulo: Makron Books, 1999.
MORETTIN, L.G. Estatística Básica – Vol.1 – Probabilidade. São Paulo: Makron Books, 1999.
STEVENSON,W.J. Estatística Aplicada à Administração. São Paulo: Harbra, 1996.
TIBONI,C.G. R. Estatística Básica para o curso de Turismo. São Paulo: Atlas, 2002.
TOLEDO, G. L. e Ovalle, I.I. Estatística Básica. São Paulo: Atlas, 1985.


Fascículo de Estatística Descritiva 2 Ano Enfermagem 2023

Enviado por

Direitos autorais:

Formatos disponíveis

Fascículo de Estatística Descritiva 2 Ano Enfermagem 2023

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Fascículo de Estatística Descritiva 2 Ano Enfermagem 2023

Enviado por

Direitos autorais:

Formatos disponíveis

4

Introdução a cadeira de Estatística Descritiva

Nesta unidade, serão abordados temas relacionados ao método estatístico. Oferecer

Esta disciplina servirá de apoio aos estudantes em Enfermagem e Matemática no processo

Nesta cadeira vamos abordar temas como: Natureza e Fundamentos do Método

O docente: Beto Francisco André Lourenço

A Estatística é considerada por alguns autores como Ciência no sentido do estudo de

A palavra estatística lembra, à maioria das pessoas, recenseamento. Os censos

A estatística é também comumente associada às pesquisas de opinião pública, aos

Conceitos Básicos de Estatística

Grandes áreas da Estatística

O docente: Beto Francisco André Lourenço

• Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam coletar,

População (ou Universo)

1.2. Importância da Estatística

O docente: Beto Francisco André Lourenço

parâmetro populacional desconhecido.

O docente: Beto Francisco André Lourenço

população. São elas:

Amostragem Aleatória Simples

Exemplo de utilização da TNA

O docente: Beto Francisco André Lourenço

Amostragem Aleatória Estratificada

Resolução: Dados: Resolução

Resolução: Dados: Resolução

O docente: Beto Francisco André Lourenço

Dados: n=2, N=90, na= , Na1=54, Na2=36

Calcula-se a percentagem, pegando o valor da população dividindo pela percentagem em causa.

Sexo População 10% Número de amostras

• Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90,

Amostragem por Conglomerado

O docente: Beto Francisco André Lourenço

O docente: Beto Francisco André Lourenço

A obtenção ou coleta dos dados é normalmente feita através de um questionário ou de

O docente: Beto Francisco André Lourenço

O Nominais - quando puderem ser reunidas em categorias ou espécies com idênticos

O docente: Beto Francisco André Lourenço

O docente: Beto Francisco André Lourenço

CÁLCULO DAS PROBABILIDADE E ESTATÍSTICA (CPE) - período 97.1 – turma 01

1 Fem Física 19 Interior Média 6 47 156

2 Masc Matem. 18 Capital Média 6 75 167

3 Fem Matem. 18 Outra Região Média 6 61 169

4 Fem Matem. 18 Capital Média 6 56 163

5 Masc Matem. 18 Capital Média 6 80 178

O docente: Beto Francisco André Lourenço

6 Fem Matem. 20 Interior Média 6 44 158

7 Fem Matem. 20 Interior Média 6 52 158

8 Masc Matem. 19 Capital Média 6 67 174

9 Fem Matem. 19 Outra Região Média 3 48 167

10 Masc Matem. 18 Capital Média 6 83 180

11 Fem Matem. 18 Capital Média 6 53 163

12 Masc Matem. 21 Outra Região Média 5 66,5 175

13 Masc Matem. 18 Interior Média 6 78 180

14 Fem Matem. 18 Interior Não Info. 6 46 158

15 Fem Matem. 18 Capital Média 6 54 160

16 Fem Matem. 19 Capital Média 6 56 162

17 Fem Matem. 19 Capital Média 7 53 160

18 Fem Matem. 18 Capital Média 6 57 164

19 Fem Física 23 Outra Região Média 6 53 160