Apontamentos de Introducao À Estatistica

Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe
CONTEÚDOS DA UNIDADE 01: NOÇÕES GERAIS SOBRE INTRODUÇÃO À

ESTATÍSTICA
 Noção de Estatística;
 Divisão da Estatística;
 População e Amostra;
 Característica e Variável;
 Classificação de Variáveis;
 Observação e Conjunto de Dados;
INTRODUÇÃO: Noções Gerais sobre Estatística.
Não é uma tarefa simples definir o que é estatística. Por vezes define-se como sendo um
conjunto de técnicas de tratamento de dados, mas é muito mais do que isso. A estatística é uma
“arte” e uma ciência que permite tirar conclusões e de uma maneira geral fazer inferências 1 a
partir de conjuntos de dados. Até 1900, a Estatística resumia-se ao que hoje em dia se chama de
Estatística Descritiva. Apesar de tudo, deu contribuições muito positivas em várias áreas
cientificas.
A necessidade de uma maior formalização nos métodos utilizados, fez com que, nos anos
seguintes, a Estatística se desenvolvesse numa outra direcção, nomeadamente no que diz respeito
ao desenvolvimento de métodos e técnicas de Inferência Estatística. Assim, por volta de 1960 os
textos de Estatística debruçam-se especialmente sobre métodos de estimação e de testes de
hipóteses, assumindo determinadas famílias de modelos, descurando os aspectos práticos da
análise dos dados.
Porém, na última década, em grande parte devido às facilidades computacionais postas à

sua disposição, os Estatísticos têm-se vindo a preocupar-se cada vez mais, com a necessidade de
desenvolver métodos de análise e exploração dos dados, que deem uma maior importância aos
mesmos.
1
Inferência, segundo GUIMARÃES (2007, p.19) significa estender os resultados da amostra para toda a população.
Outros autores, afirmam que, a inferência significa deduzir por meio de raciocínio, ou seja, tirar conclusões com
base em deduções.
Autor: Rosângelo Paúnde Página 1
Por isso mesmo, em todas as áreas do conhecimento é necessário saber “o que medir” e
“como medir”. Nesta ordem de ideias, pode se definir a Estatística como sendo a ciência que
ensina a recolher dados válidos, assim como a interpretá-los.
A estatística, durante muitos séculos, esteve relacionada apenas com as informações a

respeito do Estado. Hoje em dia, o conjunto de teorias, conceitos e métodos denominado
estatística está associado ao processo de descrição e inferência, debruçando-se, de modo
particular, sobre questões relativas a sumarização eficiente de dados, planeamento e análise de
experimentos e levantamentos e natureza de erros de medida e de outras causas de variação em
um conjunto de dados.
Em jeito de conceito, HORTA, (s.d.), conceitua a Estatística, como sendo um conjunto

de técnicas e métodos de pesquisa que entre outros tópicos envolve o planeamento do estudo a
ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a
disseminação das informações.
Como importância, (PIANA, MACHADO & SELAU, 2009, p.5) afirmam que a
estatística é importante na medida em que, é uma ferramenta necessária para a compreensão
dos fenómenos que ocorrem nas mais diferentes áreas.
DIVISÃO DA ESTATÍSTICA
A estatística divide-se em duas partes essenciais a saber: Estatística Descritiva e a

Estatística Analítica ou Inferência Estatística.
Enquanto a Estatística Descritiva cuida do resumo e da apresentação de dados de

observações por meio de tabelas, gráficos e medidas, sem se preocupar com as populações de
onde esses dados foram retirados, a Estatística Analítica ou Inferência Estatística tem como
objectivo fornecer métodos que possibilitem a realização de inferência sobre populações a partir
de amostras delas provenientes.
Diante dos factos acima elencados, pode-se afirmar que a Estatística Descritiva tem por
objectivo resumir as principais características de um conjunto de dados por meio de tabelas,
gráficos e resumos numéricos. Diferentemente da Inferência Estatística, que tem por base o

cálculo de probabilidades e compreende dois grandes tópicos: a estimação de parâmetros e os

testes de hipóteses.
Embora a Estatística Descritiva seja um ramo fundamental da Estatística, em muitos

casos ela se torna insuficiente. Isto ocorre porque quase sempre as informações são obtidas de
amostras e, consequentemente, sua análise exige generalizações que ultrapassam os dados
disponíveis. Por conseguinte, essa necessidade, aliada ao desenvolvimento dos métodos
probabilísticos, promoveu o crescimento da estatística pela ênfase aos métodos generalizadores
(Inferência Estatística).
Usualmente, é impraticável observar toda uma população, seja pelo custo alto, seja por
dificuldades operacionais. Por isso mesmo, examina-se uma amostra, de preferência bastante
representativa, para que os resultados obtidos possam ser generalizados para toda a população.
Portanto, toda conclusão tirada por amostragem, quando generalizada para a população,
apresenta um grau de incerteza.
Assim sendo, por Inferência Estatística, (GUIMARÃES, 2007, p.13), diz que é o
conjunto de técnicas e procedimentos que permitem dar ao pesquisador um grau de
confiabilidade nas afirmações que faz para a população, baseadas nos resultados das amostras.
Dessa forma, poderíamos resumir os passos necessários para se atingir bons resultados ao
realizar um experimento:
1. Planear o processo amostral e experimental;

2. Obter inferências sobre a população e;
3. Estabelecer níveis de incerteza envolvidos nessas inferências,
Para ilustrar efectivamente a necessidade da inferência estatística, ou seja, dos métodos

generalizadores (PIANA, MACHADO & SELAU, 2009, p.6), apresentam os seguintes
exemplos:
- Prever a duração média da vida útil de uma calculadora, com base no desempenho de
muitas dessas calculadoras;

- Comparar a eficiência de duas dietas para reduzir peso, com base nas perdas de peso de
pessoas que se submeteram às dietas;
- Determinar a dosagem ideal de um novo medicamento, com base em testes feitos em

pacientes voluntários de hospitais selecionados aleatoriamente;
- Prever o fluxo de trafego de uma rodovia ainda em construção, com base no trafego
observado em rodovias alternativas.
Portanto, em todas essas situações existe incerteza porque dispomos apenas de

informações parciais, incompletas ou indirectas. A Inferência Estatística trata de problemas
onde a incerteza é inerente, utilizando métodos que se fundamentam na teoria das
probabilidades. Portanto, os métodos de inferência tornam-se necessários para avaliar a
confiabilidade dos resultados observados.
POPULAÇÃO E AMOSTRA
De um modo geral, podemos dizer que o objectivo da estatística é fornecer métodos para
se conviver, de modo racional, com a variabilidade. Isto é feito através da descoberta de
regularidades nos dados relativos às situações em estudo. Assim sendo, quando estudamos uma
determinada característica, geralmente, queremos obter conclusões para um conjunto de todos
os indivíduos ou objectos que apresentam tal característica. Portanto, chamamos de população
ao conjunto de todos os indivíduos ou objectos que apresentam uma característica em comum,
cujo comportamento deseja-se analisar ou inferir.
GUIMARÃES (2007, p.13), conceitua população como sendo a totalidade de elementos

que estão sob discussão e das quais se deseja informação, se deseja investigar uma ou mais
características. Assim, segundo o mesmo autor, a população pode ser formada por pessoas,
domicílios, peças de produção, cobaias, ou qualquer outro elemento a ser investigado. Mas, para
que haja uma clara definição das unidades que formam a população, é necessária a
especificação de três elementos:
 Uma característica em comum;

 Localização temporal e;
 Localização geográfica.
Exemplo: Estudo sobre as causas das reprovações em massa nos exames da 10ª classe
nas escolas da Conselho Autárquico de Inhambane no ano de 2020. Diante deste exemplo,
teremos como população alvo, todos os estudantes do Conselho Autárquico de Inhambane que
frequentaram a 10ª classe no ano 2020; População de estudo, todos os estudantes reprovados
nesta classe no ano de 2020 no mesmo Conselho Autárquico.
Portanto, na maioria dos casos, ao estudarmos uma população, não temos acesso a
todos os seus elementos. Por conseguinte, o estudo é feito, então, a partir de uma parte desta
população, denominada amostra, que tem por objectivo representá-la.
Uma amostra é uma parcela da população utilizada para uma posterior análise de dados.
Ou seja, em vez de utilizar toda a população, que resulta em maior custo, tempo e por muitas
vezes ser inviável, o processo de amostragem utiliza uma pequena porção representativa da
população. A amostra fornece informações que podem ser utilizadas para estimar características
de toda a população.
Não obstante, é preciso garantir que a amostra ou as amostras usadas sejam obtidas por
processos adequados. Se erros forem cometidos no momento de seleccionar os elementos da
amostra, o trabalho todo fica comprometido e os resultados finais serão provavelmente bastante
viesados. Por isso mesmo, devemos tomar especial cuidado quanto aos critérios usados na
seleção da amostra.
Obviamente, o que é necessário garantir, em suma, é que a amostra seja representativa

da população. Isso significa que, com exceção de pequenas discrepâncias inerentes à
aleatoriedade sempre presente, em maior ou menor grau, no processo de amostragem, a amostra
deve possuir as mesmas características básicas da população, no que diz respeito à(s)
variável(is) que desejamos pesquisar.
Usando o exemplo anterior, para facilitar o nosso estudo, escolheremos um subconjunto

da população, ou seja, uma amostra que, das oito escolas Secundárias que leccionaram a 10ª
classe naquele Conselho Autárquico no ano 2020, selecionaremos apenas cinco: Escola
Secundária de Muelé, Escola Secundária Emília Daússe, Escola Secundária de Conguiana,
Escola Secundária 4 de Outubro e a Escola Secundária de Guitambatuno.

TIPOS DE AMOSTRAGEM
Existem dois tipos de técnicas de amostragem a saber: a amostragem probabilística e a

amostragem não-probabilística.
A amostragem será probabilística se todos os elementos da população tiverem

probabilidade conhecida, e diferente de zero, de pertencer à amostra. Caso contrário, a
amostragem será não-probabilística.
Ou seja, uma amostragem não probabilística é obtida quando o acesso a informações

não é tao simples ou os recursos forem limitados, assim o pesquisador faz o uso de dados que
estão mais a seu alcance, é a chamada amostragem por conveniência.
Exemplo:
Podemos realizar um estudo para avaliar a qualidade do serviço prestado por uma
operadora de telefonia celular. Caso tenhamos recursos suficientes, podemos realizar um plano
amostral bastante abrangente de toda a população de usuários do serviço. Isso caracteriza uma
amostra probabilística. Mas, se por restrições orçamentárias ou de outra ordem, não for
possível obter uma amostra tão numerosa ou ela seja de difícil acesso, podemos restringir nossa
amostra a uma pequena região delimitada de fácil acesso e de custo reduzido, por exemplo,
usuários de uma cidade. Essa é uma amostragem não-probabilística. Segundo essa definição, a
amostragem probabilística implica sorteio com regras bem determinadas, cuja realização só
será possível se a população for finita e totalmente acessível. A utilização de uma amostragem
probabilística é a melhor recomendação que se deve fazer no sentido de garantir a
representatividade da amostra, pois o acaso é o único responsável por eventuais discrepâncias
entre população e amostra. No caso em que a única possibilidade é o uso de uma amostragem
não-probabilística, deve-se ter a consciência de que as conclusões apresentam alguma limitação.
CARACTERÍSTICA E VARIÁVEL
As unidades de uma população se distinguem e se caracterizam por um conjunto de

particularidades, propriedades ou atributos. Cada uma dessas particularidades ou propriedades é

uma característica ou atributo da população e de suas unidades. Cada característica pode

manifestar-se nas unidades sob diferentes alternativas ou níveis.
Por exemplo, sexo e grau de instrução são características de indivíduos de uma

população. Por conseguinte, os níveis (alternativas) para a característica sexo, são dois:
masculino e feminino. E para a característica grau de instrução poderíamos encontrar cinco
níveis ou alternativas: primário, básico, médio, licenciatura (graduação) e pós-graduação
(especialistas, mestres, doutores, pós-doutorados, catedráticos).
Portanto, o conjunto de características das unidades de uma população é demasiadamente

vasto e não totalmente conhecido para ser completamente descrito. Assim, apenas as
características relevantes numa pesquisa específica é que são consideradas e, o conjunto dessas
características irá depender dos objectivos e das condições de realização da pesquisa. Desse
modo, o interesse estará sempre focalizado não nas unidades em si, mas nas suas características
relevantes.
Entretanto, o termo variável é normalmente utilizado genericamente para indicar aquilo

que é sujeito à variação ou inconsistência. Portanto, no contexto da pesquisa cientifica, uma
variável é definida como a função que estabelece uma correspondência entre os níveis de uma
característica e os valores de um conjunto numérico segundo uma escala de medida. Ou seja,
uma variável é uma característica populacional que pode ser medida de acordo com alguma
escala. Ademais, DOS SANTOS (s/r, p. 4) define variável como sendo aquilo que se deseja
observar para tirar algum tipo de conclusão, por exemplo: idade, sexo, peso, etc.
CLASSIFICAÇÃO DAS VARIÁVEIS
De modo geral, as variáveis podem ser classificadas em dois grupos distintos, a saber:
Variáveis Categóricas (Qualitativas) e Variáveis Numéricas (Quantitativas).
As variáveis Categóricas ou Qualitativas descrevem qualidades, ou seja, são aquelas

que podem ser separadas em diferentes categorias, atributos, e que se distinguem por alguma
característica não numérica. As mesmas são classificadas em: nominais e ordinais.
Nominais, quando não houver um sentido de ordenação entre os seus possíveis valores.
Exemplos: sexo (com os níveis masculino e feminino), raça de cavalos (com os níveis manga-
larga, crioulo e árabe), região geográfica (com os níveis norte, sul, sudeste e leste), estado civil
(com os níveis solteiro, casado e divorciado).
Ordinais, quando houver um sentido de ordenação entre os seus possíveis valores.

Exemplos: faixas de idade (criança, adolescente, adulto e idoso), intensidade de cor (claro,
escuro), intensidade de infestação (forte, média, fraca), grau de instrução (primário, básico,
médio, graduação e pós-graduação), etc.
As variáveis Numéricas ou Quantitativas, consistem em números que representam

contagem ou medidas, ou seja, são aquelas cujos valores são números reais, de modo que cada
valor representa um valor da variável e não uma categoria ou uma classe e, dividem-se em:
discretas e continuas.
Discretas, resultam de um conjunto finito, enumerável de valores possíveis e, só podem

assumir valores do conjunto dos números inteiros não negativos (0,1,2,3, …). Não obstante,
neste tipo de variáveis, os dados só podem ser obtidos através de um processo de contagem.
Exemplos: número de filhos de um casal, número de sementes germinadas, número de pacientes
que se recuperaram de Covid19, número de frutos estragados, etc.
Contínuas, resultam de números infinitos de valores possíveis que podem ser associados
a pontos em uma escala contínua, ou seja, descrevem dados contínuos ou de mensuração, isto é,
obtidos por um processo de medição. Por conseguinte, estas variáveis, podem assumir qualquer
valor do conjunto dos números reais (-10, 0, π, √2, …). Exemplos: peso, altura, tempo de sono,
teor de humidade, temperatura corporal, etc.
Nota:
A classificação correcta de uma variável é fundamental, uma vez que esta discriminação
é que irá indicar a possibilidade e a forma de utilização dos procedimentos estatísticos
disponíveis.
OBSERVAÇÃO E CONJUNTO DE DADOS

Os números, taxas e outras informações colectadas em experimentos ou levantamentos

são denominados dados. Assim, todo dado é um valor de uma variável (numérico ou não
numérico). A unidade da população em que são medidas as variáveis de interesse é chamada de
unidade de observação.
Observação é o conjunto de valores referentes a todas as variáveis medidas em uma

unidade de observação. Por conseguinte, ao conjunto de todas as unidades de observação
constituem o conjunto de dados.
As variáveis são representadas por letras maiúsculas (X, Y, Z, …, etc.) e os seus valores
(dados) por letras minúsculas (x, y, z, … etc.). Assim, se uma variável é representada por X (xis
maiúsculo), todos os seus elementos serão representados por x (xis minúsculo). Assim, para
individualizar ou diferenciar os valores de uma variável, acrescenta-se um índice i = 1, 2, …, n,
que representa a unidade ou a observação. Assim, um conjunto de n valores de uma variável X
será representado por x1, x2, x3, …, xn.
Exemplo: tomemos o conjunto de dados apresentado na tabela abaixo. Esse conjunto é

constituído por 5 unidades ou observações (i), uma variável identificadora (Nome), uma
variável qualitativa nominal (sexo) e duas variáveis numéricas continuas (altura e peso).
i Nome Sexo Altura Peso

1 Alfredo Masculino 1,75 51,03
2 Paulo Masculino 1,60 46,49
3 Jaime Masculino 1,52 38,33
4 Aida Feminino 1,50 45,13
5 Alcinda Feminino 1,43 34,93
Assim, este conjunto de dados é representada simbolicamente na tabela abaixo:
i A B X Y
1 a1 b1 x1 y1
2 a2 b2 x2 y2
3 a3 b3 x3 y3
4 a4 b4 x4 y4

5 a5 b5 x5 y5
Exercícios de consolidação da primeira unidade:
1. População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer;
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de individuo de um mesmo município, distrito ou país;
2. Uma parte da população retirada para analisá-la denomina-se:
a) Universo;
b) Parte;
c) Pedaço;
d) Dados Brutos;
e) Amostra;
3. A parte da estatística que se preocupa somente com a descrição de determinadas
características de um grupo, sem tirar conclusões sobre um grupo maior, denomina-se:
a) Estatística da população;
b) Estatística de amostra;
c) Estatística inferencial;
d) Estatística descritiva;
e) Estatística grupal;
4. Diga qual das variáveis estamos trabalhando nos casos abaixo:
a) Número de inscrições no seguro social;
b) Número de passageiros no minibus da via Massinga-Maxixe;
c) Peso médio dos recém-nascidos no Hospital Provincial de Inhambane;
d) Escolaridade;
e) Altitude acima do nível do mar;

f) Uma pesquisa efectuada com 1000 pessoas, indica que 40 delas são assinantes de um
serviço de computador online;
5. Classifique as seguintes variáveis:
5.1 Cor dos olhos
a) Qualitativa nominal;
b) Qualitativo ordinal;
c) Qualitativa discreta;
d) Quantitativa contínua;
e) Quantitativa discreta;
f) Qualitativa contínua;
5.2 Número de filhos de um casal:
5.3 Peso de um indivíduo:
5.4 Altura de um individuo:
g) Qualitativa nominal;
h) Qualitativo ordinal;
i) Qualitativa discreta;
j) Quantitativa contínua;
k) Quantitativa discreta;
l) Qualitativa contínua;

5.5 Número de alunos de uma escola:

m) Qualitativa nominal;
n) Qualitativo ordinal;
o) Qualitativa discreta;
p) Quantitativa contínua;
q) Quantitativa discreta;
r) Qualitativa contínua;
5.6 Grupo sanguíneo:
s) Qualitativa nominal;
t) Qualitativo ordinal;
u) Qualitativa discreta;
v) Quantitativa contínua;
w) Quantitativa discreta;
x) Qualitativa contínua;
6. Nos grupos já formados na turma, façam um trabalho de pesquisa sobre o tema
“Amostra: tipos de amostras”, sem se esquecer de trazer nos respectivos textos
exemplos clarificadores dos diferentes tipos de amostras. Prazo de submissão dos
trabalhos: 05/05/2021, no seguinte endereço electrónico: rosangeloariosa@gmail.com
CONTEÚDOS DA UNIDADE 02: ESTATÍSTICA DESCRITIVA
 Introdução;
 Apresentação de Dados: Tabelas e Gráficos;
 Distribuição de Frequências: Tabelas de Classificação Simples;

INTRODUÇÃO
Como vimos na aula anterior, uma amostra é um subconjunto de uma população,

necessariamente finita, pois todos os seus elementos são examinados para efeito da realização
do estudo estatístico desejado. Assim, é intuitivo que, quanto maior a amostra, mais precisas e
confiáveis devem ser as induções realizadas sobre a população. Não obstante, pode-se concluir
que, os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população, ao
qual denomina-se Censo ou Recenseamento. Mas essa conclusão, na prática, muitas vezes não
se verifica. O emprego de amostras pode ser feito de tal modo que se obtenham resultados
confiáveis.
Ocorre, porém, que diversas razões levam, em geral, à necessidade de recorrer-se apenas
aos elementos de uma amostra. Entre elas, podemos citar o custo do levantamento de dados e o
tempo necessário para realizá-lo, especialmente se a população for muito grande.
O método científico, quando aplicado para solução de um problema científico,

frequentemente gera dados em grande quantidade e de grande complexidade. Desse modo, a
análise da massa de dados individuais, na maioria das vezes, não revela a informação subjacente,
gerando a necessidade de algum tipo de condensação ou resumo dos dados.
Segundo PIANA, MACHADO & SELAU, (2009, p.14), conceituam a Estatística

Descritiva, como sendo a parte da Estatística que desenvolve e disponibiliza métodos para
resumo e apresentação de dados estatísticos com o objectivo de facilitar a compreensão e a
utilização da informação ali contida.
Outrossim, a Estatística Descritiva, tem por finalidade a utilização de tabelas, gráficos,

diagramas, distribuições de frequências e medidas descritivas para:
 Examinar o formato geral da distribuição dos dados;

 Verificar a ocorrência de valores atípicos;
 Identificar valores típicos que informem sobre o centro da distribuição e;
 Verificar o grau de variação presente nos dados.
Nesta ordem de ideias, a Estatística Descritiva tem como objectivo, resumir as principais
características de um conjunto de dados por meio de tabelas, gráficos e resumos numéricos.
Assim sendo, a análise estatística deve ser extremamente cuidadosa ao escolher a forma
adequada de resumir os dados.
Tabela 3: Principais Técnicas da Estatística Descritiva:
Principais Técnicas Descrição

Tabelas de Frequência Apropriada para resumir um grande conjunto de dados, agrupando
informações em categorias. As classes que compõem a tabela
podem ser categorias pontuais ou por intervalos.
Gráficos Possibilita uma visualização das principais características da

amostra. Alguns exemplos de gráficos são: diagrama de barras,
diagrama de sectores, histograma, diagrama de dispersão, box-plot.
Medidas Descritivas Por meio de medidas ou resumos numéricos podemos levantar

importantes informações sobre o conjunto de dados, tais como a
tendência central, a variabilidade, simetria, valores extremos,
valores discrepantes, etc.
Fonte: Retirado de GUIMARÃES (2007, p.26).
Assim, um dos objectivos da estatística é sintetizar os valores que uma ou mais variáveis
podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. Isso
se consegue, apresentando esses valores em tabelas e gráficos, que fornecem rápidas e seguras
informações a respeito das variáveis.
APRESENTAÇÃO DE DADOS: Tabelas e Gráficos
TABELAS
A tabela é a forma não discursiva de apresentar informações, das quais o dado numérico
se destaca como informação central. Sua finalidade é apresentar os dados de modo ordenado,
simples e de fácil interpretação, fornecendo o máximo de informação num mínimo de espaço.
Por conseguinte, a construção de uma tabela, deve obedecer a uma série de normas
técnicas. Estas normas, tem como objectivo orientar a apresentação racional e uniforme de dados
estatísticos na forma tabular. A seguir veja algumas das principais normas e recomendações para
a construção de uma tabela de dados:
1. Elementos da Tabela:
Uma tabela estatística é composta de elementos essenciais e elementos

complementares.
Os elementos essenciais são:
 Título: é a indicação que precede a tabela contendo a designação do facto observado, o

local e a época em que foi estudado;
 Corpo: é o conjunto de linhas e colunas onde estão inseridos os dados;
 Cabeçalho: é a parte superior da tabela que indica o conteúdo das colunas;
 Coluna Indicatória: é a parte da tabela que indica o conteúdo das linhas.
Os elementos complementares são:
 Fonte: é entidade que fornece os dados ou elabora a tabela;

 Notas: são as informações de natureza geral, destinadas a esclarecer o conteúdo das
tabelas;
 Chamadas: são as informações especificas destinadas a esclarecer ou conceituar dados
numa parte da tabela. Estas, deverão estar indicadas no corpo da tabela, em números
arábicos entre parênteses, à esquerda nas casas e à direita na coluna indicatória.
Nota: os elementos complementares devem situar-se no rodapé da tabela, na mesma

ordem em que foram descritos.
2. Número da Tabela:
Uma tabela deve ter número para identifica-la sempre que o documento apresentar uma
ou mais tabelas, permitindo, assim, a sua localização. A identificação da tabela deve ser feita em
números arábicos, de modo crescente, precedidos da palavra “Tabela”, podendo ou não ser
subordinada a capítulos ou secções de um documento. Exemplos: Tabela 1, Tabela 10.2, …, etc.
3. Apresentação de Dados Numéricos:
Toda a tabela deve ter dado numérico para informar a quantificação de um facto
especifico observado, o qual deve ser apresentado em números arábicos.
A parte inteira dos dados numéricos deve ser separada por pontos ou espaços de três em
três algarismos, da direita para a esquerda, por exemplo: 12.243.527 ou 12 243 527. A separação
da parte inteira da decimal deve ser feita por virgula, por exemplo: 25,67.
No sistema inglês, a separação da parte inteira é feita por virgula e, a separação da parte
inteira decimal é feita por ponto, ou seja, é o inverso do sistema moçambicano, do brasileiro, e
do português, …, etc.
4. Sinais Convencionais:
Sempre que um dado numérico não puder ser apresentado, o mesmo deve ser substituído
por um sinal convencional. A substituição de um dado numérico deve ser feita por um dos sinais
abaixo, conforme o caso:
4.1 – (Traço): indica dado numérico igual a zero não resultante de arredondamento;
4.2 .. (dois pontos): indica que não se aplica dado numérico;
4.3 … (três pontos): indica dado numérico não disponível;
4.4 x (xis): indica dado numérico omitido a fim de evitar a individualização da informação;
4.5 0, 0,0 ou 0,00 (zero): quando o valor é muito pequeno para ser expresso pela unidade
utilizada ou quando indica dado numérico igual a zero resultante de arredondamento;
4.6 ? (interrogação): quando há duvida sobre a veracidade/exactidão da informação/valor.
Quando uma tabela contiver sinais convencionais, estes deverão ser apresentados em nota
geral com seus respectivos significados.
5. Arredondamento:
Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o

último algarismo a permanecer. Exemplo: 48,23 = 48,2.

Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, aumenta-se de uma

unidade o último algarismo a permanecer. Exemplo: 23,87 = 23,9.
6. Unidade de Medida:
Uma tabela deve ter unidade de medida inscrita no cabeçalho ou nas colunas indicadoras,
sempre que houver necessidade de se indicar, complementarmente ao titulo, a expressão
quantitativa ou metrológica a dos dados numéricos.
Esta indicação deve ser feita com símbolos ou palavras, entre parênteses. Exemplos: (m)
ou (metros), (t) ou (toneladas), (Mt) ou (meticais), (€) ou (euro), (¥) ou (yen), (£) ou (libra), ($)
ou (dólar americano), (R$) ou (reais), (%) ou (percentual), …, etc.
7. Classe de Frequência:
A classe de frequência é cada um dos intervalos não superiores em que se divide uma
distribuição de frequências. Toda classe deve ser apresentada, sem ambiguidade, por extenso ou
com notação.
Toda a classe que inclui o Extremo Inferior do intervalo (EI) e exclui o Extremo Superior
(ES), deve ser apresentada de uma destas duas formas: EI |― ES ou [EI; ES).
8. Apresentação de Tempo:
Toda a série histórica consecutiva deve ser apresentada por seus pontos inicial e final,
ligados por hífen (-). Exemplos: 1892 – 912: quando varia o século; 1960 – 65: quando variam
os anos dentro do século; out 1991 – mar 1992: quando variam os meses dentro de anos.
9. Apresentação da Tabela
 O corpo da tabela deve ser delimitado, no mínimo, por três traços horizontais;
 Recomenda-se não delimitar as tabelas à direita e à esquerda por traços verticais. É
facultativo o uso de traços verticais para a separação de colunas no corpo da tabela;

 Quando, por excessiva altura, a tabela tiver que ocupar mais de uma página, não deve ser
delimitada inferiormente, repetindo-se o cabeçalho na página seguinte. Deve-se usar no
alto do cabeçalho a palavra “continuação” ou “conclusão”, conforme o caso.
 Se possuir muitas linhas e poucas colunas, poderá ser apresentada em duas ou mais partes
dispostas lado a lado e separadas por traço duplo;
 A disposição da tabela deve estar na posição normal de leitura. Caso isso não seja
possível, a apresentação será feita de forma que a rotação da página seja no sentido
horário.
Exemplo:
Tabela 4: Total de estabelecimentos, pessoal ocupado e valor da produção das indústrias

hoteleiras, nas Províncias da zona Sul de Moçambique, 2020.
Províncias Total de Pessoal Ocupado (1) Valor da Produção

Estabelecimentos (2)
(1.000 Mt)
Maputo 25 x 21.585
Gaza 31 1.710 6.495
Inhambane 107 - 954.258
Total da Zona Sul 163 1.710 982.338
Fonte: Instituto Nacional do Turismo (INATUR): 2020.
Nota: Sinais convencionais utilizados:
x: dado numérico omitido a fim de evitar a individualização da informação;
- : dado numérico igual a zero não resultante de arredondamento;
: em 31 de dezembro de 2020;
(1)
: inclui valores prestados a terceiros;

(2)
GRÁFICOS

Outro modo de apresentar dados estatísticos é sob a forma ilustrada, comumente chamada
de gráfico. Os gráficos constituem-se numa das mais eficientes formas de apresentação de dados.
Um gráfico é, essencialmente, uma figura construída a partir de uma tabela, mas,

enquanto a tabela fornece uma ideia mais precisa e possibilita uma inspecção mais rigorosa aos
dados, o gráfico é mais indicado para situações que visem proporcionar uma impressão mais
rápida e maior facilidade de compreensão do comportamento do fenómeno em estudo.
Os gráficos e as tabelas se prestam, portanto, a objectivos distintos, de modo que a

utilização de uma forma de apresentação não exclui a outra.
REGRAS GERAIS A OBSERVAR PARA A CONFECÇÃO DE UM GRÁFICO
1. Normas para a representação gráfica:

 Os gráficos, geralmente, são construídos num sistema de eixos chamado Sistema
Cartesiano Ortogonal (SCO). A variável independente é localizada no eixo horizontal
(abcissas), enquanto que a variável dependente é colocada no eixo vertical (ordenadas).
No eixo vertical, o inicio da escala deverá ser sempre zero, ponto de encontro dos eixos;
 Iguais intervalos para as medidas deverão corresponder a iguais intervalos para as
escalas;
 O gráfico deverá possuir título, fonte, notas e legenda, ou seja, toda a informação
necessária à sua compreensão, sem auxílio do texto;
 O gráfico deverá possuir formato aproximadamente quadrado para evitar que problemas
de escalas interfiram na sua correcta interpretação.
2. Tipos de Gráficos:
Podemos considerar quatro tipos principais de representação gráfica:
2.1 Estereogramas: são gráficos onde as grandezas são representadas por volumes.
Geralmente são construídos num sistema de eixos bidimensional, mas podem ser
construídos num sistema tridimensional para ilustrar a relação entre três variáveis.
2.2 Cartogramas: são representações em cartas geográficas (mapas);

2.3 Pictogramas ou Gráficos Pictóricos: são gráficos puramente ilustrativos, construídos de

modo a ter grande apelo visual, dirigidos a um público muito grande e heterogéneo. Não
devem ser utilizados em situações que exijam maior precisão.
2.4 Diagramas: são gráficos geométricos de duas dimensões, de fácil elaboração e grande
utilização. Podem ser ainda subdivididos em: gráficos de colunas, gráficos de barras,
gráficos de linhas ou curvas e gráficos de sectores.
2.4.1 Gráfico de Colunas: neste gráfico as grandezas são comparadas através de
rectângulos da mesma largura, dispostos verticalmente e com alturas proporcionais às
grandezas. A distancia entre os rectângulos deve ser, no mínimo, igual a 1/2 e, no
máximo, 2/3 da largura da base dos mesmos.
2.4.2 Gráfico de Barras: segue as mesmas instruções que o gráfico de colunas, tendo a
única diferença que os rectângulos são dispostos horizontalmente. É usado quando as
inscrições dos rectângulos forem maiores que a base dos mesmos.
2.4.3 Gráfico de Linhas ou Curvas: neste gráfico os pontos são dispostos no plano de
acordo com as suas características, e a seguir são ligados por segmentos de recta. É
muito utilizado em séries históricas e em séries mistas quando um dos factores de
variação é o tempo, como instrumento de comparação.
2.4.4 Gráfico em Sectores: é recomendado para situações em que se deseja evidenciar o
quanto cada informação representa do total. A figura consiste num círculo onde o
total (100%) representa 360°, subdividido em tantas partes quanto for necessário à
representação. Essa divisão se faz por meio de uma regra de três simples. Com o
auxilio de um transferidor, efectua-se a marcação dos ângulos correspondentes a cada
divisão.
NOTA: os gráficos do tipo diagramas são os mais usuais na disciplina de Estatística

assim como no quotidiano e, para a sua construção e esclarecimentos, cada estudante a título
individual e ou em grupo poderá desenvolver uma pesquisa.

DISTRIBUIÇÃO DE FREQUÊNCIAS: Tabelas de Classificação Simples
Um grande número de dados necessita de uma forma eficiente de sumarização. Uma das
formas mais comuns de resumir e apresentar dados é através de tabelas de distribuição de
frequências. Estas tabelas podem ser de dois tipos: de classificação simples ou de classificação
cruzada. Entretanto, para esta disciplina e, neste curso especifico, veremos somente as tabelas
de classificação simples.
Tabelas de Classificação Simples
As tabelas de classificação simples, são tabelas de frequências relativas a uma variável.

As características dessas tabelas variam de acordo com o tipo de variável em estudo. Se a
variável é do tipo categórica, então são obtidas as frequências de ocorrência de cada nível
dessa variável. Se a variável é do tipo numérica contínua, primeiro são obtidos intervalos de
mesma amplitude e depois contados os valores que ocorrem em cada intervalo.
Distribuição de Frequências de Variáveis Categóricas ou Numéricas Discretas
Quando a variável em estudo for categórica ou, em alguns casos numérica discreta, a
tabela de distribuição de frequências apresentará a seguinte característica: cada valor da variável
constituirá uma classe.
Construção da Tabela:
A construção da tabela de distribuição de frequência para variáveis categóricas

(qualitativas) ou numéricas discretas envolve apenas dois passos bastante simples:
1° Passo: ordenar os níveis do factor, ou seja, colocá-los em ordem de grandeza (rol).

Cada nível constituirá uma classe. O número de cada classe da distribuição será representado por
j, tal que j = 1, 2, 3, …, k;
2° Passo: contar o número de elementos em cada classe, ou seja, contar quantas vezes o
dado está repetido.

A seguir, veremos por meio de exemplos, como construir uma tabela de distribuição de
frequências para os dados de uma variável categórica (Exemplo: 1) e de uma variável
numérica discreta (Exemplo: 2).
Exemplo 1:
Seja a variável em estudo o conceito obtido por 60 estudantes na disciplina de Estatística,

na Universidade Save, Extensão de Maxixe para o ano de 2020, para o qual os dados observados
foram os seguintes:
ruim, médio, bom, médio, ruim, médio, ruim, médio, ruim, bom, médio, médio, bom,
médio, médio, médio, óptimo, médio, bom, óptimo, bom, óptimo, médio, óptimo, médio,
ruim, médio, óptimo, médio, médio, bom, ruim, bom, bom, médio, ruim, médio, médio,
óptimo, médio, bom, ruim, ruim, bom, médio, médio, ruim, bom, médio, médio, bom, bom,
bom, médio, ruim, bom, médio, médio, ruim, médio.
Podemos observar que esta variável categórica ou qualitativa ordinal apresenta quatro
níveis (ruim, médio, bom e óptimo). Como cada nível deve constituir uma classe da
distribuição de frequências, já está determinado que o número total de classes (k) é quatro (4).
Assim, o primeiro passo é a ordenação (rol) dos níveis da variável. Assim teremos:
ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, médio, médio,
médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio,
médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio,
médio, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom,
óptimo, óptimo, óptimo, óptimo, óptimo, óptimo.
Número de Classe (j) Classe

1 Ruim
2 Médio
3 Bom
4 Óptimo

O passo a seguir é a contagem do número de estudantes em cada nível. Estes valores são
denotados por Fj e chamados de Frequências Absolutas das classes. A partir das Frequências
Absolutas, podemos obter outras frequências de interesse numa distribuição, tais como:
 Frequência Absoluta Acumulada na classe j, denotada por Facj, que expressa o número
de elementos (observações) acumuladas até a classe j;
 frequência relativa na classe j, denotada por fj, que expressa a proporção de elementos
(observações) na classe j;
 frequência relativa acumulada na classe j, denotada por facj, que expressa a proporção
de elementos (observações) acumuladas até a classe j.
NOTA: FÓRMULAS IMPORTANTES A CONSIDERAR
Frequência Absoluta(Fj)
frequênciarelativa(fj)= ;
dimensão da amostra
A soma das Frequências Absolutas é igual à dimensao da amostra e ;
A soma das frequências relativas é igual a1.
Facj(actual) = Facj (anterior) + Fj (actual);
facj(actual) = facj (anterior) + fj (actual);
Assim, as frequências obtidas são então apresentadas na forma tabular a seguir:
Tabela 5: Frequência do conceito obtido por estudante na disciplina de Estatística na UniSave,

Extensão de Maxixe, em 2020.
j Classe Fj Facj fj facj

1 Ruim 12 12 0,2 0,2
2 Médio 27 39 0,45 0,65
3 Bom 15 54 0,25 0,9
4 Óptimo 6 60 0,1 1
- ∑(somatório) 60 - 1 -
Fonte: elaborado pelo autor, com base nos dados do exercício.

Exemplo 2:
As tabelas de distribuição de frequência de variáveis numéricas discretas são construídas

da mesma forma que as das variáveis categóricas. Consideremos agora que a variável em estudo
seja o número de animais portadores de brucelose em 350 propriedades rurais da Província de
Inhambane, em 2020. Os valores observados para esta variável foram:
2, 5, 6, 0, 4, 4, 3, 4, 2, 2, 3, 3, 5, 3, 5, 1, 2, 4, 2, 3, 5, 4, 3, 3, 2, 3, 0, 4, 4, 3, 4, 0, 3, 1, 2, 4, 2, …
Como cada valor da variável deve constituir uma classe e foram observados apenas sete
valores diferentes para esta variável, a tabela de distribuição de frequências terá sete classes.
Número de Classe (j) Classe

1 0
2 1
3 2
4 3
5 4
6 5
7 6
Através da contagem do número de vezes que cada valor apareceu, ou seja, do número de
observações em cada classe, obtemos as Frequências Absolutas (Fj), as frequências relativas (fj),
as Frequências Absolutas Acumuladas (Facj) e, as frequências relativas acumuladas (fac j),
apresentadas na tabela a seguir:
Tabela 6: Frequência do número de animais portadores de brucelose em 350 propriedades rurais

da Província de Inhambane em 2020.
j Classe Fj Facj fj facj

1 0 55 55 0,1571 0,1571
2 1 60 115 0,1714 0,3285
3 2 112 227 0,32 0,6485

4 3 82 309 0,2343 0,8828

5 4 31 340 0,0886 0,9714
6 5 8 348 0,0229 0,9943
7 6 2 350 0,0057 1
- ∑(somatório) 350 - 1 -
Fonte: elaborado pelo autor com base nos dados do exemplo 2.
Devemos observar, ainda, que tão importante quanto saber construir uma tabela é saber
interpretar os seus valores. Vejamos, como exemplo, o significado de alguns valores da tabela:
F4 = 82 ― significa que, das 350 propriedades rurais consultadas, 82 possuem 3 animais

portadores de brucelose;
Fac3 = 227 ― significa que, das 350 propriedades rurais consultadas, 227 possuem menos
de 3 animais portadores de brucelose;
f2 = 0,1714 ― significa que a proporção de propriedades rurais que possuem apenas 1

animal portador de brucelose é de 0,1714, ou seja, em percentagem é de 17,14%;
fac5 = 0,9714 ― significa que a proporção de propriedades rurais que possuem menos de
4 animais portadores de brucelose é de 0,9714, ou seja, em percentual é de 97,14%.
DISTRIBUIÇÃO DE FREQUÊNCIAS DE VARIÁVEIS NUMÉRICAS CONTÍNUAS
Ao contrário das variáveis discretas, as variáveis contínuas assumem, em geral, muitos

valores e, em sua grande maioria, diferentes uns dos outros. Assim, para contornar problemas
desse tipo, as tabelas de distribuição de frequência para variáveis contínuas são construídas
de modo que cada classe seja constituída por um intervalo de valores da variável.
Devemos observar, no entanto, que em algumas situações uma variável discreta também
poderá assumir tantos valores diferentes que a construção de uma tabela onde cada valor
constitui uma classe seja impraticável. Ou seja, pode ocorrer que ela tenha tantas linhas que a sua
construção pouco auxilie na descrição resumida dos dados. Assim, nesses casos, por uma questão

de simplificação, é usual agrupar os dados discretos em intervalos de classe, da mesma forma

que se agrupam os dados contínuos.
Construção da Tabela
O processo de construção da tabela de distribuição de frequência para variáveis

numéricas segue os seguintes passos:
1° Passo: ordenar o conjunto de dados, ou seja, colocar os dados brutos em ordem

crescente de grandeza (rol);
2° Passo: determinar o número de classes da tabela. De modo geral, este valor não deverá
ser inferior a 5 e nem superior a 15. Assim, a definição do número de classes deverá ser
orientada pelos objectivos do trabalho, mas existem algumas regras objectivas de determinação,
como por exemplo, a fórmula de Sturges:
k = 1 + 3, 32 x log n;
ou
k =√ n ;
Onde:
k = número de classes;
n = número de observações;
log = logaritmo de base 10.
3° Passo: determinar a amplitude do intervalo. Para tal, podemos utilizar a seguinte

expressão:
at
i=
k
Onde:
i = amplitude do intervalo da classe;

at = ES - EI: amplitude total do conjunto de valores;
k = número de classes.
NOTA: convencionamos, também, que o arredondamento do número de classes (k) ou

na amplitude do intervalo (i) é sempre feito para cima (por excesso).
4° Passo: construir os intervalos de classe. O Limite/Extremo Inferior (EI) da primeira

classe será sempre o menor valor do conjunto de dados (x 1) e o Limite/Extremo Superior (ES)
será o Limite/Extremo Inferior (EI) acrescido do valor da amplitude do intervalo da classe (i).
Na sequência, o Limite/Extremo Inferior (EI) da segunda classe, será o Limite/Extremo

Superior (ES) da primeira classe e o Limite/Extremo Superior (ES) da segunda classe, será este
Limite/Extremo Inferior (EI), acrescido da amplitude do intervalo da classe (i).
Assim, para todas as classes subsequentes, os intervalos deverão ser construídos da

mesma forma que a segunda.
Número de Classe (j) Classes

1 x1|― x1+i
2 x1+ i|― x1+2i
3 x1+2i |―x1+3i
… …
k x1+(k-1)i |―x1+ki
Nota-se assim que, a amplitude do intervalo é constante para todas as classes. O intervalo
fechado à esquerda e aberto à direita, representado pelo sinal |―, garante a não superposição
de classes.
Exemplo 3:
Tomemos a seguinte variável: X = peso ao nascer em kg de 60 bovinos machos na

Província de Inhambane em 2020, para a qual os valores observados (e já ordenados, ou seja, já
feitos o rol), foram:

16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 23, 23, 23,23, 23, 23, 23, 25,
25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 32,
33, 33, 33, 34, 34, 35, 36, 39.
Sendo o peso uma variável contínua cujos os valores poderiam ser todos diferentes entre
si, não podemos considerar cada valor como sendo uma classe, de modo que não podemos saber
de antemão o número de classes da distribuição de frequência (j). Este valor deverá ser
determinado e, para isso, usaremos a fórmula de Sturges. Para n = 60, teremos:
k = 1 + 3,32 x log n k = 1 + 3,32 x log60 k = 1 + 3,32 x 1,778 k = 1 + 5,903;
k = 6,9.
Como o número de classes tem que ser um número inteiro, teremos que arredondar o
valor 6,9. Usaremos como regra o arredondamento para cima (por excesso). Deste modo, o
número de classes será k = 7.
Uma vez determinado o valor de “k”, temos que obter a amplitude dos intervalos (i), mas
antes temos que determinar a amplitude total do conjunto de valores (at).
at = ES – EI at = 39 – 16 at = 23.
at 23
i= ;i= ; i=3,2857
k 7
Por uma questão de practicidade, vamos arredondar o valor da amplitude do intervalo (i)
para uma casa decimal, lembrando que o arredondamento, também neste caso, deverá ser sempre
para cima (por excesso). Assim, teremos i = 3,3.
O próximo passo é a construção dos intervalos de classe. Tomamos como

Limite/Extremo Inferior (EI) da primeira classe o menor valor do conjunto de dados x1 = 16.
Somando o 16 ao valor da amplitude do intervalo i = 3,3, obtemos o Limite/Extremo Superior
(ES) deste intervalo. Todos os demais intervalos são construídos considerando como
Limite/Extremo Inferior (EI), o Limite/Extremo Superior (ES) do intervalo de classe que o
precede e, como Limite/Extremo Superior (ES) a soma do Limite/Extremo Inferior (EI) com o
valor da amplitude do intervalo i = 3,3. Assim, teremos:

Número de Classe (j) Classes

1 16|― 19,3
2 19,3|― 22,6
3 22,6 |― 25,9
4 25,9|― 29,2
5 29,2|―32,5
6 32,5|―35,8
7 35,8 |―|39,1
Portanto, para a obtenção das Frequências Absolutas (Fj) das classes, contamos quantos
valores (observações) do conjunto de dados pertencem a cada intervalo. As demais frequências
(Facj, fj, facj), como já vimos anteriormente, derivam da Frequência Absoluta (Fj).
Em distribuições de frequências de variáveis contínuas, geralmente existe interesse em

uma outra quantidade conhecida como Ponto Médio ou Centro de Classe, denotada por cj. Os
centros de classe (cj) são calculados da seguinte forma:
EIj+ ESj
cj=
2
Onde:
cj: Ponto Médio ou Centro de Classes;
EIj: Limite/Extremo Inferior da classe j;
ESj: Limite/Extremo Superior da classe j.
Assim sendo, para o exemplo em causa, teremos:
EIj+ ESj 16 +19,3 35,3

cj= ; c 1= ; c 1= ;c 1=17,65.
2 2 2

EIj+ ESj 19,3+ 22,6 41,9

cj= ; c 2= ;c 2= ; c 2=20,95.
2 2 2
EIj+ ESj 35,8+39,1 74,9

cj= ; c 7= ;c 7= ; c 1=37,45.
2 2 2
A seguir, apresentamos a tabela de frequências completa:
Tabela 6: Frequência de peso ao nascer em kg de 60 bovinos machos na Província de Inhambane

em 2020
J Classes Fj Facj fj facj cj

1 16|― 19,3 7 7 0,1167 0,1167 17,65
2 19,3|― 22,6 9 16 0,15 0,2667 20,95
3 22,6 |― 25,9 15 31 0,25 0,5167 24,25
4 25,9|― 29,2 12 43 0,2 0,7167 27,55
5 29,2|―32,5 9 52 0,15 0,8667 30,85
6 32,5|―35,8 6 58 0,1 0,9667 34,15
7 35,8 |―|39,1 2 60 0,0333 1 37,45
∑(somatório) 60 - 1 - -
Fonte: elaborado pelo autor com base nos dados do exemplo 3.
A interpretação das frequências da tabela é exemplificada através de alguns valores a

saber:
F3 = 15 ― significa que 15 dos 60 bovinos machos nasceram com peso entre 22,6 e 25,9
kg, este último valor não incluso;
Fac5 = 52 ― significa que 52 dos 60 bovinos machos nasceram com peso entre 16 e 32,5
kg, este último valor não incluso;
f2 = 0,15 ― significa que a proporção de bovinos machos que nasceram com peso entre
16 e 22,6 kg, este último valor não incluso é de 0,15 ou seja, em percentual é de 15%;

fac6 = 0,9667 ― significa que a proporção de bovinos machos que nasceram com peso
entre 16 a 35,8 kg, este último valor não incluso é de 0,9667 ou seja, em percentual é de 96,67%.
Exercícios de Consolidação da Unidade:
1. Os dados a seguir se referem aos números de pães não vendidos em uma certa padaria
até a hora do encerramento do expediente:
0 0 4 2 0 1 0 2 0 4
1 0 0 3 2 0 1 0 0 0
2 0 0 1 0 0 3 2 1 7
0 1 0 0 2 0 0 3 2 1
a) construa a distribuição de frequências para esses dados.
2. Os dados em rol (ordenação horizontal) abaixo se referem aos valores gastos (em
meticais) pelas primeiras 50 pessoas que entraram em um determinado supermercado, na cidade
de Maxixe em 01/01/2020.
3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39
18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47
24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37
38,64 38,98 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65
50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34
a) Faça a distribuição de frequências desses dados.

CONTEÚDOS DA UNIDADE 03: MEDIDAS DESCRITIVAS
 Medidas de Localização, Posição ou Tendência Central: Média Aritmética, Moda e

Mediana;
 Medidas Separatrizes: Quartis, Decis e Percentis;
Introdução
As medidas descritivas têm o objectivo de reduzir um conjunto de dados observados

(números) a um pequeno grupo de valores que deve fornecer toda a informação relevante a
respeito desses dados. Estas medidas são funções dos valores observados e podem ser
classificadas em quatro grupos: Medidas de Localização, Medidas Separatrizes, Medidas de
Variação e Medidas de Formato.
Medidas de Localização
Também designadas por medidas de tendência central ou medidas de posição, indicam

um ponto central onde, em muitas situações importantes, está localizada a maioria das
observações.
Medidas Separatrizes
Indicam limites para proporções de observações em um conjunto, podendo ser utilizados

para construir medidas de dispersão.
Medidas de Variação
Também denominadas por medidas de dispersão, informam sobre a variabilidade dos

dados.
Medidas de Formato
Informam sobre o modo como os valores se distribuem. As mesmas, compreendem as

Medidas de Assimetria, que indicam se a maior proporção de valores está no centro ou nas
extremidades e, as Medidas de Curtose, que descrevem o grau de achatamento da distribuição.

Em suma, existe uma enorme variedade de medidas descritivas muitas delas que
concorrem entre si. Mas, para a escolha da medida mais adequada para o uso em um determinado
tipo de análise, pode-se recorrer as seguintes questões básicas:
 Com que objectivo a medida está sendo obtida?

 A medida é fácil de interpretar? É intuitiva?
 Existem valores atípicos que podem afectá-la exageradamente?
 O propósito da análise é meramente descritivo ou planeia-se fazer inferência?
Estas questões devem ser respondidas, na medida em que, uma medida descritiva deve
sempre que possível, possuir as seguintes características: ser interpretativa, ser de fácil
interpretação e prestar-se a tratamento matemático e/ou estatístico em etapas posteriores.
MEDIDAS DE LOCALIZAÇÃO OU DE POSIÇÃO, OU DE TENDÊNCIA CENTRAL
As medidas de localização, posição ou tendência central têm o objectivo de representar o

ponto de equilíbrio ou o centro de uma distribuição. Em muitos casos, podem ser considerados
valores típicos ou representativos do conjunto.
Portanto, as medidas mais utilizadas são a Média Aritmética, a Mediana e a Moda,

embora outras também possam ser úteis em algumas situações, como a Média Ponderada, a
Média Geométrica e a Média Harmónica, estas últimas que não são o objectivo fundamental
desta unidade.
MÉDIA ARITMÉTICA ( X )
A média aritmética, pela sua facilidade de cálculo e de compreensão aliada às suas

propriedades matemáticas, é a medida de localização mais conhecida e utilizada.
PASSOS PARA A SUA DETERMINAÇÃO:
1ª SITUAÇÃO: Dados Não Agrupados.
Sejam os elementos x1, x2, x3, …, xn de uma amostra, portanto “n” valores de uma
variável “X”. Assim, a média aritmética da variável aleatória de X é definida por:

∑ Xi
X = i =1
n
Onde:
X : Média Aritmética;
Xi: Elementos da Variável “X”.
n = Número Total de Elementos;
Exemplo:
Suponha um conjunto de tempo de serviço (em anos) de cinco funcionários: 3; 7; 8; 10 e

11. Determinar a média aritmética simples deste conjunto de dados.
∑ Xi 3+7+8+10+11 39 X =7.8
X = i =1 ↔X= ↔X= ↔
n 5 5
Interpretação:
O tempo médio de serviço deste grupo de funcionários é de 7,8 anos,
2ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por

Valores Simples.
Quando os dados estiverem agrupados numa distribuição de frequência de dados simples,

a média aritmética será a ponderação (multiplicação) dos valores x1, x2, x3, …, xn pelas
respectivas Frequências Absolutas (Fi): F1, F2, F3, …, Fn. Assim teremos:
∑ Xi × Fi
i=1
X=
n
Onde:
Xi: Elementos da Variável “X”.

Fi: Frequências Absolutas.
n = Número Total de Elementos;
Exemplo:
Em um determinado dia foi registado o número de veículos negociados por uma amostra
de 10 vendedores de uma agencia de automóveis obtendo a seguinte tabela:
Veículos Número de
Negociados Vendedores Xi x F i
(Xi) (Fi)
1 1 1
2 3 6
3 5 15
4 1 4
Total 10 26
Portanto:
∑ Xi × Fi [ ( 1 ×1 ) + ( 2× 3 ) + ( 3 ×5 ) + ( 4 ×1 ) ] 1+6 +15+4 26
i=1
X= ↔ X= ↔ X= ↔ X= ↔ X=2,6
n 10 10 10
Interpretação:
Em média, cada vendedor negociou 2,6 veículos.

Classes.
Quando os dados estiverem agrupados numa distribuição de frequência, para o cálculo da

média aritmética, usaremos os centros de classes (C j), ou seja, os pontos médios (Xi) dos valores
x1, x2, x3, …, xn de cada classe, ponderados pelas respectivas Frequências Absolutas (Fi): F1, F2,
F3, …, Fn. Neste caso, Cj = Xi (Centros de Classes é igual ao Ponto Médio de cada Classe).

Exemplo:
A tabela abaixo representa as pontuações obtidas por um grupo de 58 alunos matriculados na

disciplina de Introdução à Estatística:
Pontuações em Alunos
Classes Fi Xi Xi x Fi
35|― 45 5 40 200
45|― 55 12 50 600
55|― 65 18 60 1.080
65|― 75 14 70 980
75|― 85 6 80 480
85|― 95 3 90 270
∑(somatório) 58 - 3.610
1° Passo: Determinar o Ponto Médio das Classes (Xi = Cj):
EIj+ ESj 35+45 80

cj ↔ Xi= ; X 1= ; X 1= ; X 1=40.
2 2 2
EIj + ESj 45+55 100

cj ↔ Xi= ; X 2= ; X 2= ; X 2=50.
2 2 2
EIj+ ESj 85+ 95 180

cj ↔ Xi= ; X 6= ; X 6= ; X 6=90.
2 2 2
2° Passo: Determinar a Média Aritmética:

∑ Xi × Fi [ ( 40 × 5 ) + ( 12× 50 ) + ( 18× 60 ) + ( 14 ×70 )+ ( 6 ×80 ) +(3 ×90)] 200+ 600+ 1080+980+ 48

X = i=1 ↔ X= ↔ X=
n 58 58
Interpretação:
O desempenho médio deste grupo de alunos foi de 62,24 pontos na disciplina de

Introdução à Estatística.
MODA (Mo)
A Moda representada por (Mo), é o valor de maior ocorrência (mais frequente) num
conjunto de dados. É a única medida que pode não existir e, existindo, pode não ser única.
Entretanto, um conjunto de dados em relação à moda, pode ser:
Modal ou Unimodal, se apresentar uma e única moda, ou seja, o mesmo valor repetido
varias vezes no conjunto de dados em relação aos demais;
Bimodal, se apresentar duas modas, ou seja, se o conjunto de dados apresentar dois

valores que ocorrem (repete-se) o mesmo número de vezes e;
Amodal, se não apresentar moda, ou seja, não existe nenhum valor que se repete ou que
ocorre com mais frequência ou ainda, se todos os valores do conjunto ocorrerem com a mesma
frequência.
PASSOS PARA A SUA DETERMINAÇÃO:
Sejam os elementos x1, x2, x3, …, xn de uma amostra, o valor da moda para este tipo de
conjunto de dados é simplesmente o valor com maior frequência.
Exemplo 1:
Suponha o conjunto de tempo de serviço em anos de cinco funcionários: 3, 7, 8, 8 e 11.

Determinar a moda deste conjunto de dados.
Mo = 8; Distribuição Modal ou Unimodal;

Interpretação:
O tempo de serviço com maior frequência é de 8 anos.
Exemplo 2:
Suponha o conjunto de tempo de serviço em anos de cinco funcionários: 3, 3, 7, 8, 8 e 11.

Mo1 = 3
Mo2 = 8
Assim, este conjunto de dados, diz-se Bimodal.
Interpretação:
Os tempos de serviço com maior frequência foram de 3 e 8 anos.
Exemplo 3:
Suponha o conjunto de tempo de serviço em anos de cinco funcionários: 3, 7, 8, 10 e 11.

Não existe (Mo). Ou seja, é um conjunto Amodal.
Interpretação:
Não existe tempo de serviço com maior frequência.
Exemplo 4:
Suponha o conjunto de tempo de serviço em anos de oito funcionários: 1, 3, 4, 4, 5, 1, 3 e

5. Determinar a moda deste conjunto de dados.
Não existe (Mo). Ou seja, é um conjunto Amodal.
Interpretação:
Não existe tempo de serviço com maior frequência.

NOTA: é importante frisar que, para além de conjuntos de dados com duas modas - Bimodal,
também podemos encontrar conjuntos de dados com três modas – Trimodal e, conjunto de
dados com mais de três modas, que se denominam por conjunto Multimodal ou Polimodal.

Valores Simples.
Para este tipo de distribuição, a identificação da moda é efectuada pela simples

observação do elemento que apresenta maior frequência.
Exemplo:
de 10 vendedores de uma agência de automóveis obtendo a seguinte tabela.
Negociados Vendedores
(Xi) (Fi)
1 1
2 3
3 5
4 1
Total 10
Portanto, como a maior Frequência Absoluta (F i) é Fi = 5, logo a Mo = 3. Ou seja, o

número de veículos comercializados no dia com maior frequência.
Interpretação:
A quantidade de veículos comercializados no dia com maior frequência foi de três

veículos.


Classes.
Para dados agrupados em classe, temos diversas fórmulas para o calculo da moda. Assim
para esta disciplina, utilizaremos a fórmula de Czuber.
Procedimentos:
1° Passo: Identificar a classe modal (aquela que possui maior Frequência Absoluta) –
CLASSE(Mo);
2° Passo: Utilizar a seguinte fórmula:
∆1
Mo=EI + ×h ; em que: ∆1 = Fi – Fi anterior; ∆2 = Fi – Fi posterior;
∆ 1+ ∆ 2
Onde:
Mo: Moda;
EI: Extremo ou Limite Inferior da Classe Modal;
∆1/2: Variação das Frequências Absolutas em Relação à Frequência Absoluta da Classe Modal;
Fi: Frequência Absoluta da Classe Modal;
Fi anterior: Frequência Absoluta Anterior á Classe Modal;
Fi posterior: Frequência Absoluta Posterior á Classe Modal;
i ⟺ h: Amplitude da Classe Modal;
OUTRAS FÓRMULAS IMPORTANTES PARA RECORDAÇÃO:
at
i ⟺h=
k
a t=ES−EI

k =1+3,32× log n
Em que:
at: Amplitude Total do Conjunto de Valores;
k: Número de Classes da Distribuição de Frequências usando a Fórmula de Sturges;
ES: Extremo Superior do conjunto de dados observados, ou seja, o maior valor observado nos
dados;
EI: Extremo Inferior do conjunto de dados observados, ou seja, o menor valor observado nos
dados;
Exemplo:
A tabela abaixo representa a pontuação obtida por um grupo de 30 alunos matriculados

na disciplina de Introdução à Estatística.
Classes Fi
21|― 24 8
24|― 27 9
27|― 30 1
30|― 33 4
33|― 36 7
36|― 39 1
∑(somatório) 30
1° PASSO: Identificar a classe modal (aquela que possui maior Frequência Absoluta) –
CLASSE(Mo);
CLASSE(Mo) = 24|― 27;
2° PASSO: Determinar a Moda.

∆1 1
Mo=EI + ×h ⇛ Mo=24 + ×3 ⇔ Mo=24+0,3333 ⇔ Mo=24,33
∆ 1+ ∆ 2 1+ 8
Interpretação:
A pontuação com maior frequência entre o grupo de 30 alunos matriculados na disciplina

de Introdução à Estatística foi de 24,33 pontos.
Em que:
∆1 = Fi – Fi anterior ⟺ ∆1 = 9 – 8⟺ ∆1 = 1.
∆2 = Fi – Fi posterior ⟺ ∆2 = 9 – 1⟺ ∆2 = 8.
at 18
i ⟺h= ⟺ h= ⟺ h=3
k 6
at=ES−EI ⇔ at =39−21 ⇔ at=18
k =1+3,32× log n ⟺ k=1+3,32 × log 30 ⟺ k =1+3,32× 1,4771⟺ k =5,9040 ⟺ k ≅ 6
MEDIANA (Md)
A mediana. Representada por (Md), é à medida que divide um conjunto de dados

ordenados em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da mediana,
ou seja, a mediana é o elemento que ocupa a posição central de um conjunto de dados.
Sejam os elementos x1, x2, x3, …, xn de uma amostra, portanto “n” valores da variável
“X”. A mediana da variável aleatória de “X” é definida por:
Se “n” for PAR, então o valor da mediana será a média das duas observações adjacentes
n+1
à posição p= ; ou seja, neste caso temos duas posições centrais no conjunto de dados
2
n+1
ordenados, denotados por p1 e p2. Ao utilizarmos a expressão p= , obtemos um valor não
2
inteiro. Assim, as preposições p1 e p2 são os dois inteiros mais próximos do valor de p. Portanto,

a mediana (Md) será a média aritmética simples dos valores do conjunto de dados que ocupam
X p1 + X p 2
as posições p1 e p2, ou seja: Md= .
2
n+1
Se “n” for ÍMPAR, então o valor da mediana será o valor localizado na posição p=
2
Exemplo 1:
Suponha o conjunto de tempo de serviço de seis funcionários: 3, 7, 8, 10, 11 e 13.

Determinar a mediana deste conjunto de dados.
Como “n” é PAR, ou seja n = 6, então o valor da mediana (Md) estará localizado na
n+1 6+ 1
posição p= ⇔ p= ⇔ p=3,5 ,logo , p1 =8 e p2=10 . Assim, aplicando a fórmula da
2 2
mediana para este tipo de casos termos:
X p1 + X p 2 8+ 10 18
Md= ⇔ Md = ⇔ Md= ⇔ Md =9.
2 2 2
Interpretação:
50% dos funcionários possuem até 9 anos de tempo de serviço, ou, 50% dos funcionários
possuem no mínimo 9 anos de tempo de serviço.
Exemplo 2:
Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11.

Determinar a mediana deste conjunto de dados.
Como o “n” é IMPAR, ou seja, n = 5, então o valor da mediana (Md) estará localizada
n+1 5+1
na posição p= ⇔ p= ⇔ p=3 , logo , a Md =8.
2 2
Interpretação:
50% dos funcionários possuem até 8 anos de tempo de serviço, ou, 50% dos funcionários
possuem no mínimo 8 anos de tempo de serviço.


Valores Simples.
Quando os dados estiverem agrupados numa distribuição de frequência,

localizaremos/identificaremos a mediana (Md) dos valores x1, x2, x3, …, xn, pela posição da
n
mediana, usando a seguinte fórmula: POS (Md )= , através da Frequência Absoluta Acumulada
2
(Fac).
Exemplo:
de vendedores de uma agência de automóveis, obtendo a seguinte tabela:
Negociados Vendedores Fac
(Xi) Fi
1 1 1
2 3 4
3 5 9
4 1 10
∑(somatório) 10 -
Portanto, calculando a mediana (Md) e, considerando que n = 10, teremos:
n 10
POS ( Md ) = ⇔ POS ( Md )= ⇔ POS ( Md )=5.
2 2
Logo , a Posição da Mediana na Fac encontra−se na Fac=9.
Assim , a Mediana dos dados observados ( Xi ) , será: Md =3.
Interpretação:
50% dos vendedores comercializaram no máximo 3 veículos, ou então, metade dos

vendedores comercializou pelo menos 3 veículos.

Classes.
PROCEDIMENTOS:
n
1. Calcula-se a posição da Mediana: POS ( Md ) =
2
2. Pela Frequência Absoluta Acumulada (Fac), identifica-se a classe que contém o valor da
Mediana: CLASSE(Md);
POS ( Md )−Fac anterior
3. Utiliza-se a seguinte fórmula: Md=EI + ×h
Fi
Onde:
Md: Mediana;
EI: Extremo ou Limite Inferior da Classe Mediana;
n: Tamanho da Amostra ou número de elementos;
Fi: Frequência Absoluta da Classe Mediana;
Fac anterior: Frequência Absoluta Acumulada Anterior á Classe Mediana;
i ⟺ h: Amplitude da Classe Mediana;
at
i ⟺h=
k
a t=ES−EI
k =1+3,32× log n
Em que:

dados;
dados;
Exemplo:
A tabela abaixo representa a pontuação obtida por um grupo de 30 alunos matriculados

na disciplina de Introdução à Estatística.
Classes Fi Fac
21|― 24 8 8
24|― 27 9 17
27|― 30 1 18
30|― 33 4 22
33|― 36 7 29
36|― 39 1 30
n 30
1° PASSO: Calcula-se a posição da Mediana: POS ( Md ) = ⇔ POS ( Md )= ⇔ POS ( Md )=15 .
2 2
2° PASSO: Pela Frequência Absoluta Acumulada (Fac), identifica-se a classe que contém o
valor da Mediana: CLASSE(Md);
CLASSE(Md) = 24|― 27;
3° PASSO: Determinar a Mediana (Md), com base na seguinte fórmula:

POS ( Md )−Fac anterior

Md=EI + ×h
Fi
POS ( Md )−Fac anterior 15−8

Md=EI + ×h ⇛ Md =24+ × 3⇔ Md=24+2,3333 ⇔ Md =26,33
Fi 9
Interpretação:
50% dos alunos obtiveram a pontuação máxima de 26,33 pontos, ou então, metade dos
alunos obtiveram pontuação maior que 26,33 pontos.
Em que:
at 18
i ⟺h= ⟺ h= ⟺ h=3
k 6
at=ES−EI ⇔ at =39−21 ⇔ at=18
k =1+3,32× log n ⟺ k=1+3,32 × log 30 ⟺ k =1+3,32× 1,4771⟺ k =5,9040 ⟺ k ≅ 6

MEDIDAS SEPARATRIZES: QUARTIS, DECIS E PERCENTIS
As medidas Separatrizes delimitam proporções de observações de uma variável ordinal.

Elas estabelecem limites para uma determinada proporção 0 ≤ p ≤ 0 de observações. São
medidas intuitivas, de fácil compreensão e frequentemente resistentes.
Assim sendo, como medidas Separatrizes temos as seguintes: Quartis, Decis e Percentis.
QUARTIS
Quartis são os valores (Q1, Q2 e Q3) que dividem a amostra, depois de ordenada, em
quatro partes iguais (ou o mais igual possível). Assim, o Q1 é o valor da variável que deixa
atrás de si 25% das observações (dos elementos), o Q2 é o valor da variável que deixa atrás de si
50% das observações (dos elementos) e, por fim, o Q3 é o valor da variável estatística que deixa
atrás de si 75% das observações (elementos).
A diferença (Q3 – Q1) chama-se Amplitude Interquartil (Q) e é o intervalo no qual

pertencem 50% das observações, deixando 25% para a direita e 25% para a esquerda.
No entanto, para obtermos o intervalo inter-quartílico ou desvio quartílico, denotado

Q3−Q 1
por “Q”, temos a seguinte fórmula: Q= .
2
Portanto, dizer que os quartis dividem a série em quatro partes iguais não significa que,
por exemplo, os intervalos (Q1 e Q2) e (Q2 e Q3) têm a mesma amplitude, mas sim que contêm o
mesmo número de observações. Não menos importante, é o facto de que o Q2, corresponder à
Mediana (Md), ou seja, (Q2 = Md).
PROCEDIMENTOS PARA A SUA DETERMINAÇÃO
n
1° PASSO: calcular a posição do quartil com a seguinte fórmula: POS (Qi)= × i
4
Onde:
POS (Q1): posição do quartil i;
n: número de observações ou de elementos da distribuição ou do conjunto de dados;

i: número do quartil, por exemplo: i = 1, 2, 3;
2° Passo: pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor do
quartil: CLASSE (Qi);
3° PASSO: utilizar a fórmula a seguir para determinar o valor do quartil:
POS ( Qi )−Fac anterior

Qi=EI + ×h
Fi
Onde:
Qi: quartil i;
EI: Extremo ou Limite Inferior da Classe Quartílica;
Fi: Frequência Absoluta da Classe Quartílica;
Fac anterior: Frequência Absoluta Acumulada Anterior á Classe Quartílica;
i ⟺ h: Amplitude da Classe Quartílica;
at
i ⟺h=
k
a t=ES−EI
k =1+3,32× log n
Em que:
dados;
dados;
Exemplo:
Dado o rol do número de erros de impressão da primeira página de um jornal durante 50

dias, obteve-se os seguintes dados:
5 5 5 6 6 6 7 7 7 7
7 8 8 8 8 8 8 8 9 9
10 10 10 10 10 11 11 11 12 12
12 12 12 12 12 12 12 13 14 14
14 14 14 14 14 15 16 19 22 23
Do rol acima, esboçou-se a tabela abaixo, que representa o número de erros de impressão
da primeira página de um jornal durante 50 dias. Determinar o Q1 e o Q3.
Em que:
at 18
i ⟺h= ⟺ h= ⟺ h=2,5714 ⟺ h ≅ 3
k 7
a t=ES−EI ⇔ at =23−5⇔ at =18
k =1+3,32× log n ⟺ k=1+3,32 × log 50 ⟺ k =1+3,32× 1,69897 ⟺ k=6,6406 ⟺ k ≅ 7
Classes Fi Fac
5|― 8 11 11
8|― 11 14 25
11|― 14 13 38 DETERMINAÇÃO DO QUARTIL (Q1):
14|― 17 9 47
17|― 20 1 48
20|― 23 1 49
23|― 26 1 50
∑(somatório)
Autor: Rosângelo Paúnde 50 - Página 50
1° PASSO: Calcula-se a posição da Q1 com base na seguinte fórmula:

n 50
POS ( Qi ) = ×i ⇔ POS ( Q 1) = ×1 ⇔ POS ( Q1 )=12,5 .
4 4
2° PASSO: Pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor
do primeiro Quartil: CLASSE (Q1);
CLASSE (Q1) = 8|― 11;
3° PASSO: utilizar a fórmula a seguir para determinar o valor do primeiro Quartil:

Qi=EI + ×h
Fi
POS ( Q 1 )−Fac anterior 12,5−11

Q1=EI + ×h ⇛Qi =8+ × 3⇔ Qi=8+ 0,3214 ⇔Q i =8,32
F1 14
Interpretação:
25% do jornal, obteve no máximo 8,32 erros na impressão da primeira página, ou então,
75% do jornal, obteve mais de 8,32 erros na impressão da primeira página.
DETERMINAÇÃO DO QUARTIL (Q3):
1° PASSO: Calcula-se a posição da Q3 com base na seguinte fórmula:

n 50
POS ( Qi ) = ×i ⇔ POS ( Q 3 )= ×3 ⇔ POS ( Q3 ) =37,5.
4 4
do terceiro Quartil: CLASSE (Q3);
CLASSE (Q3) = 11|― 14;
3° PASSO: utilizar a fórmula a seguir para determinar o valor do quartil:

Qi=EI + ×h
Fi

POS ( Q 3 )−Fac anterior 37,5−25

Q3=EI + × h⇛ Q3=11+ × 3 ⇔Q3=11+2,8846 ⇔ Q 3=13,89
F3 13
Interpretação:
75% do jornal, obteve menos de 13,89 erros na impressão da primeira página, ou então,
25% do jornal, obteve pelo menos 13,89 erros na impressão da primeira página.
DECIS
Os decis dividem a série ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou
10% das observações ou dos elementos da série ordenada ou do conjunto de dados.
n
1° PASSO: calcular a posição do decil com a seguinte fórmula: POS ( Di)= ×i
10
Onde:
POS ( D1): posição do decil i;
i: número do decil, por exemplo: i = 1, 2, 3, 4, 5, 6, 7, 8, 9;
decil: CLASSE (Di);
3° PASSO: utilizar a fórmula a seguir para determinar o valor do decil:
POS ( Di )−Fac anterior

Di=EI + ×h
Fi
Onde:

Di: decil i;
EI: Extremo ou Limite Inferior da Classe do decil;
Fi: Frequência Absoluta da Classe do decil;
Fac anterior: Frequência Absoluta Acumulada Anterior á Classe do decil;
i ⟺ h: Amplitude da Classe do decil;
at
i ⟺h=
k
a t=ES−EI
k =1+3,32× log n
Em que:
dados;
dados;
Exemplo:

5 5 5 6 6 6 7 7 7 7
7 8 8 8 8 8 8 8 9 9
10 10 10 10 10 11 11 11 12 12
12 12 12 12 12 12 12 13 14 14
14 14 14 14 14 15 16 19 22 23
da primeira página de um jornal durante 50 dias. Determinar o sexto Decil (D6).
Em que:
at 18
i ⟺h= ⟺ h= ⟺ h=2,5714 ⟺ h ≅ 3
k 7
a t=ES−EI ⇔ at =23−5⇔ at =18
k =1+3,32× log n ⟺ k=1+3,32 × log 50 ⟺ k =1+3,32× 1,69897 ⟺ k=6,6406 ⟺ k ≅ 7
Classes Fi Fac
5|― 8 11 11
8|― 11 14 25
11|― 14 13 38 DETERMINAÇÃO DO SEXTO DECIL
14|― 17 9 47 (D6):
17|― 20 1 48
1° PASSO: Calcula-se a posição do sexto
20|― 23 1 49
Decil (D6) com a seguinte fórmula:
23|― 26 1 50
n 50
POS ( D i) = ×i ⇔ POS ( D6 )= × 6 ⇔ POS ( D6 )=30 .
10 10
do sexto Decil: CLASSE (D6);
CLASSE (D6) = 11|― 14;
3° PASSO: utilizar a fórmula a seguir para determinar o valor do Sexto Decil:

POS ( D1 )−Fac anterior

Di=EI + ×h
F1
POS ( D 6 ) −Facanterior 30−25

D6=EI + × h ⇛ D6=11+ ×3 ⇔ D 6=11+1,1538 ⇔ D6 =12,15
F1 13
Interpretação:
60% do jornal, obteve erros inferiores a 12,15 páginas na impressão da primeira página,
ou então, 40% do jornal, obteve um mínimo de 12,15 erros na impressão da primeira página.
PERCENTIS
Os percentis ou simplesmente centis, dividem a série ordenada em 100 partes iguais,

contendo cada uma delas 1/100 ou 1% das observações ou dos elementos de uma determinada
distribuição ou conjunto de dados.
n
1° PASSO: calcular a posição do percentil com a seguinte fórmula: POS (Pi)= ×i
100
Onde:
POS ( P1): posição do percentil i;
i: número do percentil, por exemplo: i = 1, 2, 3, …, 99;
percentil: CLASSE (Pi);
3° PASSO: utilizar a fórmula a seguir para determinar o valor do percentil:

POS ( Pi )−Fac anterior

Pi=EI + ×h
Fi
Onde:
Pi: percentil i;
EI: Extremo ou Limite Inferior da Classe do percentil;
Fi: Frequência Absoluta da Classe do percentil;
Fac anterior: Frequência Absoluta Acumulada Anterior á Classe do percentil;
i ⟺ h: Amplitude da Classe do percentil;
at
i ⟺h=
k
a t=ES−EI
k =1+3,32× log n
Em que:
dados;
dados;
Exemplo:
Exemplo:

5 5 5 6 6 6 7 7 7 7
7 8 8 8 8 8 8 8 9 9
10 10 10 10 10 11 11 11 12 12
12 12 12 12 12 12 12 13 14 14
14 14 14 14 14 15 16 19 22 23
da primeira página de um jornal durante 50 dias. Determinar o Percentil de ordem 40 (P40).
Em que:
at 18
i ⟺h= ⟺ h= ⟺ h=2,5714 ⟺ h ≅ 3
k 7
a t=ES−EI ⇔ at =23−5⇔ at =18
k =1+3,32× log n ⟺ k=1+3,32 × log 50 ⟺ k =1+3,32× 1,69897 ⟺ k=6,6406 ⟺ k ≅ 7
Classes Fi Fac
5|― 8 11 11
8|― 11 14 25
11|― 14 13 38 DETERMINAÇÃO DO PERCENTIL DE
14|― 17 9 47 ORDEM 40 (P40):
17|― 20 1 48
1° PASSO: Calcula-se a posição do Percentil
20|― 23 1 49
de ordem 40 (P40) com a seguinte fórmula:
23|― 26 1 50
n 50
POS ( Pi ) = ×i ⇔ POS ( P 40 )= × 40 ⇔ POS ( P40 )=20 .
100 100

do Percentil de Ordem 40: CLASSE (P40);
CLASSE (D6) = 8|― 11;
3° PASSO: utilizar a fórmula a seguir para determinar o valor do Percentil de ordem 40:
POS ( P1 )−Fac anterior

Pi=EI + ×h
F1
POS ( P40 )−Fac anterior 20−11

P40 =EI + × h⇛ P 40=8+ ×3 ⇔ P 40=8+1,9286 ⇔ P 40=9,93
F1 14
Interpretação:
40% dos erros de impressão da primeira página do jornal, foram menores que 9,93
páginas/folhas, ou então, 60% do jornal, obteve erros de impressão da primeira página maior que
9,93 páginas/folhas.
EXERCÍCIOS DE CONSOLIDAÇÃO DA UNIDADE
1. Responda as questões abaixo:

1.1 A Média, a Mediana e a Moda são medidas de:
a) Dispersão;
b) Posição;
c) Separatrizes;
d) Assimetria;
e) Curtose;
2. Na série 10, 20, 40, 50, 70, 80, a mediana será:
a) 30;
b) 35
c) 40

d) 45
3. Calcule para cada caso abaixo a respectiva média:
a) 7, 8, 9, 12, 14.
b)
(Xi) Fi
3 2
4 5
7 8
8 4
12 3
∑(somatório)
c)
Classes Fi
68|― 72 8
72|― 76 20
76|― 80 35
80|― 84 40
∑(somatório)
4. Calcule o valor da Mediana

a) 82, 86, 88, 84, 91, 93;
b)
(Xi) Fi
73 2
75 10
77 12
79 5
81 2

∑(somatório)
c)
Classes Fi
1|― 3 3
3|― 5 5
5|― 7 8
7|― 9 6
9|― 11 4
11|― 13 3
∑(somatório)
5. Calcule a Moda:
a) 3, 4, 7, 7, 7, 8, 9, 10;
b)
(Xi) Fi
2,5 7
3,5 17
4,5 10
6,5 5
∑(somatório)
c)
Classes Fi
10|― 20 7
20|― 30 19
30|― 40 28
40|― 50 32
Autor: Rosângelo Paúnde
∑(somatório) Página 60
6. Para a distribuição abaixo, calcule o segundo Decil (D2); o Percentil de ordem quatro (P4)
e o terceiro Quartil (Q3).
20|― 30 3
30|― 40 8
40|― 50 18
50|― 60 22
60|― 70 24
∑(somatório)
CONTEÚDOS DA UNIDADE 04: CONTINUAÇÃO AO ESTUDO DAS MEDIDAS

DESCRITIVAS.
 Medidas de Variação ou Dispersão: Amplitude Total, Desvio Médio, a Variância, o

Desvio Padrão e o Coeficiente de Variação;
 Medidas de Assimetria: Coeficiente de Assimetria ou de Pearson e Coeficiente de
Bowley;
 Medidas de Achatamento ou de Curtose: Coeficiente de Curtose e o Grau de Curtose.
MEDIDAS DE VARIAÇÃO OU DISPERSÃO: Amplitude Total, Desvio Médio, a Variância,

o Desvio Padrão e o Coeficiente de Variação;
INTRODUÇÃO
Uma medida de tendência central não nos dá, só por si, uma informação exaustiva da
distribuição considerada. Pelo contrário, a capacidade que se lhe atribui de representar os
elementos de uma distribuição depende do modo como estes se concentram ou dispersam em
torno dela.

Assim, podemos dizer que os parâmetros de tendência central não são suficientes para
caracterizar uma série estatística, apesar de a mediana e os quartis darem já uma ideia sumária do
modo como estão distribuídas as observações.
Por conseguinte, para melhor caracterizar uma distribuição, temos de considerar, para
além das medidas de tendência central, uma outra medida que exprima o grau de dispersão ou
variabilidade dos dados.
As medidas de dispersão indicam se os valores estão relativamente próximo um dos

outros, ou separados em torno de uma medida de posição: a média.
Outrossim, as medidas de dispersão são medidas estatísticas utilizadas para avaliar o

grau de variabilidade, ou dispersão, dos valores em torno da média. Isto é, servem para medir a
representatividade da média. (CORREA, 2003, p. 59).
Em suma:
Podemos afirmar que as medidas de variação ou dispersão complementam as medidas de

localização ou tendência central, indicando quanto as observações diferem entre si ou o grau de
afastamento das observações em relação à média.
Assim sendo, consideraremos quatro a cinco medidas de dispersão: Amplitude Total (at
ou R), Desvio Médio (DM), Variância (S2), Desvio Padrão (S) e Coeficiente de Variação (CV).
AMPLITUDE TOTAL (at ou R)
É a diferença entre o maior e o menor dos valores da série, ou seja, do conjunto de dados
da distribuição. No entanto, a utilização da amplitude total como medida de dispersão é muito
limitada, pois sendo uma medida que depende apenas dos valores externos (limite/extremo
inferior e limite/extremo superior), é instável, não sendo afectada pela dispersão dos valores
internos.
Por isso mesmo, esta medida é considerada por muitos estudiosos da área da Estatística,
como uma das medidas mais elementares, ou seja, muito precária. Este posicionamento é

justificável pois a amplitude não dá informe algum, a respeito da maneira pela qual os valores se
distribuem entre os valores extremos.
FÓRMULA:
R ⇔ at =ES−EI
Onde:
R ⇔ at : Amplitude Total ou em inglês range;
ES: Extremo/Limite Superior do conjunto de dados;
EI: Extremo/Limite Inferior do conjunto de dados.
Vejamos os seguintes exemplos: A: 4, 6, 6, 6, 8 e B: 4, 5, 6, 7, 8.
Para o conjunto A, teremos:
R ⇔ at =ES−EI ↔ R ⇔ at =8−4 ↔ R ⇔ at =4.
∑ Xi 4+ 6+6+6 +8 30
i =1
X= ↔X= ↔ X = ↔ X=6.
n 5 5
Para o conjunto B, teremos:
R ⇔ at =ES−EI ↔ R ⇔ at =8−4 ↔ R ⇔ at =4.
∑ Xi 4+ 5+6+7+ 8 30
X = i =1 ↔X= ↔ X= ↔ X =6.
n 5 5
As amplitudes totais para os dois conjuntos são, igual a 4. No entanto, as dispersões

desses dois conjuntos de dados são diferentes. Analisando os dois conjuntos de dados
separadamente, percebemos que o segundo conjunto apresenta valores bem mais espalhados

entre si, ou seja, heterogéneos e, muito distantes ou distorcidos em relação à media que é X =6.
Mas, no primeiro conjunto, verifica-se que os valores são bem próximos entre si, ou seja, são
homogéneos e, giram em volta da média que é igualmente X =6.
A amplitude total é a forma mais fácil de avaliar a dispersão dos dados, de tal forma que,
quanto maior for a amplitude total, maior será a dispersão dos dados.
DESVIO MÉDIO (DM)
O desvio médio analisa a média dos desvios em torno da média. E, para o seu cálculo,
temos que considerar as seguintes situações:
Sejam os elementos x1, x2, x3, …, xn de uma amostra, portanto “n” valores da variável
“X”, com média igual a X . O Desvio Médio (DM) da variável aleatória de “X” será definido
por:
∑ ¿ Xi−X∨¿
i=1
DM = ¿
n
Onde:
DM: Desvio Médio;
X :Média Aritmética e;
n: Número total de elementos do conjunto.
| |: Este sinal chama-se módulo de um número e, matematicamente, o módulo de qualquer

número seja ele positivo ou negativo é, sempre, igual a esse número, mas com sinal positivo.
Exemplo:
Suponha o conjunto de dados, que representa o tempo de serviço de cinco funcionários:

3, 7, 8, 10 e 11. Determinar o Desvio Médio.
1° PASSO: Determinar a Média Aritmética do conjunto de dados.

∑ Xi 3+7+8+10+11 39
X = i =1 ↔X= ↔ X = ↔ X=7,8
n 5 5
2° PASSO: Determinar o Desvio Médio (DM)
∑ ¿ Xi−X∨¿
⇔ DM =¿ 3−7,8∨+¿ 7−7,8∨+ ¿ 8−7,8∨+¿ 10−7,8∨+¿ 11−7,8∨ ¿ ⇔ DM =¿ 4,8+0,8+ 0
i=1
DM =
n 5
Interpretação:
Em média, o tempo de serviço deste grupo de funcionários se desvia em 2,24 anos em

torno dos 7,8 anos de tempo médio de serviço.

Valores Simples.

usaremos o Desvio Médio dos valores x1, x2, x3, …, xn, ponderados (multiplicados) pelas
respectivas Frequências Absolutas (Fi): F1, F2, F3, …, Fn. Assim teremos:
∑ ¿ Xi−X∨¿ × F i
i=1
DM = ¿
n
Onde:
DM: Desvio Médio;
n: Número total de elementos do conjunto;
Fi: Frequência Absoluta.

Exemplo:
de 10 vendedores de uma agência de automóveis como a tabela abaixo indica. Determine o
Desvio Médio.
Veículos Número de X i × F i | ¿ X i −X∨× Fi

Negociados Vendedores X i −X∨¿
(Xi) (Fi)
1 1 1 1,6 1,6
2 3 6 0,6 1,8
3 5 15 0,4 2,0
4 1 4 1,4 1,4
Total 10 26 4,0 6,8
∑ Xi × Fi [ ( 1 ×1 ) + ( 2× 3 ) + ( 3 ×5 ) + ( 4 ×1 ) ] 1+6 +15+4 26
i=1
X= ↔ X= ↔ X= ↔ X= ↔ X=2,6
n 10 10 10
Logo:
∑ ¿ Xi−X∨× Fi 6,8
DM = i=1 ⇔ DM = ⇔ DM =0,68
n 10
Interpretação:
Em média, a quantidade de veículos negociada de cada vendedor possui uma

distância/dispersão de 0,68 em torno dos 2,6 veículos comercializados em média por vendedor.

Classes.

Quando os dados estiverem agrupados numa distribuição de frequência de dados

agrupados em classes, usaremos o Desvio Médio dos pontos médios ou centros de classes x1,
x2, x3, …, xn de cada classe, ponderados (multiplicados) pelas respectivas Frequências Absolutas
(Fi): F1, F2, F3, …, Fn. desta forma, o cálculo do Desvio Médio (DM) passa a ser igual, ao
procedimento utilizado na 2ª situação. Assim teremos:
∑ ¿ Xi−X∨¿ × F i
i=1
DM = ¿
n
Onde:
DM: Desvio Médio;
n: Número total de elementos do conjunto;
Fi: Frequência Absoluta.
Exemplo:
A tabela abaixo representa as pontuações obtidas por um grupo de 58 alunos matriculados na

disciplina de Introdução à Estatística. Determine o Desvio Médio.
Pontuações em Alunos Xi Xi × Fi | X i −X∨¿ ¿ X i −X∨× Fi

Classes Fi
35|― 45 5 40 200 22,24 111,2
45|― 55 12 50 600 12,24 146,52
55|― 65 18 60 1.080 2,24 40,32
65|― 75 14 70 980 7,76 108,64
75|― 85 6 80 480 17,76 106,56
85|― 95 3 90 270 27,76 83,28

∑(somatório) 58 - 3.610 - 596,52
EIj+ ESj 35+45 80

cj ↔ Xi= ; X 1= ; X 1= ; X 1=40.
2 2 2
EIj + ESj 45+55 100

cj ↔ Xi= ; X 2= ; X 2= ; X 2=50.
2 2 2
EIj+ ESj 85+ 95 180

cj ↔ Xi= ; X 6= ; X 6= ; X 6=90.;
2 2 2
∑ Xi × Fi [ ( 40 × 5 ) + ( 12× 50 ) + ( 18× 60 ) + ( 14 ×70 )+ ( 6 ×80 ) +(3 ×90)] 200+ 600+ 1080+980+ 48

i=1
X= ↔ X= ↔ X=
n 58 58
3° Passo: Determinar o Desvio Médio (DM):
∑ ¿ Xi−X∨× Fi 596,52
DM = i=1 ⇔ DM = ⇔ DM=10,2848 ⇔ DM ≅ 10,29.
n 58
Interpretação:
Em média, a nota de cada aluno deste grupo teve um distanciamento/dispersão de 10,29

pontos em torno do desempenho médio deste grupo de alunos que foi de 62,24 pontos nesta
disciplina.
VARIÂNCIA (S2 ouσ 2) E DESVIO PADRÃO (S ou σ )
Outra maneira de eliminar os sinais dos desvios, consiste em eleva-los ao quadrado. Por
isso, em vez da média dos valores absolutos dos desvios, considera-se a média dos quadrados
dos desvios, obtendo-se assim, uma outra medida de dispersão bastante utilizada – a variância.

Portanto, a variância de um conjunto de dados é a média dos quadrados dos desvios dos
valores a contar da média (SHIGUTI & SHIGUTI, 2006, p.58).
Corroborando com (SHIGUTI & SHIGUTI, 2006, p.58), (PIANA, MACHADO &
SELAU, 2009, p.46), acrescentam ainda que, a variância é denotada por S2 e, é a medida de
dispersão mais utilizada, seja pela facilidade de compreensão e cálculo, assim como pela
possibilidade de emprego na Inferência Estatística.
Os mesmos autores, definem ela como sendo a média dos quadrados dos desvios em
relação à média aritmética. Assim, a fórmula da variância poderá ser calculada de duas formas:
Quando trabalhamos com universo de dados ou população, a variância é representada

pelo seguinte símbolo grego (sigma): σ 2 ;
Quando trabalhamos com uma amostra de um conjunto de dados, a variância é

representada pelo seguinte símbolo: S2.
1ª SITUAÇÃO: Dados não Agrupados
Sejam os elementos x1, x2, x3, …, xn, portanto “n” valores da variável “X”, com média
igual a X . A Variância da variável aleatória de “X” será definida por:
∑ ( Xi− X)2
σ 2= i=1
n
Ou
∑ (Xi−X )2
2 i=1
S=
n−1
Onde:

2
σ : Variância, usando dados populacionais;
2
S : Variância, usando dados amostrais;
n – 1: Número de graus de liberdade ou desvios independentes.
NOTA:
No caso em que a variância for utilizada apenas para descrever a variação de um

conjunto de dados populacionais, sem que posteriormente se necessite de fazer inferências,
então, ela poderá ser calculada utilizando o número de observações (n) como denominador e será
denotada por σ 2.
Mas, se o objectivo for descrever a variação dos dados de uma amostra que será
utilizada para inferir sobre uma população, então a medida que deve ser utilizada é a variância
com o denominador “n – 1” e, será denotada por S2. Por conseguinte, a fórmula mais utilizada
em estatística é a que apresenta como denominador “n – 1”, devido ao uso de amostras de dados
em maior parte de pesquisas estatísticas, para posterior fazer inferências sobre um grupo maior,
ou seja, sobre a população.
Exemplo:

3, 7, 8, 10 e 11. Determinar a variância deste conjunto de dados.
1° PASSO: Determinar a Média Aritmética ( X ).
∑ Xi 3+7+8+10+11 39
i =1
X= ↔X= ↔ X = ↔ X=7,8
n 5 5
2° PASSO: determinar a variância (S2)

∑ ( Xi− X )2 ( 3−7,8 )2 + ( 7−7,8 )2+ ( 8−7,8 )2 + ( 10−7,8 )2+ (11−7,8 )2 23,04+0,64+ 0,04+ 4,84+10,
2 i=1 2
S= ⇔S = ⇔ S 2=
n−1 5 5−1
anos 2.
DESVIO PADRÃO (S / σ ) PARA A 1ª SITUAÇÃO:
Assim, para a 1ª situação acima, podemos encontrar o DESVIO PADRÃO (S/σ ) da

variância. Mas antes disso, é pertinente dizer que, o Desvio Padrão denotado por (S / σ ), surge
para solucionar o problema de interpretação da variância, devido ao expoente no seu resultado e,
é definido como a raiz quadrada positiva da variância.
Ademais, podemos observar que, o Desvio Padrão é expresso na mesma unidade de

medida em que os dados se apresentam, ou seja, sem o expoente ao quadrado, o que facilita
bastante a sua interpretação. E, para o seu cálculo, usaremos as seguintes fórmulas:
Fórmulas:
σ =√ σ 2
Ou
S= √ S2
Onde:
σ : Desvio Padrão, usando dados populacionais;
S: Desvio Padrão, usando dados amostrais;
Exemplo:

3, 7, 8, 10 e 11. Determinar a variância deste conjunto de dados.

1° PASSO: Determinar a Média Aritmética ( X ):
∑ Xi 3+7+8+10+11 39
i =1
X= ↔X= ↔ X = ↔ X=7,8
n 5 5
2° PASSO: Determinar a variância (S2):
∑ ( Xi− X )2 ( 3−7,8 )2 + ( 7−7,8 )2+ ( 8−7,8 )2 + ( 10−7,8 )2+ (11−7,8 )2 23,04+0,64+ 0,04+ 4,84+10,
2 i=1 2 2
S= ⇔S = ⇔S =
n−1 5 5−1
anos 2.
3° PASSO: Determinar o Desvio Padrão (S):
S= √ S2 ⟺ S= √9,7 anos2 ⇔ S=3,11anos.

Valores Simples.

usaremos a Variância dos valores x1, x2, x3, …, xn, ponderados (multiplicados) pelas respectivas
Frequências Absolutas (Fi): F1, F2, F3, …, Fn. Assim teremos:
n n
∑ (Xi− X) × F i
2
Ou ∑ ( Xi−X )2 × F i
2 i=1 2 i=1
σ = S=
n n−1
Onde:
2
2
X :Média Aritmética;

F i: Frequências Absolutas do conjunto de dados;
Exemplo:
de 10 vendedores de uma agência de automóveis como a tabela abaixo indica. Determine a
variância.
Veículos Número de X i × F i 2 2
(X ¿ ¿i− X ) ¿(X ¿ ¿i− X ) × F i ¿
Negociados Vendedores
(Xi) (Fi)
1 1 1 2,56 2,56
2 3 6 0,36 1,08
3 5 15 0,16 0,8
4 1 4 1,96 1,96
Total 10 26 - 6,4
∑ Xi × Fi [ ( 1 ×1 ) + ( 2× 3 ) + ( 3 ×5 ) + ( 4 ×1 ) ] 1+6 +15+4 26
i=1
X= ↔ X= ↔ X= ↔ X= ↔ X=2,6
n 10 10 10
Logo:
∑ (X ¿¿ i−X )2 × Fi 6,4 6,4 veículos 2

2 i=1 2 2 2
S= ⇔S = ⇔S = ⇔ S =0,71 ¿
n−1 10−1 9
PORTANTO, PARA A DETERMINAÇÃO DO DESVIO PADRÃO PARA A 2ª

SITUAÇÃO, TEREMOS:
S= √ S2 ⟺ S= √0,71 anos 2 ⇔ S=0,84 veiculos.


Classes.
Quando os dados estiverem agrupados numa distribuição de frequência de dados

agrupados em classes, usaremos a variância dos pontos médios ou centros de classes x1, x2, x3,
…, xn de cada classe, ponderados (multiplicados) pelas respectivas Frequências Absolutas (Fi):
F1, F2, F3, …, Fn. Desta forma, o cálculo da variância ( S2) passa a ser igual, ao procedimento
utilizado na 2ª situação. Assim teremos:
n n
∑ (Xi− X) × F i
2
Ou ∑ ( Xi−X )2 × F i
2 i=1 2 i=1
σ = S=
n n−1
Onde:
2
2
X :Média Aritmética;
F i: Frequências Absolutas do conjunto de dados;
Exemplo:
A tabela abaixo representa as pontuações obtidas por um grupo de 58 alunos

matriculados na disciplina de Introdução à Estatística. Determine o Desvio Médio.
Pontuações em Alunos Xi Xi × Fi 2
( X ¿ ¿i− X )2 ¿(X ¿ ¿i− X ) × F i ¿
Classes Fi

35|― 45 5 40 200 494,6176 2.473,088

45|― 55 12 50 600 149,8176 1.797,8112
55|― 65 18 60 1.080 5,0176 90,3168
65|― 75 14 70 980 60,2176 843,0464
75|― 85 6 80 480 315,4176 1.892,5056
85|― 95 3 90 270 770,6176 2.311,8528
∑(somatório) 58 - 3.610 - 9.408,62
EIj+ ESj 35+45 80

cj ↔ Xi= ; X 1= ; X 1= ; X 1=40.
2 2 2
EIj + ESj 45+55 100

cj ↔ Xi= ; X 2= ; X 2= ; X 2=50.
y2 2 2
EIj+ ESj 85+ 95 180

cj ↔ Xi= ; X 6= ; X 6= ; X 6=90.
2 2 2
∑ Xi × Fi [ ( 40 × 5 ) + ( 12× 50 ) + ( 18× 60 ) + ( 14 ×70 )+ ( 6 ×80 ) +(3 ×90)] 200+ 600+ 1080+980+ 48

i=1
X= ↔ X= ↔X=
n 58 58
3° Passo: Determinar a variância (S2):
∑ (X ¿¿ i−X )2 × Fi 9.408,62 9.408,62 pontos 2

2 i=1 2
S= ⇔S = ⇔ S 2= ⇔ S 2=165,06 ¿
n−1 58−1 57
PORTANTO, PARA A DETERMINAÇÃO DO DESVIO PADRÃO PARA A 3ª

SITUAÇÃO, TEREMOS:
S= √ S ⟺ S= √ 165,06 pontos2 ⇔ S=12,85pontos.

2

COEFICIENTE DE VARIAÇÃO (CV)
As medidas de dispersão que anteriormente nos referimos são medidas que se exprimem
na mesma unidade dos dados e, sendo assim, se torna impossível comparar entre si as dispersões
de duas distribuições, cujos valores não se refiram à mesma unidade.
Assim sendo, Coeficiente de Variação trata-se de uma média relativa à dispersão, útil
para a comparação e observação em termos relativos do grau de concentração em torno da média
de séries distintas e, o mesmo é denotado por (CV) e é dado pela seguinte fórmula:
Fórmula:
S
CV = × 100 %
X
Onde:
CV: Coeficiente de Variação;
X : Média Aritmética e;
S: Desvio Padrão.
CLASSIFICAÇÃO DA DISTRIBUIÇÃO QUANTO À DISPERSÃO DOS DADOS
 Dispersão Baixa: se o CV ≤ 15%;

 Dispersão Média: se 15% < CV < 30%
 Dispersão Alta: se o CV ≥ 30%
Exemplo:
Numa empresa, o salário médio dos funcionários do sexo masculino é de 4.000,00Mt,

comum desvio padrão de 1.500,00Mt e, os funcionários do sexo feminino tem em média um

salário de 3.000,00Mt, com um desvio padrão de 1.200,00Mt. Determine o coeficiente de

variação para ambos sexos.
1° Determina-se, o Coeficiente de Variação (CV) para funcionários do sexo Masculino e,

teremos:
S 1.500
CV = × 100 % ⟺ CV = × 100 % ⟺ CV =0,375 ×100 % ⟺ CV =37,5 %
X 4.000
2° determina-se, o Coeficiente de Variação (CV) para funcionários do sexo Feminino e,

teremos:
S 1.200
CV = × 100 % ⟺ CV = ×100 % ⟺ CV =0,4 ×100 % ⟺ CV =40 %
X 3.000
Interpretação:
Conclui-se que, o salário das mulheres apresenta maior dispersão relativa, em relação ao
salário dos homens, apesar de ambos, serem classificados como que apresentam alta dispersão
por estarem acima dos 30%.
NOTA:
O Coeficiente de Variação é desprovido de unidade de medida, uma vez que, é expresso

em percentagem. Não obstante, o mesmo é uma medida relativa, ou seja, que relaciona o Desvio
Padrão (S) com a sua respectiva Média Aritmética ( X ).
MEDIDAS DE FORMATO: ASSIMETRIA E CURTOSE

O formato é um aspecto importante de uma distribuição. Embora mudanças em uma

medida de variação também provoquem alterações no aspecto visual, o formato de uma
distribuição se relaciona com as ideias de simetria e curtose.
Várias medidas têm o objectivo de informar sobre o formato de uma distribuição. Entre
as mais precisas estão os Coeficiente de Assimetria de Pearson, Coeficiente de Assimetria de
Bowley e Coeficiente de Curtose, que são calculados a partir dos momentos da distribuição.
MEDIDAS DE ASSIMETRIA: Coeficiente de Assimetria de Pearson e Coeficiente de

Bowley
Estas medidas indicam o grau de deformação de uma distribuição em relação ao eixo de

simetria. Portanto, existem vários coeficientes com o objectivo de quantificar tais assimetrias.
Para esta disciplina, estudaremos dois destes coeficientes à saber: Coeficiente de Assimetria de
Pearson e Coeficiente de Assimetria de Bowley.
COEFICIENTE DE ASSIMETRIA DE PEARSON
Entre as várias medidas de assimetria que devem informar se a maioria dos valores se
localiza à esquerda, ou à direita, ou se estão uniformemente distribuídos em torno da média
aritmética, temos o Coeficiente de Assimetria ou de Pearson, denotado por AS. Este
coeficiente, é representado pela seguinte fórmula:
3 ×(X−Md ) X −Mo
AS= ou AS=
S S
Onde:
AS: Coeficiente de Assimetria de Pearson;
Md : Mediana;
Mo : Moda e; S: Desvio Padrão.
CLASSIFICAÇÃO DO COEFICIENTE DE ASSIMETRIA DE PEARSON

Se AS = 0, ou se, X = Mo = Md , diz-se que a distribuição é simétrica;
Se AS > 0, ou se X −Mo=a um valor positivo , diz-se que a distribuição é assimétrica positiva

(ou à direita);
Se AS < 0, ou se X −Mo=a um valor negativo , diz-se que a distribuição é assimétrica negativa

(ou à esquerda);
Não obstante:
Se 0,15 < |AS| < 1, diz-se que é assimétrica moderada;
Se |AS| > 1, diz-se que é assimétrica forte.
COEFICIENTE DE ASSIMETRIA DE BOWLEY
Q3+ Q1−2× Md
AB=
Q3−Q1
Onde:
AB: Coeficiente de Assimetria de Bowley;
Q 3: Terceiro Quartil do conjunto de dados;
Q 1: primeiro quartil do conjunto de dados;
Md : Mediana do conjunto de dados.
CLASSIFICAÇÃO DO COEFICIENTE DE ASSIMETRIA DE BOWLEY
Se, AB = 0, diz-se que é uma distribuição Simétrica;
Se, 0 < AB ≤ 0,1, diz-se que a distribuição é assimétrica positiva fraca;
Se, 0,1 < AB < 0,3, diz-se que a distribuição é assimétrica positiva moderada;
Se, 0,3 ≤ AB ≤ 1, diz-se que a distribuição é assimétrica positiva forte;

Se, - 0,1 ≤ AB < 0, diz-se que a distribuição é assimétrica negativa fraca;
Se, - 0,3 < AB < - 0,1, diz-se que a distribuição é assimétrica moderada;
Se, - 1 ≤ AB ≤ - 0,3, diz se que a distribuição é assimétrica negativa forte.
MEDIDAS DE CURTOSE
Entende-se por Curtose, o grau de achatamento de uma distribuição. Assim, para medir o
grau de curtose, denotado por (K), utilizaremos a seguinte fórmula:
Q3 −Q 1
K=
2 ×(P ¿ ¿ 90−P10 )¿
Onde:
K : Coeficiente de Curtose;
Q 3: Terceiro Quartil do conjunto de dados;
Q 1: Primeiro Quartil do conjunto de dados;
P90 : Percentil de ordem noventa do conjunto de dados;
P10: Décimo Percentil do conjunto de dados.
CLASSIFICAÇÃO DO COEFICIENTE DE CURTOSE
Se, K = 0,263, diz-se que o coeficiente de curtose apresenta uma curva mesocúrtica, ou seja, é
mesocúrtica;
Se, K > 0,263, diz-se que o coeficiente de curtose apresenta uma curva platicúrtica, ou seja, é
platicúrtica;
Se, K < 0,263, diz-se que o coeficiente de curtose apresenta uma curva leptocúrtica, ou seja, é
leptocúrtica.
Exercícios de Consolidação da Unidade

1. O Desvio Médio para o conjunto de dados abaixo, será:
Xi Fi
5 2
7 3
8 5
9 4
11 2
∑(somatório) 16
a) 1,28 ( )
b) 1,20 ( )
c) 1,0 ( )
d) 0,83 ( )
2. O Desvio Padrão de um conjunto de dados é 9. A sua variância será:

a) 3 ( ); b) 36 ( ); c) 81 ( ) d) 18 ( )
3. Na distribuição de valores iguais, o Desvio Padrão é:

a) Negativo ( ) b) A Unidade ( ) c) Zero ( ) d) Positivo ( )
4. O Cálculo da Variância, supõe o conhecimento da:

a) Fac ( ) b) Média ( ) c) Mediana ( ) d) Moda ( )
5. Determine, a variância do conjunto de dados tabelados abaixo:
Classes Fi
03|―08 5
08|― 13 15
13|―18 20
18|― 23 10
∑(somatório) 50
6. Com base na distribuição de frequências abaixo, determine o valor do Coeficiente de

Assimetria de Pearson (AS) e o Coeficiente de Assimetria de Bowley (AB) e, classifique-
os.
Classes Fi
02|―06 6
06|― 10 12
10|―14 24
14|― 18 12
18|― 22 6
∑(somatório) 60
7. Sabe-se que uma distribuição apresentou as seguintes medidas: Q 1 = 24,4 cm; Q3 = 41,2
cm; P10 = 20,2 cm e, P90 = 49,5 cm. Com essas medidas, determine o valor do Coeficiente
de Curtose (K) e, classifique-o.

CONTEÚDOS DA UNIDADE 06: FUNADAMENTOS DE PROBABILIDADE.
 Introdução;
 Conceitos Fundamentais;
 Operações com Eventos
 Conceitos de Probabilidade;
 Axiomas e Teoremas de Probabilidades;
 Exercícios de Consolidação da Unidade.
INTRODUÇÃO
A Estatística, desde as suas origens no antigo Egipto há 2000 anos antes de Cristo (aC),
até meados do século XIX, se preocupava apenas com a organização e apresentação de dados de
observações colectadas empiricamente (Estatística Descritiva).
Somente com o desenvolvimento da Teoria das Probabilidades foi possível que a

Estatística se estruturasse organicamente e ampliasse seu campo de acção, através da criação de
técnicas de amostragem mais adequadas e de formas de relacionar as amostras com as
populações de ondem provieram (Inferência Estatística).
Actualmente, a Teoria da Probabilidade tem um papel importante em quase todos os

ramos da ciência, desde a medicina onde se avaliam os riscos dos efeitos de diversos tratamentos
(por exemplo, na tomada de decisões sobre diversas campanhas) até ao controlo de qualidade,
na indústria, para se obter uma maior precisão nas decisões, perante situações de incerteza
(MURTEIRA & ANTUNES, 2012).
CONCEITOS FUNDAMENTAIS
O objectivo da Teoria da Probabilidade é o de estudar fenómenos aleatórios,

construindo modelos matemáticos, a que chamamos de modelos de probabilidade, que os possam
descrever convenientemente.
Assim, para o entendimento da temática Probabilidades, é pertinente antes de mais, o

entendimento e percepção de alguns conceitos fundamentais, tais como: Experimento

Probabilístico ou Aleatório, denotado por (E), Espaço Amostral, denotado por (S), Evento ou
Acontecimento, denotado por (Qualquer Letra Maiúscula do Alfabeto).
Experimento Probabilístico ou Aleatório (E)
De acordo com PIANA, MACHADO & SELAU (2009, p.68), Experimento

Probabilístico ou Aleatório, é toda a experiência cujos resultados podem não ser os mesmos,
ainda que sejam repetidos sob condições idênticas.
Outrossim, SHIGUTI & SHIGUTI (2006, p.64), definem Experimento Probabilístico

ou Aleatório, como sendo o processo de observação ou medida de um determinado fenómeno
em estudo. Os mesmos autores, acrescentam ainda que, é a experiência que repetida sob as
mesmas condições, conduz a resultados, em geral, distintos.
No entanto, MARTINS (2005, p.130), define Experimento Probabilístico ou

Experiência Aleatória, como o processo de observar um resultado de um fenómeno aleatório2.
Numa experiência aleatória obtém-se um resultado, de entre um conjunto de resultados

conhecidos de antemão, mas não se tem conhecimento suficiente de qual o resultado que sai em
cada realização da experiência. Admite-se ainda que a experiência se pode repetir e que as
repetições são realizadas nas mesmas circunstâncias e são independentes.
Assim, como características desses experimentos temos as seguintes:
 Cada experimento pode ser repetido indefinidamente sob condições inalteradas;

 Embora não possamos afirmar qual o resultado que ocorrerá, é sempre possível descrever
o conjunto de todos os possíveis resultados;
2
Fenómenos Aleatórios, são fenómenos cujos resultados individuais são incertos, mas para os quais se admite uma
regularidade a longo termo, possibilitando a obtenção de um padrão genérico de comportamento. Como exemplos de
fenómenos aleatórios, temos: Chave do totoloto em cada semana; Resposta de uma doença a um tratamento feito
com determinado medicamento; Estado do tempo no dia seguinte; Comportamento dos eleitores nas próximas
eleições legislativas; Comportamento de um aluno no exame de resposta de múltipla escolha, para o qual não
estudou; Comportamento do mercado perante um producto novo para lavar a roupa; etc.

 Quando o experimento for realizado repetidamente, os resultados individuais parecem

ocorrer de forma acidental, mas se for repetido um grande número de vezes uma
configuração definida ou regularidade surgirá.
Exemplos:
 Contar o número de carros estacionados, na rua, ao sairmos de manhã de casa;

 Perguntar a uma pessoa ao acaso, quantas são as pessoas do seu agregado familiar;
 Lançar uma moeda ao ar e ver o resultado que sai;
 Lançar uma moeda ao ar 20 vezes e ver quantas caras saem;
 Medir o tempo que de manhã levamos a chegar ao emprego;
 Contar o número de desastres que encontramos, em cada dia, na ida para o emprego.
As situações anteriores são exemplos de experiências aleatórias pois, além de envolverem

aleatoriedade, o resultado da experiência está bem especificado. O mesmo não se passa com a
seguinte situação: ao acordar, de manhã, ir à janela. Efectivamente, nesta situação anterior não
se especificou qual o resultado possível, de modo a termos uma experiência aleatória.
Espaço Amostral (S)
SHIGUTI & SHIGUTI (2006, p.64), definem Espaço Amostral como um conjunto de
todas as possíveis ocorrências de um determinado experimento aleatório (E).
Entretanto, PIANA, MACHADO & SELAU (2009, p.68), dizem que, Espaço Amostral,
é o conjunto de todos os possíveis resultados de um experimento aleatório, ou seja, é o conjunto
universo relativo aos resultados de um experimento. Assim, a cada experimento aleatório, está
associado um conjunto de resultados possíveis, ou Espaço Amostral.
Por outro lado, MARTINS ((2005, p.131) define Espaço Amostral, como o conjunto de
todos os resultados possíveis, associados à realização de uma experiência aleatória.
Exemplos:
 No seguinte Experimento Aleatório, que denotaremos por “um” (E1): Lançamento de

um dado ao ar e observar o número na face superior. Assim, para este caso, teremos

como Espaço Amostral (S) os seguintes: S1 = {1; 2; 3; 4; 5; 6}, visto que, um dado não
defeituoso, contém 6 faces;
 No seguinte Experimento Aleatório, que denotaremos por “dois” (E2): Lançamento de
uma moeda ao ar e observar o valor na face superior. Assim, para este caso, teremos
como Espaço Amostral (S) os seguintes: S2 = {cara; coroa}, visto que, uma moeda não
defeituosa, contém 2 faces, ou seja, cara ou coroa;
 No seguinte Experimento Aleatório, que denotaremos por “três” (E3): Lançamento de
um dado e uma moeda ao ar e observar os números e os valores nas faces superiores.
Assim, para este caso, teremos como Espaço Amostral (S) os seguintes: S3 = {1 e cara; 2
e cara; 3 e cara; 4 e cara; 5 e cara; 6 e cara; 1 e coroa; 2 e coroa; 3 e coroa; 4 e coroa; 5 e
coroa; 6 e coroa}, visto que, um dado não defeituoso, contém 6 faces e uma moeda não
defeituosa, contém 2 faces;
Evento ou Acontecimento (Denotado por qualquer letra maiúscula)
Para PIANA, MACHADO & SELAU (2009, p.68), Evento ou Acontecimento é todo
conjunto particular de resultados do Espaço Amostral (S) ou, ainda, é todo o subconjunto do
Espaço Amostral (S). Geralmente, é denotado por qualquer letra maiúscula do abecedário
português (A; B; C, etc.).
Corroborando com os autores acima, SHIGUTI & SHIGUTI (2006, p.64), definem
Evento ou Acontecimento, como qualquer subconjunto de ocorrências de um determinado
espaço amostral (S).
Por outro lado, MARTINS (2005, p.131) afirma que, Evento ou Acontecimento é o
subconjunto do espaço amostral ou de resultados (S).
Assim, diante dos posicionamentos dos autores acima e, considerando a Experiência

Aleatória (E) que consiste em perguntar a uma pessoa, escolhida ao acaso, quantas pessoas
constituem o seu agregado familiar, o Espaço Amostral ou de Resultados é constituído por
todos os números inteiros não negativos (excluindo o zero). Portanto, alguns acontecimentos
são:
 3 pessoas, que podemos representar por: S = {3}

 entre 2 e 4 pessoas (inclusive), que pode se representar por: S = {2, 3, 4)

 mais de 3 pessoas, que pode se representar por: S= {4, 5, 6, …}
 menos de 10 pessoas, que pode se representar por: S = {1, 2, …, 9}
De um modo geral os Eventos ou Acontecimentos identificam-se com letras maiúsculas

“A”, “B”, “C”, …, “Z”. Assim, diz-se que se realizou o acontecimento “A”, quando o resultado
da experiência pertence a “A”.
Exemplos:
 S1 = {1; 2; 3; 4; 5; 6}, assim, este Espaço Amostral (S1) é composto de 6 eventos;

 S2 = {cara; coroa}, assim, este Espaço Amostral (S2) é composto de 2 eventos;
 S3 = {1 e cara; 2 e cara; 3 e cara; 4 e cara; 5 e cara; 6 e cara; 1 e coroa; 2 e coroa; 3 e
coroa; 4 e coroa; 5 e coroa; 6 e coroa}, assim, este Espaço Amostral (S 3) é composto de
12 eventos;
Tipos de Eventos ou Acontecimentos
No entanto, alguns dos eventos ou acontecimentos são constituídos por:
1. Um único resultado, desta feita, chama-se Evento ou Acontecimento Elementar.

2. Eventos Compostos, quando constituído por mais de um resultado;
3. Outros ainda, denominados de Eventos ou Acontecimentos Certos, quando constituído
por todos os resultados do espaço amostral (Se A = S);
4. Evento Impossível, se não tiver qualquer elemento do espaço amostral (Se A = ∅).
5. Evento Complementar, que é um outro conjunto formado pelos elementos que
pertencem ao espaço amostral, mas que não pertencem ao conjunto em estudo.
NOTA:
Genericamente, se o número de elementos do espaço amostral de um espaço

amostral finito é “n”, então o número de eventos é dado por 2n, onde a base 2, corresponde o
número de faces possíveis do objecto lançado ao ar. Assim, por exemplo, no lançamento de 5
moedas ao ar, o número de elementos do espaço amostral ou de resultados possíveis é 2 5 = 32.
Portanto, S = 32.

OPERAÇÕES COM EVENTOS
Conjunto representa uma colecção de objectos. Assim, em geral, os conjuntos indicam-

se por uma letra maiúscula do alfabeto, tal e qual os eventos e, seus elementos por letras
minúsculas. Desta feita, um conjunto pode ser representado por chavetas ou de forma geométrica
(quadros e círculos).
Assim, um conjunto pode igualmente estar representado por Extensão e por

Compreensão. Assim, se os seus elementos estiverem descriminados um por um e separados
por virgulas, diz-se por Extensão. De contrário, se os seus elementos estiverem definidos por
uma propriedade característica de todos os elementos, diz-se por Compreensão.
Portanto, através do diagrama de Venn, os conjuntos são representados, graficamente, ou

seja, todos os elementos são representados por pontos dentro duma linha fechada e, junto de cada
ponto está a designação de cada elemento.
Cardinal de um Conjunto (#)
O cardinal de um conjunto finito A é o número de elementos deste conjunto. Assim, do

conjunto A, representa-se por: #A. Exemplo: Se A = {a, b, c, d}, diz-se que o cardinal é #A = 4.
União de Conjuntos (∪)
A União de acontecimentos A e B é o acontecimento que se realiza quando se realiza A

ou B ou ambos. E, representa-se por A ∪B e é formado pelos resultados que pertencem a pelo
menos um dos acontecimentos.
Intersecção de Conjuntos (∩)
A intersecção de acontecimentos A e B é o acontecimento que se realiza se e só se (sse)

A e B se realizam simultaneamente. E, representa-se por A ∩ B e é constituído pelos resultados
comuns de A e B.

Complementar de um Conjunto ou Acontecimento Contrário ( A )
O complementar de um conjunto “A” ou acontecimento contrário de “A” em relação a

um dado espaço amostral (S), é o acontecimento constituído por todos os resultados do espaço
amostral (S) que não pertençam a “A”. E, representa-se por A . Assim:
A ∪ A=S e , A ∩ A=∅
Outrossim, dados dois conjuntos A e B, chama-se complementar de “B” em relação a

“A”, ao conjunto dos elementos de “A” que não pertencem a “B”. E, representa-se por A \ B ou
A – B, onde lê-se “A” menos “B” ou Diferença de “A” e “B”.
Conjuntos Disjuntos
Os acontecimentos disjuntos, incompatíveis ou mutuamente exclusivos, são

acontecimentos que não tem resultados comuns e, portanto, a realização de um deles implica, a
não realização do outro. Logo:
A ∩ B=∅
Relação de Pertença (∈)
Esta relação serve para indicar se um elemento pertence ou não a um conjunto.
Exemplo:
a ∈ A → lê−se a pertence ao conjunto A ;
2 ∉ A →lê−se 2 nåo pertence ao conjunto A .
Portanto, esta relação só se estabelece entre o elemento e o conjunto.
Relação de Inclusão
Serve para indicar se um conjunto está contido ou não noutro conjunto, ou seja, se é ou
não seu subconjunto.
A ⊂B → lê−se A está contido ou é sub conjunto de B;

B⊄ A → lê−se B nåo está contido ou nåo é subconjunto de A .
Portanto, esta relação só se estabelece entre conjuntos.
PROBABILIDADES. CONCEITOS.
Na linguagem corrente, a noção de probabilidade é utilizada sem qualquer definição

precisa do seu significado, contudo, a teoria das probabilidades, sendo uma disciplina da
Matemática, deve tornar esta noção precisa. Por isso, a primeira definição de probabilidade foi
estabelecida por LAPLACE em 1812.
AXIOMAS E TEOREMAS DE PROBABILIDADES
Axioma 1: Diz que, a probabilidade de um acontecimento A é um n° real de 0 a 1.

Assim, teremos:
0 ≤ P(A )≤ 1
Axioma 2: A probabilidade do acontecimento certo é 1. Assim, se A é um evento ou

acontecimento certo, assim teremos:
P ( A )=1
Axioma 3: A probabilidade da reunião de dois acontecimentos certos disjuntos, ou seja,

mutuamente exclusivos, é igual a soma das probabilidades desses acontecimentos. Assim,
teremos:
P ( A ⋃ B )=P ( A ) + P ( B ) ; se A ∩ B=∅
PORTANTO, A PARTIR DESTES AXIOMAS 3, PODEMOS DEDUZIR OS

TEOREMAS SEGUINTES:
Teorema 1: A probabilidade do acontecimento contrario é:
P ( A )=1−P (A )
Teorema 2: A probabilidade do acontecimento impossível é zero.

3
São verdades inquestionáveis, universalmente válidas, muitas vezes utilizadas como princípios na construção de
uma teoria ou como base para uma argumentação.
P(∅)=0
Teorema 3: Se A e B são acontecimentos não disjuntos, têm-se:
P ( A ⋃ B )=P ( A ) + P ( B )−P ( A ∩ B ) ; se A ∩B ≠ ∅ , emque ∅ é o conjunto impossível
Assim, a Lei de Laplace, enuncia o seguinte: “Se uma experiência aleatória pode ter “N”
resultados mutuamente exclusivos e igualmente possíveis, e se desses resultados, “n” têm um
n
certo atributo “A”, então a probabilidade de “A” é dada por . E, habitualmente escreve-se:
N
n N ° de Casos Favoráveis do Acontecimento A

P ( A )= → P ( A )=
N N ° de Casos Possíveis
Exemplo:
1. Calcule a probabilidade de que, num lançamento de um dado perfeito/honesto com as

faces numeradas de 1 a 6, se obtenha:
1.1 Um número par:
Dados:
N° de Casos Possíveis = 6 faces, que corresponde ao espaço amostral do dado: S = {1, 2,

3, 4, 5, 6};
N° de Casos Favoráveis = 3 faces, que corresponde ao que pretendemos que saia (Par):
A = {2, 4, 6}.
n N ° de Casos Favoráveis 3 1
P ( A )= → P ( A )= → P ( A )= → P ( A )= → P ( A )=0,5→ P ( A )=50 %
N N ° de Casos Possíveis 6 2
1.2 Um número não inferior a 5.
Dados:
N° de Casos Possíveis = 6 faces, que corresponde ao espaço amostral do dado: S = {1, 2, 3,

4, 5, 6}
N° de Casos Favoráveis = 2 faces, que corresponde ao que pretendemos que saia (N° não
inferior a 5): A = {5, 6}.
P ( A )= → P ( A )= → P ( A )= → P ( A )= → P ( A ) =0,3333 → P ( A )=33,33 %
2. Calcule a probabilidade de que, no lançamento de uma moeda perfeita/honesta ao ar sair:

2.1 Cara;
Dados:
N° de Casos Possíveis = 2 faces, que corresponde ao espaço amostral da moeda: S =

{cara, coroa};
N° de Casos Favoráveis = 1 face, que corresponde ao que pretendemos que saia (cara):
A = {cara}.
n N ° de Casos Favoráveis 1
P ( A )= → P ( A )= → P ( A )= → P ( A ) =0,5→ P ( A )=50 %
N N ° de Casos Possíveis 2
2.2 Coroa.
Dados:
N° de Casos Possíveis = 2 faces, que corresponde ao espaço amostral da moeda: S =

{cara, coroa};
N° de Casos Favoráveis = 1 face, que corresponde ao que pretendemos que saia (coroa):
A = {coroa}.
n N ° de Casos Favoráveis 1
P ( A )= → P ( A )= → P ( A )= → P ( A ) =0,5→ P ( A )=50 %
N N ° de Casos Possíveis 2
3. Extrai-se uma carta, ao acaso, de um baralho de 52 cartas. Vamos calcular a

probabilidade de que:
3.1 A carta extraída seja um Rei;
Dados:
N° de Casos Possíveis = 52, que corresponde ao espaço amostral de um baralho, que

contém 52 cartas: S = {52 cartas};
N° de Casos Favoráveis = 4 Reis, que corresponde ao que pretendemos que saia (Rei): A
= {há 4 reis num baralho}.
P ( A )= → P ( A )= → P ( A )= → P ( A )= → P ( A )=0,0769 → P ( A ) =7,69 %
3.2 A carta extraída seja copas;
Dados:
N° de Casos Possíveis = 52, que corresponde ao espaço amostral de um baralho, que

contém 52 cartas: S = {52 cartas};
N° de Casos Favoráveis = 13 Copas, que corresponde ao que pretendemos que saia

(Copas): A = {há 13 cartas de copas num baralho}.
P ( A )= → P ( A )= → P ( A )= → P ( A ) = → P ( A )=0,25 → P ( A )=25 %
Exercícios de Consolidação da Unidade
1. Seja o experimento “E” o lançamento de um dado honesto ao ar. Qual a probabilidade de

o evento “A”:
1.1 Sair números maiores e iguais a 2?
1.2 Sair um número ímpar?
2. No lançamento de duas moedas não defeituosas ao ar, qual é a probabilidade de se obter:
2.1 Duas caras;

2.2 Uma cara e uma coroa.

3. O António abre ao acaso, um livro, ficando a vista duas páginas numeradas. Qual é a
probabilidade de a soma dos números dessas duas paginas ser impar?
4. Dos ouvintes da Rádio Moçambique, 37% ouvem o programa RM Desporto; 53% ouvem
o programa Nogoma Moçambique e 15% ouvem ambos os programas. Ao escolher
aleatoriamente um ouvinte desta estacão radiofónica, qual é a probabilidade de que:
4.1 Escute apenas um dos referidos programas;
4.2 Não escute nenhum destes dois programas.

Apontamentos de Introducao À Estatistica

Enviado por

Direitos autorais:

Formatos disponíveis

Apontamentos de Introducao À Estatistica

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apontamentos de Introducao À Estatistica

Enviado por

Direitos autorais:

Formatos disponíveis

Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

CONTEÚDOS DA UNIDADE 01: NOÇÕES GERAIS SOBRE INTRODUÇÃO À

INTRODUÇÃO: Noções Gerais sobre Estatística.

Porém, na última década, em grande parte devido às facilidades computacionais postas à

A estatística, durante muitos séculos, esteve relacionada apenas com as informações a

Em jeito de conceito, HORTA, (s.d.), conceitua a Estatística, como sendo um conjunto

A estatística divide-se em duas partes essenciais a saber: Estatística Descritiva e a

Enquanto a Estatística Descritiva cuida do resumo e da apresentação de dados de

Autor: Rosângelo Paúnde Página 2

cálculo de probabilidades e compreende dois grandes tópicos: a estimação de parâmetros e os

Embora a Estatística Descritiva seja um ramo fundamental da Estatística, em muitos

1. Planear o processo amostral e experimental;

Para ilustrar efectivamente a necessidade da inferência estatística, ou seja, dos métodos

Autor: Rosângelo Paúnde Página 3

- Determinar a dosagem ideal de um novo medicamento, com base em testes feitos em

Portanto, em todas essas situações existe incerteza porque dispomos apenas de

GUIMARÃES (2007, p.13), conceitua população como sendo a totalidade de elementos

 Uma característica em comum;

Obviamente, o que é necessário garantir, em suma, é que a amostra seja representativa

Usando o exemplo anterior, para facilitar o nosso estudo, escolheremos um subconjunto

Autor: Rosângelo Paúnde Página 5

Existem dois tipos de técnicas de amostragem a saber: a amostragem probabilística e a

A amostragem será probabilística se todos os elementos da população tiverem

Ou seja, uma amostragem não probabilística é obtida quando o acesso a informações

As unidades de uma população se distinguem e se caracterizam por um conjunto de

Autor: Rosângelo Paúnde Página 6

uma característica ou atributo da população e de suas unidades. Cada característica pode

Por exemplo, sexo e grau de instrução são características de indivíduos de uma

Portanto, o conjunto de características das unidades de uma população é demasiadamente

Entretanto, o termo variável é normalmente utilizado genericamente para indicar aquilo

CLASSIFICAÇÃO DAS VARIÁVEIS

As variáveis Categóricas ou Qualitativas descrevem qualidades, ou seja, são aquelas

Ordinais, quando houver um sentido de ordenação entre os seus possíveis valores.

As variáveis Numéricas ou Quantitativas, consistem em números que representam

Discretas, resultam de um conjunto finito, enumerável de valores possíveis e, só podem

OBSERVAÇÃO E CONJUNTO DE DADOS

Os números, taxas e outras informações colectadas em experimentos ou levantamentos

Observação é o conjunto de valores referentes a todas as variáveis medidas em uma

Exemplo: tomemos o conjunto de dados apresentado na tabela abaixo. Esse conjunto é

i Nome Sexo Altura Peso

Autor: Rosângelo Paúnde Página 9

Exercícios de consolidação da primeira unidade:

Autor: Rosângelo Paúnde Página 10

Autor: Rosângelo Paúnde Página 11

5.5 Número de alunos de uma escola:

CONTEÚDOS DA UNIDADE 02: ESTATÍSTICA DESCRITIVA

Autor: Rosângelo Paúnde Página 12

Como vimos na aula anterior, uma amostra é um subconjunto de uma população,

O método científico, quando aplicado para solução de um problema científico,

Segundo PIANA, MACHADO & SELAU, (2009, p.14), conceituam a Estatística

Outrossim, a Estatística Descritiva, tem por finalidade a utilização de tabelas, gráficos,

 Examinar o formato geral da distribuição dos dados;

Tabela 3: Principais Técnicas da Estatística Descritiva:

Principais Técnicas Descrição

Gráficos Possibilita uma visualização das principais características da

Medidas Descritivas Por meio de medidas ou resumos numéricos podemos levantar

Fonte: Retirado de GUIMARÃES (2007, p.26).

APRESENTAÇÃO DE DADOS: Tabelas e Gráficos

Uma tabela estatística é composta de elementos essenciais e elementos