Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Apontamentos de Introducao À Estatistica

Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1de 94

Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

CONTEÚDOS DA UNIDADE 01: NOÇÕES GERAIS SOBRE INTRODUÇÃO À


ESTATÍSTICA

 Noção de Estatística;
 Divisão da Estatística;
 População e Amostra;
 Característica e Variável;
 Classificação de Variáveis;
 Observação e Conjunto de Dados;

INTRODUÇÃO: Noções Gerais sobre Estatística.

Não é uma tarefa simples definir o que é estatística. Por vezes define-se como sendo um
conjunto de técnicas de tratamento de dados, mas é muito mais do que isso. A estatística é uma
“arte” e uma ciência que permite tirar conclusões e de uma maneira geral fazer inferências 1 a
partir de conjuntos de dados. Até 1900, a Estatística resumia-se ao que hoje em dia se chama de
Estatística Descritiva. Apesar de tudo, deu contribuições muito positivas em várias áreas
cientificas.

A necessidade de uma maior formalização nos métodos utilizados, fez com que, nos anos
seguintes, a Estatística se desenvolvesse numa outra direcção, nomeadamente no que diz respeito
ao desenvolvimento de métodos e técnicas de Inferência Estatística. Assim, por volta de 1960 os
textos de Estatística debruçam-se especialmente sobre métodos de estimação e de testes de
hipóteses, assumindo determinadas famílias de modelos, descurando os aspectos práticos da
análise dos dados.

Porém, na última década, em grande parte devido às facilidades computacionais postas à


sua disposição, os Estatísticos têm-se vindo a preocupar-se cada vez mais, com a necessidade de
desenvolver métodos de análise e exploração dos dados, que deem uma maior importância aos
mesmos.
1
Inferência, segundo GUIMARÃES (2007, p.19) significa estender os resultados da amostra para toda a população.
Outros autores, afirmam que, a inferência significa deduzir por meio de raciocínio, ou seja, tirar conclusões com
base em deduções.
Autor: Rosângelo Paúnde Página 1
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Por isso mesmo, em todas as áreas do conhecimento é necessário saber “o que medir” e
“como medir”. Nesta ordem de ideias, pode se definir a Estatística como sendo a ciência que
ensina a recolher dados válidos, assim como a interpretá-los.

A estatística, durante muitos séculos, esteve relacionada apenas com as informações a


respeito do Estado. Hoje em dia, o conjunto de teorias, conceitos e métodos denominado
estatística está associado ao processo de descrição e inferência, debruçando-se, de modo
particular, sobre questões relativas a sumarização eficiente de dados, planeamento e análise de
experimentos e levantamentos e natureza de erros de medida e de outras causas de variação em
um conjunto de dados.

Em jeito de conceito, HORTA, (s.d.), conceitua a Estatística, como sendo um conjunto


de técnicas e métodos de pesquisa que entre outros tópicos envolve o planeamento do estudo a
ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a
disseminação das informações.

Como importância, (PIANA, MACHADO & SELAU, 2009, p.5) afirmam que a
estatística é importante na medida em que, é uma ferramenta necessária para a compreensão
dos fenómenos que ocorrem nas mais diferentes áreas.

DIVISÃO DA ESTATÍSTICA

A estatística divide-se em duas partes essenciais a saber: Estatística Descritiva e a


Estatística Analítica ou Inferência Estatística.

Enquanto a Estatística Descritiva cuida do resumo e da apresentação de dados de


observações por meio de tabelas, gráficos e medidas, sem se preocupar com as populações de
onde esses dados foram retirados, a Estatística Analítica ou Inferência Estatística tem como
objectivo fornecer métodos que possibilitem a realização de inferência sobre populações a partir
de amostras delas provenientes.

Diante dos factos acima elencados, pode-se afirmar que a Estatística Descritiva tem por
objectivo resumir as principais características de um conjunto de dados por meio de tabelas,
gráficos e resumos numéricos. Diferentemente da Inferência Estatística, que tem por base o

Autor: Rosângelo Paúnde Página 2


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

cálculo de probabilidades e compreende dois grandes tópicos: a estimação de parâmetros e os


testes de hipóteses.

Embora a Estatística Descritiva seja um ramo fundamental da Estatística, em muitos


casos ela se torna insuficiente. Isto ocorre porque quase sempre as informações são obtidas de
amostras e, consequentemente, sua análise exige generalizações que ultrapassam os dados
disponíveis. Por conseguinte, essa necessidade, aliada ao desenvolvimento dos métodos
probabilísticos, promoveu o crescimento da estatística pela ênfase aos métodos generalizadores
(Inferência Estatística).

Usualmente, é impraticável observar toda uma população, seja pelo custo alto, seja por
dificuldades operacionais. Por isso mesmo, examina-se uma amostra, de preferência bastante
representativa, para que os resultados obtidos possam ser generalizados para toda a população.
Portanto, toda conclusão tirada por amostragem, quando generalizada para a população,
apresenta um grau de incerteza.

Assim sendo, por Inferência Estatística, (GUIMARÃES, 2007, p.13), diz que é o
conjunto de técnicas e procedimentos que permitem dar ao pesquisador um grau de
confiabilidade nas afirmações que faz para a população, baseadas nos resultados das amostras.

Dessa forma, poderíamos resumir os passos necessários para se atingir bons resultados ao
realizar um experimento:

1. Planear o processo amostral e experimental;


2. Obter inferências sobre a população e;
3. Estabelecer níveis de incerteza envolvidos nessas inferências,

Para ilustrar efectivamente a necessidade da inferência estatística, ou seja, dos métodos


generalizadores (PIANA, MACHADO & SELAU, 2009, p.6), apresentam os seguintes
exemplos:

- Prever a duração média da vida útil de uma calculadora, com base no desempenho de
muitas dessas calculadoras;

Autor: Rosângelo Paúnde Página 3


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

- Comparar a eficiência de duas dietas para reduzir peso, com base nas perdas de peso de
pessoas que se submeteram às dietas;

- Determinar a dosagem ideal de um novo medicamento, com base em testes feitos em


pacientes voluntários de hospitais selecionados aleatoriamente;

- Prever o fluxo de trafego de uma rodovia ainda em construção, com base no trafego
observado em rodovias alternativas.

Portanto, em todas essas situações existe incerteza porque dispomos apenas de


informações parciais, incompletas ou indirectas. A Inferência Estatística trata de problemas
onde a incerteza é inerente, utilizando métodos que se fundamentam na teoria das
probabilidades. Portanto, os métodos de inferência tornam-se necessários para avaliar a
confiabilidade dos resultados observados.

POPULAÇÃO E AMOSTRA

De um modo geral, podemos dizer que o objectivo da estatística é fornecer métodos para
se conviver, de modo racional, com a variabilidade. Isto é feito através da descoberta de
regularidades nos dados relativos às situações em estudo. Assim sendo, quando estudamos uma
determinada característica, geralmente, queremos obter conclusões para um conjunto de todos
os indivíduos ou objectos que apresentam tal característica. Portanto, chamamos de população
ao conjunto de todos os indivíduos ou objectos que apresentam uma característica em comum,
cujo comportamento deseja-se analisar ou inferir.

GUIMARÃES (2007, p.13), conceitua população como sendo a totalidade de elementos


que estão sob discussão e das quais se deseja informação, se deseja investigar uma ou mais
características. Assim, segundo o mesmo autor, a população pode ser formada por pessoas,
domicílios, peças de produção, cobaias, ou qualquer outro elemento a ser investigado. Mas, para
que haja uma clara definição das unidades que formam a população, é necessária a
especificação de três elementos:

 Uma característica em comum;


 Localização temporal e;
 Localização geográfica.
Autor: Rosângelo Paúnde Página 4
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Exemplo: Estudo sobre as causas das reprovações em massa nos exames da 10ª classe
nas escolas da Conselho Autárquico de Inhambane no ano de 2020. Diante deste exemplo,
teremos como população alvo, todos os estudantes do Conselho Autárquico de Inhambane que
frequentaram a 10ª classe no ano 2020; População de estudo, todos os estudantes reprovados
nesta classe no ano de 2020 no mesmo Conselho Autárquico.

Portanto, na maioria dos casos, ao estudarmos uma população, não temos acesso a
todos os seus elementos. Por conseguinte, o estudo é feito, então, a partir de uma parte desta
população, denominada amostra, que tem por objectivo representá-la.

Uma amostra é uma parcela da população utilizada para uma posterior análise de dados.
Ou seja, em vez de utilizar toda a população, que resulta em maior custo, tempo e por muitas
vezes ser inviável, o processo de amostragem utiliza uma pequena porção representativa da
população. A amostra fornece informações que podem ser utilizadas para estimar características
de toda a população.

Não obstante, é preciso garantir que a amostra ou as amostras usadas sejam obtidas por
processos adequados. Se erros forem cometidos no momento de seleccionar os elementos da
amostra, o trabalho todo fica comprometido e os resultados finais serão provavelmente bastante
viesados. Por isso mesmo, devemos tomar especial cuidado quanto aos critérios usados na
seleção da amostra.

Obviamente, o que é necessário garantir, em suma, é que a amostra seja representativa


da população. Isso significa que, com exceção de pequenas discrepâncias inerentes à
aleatoriedade sempre presente, em maior ou menor grau, no processo de amostragem, a amostra
deve possuir as mesmas características básicas da população, no que diz respeito à(s)
variável(is) que desejamos pesquisar.

Usando o exemplo anterior, para facilitar o nosso estudo, escolheremos um subconjunto


da população, ou seja, uma amostra que, das oito escolas Secundárias que leccionaram a 10ª
classe naquele Conselho Autárquico no ano 2020, selecionaremos apenas cinco: Escola
Secundária de Muelé, Escola Secundária Emília Daússe, Escola Secundária de Conguiana,
Escola Secundária 4 de Outubro e a Escola Secundária de Guitambatuno.

Autor: Rosângelo Paúnde Página 5


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

TIPOS DE AMOSTRAGEM

Existem dois tipos de técnicas de amostragem a saber: a amostragem probabilística e a


amostragem não-probabilística.

A amostragem será probabilística se todos os elementos da população tiverem


probabilidade conhecida, e diferente de zero, de pertencer à amostra. Caso contrário, a
amostragem será não-probabilística.

Ou seja, uma amostragem não probabilística é obtida quando o acesso a informações


não é tao simples ou os recursos forem limitados, assim o pesquisador faz o uso de dados que
estão mais a seu alcance, é a chamada amostragem por conveniência.

Exemplo:

Podemos realizar um estudo para avaliar a qualidade do serviço prestado por uma
operadora de telefonia celular. Caso tenhamos recursos suficientes, podemos realizar um plano
amostral bastante abrangente de toda a população de usuários do serviço. Isso caracteriza uma
amostra probabilística. Mas, se por restrições orçamentárias ou de outra ordem, não for
possível obter uma amostra tão numerosa ou ela seja de difícil acesso, podemos restringir nossa
amostra a uma pequena região delimitada de fácil acesso e de custo reduzido, por exemplo,
usuários de uma cidade. Essa é uma amostragem não-probabilística. Segundo essa definição, a
amostragem probabilística implica sorteio com regras bem determinadas, cuja realização só
será possível se a população for finita e totalmente acessível. A utilização de uma amostragem
probabilística é a melhor recomendação que se deve fazer no sentido de garantir a
representatividade da amostra, pois o acaso é o único responsável por eventuais discrepâncias
entre população e amostra. No caso em que a única possibilidade é o uso de uma amostragem
não-probabilística, deve-se ter a consciência de que as conclusões apresentam alguma limitação.

CARACTERÍSTICA E VARIÁVEL

As unidades de uma população se distinguem e se caracterizam por um conjunto de


particularidades, propriedades ou atributos. Cada uma dessas particularidades ou propriedades é

Autor: Rosângelo Paúnde Página 6


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

uma característica ou atributo da população e de suas unidades. Cada característica pode


manifestar-se nas unidades sob diferentes alternativas ou níveis.

Por exemplo, sexo e grau de instrução são características de indivíduos de uma


população. Por conseguinte, os níveis (alternativas) para a característica sexo, são dois:
masculino e feminino. E para a característica grau de instrução poderíamos encontrar cinco
níveis ou alternativas: primário, básico, médio, licenciatura (graduação) e pós-graduação
(especialistas, mestres, doutores, pós-doutorados, catedráticos).

Portanto, o conjunto de características das unidades de uma população é demasiadamente


vasto e não totalmente conhecido para ser completamente descrito. Assim, apenas as
características relevantes numa pesquisa específica é que são consideradas e, o conjunto dessas
características irá depender dos objectivos e das condições de realização da pesquisa. Desse
modo, o interesse estará sempre focalizado não nas unidades em si, mas nas suas características
relevantes.

Entretanto, o termo variável é normalmente utilizado genericamente para indicar aquilo


que é sujeito à variação ou inconsistência. Portanto, no contexto da pesquisa cientifica, uma
variável é definida como a função que estabelece uma correspondência entre os níveis de uma
característica e os valores de um conjunto numérico segundo uma escala de medida. Ou seja,
uma variável é uma característica populacional que pode ser medida de acordo com alguma
escala. Ademais, DOS SANTOS (s/r, p. 4) define variável como sendo aquilo que se deseja
observar para tirar algum tipo de conclusão, por exemplo: idade, sexo, peso, etc.

CLASSIFICAÇÃO DAS VARIÁVEIS

De modo geral, as variáveis podem ser classificadas em dois grupos distintos, a saber:
Variáveis Categóricas (Qualitativas) e Variáveis Numéricas (Quantitativas).

As variáveis Categóricas ou Qualitativas descrevem qualidades, ou seja, são aquelas


que podem ser separadas em diferentes categorias, atributos, e que se distinguem por alguma
característica não numérica. As mesmas são classificadas em: nominais e ordinais.

Nominais, quando não houver um sentido de ordenação entre os seus possíveis valores.
Exemplos: sexo (com os níveis masculino e feminino), raça de cavalos (com os níveis manga-
Autor: Rosângelo Paúnde Página 7
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

larga, crioulo e árabe), região geográfica (com os níveis norte, sul, sudeste e leste), estado civil
(com os níveis solteiro, casado e divorciado).

Ordinais, quando houver um sentido de ordenação entre os seus possíveis valores.


Exemplos: faixas de idade (criança, adolescente, adulto e idoso), intensidade de cor (claro,
escuro), intensidade de infestação (forte, média, fraca), grau de instrução (primário, básico,
médio, graduação e pós-graduação), etc.

As variáveis Numéricas ou Quantitativas, consistem em números que representam


contagem ou medidas, ou seja, são aquelas cujos valores são números reais, de modo que cada
valor representa um valor da variável e não uma categoria ou uma classe e, dividem-se em:
discretas e continuas.

Discretas, resultam de um conjunto finito, enumerável de valores possíveis e, só podem


assumir valores do conjunto dos números inteiros não negativos (0,1,2,3, …). Não obstante,
neste tipo de variáveis, os dados só podem ser obtidos através de um processo de contagem.
Exemplos: número de filhos de um casal, número de sementes germinadas, número de pacientes
que se recuperaram de Covid19, número de frutos estragados, etc.

Contínuas, resultam de números infinitos de valores possíveis que podem ser associados
a pontos em uma escala contínua, ou seja, descrevem dados contínuos ou de mensuração, isto é,
obtidos por um processo de medição. Por conseguinte, estas variáveis, podem assumir qualquer
valor do conjunto dos números reais (-10, 0, π, √2, …). Exemplos: peso, altura, tempo de sono,
teor de humidade, temperatura corporal, etc.

Nota:

A classificação correcta de uma variável é fundamental, uma vez que esta discriminação
é que irá indicar a possibilidade e a forma de utilização dos procedimentos estatísticos
disponíveis.

OBSERVAÇÃO E CONJUNTO DE DADOS


Autor: Rosângelo Paúnde Página 8
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Os números, taxas e outras informações colectadas em experimentos ou levantamentos


são denominados dados. Assim, todo dado é um valor de uma variável (numérico ou não
numérico). A unidade da população em que são medidas as variáveis de interesse é chamada de
unidade de observação.

Observação é o conjunto de valores referentes a todas as variáveis medidas em uma


unidade de observação. Por conseguinte, ao conjunto de todas as unidades de observação
constituem o conjunto de dados.

As variáveis são representadas por letras maiúsculas (X, Y, Z, …, etc.) e os seus valores
(dados) por letras minúsculas (x, y, z, … etc.). Assim, se uma variável é representada por X (xis
maiúsculo), todos os seus elementos serão representados por x (xis minúsculo). Assim, para
individualizar ou diferenciar os valores de uma variável, acrescenta-se um índice i = 1, 2, …, n,
que representa a unidade ou a observação. Assim, um conjunto de n valores de uma variável X
será representado por x1, x2, x3, …, xn.

Exemplo: tomemos o conjunto de dados apresentado na tabela abaixo. Esse conjunto é


constituído por 5 unidades ou observações (i), uma variável identificadora (Nome), uma
variável qualitativa nominal (sexo) e duas variáveis numéricas continuas (altura e peso).

i Nome Sexo Altura Peso


1 Alfredo Masculino 1,75 51,03
2 Paulo Masculino 1,60 46,49
3 Jaime Masculino 1,52 38,33
4 Aida Feminino 1,50 45,13
5 Alcinda Feminino 1,43 34,93
Assim, este conjunto de dados é representada simbolicamente na tabela abaixo:

i A B X Y
1 a1 b1 x1 y1
2 a2 b2 x2 y2
3 a3 b3 x3 y3
4 a4 b4 x4 y4

Autor: Rosângelo Paúnde Página 9


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

5 a5 b5 x5 y5

Exercícios de consolidação da primeira unidade:

1. População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer;
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de individuo de um mesmo município, distrito ou país;
2. Uma parte da população retirada para analisá-la denomina-se:
a) Universo;
b) Parte;
c) Pedaço;
d) Dados Brutos;
e) Amostra;
3. A parte da estatística que se preocupa somente com a descrição de determinadas
características de um grupo, sem tirar conclusões sobre um grupo maior, denomina-se:
a) Estatística da população;
b) Estatística de amostra;
c) Estatística inferencial;
d) Estatística descritiva;
e) Estatística grupal;
4. Diga qual das variáveis estamos trabalhando nos casos abaixo:
a) Número de inscrições no seguro social;
b) Número de passageiros no minibus da via Massinga-Maxixe;
c) Peso médio dos recém-nascidos no Hospital Provincial de Inhambane;
d) Escolaridade;
e) Altitude acima do nível do mar;

Autor: Rosângelo Paúnde Página 10


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

f) Uma pesquisa efectuada com 1000 pessoas, indica que 40 delas são assinantes de um
serviço de computador online;
5. Classifique as seguintes variáveis:
5.1 Cor dos olhos
a) Qualitativa nominal;
b) Qualitativo ordinal;
c) Qualitativa discreta;
d) Quantitativa contínua;
e) Quantitativa discreta;
f) Qualitativa contínua;
5.2 Número de filhos de um casal:
a) Qualitativa nominal;
b) Qualitativo ordinal;
c) Qualitativa discreta;
d) Quantitativa contínua;
e) Quantitativa discreta;
f) Qualitativa contínua;
5.3 Peso de um indivíduo:
a) Qualitativa nominal;
b) Qualitativo ordinal;
c) Qualitativa discreta;
d) Quantitativa contínua;
e) Quantitativa discreta;
f) Qualitativa contínua;
5.4 Altura de um individuo:
g) Qualitativa nominal;
h) Qualitativo ordinal;
i) Qualitativa discreta;
j) Quantitativa contínua;
k) Quantitativa discreta;
l) Qualitativa contínua;

Autor: Rosângelo Paúnde Página 11


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

5.5 Número de alunos de uma escola:


m) Qualitativa nominal;
n) Qualitativo ordinal;
o) Qualitativa discreta;
p) Quantitativa contínua;
q) Quantitativa discreta;
r) Qualitativa contínua;
5.6 Grupo sanguíneo:
s) Qualitativa nominal;
t) Qualitativo ordinal;
u) Qualitativa discreta;
v) Quantitativa contínua;
w) Quantitativa discreta;
x) Qualitativa contínua;
6. Nos grupos já formados na turma, façam um trabalho de pesquisa sobre o tema
“Amostra: tipos de amostras”, sem se esquecer de trazer nos respectivos textos
exemplos clarificadores dos diferentes tipos de amostras. Prazo de submissão dos
trabalhos: 05/05/2021, no seguinte endereço electrónico: rosangeloariosa@gmail.com

CONTEÚDOS DA UNIDADE 02: ESTATÍSTICA DESCRITIVA

 Introdução;
 Apresentação de Dados: Tabelas e Gráficos;
 Distribuição de Frequências: Tabelas de Classificação Simples;

Autor: Rosângelo Paúnde Página 12


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

INTRODUÇÃO

Como vimos na aula anterior, uma amostra é um subconjunto de uma população,


necessariamente finita, pois todos os seus elementos são examinados para efeito da realização
do estudo estatístico desejado. Assim, é intuitivo que, quanto maior a amostra, mais precisas e
confiáveis devem ser as induções realizadas sobre a população. Não obstante, pode-se concluir
que, os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população, ao
qual denomina-se Censo ou Recenseamento. Mas essa conclusão, na prática, muitas vezes não
se verifica. O emprego de amostras pode ser feito de tal modo que se obtenham resultados
confiáveis.

Ocorre, porém, que diversas razões levam, em geral, à necessidade de recorrer-se apenas
aos elementos de uma amostra. Entre elas, podemos citar o custo do levantamento de dados e o
tempo necessário para realizá-lo, especialmente se a população for muito grande.

O método científico, quando aplicado para solução de um problema científico,


frequentemente gera dados em grande quantidade e de grande complexidade. Desse modo, a
análise da massa de dados individuais, na maioria das vezes, não revela a informação subjacente,
gerando a necessidade de algum tipo de condensação ou resumo dos dados.

Segundo PIANA, MACHADO & SELAU, (2009, p.14), conceituam a Estatística


Descritiva, como sendo a parte da Estatística que desenvolve e disponibiliza métodos para
resumo e apresentação de dados estatísticos com o objectivo de facilitar a compreensão e a
utilização da informação ali contida.

Outrossim, a Estatística Descritiva, tem por finalidade a utilização de tabelas, gráficos,


diagramas, distribuições de frequências e medidas descritivas para:

 Examinar o formato geral da distribuição dos dados;


 Verificar a ocorrência de valores atípicos;
 Identificar valores típicos que informem sobre o centro da distribuição e;
 Verificar o grau de variação presente nos dados.

Nesta ordem de ideias, a Estatística Descritiva tem como objectivo, resumir as principais
características de um conjunto de dados por meio de tabelas, gráficos e resumos numéricos.
Autor: Rosângelo Paúnde Página 13
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Assim sendo, a análise estatística deve ser extremamente cuidadosa ao escolher a forma
adequada de resumir os dados.

Tabela 3: Principais Técnicas da Estatística Descritiva:

Principais Técnicas Descrição


Tabelas de Frequência Apropriada para resumir um grande conjunto de dados, agrupando
informações em categorias. As classes que compõem a tabela
podem ser categorias pontuais ou por intervalos.

Gráficos Possibilita uma visualização das principais características da


amostra. Alguns exemplos de gráficos são: diagrama de barras,
diagrama de sectores, histograma, diagrama de dispersão, box-plot.

Medidas Descritivas Por meio de medidas ou resumos numéricos podemos levantar


importantes informações sobre o conjunto de dados, tais como a
tendência central, a variabilidade, simetria, valores extremos,
valores discrepantes, etc.

Fonte: Retirado de GUIMARÃES (2007, p.26).

Assim, um dos objectivos da estatística é sintetizar os valores que uma ou mais variáveis
podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. Isso
se consegue, apresentando esses valores em tabelas e gráficos, que fornecem rápidas e seguras
informações a respeito das variáveis.

APRESENTAÇÃO DE DADOS: Tabelas e Gráficos

TABELAS

A tabela é a forma não discursiva de apresentar informações, das quais o dado numérico
se destaca como informação central. Sua finalidade é apresentar os dados de modo ordenado,
simples e de fácil interpretação, fornecendo o máximo de informação num mínimo de espaço.
Autor: Rosângelo Paúnde Página 14
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Por conseguinte, a construção de uma tabela, deve obedecer a uma série de normas
técnicas. Estas normas, tem como objectivo orientar a apresentação racional e uniforme de dados
estatísticos na forma tabular. A seguir veja algumas das principais normas e recomendações para
a construção de uma tabela de dados:

1. Elementos da Tabela:

Uma tabela estatística é composta de elementos essenciais e elementos


complementares.

Os elementos essenciais são:

 Título: é a indicação que precede a tabela contendo a designação do facto observado, o


local e a época em que foi estudado;
 Corpo: é o conjunto de linhas e colunas onde estão inseridos os dados;
 Cabeçalho: é a parte superior da tabela que indica o conteúdo das colunas;
 Coluna Indicatória: é a parte da tabela que indica o conteúdo das linhas.

Os elementos complementares são:

 Fonte: é entidade que fornece os dados ou elabora a tabela;


 Notas: são as informações de natureza geral, destinadas a esclarecer o conteúdo das
tabelas;
 Chamadas: são as informações especificas destinadas a esclarecer ou conceituar dados
numa parte da tabela. Estas, deverão estar indicadas no corpo da tabela, em números
arábicos entre parênteses, à esquerda nas casas e à direita na coluna indicatória.

Nota: os elementos complementares devem situar-se no rodapé da tabela, na mesma


ordem em que foram descritos.

2. Número da Tabela:

Uma tabela deve ter número para identifica-la sempre que o documento apresentar uma
ou mais tabelas, permitindo, assim, a sua localização. A identificação da tabela deve ser feita em
números arábicos, de modo crescente, precedidos da palavra “Tabela”, podendo ou não ser
subordinada a capítulos ou secções de um documento. Exemplos: Tabela 1, Tabela 10.2, …, etc.
Autor: Rosângelo Paúnde Página 15
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

3. Apresentação de Dados Numéricos:

Toda a tabela deve ter dado numérico para informar a quantificação de um facto
especifico observado, o qual deve ser apresentado em números arábicos.

A parte inteira dos dados numéricos deve ser separada por pontos ou espaços de três em
três algarismos, da direita para a esquerda, por exemplo: 12.243.527 ou 12 243 527. A separação
da parte inteira da decimal deve ser feita por virgula, por exemplo: 25,67.

No sistema inglês, a separação da parte inteira é feita por virgula e, a separação da parte
inteira decimal é feita por ponto, ou seja, é o inverso do sistema moçambicano, do brasileiro, e
do português, …, etc.

4. Sinais Convencionais:

Sempre que um dado numérico não puder ser apresentado, o mesmo deve ser substituído
por um sinal convencional. A substituição de um dado numérico deve ser feita por um dos sinais
abaixo, conforme o caso:

4.1 – (Traço): indica dado numérico igual a zero não resultante de arredondamento;
4.2 .. (dois pontos): indica que não se aplica dado numérico;
4.3 … (três pontos): indica dado numérico não disponível;
4.4 x (xis): indica dado numérico omitido a fim de evitar a individualização da informação;
4.5 0, 0,0 ou 0,00 (zero): quando o valor é muito pequeno para ser expresso pela unidade
utilizada ou quando indica dado numérico igual a zero resultante de arredondamento;
4.6 ? (interrogação): quando há duvida sobre a veracidade/exactidão da informação/valor.

Quando uma tabela contiver sinais convencionais, estes deverão ser apresentados em nota
geral com seus respectivos significados.

5. Arredondamento:

Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o


último algarismo a permanecer. Exemplo: 48,23 = 48,2.

Autor: Rosângelo Paúnde Página 16


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, aumenta-se de uma


unidade o último algarismo a permanecer. Exemplo: 23,87 = 23,9.

6. Unidade de Medida:

Uma tabela deve ter unidade de medida inscrita no cabeçalho ou nas colunas indicadoras,
sempre que houver necessidade de se indicar, complementarmente ao titulo, a expressão
quantitativa ou metrológica a dos dados numéricos.

Esta indicação deve ser feita com símbolos ou palavras, entre parênteses. Exemplos: (m)
ou (metros), (t) ou (toneladas), (Mt) ou (meticais), (€) ou (euro), (¥) ou (yen), (£) ou (libra), ($)
ou (dólar americano), (R$) ou (reais), (%) ou (percentual), …, etc.

7. Classe de Frequência:

A classe de frequência é cada um dos intervalos não superiores em que se divide uma
distribuição de frequências. Toda classe deve ser apresentada, sem ambiguidade, por extenso ou
com notação.

Toda a classe que inclui o Extremo Inferior do intervalo (EI) e exclui o Extremo Superior
(ES), deve ser apresentada de uma destas duas formas: EI |― ES ou [EI; ES).

8. Apresentação de Tempo:

Toda a série histórica consecutiva deve ser apresentada por seus pontos inicial e final,
ligados por hífen (-). Exemplos: 1892 – 912: quando varia o século; 1960 – 65: quando variam
os anos dentro do século; out 1991 – mar 1992: quando variam os meses dentro de anos.

9. Apresentação da Tabela
 O corpo da tabela deve ser delimitado, no mínimo, por três traços horizontais;
 Recomenda-se não delimitar as tabelas à direita e à esquerda por traços verticais. É
facultativo o uso de traços verticais para a separação de colunas no corpo da tabela;

Autor: Rosângelo Paúnde Página 17


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

 Quando, por excessiva altura, a tabela tiver que ocupar mais de uma página, não deve ser
delimitada inferiormente, repetindo-se o cabeçalho na página seguinte. Deve-se usar no
alto do cabeçalho a palavra “continuação” ou “conclusão”, conforme o caso.
 Se possuir muitas linhas e poucas colunas, poderá ser apresentada em duas ou mais partes
dispostas lado a lado e separadas por traço duplo;
 A disposição da tabela deve estar na posição normal de leitura. Caso isso não seja
possível, a apresentação será feita de forma que a rotação da página seja no sentido
horário.

Exemplo:

Tabela 4: Total de estabelecimentos, pessoal ocupado e valor da produção das indústrias


hoteleiras, nas Províncias da zona Sul de Moçambique, 2020.

Províncias Total de Pessoal Ocupado (1) Valor da Produção


Estabelecimentos (2)

(1.000 Mt)
Maputo 25 x 21.585
Gaza 31 1.710 6.495
Inhambane 107 - 954.258
Total da Zona Sul 163 1.710 982.338
Fonte: Instituto Nacional do Turismo (INATUR): 2020.

Nota: Sinais convencionais utilizados:

x: dado numérico omitido a fim de evitar a individualização da informação;

- : dado numérico igual a zero não resultante de arredondamento;

: em 31 de dezembro de 2020;
(1)

: inclui valores prestados a terceiros;


(2)

GRÁFICOS

Autor: Rosângelo Paúnde Página 18


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Outro modo de apresentar dados estatísticos é sob a forma ilustrada, comumente chamada
de gráfico. Os gráficos constituem-se numa das mais eficientes formas de apresentação de dados.

Um gráfico é, essencialmente, uma figura construída a partir de uma tabela, mas,


enquanto a tabela fornece uma ideia mais precisa e possibilita uma inspecção mais rigorosa aos
dados, o gráfico é mais indicado para situações que visem proporcionar uma impressão mais
rápida e maior facilidade de compreensão do comportamento do fenómeno em estudo.

Os gráficos e as tabelas se prestam, portanto, a objectivos distintos, de modo que a


utilização de uma forma de apresentação não exclui a outra.

REGRAS GERAIS A OBSERVAR PARA A CONFECÇÃO DE UM GRÁFICO

1. Normas para a representação gráfica:


 Os gráficos, geralmente, são construídos num sistema de eixos chamado Sistema
Cartesiano Ortogonal (SCO). A variável independente é localizada no eixo horizontal
(abcissas), enquanto que a variável dependente é colocada no eixo vertical (ordenadas).
No eixo vertical, o inicio da escala deverá ser sempre zero, ponto de encontro dos eixos;
 Iguais intervalos para as medidas deverão corresponder a iguais intervalos para as
escalas;
 O gráfico deverá possuir título, fonte, notas e legenda, ou seja, toda a informação
necessária à sua compreensão, sem auxílio do texto;
 O gráfico deverá possuir formato aproximadamente quadrado para evitar que problemas
de escalas interfiram na sua correcta interpretação.
2. Tipos de Gráficos:

Podemos considerar quatro tipos principais de representação gráfica:

2.1 Estereogramas: são gráficos onde as grandezas são representadas por volumes.
Geralmente são construídos num sistema de eixos bidimensional, mas podem ser
construídos num sistema tridimensional para ilustrar a relação entre três variáveis.
2.2 Cartogramas: são representações em cartas geográficas (mapas);

Autor: Rosângelo Paúnde Página 19


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

2.3 Pictogramas ou Gráficos Pictóricos: são gráficos puramente ilustrativos, construídos de


modo a ter grande apelo visual, dirigidos a um público muito grande e heterogéneo. Não
devem ser utilizados em situações que exijam maior precisão.
2.4 Diagramas: são gráficos geométricos de duas dimensões, de fácil elaboração e grande
utilização. Podem ser ainda subdivididos em: gráficos de colunas, gráficos de barras,
gráficos de linhas ou curvas e gráficos de sectores.
2.4.1 Gráfico de Colunas: neste gráfico as grandezas são comparadas através de
rectângulos da mesma largura, dispostos verticalmente e com alturas proporcionais às
grandezas. A distancia entre os rectângulos deve ser, no mínimo, igual a 1/2 e, no
máximo, 2/3 da largura da base dos mesmos.
2.4.2 Gráfico de Barras: segue as mesmas instruções que o gráfico de colunas, tendo a
única diferença que os rectângulos são dispostos horizontalmente. É usado quando as
inscrições dos rectângulos forem maiores que a base dos mesmos.
2.4.3 Gráfico de Linhas ou Curvas: neste gráfico os pontos são dispostos no plano de
acordo com as suas características, e a seguir são ligados por segmentos de recta. É
muito utilizado em séries históricas e em séries mistas quando um dos factores de
variação é o tempo, como instrumento de comparação.
2.4.4 Gráfico em Sectores: é recomendado para situações em que se deseja evidenciar o
quanto cada informação representa do total. A figura consiste num círculo onde o
total (100%) representa 360°, subdividido em tantas partes quanto for necessário à
representação. Essa divisão se faz por meio de uma regra de três simples. Com o
auxilio de um transferidor, efectua-se a marcação dos ângulos correspondentes a cada
divisão.

NOTA: os gráficos do tipo diagramas são os mais usuais na disciplina de Estatística


assim como no quotidiano e, para a sua construção e esclarecimentos, cada estudante a título
individual e ou em grupo poderá desenvolver uma pesquisa.

Autor: Rosângelo Paúnde Página 20


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

DISTRIBUIÇÃO DE FREQUÊNCIAS: Tabelas de Classificação Simples

Um grande número de dados necessita de uma forma eficiente de sumarização. Uma das
formas mais comuns de resumir e apresentar dados é através de tabelas de distribuição de
frequências. Estas tabelas podem ser de dois tipos: de classificação simples ou de classificação
cruzada. Entretanto, para esta disciplina e, neste curso especifico, veremos somente as tabelas
de classificação simples.

Tabelas de Classificação Simples

As tabelas de classificação simples, são tabelas de frequências relativas a uma variável.


As características dessas tabelas variam de acordo com o tipo de variável em estudo. Se a
variável é do tipo categórica, então são obtidas as frequências de ocorrência de cada nível
dessa variável. Se a variável é do tipo numérica contínua, primeiro são obtidos intervalos de
mesma amplitude e depois contados os valores que ocorrem em cada intervalo.

Distribuição de Frequências de Variáveis Categóricas ou Numéricas Discretas

Quando a variável em estudo for categórica ou, em alguns casos numérica discreta, a
tabela de distribuição de frequências apresentará a seguinte característica: cada valor da variável
constituirá uma classe.

Construção da Tabela:

A construção da tabela de distribuição de frequência para variáveis categóricas


(qualitativas) ou numéricas discretas envolve apenas dois passos bastante simples:

1° Passo: ordenar os níveis do factor, ou seja, colocá-los em ordem de grandeza (rol).


Cada nível constituirá uma classe. O número de cada classe da distribuição será representado por
j, tal que j = 1, 2, 3, …, k;

2° Passo: contar o número de elementos em cada classe, ou seja, contar quantas vezes o
dado está repetido.

Autor: Rosângelo Paúnde Página 21


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

A seguir, veremos por meio de exemplos, como construir uma tabela de distribuição de
frequências para os dados de uma variável categórica (Exemplo: 1) e de uma variável
numérica discreta (Exemplo: 2).

Exemplo 1:

Seja a variável em estudo o conceito obtido por 60 estudantes na disciplina de Estatística,


na Universidade Save, Extensão de Maxixe para o ano de 2020, para o qual os dados observados
foram os seguintes:

ruim, médio, bom, médio, ruim, médio, ruim, médio, ruim, bom, médio, médio, bom,
médio, médio, médio, óptimo, médio, bom, óptimo, bom, óptimo, médio, óptimo, médio,
ruim, médio, óptimo, médio, médio, bom, ruim, bom, bom, médio, ruim, médio, médio,
óptimo, médio, bom, ruim, ruim, bom, médio, médio, ruim, bom, médio, médio, bom, bom,
bom, médio, ruim, bom, médio, médio, ruim, médio.

Podemos observar que esta variável categórica ou qualitativa ordinal apresenta quatro
níveis (ruim, médio, bom e óptimo). Como cada nível deve constituir uma classe da
distribuição de frequências, já está determinado que o número total de classes (k) é quatro (4).
Assim, o primeiro passo é a ordenação (rol) dos níveis da variável. Assim teremos:

ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, ruim, médio, médio,
médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio,
médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio, médio,
médio, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom, bom,
óptimo, óptimo, óptimo, óptimo, óptimo, óptimo.

Número de Classe (j) Classe


1 Ruim
2 Médio
3 Bom
4 Óptimo

Autor: Rosângelo Paúnde Página 22


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

O passo a seguir é a contagem do número de estudantes em cada nível. Estes valores são
denotados por Fj e chamados de Frequências Absolutas das classes. A partir das Frequências
Absolutas, podemos obter outras frequências de interesse numa distribuição, tais como:

 Frequência Absoluta Acumulada na classe j, denotada por Facj, que expressa o número
de elementos (observações) acumuladas até a classe j;
 frequência relativa na classe j, denotada por fj, que expressa a proporção de elementos
(observações) na classe j;
 frequência relativa acumulada na classe j, denotada por facj, que expressa a proporção
de elementos (observações) acumuladas até a classe j.

NOTA: FÓRMULAS IMPORTANTES A CONSIDERAR

Frequência Absoluta(Fj)
frequênciarelativa(fj)= ;
dimensão da amostra

A soma das Frequências Absolutas é igual à dimensao da amostra e ;

A soma das frequências relativas é igual a1.

Facj(actual) = Facj (anterior) + Fj (actual);

facj(actual) = facj (anterior) + fj (actual);

Assim, as frequências obtidas são então apresentadas na forma tabular a seguir:

Tabela 5: Frequência do conceito obtido por estudante na disciplina de Estatística na UniSave,


Extensão de Maxixe, em 2020.

j Classe Fj Facj fj facj


1 Ruim 12 12 0,2 0,2
2 Médio 27 39 0,45 0,65
3 Bom 15 54 0,25 0,9
4 Óptimo 6 60 0,1 1
- ∑(somatório) 60 - 1 -
Fonte: elaborado pelo autor, com base nos dados do exercício.

Autor: Rosângelo Paúnde Página 23


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Exemplo 2:

As tabelas de distribuição de frequência de variáveis numéricas discretas são construídas


da mesma forma que as das variáveis categóricas. Consideremos agora que a variável em estudo
seja o número de animais portadores de brucelose em 350 propriedades rurais da Província de
Inhambane, em 2020. Os valores observados para esta variável foram:

2, 5, 6, 0, 4, 4, 3, 4, 2, 2, 3, 3, 5, 3, 5, 1, 2, 4, 2, 3, 5, 4, 3, 3, 2, 3, 0, 4, 4, 3, 4, 0, 3, 1, 2, 4, 2, …

Como cada valor da variável deve constituir uma classe e foram observados apenas sete
valores diferentes para esta variável, a tabela de distribuição de frequências terá sete classes.

Número de Classe (j) Classe


1 0
2 1
3 2
4 3
5 4
6 5
7 6

Através da contagem do número de vezes que cada valor apareceu, ou seja, do número de
observações em cada classe, obtemos as Frequências Absolutas (Fj), as frequências relativas (fj),
as Frequências Absolutas Acumuladas (Facj) e, as frequências relativas acumuladas (fac j),
apresentadas na tabela a seguir:

Tabela 6: Frequência do número de animais portadores de brucelose em 350 propriedades rurais


da Província de Inhambane em 2020.

j Classe Fj Facj fj facj


1 0 55 55 0,1571 0,1571
2 1 60 115 0,1714 0,3285
3 2 112 227 0,32 0,6485

Autor: Rosângelo Paúnde Página 24


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

4 3 82 309 0,2343 0,8828


5 4 31 340 0,0886 0,9714
6 5 8 348 0,0229 0,9943
7 6 2 350 0,0057 1
- ∑(somatório) 350 - 1 -
Fonte: elaborado pelo autor com base nos dados do exemplo 2.

Devemos observar, ainda, que tão importante quanto saber construir uma tabela é saber
interpretar os seus valores. Vejamos, como exemplo, o significado de alguns valores da tabela:

F4 = 82 ― significa que, das 350 propriedades rurais consultadas, 82 possuem 3 animais


portadores de brucelose;

Fac3 = 227 ― significa que, das 350 propriedades rurais consultadas, 227 possuem menos
de 3 animais portadores de brucelose;

f2 = 0,1714 ― significa que a proporção de propriedades rurais que possuem apenas 1


animal portador de brucelose é de 0,1714, ou seja, em percentagem é de 17,14%;

fac5 = 0,9714 ― significa que a proporção de propriedades rurais que possuem menos de
4 animais portadores de brucelose é de 0,9714, ou seja, em percentual é de 97,14%.

DISTRIBUIÇÃO DE FREQUÊNCIAS DE VARIÁVEIS NUMÉRICAS CONTÍNUAS

Ao contrário das variáveis discretas, as variáveis contínuas assumem, em geral, muitos


valores e, em sua grande maioria, diferentes uns dos outros. Assim, para contornar problemas
desse tipo, as tabelas de distribuição de frequência para variáveis contínuas são construídas
de modo que cada classe seja constituída por um intervalo de valores da variável.

Devemos observar, no entanto, que em algumas situações uma variável discreta também
poderá assumir tantos valores diferentes que a construção de uma tabela onde cada valor
constitui uma classe seja impraticável. Ou seja, pode ocorrer que ela tenha tantas linhas que a sua
construção pouco auxilie na descrição resumida dos dados. Assim, nesses casos, por uma questão

Autor: Rosângelo Paúnde Página 25


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

de simplificação, é usual agrupar os dados discretos em intervalos de classe, da mesma forma


que se agrupam os dados contínuos.

Construção da Tabela

O processo de construção da tabela de distribuição de frequência para variáveis


numéricas segue os seguintes passos:

1° Passo: ordenar o conjunto de dados, ou seja, colocar os dados brutos em ordem


crescente de grandeza (rol);

2° Passo: determinar o número de classes da tabela. De modo geral, este valor não deverá
ser inferior a 5 e nem superior a 15. Assim, a definição do número de classes deverá ser
orientada pelos objectivos do trabalho, mas existem algumas regras objectivas de determinação,
como por exemplo, a fórmula de Sturges:

k = 1 + 3, 32 x log n;

ou

k =√ n ;

Onde:

k = número de classes;

n = número de observações;

log = logaritmo de base 10.

3° Passo: determinar a amplitude do intervalo. Para tal, podemos utilizar a seguinte


expressão:

at
i=
k

Onde:

i = amplitude do intervalo da classe;

Autor: Rosângelo Paúnde Página 26


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

at = ES - EI: amplitude total do conjunto de valores;

k = número de classes.

NOTA: convencionamos, também, que o arredondamento do número de classes (k) ou


na amplitude do intervalo (i) é sempre feito para cima (por excesso).

4° Passo: construir os intervalos de classe. O Limite/Extremo Inferior (EI) da primeira


classe será sempre o menor valor do conjunto de dados (x 1) e o Limite/Extremo Superior (ES)
será o Limite/Extremo Inferior (EI) acrescido do valor da amplitude do intervalo da classe (i).

Na sequência, o Limite/Extremo Inferior (EI) da segunda classe, será o Limite/Extremo


Superior (ES) da primeira classe e o Limite/Extremo Superior (ES) da segunda classe, será este
Limite/Extremo Inferior (EI), acrescido da amplitude do intervalo da classe (i).

Assim, para todas as classes subsequentes, os intervalos deverão ser construídos da


mesma forma que a segunda.

Número de Classe (j) Classes


1 x1|― x1+i
2 x1+ i|― x1+2i
3 x1+2i |―x1+3i
… …
k x1+(k-1)i |―x1+ki

Nota-se assim que, a amplitude do intervalo é constante para todas as classes. O intervalo
fechado à esquerda e aberto à direita, representado pelo sinal |―, garante a não superposição
de classes.

Exemplo 3:

Tomemos a seguinte variável: X = peso ao nascer em kg de 60 bovinos machos na


Província de Inhambane em 2020, para a qual os valores observados (e já ordenados, ou seja, já
feitos o rol), foram:

Autor: Rosângelo Paúnde Página 27


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 23, 23, 23,23, 23, 23, 23, 25,
25, 25, 25, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 31, 32,
33, 33, 33, 34, 34, 35, 36, 39.

Sendo o peso uma variável contínua cujos os valores poderiam ser todos diferentes entre
si, não podemos considerar cada valor como sendo uma classe, de modo que não podemos saber
de antemão o número de classes da distribuição de frequência (j). Este valor deverá ser
determinado e, para isso, usaremos a fórmula de Sturges. Para n = 60, teremos:

k = 1 + 3,32 x log n k = 1 + 3,32 x log60 k = 1 + 3,32 x 1,778 k = 1 + 5,903;

k = 6,9.

Como o número de classes tem que ser um número inteiro, teremos que arredondar o
valor 6,9. Usaremos como regra o arredondamento para cima (por excesso). Deste modo, o
número de classes será k = 7.

Uma vez determinado o valor de “k”, temos que obter a amplitude dos intervalos (i), mas
antes temos que determinar a amplitude total do conjunto de valores (at).

at = ES – EI at = 39 – 16 at = 23.

at 23
i= ;i= ; i=3,2857
k 7

Por uma questão de practicidade, vamos arredondar o valor da amplitude do intervalo (i)
para uma casa decimal, lembrando que o arredondamento, também neste caso, deverá ser sempre
para cima (por excesso). Assim, teremos i = 3,3.

O próximo passo é a construção dos intervalos de classe. Tomamos como


Limite/Extremo Inferior (EI) da primeira classe o menor valor do conjunto de dados x1 = 16.
Somando o 16 ao valor da amplitude do intervalo i = 3,3, obtemos o Limite/Extremo Superior
(ES) deste intervalo. Todos os demais intervalos são construídos considerando como
Limite/Extremo Inferior (EI), o Limite/Extremo Superior (ES) do intervalo de classe que o
precede e, como Limite/Extremo Superior (ES) a soma do Limite/Extremo Inferior (EI) com o
valor da amplitude do intervalo i = 3,3. Assim, teremos:

Autor: Rosângelo Paúnde Página 28


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Número de Classe (j) Classes


1 16|― 19,3
2 19,3|― 22,6
3 22,6 |― 25,9
4 25,9|― 29,2
5 29,2|―32,5
6 32,5|―35,8
7 35,8 |―|39,1

Portanto, para a obtenção das Frequências Absolutas (Fj) das classes, contamos quantos
valores (observações) do conjunto de dados pertencem a cada intervalo. As demais frequências
(Facj, fj, facj), como já vimos anteriormente, derivam da Frequência Absoluta (Fj).

Em distribuições de frequências de variáveis contínuas, geralmente existe interesse em


uma outra quantidade conhecida como Ponto Médio ou Centro de Classe, denotada por cj. Os
centros de classe (cj) são calculados da seguinte forma:

EIj+ ESj
cj=
2

Onde:

cj: Ponto Médio ou Centro de Classes;

EIj: Limite/Extremo Inferior da classe j;

ESj: Limite/Extremo Superior da classe j.

Assim sendo, para o exemplo em causa, teremos:

EIj+ ESj 16 +19,3 35,3


cj= ; c 1= ; c 1= ;c 1=17,65.
2 2 2

Autor: Rosângelo Paúnde Página 29


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

EIj+ ESj 19,3+ 22,6 41,9


cj= ; c 2= ;c 2= ; c 2=20,95.
2 2 2

EIj+ ESj 35,8+39,1 74,9


cj= ; c 7= ;c 7= ; c 1=37,45.
2 2 2

A seguir, apresentamos a tabela de frequências completa:

Tabela 6: Frequência de peso ao nascer em kg de 60 bovinos machos na Província de Inhambane


em 2020

J Classes Fj Facj fj facj cj


1 16|― 19,3 7 7 0,1167 0,1167 17,65
2 19,3|― 22,6 9 16 0,15 0,2667 20,95
3 22,6 |― 25,9 15 31 0,25 0,5167 24,25
4 25,9|― 29,2 12 43 0,2 0,7167 27,55
5 29,2|―32,5 9 52 0,15 0,8667 30,85
6 32,5|―35,8 6 58 0,1 0,9667 34,15
7 35,8 |―|39,1 2 60 0,0333 1 37,45
∑(somatório) 60 - 1 - -
Fonte: elaborado pelo autor com base nos dados do exemplo 3.

A interpretação das frequências da tabela é exemplificada através de alguns valores a


saber:

F3 = 15 ― significa que 15 dos 60 bovinos machos nasceram com peso entre 22,6 e 25,9
kg, este último valor não incluso;

Fac5 = 52 ― significa que 52 dos 60 bovinos machos nasceram com peso entre 16 e 32,5
kg, este último valor não incluso;

f2 = 0,15 ― significa que a proporção de bovinos machos que nasceram com peso entre
16 e 22,6 kg, este último valor não incluso é de 0,15 ou seja, em percentual é de 15%;

Autor: Rosângelo Paúnde Página 30


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

fac6 = 0,9667 ― significa que a proporção de bovinos machos que nasceram com peso
entre 16 a 35,8 kg, este último valor não incluso é de 0,9667 ou seja, em percentual é de 96,67%.

Exercícios de Consolidação da Unidade:

1. Os dados a seguir se referem aos números de pães não vendidos em uma certa padaria
até a hora do encerramento do expediente:

0 0 4 2 0 1 0 2 0 4

1 0 0 3 2 0 1 0 0 0

2 0 0 1 0 0 3 2 1 7

0 1 0 0 2 0 0 3 2 1

a) construa a distribuição de frequências para esses dados.

2. Os dados em rol (ordenação horizontal) abaixo se referem aos valores gastos (em
meticais) pelas primeiras 50 pessoas que entraram em um determinado supermercado, na cidade
de Maxixe em 01/01/2020.

3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39

18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47

24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37

38,64 38,98 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65

50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34

a) Faça a distribuição de frequências desses dados.

Autor: Rosângelo Paúnde Página 31


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

CONTEÚDOS DA UNIDADE 03: MEDIDAS DESCRITIVAS

 Medidas de Localização, Posição ou Tendência Central: Média Aritmética, Moda e


Mediana;
 Medidas Separatrizes: Quartis, Decis e Percentis;

Introdução

As medidas descritivas têm o objectivo de reduzir um conjunto de dados observados


(números) a um pequeno grupo de valores que deve fornecer toda a informação relevante a
respeito desses dados. Estas medidas são funções dos valores observados e podem ser
classificadas em quatro grupos: Medidas de Localização, Medidas Separatrizes, Medidas de
Variação e Medidas de Formato.

Medidas de Localização

Também designadas por medidas de tendência central ou medidas de posição, indicam


um ponto central onde, em muitas situações importantes, está localizada a maioria das
observações.

Medidas Separatrizes

Indicam limites para proporções de observações em um conjunto, podendo ser utilizados


para construir medidas de dispersão.

Medidas de Variação

Também denominadas por medidas de dispersão, informam sobre a variabilidade dos


dados.

Medidas de Formato

Informam sobre o modo como os valores se distribuem. As mesmas, compreendem as


Medidas de Assimetria, que indicam se a maior proporção de valores está no centro ou nas
extremidades e, as Medidas de Curtose, que descrevem o grau de achatamento da distribuição.

Autor: Rosângelo Paúnde Página 32


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Em suma, existe uma enorme variedade de medidas descritivas muitas delas que
concorrem entre si. Mas, para a escolha da medida mais adequada para o uso em um determinado
tipo de análise, pode-se recorrer as seguintes questões básicas:

 Com que objectivo a medida está sendo obtida?


 A medida é fácil de interpretar? É intuitiva?
 Existem valores atípicos que podem afectá-la exageradamente?
 O propósito da análise é meramente descritivo ou planeia-se fazer inferência?

Estas questões devem ser respondidas, na medida em que, uma medida descritiva deve
sempre que possível, possuir as seguintes características: ser interpretativa, ser de fácil
interpretação e prestar-se a tratamento matemático e/ou estatístico em etapas posteriores.

MEDIDAS DE LOCALIZAÇÃO OU DE POSIÇÃO, OU DE TENDÊNCIA CENTRAL

As medidas de localização, posição ou tendência central têm o objectivo de representar o


ponto de equilíbrio ou o centro de uma distribuição. Em muitos casos, podem ser considerados
valores típicos ou representativos do conjunto.

Portanto, as medidas mais utilizadas são a Média Aritmética, a Mediana e a Moda,


embora outras também possam ser úteis em algumas situações, como a Média Ponderada, a
Média Geométrica e a Média Harmónica, estas últimas que não são o objectivo fundamental
desta unidade.

MÉDIA ARITMÉTICA ( X )

A média aritmética, pela sua facilidade de cálculo e de compreensão aliada às suas


propriedades matemáticas, é a medida de localização mais conhecida e utilizada.

PASSOS PARA A SUA DETERMINAÇÃO:

1ª SITUAÇÃO: Dados Não Agrupados.

Sejam os elementos x1, x2, x3, …, xn de uma amostra, portanto “n” valores de uma
variável “X”. Assim, a média aritmética da variável aleatória de X é definida por:

Autor: Rosângelo Paúnde Página 33


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

∑ Xi
X = i =1
n

Onde:

X : Média Aritmética;

Xi: Elementos da Variável “X”.

n = Número Total de Elementos;

Exemplo:

Suponha um conjunto de tempo de serviço (em anos) de cinco funcionários: 3; 7; 8; 10 e


11. Determinar a média aritmética simples deste conjunto de dados.

∑ Xi 3+7+8+10+11 39 X =7.8
X = i =1 ↔X= ↔X= ↔
n 5 5

Interpretação:

O tempo médio de serviço deste grupo de funcionários é de 7,8 anos,

2ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Valores Simples.

Quando os dados estiverem agrupados numa distribuição de frequência de dados simples,


a média aritmética será a ponderação (multiplicação) dos valores x1, x2, x3, …, xn pelas
respectivas Frequências Absolutas (Fi): F1, F2, F3, …, Fn. Assim teremos:

∑ Xi × Fi
i=1
X=
n

Onde:

X : Média Aritmética;

Xi: Elementos da Variável “X”.


Autor: Rosângelo Paúnde Página 34
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Fi: Frequências Absolutas.

n = Número Total de Elementos;

Exemplo:

Em um determinado dia foi registado o número de veículos negociados por uma amostra
de 10 vendedores de uma agencia de automóveis obtendo a seguinte tabela:

Veículos Número de
Negociados Vendedores Xi x F i
(Xi) (Fi)
1 1 1
2 3 6
3 5 15
4 1 4
Total 10 26

Portanto:

∑ Xi × Fi [ ( 1 ×1 ) + ( 2× 3 ) + ( 3 ×5 ) + ( 4 ×1 ) ] 1+6 +15+4 26
i=1
X= ↔ X= ↔ X= ↔ X= ↔ X=2,6
n 10 10 10

Interpretação:

Em média, cada vendedor negociou 2,6 veículos.

3ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Classes.

Quando os dados estiverem agrupados numa distribuição de frequência, para o cálculo da


média aritmética, usaremos os centros de classes (C j), ou seja, os pontos médios (Xi) dos valores
x1, x2, x3, …, xn de cada classe, ponderados pelas respectivas Frequências Absolutas (Fi): F1, F2,
F3, …, Fn. Neste caso, Cj = Xi (Centros de Classes é igual ao Ponto Médio de cada Classe).

Autor: Rosângelo Paúnde Página 35


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Exemplo:

A tabela abaixo representa as pontuações obtidas por um grupo de 58 alunos matriculados na


disciplina de Introdução à Estatística:

Pontuações em Alunos
Classes Fi Xi Xi x Fi
35|― 45 5 40 200
45|― 55 12 50 600
55|― 65 18 60 1.080
65|― 75 14 70 980
75|― 85 6 80 480
85|― 95 3 90 270
∑(somatório) 58 - 3.610

1° Passo: Determinar o Ponto Médio das Classes (Xi = Cj):

EIj+ ESj 35+45 80


cj ↔ Xi= ; X 1= ; X 1= ; X 1=40.
2 2 2

EIj + ESj 45+55 100


cj ↔ Xi= ; X 2= ; X 2= ; X 2=50.
2 2 2

EIj+ ESj 85+ 95 180


cj ↔ Xi= ; X 6= ; X 6= ; X 6=90.
2 2 2

2° Passo: Determinar a Média Aritmética:

Autor: Rosângelo Paúnde Página 36


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

∑ Xi × Fi [ ( 40 × 5 ) + ( 12× 50 ) + ( 18× 60 ) + ( 14 ×70 )+ ( 6 ×80 ) +(3 ×90)] 200+ 600+ 1080+980+ 48


X = i=1 ↔ X= ↔ X=
n 58 58

Interpretação:

O desempenho médio deste grupo de alunos foi de 62,24 pontos na disciplina de


Introdução à Estatística.

MODA (Mo)

A Moda representada por (Mo), é o valor de maior ocorrência (mais frequente) num
conjunto de dados. É a única medida que pode não existir e, existindo, pode não ser única.

Entretanto, um conjunto de dados em relação à moda, pode ser:

Modal ou Unimodal, se apresentar uma e única moda, ou seja, o mesmo valor repetido
varias vezes no conjunto de dados em relação aos demais;

Bimodal, se apresentar duas modas, ou seja, se o conjunto de dados apresentar dois


valores que ocorrem (repete-se) o mesmo número de vezes e;

Amodal, se não apresentar moda, ou seja, não existe nenhum valor que se repete ou que
ocorre com mais frequência ou ainda, se todos os valores do conjunto ocorrerem com a mesma
frequência.

PASSOS PARA A SUA DETERMINAÇÃO:

1ª SITUAÇÃO: Dados Não Agrupados.

Sejam os elementos x1, x2, x3, …, xn de uma amostra, o valor da moda para este tipo de
conjunto de dados é simplesmente o valor com maior frequência.

Exemplo 1:

Suponha o conjunto de tempo de serviço em anos de cinco funcionários: 3, 7, 8, 8 e 11.


Determinar a moda deste conjunto de dados.

Mo = 8; Distribuição Modal ou Unimodal;

Autor: Rosângelo Paúnde Página 37


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Interpretação:

O tempo de serviço com maior frequência é de 8 anos.

Exemplo 2:

Suponha o conjunto de tempo de serviço em anos de cinco funcionários: 3, 3, 7, 8, 8 e 11.


Determinar a moda deste conjunto de dados.

Mo1 = 3

Mo2 = 8

Assim, este conjunto de dados, diz-se Bimodal.

Interpretação:

Os tempos de serviço com maior frequência foram de 3 e 8 anos.

Exemplo 3:

Suponha o conjunto de tempo de serviço em anos de cinco funcionários: 3, 7, 8, 10 e 11.


Determinar a moda deste conjunto de dados.

Não existe (Mo). Ou seja, é um conjunto Amodal.

Interpretação:

Não existe tempo de serviço com maior frequência.

Exemplo 4:

Suponha o conjunto de tempo de serviço em anos de oito funcionários: 1, 3, 4, 4, 5, 1, 3 e


5. Determinar a moda deste conjunto de dados.

Não existe (Mo). Ou seja, é um conjunto Amodal.

Interpretação:

Não existe tempo de serviço com maior frequência.

Autor: Rosângelo Paúnde Página 38


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

NOTA: é importante frisar que, para além de conjuntos de dados com duas modas - Bimodal,
também podemos encontrar conjuntos de dados com três modas – Trimodal e, conjunto de
dados com mais de três modas, que se denominam por conjunto Multimodal ou Polimodal.

2ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Valores Simples.

Para este tipo de distribuição, a identificação da moda é efectuada pela simples


observação do elemento que apresenta maior frequência.

Exemplo:

Em um determinado dia foi registado o número de veículos negociados por uma amostra
de 10 vendedores de uma agência de automóveis obtendo a seguinte tabela.

Veículos Número de
Negociados Vendedores
(Xi) (Fi)
1 1
2 3
3 5
4 1
Total 10

Portanto, como a maior Frequência Absoluta (F i) é Fi = 5, logo a Mo = 3. Ou seja, o


número de veículos comercializados no dia com maior frequência.

Interpretação:

A quantidade de veículos comercializados no dia com maior frequência foi de três


veículos.

Autor: Rosângelo Paúnde Página 39


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

3ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Classes.

Para dados agrupados em classe, temos diversas fórmulas para o calculo da moda. Assim
para esta disciplina, utilizaremos a fórmula de Czuber.

Procedimentos:

1° Passo: Identificar a classe modal (aquela que possui maior Frequência Absoluta) –
CLASSE(Mo);

2° Passo: Utilizar a seguinte fórmula:

∆1
Mo=EI + ×h ; em que: ∆1 = Fi – Fi anterior; ∆2 = Fi – Fi posterior;
∆ 1+ ∆ 2

Onde:

Mo: Moda;

EI: Extremo ou Limite Inferior da Classe Modal;

∆1/2: Variação das Frequências Absolutas em Relação à Frequência Absoluta da Classe Modal;

Fi: Frequência Absoluta da Classe Modal;

Fi anterior: Frequência Absoluta Anterior á Classe Modal;

Fi posterior: Frequência Absoluta Posterior á Classe Modal;

i ⟺ h: Amplitude da Classe Modal;

OUTRAS FÓRMULAS IMPORTANTES PARA RECORDAÇÃO:

at
i ⟺h=
k

a t=ES−EI

Autor: Rosângelo Paúnde Página 40


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

k =1+3,32× log n

Em que:

at: Amplitude Total do Conjunto de Valores;

k: Número de Classes da Distribuição de Frequências usando a Fórmula de Sturges;

ES: Extremo Superior do conjunto de dados observados, ou seja, o maior valor observado nos
dados;

EI: Extremo Inferior do conjunto de dados observados, ou seja, o menor valor observado nos
dados;

Exemplo:

A tabela abaixo representa a pontuação obtida por um grupo de 30 alunos matriculados


na disciplina de Introdução à Estatística.

Pontuações em Alunos
Classes Fi
21|― 24 8
24|― 27 9
27|― 30 1
30|― 33 4
33|― 36 7
36|― 39 1
∑(somatório) 30

1° PASSO: Identificar a classe modal (aquela que possui maior Frequência Absoluta) –
CLASSE(Mo);

CLASSE(Mo) = 24|― 27;

2° PASSO: Determinar a Moda.

Autor: Rosângelo Paúnde Página 41


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

∆1 1
Mo=EI + ×h ⇛ Mo=24 + ×3 ⇔ Mo=24+0,3333 ⇔ Mo=24,33
∆ 1+ ∆ 2 1+ 8

Interpretação:

A pontuação com maior frequência entre o grupo de 30 alunos matriculados na disciplina


de Introdução à Estatística foi de 24,33 pontos.

Em que:

∆1 = Fi – Fi anterior ⟺ ∆1 = 9 – 8⟺ ∆1 = 1.

∆2 = Fi – Fi posterior ⟺ ∆2 = 9 – 1⟺ ∆2 = 8.

at 18
i ⟺h= ⟺ h= ⟺ h=3
k 6

at=ES−EI ⇔ at =39−21 ⇔ at=18

k =1+3,32× log n ⟺ k=1+3,32 × log 30 ⟺ k =1+3,32× 1,4771⟺ k =5,9040 ⟺ k ≅ 6

MEDIANA (Md)

A mediana. Representada por (Md), é à medida que divide um conjunto de dados


ordenados em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da mediana,
ou seja, a mediana é o elemento que ocupa a posição central de um conjunto de dados.

1ª SITUAÇÃO: Dados Não Agrupados.

Sejam os elementos x1, x2, x3, …, xn de uma amostra, portanto “n” valores da variável
“X”. A mediana da variável aleatória de “X” é definida por:

Se “n” for PAR, então o valor da mediana será a média das duas observações adjacentes
n+1
à posição p= ; ou seja, neste caso temos duas posições centrais no conjunto de dados
2
n+1
ordenados, denotados por p1 e p2. Ao utilizarmos a expressão p= , obtemos um valor não
2
inteiro. Assim, as preposições p1 e p2 são os dois inteiros mais próximos do valor de p. Portanto,

Autor: Rosângelo Paúnde Página 42


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

a mediana (Md) será a média aritmética simples dos valores do conjunto de dados que ocupam
X p1 + X p 2
as posições p1 e p2, ou seja: Md= .
2

n+1
Se “n” for ÍMPAR, então o valor da mediana será o valor localizado na posição p=
2

Exemplo 1:

Suponha o conjunto de tempo de serviço de seis funcionários: 3, 7, 8, 10, 11 e 13.


Determinar a mediana deste conjunto de dados.

Como “n” é PAR, ou seja n = 6, então o valor da mediana (Md) estará localizado na
n+1 6+ 1
posição p= ⇔ p= ⇔ p=3,5 ,logo , p1 =8 e p2=10 . Assim, aplicando a fórmula da
2 2
mediana para este tipo de casos termos:

X p1 + X p 2 8+ 10 18
Md= ⇔ Md = ⇔ Md= ⇔ Md =9.
2 2 2

Interpretação:

50% dos funcionários possuem até 9 anos de tempo de serviço, ou, 50% dos funcionários
possuem no mínimo 9 anos de tempo de serviço.

Exemplo 2:

Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11.


Determinar a mediana deste conjunto de dados.

Como o “n” é IMPAR, ou seja, n = 5, então o valor da mediana (Md) estará localizada
n+1 5+1
na posição p= ⇔ p= ⇔ p=3 , logo , a Md =8.
2 2

Interpretação:

50% dos funcionários possuem até 8 anos de tempo de serviço, ou, 50% dos funcionários
possuem no mínimo 8 anos de tempo de serviço.

Autor: Rosângelo Paúnde Página 43


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

2ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Valores Simples.

Quando os dados estiverem agrupados numa distribuição de frequência,


localizaremos/identificaremos a mediana (Md) dos valores x1, x2, x3, …, xn, pela posição da
n
mediana, usando a seguinte fórmula: POS (Md )= , através da Frequência Absoluta Acumulada
2
(Fac).

Exemplo:

Em um determinado dia foi registado o número de veículos negociados por uma amostra
de vendedores de uma agência de automóveis, obtendo a seguinte tabela:

Veículos Número de
Negociados Vendedores Fac
(Xi) Fi
1 1 1
2 3 4
3 5 9
4 1 10
∑(somatório) 10 -

Portanto, calculando a mediana (Md) e, considerando que n = 10, teremos:

n 10
POS ( Md ) = ⇔ POS ( Md )= ⇔ POS ( Md )=5.
2 2

Logo , a Posição da Mediana na Fac encontra−se na Fac=9.

Assim , a Mediana dos dados observados ( Xi ) , será: Md =3.

Interpretação:

50% dos vendedores comercializaram no máximo 3 veículos, ou então, metade dos


vendedores comercializou pelo menos 3 veículos.
Autor: Rosângelo Paúnde Página 44
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

3ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Classes.

PROCEDIMENTOS:

n
1. Calcula-se a posição da Mediana: POS ( Md ) =
2
2. Pela Frequência Absoluta Acumulada (Fac), identifica-se a classe que contém o valor da
Mediana: CLASSE(Md);
POS ( Md )−Fac anterior
3. Utiliza-se a seguinte fórmula: Md=EI + ×h
Fi

Onde:

Md: Mediana;

EI: Extremo ou Limite Inferior da Classe Mediana;

n: Tamanho da Amostra ou número de elementos;

Fi: Frequência Absoluta da Classe Mediana;

Fac anterior: Frequência Absoluta Acumulada Anterior á Classe Mediana;

i ⟺ h: Amplitude da Classe Mediana;

OUTRAS FÓRMULAS IMPORTANTES PARA RECORDAÇÃO:

at
i ⟺h=
k

a t=ES−EI

k =1+3,32× log n

Em que:

Autor: Rosângelo Paúnde Página 45


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

at: Amplitude Total do Conjunto de Valores;

k: Número de Classes da Distribuição de Frequências usando a Fórmula de Sturges;

ES: Extremo Superior do conjunto de dados observados, ou seja, o maior valor observado nos
dados;

EI: Extremo Inferior do conjunto de dados observados, ou seja, o menor valor observado nos
dados;

Exemplo:

A tabela abaixo representa a pontuação obtida por um grupo de 30 alunos matriculados


na disciplina de Introdução à Estatística.

Pontuações em Alunos
Classes Fi Fac
21|― 24 8 8
24|― 27 9 17
27|― 30 1 18
30|― 33 4 22
33|― 36 7 29
36|― 39 1 30
∑(somatório) 30 -

n 30
1° PASSO: Calcula-se a posição da Mediana: POS ( Md ) = ⇔ POS ( Md )= ⇔ POS ( Md )=15 .
2 2

2° PASSO: Pela Frequência Absoluta Acumulada (Fac), identifica-se a classe que contém o
valor da Mediana: CLASSE(Md);

CLASSE(Md) = 24|― 27;

3° PASSO: Determinar a Mediana (Md), com base na seguinte fórmula:

Autor: Rosângelo Paúnde Página 46


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

POS ( Md )−Fac anterior


Md=EI + ×h
Fi

POS ( Md )−Fac anterior 15−8


Md=EI + ×h ⇛ Md =24+ × 3⇔ Md=24+2,3333 ⇔ Md =26,33
Fi 9

Interpretação:

50% dos alunos obtiveram a pontuação máxima de 26,33 pontos, ou então, metade dos
alunos obtiveram pontuação maior que 26,33 pontos.

Em que:

at 18
i ⟺h= ⟺ h= ⟺ h=3
k 6

at=ES−EI ⇔ at =39−21 ⇔ at=18

k =1+3,32× log n ⟺ k=1+3,32 × log 30 ⟺ k =1+3,32× 1,4771⟺ k =5,9040 ⟺ k ≅ 6

Autor: Rosângelo Paúnde Página 47


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

MEDIDAS SEPARATRIZES: QUARTIS, DECIS E PERCENTIS

As medidas Separatrizes delimitam proporções de observações de uma variável ordinal.


Elas estabelecem limites para uma determinada proporção 0 ≤ p ≤ 0 de observações. São
medidas intuitivas, de fácil compreensão e frequentemente resistentes.

Assim sendo, como medidas Separatrizes temos as seguintes: Quartis, Decis e Percentis.

QUARTIS

Quartis são os valores (Q1, Q2 e Q3) que dividem a amostra, depois de ordenada, em
quatro partes iguais (ou o mais igual possível). Assim, o Q1 é o valor da variável que deixa
atrás de si 25% das observações (dos elementos), o Q2 é o valor da variável que deixa atrás de si
50% das observações (dos elementos) e, por fim, o Q3 é o valor da variável estatística que deixa
atrás de si 75% das observações (elementos).

A diferença (Q3 – Q1) chama-se Amplitude Interquartil (Q) e é o intervalo no qual


pertencem 50% das observações, deixando 25% para a direita e 25% para a esquerda.

No entanto, para obtermos o intervalo inter-quartílico ou desvio quartílico, denotado


Q3−Q 1
por “Q”, temos a seguinte fórmula: Q= .
2

Portanto, dizer que os quartis dividem a série em quatro partes iguais não significa que,
por exemplo, os intervalos (Q1 e Q2) e (Q2 e Q3) têm a mesma amplitude, mas sim que contêm o
mesmo número de observações. Não menos importante, é o facto de que o Q2, corresponder à
Mediana (Md), ou seja, (Q2 = Md).

PROCEDIMENTOS PARA A SUA DETERMINAÇÃO

n
1° PASSO: calcular a posição do quartil com a seguinte fórmula: POS (Qi)= × i
4

Onde:

POS (Q1): posição do quartil i;

n: número de observações ou de elementos da distribuição ou do conjunto de dados;


Autor: Rosângelo Paúnde Página 48
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

i: número do quartil, por exemplo: i = 1, 2, 3;

2° Passo: pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor do
quartil: CLASSE (Qi);

3° PASSO: utilizar a fórmula a seguir para determinar o valor do quartil:

POS ( Qi )−Fac anterior


Qi=EI + ×h
Fi

Onde:

Qi: quartil i;

EI: Extremo ou Limite Inferior da Classe Quartílica;

n: Tamanho da Amostra ou número de elementos;

Fi: Frequência Absoluta da Classe Quartílica;

Fac anterior: Frequência Absoluta Acumulada Anterior á Classe Quartílica;

i ⟺ h: Amplitude da Classe Quartílica;

OUTRAS FÓRMULAS IMPORTANTES PARA RECORDAÇÃO:

at
i ⟺h=
k

a t=ES−EI

k =1+3,32× log n

Em que:

at: Amplitude Total do Conjunto de Valores;

k: Número de Classes da Distribuição de Frequências usando a Fórmula de Sturges;

ES: Extremo Superior do conjunto de dados observados, ou seja, o maior valor observado nos
dados;
Autor: Rosângelo Paúnde Página 49
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

EI: Extremo Inferior do conjunto de dados observados, ou seja, o menor valor observado nos
dados;

Exemplo:

Dado o rol do número de erros de impressão da primeira página de um jornal durante 50


dias, obteve-se os seguintes dados:

5 5 5 6 6 6 7 7 7 7

7 8 8 8 8 8 8 8 9 9

10 10 10 10 10 11 11 11 12 12

12 12 12 12 12 12 12 13 14 14

14 14 14 14 14 15 16 19 22 23

Do rol acima, esboçou-se a tabela abaixo, que representa o número de erros de impressão
da primeira página de um jornal durante 50 dias. Determinar o Q1 e o Q3.

Em que:

at 18
i ⟺h= ⟺ h= ⟺ h=2,5714 ⟺ h ≅ 3
k 7

a t=ES−EI ⇔ at =23−5⇔ at =18

k =1+3,32× log n ⟺ k=1+3,32 × log 50 ⟺ k =1+3,32× 1,69897 ⟺ k=6,6406 ⟺ k ≅ 7

Classes Fi Fac
5|― 8 11 11
8|― 11 14 25
11|― 14 13 38 DETERMINAÇÃO DO QUARTIL (Q1):
14|― 17 9 47
17|― 20 1 48
20|― 23 1 49
23|― 26 1 50
∑(somatório)
Autor: Rosângelo Paúnde 50 - Página 50
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

1° PASSO: Calcula-se a posição da Q1 com base na seguinte fórmula:


n 50
POS ( Qi ) = ×i ⇔ POS ( Q 1) = ×1 ⇔ POS ( Q1 )=12,5 .
4 4

2° PASSO: Pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor
do primeiro Quartil: CLASSE (Q1);

CLASSE (Q1) = 8|― 11;

3° PASSO: utilizar a fórmula a seguir para determinar o valor do primeiro Quartil:

POS ( Qi )−Fac anterior


Qi=EI + ×h
Fi

POS ( Q 1 )−Fac anterior 12,5−11


Q1=EI + ×h ⇛Qi =8+ × 3⇔ Qi=8+ 0,3214 ⇔Q i =8,32
F1 14

Interpretação:

25% do jornal, obteve no máximo 8,32 erros na impressão da primeira página, ou então,
75% do jornal, obteve mais de 8,32 erros na impressão da primeira página.

DETERMINAÇÃO DO QUARTIL (Q3):

1° PASSO: Calcula-se a posição da Q3 com base na seguinte fórmula:


n 50
POS ( Qi ) = ×i ⇔ POS ( Q 3 )= ×3 ⇔ POS ( Q3 ) =37,5.
4 4

2° PASSO: Pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor
do terceiro Quartil: CLASSE (Q3);

CLASSE (Q3) = 11|― 14;

3° PASSO: utilizar a fórmula a seguir para determinar o valor do quartil:

POS ( Qi )−Fac anterior


Qi=EI + ×h
Fi

Autor: Rosângelo Paúnde Página 51


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

POS ( Q 3 )−Fac anterior 37,5−25


Q3=EI + × h⇛ Q3=11+ × 3 ⇔Q3=11+2,8846 ⇔ Q 3=13,89
F3 13

Interpretação:

75% do jornal, obteve menos de 13,89 erros na impressão da primeira página, ou então,
25% do jornal, obteve pelo menos 13,89 erros na impressão da primeira página.

DECIS

Os decis dividem a série ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou
10% das observações ou dos elementos da série ordenada ou do conjunto de dados.

PROCEDIMENTOS PARA A SUA DETERMINAÇÃO

n
1° PASSO: calcular a posição do decil com a seguinte fórmula: POS ( Di)= ×i
10

Onde:

POS ( D1): posição do decil i;

n: número de observações ou de elementos da distribuição ou do conjunto de dados;

i: número do decil, por exemplo: i = 1, 2, 3, 4, 5, 6, 7, 8, 9;

2° Passo: pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor do
decil: CLASSE (Di);

3° PASSO: utilizar a fórmula a seguir para determinar o valor do decil:

POS ( Di )−Fac anterior


Di=EI + ×h
Fi

Onde:

Autor: Rosângelo Paúnde Página 52


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Di: decil i;

EI: Extremo ou Limite Inferior da Classe do decil;

n: Tamanho da Amostra ou número de elementos;

Fi: Frequência Absoluta da Classe do decil;

Fac anterior: Frequência Absoluta Acumulada Anterior á Classe do decil;

i ⟺ h: Amplitude da Classe do decil;

OUTRAS FÓRMULAS IMPORTANTES PARA RECORDAÇÃO:

at
i ⟺h=
k

a t=ES−EI

k =1+3,32× log n

Em que:

at: Amplitude Total do Conjunto de Valores;

k: Número de Classes da Distribuição de Frequências usando a Fórmula de Sturges;

ES: Extremo Superior do conjunto de dados observados, ou seja, o maior valor observado nos
dados;

EI: Extremo Inferior do conjunto de dados observados, ou seja, o menor valor observado nos
dados;

Exemplo:

Dado o rol do número de erros de impressão da primeira página de um jornal durante 50


dias, obteve-se os seguintes dados:

5 5 5 6 6 6 7 7 7 7

7 8 8 8 8 8 8 8 9 9
Autor: Rosângelo Paúnde Página 53
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

10 10 10 10 10 11 11 11 12 12

12 12 12 12 12 12 12 13 14 14

14 14 14 14 14 15 16 19 22 23

Do rol acima, esboçou-se a tabela abaixo, que representa o número de erros de impressão
da primeira página de um jornal durante 50 dias. Determinar o sexto Decil (D6).

Em que:

at 18
i ⟺h= ⟺ h= ⟺ h=2,5714 ⟺ h ≅ 3
k 7

a t=ES−EI ⇔ at =23−5⇔ at =18

k =1+3,32× log n ⟺ k=1+3,32 × log 50 ⟺ k =1+3,32× 1,69897 ⟺ k=6,6406 ⟺ k ≅ 7

Classes Fi Fac
5|― 8 11 11
8|― 11 14 25
11|― 14 13 38 DETERMINAÇÃO DO SEXTO DECIL
14|― 17 9 47 (D6):
17|― 20 1 48
1° PASSO: Calcula-se a posição do sexto
20|― 23 1 49
Decil (D6) com a seguinte fórmula:
23|― 26 1 50
∑(somatório) 50 -
n 50
POS ( D i) = ×i ⇔ POS ( D6 )= × 6 ⇔ POS ( D6 )=30 .
10 10

2° PASSO: Pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor
do sexto Decil: CLASSE (D6);

CLASSE (D6) = 11|― 14;

3° PASSO: utilizar a fórmula a seguir para determinar o valor do Sexto Decil:

Autor: Rosângelo Paúnde Página 54


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

POS ( D1 )−Fac anterior


Di=EI + ×h
F1

POS ( D 6 ) −Facanterior 30−25


D6=EI + × h ⇛ D6=11+ ×3 ⇔ D 6=11+1,1538 ⇔ D6 =12,15
F1 13

Interpretação:

60% do jornal, obteve erros inferiores a 12,15 páginas na impressão da primeira página,
ou então, 40% do jornal, obteve um mínimo de 12,15 erros na impressão da primeira página.

PERCENTIS

Os percentis ou simplesmente centis, dividem a série ordenada em 100 partes iguais,


contendo cada uma delas 1/100 ou 1% das observações ou dos elementos de uma determinada
distribuição ou conjunto de dados.

PROCEDIMENTOS PARA A SUA DETERMINAÇÃO

n
1° PASSO: calcular a posição do percentil com a seguinte fórmula: POS (Pi)= ×i
100

Onde:

POS ( P1): posição do percentil i;

n: número de observações ou de elementos da distribuição ou do conjunto de dados;

i: número do percentil, por exemplo: i = 1, 2, 3, …, 99;

2° Passo: pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor do
percentil: CLASSE (Pi);

3° PASSO: utilizar a fórmula a seguir para determinar o valor do percentil:

Autor: Rosângelo Paúnde Página 55


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

POS ( Pi )−Fac anterior


Pi=EI + ×h
Fi

Onde:

Pi: percentil i;

EI: Extremo ou Limite Inferior da Classe do percentil;

n: Tamanho da Amostra ou número de elementos;

Fi: Frequência Absoluta da Classe do percentil;

Fac anterior: Frequência Absoluta Acumulada Anterior á Classe do percentil;

i ⟺ h: Amplitude da Classe do percentil;

OUTRAS FÓRMULAS IMPORTANTES PARA RECORDAÇÃO:

at
i ⟺h=
k

a t=ES−EI

k =1+3,32× log n

Em que:

at: Amplitude Total do Conjunto de Valores;

k: Número de Classes da Distribuição de Frequências usando a Fórmula de Sturges;

ES: Extremo Superior do conjunto de dados observados, ou seja, o maior valor observado nos
dados;

EI: Extremo Inferior do conjunto de dados observados, ou seja, o menor valor observado nos
dados;

Exemplo:

Exemplo:
Autor: Rosângelo Paúnde Página 56
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Dado o rol do número de erros de impressão da primeira página de um jornal durante 50


dias, obteve-se os seguintes dados:

5 5 5 6 6 6 7 7 7 7

7 8 8 8 8 8 8 8 9 9

10 10 10 10 10 11 11 11 12 12

12 12 12 12 12 12 12 13 14 14

14 14 14 14 14 15 16 19 22 23

Do rol acima, esboçou-se a tabela abaixo, que representa o número de erros de impressão
da primeira página de um jornal durante 50 dias. Determinar o Percentil de ordem 40 (P40).

Em que:

at 18
i ⟺h= ⟺ h= ⟺ h=2,5714 ⟺ h ≅ 3
k 7

a t=ES−EI ⇔ at =23−5⇔ at =18

k =1+3,32× log n ⟺ k=1+3,32 × log 50 ⟺ k =1+3,32× 1,69897 ⟺ k=6,6406 ⟺ k ≅ 7

Classes Fi Fac
5|― 8 11 11
8|― 11 14 25
11|― 14 13 38 DETERMINAÇÃO DO PERCENTIL DE
14|― 17 9 47 ORDEM 40 (P40):
17|― 20 1 48
1° PASSO: Calcula-se a posição do Percentil
20|― 23 1 49
de ordem 40 (P40) com a seguinte fórmula:
23|― 26 1 50
∑(somatório) 50 -
n 50
POS ( Pi ) = ×i ⇔ POS ( P 40 )= × 40 ⇔ POS ( P40 )=20 .
100 100

Autor: Rosângelo Paúnde Página 57


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

2° PASSO: Pela Frequência Absoluta Acumulada (Fac), identificar a classe que contêm o valor
do Percentil de Ordem 40: CLASSE (P40);

CLASSE (D6) = 8|― 11;

3° PASSO: utilizar a fórmula a seguir para determinar o valor do Percentil de ordem 40:

POS ( P1 )−Fac anterior


Pi=EI + ×h
F1

POS ( P40 )−Fac anterior 20−11


P40 =EI + × h⇛ P 40=8+ ×3 ⇔ P 40=8+1,9286 ⇔ P 40=9,93
F1 14

Interpretação:

40% dos erros de impressão da primeira página do jornal, foram menores que 9,93
páginas/folhas, ou então, 60% do jornal, obteve erros de impressão da primeira página maior que
9,93 páginas/folhas.

EXERCÍCIOS DE CONSOLIDAÇÃO DA UNIDADE

1. Responda as questões abaixo:


1.1 A Média, a Mediana e a Moda são medidas de:
a) Dispersão;
b) Posição;
c) Separatrizes;
d) Assimetria;
e) Curtose;
2. Na série 10, 20, 40, 50, 70, 80, a mediana será:
a) 30;
b) 35
c) 40

Autor: Rosângelo Paúnde Página 58


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

d) 45
3. Calcule para cada caso abaixo a respectiva média:
a) 7, 8, 9, 12, 14.
b)

(Xi) Fi
3 2
4 5
7 8
8 4
12 3
∑(somatório)

c)
Classes Fi
68|― 72 8
72|― 76 20
76|― 80 35
80|― 84 40
∑(somatório)

4. Calcule o valor da Mediana


a) 82, 86, 88, 84, 91, 93;
b)

(Xi) Fi
73 2
75 10
77 12
79 5
81 2

Autor: Rosângelo Paúnde Página 59


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

∑(somatório)

c)

Classes Fi
1|― 3 3
3|― 5 5
5|― 7 8
7|― 9 6
9|― 11 4
11|― 13 3
∑(somatório)

5. Calcule a Moda:
a) 3, 4, 7, 7, 7, 8, 9, 10;
b)

(Xi) Fi
2,5 7
3,5 17
4,5 10
6,5 5
∑(somatório)

c)

Classes Fi
10|― 20 7
20|― 30 19
30|― 40 28
40|― 50 32
Autor: Rosângelo Paúnde
∑(somatório) Página 60
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

6. Para a distribuição abaixo, calcule o segundo Decil (D2); o Percentil de ordem quatro (P4)
e o terceiro Quartil (Q3).

20|― 30 3
30|― 40 8
40|― 50 18
50|― 60 22
60|― 70 24
∑(somatório)

CONTEÚDOS DA UNIDADE 04: CONTINUAÇÃO AO ESTUDO DAS MEDIDAS


DESCRITIVAS.

 Medidas de Variação ou Dispersão: Amplitude Total, Desvio Médio, a Variância, o


Desvio Padrão e o Coeficiente de Variação;
 Medidas de Assimetria: Coeficiente de Assimetria ou de Pearson e Coeficiente de
Bowley;
 Medidas de Achatamento ou de Curtose: Coeficiente de Curtose e o Grau de Curtose.

MEDIDAS DE VARIAÇÃO OU DISPERSÃO: Amplitude Total, Desvio Médio, a Variância,


o Desvio Padrão e o Coeficiente de Variação;

INTRODUÇÃO

Uma medida de tendência central não nos dá, só por si, uma informação exaustiva da
distribuição considerada. Pelo contrário, a capacidade que se lhe atribui de representar os
elementos de uma distribuição depende do modo como estes se concentram ou dispersam em
torno dela.

Autor: Rosângelo Paúnde Página 61


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Assim, podemos dizer que os parâmetros de tendência central não são suficientes para
caracterizar uma série estatística, apesar de a mediana e os quartis darem já uma ideia sumária do
modo como estão distribuídas as observações.

Por conseguinte, para melhor caracterizar uma distribuição, temos de considerar, para
além das medidas de tendência central, uma outra medida que exprima o grau de dispersão ou
variabilidade dos dados.

As medidas de dispersão indicam se os valores estão relativamente próximo um dos


outros, ou separados em torno de uma medida de posição: a média.

Outrossim, as medidas de dispersão são medidas estatísticas utilizadas para avaliar o


grau de variabilidade, ou dispersão, dos valores em torno da média. Isto é, servem para medir a
representatividade da média. (CORREA, 2003, p. 59).

Em suma:

Podemos afirmar que as medidas de variação ou dispersão complementam as medidas de


localização ou tendência central, indicando quanto as observações diferem entre si ou o grau de
afastamento das observações em relação à média.

Assim sendo, consideraremos quatro a cinco medidas de dispersão: Amplitude Total (at
ou R), Desvio Médio (DM), Variância (S2), Desvio Padrão (S) e Coeficiente de Variação (CV).

AMPLITUDE TOTAL (at ou R)

É a diferença entre o maior e o menor dos valores da série, ou seja, do conjunto de dados
da distribuição. No entanto, a utilização da amplitude total como medida de dispersão é muito
limitada, pois sendo uma medida que depende apenas dos valores externos (limite/extremo
inferior e limite/extremo superior), é instável, não sendo afectada pela dispersão dos valores
internos.

Por isso mesmo, esta medida é considerada por muitos estudiosos da área da Estatística,
como uma das medidas mais elementares, ou seja, muito precária. Este posicionamento é

Autor: Rosângelo Paúnde Página 62


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

justificável pois a amplitude não dá informe algum, a respeito da maneira pela qual os valores se
distribuem entre os valores extremos.

FÓRMULA:

R ⇔ at =ES−EI

Onde:

R ⇔ at : Amplitude Total ou em inglês range;

ES: Extremo/Limite Superior do conjunto de dados;

EI: Extremo/Limite Inferior do conjunto de dados.

Vejamos os seguintes exemplos: A: 4, 6, 6, 6, 8 e B: 4, 5, 6, 7, 8.

Para o conjunto A, teremos:

R ⇔ at =ES−EI ↔ R ⇔ at =8−4 ↔ R ⇔ at =4.

∑ Xi 4+ 6+6+6 +8 30
i =1
X= ↔X= ↔ X = ↔ X=6.
n 5 5

Para o conjunto B, teremos:

R ⇔ at =ES−EI ↔ R ⇔ at =8−4 ↔ R ⇔ at =4.

∑ Xi 4+ 5+6+7+ 8 30
X = i =1 ↔X= ↔ X= ↔ X =6.
n 5 5

As amplitudes totais para os dois conjuntos são, igual a 4. No entanto, as dispersões


desses dois conjuntos de dados são diferentes. Analisando os dois conjuntos de dados
separadamente, percebemos que o segundo conjunto apresenta valores bem mais espalhados

Autor: Rosângelo Paúnde Página 63


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

entre si, ou seja, heterogéneos e, muito distantes ou distorcidos em relação à media que é X =6.
Mas, no primeiro conjunto, verifica-se que os valores são bem próximos entre si, ou seja, são
homogéneos e, giram em volta da média que é igualmente X =6.

A amplitude total é a forma mais fácil de avaliar a dispersão dos dados, de tal forma que,
quanto maior for a amplitude total, maior será a dispersão dos dados.

DESVIO MÉDIO (DM)

O desvio médio analisa a média dos desvios em torno da média. E, para o seu cálculo,
temos que considerar as seguintes situações:

1ª SITUAÇÃO: Dados Não Agrupados.

Sejam os elementos x1, x2, x3, …, xn de uma amostra, portanto “n” valores da variável
“X”, com média igual a X . O Desvio Médio (DM) da variável aleatória de “X” será definido
por:

∑ ¿ Xi−X∨¿
i=1
DM = ¿
n

Onde:

DM: Desvio Médio;

X :Média Aritmética e;

n: Número total de elementos do conjunto.

| |: Este sinal chama-se módulo de um número e, matematicamente, o módulo de qualquer


número seja ele positivo ou negativo é, sempre, igual a esse número, mas com sinal positivo.

Exemplo:

Suponha o conjunto de dados, que representa o tempo de serviço de cinco funcionários:


3, 7, 8, 10 e 11. Determinar o Desvio Médio.

1° PASSO: Determinar a Média Aritmética do conjunto de dados.


Autor: Rosângelo Paúnde Página 64
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

∑ Xi 3+7+8+10+11 39
X = i =1 ↔X= ↔ X = ↔ X=7,8
n 5 5

2° PASSO: Determinar o Desvio Médio (DM)

∑ ¿ Xi−X∨¿
⇔ DM =¿ 3−7,8∨+¿ 7−7,8∨+ ¿ 8−7,8∨+¿ 10−7,8∨+¿ 11−7,8∨ ¿ ⇔ DM =¿ 4,8+0,8+ 0
i=1
DM =
n 5

Interpretação:

Em média, o tempo de serviço deste grupo de funcionários se desvia em 2,24 anos em


torno dos 7,8 anos de tempo médio de serviço.

2ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Valores Simples.

Quando os dados estiverem agrupados numa distribuição de frequência de dados simples,


usaremos o Desvio Médio dos valores x1, x2, x3, …, xn, ponderados (multiplicados) pelas
respectivas Frequências Absolutas (Fi): F1, F2, F3, …, Fn. Assim teremos:

∑ ¿ Xi−X∨¿ × F i
i=1
DM = ¿
n

Onde:

DM: Desvio Médio;

X :Média Aritmética e;

n: Número total de elementos do conjunto;

Fi: Frequência Absoluta.

Autor: Rosângelo Paúnde Página 65


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Exemplo:

Em um determinado dia foi registado o número de veículos negociados por uma amostra
de 10 vendedores de uma agência de automóveis como a tabela abaixo indica. Determine o
Desvio Médio.

Veículos Número de X i × F i | ¿ X i −X∨× Fi


Negociados Vendedores X i −X∨¿
(Xi) (Fi)
1 1 1 1,6 1,6
2 3 6 0,6 1,8
3 5 15 0,4 2,0
4 1 4 1,4 1,4
Total 10 26 4,0 6,8

∑ Xi × Fi [ ( 1 ×1 ) + ( 2× 3 ) + ( 3 ×5 ) + ( 4 ×1 ) ] 1+6 +15+4 26
i=1
X= ↔ X= ↔ X= ↔ X= ↔ X=2,6
n 10 10 10

Logo:

∑ ¿ Xi−X∨× Fi 6,8
DM = i=1 ⇔ DM = ⇔ DM =0,68
n 10

Interpretação:

Em média, a quantidade de veículos negociada de cada vendedor possui uma


distância/dispersão de 0,68 em torno dos 2,6 veículos comercializados em média por vendedor.

3ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Classes.

Autor: Rosângelo Paúnde Página 66


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Quando os dados estiverem agrupados numa distribuição de frequência de dados


agrupados em classes, usaremos o Desvio Médio dos pontos médios ou centros de classes x1,
x2, x3, …, xn de cada classe, ponderados (multiplicados) pelas respectivas Frequências Absolutas
(Fi): F1, F2, F3, …, Fn. desta forma, o cálculo do Desvio Médio (DM) passa a ser igual, ao
procedimento utilizado na 2ª situação. Assim teremos:

∑ ¿ Xi−X∨¿ × F i
i=1
DM = ¿
n

Onde:

DM: Desvio Médio;

X :Média Aritmética e;

n: Número total de elementos do conjunto;

Fi: Frequência Absoluta.

Exemplo:

A tabela abaixo representa as pontuações obtidas por um grupo de 58 alunos matriculados na


disciplina de Introdução à Estatística. Determine o Desvio Médio.

Pontuações em Alunos Xi Xi × Fi | X i −X∨¿ ¿ X i −X∨× Fi


Classes Fi
35|― 45 5 40 200 22,24 111,2
45|― 55 12 50 600 12,24 146,52
55|― 65 18 60 1.080 2,24 40,32
65|― 75 14 70 980 7,76 108,64
75|― 85 6 80 480 17,76 106,56
85|― 95 3 90 270 27,76 83,28

Autor: Rosângelo Paúnde Página 67


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

∑(somatório) 58 - 3.610 - 596,52

1° Passo: Determinar o Ponto Médio das Classes (Xi = Cj):

EIj+ ESj 35+45 80


cj ↔ Xi= ; X 1= ; X 1= ; X 1=40.
2 2 2

EIj + ESj 45+55 100


cj ↔ Xi= ; X 2= ; X 2= ; X 2=50.
2 2 2

EIj+ ESj 85+ 95 180


cj ↔ Xi= ; X 6= ; X 6= ; X 6=90.;
2 2 2

2° Passo: Determinar a Média Aritmética:

∑ Xi × Fi [ ( 40 × 5 ) + ( 12× 50 ) + ( 18× 60 ) + ( 14 ×70 )+ ( 6 ×80 ) +(3 ×90)] 200+ 600+ 1080+980+ 48


i=1
X= ↔ X= ↔ X=
n 58 58

3° Passo: Determinar o Desvio Médio (DM):

∑ ¿ Xi−X∨× Fi 596,52
DM = i=1 ⇔ DM = ⇔ DM=10,2848 ⇔ DM ≅ 10,29.
n 58

Interpretação:

Em média, a nota de cada aluno deste grupo teve um distanciamento/dispersão de 10,29


pontos em torno do desempenho médio deste grupo de alunos que foi de 62,24 pontos nesta
disciplina.

VARIÂNCIA (S2 ouσ 2) E DESVIO PADRÃO (S ou σ )

Outra maneira de eliminar os sinais dos desvios, consiste em eleva-los ao quadrado. Por
isso, em vez da média dos valores absolutos dos desvios, considera-se a média dos quadrados
dos desvios, obtendo-se assim, uma outra medida de dispersão bastante utilizada – a variância.

Autor: Rosângelo Paúnde Página 68


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Portanto, a variância de um conjunto de dados é a média dos quadrados dos desvios dos
valores a contar da média (SHIGUTI & SHIGUTI, 2006, p.58).

Corroborando com (SHIGUTI & SHIGUTI, 2006, p.58), (PIANA, MACHADO &
SELAU, 2009, p.46), acrescentam ainda que, a variância é denotada por S2 e, é a medida de
dispersão mais utilizada, seja pela facilidade de compreensão e cálculo, assim como pela
possibilidade de emprego na Inferência Estatística.

Os mesmos autores, definem ela como sendo a média dos quadrados dos desvios em
relação à média aritmética. Assim, a fórmula da variância poderá ser calculada de duas formas:

Quando trabalhamos com universo de dados ou população, a variância é representada


pelo seguinte símbolo grego (sigma): σ 2 ;

Quando trabalhamos com uma amostra de um conjunto de dados, a variância é


representada pelo seguinte símbolo: S2.

1ª SITUAÇÃO: Dados não Agrupados

Sejam os elementos x1, x2, x3, …, xn, portanto “n” valores da variável “X”, com média
igual a X . A Variância da variável aleatória de “X” será definida por:

∑ ( Xi− X)2
σ 2= i=1
n

Ou

∑ (Xi−X )2
2 i=1
S=
n−1

Onde:

Autor: Rosângelo Paúnde Página 69


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

2
σ : Variância, usando dados populacionais;

2
S : Variância, usando dados amostrais;

X :Média Aritmética e;

n: Número total de elementos do conjunto.

n – 1: Número de graus de liberdade ou desvios independentes.

NOTA:

No caso em que a variância for utilizada apenas para descrever a variação de um


conjunto de dados populacionais, sem que posteriormente se necessite de fazer inferências,
então, ela poderá ser calculada utilizando o número de observações (n) como denominador e será
denotada por σ 2.

Mas, se o objectivo for descrever a variação dos dados de uma amostra que será
utilizada para inferir sobre uma população, então a medida que deve ser utilizada é a variância
com o denominador “n – 1” e, será denotada por S2. Por conseguinte, a fórmula mais utilizada
em estatística é a que apresenta como denominador “n – 1”, devido ao uso de amostras de dados
em maior parte de pesquisas estatísticas, para posterior fazer inferências sobre um grupo maior,
ou seja, sobre a população.

Exemplo:

Suponha o conjunto de dados, que representa o tempo de serviço de cinco funcionários:


3, 7, 8, 10 e 11. Determinar a variância deste conjunto de dados.

1° PASSO: Determinar a Média Aritmética ( X ).

∑ Xi 3+7+8+10+11 39
i =1
X= ↔X= ↔ X = ↔ X=7,8
n 5 5

2° PASSO: determinar a variância (S2)

Autor: Rosângelo Paúnde Página 70


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

∑ ( Xi− X )2 ( 3−7,8 )2 + ( 7−7,8 )2+ ( 8−7,8 )2 + ( 10−7,8 )2+ (11−7,8 )2 23,04+0,64+ 0,04+ 4,84+10,
2 i=1 2
S= ⇔S = ⇔ S 2=
n−1 5 5−1
anos 2.

DESVIO PADRÃO (S / σ ) PARA A 1ª SITUAÇÃO:

Assim, para a 1ª situação acima, podemos encontrar o DESVIO PADRÃO (S/σ ) da


variância. Mas antes disso, é pertinente dizer que, o Desvio Padrão denotado por (S / σ ), surge
para solucionar o problema de interpretação da variância, devido ao expoente no seu resultado e,
é definido como a raiz quadrada positiva da variância.

Ademais, podemos observar que, o Desvio Padrão é expresso na mesma unidade de


medida em que os dados se apresentam, ou seja, sem o expoente ao quadrado, o que facilita
bastante a sua interpretação. E, para o seu cálculo, usaremos as seguintes fórmulas:

Fórmulas:

σ =√ σ 2

Ou

S= √ S2

Onde:

σ : Desvio Padrão, usando dados populacionais;

S: Desvio Padrão, usando dados amostrais;

Exemplo:

Suponha o conjunto de dados, que representa o tempo de serviço de cinco funcionários:


3, 7, 8, 10 e 11. Determinar a variância deste conjunto de dados.

Autor: Rosângelo Paúnde Página 71


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

1° PASSO: Determinar a Média Aritmética ( X ):

∑ Xi 3+7+8+10+11 39
i =1
X= ↔X= ↔ X = ↔ X=7,8
n 5 5

2° PASSO: Determinar a variância (S2):

∑ ( Xi− X )2 ( 3−7,8 )2 + ( 7−7,8 )2+ ( 8−7,8 )2 + ( 10−7,8 )2+ (11−7,8 )2 23,04+0,64+ 0,04+ 4,84+10,
2 i=1 2 2
S= ⇔S = ⇔S =
n−1 5 5−1
anos 2.

3° PASSO: Determinar o Desvio Padrão (S):

S= √ S2 ⟺ S= √9,7 anos2 ⇔ S=3,11anos.

2ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Valores Simples.

Quando os dados estiverem agrupados numa distribuição de frequência de dados simples,


usaremos a Variância dos valores x1, x2, x3, …, xn, ponderados (multiplicados) pelas respectivas
Frequências Absolutas (Fi): F1, F2, F3, …, Fn. Assim teremos:

n n

∑ (Xi− X) × F i
2
Ou ∑ ( Xi−X )2 × F i
2 i=1 2 i=1
σ = S=
n n−1

Onde:

2
σ : Variância, usando dados populacionais;

2
S : Variância, usando dados amostrais;

X :Média Aritmética;

Autor: Rosângelo Paúnde Página 72


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

F i: Frequências Absolutas do conjunto de dados;

n: Número total de elementos do conjunto.

n – 1: Número de graus de liberdade ou desvios independentes.

Exemplo:

Em um determinado dia foi registado o número de veículos negociados por uma amostra
de 10 vendedores de uma agência de automóveis como a tabela abaixo indica. Determine a
variância.

Veículos Número de X i × F i 2 2
(X ¿ ¿i− X ) ¿(X ¿ ¿i− X ) × F i ¿
Negociados Vendedores
(Xi) (Fi)
1 1 1 2,56 2,56
2 3 6 0,36 1,08
3 5 15 0,16 0,8
4 1 4 1,96 1,96
Total 10 26 - 6,4

∑ Xi × Fi [ ( 1 ×1 ) + ( 2× 3 ) + ( 3 ×5 ) + ( 4 ×1 ) ] 1+6 +15+4 26
i=1
X= ↔ X= ↔ X= ↔ X= ↔ X=2,6
n 10 10 10

Logo:

∑ (X ¿¿ i−X )2 × Fi 6,4 6,4 veículos 2


2 i=1 2 2 2
S= ⇔S = ⇔S = ⇔ S =0,71 ¿
n−1 10−1 9

PORTANTO, PARA A DETERMINAÇÃO DO DESVIO PADRÃO PARA A 2ª


SITUAÇÃO, TEREMOS:

S= √ S2 ⟺ S= √0,71 anos 2 ⇔ S=0,84 veiculos.

Autor: Rosângelo Paúnde Página 73


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

3ª SITUAÇÃO: Dados Agrupados em uma Determinada Distribuição de Frequência por


Classes.

Quando os dados estiverem agrupados numa distribuição de frequência de dados


agrupados em classes, usaremos a variância dos pontos médios ou centros de classes x1, x2, x3,
…, xn de cada classe, ponderados (multiplicados) pelas respectivas Frequências Absolutas (Fi):
F1, F2, F3, …, Fn. Desta forma, o cálculo da variância ( S2) passa a ser igual, ao procedimento
utilizado na 2ª situação. Assim teremos:

n n

∑ (Xi− X) × F i
2
Ou ∑ ( Xi−X )2 × F i
2 i=1 2 i=1
σ = S=
n n−1

Onde:

2
σ : Variância, usando dados populacionais;

2
S : Variância, usando dados amostrais;

X :Média Aritmética;

F i: Frequências Absolutas do conjunto de dados;

n: Número total de elementos do conjunto.

n – 1: Número de graus de liberdade ou desvios independentes.

Exemplo:

A tabela abaixo representa as pontuações obtidas por um grupo de 58 alunos


matriculados na disciplina de Introdução à Estatística. Determine o Desvio Médio.

Pontuações em Alunos Xi Xi × Fi 2
( X ¿ ¿i− X )2 ¿(X ¿ ¿i− X ) × F i ¿
Classes Fi

Autor: Rosângelo Paúnde Página 74


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

35|― 45 5 40 200 494,6176 2.473,088


45|― 55 12 50 600 149,8176 1.797,8112
55|― 65 18 60 1.080 5,0176 90,3168
65|― 75 14 70 980 60,2176 843,0464
75|― 85 6 80 480 315,4176 1.892,5056
85|― 95 3 90 270 770,6176 2.311,8528
∑(somatório) 58 - 3.610 - 9.408,62

1° Passo: Determinar o Ponto Médio das Classes (Xi = Cj):

EIj+ ESj 35+45 80


cj ↔ Xi= ; X 1= ; X 1= ; X 1=40.
2 2 2

EIj + ESj 45+55 100


cj ↔ Xi= ; X 2= ; X 2= ; X 2=50.
y2 2 2

EIj+ ESj 85+ 95 180


cj ↔ Xi= ; X 6= ; X 6= ; X 6=90.
2 2 2

2° Passo: Determinar a Média Aritmética:

∑ Xi × Fi [ ( 40 × 5 ) + ( 12× 50 ) + ( 18× 60 ) + ( 14 ×70 )+ ( 6 ×80 ) +(3 ×90)] 200+ 600+ 1080+980+ 48


i=1
X= ↔ X= ↔X=
n 58 58

3° Passo: Determinar a variância (S2):

∑ (X ¿¿ i−X )2 × Fi 9.408,62 9.408,62 pontos 2


2 i=1 2
S= ⇔S = ⇔ S 2= ⇔ S 2=165,06 ¿
n−1 58−1 57

PORTANTO, PARA A DETERMINAÇÃO DO DESVIO PADRÃO PARA A 3ª


SITUAÇÃO, TEREMOS:

S= √ S ⟺ S= √ 165,06 pontos2 ⇔ S=12,85pontos.


2

Autor: Rosângelo Paúnde Página 75


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

COEFICIENTE DE VARIAÇÃO (CV)

As medidas de dispersão que anteriormente nos referimos são medidas que se exprimem
na mesma unidade dos dados e, sendo assim, se torna impossível comparar entre si as dispersões
de duas distribuições, cujos valores não se refiram à mesma unidade.

Assim sendo, Coeficiente de Variação trata-se de uma média relativa à dispersão, útil
para a comparação e observação em termos relativos do grau de concentração em torno da média
de séries distintas e, o mesmo é denotado por (CV) e é dado pela seguinte fórmula:

Fórmula:

S
CV = × 100 %
X

Onde:

CV: Coeficiente de Variação;

X : Média Aritmética e;

S: Desvio Padrão.

CLASSIFICAÇÃO DA DISTRIBUIÇÃO QUANTO À DISPERSÃO DOS DADOS

 Dispersão Baixa: se o CV ≤ 15%;


 Dispersão Média: se 15% < CV < 30%
 Dispersão Alta: se o CV ≥ 30%

Exemplo:

Numa empresa, o salário médio dos funcionários do sexo masculino é de 4.000,00Mt,


comum desvio padrão de 1.500,00Mt e, os funcionários do sexo feminino tem em média um

Autor: Rosângelo Paúnde Página 76


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

salário de 3.000,00Mt, com um desvio padrão de 1.200,00Mt. Determine o coeficiente de


variação para ambos sexos.

1° Determina-se, o Coeficiente de Variação (CV) para funcionários do sexo Masculino e,


teremos:

S 1.500
CV = × 100 % ⟺ CV = × 100 % ⟺ CV =0,375 ×100 % ⟺ CV =37,5 %
X 4.000

2° determina-se, o Coeficiente de Variação (CV) para funcionários do sexo Feminino e,


teremos:

S 1.200
CV = × 100 % ⟺ CV = ×100 % ⟺ CV =0,4 ×100 % ⟺ CV =40 %
X 3.000

Interpretação:

Conclui-se que, o salário das mulheres apresenta maior dispersão relativa, em relação ao
salário dos homens, apesar de ambos, serem classificados como que apresentam alta dispersão
por estarem acima dos 30%.

NOTA:

O Coeficiente de Variação é desprovido de unidade de medida, uma vez que, é expresso


em percentagem. Não obstante, o mesmo é uma medida relativa, ou seja, que relaciona o Desvio
Padrão (S) com a sua respectiva Média Aritmética ( X ).

MEDIDAS DE FORMATO: ASSIMETRIA E CURTOSE

Autor: Rosângelo Paúnde Página 77


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

O formato é um aspecto importante de uma distribuição. Embora mudanças em uma


medida de variação também provoquem alterações no aspecto visual, o formato de uma
distribuição se relaciona com as ideias de simetria e curtose.

Várias medidas têm o objectivo de informar sobre o formato de uma distribuição. Entre
as mais precisas estão os Coeficiente de Assimetria de Pearson, Coeficiente de Assimetria de
Bowley e Coeficiente de Curtose, que são calculados a partir dos momentos da distribuição.

MEDIDAS DE ASSIMETRIA: Coeficiente de Assimetria de Pearson e Coeficiente de


Bowley

Estas medidas indicam o grau de deformação de uma distribuição em relação ao eixo de


simetria. Portanto, existem vários coeficientes com o objectivo de quantificar tais assimetrias.
Para esta disciplina, estudaremos dois destes coeficientes à saber: Coeficiente de Assimetria de
Pearson e Coeficiente de Assimetria de Bowley.

COEFICIENTE DE ASSIMETRIA DE PEARSON

Entre as várias medidas de assimetria que devem informar se a maioria dos valores se
localiza à esquerda, ou à direita, ou se estão uniformemente distribuídos em torno da média
aritmética, temos o Coeficiente de Assimetria ou de Pearson, denotado por AS. Este
coeficiente, é representado pela seguinte fórmula:

3 ×(X−Md ) X −Mo
AS= ou AS=
S S

Onde:

AS: Coeficiente de Assimetria de Pearson;

X : Média Aritmética;

Md : Mediana;

Mo : Moda e; S: Desvio Padrão.

CLASSIFICAÇÃO DO COEFICIENTE DE ASSIMETRIA DE PEARSON

Autor: Rosângelo Paúnde Página 78


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Se AS = 0, ou se, X = Mo = Md , diz-se que a distribuição é simétrica;

Se AS > 0, ou se X −Mo=a um valor positivo , diz-se que a distribuição é assimétrica positiva


(ou à direita);

Se AS < 0, ou se X −Mo=a um valor negativo , diz-se que a distribuição é assimétrica negativa


(ou à esquerda);

Não obstante:

Se 0,15 < |AS| < 1, diz-se que é assimétrica moderada;

Se |AS| > 1, diz-se que é assimétrica forte.

COEFICIENTE DE ASSIMETRIA DE BOWLEY

Q3+ Q1−2× Md
AB=
Q3−Q1

Onde:

AB: Coeficiente de Assimetria de Bowley;

Q 3: Terceiro Quartil do conjunto de dados;

Q 1: primeiro quartil do conjunto de dados;

Md : Mediana do conjunto de dados.

CLASSIFICAÇÃO DO COEFICIENTE DE ASSIMETRIA DE BOWLEY

Se, AB = 0, diz-se que é uma distribuição Simétrica;

Se, 0 < AB ≤ 0,1, diz-se que a distribuição é assimétrica positiva fraca;

Se, 0,1 < AB < 0,3, diz-se que a distribuição é assimétrica positiva moderada;

Se, 0,3 ≤ AB ≤ 1, diz-se que a distribuição é assimétrica positiva forte;

Autor: Rosângelo Paúnde Página 79


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Se, - 0,1 ≤ AB < 0, diz-se que a distribuição é assimétrica negativa fraca;

Se, - 0,3 < AB < - 0,1, diz-se que a distribuição é assimétrica moderada;

Se, - 1 ≤ AB ≤ - 0,3, diz se que a distribuição é assimétrica negativa forte.

MEDIDAS DE CURTOSE

Entende-se por Curtose, o grau de achatamento de uma distribuição. Assim, para medir o
grau de curtose, denotado por (K), utilizaremos a seguinte fórmula:

Q3 −Q 1
K=
2 ×(P ¿ ¿ 90−P10 )¿

Onde:

K : Coeficiente de Curtose;

Q 3: Terceiro Quartil do conjunto de dados;

Q 1: Primeiro Quartil do conjunto de dados;

P90 : Percentil de ordem noventa do conjunto de dados;

P10: Décimo Percentil do conjunto de dados.

CLASSIFICAÇÃO DO COEFICIENTE DE CURTOSE

Se, K = 0,263, diz-se que o coeficiente de curtose apresenta uma curva mesocúrtica, ou seja, é
mesocúrtica;

Se, K > 0,263, diz-se que o coeficiente de curtose apresenta uma curva platicúrtica, ou seja, é
platicúrtica;

Se, K < 0,263, diz-se que o coeficiente de curtose apresenta uma curva leptocúrtica, ou seja, é
leptocúrtica.

Exercícios de Consolidação da Unidade

Autor: Rosângelo Paúnde Página 80


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

1. O Desvio Médio para o conjunto de dados abaixo, será:

Xi Fi
5 2
7 3
8 5
9 4
11 2
∑(somatório) 16

a) 1,28 ( )
b) 1,20 ( )
c) 1,0 ( )
d) 0,83 ( )

2. O Desvio Padrão de um conjunto de dados é 9. A sua variância será:


a) 3 ( ); b) 36 ( ); c) 81 ( ) d) 18 ( )

3. Na distribuição de valores iguais, o Desvio Padrão é:


a) Negativo ( ) b) A Unidade ( ) c) Zero ( ) d) Positivo ( )

4. O Cálculo da Variância, supõe o conhecimento da:


a) Fac ( ) b) Média ( ) c) Mediana ( ) d) Moda ( )

5. Determine, a variância do conjunto de dados tabelados abaixo:

Classes Fi
03|―08 5
08|― 13 15
13|―18 20
18|― 23 10
∑(somatório) 50
Autor: Rosângelo Paúnde Página 81
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

6. Com base na distribuição de frequências abaixo, determine o valor do Coeficiente de


Assimetria de Pearson (AS) e o Coeficiente de Assimetria de Bowley (AB) e, classifique-
os.

Classes Fi
02|―06 6
06|― 10 12
10|―14 24
14|― 18 12
18|― 22 6
∑(somatório) 60

7. Sabe-se que uma distribuição apresentou as seguintes medidas: Q 1 = 24,4 cm; Q3 = 41,2
cm; P10 = 20,2 cm e, P90 = 49,5 cm. Com essas medidas, determine o valor do Coeficiente
de Curtose (K) e, classifique-o.

Autor: Rosângelo Paúnde Página 82


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

CONTEÚDOS DA UNIDADE 06: FUNADAMENTOS DE PROBABILIDADE.

 Introdução;
 Conceitos Fundamentais;
 Operações com Eventos
 Conceitos de Probabilidade;
 Axiomas e Teoremas de Probabilidades;
 Exercícios de Consolidação da Unidade.

INTRODUÇÃO

A Estatística, desde as suas origens no antigo Egipto há 2000 anos antes de Cristo (aC),
até meados do século XIX, se preocupava apenas com a organização e apresentação de dados de
observações colectadas empiricamente (Estatística Descritiva).

Somente com o desenvolvimento da Teoria das Probabilidades foi possível que a


Estatística se estruturasse organicamente e ampliasse seu campo de acção, através da criação de
técnicas de amostragem mais adequadas e de formas de relacionar as amostras com as
populações de ondem provieram (Inferência Estatística).

Actualmente, a Teoria da Probabilidade tem um papel importante em quase todos os


ramos da ciência, desde a medicina onde se avaliam os riscos dos efeitos de diversos tratamentos
(por exemplo, na tomada de decisões sobre diversas campanhas) até ao controlo de qualidade,
na indústria, para se obter uma maior precisão nas decisões, perante situações de incerteza
(MURTEIRA & ANTUNES, 2012).

CONCEITOS FUNDAMENTAIS

O objectivo da Teoria da Probabilidade é o de estudar fenómenos aleatórios,


construindo modelos matemáticos, a que chamamos de modelos de probabilidade, que os possam
descrever convenientemente.

Assim, para o entendimento da temática Probabilidades, é pertinente antes de mais, o


entendimento e percepção de alguns conceitos fundamentais, tais como: Experimento

Autor: Rosângelo Paúnde Página 83


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Probabilístico ou Aleatório, denotado por (E), Espaço Amostral, denotado por (S), Evento ou
Acontecimento, denotado por (Qualquer Letra Maiúscula do Alfabeto).

Experimento Probabilístico ou Aleatório (E)

De acordo com PIANA, MACHADO & SELAU (2009, p.68), Experimento


Probabilístico ou Aleatório, é toda a experiência cujos resultados podem não ser os mesmos,
ainda que sejam repetidos sob condições idênticas.

Outrossim, SHIGUTI & SHIGUTI (2006, p.64), definem Experimento Probabilístico


ou Aleatório, como sendo o processo de observação ou medida de um determinado fenómeno
em estudo. Os mesmos autores, acrescentam ainda que, é a experiência que repetida sob as
mesmas condições, conduz a resultados, em geral, distintos.

No entanto, MARTINS (2005, p.130), define Experimento Probabilístico ou


Experiência Aleatória, como o processo de observar um resultado de um fenómeno aleatório2.

Numa experiência aleatória obtém-se um resultado, de entre um conjunto de resultados


conhecidos de antemão, mas não se tem conhecimento suficiente de qual o resultado que sai em
cada realização da experiência. Admite-se ainda que a experiência se pode repetir e que as
repetições são realizadas nas mesmas circunstâncias e são independentes.

Assim, como características desses experimentos temos as seguintes:

 Cada experimento pode ser repetido indefinidamente sob condições inalteradas;


 Embora não possamos afirmar qual o resultado que ocorrerá, é sempre possível descrever
o conjunto de todos os possíveis resultados;

2
Fenómenos Aleatórios, são fenómenos cujos resultados individuais são incertos, mas para os quais se admite uma
regularidade a longo termo, possibilitando a obtenção de um padrão genérico de comportamento. Como exemplos de
fenómenos aleatórios, temos: Chave do totoloto em cada semana; Resposta de uma doença a um tratamento feito
com determinado medicamento; Estado do tempo no dia seguinte; Comportamento dos eleitores nas próximas
eleições legislativas; Comportamento de um aluno no exame de resposta de múltipla escolha, para o qual não
estudou; Comportamento do mercado perante um producto novo para lavar a roupa; etc.

Autor: Rosângelo Paúnde Página 84


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

 Quando o experimento for realizado repetidamente, os resultados individuais parecem


ocorrer de forma acidental, mas se for repetido um grande número de vezes uma
configuração definida ou regularidade surgirá.

Exemplos:

 Contar o número de carros estacionados, na rua, ao sairmos de manhã de casa;


 Perguntar a uma pessoa ao acaso, quantas são as pessoas do seu agregado familiar;
 Lançar uma moeda ao ar e ver o resultado que sai;
 Lançar uma moeda ao ar 20 vezes e ver quantas caras saem;
 Medir o tempo que de manhã levamos a chegar ao emprego;
 Contar o número de desastres que encontramos, em cada dia, na ida para o emprego.

As situações anteriores são exemplos de experiências aleatórias pois, além de envolverem


aleatoriedade, o resultado da experiência está bem especificado. O mesmo não se passa com a
seguinte situação: ao acordar, de manhã, ir à janela. Efectivamente, nesta situação anterior não
se especificou qual o resultado possível, de modo a termos uma experiência aleatória.

Espaço Amostral (S)

SHIGUTI & SHIGUTI (2006, p.64), definem Espaço Amostral como um conjunto de
todas as possíveis ocorrências de um determinado experimento aleatório (E).

Entretanto, PIANA, MACHADO & SELAU (2009, p.68), dizem que, Espaço Amostral,
é o conjunto de todos os possíveis resultados de um experimento aleatório, ou seja, é o conjunto
universo relativo aos resultados de um experimento. Assim, a cada experimento aleatório, está
associado um conjunto de resultados possíveis, ou Espaço Amostral.

Por outro lado, MARTINS ((2005, p.131) define Espaço Amostral, como o conjunto de
todos os resultados possíveis, associados à realização de uma experiência aleatória.

Exemplos:

 No seguinte Experimento Aleatório, que denotaremos por “um” (E1): Lançamento de


um dado ao ar e observar o número na face superior. Assim, para este caso, teremos

Autor: Rosângelo Paúnde Página 85


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

como Espaço Amostral (S) os seguintes: S1 = {1; 2; 3; 4; 5; 6}, visto que, um dado não
defeituoso, contém 6 faces;
 No seguinte Experimento Aleatório, que denotaremos por “dois” (E2): Lançamento de
uma moeda ao ar e observar o valor na face superior. Assim, para este caso, teremos
como Espaço Amostral (S) os seguintes: S2 = {cara; coroa}, visto que, uma moeda não
defeituosa, contém 2 faces, ou seja, cara ou coroa;
 No seguinte Experimento Aleatório, que denotaremos por “três” (E3): Lançamento de
um dado e uma moeda ao ar e observar os números e os valores nas faces superiores.
Assim, para este caso, teremos como Espaço Amostral (S) os seguintes: S3 = {1 e cara; 2
e cara; 3 e cara; 4 e cara; 5 e cara; 6 e cara; 1 e coroa; 2 e coroa; 3 e coroa; 4 e coroa; 5 e
coroa; 6 e coroa}, visto que, um dado não defeituoso, contém 6 faces e uma moeda não
defeituosa, contém 2 faces;

Evento ou Acontecimento (Denotado por qualquer letra maiúscula)

Para PIANA, MACHADO & SELAU (2009, p.68), Evento ou Acontecimento é todo
conjunto particular de resultados do Espaço Amostral (S) ou, ainda, é todo o subconjunto do
Espaço Amostral (S). Geralmente, é denotado por qualquer letra maiúscula do abecedário
português (A; B; C, etc.).

Corroborando com os autores acima, SHIGUTI & SHIGUTI (2006, p.64), definem
Evento ou Acontecimento, como qualquer subconjunto de ocorrências de um determinado
espaço amostral (S).

Por outro lado, MARTINS (2005, p.131) afirma que, Evento ou Acontecimento é o
subconjunto do espaço amostral ou de resultados (S).

Assim, diante dos posicionamentos dos autores acima e, considerando a Experiência


Aleatória (E) que consiste em perguntar a uma pessoa, escolhida ao acaso, quantas pessoas
constituem o seu agregado familiar, o Espaço Amostral ou de Resultados é constituído por
todos os números inteiros não negativos (excluindo o zero). Portanto, alguns acontecimentos
são:

 3 pessoas, que podemos representar por: S = {3}

Autor: Rosângelo Paúnde Página 86


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

 entre 2 e 4 pessoas (inclusive), que pode se representar por: S = {2, 3, 4)


 mais de 3 pessoas, que pode se representar por: S= {4, 5, 6, …}
 menos de 10 pessoas, que pode se representar por: S = {1, 2, …, 9}

De um modo geral os Eventos ou Acontecimentos identificam-se com letras maiúsculas


“A”, “B”, “C”, …, “Z”. Assim, diz-se que se realizou o acontecimento “A”, quando o resultado
da experiência pertence a “A”.

Exemplos:

 S1 = {1; 2; 3; 4; 5; 6}, assim, este Espaço Amostral (S1) é composto de 6 eventos;


 S2 = {cara; coroa}, assim, este Espaço Amostral (S2) é composto de 2 eventos;
 S3 = {1 e cara; 2 e cara; 3 e cara; 4 e cara; 5 e cara; 6 e cara; 1 e coroa; 2 e coroa; 3 e
coroa; 4 e coroa; 5 e coroa; 6 e coroa}, assim, este Espaço Amostral (S 3) é composto de
12 eventos;

Tipos de Eventos ou Acontecimentos

No entanto, alguns dos eventos ou acontecimentos são constituídos por:

1. Um único resultado, desta feita, chama-se Evento ou Acontecimento Elementar.


2. Eventos Compostos, quando constituído por mais de um resultado;
3. Outros ainda, denominados de Eventos ou Acontecimentos Certos, quando constituído
por todos os resultados do espaço amostral (Se A = S);
4. Evento Impossível, se não tiver qualquer elemento do espaço amostral (Se A = ∅).
5. Evento Complementar, que é um outro conjunto formado pelos elementos que
pertencem ao espaço amostral, mas que não pertencem ao conjunto em estudo.

NOTA:

Genericamente, se o número de elementos do espaço amostral de um espaço


amostral finito é “n”, então o número de eventos é dado por 2n, onde a base 2, corresponde o
número de faces possíveis do objecto lançado ao ar. Assim, por exemplo, no lançamento de 5
moedas ao ar, o número de elementos do espaço amostral ou de resultados possíveis é 2 5 = 32.
Portanto, S = 32.

Autor: Rosângelo Paúnde Página 87


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

OPERAÇÕES COM EVENTOS

Conjunto representa uma colecção de objectos. Assim, em geral, os conjuntos indicam-


se por uma letra maiúscula do alfabeto, tal e qual os eventos e, seus elementos por letras
minúsculas. Desta feita, um conjunto pode ser representado por chavetas ou de forma geométrica
(quadros e círculos).

Assim, um conjunto pode igualmente estar representado por Extensão e por


Compreensão. Assim, se os seus elementos estiverem descriminados um por um e separados
por virgulas, diz-se por Extensão. De contrário, se os seus elementos estiverem definidos por
uma propriedade característica de todos os elementos, diz-se por Compreensão.

Portanto, através do diagrama de Venn, os conjuntos são representados, graficamente, ou


seja, todos os elementos são representados por pontos dentro duma linha fechada e, junto de cada
ponto está a designação de cada elemento.

Cardinal de um Conjunto (#)

O cardinal de um conjunto finito A é o número de elementos deste conjunto. Assim, do


conjunto A, representa-se por: #A. Exemplo: Se A = {a, b, c, d}, diz-se que o cardinal é #A = 4.

União de Conjuntos (∪)

A União de acontecimentos A e B é o acontecimento que se realiza quando se realiza A


ou B ou ambos. E, representa-se por A ∪B e é formado pelos resultados que pertencem a pelo
menos um dos acontecimentos.

Intersecção de Conjuntos (∩)

A intersecção de acontecimentos A e B é o acontecimento que se realiza se e só se (sse)


A e B se realizam simultaneamente. E, representa-se por A ∩ B e é constituído pelos resultados
comuns de A e B.

Autor: Rosângelo Paúnde Página 88


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Complementar de um Conjunto ou Acontecimento Contrário ( A )

O complementar de um conjunto “A” ou acontecimento contrário de “A” em relação a


um dado espaço amostral (S), é o acontecimento constituído por todos os resultados do espaço
amostral (S) que não pertençam a “A”. E, representa-se por A . Assim:

A ∪ A=S e , A ∩ A=∅

Outrossim, dados dois conjuntos A e B, chama-se complementar de “B” em relação a


“A”, ao conjunto dos elementos de “A” que não pertencem a “B”. E, representa-se por A \ B ou
A – B, onde lê-se “A” menos “B” ou Diferença de “A” e “B”.

Conjuntos Disjuntos

Os acontecimentos disjuntos, incompatíveis ou mutuamente exclusivos, são


acontecimentos que não tem resultados comuns e, portanto, a realização de um deles implica, a
não realização do outro. Logo:

A ∩ B=∅

Relação de Pertença (∈)

Esta relação serve para indicar se um elemento pertence ou não a um conjunto.

Exemplo:

a ∈ A → lê−se a pertence ao conjunto A ;

2 ∉ A →lê−se 2 nåo pertence ao conjunto A .

Portanto, esta relação só se estabelece entre o elemento e o conjunto.

Relação de Inclusão

Serve para indicar se um conjunto está contido ou não noutro conjunto, ou seja, se é ou
não seu subconjunto.

A ⊂B → lê−se A está contido ou é sub conjunto de B;

Autor: Rosângelo Paúnde Página 89


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

B⊄ A → lê−se B nåo está contido ou nåo é subconjunto de A .

Portanto, esta relação só se estabelece entre conjuntos.

PROBABILIDADES. CONCEITOS.

Na linguagem corrente, a noção de probabilidade é utilizada sem qualquer definição


precisa do seu significado, contudo, a teoria das probabilidades, sendo uma disciplina da
Matemática, deve tornar esta noção precisa. Por isso, a primeira definição de probabilidade foi
estabelecida por LAPLACE em 1812.

AXIOMAS E TEOREMAS DE PROBABILIDADES

Axioma 1: Diz que, a probabilidade de um acontecimento A é um n° real de 0 a 1.


Assim, teremos:

0 ≤ P(A )≤ 1

Axioma 2: A probabilidade do acontecimento certo é 1. Assim, se A é um evento ou


acontecimento certo, assim teremos:

P ( A )=1

Axioma 3: A probabilidade da reunião de dois acontecimentos certos disjuntos, ou seja,


mutuamente exclusivos, é igual a soma das probabilidades desses acontecimentos. Assim,
teremos:

P ( A ⋃ B )=P ( A ) + P ( B ) ; se A ∩ B=∅

PORTANTO, A PARTIR DESTES AXIOMAS 3, PODEMOS DEDUZIR OS


TEOREMAS SEGUINTES:

Teorema 1: A probabilidade do acontecimento contrario é:

P ( A )=1−P (A )

Teorema 2: A probabilidade do acontecimento impossível é zero.


3
São verdades inquestionáveis, universalmente válidas, muitas vezes utilizadas como princípios na construção de
uma teoria ou como base para uma argumentação.
Autor: Rosângelo Paúnde Página 90
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

P(∅)=0

Teorema 3: Se A e B são acontecimentos não disjuntos, têm-se:

P ( A ⋃ B )=P ( A ) + P ( B )−P ( A ∩ B ) ; se A ∩B ≠ ∅ , emque ∅ é o conjunto impossível

Assim, a Lei de Laplace, enuncia o seguinte: “Se uma experiência aleatória pode ter “N”
resultados mutuamente exclusivos e igualmente possíveis, e se desses resultados, “n” têm um
n
certo atributo “A”, então a probabilidade de “A” é dada por . E, habitualmente escreve-se:
N

n N ° de Casos Favoráveis do Acontecimento A


P ( A )= → P ( A )=
N N ° de Casos Possíveis

Exemplo:

1. Calcule a probabilidade de que, num lançamento de um dado perfeito/honesto com as


faces numeradas de 1 a 6, se obtenha:
1.1 Um número par:

Dados:

N° de Casos Possíveis = 6 faces, que corresponde ao espaço amostral do dado: S = {1, 2,


3, 4, 5, 6};

N° de Casos Favoráveis = 3 faces, que corresponde ao que pretendemos que saia (Par):
A = {2, 4, 6}.

n N ° de Casos Favoráveis 3 1
P ( A )= → P ( A )= → P ( A )= → P ( A )= → P ( A )=0,5→ P ( A )=50 %
N N ° de Casos Possíveis 6 2

1.2 Um número não inferior a 5.

Dados:
Autor: Rosângelo Paúnde Página 91
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

N° de Casos Possíveis = 6 faces, que corresponde ao espaço amostral do dado: S = {1, 2, 3,


4, 5, 6}

N° de Casos Favoráveis = 2 faces, que corresponde ao que pretendemos que saia (N° não
inferior a 5): A = {5, 6}.

n N ° de Casos Favoráveis 2 1
P ( A )= → P ( A )= → P ( A )= → P ( A )= → P ( A ) =0,3333 → P ( A )=33,33 %
N N ° de Casos Possíveis 6 3

2. Calcule a probabilidade de que, no lançamento de uma moeda perfeita/honesta ao ar sair:


2.1 Cara;

Dados:

N° de Casos Possíveis = 2 faces, que corresponde ao espaço amostral da moeda: S =


{cara, coroa};

N° de Casos Favoráveis = 1 face, que corresponde ao que pretendemos que saia (cara):
A = {cara}.

n N ° de Casos Favoráveis 1
P ( A )= → P ( A )= → P ( A )= → P ( A ) =0,5→ P ( A )=50 %
N N ° de Casos Possíveis 2

2.2 Coroa.

Dados:

N° de Casos Possíveis = 2 faces, que corresponde ao espaço amostral da moeda: S =


{cara, coroa};

N° de Casos Favoráveis = 1 face, que corresponde ao que pretendemos que saia (coroa):
A = {coroa}.

n N ° de Casos Favoráveis 1
P ( A )= → P ( A )= → P ( A )= → P ( A ) =0,5→ P ( A )=50 %
N N ° de Casos Possíveis 2

3. Extrai-se uma carta, ao acaso, de um baralho de 52 cartas. Vamos calcular a


probabilidade de que:
3.1 A carta extraída seja um Rei;
Autor: Rosângelo Paúnde Página 92
Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

Dados:

N° de Casos Possíveis = 52, que corresponde ao espaço amostral de um baralho, que


contém 52 cartas: S = {52 cartas};

N° de Casos Favoráveis = 4 Reis, que corresponde ao que pretendemos que saia (Rei): A
= {há 4 reis num baralho}.

n N ° de Casos Favoráveis 4 1
P ( A )= → P ( A )= → P ( A )= → P ( A )= → P ( A )=0,0769 → P ( A ) =7,69 %
N N ° de Casos Possíveis 52 13

3.2 A carta extraída seja copas;

Dados:

N° de Casos Possíveis = 52, que corresponde ao espaço amostral de um baralho, que


contém 52 cartas: S = {52 cartas};

N° de Casos Favoráveis = 13 Copas, que corresponde ao que pretendemos que saia


(Copas): A = {há 13 cartas de copas num baralho}.

n N ° de Casos Favoráveis 13 1
P ( A )= → P ( A )= → P ( A )= → P ( A ) = → P ( A )=0,25 → P ( A )=25 %
N N ° de Casos Possíveis 52 4

Exercícios de Consolidação da Unidade

1. Seja o experimento “E” o lançamento de um dado honesto ao ar. Qual a probabilidade de


o evento “A”:
1.1 Sair números maiores e iguais a 2?
1.2 Sair um número ímpar?
2. No lançamento de duas moedas não defeituosas ao ar, qual é a probabilidade de se obter:
2.1 Duas caras;

Autor: Rosângelo Paúnde Página 93


Apontamentos da Disciplina de Introdução à Estatística – UniSave - Maxixe

2.2 Uma cara e uma coroa.


3. O António abre ao acaso, um livro, ficando a vista duas páginas numeradas. Qual é a
probabilidade de a soma dos números dessas duas paginas ser impar?
4. Dos ouvintes da Rádio Moçambique, 37% ouvem o programa RM Desporto; 53% ouvem
o programa Nogoma Moçambique e 15% ouvem ambos os programas. Ao escolher
aleatoriamente um ouvinte desta estacão radiofónica, qual é a probabilidade de que:
4.1 Escute apenas um dos referidos programas;
4.2 Não escute nenhum destes dois programas.

Autor: Rosângelo Paúnde Página 94

Você também pode gostar