Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Distribuição de Frequências

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 14

Tópico 02

Estatística Básica

Distribuição de Frequências

1. Introdução
Como forma de apresentar os dados sintetizados, utilizamos tabelas e gráficos. Ao
longo deste conteúdo, veremos os recursos adequados para cada tipo de variável, os
elementos de frequência para analisar a distribuição dos dados, e os tipos de gráficos.

2. Distribuição de Frequência
Ao resumimos os dados, estamos interessados em conhecer o comportamento da
variável. Nesta seção, veremos as formas de organizar um conjunto de observações
em uma tabela para analisarmos sua distribuição, conforme o tipo de variável:
qualitativas (nominais e ordinais), quantitativos (discretos e contínuos).

Para dados qualitativos (nominais e ordinais)


Quando dispomos de dados qualitativos, os recursos são limitados para estudarmos a
distribuição de frequências.

Os elementos utilizados para estas variáveis são as frequências absolutas


(fi) e frequências relativas (fRi) . A frequência absoluta é uma contagem de cada
categoria e a relativa é a proporção de cada categoria em relação ao total. Esta
proporção também pode ser apresentada em percentual, quando multiplicada por
100.
De forma geral, a apresentação da tabela para este tipo de dados seria:

Onde:fi = frequência absoluta na categoria


ifri = frequência relativa na categoria in
= tamanho amostral Elementos de uma tabela de
frequência para variável qualitativa.

Para dados quantitativos (discretos e contínuos)


Para as variáveis quantitativas, além dos elementos citados, ainda podemos
acrescentar a frequência absoluta acumulada (Fi) e a frequência relativa acumulada
(FRi).

Este elemento indica quantas classes, ou que porcentagem delas, estão abaixo de um
certo valor.

De forma geral, a apresentação da tabela para este tipo de dados seria:

Onde:fi = frequência absoluta na classe ifri =

frequência relativa na classe iFi = frequência absoluta


acumulada na classe iFRi = frequência relativa
acumulada na classe in = tamanho
amostral Elementos de uma tabela de frequência
amostral Elementos de uma tabela de frequência
para variável quantitativa.

Para resumir uma variável contínua em uma tabela, é comum utilizarmos classes.

A escolha dos limites dos intervalos é arbitrária e varia com a natureza dos dados. É
conveniente que as classes possuam a mesma amplitude, isto é, contenham o mesmo
tamanho de intervalo. Devemos ter cuidado também com a quantidade de intervalos:
com poucas classes perdem-se muitas informações, e com muitas classes perde-se a
finalidade de resumir dados. Existem algumas fórmulas que podem ser empregadas
para determinar o número de classes, quando não conhecemos a natureza dos dados.
São elas:

Onde C é a quantidade de classes e “n” é o tamanho amostral. A figura abaixo mostra


a relação entre a quantidade de classes e o número de casos.
Número de classes em função de n empregando algumas
aproximações.

Para calcularmos o tamanho de cada intervalo (h), dividimos a amplitude total


(maior valor observado menos o menor valor observado) pela quantidade de
intervalos. A notação utilizada para cada intervalo é “li |— ls”, onde “li” é o limite
inferior e “ls” é o limite superior da classe. O ponto médio (xi) de cada classe é feito
por (li + ls) / 2.


Você pode obter mais conjuntos de dados para exercitar seus conhecimentos.

https://www.ime.usp.br/~jmsinger/MorettinSinger/

Exemplo prático: o conjunto de dados fictício abaixo nos dá algumas informações


sobre 10 alunos da UVV.

Apresentando as distribuições de frequências para a variável qualitativa nominal


(sexo), qualitativa ordinal (escolaridade da mãe), quantitativa discreta (quantidade
de irmãos) e quantitativa contínua (altura em metros):

Elementos de uma tabela de frequência para


variável qualitativa nominal, exemplo prático,
variável sexo.

Elementos de uma tabela de frequência para variável


qualitativa ordinal, exemplo prático, variável escolaridade
da mãe.

Elementos de uma tabela de frequência para variável


quantitativa discreta, exemplo prático, variável quantidade
de irmãos
Elementos de uma tabela de frequência para variável quantitativa contínua,
exemplo prático, variável altura.

?
A elaboração correta dos elementos de frequência é muito importante.
Entretanto, saber interpretá-los é primordial. Como você explicaria as
informações de uma tabela?

Resumindo a elaboração das classes para dados contínuos, quando não se conhece
previamente a natureza dos dados:

Passo 1: determinar o número de classes com alguma das 4 fórmulas apresentadas.

Passo 2: calcular a amplitude total (AT), subtraindo o valor da maior observação pelo
valor da menor observação.

Passo 3: calcular o tamanho da amplitude de cada classe (h), dividindo o tamanho da


amplitude total pela quantidade de classes. Caso o número calculado resulte em um
número não inteiro, recomenda-se que arredonde para o próximo maior valor inteiro,
para que a distribuição contemple todos os dados.

h = AT/C
Passo 4: montar as classes de forma que o limite inferior da primeira classe seja o
menor valor observado e o limite superior da primeira classe seja a soma do limite
inferior mais o valor calculado da amplitude de classe.

Passo 5: para as demais classes, seguimos somando os limites das classes (inferior e
superior) com o valor calculado da amplitude de classe.

Passo 6: calcular o ponto médio de cada classe.


Aprenda a como criar uma tabela dinâmica no Excel com este tutorial
da Microsoft.

https://support.microsoft.com/pt-br/office/criar-uma-tabela-
din%C3%A2mica-para-analisar-dados-da-planilha-a9a84538-bfe9-40a9-
a8e9-f99134456576

3. Gráficos
Os gráficos são uma representação visual das informações que também nos dão uma
ideia de distribuição dos dados. Atualmente, um grande número
de softwares encontra-se à nossa disposição para criar gráficos estatísticos. Existem
gráficos que são mais adequados, dependendo do tipo de variável.


Os recursos gráficos trazem um grande impacto ao apresentar as
informações. Florence Nightingale, uma importante enfermeira inglesa que
atuou durante a Guerra da Crimeia, mostrou através do Diagrama de Rosa
que infecções hospitalares matavam mais pacientes do que os próprios
combates.

https://pet-estatistica.github.io/site/download/posts/postHELEN.html

Para dados qualitativos (nominais e ordinais)


Os gráficos de setores (ou gráfico de pizza) é uma representação na qual os
semicírculos estão divididos de forma proporcional à frequência apresentada. Em
decorrência desta característica, ele é melhor descrito quando são utilizadas
frequências relativas.

Gráfico de setor com dados do exemplo prático, variável


qualitativa nominal sexo.

Os gráficos em barras e os gráficos em colunas consistem em retângulos cuja


magnitude representa a frequência absoluta ou relativa. Os retângulos são
posicionados de forma espaçada uns dos outros. Os retângulos dos gráficos em
colunas são posicionados de forma vertical e dos gráficos em barras, de forma
horizontal. A diferença na utilização do gráfico de barras e de colunas é
essencialmente estética: quando o nome dos rótulos das categorias é extenso, opta-se
pelo gráfico em barras.

Gráfico de barras com dados do exemplo prático, variável


qualitativa ordinal, escolaridade da mãe.

Para dados quantitativos (discretos e contínuos)


Para dados quantitativos discretos, podemos utilizar os gráficos de
colunas anteriormente mencionados.

Gráfico de colunas com dados do exemplo prático, variável


quantitativa discreta, quantidade de irmãos.
Para representar dados quantitativos contínuos, podemos utilizar o histograma. O
histograma é um gráfico composto por retângulos justapostos, com bases
proporcionais aos intervalos das classes e a área de cada retângulo proporcional à
respectiva frequência. Este gráfico é mais indicado quando queremos apresentar
dados que possuam distribuição Gaussiana (ou Normal). A partir do gráfico do
histograma, podemos construir o polígono de frequências. O polígono utiliza a
mesma base do histograma e a altura é o ponto médio ligada à frequência. Cada
ponto é conectado entre si por linhas retas, formando, assim, um polígono.

Histograma com dados do exemplo prático, variável quantitativa


contínua, altura (em metros).
Polígono de frequências com dados do exemplo prático, variável
quantitativa contínua, altura (em metros).

Além do histograma e do polígono de frequências, podemos construir um Box-


Plot para representar dados quantitativos contínuos. Este gráfico é mais indicado
quando queremos apresentar dados que não possuam distribuição Gaussiana (ou
Normal). Ele resume e abrange medidas de posição, dispersão, assimetria, amplitude
e dados discrepantes (também chamados por valores atípicos ou outliers).

Esquema para construção de um box-plot, onde Q1=primeiro


quartil, Q2=segundo quartil (ou mediana), Q3=terceiro quartil,
LS=limite superior, LI=limite inferior



Saiba um pouco mais sobre os gráficos estatísticos neste vídeo

Gráficos Estatísticos

Representação Grá/ca | Estatística

?
Será que podemos representar mais de uma variável em um único gráfico? E
combinar diferentes tipos de variáveis em um único gráfico?

4. Referências
ARANGO, Hector Gustavo. Bioestatística – Teórica e Computacional. 3. ed.
Barueri: Grupo GEN, 2009.
MORETTIN, Pedro Alberto; BUSSAB, Wilton Oliveira. Estatística básica. São
Paulo: Saraiva Educação SA, 2017.

VIEIRA, Sonia. Estatística básica. 2ª edição revista e ampliada. São Paulo:


Cengage Learning Brasil, 2018.

YouTube. (2020). Salvando o Semestre. Representação Gráfica. 9min19.


Disponível em: <https://www.youtube.com/watch?v=DTlUwN0FHXg>.

Parabéns, esta aula foi concluída!


O que achou do conteúdo estudado?

Péssimo Ruim Normal Bom Excelente

Deixe aqui seu comentário

Mínimo de caracteres: 0/150

Enviar

Você também pode gostar