Ma_Re_A05_WEB
Ma_Re_A05_WEB
Ma_Re_A05_WEB
Como Organizá-los?
Dados Numéricos e as Distribuições de Freqüências
Dados Discretos: Organização Tabular
Dados Contínuos: Distribuição de Freqüências
em Intervalos de Classe
Tipos de Freqüências
aula
05
Apresentação
N
a aula 4 (Gráficos estatísticos: uma síntese dos dados), tratamos da apresentação de
dados qualitativos. Agora, aprenderemos como organizar e apresentar em tabelas os
valores assumidos por uma variável de natureza quantitativa. Portanto, lidaremos,
necessariamente, com dados numéricos; sejam eles discretos ou contínuos. Observações
estatísticas com essa característica (dado numérico) geram um tipo particular de série co-
nhecida como distribuição de freqüências. Esse será o assunto enfocado neste texto. Ve-
remos como devem ser estruturadas as tabelas para exposição de dados tanto discretos
quanto contínuos. Também trabalharemos conceitos importantes, como: limites de classe,
tipos de freqüências, ponto médio de classe, entre outros. A apresentação gráfica dessa série
será estudada em nossa próxima aula.
Para a compreensão deste material didático, você precisa manter uma leitura atenta e
ter conhecimentos básicos – as quatro operações e proporções – e também sobre raiz qua-
drada. Exemplos e exercícios acompanham todo o texto e irão ajudá-lo a entender o assunto
explorado.
Objetivos
Pretendemos que esta aula, além de evidenciar a importância de
saber condensar observações estatísticas de natureza quantitativa,
ajude você na construção de conhecimentos sobre a organização
tabular para esses dados – discretos e contínuos –, de modo que
aprenda a elaborar distribuições de freqüências para apresentá-
los. Ademais, nos esforçamos para que você possa desenvolver
habilidades que lhe permita extrair e interpretar informações so-
bre o comportamento de variáveis quantitativas a partir de tabelas
com tais distribuições.
A
ntes de começar, vamos revisar um pouco? Na aula 2 (A estatística: do senso comum
ao conhecimento científico), destacamos a definição: “Variáveis quantitativas são
aquelas que assumem somente valores numéricos”. Veja, por exemplo, os possíveis
resultados obtidos quando se pergunta: “Qual o número de pessoas na sua residência?” ou
“Qual o seu peso?”. Certamente, devem ser expressos em números, porém, será que há
alguma diferença entre as possíveis respostas para cada uma das questões? Seguramente,
sim.
Na primeira delas, o resultado é sempre conseqüência de uma contagem, assim,
somente têm sentido respostas com números inteiros: 1; 2; 3... (no caso específico, sem
contar com o zero). Esses são dados discretos. Para a segunda pergunta, teoricamente,
qualquer valor, entre o menor e o maior peso, pode aparecer como resposta. Teremos,
então, dados contínuos, pois, nesse caso, não podemos fazer uma associação com os
números naturais. Tal diferença na característica desses dados nos leva a organizá-los de
forma distinta em relação à distribuição de suas freqüências.
Vamos iniciar a partir de um exemplo com dados discretos? Imagine a seguinte situação
(fictícia): você é professor(a) de Matemática, na Escola Estadual Nair Burégio, de várias
turmas da 8a série do Ensino Fundamental, sendo umas, matutinas, e outras, noturnas, no
município de Carapeba. Para acompanhar o desempenho de seus alunos, você procura
analisar o comportamento das notas de um teste objetivo, com dez questões, aplicado no
final do trimestre. (Nesse teste de múltipla escolha, cada questão vale 1,0 ponto e o aluno
apenas marca um “X” na alternativa que ele julgar certa). Essa análise é feita a partir do estudo
de duas amostras: uma com 54 alunos das turmas da manhã, outra com 52 da noite.
Quais são as possíveis notas dos alunos nesse teste? Será que você pensou:
0;1;2;... ;10? Muito bem, você acertou! Pois, em cada questão, o aluno simplesmente
acerta ou erra. Assim, os resultados só poderão ser valores inteiros, variando de zero a
10 pontos. Com isso, teremos dados discretos para essa pontuação, não é?
Suponha que, na amostra, as notas do teste objetivo desses alunos, obtidas na
mesma seqüência da lista de chamada, referentes ao primeiro trimestre do ano passado
(não esqueça, são dados fictícios) foram:
8 7 6 9 7 5 5 7 6 6 5 8 6 7
6 9 9 8 7 5 6 8 8 8 7 5 8 7
8 6 7 4 5 8 9 9 8 5 8 7 7 4
9 9 5 6 7 7 6 8 7 6 7 7
9 8 6 7 5 9 7 5 6 8 4 7 6 8
6 5 7 6 7 8 5 6 7 6 6 5 9 6
6 7 4 8 3 9 4 8 5 8 7 8 6 9
7 8 6 5 7 5 8 6 7 6
Diante disso, nossa primeira providência será ordenar todos os valores. Essa
organização (de forma crescente ou decrescente) já nos fornece um entendimento sobre
eles (normalmente, são ordenados do menor para o maior). O conjunto formado por todos
os dados brutos que foram organizados em ordem de grandeza (inclusive, com todas as
repetições) é chamado de rol. Lembre-se:
C
onsidere os dados associados à amostra das turmas da manhã. Tente fazer agora,
o rol para essa turma, ordenando os valores de forma crescente (começando pelo
menor valor). Depois, confira o resultado.
Rol – Amostra da pontuação nas turmas da manhã (54 valores ordenados por linha):
4 4 5 5 5 5 5 5 5 5 6 6 6 6
6 6 6 6 6 6 7 7 7 7 7 7 7 7
7 7 7 7 7 7 7 8 8 8 8 8 8 8
8 8 8 8 8 9 9 9 9 9 9 9
Atividade 1
Construa a seguir o rol referente à amostra das turmas da noite (52
1 valores).
Observe atentamente o rol de cada uma das turmas. Assim, você terá uma idéia melhor
da situação, concorda? Na amostra da manhã, por exemplo, podemos ver claramente que a
menor pontuação obtida foi 4 e a maior foi 9, portanto, ninguém acertou todas as questões,
não é mesmo? Note também que os valores se repetiram com muita freqüência. Em geral,
isso acontece quando os dados são discretos.
Para essas considerações, nos baseamos apenas no rol, o qual constitui uma primeira
etapa na organização de dados quantitativos e já nos ajuda de início.
Exibiremos, neste momento, a distribuição de freqüências para a pontuação no teste
objetivo na amostra das turmas da manhã e, em seguida, explicaremos sua elaboração.
Variável estudada (X i)
Freqüência observada (f i)
(Dados originais)
TOTAL
Atividade 2
Teste seus conhecimentos, construindo uma distribuição de freqüên-
1 cias para os dados da amostra das turmas da noite, composta por
52 valores. Em seguida, faça uma análise e teça seus comentários.
Confronte seus resultados com os obtidos pelos alunos da turma da
manhã. Quais suas conclusões sobre o desempenho desses alunos?
V
amos começar com um exemplo? Imagine que, além da pontuação naquele teste
objetivo, você analisa o comportamento da média trimestral de seus alunos. Tal
média é obtida a partir das três notas das provas mensais. Em cada uma, a nota pode
variar de zero a 10,0 pontos. Logo, a média trimestral de um aluno pode assumir qualquer
valor no intervalo de zero a 10 (inclusive o zero e o dez). Isso significa que os dados
referentes à pontuação dessa média são do tipo contínuo.
Suponha que os valores seguintes correspondem a essas médias, no primeiro trimestre,
obtidas na seqüência da lista de chamada:
5,0 6,5 7,7 8,2 7,1 5,4 8,3 9,0 8,0 5,9 8,5 6,3 6,6 9,7
7,0 8,0 7,0 4,7 9,4 7,0 9,5 7,5 8,7 7,1 6,0 8,4 7,9 6,4
4,0 8,8 6,4 7,8 5,7 8,8 3,1 8,1 9,6 4,2 7,2 7,3 3,1 9,0
9,0 7,4 6,8 5,0 8,1 9,9 5,7 6,7 7,6 5,3 8,6 7,4
4,0 5,1 6,0 4,1 5,2 8,7 5,2 4,2 7,1 5,7 8,8 8,2 6,8 5,5
3,0 4,8 5,3 3,0 6,5 5,3 3,1 9,3 4,0 4,4 7,0 4,7 5,5 7,5
3,5 9,5 4,2 5,8 4,0 6,5 6,2 5,1 5,0 6,8 3,8 4,9 5,3 3,6
7,9 5,3 6,7 8,4 6,0 4,9 7,3 4,5 9,9 5,9
Você está diante de dois conjuntos de dados estatísticos – dados brutos – os quais,
juntos, totalizam 106 números (54 + 52). Novamente, perguntamos: com valores assim
desordenados, teremos condições de analisar o desempenho desses alunos? Com certeza,
você concordará conosco: NÃO! Dados com essa apresentação não contribuem para uma
leitura do que está ocorrendo. Então, nossa primeira providência será ordená-los.
Rol - médias trimestrais - amostra das turmas da MANHÃ (ordenados por linha):
3,1 3,7 4,0 4,2 4,7 5,0 5,0 5,3 5,4 5,7 5,7 5,9 6,0 6,3
6,4 6,4 6,5 6,6 6,7 6,8 7,0 7,0 7,0 7,1 7,1 7,2 7,3 7,4
7,4 7,5 7,6 7,7 7,8 7,9 8,0 8,0 8,1 8,1 8,2 8,3 8,4 8,5
8,6 8,7 8,8 8,8 9,0 9,0 9,0 9,4 9,5 9,6 9,7 9,9
Você está diante de um conjunto de dados do tipo contínuo (no caso anterior, os dados
eram discretos, lembra?). Antes de prosseguir com a leitura deste texto, pare um pouco e
examine com muita atenção esse rol. Compare-o com o anterior, o da pontuação com dados
discretos da amostra da manhã. No caso dessas médias, os valores também são muito
repetitivos?
Com certeza, você deve ter constatado que, nessa amostra, as observações não se
repetiram muito. Em geral, essa é uma característica de valores amostrais associados a
uma variável do tipo contínua. Dados numéricos (discretos ou contínuos) com essa carac-
terística são organizados de forma diferente daquela anterior, pois, para serem condensados
e apresentados em tabelas, são agrupados adequadamente em intervalos. Esse procedi-
mento, embora nos exponha ao risco de perder alguma informação, já que renunciamos aos
próprios dados originais presentes no rol, nos oferece muitas vantagens e é de fundamental
importância para a apresentação de resultados numéricos quando aparecem com muita va-
riabilidade entre si. Por exemplo, no caso das médias trimestrais para a turma da manhã, a
distribuição de freqüências para dados agrupados pode ser deste modo:
Analise bem essa tabela. Verifique que as observações originais constantes no rol,
não aparecem mais de forma individual na primeira coluna, como na Tabela 1. Agora, essa
coluna é ocupada com 7 intervalos. Estes contêm todos os valores da amostra estudada e são
também chamados de classes ou intervalos de classes. Nessa distribuição, eles possuem
o mesmo peso: todos iguais a 1,0 ponto. Você pode constatar que cada classe é limitada por
dois valores: o limite inferior (li ) − o menor deles − e o limite superior (Li ), o maior. Estes
Analise bem essa tabela. Verifique que as observações originais constantes no rol,
estão separados pelo símbolo “”. Mas, você sabe o que isso significa?
Pode-se entender como sendo uma maneira de estabelecer de que lado o intervalo é
não aparecem mais de forma individual na primeira coluna, como na Tabela 1. Agora, essa
aberto e onde ele é fechado. A regra é clara: pertence à classe aquele limite que estiver
posicionado junto ao traço vertical; caso contrário, ele não pertencerá ao intervalo.
Para esclarecer melhor, consideremos, por exemplo, a 6a classe. Ela é representada por
colunaéocupadacom7intervalos. Estescontêmtodososvaloresdaamostraestudadaesão
8 9. Veja que o limite inferior 8 está junto ao traço vertical e o limite superior 9, não. Con-
seqüentemente, 8 pertence a esse intervalo, enquanto o valor 9, não. Assim, concluiremos
Pode-se entender como sendo uma maneira de estabelecer de que lado o intervalo é
limites inferiores pertencem ao intervalo e todos os limites superiores, não.
aberto e onde ele é fechado. A regra é clara: pertence à classe aquele limite que estiver
Aula 05 Matemática e Realidade 11
Atividade 4
Calcule a amplitude total para os dados da amostra das turmas da
1 noite.
Não esqueça:
h = tamanho das classes em uma distribuição de freqüências
A amplitude total deve ser subdividida em quantas classes? Por que no exemplo da
Tabela 2 há sete intervalos?
O número de classes em uma distribuição, na linguagem estatística, é referido como K
e depende da quantidade de dados que serão tabelados. Em geral, os autores recomendam
que as distribuições de freqüências tenham, no mínimo, 5 e, no máximo, 20 intervalos.
Adotaremos, então, essa sugestão: 5 K 20. O objetivo dela é evitar distribuições com um
número muito reduzido ou muito grande de intervalos, pois assim é possível que se torne
bastante difícil identificar tendências (algum padrão) que nos informem sobre o comporta-
mento dos dados. Porém, não há regra única e rígida sobre o número de classes de uma
distribuição. Como sugestão, apresentaremos uma regra que poderá ser alterada, de acordo
com o bom senso e a experiência do próprio pesquisador. Podemos encontrar K, o número
de classes de uma distribuição, através da expressão:
√ √
k∼
= número de valores a serem tabelados. Isto é, k∼
= n.
No caso das médias, a amostra das turmas da manhã é composta de 54 valores. Por-
tanto, .
Logo, podemos ter K = 7 ou K = 8 intervalos. Escolhemos K = 7 porque com esse nú-
mero, como veremos a seguir, as classes puderam ficar, todas, com tamanho igual a 1. Isso
traz a vantagem de facilitar ainda mais a leitura dos dados. Assim, a distribuição da Tabela 2
se apresenta com sete intervalos de classe ou simplesmente sete classes.
Como encontramos o tamanho das classes, h = 1,0 ponto, para os dados da turma da
manhã? Veja bem, a amplitude total nessa amostra foi At = 6,8 pontos. Esse valor dividido
pelo número de intervalos K, que, nesse exemplo foi 7, nos dará o tamanho das classes da
distribuição. Assim, temos que:
Vamos calcular o tamanho dos intervalos para as turmas da manhã? Substitua os valo-
res, calcule e, só depois, confira!
Atividade 5
1
Qual o tamanho dos intervalos para os dados das turmas da noite?
Observe o rol e veja que no caso das médias na amostra da manhã, o mínimo foi 3,1
pontos. Escolhemos como limite inferior do 1o intervalo, o valor (arredondado) igual a 3,0.
A partir dele, estabelecemos todas as classes, considerando h = 1,0 ponto. Em seguida, con-
tamos todas as freqüências associadas às respectivas classes. Anotamos cada resultado − a
freqüência absoluta de classe (fi ) − ao lado do respectivo intervalo, na coluna à direita. Após
essa etapa, concluímos a tabela, colocando o título e a fonte!
Atividade 6
100
Por exemplo, temos as freqüências acumuladas abaixo de:
4,0 pontos 2
5,0 pontos 2+3=5
6,0 pontos 2 + 3 + 7 = 12
e assim consecutivamente. Vamos tentar concluir essas freqüências? Continue essa
tarefa e depois confira os seus resultados através da Tabela 3.
Como calculamos as freqüências acumuladas “acima de” (Fi ↑)?
De modo semelhante às acumuladas “abaixo de” (Fi ↓), porém com um detalhe que
as diferencia. Por exemplo, veja se você consegue responder: quantos alunos tiveram uma
média maior ou igual a 7,0 pontos? Você terá que somar a freqüência absoluta simples (fi )
do intervalo 7 8, que é 14, com as freqüências absolutas simples de todos os outros que
sucedem esse intervalo.
Portanto, teremos que somar: 14 + 12 + 8 = 34.
O que significa 34? É o número de alunos, nessa amostra, que teve uma média igual ou
maior a 7,0 pontos.
Em síntese: para calcular a freqüência acumulada “acima de” (Fi ↑) correspondente a
qualquer intervalo i , basta somar a freqüência absoluta simples fi dessa classe i com as
fi s de todas os intervalos que sucedem essa classe de referência i .
i + Li
b) Xi = ;
2
1 3+4
X1 = 3 + = 3, 5 ou X1 = = 3, 5;
2 2
1 4+5
X2 = 4 + = 4, 5 ou X2 = = 4, 5.
2 2
Observe como os dados organizados podem nos dar informações sobre uma deter-
minada situação a que se referem! Note como é importante saber confeccionar e ler as
Resumo
Nesta aula, aprendemos como organizar dados quantitativos, construindo
distribuições de freqüência para eles. Explicamos como são elaboradas as
tabelas de freqüências quando os dados precisam ser agrupados ou não
em classes. Definimos e exploramos ponto médio e os diversos tipos de
freqüências. Insistimos na importância da compreensão do comportamento da
variável pesquisada para subsidiar sua análise, pois a interpretação de uma
distribuição de freqüências nos permite chegar a conclusões pertinentes sobre
a situação pesquisada.
Auto-avaliação
Vamos ver o que aprendemos? Considere a amostra constituída pelos 52 alunos das
turmas da noite. Essa amostra nos forneceu dois conjuntos de dados (fictícios, lembre-se!):
o conjunto formado pela pontuação obtida por esses alunos, no teste objetivo e o conjunto
constituído pelas suas médias trimestrais. Com isso,
examine com muita atenção essas tabelas com as distribuições que você cons-
2 truiu. Procure analisar esses resultados e tirar suas conclusões. Compare-os com
aqueles referentes à amostra das turmas da manhã, apresentados neste texto. O
que você pode dizer sobre o desempenho desses alunos em Matemática, nessas
turmas? Há alguma diferença entre essas duas amostras? Teça seus comentários
e apresente suas conclusões.
Pontuação No de Fi ↓ Fi ↓ % Fi ↑ Fi ↑ %
(Xi ) alunos f% “abaixo “abaixo “acima “acima
(fi ) de” de” de” de”
4 2 3, 7 2 3, 7 54 100, 0
5 8 14, 8 10 18, 5 52 96, 3
6 10 18, 5 20 37 44 81, 5
7 15 27, 8 35 64, 8 34 63, 0
8 12 22, 2 47 87, 0 19 35, 2
9 7 13, 0 54 100, 0 7 13, 0
Total 54 100, 0 —— —— —— ——
3
7 9
8 5
DOWNING, D.; CLARK, J. Estatística aplicada. Tradução de Alfredo Alves de Farias. São
Paulo: Saraiva, 2003.
LARSON, R.; FARBER, B. Estatística aplicada. Tradução de Cyro de C. Patarra. São Paulo:
Prentice Hall, 2004.
PEREIRA, W.; KIRSTEN, J. T.; ALVES, W. Estatística para as ciências sociais. São Paulo:
Saraiva, 1980.