Começando a construir um sentido de uso da estatística para a vida cotidiana. Experimentando dados em situações reais e aprendendo a utilizar ferramentas de relevância para análises simples porém fundamentais.
1 de 34
Mais conteúdo relacionado
Aula 02 - Estatística da vida cotidiana
1. Tópicos em Gestão da Informação II
Aula 02 – Estatística da vida
diária
Prof. Dalton Martins
dmartins@gmail.com
Gestão da Informação
Faculdade de Informação e Comunicação
Universidade Federal de Goiás
2. Documentário
● O prazer da estatística:
– mostra exemplos fundamentais de uso da
estatística na cotidiano de cidades e problemas
humanos de uma forma simples e focada em suas
aplicações;
– https://www.youtube.com/watch?v=xLr68J2yDJ8
3. O que é estatística
● É, antes de qualquer coisa, um método
científico que determina questões de pesquisa
– Projeta estudos e experimentos;
– Coleta, organiza, resume e analisa dados;
– Interpreta resultados e esboça conclusões.
4. As estatísticas erram
● É fundamental para um gestor da informação
despertar um certo nível de ceticismo perante
as informações que lhe chegam a mão: isso
está mesmo correto?
● A mídia apresenta muitos exemplos de
estatísticas erradas e descobrir alguns desses
problemas é um bom treino para se tornar mais
confiante com a estatística e desarmar
qualquer explosão de números!
5. Detectando erros, exageros e
mentirinhas leves
● A primeira coisa a fazer é se perguntar se o resultado
está de fato correto e procurar investigar;
● Algumas dicas:
– Verifique se a soma está correta → as porcentagens somam
mesmo 100%. A soma do número de pessoas em cada
categoria resulta no número de pessoas entrevistas;
– Verifique duas vezes até os cálculos mais simples;
– Sempre procure por um total para que você possa colocar os
resultados em perspectiva adequada;
– Ignore os resultados baseados em amostrar muito pequenas!
9. Revelando estatísticas enganosas
● As estatísticas que se referem à criminalidade
são um grande exemplo de como a estatística
é utilizada para mostrar os dois lados de uma
história, em que apenas um é verdadeiro;
● Como dois políticos podem argumentar o
aumento e a diminuição da criminalidade ao
mesmo tempo para um mesmo local?
10. Exemplo
Número de crimes nos EUA
Ano Crimes
1987 13.508.700
1988 13.923.100
1989 14.251.400
1990 14.475.600
1991 14.872.900
1992 14.438.200
1993 14.144.800
1994 13.989.500
1995 13.862.700
1996 13.493.900
1997 13.175.100
Uma informação fundamental foi deixada de fora da história aqui. Outra coisa
importante aumentou também no período → a população!
Entre 1987 e 1993 parece que o índice
de criminalidade aumentou nos EUA.
11. Exemplo
Número de crimes nos EUA
Ano Crimes População Taxa de Crimes
1987 13.508.700 243.400.000 5.550,00
1988 13.923.100 245.807.000 5.664,24
1989 14.251.400 248.239.000 5.741,00
1990 14.475.600 248.710.000 5.820,27
1991 14.872.900 252.177.000 5.897,80
1992 14.438.200 255.082.000 5.660,22
1993 14.144.800 257.908.000 5.484,44
1994 13.989.500 260.341.000 5.373,53
1995 13.862.700 262.755.000 5.275,90
1996 13.493.900 265.284.000 5.086,59
1997 13.175.100 267.637.000 4.922,75
Entre 1987 e 1993 a taxa de crimes diminuiu e não aumentou!
12. O que é melhor para avaliar esse
aspecto representado pelos dados
anteriores: o número absoluto de
eventos ou a taxa relativa ao
número da população?
13. Razões, taxas e porcentagens
● Razão:
– É uma fração que divide duas quantidades;
– Exemplo: a razão de meninas por meninos é de 3 para 2;
● Taxa:
– É uma razão que reflete uma quantidade por certa unidade;
– Exemplo: seu carro faz 60 km por hora em média;
● Porcentagem:
– É um número entre 0 e 100 que reflete a proporção do todo.
– Para encontrar o aumento/diminuição de porcentagem entre
dois valores em dois períodos diferentes, faça
● A quantidade de “depois” menos a quantidade “antes” e divida o
resultado pela quantidade de “antes”.
14. Exercício
Ano Crimes População Taxa de Crimes
1987 13.508.700 243.400.000 5.550,00
1988 13.923.100 245.807.000 5.664,24
1989 14.251.400 248.239.000 5.741,00
1990 14.475.600 248.710.000 5.820,27
1991 14.872.900 252.177.000 5.897,80
1992 14.438.200 255.082.000 5.660,22
1993 14.144.800 257.908.000 5.484,44
1994 13.989.500 260.341.000 5.373,53
1995 13.862.700 262.755.000 5.275,90
1996 13.493.900 265.284.000 5.086,59
1997 13.175.100 267.637.000 4.922,75
1. Quanto variou a taxa de crimes entre 1987 e 1993?
2. E entre 1987 e 1997?
15. Sintetizando dados com estatísticas
● Todos os conjuntos de dados têm uma história e, se
usadas de maneira apropriada, as estatísticas são a
melhor maneira de contar essa história;
● As estatísticas são usadas para sintetizar algumas
informações mais básicas dentro de um conjunto de
dados:
– Permite entendermos o que, de maneira geral, está
acontecendo nos dados;
– Somente depois vamos formular algumas hipóteses e
procurar relações entre os itens medidos.
16. Tipos de dados que podem ser
sumarizados
● Dados categóricos:
– Coletam qualidades ou características a respeito de um indivíduo, como a cor
dos olhos de uma pessoa, o sexo, o partido político ou a opinião sobre
determinado assunto;
– Os dados categorizados são frequentemente resumidos por meio das
porcentagens de indivíduos que se enquadram em cada uma das categorias
definidas;
– Ainda podemos utilizar tabelas cruzadas, que resumem os dados utilizando
duas variáveis categóricas na linha e coluna da tabela, tais como sexo e partido
político para observarmos a distribuição dos indivíduos entre essas categorias;
● Dados numéricos:
– São características mensuráveis, tais como altura, peso, idade ou renda
financeira;
– Pelo fato de terem significado numérico, podem ser resumidos de várias
formas;
– Determinadas características de dados numéricos podem ser descritas usando
as estatísticas, tais como localização do centro, a maneira como os dados
estão distribuídos e a localização de alguns marcos.
19. Dados numéricos
● Chegando ao centro:
– O modo mais comum de sintetizar um conjunto de
dados é descrever onde está o centro;
– O centro de um conjunto de dados pode ser medido de
diferentes formas e o método escolhido pode influenciar
muito nas conclusões que podem ser tiradas;
– As formas mais comuns de representar o centro de um
conjunto de dados é usando a média e a
mediana.
20. Média
● O que fazer para encontrar a média para um
conjunto de dados:
– Some todos os números do conjunto de dados;
– Divida pelo número de números do conjunto de
dados, n.
● Pela forma como a média é calculada os valores
muito discrepantes do conjunto, sejam mais altos
ou mais baixos tendem a “puxar” a média para
cima ou para baixo, distorcendo o resultado.
22. Mediana
● A mediana de um conjunto de dados é o valor que se
encontra exatamente no meio
● O que fazer para encontrar a mediana para um conjunto
de dados:
– Ordene os números do menor para o maior;
– Se o conjunto de dados possuir um número ímpar de números,
escolha o número que estiver exatamente no meio → este é a
mediana;
– Se o conjunto de dados possuir um número par de números,
pegue os dois números que estiverem exatamente no meio e
faça a média deles para encontrar a mediana.
23. Exemplo
Cargos Salários
Presidente R$ 20.000,00
Diretor R$ 8.000,00
Engenheiro R$ 2.000,00
Estagiário R$ 800,00
Mediana: R$ 5.000,00
A mediana é menos influenciada por valores tão discrepantes nas extremidades.
24. Distorções
Se os valores forem discrepantes na extremidade inferior, muito pequenos,
a curva será assimétrica para a esquerda.
Se os valores forem discrepantes na extremidade superior, muito grandes,
a curva será assimétrica para a direita.
25. Distorções
● A média de um conjunto de dados é
influenciada por valores discrepantes;
● Isso não acontece com a mediana;
● Se alguém lhe apresentar a média de um
conjunto de dados, pergunte também pela
mediana:
– Isso te dará uma visão aproximada se há muita ou
pouca distorção na distribuição dos dados.
26. Contabilizando variação
● A variabilidade é o que faz a estatística ser
como é → sempre existe variação em um
conjunto de dados;
● O desvio padrão representa de longe a medida
mais utilizada para calcular variabilidade:
– Representa a distância normal de qualquer ponto
no conjunto de dados até o centro.
– Ele é, aproximadamente, a distância média até o
centro. No caso, o centro é a média.
27. Desvio padrão
● Como obter o desvio padrão:
– Encontre a média do conjunto de dados;
– Subtraia o valor da média para cada um dos números;
– Eleve ao quadrado cada resultado obtido no passo
anterior;
– Some todos os resultados obtidos no passo anterior;
– Divida a soma pela quantidade de números no
conjunto de dados menos 1 (n-1);
– Descubra a raiz quadrada do número resultante.
29. Interpretando o desvio padrão
● Um desvio padrão pequeno, basicamente,
significa que os valores do conjunto de dados
estão, na média, próximos do centro desse
conjunto;
● Um desvio padrão grande significa que os
valores do conjunto de dados estão, na média,
mais afastados do centro.
32. A importância do desvio padrão
● O desvio padrão não aparece muito na mídia e isso é
um grande problema;
● Se você descobrir onde fica o centro dos dados sem
saber o quanto tais dados variam, você tem apenas uma
parte da história;
● A variedade é o tempero da vida, assim, sem uma
indicação de quanto diversificado e variado são os
dados, você não saberá o verdadeiro tempo dos dados!
● Sem o desvio padrão não é possível comparar dois
conjuntos de dados de maneira eficiente.
33. A importância do desvio padrão
● Só saber a média e a mediana não é o suficiente;
● Por exemplo, os seguintes conjuntos possuem a
mesma média e mediana:
– 199,200,201
– 0,200,400
● Porém, sua variabilidade é bastante diferente:
– O desvio padrão do primeiro conjunto é 1;
– Do segundo é 200!!!
34. Exercícios
● Baixe o arquivo na página do curso chamado:
– https://gestaodainformacao.fic.ufg.br/pages/66915-dalton-lopes-martins
– Auxílio a Pesquisadores – FAPEG 2013.ods
● Faça:
– A organização dos dados em formato moeda;
– Ordene do maior para menor;
– Encontre a somatória das colunas;
– Encontre a média, mediana e desvio padrão para os dados;
– Analise os resultados: o que eles dizem!