ResumoTeoria e Fichas TrabalhoEstatística
ResumoTeoria e Fichas TrabalhoEstatística
ResumoTeoria e Fichas TrabalhoEstatística
ESTATÍSTICA
Programa:
I. Estatística — Generalidades
Avaliação:
Duração Avaliação
Teste de avaliação
(60%)
“Ciência que dispõe de processos apropriados para recolher, organizar, classificar, apresentar
e interpretar conjuntos de dados"
A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes
incompletos, na medida em que nos dão informação útil sobre o problema em estudo, não
realçando, no entanto, aspetos importantes.
É objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das
situações que representam.
No estudo de um problema envolvendo métodos estatísticos, estes devem ser utilizados mesmo
antes de se recolher a amostra, isto é, deve-se planear a experiência que nos vai permitir recolher
os dados, de modo a que, posteriormente, se possa extrair o máximo de informação relevante
para o problema em estudo, ou seja para a população de onde os dados provêm.
Se pretendemos estudar o sucesso escolar, em Português dos alunos do 10º ano, da Escola
Exemplo :
Secundária Prof. Herculano de Carvalho, será natural ir consultar as pautas destes alunos, no
final do ano. A partir daí poderá facilmente ser obtida a percentagem de aprovações.
Se, no entanto, pretendermos aprofundar um pouco mais este assunto, nomeadamente saber
se o sucesso é análogo para os rapazes e raparigas, ou nos diferentes agrupamentos
disciplinares, deverá recolher-se não só a informação respeitante ao aluno ter passado ou
não, mas também para cada um o sexo e o agrupamento disciplinar:
Agrupamento disciplinar Nota Sexo
1 12 F
2 13 M
... ... ...
Uma vez os dados recolhidos, sob a forma de uma amostra, faz-se a redução e
representação desses dados, utilizando as tabelas e os diferentes tipos de gráficos, sendo um dos
principais objectivos desta fase, a identificação da estrutura subjacente aos dados, deixando de
lado a aleatoriedade presente.
Página 2 de 38
Módulo Estatística
Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou
testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a
potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma
população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido.
2. População e Amostra
Uma noção fundamental em Estatística é a de conjunto ou agregado, conceito para o qual se usam,
indiferentemente, os termos População ou universo.
2.1-População
Coleção de unidades individuais, que podem ser pessoas ou resultados
experimentais, com uma ou mais características comuns, que se pretendem
estudar.
ATENÇÃO : População em estatística
não diz respeito exclusivamente a pessoas!
EXEMPLOS
Exemplo 1: Relativamente à população constituída pelos alunos do 10º ano
de escolaridade matriculados na Escola Secundária dos Olivais nº 2, podemos
estar interessados em estudar as seguintes características populacionais:
- Altura (em cm) dos alunos:
Depois de medir a altura de cada aluno, obteríamos um conjunto de dados com o seguinte aspeto:
145, 161, 158, 156, 146,... ,140, 139, 162
- Notas obtidas na disciplina de Português,
no 1º período:
10, 15, 13, 16, 9, 11, 10, ... , 18, 11, 13, 8
PORQUÊ?
Página 3 de 38
Módulo Estatística
- Pode o estudo da população levar à destruição da população
Exemplo: População dos fósforos de uma caixa.
- Pode o estudo da população ser muito dispendioso
Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado
candidato.
Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se só alguns
elementos, a que damos o nome de Amostra.
2.2-Amostra Conjunto de dados ou observações, recolhidos a partir de um subconjunto da
população, que se estuda com o objetivo de tirar conclusões para a população de onde
foi recolhida.
EXEMPLOS
Exemplo 1: Relativamente à população das alturas dos alunos do 10º ano matriculados na Escola
Secundária dos Olivais, nº 2, consideremos a seguinte amostra, constituída pelas
alturas (em cm) de 20 alunos escolhidos ao acaso:
145, 163, 157, 152, 156, 149, 160, 157, 148, 147, 151, 152, 150, 148, 156,
160, 148, 157, 153, 162
Para a maioria das pessoas a palavra recenseamento ou censo encontra-se associada à enumeração dos
elementos da população de um País. Em Portugal, de dez em dez anos, realiza-se o Recenseamento Geral da
População. O último ocorreu em 2011, encontrando-se disponíveis na Internet (Infoline - Serviço de
Informação On Line do INE) os resultados desses censos - Censos 2011.
3.2-Sondagem Por vezes não é viável nem desejável, principalmente quando o número de
elementos da população é muito elevado, inquirir todos os seus elementos sempre
que se quer estudar uma ou mais características particulares dessa população.
Assim surge o conceito de sondagem, que se pode tentar definir como:
estudo científico de uma parte de uma população com o objetivo de estudar atitudes, hábitos e
preferências da população relativamente a acontecimentos, circunstâncias e assuntos de interesse
comum.
É fundamental referir que, contrariamente ao recenseamento, as sondagens inquirem ou analisam apenas uma
parte da população em estudo, isto é, restringem-se a uma amostra dessa população, mas com o objetivo de
extrapolar para todos os elementos da população os resultados observados na amostra.
Página 5 de 38
Módulo Estatística
4. Estatística Descritiva e Estatística Indutiva
De acordo com o que dissemos anteriormente, numa análise estatística distinguem-se essencialmente
duas fases:
Uma primeira fase em que se procura descrever e estudar a amostra:
Estatística Descritiva
e uma segunda fase em que se procura tirar conclusões para a população:
Estatística Indutiva
Módulo Probabilidades
Ficha Nº2 Aplicação da Lei de Laplace |Diagrama de árvore| Tabela de dupla Entrada
Esquematicamente, temos:
Página 6 de 38
Módulo Estatística
Resumindo, podemos dizer que uma análise estatística envolve duas fases fundamentais, com objectivos distintos:
No entanto, ao contrário das proposições deduzidas, não podemos dizer que são falsas ou verdadeiras, já que
foram verificadas sobre um conjunto restrito de indivíduos, e portanto não são falsas, mas não foram verificadas
para todos os indivíduos da População, pelo que também não podemos afirmar que são verdadeiras !
Existe, assim, um certo grau de incerteza (percentagem de erro) que é medido em termos de Probabilidade.
Página 7 de 38
Módulo Estatística
5. Campos de Aplicação
5.1Estudos de mercado
5.2 Medicina
OPretende-se
gerente de estudar
uma fábrica de detergentes
o efeito de um novopretende lançarpara
medicamento um novo
curarproduto para lavar
determinada a loiça,
doença. pelo que, encarrega
É selecionado um grupo
de 20
uma doentes,
empresa administrando-se
especialista o novo
em estudos medicamento
de mercado a 10 desses
de "estimar" doentes escolhidos
a percentagem ao acaso
de potenciais e o medicamento
compradores desse
habitual aos restantes.
produto.
População: conjunto de todos os agregados familiares do País
Amostra: População: conjunto
conjunto de todos
de alguns os doentes
agregados com ainquiridos
familiares, doença que o medicamento
pela empresa a estudar pretende tratar.
Problema: Amostra: conjuntoa dos
pretende-se, 20da
partir doentes selecionados
percentagem de respostas afirmativas, de entre os inquiridos sobre a
Problema: pretende-se, a partir dos resultados obtidos, realizar um "teste de hipóteses" para tomar
compraumadodecisão
novo produto, obter
sobre qual dosuma estimativa do
medicamentos número de compradores na População.
é melhor.
Controle de Qualidade
O administrador de uma fábrica de parafusos pretende assegurar-se de que
a percentagem de peças defeituosas não excede um determinado valor, a
partir do qual determinada encomenda poderia ser rejeitada.
As variáveis qualitativas são organizados na forma de uma tabela de frequências que apresenta o número de
elementos - frequência absoluta (ou só frequência) de cada uma das categorias ou classes.
Numa tabela de frequências, além das frequências absolutas, também se apresentam as frequências relativas:
Num inquérito realizado a 150 indivíduos, estes tiveram de assinalar o sexo - M ou F, e o estado civil -
Exemplo:
Solteiro, Casado, Viúvo ou Divorciado. Uma forma de resumir a informação contida nos dados, no que
diz respeito ao estado civil, é construir uma tabela de frequências em que se consideram para as
classes as diferentes modalidades que o estado civil pode tomar:
2.1 Variáveis
quantitativas Estes dados só podem tomar um número finito ou infinito numerável de valores
discretas distintos, apresentando vários valores repetidos - é o caso, por exemplo, do nº de filhos
de uma família ou do nº de acidentes, por dia, em determinado cruzamento.
REPRESENTAÇÃO
Diagrama de barras Representação gráfica que consiste em marcar num sistema de eixos
ou coordenados, no eixo dos xx o valor das classes e nesses pontos barras verticais
Distribuição de frequências de altura igual à frequência absoluta ou à frequência relativa.
Obter-se-á um gráfico com o aspeto
seguinte:
Página 11 de 38
Módulo Estatística
Exemplo: Utilizando a tabela de frequências obtida no exemplo anteriormente
considerado, construa o diagrama de barras e o polígono de
frequências (utilize frequências relativas).:
Tabela de frequências Diagrama de barras
Classes freq. abs. freq. rel.
0 4 0.20
1 8 0.40
2 4 0.20
3 3 0.15
4 1 0.05
Total 20 1.00
Para exemplificar o processo descrito a seguir, utilizaremos a amostra de notas obtidas num ponto de
Matemática de uma determinada turma:
12.1 8.9 16.2 8.2 9.8 15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1
15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5
1º Definição a) Determinar a amplitude da amostra, isto é, a diferença entre o valor máximo
das classes e o valor mínimo
No caso da amostra considerada, amplitude =
16.2 - 7.5 = 8.7
b) Dividir essa amplitude pelo número k de classes pretendido; tomar para essa
amplitude de classe h um valor aproximado por excesso do valor anteriormente obtido.
No caso da amostra considerada, escolhendo k=5,
h = 8.7 / 5 = 1.74 1.8
c) Construir as classes de modo que tenham todas a mesma amplitude e cuja união contenha todos os
elementos da amostra.
Uma metodologia a seguir para construir as classes Ci = [ci , ci+1[ poderá ser a seguinte:
Página 14 de 38
Módulo Estatística
[11.1, 12.9[ 3
[12.9, 14.7[ 5
[14.7, 16.5[ 6
Para a representação gráfica de dados contínuos, usa-se um diagrama de áreas ou histograma, formado por uma
sucessão de rectângulos adjacentes, tendo cada um por base um intervalo de classe e por área a frequência
relativa (ou a frequência absoluta).
Deste modo a área total será igual a 1 (resp. igual a n, a dimensão da amostra)
Diagrama de caule-e-folhas
É um tipo de representação que se pode considerar entre a tabela e o gráfico, uma vez que são apresentados os
verdadeiros valores da amostra, mas numa apresentação sugestiva, que faz lembrar um histograma.
Consiste em escrever do lado esquerdo de uma linha vertical o dígito (ou dígitos) da classe de maior
grandeza, seguidos dos restantes. A representação obtida terá o seguinte aspecto:
Diagrama de extremos e quartis
Página 15 de 38
Módulo Estatística
É um tipo de representação gráfica, em que se realçam algumas características da amostra. O
conjunto dos valores da amostra compreendidos entre o 1º e o 3º QUARTIS, que vamos representar
por Q1 e Q3 é representado por um rectângulo (caixa) com a MEDIANA indicada por uma barra. A
largura do rectângulo não dá qualquer informação, pelo que pode ser qualquer. Consideram-se
seguidamente duas linhas que unem os meios dos lados do rectângulo com os extremos da
amostra. Para obter esta representação, começa por se recolher da amostra, informação sobre 5
números, que são: os 2 extremos (mínimo e máximo), a mediana e o 1º e 3º quartis. A
representação do diagrama de extremos e quartis tem o seguinte aspecto:
MEDIDAS DE LOCALIZAÇÃO
Antes de começar a definir as medidas, que vão ser utilizadas para resumir a informação contida nos
dados, e lembrando mais uma vez que estamos na fase da análise estatística conhecida por Estatística
O extremo inferior é o mínimo da amostra, enquanto que o extremo superior é o máximo da
Descritiva, vamos introduzir uma notação conveniente para representar a amostra. Assim, o conjunto de dados
amostra.
ou observações que constituem a amostra será representado por
x1, x2, ..., xn
onde x1, x2, ..., xn, representam, respectivamente, a 1ª observação, a 2ª observação e a n-ésima observação, de
uma amostra de dimensão n. Esta notação não implica uma relação de ordem entre os elementos da amostra.
Das medidas, ou estatísticas que iremos definir, para caracterizar os dados, destacam-se as
medidas de localização
nomeadamente as que localizam o centro da amostra (média, moda e mediana) , e as
medidas de dispersão
que serão abordadas no capítulo seguinte.
Será mesmo necessário utilizar os dois tipos de medidas, para caracterizar os dados?
Vejamos um exemplo:
Pedro João
observamos que uma característica apresentada pelas notas do João, é uma maior variabilidade do que as
notas do Pedro.
Página 16 de 38
Módulo Estatística
Média
A média amostral ou simplesmente média, que se representa por é uma medida de localização do centro da
amostra, e obtém-se a partir da seguinte expressão:
Esquematicamente podemos posicionar a média da forma seguinte, tendo em conta a representação gráfica na
forma de histograma.
Página 17 de 38
Módulo Estatística
Mediana
DesvioDado um histograma é fácil obter a posição da mediana, pois esta está na posição em que
padrão
passando uma linha vertical por esse ponto o histograma fica dividido em duas partes com
áreas
O desvio iguais.é uma medida de dispersão usada com a média. Mede a variabilidade dos valores à volta da média.
padrão
O valor mínimo do desvio padrão é 0 indicando que não há variabilidade, ou seja, que todos os valores são iguais à
média.
A fórmula de cálculo do desvio padrão para os valores x 1, x2, x3,…, xn de uma amostra é a seguinte:
Como medida de localização, a mediana é mais resistente do que a média, pois não é tão
sensível aos dados.
QUARTIS
Medidas que dividem a amostra respectivamente em 25% , 50% , 75 % e 100 %.
Ver o diagrama de extremos e quartis
Por convenção, usa-se a letra grega s (sigma) para o desvio padrão da população e s para o desvio padrão da amostra
NOTA: Por razões matemáticas que não estão no âmbito deste manual, no caso do cálculo do desvio padrão da
população deve-se usar como quociente da fórmula n em vez de n-1, e a média da população em vez da média da
amostra.
A média das idades é:
O desvio padrão é:
Página 19 de 38
Módulo Estatística
III Referência a distribuições bidimensionais (abordagem gráfica e intuitiva)
Uma das áreas mais importantes da estatística é aquela que permite efetuar
previsões de alguma variável.
Página 20 de 38
Módulo Estatística
Considere os seguintes dados, que representam o número de faltas não autorizadas por
ano e a distância (em km) a que os empregados de determinado armazém estão de casa.
Comentário:
Página 21 de 38
Módulo Estatística
O diagrama de pontos ou nuvem de pontos permite observar o comportamento conjunto
das duas variáveis e ajuda a determinar se existe alguma relação entre eles.
Visualmente os diagramas de pontos podem resultar num dos seguintes três exemplos:
- Quando não se verifica nada do referido anteriormente, existe uma correlação nula.
Página 22 de 38
Módulo Estatística
Para ser mais exata a análise ao tipo de
correlação existente entre duas variáveis, ou quando
visualmente é difícil de
Página 23 de 38
Módulo Estatística
Quando o grau de correlação é forte, afirmamos que uma variável influencia a outra e é
nessa situação que podemos efetuar previsões. Para isso utiliza-se a reta de regressão.
- As previsões
fazem-
se
utilizando a equação da
reta de regressão
substituindo x ou y.
Módulo Estatística
Página 24 de 38
Módulo Estatística
1. Para conhecer o canal preferido pelos habitantes de Lisboa foram inquiridos 300 pessoas.
1.1 Foi realizado uma sondagem ou um censo? Justifica.
1.2 Indica a população e a amostra.
4. Num estudo feito numa escola, e para caracterizar os seus 2500 alunos recolheram-se dados de
200 alunos referentes às seguintes variáveis:
Variáveis Discretas
Quantitativas
Página 25 de 38
Módulo Estatística
Contínuas
Variável qualitativa é uma variável que não se pode medir nem referenciar numericamente.
Exemplos: cor dos olhos; disciplina preferida, clube preferido …
Variável quantitativa é uma variável que se pode medir, apresentando-se com diferentes
intensidades.
Exemplos: altura, classificação do fim do período, nº de irmãos, tempo médio de estudo num dia…
Página 26 de 38
Módulo Estatística
Módulo Estatística
1. Numa cidade de 20000 habitantes fez-se um inquérito sobre o meios de transporte utilizado
diariamente para se deslocarem para o emprego. Foram interrogadas 2500 pessoas e os
resultados foram registados no seguinte gráfico:
1.1 Construa uma tabela com a frequência relativa
de cada um dos transportes.
1.2 Quantas das pessoas inquiridas definem como
meio de transporte mais utilizado o
Automóvel?
Página 27 de 38
Módulo Estatística
3.1 Calcula as amplitudes dos ângulos indicados no diagrama circular.
3.2 Calcula quantos alunos usam Tênis, Sandálias ou Sapatos.
Página 28 de 38
Módulo Estatística
7. Observa atentamente o gráfico de barras que representa a distribuição do número de horas
diárias de sono de pessoas adultas.
7.1 Quantas pessoas foram observadas?
7.2 Qual a variável em estudo e qual a sua natureza?
7.3 Qual a percentagem de adultos que dormem oito horas?
7.4 Neste estudo quantas pessoas dormem menos de sete horas?
8. Considera o seguinte pictograma que indica a área ardida em Portugal entre 2003 e 2007.
Página 29 de 38
Módulo Estatística
Página 30 de 38
Módulo Estatística
Módulo Estatística
OOFPFFPOCCOFPPCFFOOOCPOPOCOOPO
(F = Fiat; O = Opel; P = Peugeot; C = Citroen)
2. Foi feito um levantamento sobre o número de ovos existentes nos ninhos das andorinhas de
uma região.
0 3 1 2 4 2 3
1 2 2 3 1 1 1
3 1 3 4 0 1 2
2.1. Clas
sifique a variável em estudo.
2.2. Construa a tabela de frequências absolutas e relativas.
3. Fez-se um inquérito a 20 jovens sobre as idas à discoteca no último mês e os resultados estão
indicados na seguinte tabela.
3 5 4 2 1 0 3 4 5 1
Idas à discoteca
3 5 2 1 0 5 5 5 4 3
Página 31 de 38
Módulo Estatística
4. Registou-se o número de bebés nascidos na maternidade de um hospital em cada um dos
dias do mês de Abril, tendo-se obtido os seguintes valores:
3 1 2 3 0 2 4 3 4 2
3 2 1 2 2 0 4 3 1 1
4 3 3 2 1 3 2 0 3 2
12.1 8.9 16.2 8.2 9.8 15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1
15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5
b) Dividir essa amplitude pelo número k tal que 2K>n de classes pretendido;
tomar para essa amplitude de classe h um valor aproximado por excesso do
valor anteriormente obtido.
c) Construir as classes de modo que tenham todas a mesma amplitude e cuja
união contenha todos os elementos da amostra.
Página 32 de 38
Módulo Estatística
Módulo Estatística
1. Observe as notas, em percentagem, obtidas por uma turma do 9º ano durante o 1.º período.
Aluno Minitest 1.º 2.º
1 99 100 94 1.1. Qual foi a nota média dos testes obtidas
2 80 58 75
3 68 53 69 pelo aluno número 1?
4 15 46 50
5 15 12 24
6 24 54 46 1.2. Qual a média obtida pelos alunos da
7 65 53 50 turma no miniteste? E no 2.º teste?
8 24 38 50
2. Uma empresa tem seis trabalhadores com os ordenados representados na tabela:
Indique:
A medida que melhor representa os dados é a ____________________ pois não é afetada por
valores discrepantes.
3. A Joana realizou para a disciplina de Matemática, durante o ano letivo, cinco trabalhos nos quais
obteve as seguintes classificações:
10 8 16 8 18
A classificação final é atribuída tendo em conta as notas dos cinco trabalhos mediante o critério
escolhido pelo professor:
Critério A: Média das classificações
Critério B: Moda das classificações
Critério C: Mediana das Classificações
Página 33 de 38
Módulo Estatística
4. Indica se as afirmações são verdadeiras ou falsas, justificando:
4.1 Numa turma o aluno mais alto mede 180 centímetros e o aluno mais baixo mede
162.
4.2 4.2 A média das alturas dos alunos poderá ser 181 centímetros.
4.3 É possível determinar a média em variáveis qualitativas.
4.4 É possível determinar a moda em variáveis quantitativas contínuas.
6. Observa atentamente o gráfico de barras que representa a distribuição do número de vezes que
as pessoas inquiridas foram ao supermercado por semana.
Página 34 de 38
Módulo Estatística
7. Para analisar o desempenho dos alunos na disciplina de Matemática, uma escola fez um estudo
em que analisou as classificações dos seus 200 alunos no último teste de Matemática.
Posteriormente afixou a seguinte tabela:
Informação
Como está a Matemática na nossa Escola?
Classificações (%) ni
¿ 20
¿ 120
¿ 40
¿ 20
7.4 Calcule, um valor aproximado da nota média dos alunos desta escola no último teste de
Matemática.
Página 35 de 38
Módulo Estatística
Módulo Estatística
Medidas de dispersão
Variância e desvio padrão de dados simples - Para um melhor conhecimento da dispersão dos
dados de uma amostra, podemos recorrer a medidas como a variância e o desvio padrão, que medem o
afastamento de todos os dados relativamente à média aritmética.
( x i− x́ )2 . ni ∑ (x i−x́)2 . ni
Variância: v= ∑
N
Desvio padrão:σ =
√ N
1. A Margarida e a Liliana são irmãs gémeas. Estão no 10º ano, na mesma turma, e gostam de competir pelos
melhores resultados em Matemática. As suas notas nos testes de avaliação foram:
Margarida: 10 12 13 13 16 13 14
Liliana: 9 17 9 13 18 16 9
1.1. Calcule a amplitude e a amplitude inter-quartil de cada amostra. Compare-as. O que conclui?
1.2. Calcule a nota média dos testes da Margarida e da Liliana.
1.3. A média parece-lhe um bom indicador das notas das gémeas? Justifique.
1.4. Qual das duas alunas lhe parece ser a melhor na disciplina de Matemática? Porquê?
1.5. Sem recorrer à calculadora, determine, relativamente às notas da Margarida, o valor da variância e do
desvio padrão.
Página 36 de 38
Módulo Estatística
Módulo Estatística
1.1 Determina a previsão do peso de um bebé para um caso em que a mãe fume 22 cigarros por
dia.
1.2 Determina a previsão do peso de um bebé para um caso em que a mãe não fume.
Página 37 de 38
Módulo Estatística
2. Pesaram-se e mediram-se alguns indivíduos e obtiveram-se os seguintes resultados.
É importante a fase de
recolha da amostra? Observa-se que os pontos estão dispostos
de forma crescente. As duas variáveis estão
Sim, pois a amostra deve ser
relacionadas positivamente, isto é, à
tão representativa quanto
medida que o peso aumenta, a altura
também aumenta.
Y =0,9016 x +109,36
2.1 Efetua uma previsão para a altura de um indivíduo que pese 86 kg.
2.2 Efetua uma previsão para a altura de um indivíduo que pese 50 kg.
Página 38 de 38
Módulo Estatística