ResumoTeoria e Fichas Trabalho A3
ResumoTeoria e Fichas Trabalho A3
ResumoTeoria e Fichas Trabalho A3
ESTATÍSTICA
Programa:
I. Estatística — Generalidades
“Ciência que dispõe de processos apropriados para recolher, organizar, classificar, apresentar
e interpretar conjuntos de dados"
A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes
incompletos, na medida em que nos dão informação útil sobre o problema em estudo, não
realçando, no entanto, aspetos importantes.
É objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das
situações que representam.
No estudo de um problema envolvendo métodos estatísticos, estes devem ser utilizados mesmo
antes de se recolher a amostra, isto é, deve-se planear a experiência que nos vai permitir recolher
os dados, de modo a que, posteriormente, se possa extrair o máximo de informação relevante
para o problema em estudo, ou seja para a população de onde os dados provêm.
Se pretendemos estudar o sucesso escolar, em Português dos alunos do 10º ano, da Escola
Exemplo :
Secundária Prof. Herculano de Carvalho, será natural ir consultar as pautas destes alunos, no
final do ano. A partir daí poderá facilmente ser obtida a percentagem de aprovações.
Se, no entanto, pretendermos aprofundar um pouco mais este assunto, nomeadamente saber
se o sucesso é análogo para os rapazes e raparigas, ou nos diferentes agrupamentos
disciplinares, deverá recolher-se não só a informação respeitante ao aluno ter passado ou
não, mas também para cada um o sexo e o agrupamento disciplinar:
Página 2 de 41
Módulo Estatística
Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou
testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a
potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma
população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido.
2. População e Amostra
Uma noção fundamental em Estatística é a de conjunto ou agregado, conceito para o qual se usam,
indiferentemente, os termos População ou universo.
2.1-População
Coleção de unidades individuais, que podem ser pessoas ou resultados
experimentais, com uma ou mais características comuns, que se pretendem
estudar.
ATENÇÃO : População em estatística
não diz respeito exclusivamente a pessoas!
EXEMPLOS
Depois de medir a altura de cada aluno, obteríamos um conjunto de dados com o seguinte aspeto:
PORQUÊ?
Página 3 de 41
Módulo Estatística
- Pode a população ter dimensão infinita
Exemplo: População constituída pelas pressões atmosféricas, nos diferentes
pontos de uma cidade.
- Pode o estudo da população levar à destruição da população
Exemplo: População dos fósforos de uma caixa.
- Pode o estudo da população ser muito dispendioso
Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado
candidato.
Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se só alguns
elementos, a que damos o nome de Amostra.
2.2-Amostra Conjunto de dados ou observações, recolhidos a partir de um subconjunto da
população, que se estuda com o objetivo de tirar conclusões para a população de
onde foi recolhida.
EXEMPLOS
Exemplo 1: Relativamente à população das alturas dos alunos do 10º ano matriculados na Escola
Secundária dos Olivais, nº 2, consideremos a seguinte amostra, constituída pelas
alturas (em cm) de 20 alunos escolhidos ao acaso:
145, 163, 157, 152, 156, 149, 160, 157, 148, 147, 151, 152, 150, 148, 156,
160, 148, 157, 153, 162
É importante a fase de recolha da amostra?
Sim, pois a amostra deve ser tão representativa quanto possível da População que se pretende
estudar, uma vez que vai ser a partir do estudo da amostra, que vamos tirar conclusões para a
População.
Quando a amostra não representa corretamente a população diz-se enviesada e a sua utilização
pode dar origem a interpretações erradas, como se sugere nos seguintes exemplos:
Estudo científico de um universo de pessoas, instituições ou objetos físicos com o propósito de adquirir
conhecimentos, observando todos os seus elementos, e fazer juízos quantitativos acerca de características
importantes desse universo.
Para a maioria das pessoas a palavra recenseamento ou censo encontra-se associada à enumeração dos
elementos da população de um País. Em Portugal, de dez em dez anos, realiza-se o Recenseamento Geral da
População. O último ocorreu em 2011, encontrando-se disponíveis na Internet (Infoline - Serviço de Informação
On Line do INE) os resultados desses censos - Censos 2011.
3.2-Sondagem Por vezes não é viável nem desejável, principalmente quando o número de
elementos da população é muito elevado, inquirir todos os seus elementos sempre
que se quer estudar uma ou mais características particulares dessa população.
Assim surge o conceito de sondagem, que se pode tentar definir como:
estudo científico de uma parte de uma população com o objetivo de estudar atitudes, hábitos e
preferências da população relativamente a acontecimentos, circunstâncias e assuntos de interesse
Módulo Probabilidades
comum.
Ano letivo 2013 - 2014
É fundamental referir que, contrariamente ao recenseamento, as sondagens inquirem ou analisam apenas uma
parteFicha
da população
Nº2 em estudo, isto é,da
Aplicação restringem-se a uma
Lei de Laplace amostra de
|Diagrama dessa população,
árvore| Tabelamas com o Entrada
de dupla objetivo de
extrapolar para todos os elementos da população os resultados observados na amostra.
4. Estatística Descritiva e Estatística Indutiva
De acordo com o que dissemos anteriormente, numa análise estatística distinguem-se essencialmente
duas fases:
Uma primeira fase em que se procura descrever e estudar a amostra:
Estatística Descritiva
Página 5 de 41
Módulo Estatística
e uma segunda fase em que se procura tirar conclusões para a população:
Estatística Indutiva
Resumindo, podemos dizer que uma análise estatística envolve duas fases fundamentais, com objectivos distintos:
No entanto, ao contrário das proposições deduzidas, não podemos dizer que são falsas ou verdadeiras, já que
5. Campos de Aplicação
5.1Estudos de mercado
O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar a loiça, pelo que, encarrega
uma empresa especialista em estudos de mercado de "estimar" a percentagem de potenciais compradores desse
produto.
5.2 Medicina
Pretende-se estudar o efeito de um novo medicamento para curar determinada doença. É selecionado um
grupo de 20 doentes, administrando-se o novo medicamento a 10 desses doentes escolhidos ao acaso e o
medicamento habitual aos restantes.
População: conjunto de todos os doentes com a doença que o medicamento a estudar pretende tratar.
Amostra: conjunto dos 20 doentes selecionados
Problema: pretende-se, a partir dos resultados obtidos, realizar um "teste de hipóteses" para tomar
uma decisão sobre qual dos medicamentos é melhor.
Controle de Qualidade
Página 7 de 41
O administrador de uma fábrica de parafusos pretende assegurar-se de que
a percentagem de peças defeituosas não excedeMódulo Estatísticavalor, a
um determinado
partir do qual determinada encomenda poderia ser rejeitada.
II. Organização e interpretação de caracteres estatísticos (qualitativos e
quantitativos)
1. Tipo de variáveis (dados ou carateres) estatísticas
REPRESENTAÇÃO
Para exemplificar o processo descrito a seguir, utilizaremos a amostra de notas obtidas num ponto de
Matemática de uma determinada turma: Página 12 de 41
12.1 8.9 16.2 8.2 9.8 Módulo Estatística
15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1
15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5
2º Contagem do número de elementos
Conta-se o número de elementos da amostra, que pertencem a cada classe. Analogamente ao
que foi considerado no caso dos dados discretos, esses valores serão as frequências absolutas
das classes. No caso da amostra dada
Classe Freq Absoluta
[7.5, 9.3[ 5
[9.3, 11.1[ 3
[11.1, 12.9[ 3
[12.9, 14.7[ 5
[14.7, 16.5[ 6
Página 13 de 41
Módulo Estatística
Representação gráfica de dados contínuos
Histograma
Para a representação gráfica de dados contínuos, usa-se um diagrama de áreas ou histograma, formado por uma
sucessão de rectângulos adjacentes, tendo cada um por base um intervalo de classe e por área a frequência
relativa (ou a frequência absoluta).
Deste modo a área total será igual a 1 (resp. igual a n, a dimensão da amostra)
Diagrama de caule-e-folhas
É um tipo de representação que se pode considerar entre a tabela e o gráfico, uma vez que são apresentados os
verdadeiros valores da amostra, mas numa apresentação sugestiva, que faz lembrar um histograma.
Consiste em escrever do lado esquerdo de uma linha vertical o dígito (ou dígitos) da classe de maior
grandeza, seguidos dos restantes. A representação obtida terá o seguinte aspecto:
Página 14 de 41
Módulo Estatística
Diagrama de extremos e quartis
Página 15 de 41
Módulo Estatística
MEDIDAS DE LOCALIZAÇÃO
Antes de começar a definir as medidas, que vão ser utilizadas para resumir a informação contida nos
dados, e lembrando mais uma vez que estamos na fase da análise estatística conhecida por Estatística
Descritiva, vamos introduzir uma notação conveniente para representar a amostra. Assim, o conjunto de dados
ou observações que constituem a amostra será representado por
Das medidas, ou estatísticas que iremos definir, para caracterizar os dados, destacam-se as
medidas de localização
nomeadamente as que localizam o centro da amostra (média, moda e mediana) , e as
medidas de dispersão
que serão abordadas no capítulo seguinte.
Página 16 de 41
Será mesmo necessário utilizar os dois tiposMódulo
de medidas, para caracterizar os dados?
Estatística
Vejamos um exemplo:
Média
A média amostral ou simplesmente média, que se representa por é uma medida de localização do centro da
amostra, e obtém-se a partir da seguinte expressão:
Esquematicamente podemos posicionar a média da forma seguinte, tendo em conta a representação gráfica na
forma de histograma.
Dado um histograma é fácil obter a posição da mediana, pois esta está na posição em que
passando uma linha vertical por esse ponto o histograma fica dividido em duas partes com
áreas iguais.
Como medida de localização, a mediana é mais resistente do que a média, pois não é tão
sensível aos dados.
QUARTIS
Medidas que dividem a amostra respectivamente em 25% , 50% , 75 % e 100 %.
Página 18 de 41
Módulo Estatística
MEDIDAS DE DISPERSÃO
Desvio padrão
O desvio padrão é uma medida de dispersão usada com a média. Mede a variabilidade dos valores à volta da média.
O valor mínimo do desvio padrão é 0 indicando que não há variabilidade, ou seja, que todos os valores são iguais à
média.
A fórmula de cálculo do desvio padrão para os valores x 1, x2, x3,…, xn de uma amostra é a seguinte:
Por convenção, usa-se a letra grega s (sigma) para o desvio padrão da população e s para o desvio padrão da amostra
NOTA: Por razões matemáticas que não estão no âmbito deste manual, no caso do cálculo do desvio padrão da
população deve-se usar como quociente da fórmula n em vez de n-1, e a média da população em vez da média da
amostra.
A média das idades é:
O desvio padrão é:
Página 19 de 41
Módulo Estatística
III Referência a distribuições bidimensionais (abordagem gráfica e intuitiva)
Uma das áreas mais importantes da estatística é aquela que permite efetuar
previsões de alguma variável.
Considere os seguintes dados, que representam o número de faltas não autorizadas por
ano e a distância (em km) a que os empregados de determinado armazém estão de casa.
Página 20 de 41
Módulo Estatística
Comentário:
Página 21 de 41
Módulo Estatística
O diagrama de pontos ou nuvem de pontos permite observar o comportamento conjunto
das duas variáveis e ajuda a determinar se existe alguma relação entre eles.
Visualmente os diagramas de pontos podem resultar num dos seguintes três exemplos:
- Quando não se verifica nada do referido anteriormente, existe uma correlação nula.
Página 22 de 41
Módulo Estatística
Para ser mais exata a análise ao tipo de correlação existente entre duas variáveis, ou
quando visualmente é difícil de analisar, recorre-se ao coeficiente de correlação.
Página 23 de 41
Módulo Estatística
Quando o grau de correlação é forte, afirmamos que uma variável influencia a outra e é
nessa situação que podemos efetuar previsões. Para isso utiliza-se a reta de regressão.
Página 24 de 41
Módulo Estatística
- As previsões fazem-se utilizando a equação da reta de regressão substituindo x ou y.
Página 25 de 41
Módulo Estatística
Módulo Estatística
1. Para conhecer o canal preferido pelos habitantes de Lisboa foram inquiridas 300 pessoas.
1.1 Foi realizado uma sondagem ou um censo? Justifica.
1.2 Indica a população e a amostra.
4. Num estudo feito numa escola, e para caracterizar os seus 2500 alunos recolheram-se dados de
200 alunos referentes às seguintes variáveis:
Página 26 de 41
Módulo Estatística
4.2 Caracterize as variáveis como sendo quantitativa contínua, quantitativa discreta ou
qualitativa.
Tipos de Variável
Qualitativas
Variáveis Discretas
Quantitativas
Contínuas
Variável qualitativa é uma variável que não se pode medir nem referenciar numericamente.
Exemplos: cor dos olhos; disciplina preferida, clube preferido …
Variável quantitativa é uma variável que se pode medir, apresentando-se com diferentes
intensidades.
Exemplos: altura, classificação do fim do período, nº de irmãos, tempo médio de estudo num dia…
Página 27 de 41
Módulo Estatística
Página 28 de 41
Módulo Estatística
Módulo Estatística
1. Numa cidade de 20000 habitantes fez-se um inquérito sobre o meios de transporte utilizado
diariamente para se deslocarem para o emprego. Foram interrogadas 2500 pessoas e os
resultados foram registados no seguinte gráfico:
1.1 Construa uma tabela com a frequência relativa
de cada um dos transportes.
1.2 Quantas das pessoas inquiridas definem como
meio de transporte mais utilizado o
Automóvel?
Página 29 de 41
Módulo Estatística
3.1 Calcula as amplitudes dos ângulos indicados no diagrama circular.
3.2 Calcula quantos alunos usam Tênis, Sandálias ou Sapatos.
Página 30 de 41
Módulo Estatística
7. Observa atentamente o gráfico de barras que representa a distribuição do número de horas
diárias de sono de pessoas adultas.
7.1 Quantas pessoas foram observadas?
7.2 Qual a variável em estudo e qual a sua natureza?
7.3 Qual a percentagem de adultos que dormem oito horas?
7.4 Neste estudo quantas pessoas dormem menos de sete horas?
8. Considera o seguinte pictograma que indica a área ardida em Portugal entre 2003 e 2007.
Página 31 de 41
Módulo Estatística
Página 32 de 41
Módulo Estatística
Módulo Estatística
OOFPFFPOCCOFPPCFFOOOCPOPOCOOPO
(F = Fiat; O = Opel; P = Peugeot; C = Citroen)
2. Foi feito um levantamento sobre o número de ovos existentes nos ninhos das andorinhas de
uma região.
0 3 1 2 4 2 3
1 2 2 3 1 1 1
3 1 3 4 0 1 2 2.1. Clas
sifique a variável em estudo.
2.2. Construa a tabela de frequências absolutas e relativas.
3. Fez-se um inquérito a 20 jovens sobre as idas à discoteca no último mês e os resultados estão
indicados na seguinte tabela.
3 5 4 2 1 0 3 4 5 1
Idas à discoteca
3 5 2 1 0 5 5 5 4 3
Página 33 de 41
Módulo Estatística
4. Registou-se o número de bebés nascidos na maternidade de um hospital em cada um dos
dias do mês de Abril, tendo-se obtido os seguintes valores:
3 1 2 3 0 2 4 3 4 2
3 2 1 2 2 0 4 3 1 1
4 3 3 2 1 3 2 0 3 2
12.1 8.9 16.2 8.2 9.8 15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1
15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5
b) Dividir essa amplitude pelo número k tal que 2K>n de classes pretendido;
tomar para essa amplitude de classe h um valor aproximado por excesso do
valor anteriormente obtido.
c) Construir as classes de modo que tenham todas a mesma amplitude e cuja
união contenha todos os elementos da amostra.
Página 34 de 41
Módulo Estatística
Módulo Estatística
1. Observe as notas, em percentagem, obtidas por uma turma do 9º ano durante o 1.º período.
Aluno Miniteste 1.º 2.º
1 99 100 94 1.1. Qual foi a nota média dos testes obtidas
2 80 58 75
3 68 53 69 pelo aluno número 1?
4 15 46 50
5 15 12 24
1.2. Qual a média obtida pelos alunos da
6 24 54 46
7 65 53 50 turma no miniteste? E no 2.º teste?
8 24 38 50
2. Uma empresa tem seis trabalhadores com os ordenados representados na tabela:
Indique:
A medida que melhor representa os dados é a ____________________ pois não é afetada por
valores discrepantes.
3. A Joana realizou para a disciplina de Matemática, durante o ano letivo, cinco trabalhos nos quais
obteve as seguintes classificações:
10 8 16 8 18
A classificação final é atribuída tendo em conta as notas dos cinco trabalhos mediante o critério
escolhido pelo professor:
Critério A: Média das classificações
Critério B: Moda das classificações
Critério C: Mediana das Classificações
Página 35 de 41
Módulo Estatística
4. Indica se as afirmações são verdadeiras ou falsas, justificando:
4.1 Numa turma o aluno mais alto mede 180 centímetros e o aluno mais baixo mede
162.
4.2 4.2 A média das alturas dos alunos poderá ser 181 centímetros.
4.3 É possível determinar a média em variáveis qualitativas.
4.4 É possível determinar a moda em variáveis quantitativas contínuas.
10
12
14
16
18
20
22
24
0
2
4
6
8
número de idas ao cinema durante um mês.
6. Observa atentamente o gráfico de barras que representa a distribuição do número de vezes que
as pessoas inquiridas foram ao supermercado por semana.
Página 36 de 41
Módulo Estatística
7. Para analisar o desempenho dos alunos na disciplina de Matemática, uma escola fez um estudo
em que analisou as classificações dos seus 200 alunos no último teste de Matemática.
Posteriormente afixou a seguinte tabela:
Informação
Como está a Matemática na nossa Escola?
Classificações (%) ni
¿ 20
¿ 120
¿ 40
¿ 20
7.4 Calcule, um valor aproximado da nota média dos alunos desta escola no último teste de
Matemática.
Página 37 de 41
Módulo Estatística
Módulo Estatística
Medidas de dispersão
Variância e desvio padrão de dados simples - Para um melhor conhecimento da dispersão dos
dados de uma amostra, podemos recorrer a medidas como a variância e o desvio padrão, que medem o
afastamento de todos os dados relativamente à média aritmética.
Variância: v=
∑ (x i−x )2 . ni
N
Desvio padrão:σ =
√ ∑ ( x i−x)2 . ni
N
Para
Aplic
ar:
1. A Margarida e a Liliana são irmãs gémeas. Estão no 10º ano, na mesma turma, e gostam de competir pelos
melhores resultados em Matemática. As suas notas nos testes de avaliação foram:
Margarida: 10 12 13 13 16 13 14
Liliana: 9 17 9 13 18 16 9
1.1. Calcule a amplitude e a amplitude inter-quartil de cada amostra. Compare-as. O que conclui?
1.2. Calcule a nota média dos testes da Margarida e da Liliana.
Página 38 de 41
Módulo Estatística
1.3. A média parece-lhe um bom indicador das notas das gémeas? Justifique.
1.4. Qual das duas alunas lhe parece ser a melhor na disciplina de Matemática? Porquê?
1.5.Sem recorrer à calculadora, determine, relativamente às notas da Margarida, o valor da variância e do
desvio padrão.
Página 39 de 41
Módulo Estatística
Módulo Estatística
1.1 Determina a previsão do peso de um bebé para um caso em que a mãe fume 22 cigarros por
dia.
1.2 Determina a previsão do peso de um bebé para um caso em que a mãe não fume.
Página 40 de 41
Módulo Estatística
2. Pesaram-se e mediram-se alguns indivíduos e obtiveram-se os seguintes resultados.
Y =0,9016 x+109,36
2.1 Efetua uma previsão para a altura de um indivíduo que pese 86 kg.
2.2 Efetua uma previsão para a altura de um indivíduo que pese 50 kg.
Página 41 de 41
Módulo Estatística