Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

ResumoTeoria e Fichas TrabalhoEstatística

Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1de 38

Módulo

ESTATÍSTICA
Programa:

I. Estatística — Generalidades

 Objeto da estatística. Utilidade na vida moderna.


 Recenseamento e sondagem; população e amostra; critérios de seleção de amostra de uma
determinada população.
 Estatística descritiva e indutiva.

II. Organização e interpretação de caracteres estatísticos (qualitativos e quantitativos)

 Tipos de caracteres estatísticos: qualitativo e quantitativo (discreto e contínuo).


 Formas de representação: gráficos circulares, diagramas de barras/histogramas, pictogramas, função
cumulativa, diagrama de extremos e quartis, tabelas de frequências absolutas e relativas, polígono de
frequências.
 Medidas de localização central: moda/classe modal, média, mediana e quartis.
 Medidas de dispersão: amplitude, variância, desvio padrão, amplitude inter-quartis.

III. Referência a distribuições bidimensionais (abordagem gráfica e intuitiva)

 Diagrama de dispersão; dependência estatística e correlação positiva e negativa.


 Coeficiente de correlação e sua variação no intervalo.
 Definição de centro de gravidade de um conjunto finito de pontos; sua interpretação física.
 Reta de regressão: sua interpretação e limitações.

Avaliação:
Duração Avaliação
Teste de avaliação
(60%)

Avaliação contínua (30%) – Incluí trabalho de grupo


27h/28 horas
Atitudes e Comportamento (5%)

Assiduidade e Pontualidade (5%)


I - Estatística Generalidades
1. Objeto da Estatística

“Ciência que dispõe de processos apropriados para recolher, organizar, classificar, apresentar
e interpretar conjuntos de dados"

     
A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes
incompletos, na medida em que nos dão informação útil sobre o problema em estudo, não
realçando, no entanto, aspetos importantes.

É objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das
situações que representam.

No estudo de um problema envolvendo métodos estatísticos, estes devem ser utilizados mesmo
antes de se recolher a amostra, isto é, deve-se planear a experiência que nos vai permitir recolher
os dados, de modo a que, posteriormente, se possa extrair o máximo de informação relevante
para o problema em estudo, ou seja para a população de onde os dados provêm.

Se pretendemos estudar o sucesso escolar, em Português dos alunos do 10º ano, da Escola
Exemplo :
Secundária Prof. Herculano de Carvalho, será natural ir consultar as pautas destes alunos, no
final do ano. A partir daí poderá facilmente ser obtida a percentagem de aprovações.

Se, no entanto, pretendermos aprofundar um pouco mais este assunto, nomeadamente saber
se o sucesso é análogo para os rapazes e raparigas, ou nos diferentes agrupamentos
disciplinares, deverá recolher-se não só a informação respeitante ao aluno ter passado ou
não, mas também para cada um o sexo e o agrupamento disciplinar:
Agrupamento disciplinar Nota Sexo
1 12 F
2 13 M
... ... ...
                 
Uma vez os dados recolhidos, sob a forma de uma amostra, faz-se a redução e
representação desses dados, utilizando as tabelas e os diferentes tipos de gráficos, sendo um dos
principais objectivos desta fase, a identificação da estrutura subjacente aos dados, deixando de
lado a aleatoriedade presente.

Página 2 de 38
Módulo Estatística
Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou
testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a
potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma
população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido.

2. População e Amostra

Uma noção fundamental em Estatística é a de conjunto ou agregado, conceito para o qual se usam,
indiferentemente, os termos População ou universo.

         2.1-População        
Coleção de unidades individuais, que podem ser pessoas ou resultados
experimentais, com uma ou mais características comuns, que se pretendem
estudar.
                  ATENÇÃO : População em estatística
não diz respeito exclusivamente a pessoas!

EXEMPLOS
Exemplo 1: Relativamente à população constituída pelos alunos do 10º ano
de escolaridade matriculados na Escola Secundária dos Olivais nº 2, podemos
estar interessados em estudar as seguintes características populacionais:
- Altura (em cm) dos alunos:
Depois de medir a altura de cada aluno, obteríamos um conjunto de dados com o seguinte aspeto:
145, 161, 158, 156, 146,... ,140, 139, 162
- Notas obtidas na disciplina de Português,
no 1º período:
10, 15, 13, 16, 9, 11, 10, ... , 18, 11, 13, 8

Nem sempre é possível estudar exaustivamente todos os elementos da população!

PORQUÊ?

- Pode a população ter dimensão infinita


Exemplo: População constituída pelas pressões atmosféricas, nos diferentes
pontos de uma cidade.

Página 3 de 38
Módulo Estatística
- Pode o estudo da população levar à destruição da população
Exemplo: População dos fósforos de uma caixa.
- Pode o estudo da população ser muito dispendioso
Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado
candidato.

Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se só alguns
elementos, a que damos o nome de Amostra.
                     
2.2-Amostra Conjunto de dados ou observações, recolhidos a partir de um subconjunto da
população, que se estuda com o objetivo de tirar conclusões para a população de onde
foi recolhida.
                 

EXEMPLOS

Exemplo 1: Relativamente à população das alturas dos alunos do 10º ano matriculados na Escola
Secundária dos Olivais, nº 2, consideremos a seguinte amostra, constituída pelas
alturas (em cm) de 20 alunos escolhidos ao acaso:
            
145, 163, 157, 152, 156, 149, 160, 157, 148, 147, 151, 152, 150, 148, 156,
160, 148, 157, 153, 162

É importante a fase de recolha da amostra?


                
Sim, pois a amostra deve ser tão representativa quanto possível da População que se pretende
estudar, uma vez que vai ser a partir do estudo da amostra, que vamos tirar conclusões para a
População.
             
Quando a amostra não representa corretamente a população diz-se enviesada e a sua utilização
pode dar origem a interpretações erradas, como se sugere nos seguintes exemplos:
- Utilizar uma amostra constituída por 10 benfiquistas, para prever o vencedor do próximo
Benfica-Sporting.
- Utilizar uma amostra constituída pelos leitores habituais de determinada revista
especializada, para tirar conclusões sobre a população geral.
Página 4 de 38
Módulo Estatística
3. Recenseamento e Sondagem

3.1-Recenseamento O termo recenseamento está, em regra geral, associado à contagem oficial e


periódica dos indivíduos de um País, ou parte de um País. Ele abrange, no
entanto, um leque mais vasto de situações. Assim, pode definir-se
recenseamento do seguinte modo:
Estudo científico de um universo de pessoas, instituições ou objetos físicos com o propósito de adquirir
conhecimentos, observando todos os seus elementos, e fazer juízos quantitativos acerca de características
importantes desse universo.
       

Para a maioria das pessoas a palavra recenseamento ou censo encontra-se associada à enumeração dos
elementos da população de um País. Em Portugal, de dez em dez anos, realiza-se o Recenseamento Geral da
População. O último ocorreu em 2011, encontrando-se disponíveis na Internet (Infoline - Serviço de
Informação On Line do INE) os resultados desses censos - Censos 2011.

3.2-Sondagem Por vezes não é viável nem desejável, principalmente quando o número de
elementos da população é muito elevado, inquirir todos os seus elementos sempre
que se quer estudar uma ou mais características particulares dessa população.
Assim surge o conceito de sondagem, que se pode tentar definir como:
estudo científico de uma parte de uma população com o objetivo de estudar atitudes, hábitos e
preferências da população relativamente a acontecimentos, circunstâncias e assuntos de interesse
comum.
É fundamental referir que, contrariamente ao recenseamento, as sondagens inquirem ou analisam apenas uma
parte da população em estudo, isto é, restringem-se a uma amostra dessa população, mas com o objetivo de
extrapolar para todos os elementos da população os resultados observados na amostra.

Página 5 de 38
Módulo Estatística
4. Estatística Descritiva e Estatística Indutiva

De acordo com o que dissemos anteriormente, numa análise estatística distinguem-se essencialmente
duas fases:
                  
Uma primeira fase em que se procura descrever e estudar a amostra:
Estatística Descritiva
               
e uma segunda fase em que se procura tirar conclusões para a população:
Estatística Indutiva

Exemplo de aplicação da Estatística

Módulo Probabilidades

Ano letivo 2013 - 2014

Ficha Nº2 Aplicação da Lei de Laplace |Diagrama de árvore| Tabela de dupla Entrada

Esquematicamente, temos:

Página 6 de 38
Módulo Estatística
Resumindo, podemos dizer que uma análise estatística envolve duas fases fundamentais, com objectivos distintos:

Estatística Procura-se descrever a amostra, pondo em evidência as características principais e as


1ª Fase
Descritiva propriedades.

         

Estatística Conhecidas certas propriedades (obtidas a partir de uma análise descritiva da


2ª Fase
Indutiva amostra), expressas por meio de proposições, imaginam-se proposições mais gerais,
que exprimam a existência de leis (na população).

   

No entanto, ao contrário das proposições deduzidas, não podemos dizer que são falsas ou verdadeiras, já que
foram verificadas sobre um conjunto restrito de indivíduos, e portanto não são falsas, mas não foram verificadas
para todos os indivíduos da População, pelo que também não podemos afirmar que são verdadeiras !

Existe, assim, um certo grau de incerteza (percentagem de erro) que é medido em termos de Probabilidade.

Página 7 de 38
Módulo Estatística
5. Campos de Aplicação

"Os campos de aplicação da Estatística são muitos e os mais variados."

5.1Estudos de mercado

5.2 Medicina
OPretende-se
gerente de estudar
uma fábrica de detergentes
o  efeito de um novopretende lançarpara
medicamento um novo
curarproduto para lavar
determinada a loiça,
doença. pelo que, encarrega
É selecionado um grupo
de 20
uma doentes,
empresa administrando-se
especialista o novo
em estudos medicamento
de mercado a 10 desses
de "estimar" doentes escolhidos
a percentagem ao acaso
de potenciais e o medicamento
compradores desse
habitual  aos restantes.
produto.
     
População: conjunto de todos os agregados familiares do País
Amostra: População: conjunto
conjunto de todos
de alguns os doentes
agregados com ainquiridos
familiares, doença que o medicamento
pela empresa a estudar pretende tratar.
Problema: Amostra: conjuntoa dos
pretende-se, 20da
partir doentes selecionados
percentagem de respostas afirmativas, de entre os inquiridos sobre a
Problema: pretende-se, a partir dos resultados obtidos, realizar um "teste de hipóteses" para tomar
compraumadodecisão
novo produto, obter
sobre qual dosuma estimativa do
medicamentos número de compradores na População.
é melhor.

Controle de Qualidade
O administrador de uma fábrica de parafusos pretende assegurar-se de que
a percentagem de peças defeituosas não excede um determinado valor, a
partir do qual determinada encomenda poderia ser rejeitada.

População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o


mesmo processo.
Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos.
Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na8amostra,
Página de 38
"estimar" a percentagemMódulo
de defeituosos em
Estatística toda a produção.
II. Organização e interpretação de caracteres estatísticos (qualitativos e
quantitativos)
1. Tipo de variáveis (dados ou carateres) estatísticas

Podemos classificar as variáveis que constituem a Amostra, , em dois tipos fundamentais:

Variáveis Qualitativas e Variáveis quantitativas

Vejamos como se tratam e organizam os vários tipos de variáveis:


1.1 Representam a informação que identifica alguma qualidade, categoria ou característica,
Variáveis não suscetível de medida, mas de classificação, assumindo várias modalidades.
qualitativas  
  Exemplo: O estado civil de um indivíduo é um dado qualitativo, assumindo as categorias:
casado, viúvo e divorciado.

As variáveis qualitativas são organizados na forma de uma tabela de frequências que apresenta o número de

elementos - frequência absoluta (ou só frequência) de cada uma das categorias ou classes.

Numa tabela de frequências, além das frequências absolutas, também se apresentam as frequências relativas:

Dimensão da amostra é o Número de elementos da amostra

Num inquérito realizado a 150 indivíduos, estes tiveram de assinalar o sexo - M ou F, e o estado civil -
Exemplo:
Solteiro, Casado, Viúvo ou Divorciado. Uma forma de resumir a informação contida nos dados, no que
diz respeito ao estado civil, é construir uma tabela de frequências em que se consideram para as
classes as diferentes modalidades que o estado civil pode tomar:

Tabela de frequências simples


Classes ou
freq. abs. freq. rel.
Estado Civil
Solteiro 78 0.52
Casado 50 0.33
Viúvo 5 0.03
Divorciado 17 0.12 Página 9 de 38
Total
Módulo Estatística 150 1.00
2. Variáveis Representam a informação resultante de características susceptíveis de serem medidas,
quantitativas
apresentando-se com diferentes intensidades, que podem ser de natureza discreta (descontínua) -
 
dados discretos, ou contínua - dados contínuos.
                  
Exemplo: Consideremos uma amostra constituída pelo nº de irmãos de 10 alunos de uma
determinada turma :
3, 4, 1, 1, 3, 1, 0, 2, 1, 2
Estes dados são de natureza discreta.

Se para os mesmos alunos considerarmos as alturas (cm):


153, 157, 161, 160, 158, 155, 162, 156, 152, 159
obteremos dados do tipo contínuo.

2.1 Variáveis
quantitativas Estes dados só podem tomar um número finito ou infinito numerável de valores
discretas distintos, apresentando vários valores repetidos - é o caso, por exemplo, do nº de filhos
de uma família ou do nº de acidentes, por dia, em determinado cruzamento.

       

Como Os dados são organizados na forma de uma tabela de frequências, análoga à


organizar construída para o caso dos dados qualitativos. No entanto, em vez das categorias
os dados? apresentam-se os valores distintos da amostra, os quais vão constituir as classes.
Página 10 de 38
Módulo Estatística
Exemplo: Consideremos a amostra constituída pelo nº de irmãos dos 20 alunos de uma
determinada turma:
1, 1, 2, 1, 0, 3, 4, 2, 3, 1, 0, 2, 1, 1, 0, 1, 1, 0, 3, 2
             
tabela de frequências
classes freq. abs. freq. rel.
0 4 0.20
1 8 0.40
2 4 0.20
3 3 0.15
4 1 0.05
total 20 1.00

REPRESENTAÇÃO

Diagrama de barras Representação gráfica que consiste em marcar num sistema de eixos
ou coordenados, no eixo dos xx o valor das classes e nesses pontos barras verticais
Distribuição de frequências de altura igual à frequência absoluta ou à frequência relativa.
Obter-se-á um gráfico com o aspeto
seguinte:

A linha a tracejado, que une os extremos das barras, chama-se


Polígono de Frequências

Página 11 de 38
Módulo Estatística
Exemplo: Utilizando a tabela de frequências obtida no exemplo anteriormente
considerado, construa o diagrama de barras e o polígono de
frequências (utilize frequências relativas).:
   
Tabela de frequências Diagrama de barras
Classes freq. abs. freq. rel.
0 4 0.20
1 8 0.40
2 4 0.20
3 3 0.15
4 1 0.05
Total 20 1.00

Algumas considerações sobre a metodologia a seguir


na construção do diagrama de barras:

1. Ordenar a amostra e considerar para classes os diferentes valores aí considerados.


Marcar essas classes no eixo xx, num sistema de eixos coordenados.
            
2. Nos pontos onde se consideraram as classes, marcar barras de altura igual à frequência absoluta ou
relativa, da respectiva classe. De preferência utilizar as frequências relativas, pois se pretendermos
comparar diagramas de barras de amostras diferentes, temos a garantia de que a soma das barras em
qualquer dos diagramas, é igual a 1.
Página 12 de 38
Módulo Estatística
2.2-Variáveis quantitativas No caso de uma variável contínua, esta pode tomar todos os valores numéricos,
contínuas inteiros ou não, compreendidos no seu intervalo de variação - temos por
exemplo o peso, a altura, etc...
          
Como organizar os dados?
Enquanto que no caso de dados discretos, a construção da tabela de frequências não apresenta qualquer
dificuldade, no caso das variáveis contínuas o processo é um pouco mais elaborado, distinguindo-se certas etapas
principais.

Construção da tabela de frequências, de uma amostra de dados contínuos

Para exemplificar o processo descrito a seguir, utilizaremos a amostra de notas obtidas num ponto de
Matemática de uma determinada turma:
12.1 8.9 16.2 8.2 9.8 15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1
15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5
  
1º Definição a) Determinar a amplitude da amostra, isto é, a diferença entre o valor máximo
das classes e o valor mínimo
No caso da amostra considerada, amplitude =
16.2 - 7.5 = 8.7

b) Dividir essa amplitude pelo número k   de classes pretendido; tomar para essa
amplitude de classe h um valor aproximado por excesso do valor anteriormente obtido.
No caso da amostra considerada, escolhendo k=5,
h = 8.7 / 5 = 1.74 1.8

c) Construir as classes de modo que tenham todas a mesma amplitude e cuja união contenha todos os
elementos da amostra.
Uma metodologia a seguir para construir as classes Ci = [ci , ci+1[ poderá ser a seguinte:

A primeira classe C1 será

C1 = [c1, c2[ = [mín. da amostra, mín. da amostra + h[

As outras classes Ci serão


Ci = [ mín. amostra + ( i - 1) x h , mín. amostra + i x h [  
com i=1,2,...,k
No caso da amostra temos:  
C1=[7.5, 9.3[ ;  C2=[9.3, 11.1[ ; C3=[11.1, 12.9[ ; C4=[12.9, 14.7[ ; C5=[14.7, 16.5[
Página 13 de 38
Módulo Estatística
2º Contagem do número de elementos
Conta-se o número de elementos da amostra, que pertencem a cada classe. Analogamente ao
que foi considerado no caso dos dados discretos, esses valores serão as frequências absolutas
das classes. No caso da amostra dada
    
Classe Freq Absoluta
[7.5, 9.3[ 5
[9.3, 11.1[ 3

Página 14 de 38
Módulo Estatística
[11.1, 12.9[ 3
[12.9, 14.7[ 5
[14.7, 16.5[ 6

Representação gráfica de dados contínuos


Histograma

Para a representação gráfica de dados contínuos, usa-se um diagrama de áreas ou histograma, formado por uma
sucessão de rectângulos adjacentes, tendo cada um por base um intervalo de classe e por área a frequência 
relativa (ou a frequência absoluta).
Deste modo a área total será igual a 1 (resp. igual a n, a dimensão da amostra)

A representação obtida terá o seguinte aspecto:

Diagrama de caule-e-folhas

É um tipo de representação que se pode considerar entre a tabela e o gráfico, uma vez que são apresentados os
verdadeiros valores da amostra, mas numa apresentação sugestiva, que faz lembrar um histograma.

Consiste em escrever do lado esquerdo de uma linha vertical o dígito (ou dígitos) da classe de maior
grandeza, seguidos dos restantes. A representação obtida terá o seguinte aspecto:

           
Diagrama de extremos e quartis

Página 15 de 38
Módulo Estatística
É um tipo de representação gráfica, em que se realçam algumas características da amostra. O
conjunto dos valores da amostra compreendidos entre o 1º e o 3º QUARTIS, que vamos representar
por Q1 e Q3 é representado por um rectângulo (caixa) com a MEDIANA indicada por uma barra. A
largura do rectângulo não dá qualquer informação, pelo que pode ser qualquer. Consideram-se
seguidamente duas linhas que unem os meios dos lados do rectângulo com os extremos da
amostra. Para obter esta representação, começa por se recolher da amostra, informação sobre 5
números, que são: os 2 extremos (mínimo e máximo), a mediana e o 1º e 3º quartis. A
representação do diagrama de extremos e quartis tem o seguinte aspecto:

MEDIDAS DE LOCALIZAÇÃO

Antes de começar a definir as medidas, que vão ser utilizadas para resumir a informação contida nos
dados, e lembrando mais uma vez que estamos na fase da análise estatística conhecida por Estatística
O extremo inferior é o mínimo da amostra, enquanto que o extremo superior é o máximo da
Descritiva, vamos introduzir uma notação conveniente para representar a amostra. Assim, o conjunto de dados
amostra.
ou observações que constituem a amostra será representado por
x1, x2, ..., xn
onde x1, x2, ..., xn, representam, respectivamente, a 1ª observação, a 2ª observação e a n-ésima observação, de
uma amostra de dimensão n. Esta notação não implica uma relação de ordem entre os elementos da amostra.

Das medidas, ou estatísticas que iremos definir, para caracterizar os dados, destacam-se as
medidas de localização
nomeadamente as que localizam o centro da amostra (média, moda e mediana) , e as
medidas de dispersão
que serão abordadas no capítulo seguinte.
      
Será mesmo necessário utilizar os dois tipos de medidas, para caracterizar os dados?

Vejamos um exemplo:

Dois alunos do 7º ano obtiveram as seguintes notas, no 3º período:


Pedro 4 3 3 3 3 3 4 3 4 3
João 5 2 2 3 4 3 5 3 3 3
O Pedro e o João tiveram a mesma média de 3.3, mas o João não transitou de ano. Representando as notas
num diagrama de caule e folhas:

Pedro João

observamos que uma característica apresentada pelas notas do João, é uma maior variabilidade do que as
notas do Pedro.

Página 16 de 38
Módulo Estatística
Média

A média amostral ou simplesmente média, que se representa por é uma medida de localização do centro da
amostra, e obtém-se a partir da seguinte expressão:

onde x1, x2, ..., xn representam os elementos da amostra e n a sua dimensão

MÉDIA EM REPRESENTAÇÕES GRÁFICAS

Esquematicamente podemos posicionar a média da forma seguinte, tendo em conta a representação gráfica na
forma de histograma.

Figura aproximadamente O enviesamento para a O enviesamento para a


simétrica, pelo que o direita provoca que a esquerda provoca uma
centro está bem média seja deslocada deslocação da média para
definido. para a direita. a esquerda.
Moda

Para um conjunto de dados, define-se moda como sendo:


o valor que surge com mais frequência  se os dados são discretos, ou, o intervalo de classe com maior frequência
se os dados são contínuos.
Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe
modal.

MODA EM REPRESENTAÇÕES GRÁFICAS

Página 17 de 38
Módulo Estatística
Mediana

A mediana, m, é uma medida de localização do centro da distribuição dos dados, definida do


seguinte modo:
Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a
divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os
outros 50% são maiores ou iguais à mediana
Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n
elementos:
Se n é ímpar, a mediana é o elemento médio.
Se n é par, a mediana é a semi-soma dos dois elementos médios.
Se se representarem os elementos da amostra ordenada com a seguinte notação:     X1:n ,
X2:n , ... , Xn:n
então uma expressão para o cálculo da mediana será:

Como medida de localização, a mediana é


Página 18 de 38
Módulo Estatística
MEDIDAS DE DISPERSÃO
MEDIANA EM REPRESENTAÇÕES GRÁFICAS

DesvioDado um histograma é fácil obter a posição da mediana, pois esta está na posição em que
padrão
passando uma linha vertical por esse ponto o histograma fica dividido em duas partes com
áreas
O desvio iguais.é uma medida de dispersão usada com a média. Mede a variabilidade dos valores à volta da média.
padrão
O valor mínimo do desvio padrão é 0 indicando que não há variabilidade, ou seja, que todos os valores são iguais à
média.

A fórmula de cálculo do desvio padrão para os valores x 1, x2, x3,…, xn de uma amostra é a seguinte:

Como medida de localização, a mediana é mais resistente do que a média, pois não é tão
sensível aos dados.

QUARTIS
Medidas que dividem a amostra respectivamente em 25% , 50% , 75 % e 100 %.
 
Ver o diagrama de extremos e quartis
Por convenção, usa-se a letra grega s (sigma) para o desvio padrão da população e s para o desvio padrão da amostra

NOTA: Por razões matemáticas que não estão no âmbito deste manual, no caso do cálculo do desvio padrão da
população deve-se usar como quociente da fórmula n em vez de n-1, e a média da população em vez da média da
amostra.

Exemplo: Consideremos os seguintes dados:


 

Nome  Idade  Nome  Idade


Paula 22 Gonçalo 22
Manuel 24 Pedro 20
Carla 26 Cristina 24
Maria 23 Sofia 28
João 21 Susana 30

 
A média das idades é:

(22+24+26+23+21+22+20+24+28+30) /10 = 24 anos.

O desvio padrão é:
Página 19 de 38
Módulo Estatística
III Referência a distribuições bidimensionais (abordagem gráfica e intuitiva)

Uma das áreas mais importantes da estatística é aquela que permite efetuar
previsões de alguma variável.

Quando a estatística trabalha duas variáveis em simultâneo, dizemos que estamos


na presença de uma distribuição bidimensional.

Através das distribuições bidimensionais poderemos responder a questões como:


Os mais altos são mais pesados? A altura dos pais influencia a altura dos filhos? A
temperatura influencia o número de pneumonias?

Para começarmos a estudar qualquer relação entre variáveis, temos


necessariamente de recolher os dados. Vejamos um exemplo:

Página 20 de 38
Módulo Estatística
Considere os seguintes dados, que representam o número de faltas não autorizadas por
ano e a distância (em km) a que os empregados de determinado armazém estão de casa.

Como representar este tipo de dados?

Utiliza-se um DIAGRAMA DE DISPERSÃO ou NUVEM DE PONTOS que é um sistema de eixos


em que uma variável está representada num eixo horizontal e a outra variável está
representada num eixo vertical e onde cada ponto representa um elemento da população.

  

Comentário:

O gráfico mostra uma ligeira


associação, de sentido
contrário, entre o nº de faltas e
a distância.

Assim, quanto maior é a


distância, menor é a tendência
para faltar !

Página 21 de 38
Módulo Estatística
O diagrama de pontos ou nuvem de pontos permite observar o comportamento conjunto
das duas variáveis e ajuda a determinar se existe alguma relação entre eles.

Cada ponto do gráfico representa um elemento da população. As coordenadas são os


valores das duas variáveis.

Visualmente os diagramas de pontos podem resultar num dos seguintes três exemplos:

1. Os pontos aparecem de forma decrescente;


2. Os pontos aparecem de forma crescente;
3. Os pontos não estão relacionados de nenhuma maneira das anteriores;

Afirmamos portanto que se:

- Os pontos estão dispostos de forma crescente, existe uma correlação positiva.

- Os pontos estão dispostos de forma decrescente, existe uma correlação negativa.

- Quando não se verifica nada do referido anteriormente, existe uma correlação nula.

Página 22 de 38
Módulo Estatística
Para ser mais exata a análise ao tipo de
correlação existente entre duas variáveis, ou quando
visualmente é difícil de

analisar, recorre-se ao coeficiente de correlação.

Página 23 de 38
Módulo Estatística
Quando o grau de correlação é forte, afirmamos que uma variável influencia a outra e é
nessa situação que podemos efetuar previsões. Para isso utiliza-se a reta de regressão.

- As previsões
fazem-
se
utilizando a equação da
reta de regressão
substituindo x ou y.

Módulo Estatística

Ficha Nº1 População e amostra / Sondagem e Censos /Tipos de variável

Página 24 de 38
Módulo Estatística
1. Para conhecer o canal preferido pelos habitantes de Lisboa foram inquiridos 300 pessoas.
1.1 Foi realizado uma sondagem ou um censo? Justifica.
1.2 Indica a população e a amostra.

2. Numa escola secundária com 687 alunos, 44 professores e 26 administrativos e auxiliares de


ação educativa, a equipa do jornal pretende fazer um estudo sobre a satisfação da comunidade
escolar, relativamente à alimentação fornecida na cantina pela nova empresa de catering.
2.1. Qual a população que se pretende estudar?
2.2. Se fossem inquiridos todos os alunos da escola estaríamos perante uma sondagem ou um
censo? Justifique.
2.3. Se fossem escolhidos 60 alunos do 12º ano dessa escola estaríamos perante uma amostra
representativa? Justifique.

3. Classifique cada uma das seguintes variáveis estatísticas:


3.1.Número de andares dos prédios de uma freguesia;
3.2.Partido político preferido dos eleitores portugueses;
3.3.Quantidade de árvores por espécie existentes numa dada cidade;
3.4.Peso da mochila de cada estudante português;
3.5.Número de bombeiros das corporações do arquipélago dos Açores;
3.6.Tipos de queijo comercializados em Portugal.

4. Num estudo feito numa escola, e para caracterizar os seus 2500 alunos recolheram-se dados de
200 alunos referentes às seguintes variáveis:  

(A) Local de residência; (B) Número de irmãos;


(C) Animal preferido; (D) Idade.

4.1 Indique a população e a amostra.


4.2 Caracterize as variáveis como sendo quantitativa contínua, quantitativa discreta ou
qualitativa.
Tipos de Variável
Qualitativas

Variáveis Discretas

Quantitativas

Página 25 de 38
Módulo Estatística
Contínuas

Variável qualitativa é uma variável que não se pode medir nem referenciar numericamente.
Exemplos: cor dos olhos; disciplina preferida, clube preferido …

Variável quantitativa é uma variável que se pode medir, apresentando-se com diferentes
intensidades.
Exemplos: altura, classificação do fim do período, nº de irmãos, tempo médio de estudo num dia…

Uma variável diz-se discreta quando só pode tomar valores isolados.


Exemplo: classificação do fim do período, nº de irmãos…

Uma variável diz-se contínua se podem tomar todos os valores reais.


Exemplo: altura, tempo médio de estudo num dia…

Página 26 de 38
Módulo Estatística
Módulo Estatística

Ficha Nº2 Representações Gráficas

1. Numa cidade de 20000 habitantes fez-se um inquérito sobre o meios de transporte utilizado
diariamente para se deslocarem para o emprego. Foram interrogadas 2500 pessoas e os
resultados foram registados no seguinte gráfico:
      
1.1 Construa uma tabela com a frequência relativa
de cada um dos transportes.
1.2 Quantas das pessoas inquiridas definem como
meio de transporte mais utilizado o
Automóvel?

2. As classificações obtidas por 240 alunos na prova global de


uma dada disciplina estão representadas no
histograma.
Determina a percentagem de alunos que obtiveram
menos de 10 valores.

3. Foi realizado um estudo com os 450 alunos de uma escola


para saber os tipos de calçados mais usados apresentou o
seguinte diagrama circular:

• 48% dos alunos usavam sandálias;


• 22% dos alunos usavam tênis;
• 30% dos alunos usavam sapato.
Esse resultado foi representado em um diagrama circular

Página 27 de 38
Módulo Estatística
3.1 Calcula as amplitudes dos ângulos indicados no diagrama circular.
3.2 Calcula quantos alunos usam Tênis, Sandálias ou Sapatos.

4. Observa o seguinte recorte de jornal relativamente à taxa de desemprego por nível de


escolaridade no ano de 2005?

4.1 Em que nível de escolaridade, a população portuguesa apresenta


maior taxa de desemprego?
4.2 Se em 2005 existiram 670 230 desempregados, quantos têm o
ensino superior?

5. O seguinte gráfico circular representa o grau de satisfação de 500


utilizadores de um serviço de internet.
Satisfeito
Determina o número de pessoas que estão:
Satisfeitas, Muito satisfeitas e Insatisfeitas.
Muito Satisfeito
No resultado final aproxima às unidades.
Insatisfeito

6. O gráfico de barras da figura ao lado mostra o


resultado de cinquenta lançamentos de um dado
onde se apontava o número que ficava voltado para
cima.
6.1Determina o número de vezes que cada face
saiu.
6.2Determina a percentagem de lançamentos onde
saiu a face número 1.

Página 28 de 38
Módulo Estatística
7. Observa atentamente o gráfico de barras que representa a distribuição do número de horas
diárias de sono de pessoas adultas.
7.1 Quantas pessoas foram observadas?
7.2 Qual a variável em estudo e qual a sua natureza?
7.3 Qual a percentagem de adultos que dormem oito horas?
7.4 Neste estudo quantas pessoas dormem menos de sete horas?

8. Considera o seguinte pictograma que indica a área ardida em Portugal entre 2003 e 2007.

8.1 Qual a área ardida em Portugal, no ano de


2004?
8.2 Qual a área ardida em Portugal no ano de 2007?

Página 29 de 38
Módulo Estatística
Página 30 de 38
Módulo Estatística
Módulo Estatística

Ficha Nº3 Tabelas de Frequências

1. Num concessionário automóvel, registaram-se as marcas vendidas num mês:

OOFPFFPOCCOFPPCFFOOOCPOPOCOOPO
(F = Fiat; O = Opel; P = Peugeot; C = Citroen)

1.1.Identifique a variável em estudo.


1.2.Elabore uma tabela de frequências absolutas e relativas.
1.3.Construa um gráfico de barras de frequências absolutas.

2. Foi feito um levantamento sobre o número de ovos existentes nos ninhos das andorinhas de
uma região.
0 3 1 2 4 2 3
1 2 2 3 1 1 1
3 1 3 4 0 1 2
2.1. Clas
sifique a variável em estudo.
2.2. Construa a tabela de frequências absolutas e relativas.

3. Fez-se um inquérito a 20 jovens sobre as idas à discoteca no último mês e os resultados estão
indicados na seguinte tabela.

3 5 4 2 1 0 3 4 5 1
Idas à discoteca
3 5 2 1 0 5 5 5 4 3

3.1.Constrói a tabela de frequências absolutas e relativas.


3.2.Qual a percentagem de jovens que vão à discoteca?
3.3.Quantos jovens vão pelo menos duas vezes à discoteca?

Página 31 de 38
Módulo Estatística
4. Registou-se o número de bebés nascidos na maternidade de um hospital em cada um dos
dias do mês de Abril, tendo-se obtido os seguintes valores:

3 1 2 3 0 2 4 3 4 2

3 2 1 2 2 0 4 3 1 1

4 3 3 2 1 3 2 0 3 2

4.1. Identifica a variável estatística em estudo.


4.2. Classifica a variável estatística.
4.3. Constrói a tabela de frequências absolutas e relativas.

5. Elabora uma tabela de frequências para as notas de um teste na disciplina de Português.

12.1 8.9 16.2 8.2 9.8 15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1
15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5

1º Definição a) Determinar a amplitude da amostra, isto é, a diferença entre o valor máximo e o


das classes valor mínimo
No caso da amostra considerada,
amplitude =

b) Dividir essa amplitude pelo número k tal que 2K>n de classes pretendido;
tomar para essa amplitude de classe h um valor aproximado por excesso do
valor anteriormente obtido.
c) Construir as classes de modo que tenham todas a mesma amplitude e cuja
união contenha todos os elementos da amostra.

Página 32 de 38
Módulo Estatística
Módulo Estatística

Ficha Nº4 Medidas de Localização

1. Observe as notas, em percentagem, obtidas por uma turma do 9º ano durante o 1.º período.
Aluno Minitest 1.º 2.º
1 99 100 94 1.1. Qual foi a nota média dos testes obtidas
2 80 58 75
3 68 53 69 pelo aluno número 1?
4 15 46 50
5 15 12 24
6 24 54 46 1.2. Qual a média obtida pelos alunos da
7 65 53 50 turma no miniteste? E no 2.º teste?
8 24 38 50
2. Uma empresa tem seis trabalhadores com os ordenados representados na tabela:
Indique:

A medida que melhor representa os dados é a ____________________ pois não é afetada por
valores discrepantes.

3. A Joana realizou para a disciplina de Matemática, durante o ano letivo, cinco trabalhos nos quais
obteve as seguintes classificações:

10 8 16 8 18

A classificação final é atribuída tendo em conta as notas dos cinco trabalhos mediante o critério
escolhido pelo professor:
Critério A: Média das classificações
Critério B: Moda das classificações
Critério C: Mediana das Classificações

Qual dos três critérios é o mais favorável para a Joana? Justifica.

Página 33 de 38
Módulo Estatística
4. Indica se as afirmações são verdadeiras ou falsas, justificando:

4.1 Numa turma o aluno mais alto mede 180 centímetros e o aluno mais baixo mede
162.
4.2 4.2 A média das alturas dos alunos poderá ser 181 centímetros.
4.3 É possível determinar a média em variáveis qualitativas.
4.4 É possível determinar a moda em variáveis quantitativas contínuas.

Nº de idas ao cinema durante um mês num grupo de jovens


5. O gráfico de barras da figura ao lado mostra o resultado
de um inquérito feito a um grupo de jovens sobre o 24
22
número de idas ao cinema durante um mês.
20
18
16
Nº de jovens

5.1 Qual é a moda desta distribuição? 14


12
10
8
5.2 Determina a percentagem de jovens
6
que não foi ao cinema durante o mês.
4
2
0
0 1 2 3 4 5 6
5.3 Determina a média de idas ao cinema. Idas cinema

5.4 Justifica porque é que a média nunca poderá assumir o valor de 7.

6. Observa atentamente o gráfico de barras que representa a distribuição do número de vezes que
as pessoas inquiridas foram ao supermercado por semana.

6.1 Quantas pessoas foram observadas?


6.2 Qual a variável em estudo e qual a sua
natureza?
6.3 Determina a média de vezes que as
pessoas inquiridas foram ao
supermercado por semana.

Página 34 de 38
Módulo Estatística
7. Para analisar o desempenho dos alunos na disciplina de Matemática, uma escola fez um estudo
em que analisou as classificações dos seus 200 alunos no último teste de Matemática.
Posteriormente afixou a seguinte tabela:

Informação
Como está a Matemática na nossa Escola?

Classificações (%) ni
¿ 20
¿ 120
¿ 40
¿ 20

7.1 Este estudo é um recenseamento ou uma sondagem?


7.2 Calcule a percentagem de alunos que obteve classificação positiva inferior a 75%.
7.3 Complete a seguinte tabela:
Classificações (%) Marca da Classe ( y i ¿ ni
0+25
¿ =12,5 20
2
25+50
¿ =37,5
2

7.4 Calcule, um valor aproximado da nota média dos alunos desta escola no último teste de
Matemática.

Página 35 de 38
Módulo Estatística
Módulo Estatística

Ficha Nº5 Medidas de Dispersão

Medidas de dispersão

 Amplitude inter-quartil é a diferença entre Q3 e Q1.


A amplitude inter-quartil é sempre positiva ou nula e quanto maior for a variabilidade dos dados maior será o
seu valor.

 Variância e desvio padrão de dados simples - Para um melhor conhecimento da dispersão dos
dados de uma amostra, podemos recorrer a medidas como a variância e o desvio padrão, que medem o
afastamento de todos os dados relativamente à média aritmética.

( x i− x́ )2 . ni ∑ (x i−x́)2 . ni
Variância: v= ∑
N
Desvio padrão:σ =
√ N

1. A Margarida e a Liliana são irmãs gémeas. Estão no 10º ano, na mesma turma, e gostam de competir pelos
melhores resultados em Matemática. As suas notas nos testes de avaliação foram:
Margarida: 10 12 13 13 16 13 14
Liliana: 9 17 9 13 18 16 9

1.1. Calcule a amplitude e a amplitude inter-quartil de cada amostra. Compare-as. O que conclui?
1.2. Calcule a nota média dos testes da Margarida e da Liliana.
1.3. A média parece-lhe um bom indicador das notas das gémeas? Justifique.
1.4. Qual das duas alunas lhe parece ser a melhor na disciplina de Matemática? Porquê?
1.5. Sem recorrer à calculadora, determine, relativamente às notas da Margarida, o valor da variância e do
desvio padrão.

Página 36 de 38
Módulo Estatística
Módulo Estatística

Ficha Nº6 Distribuição Bidimensional

Organizaram-se os dados num diagrama de dispersão e encontrou-se a seguinte reta de regressão


Quando não (para efetuar
é possível estimativas)
estudar,
exaustivamente, todos os
elementos da população,
estudam-se só alguns

Como os pontos estão dispostos de forma decrescente, afirmamos que as variáveis


estão relacionadas negativamente, isto é, quanto maior o número de cigarros fumados por dia,
menor é o peso do bebé à nascença.

A equação da reta de regressão é: y= -0,0550301 x + 3,57053.

1.1 Determina a previsão do peso de um bebé para um caso em que a mãe fume 22 cigarros por
dia.
1.2 Determina a previsão do peso de um bebé para um caso em que a mãe não fume.

Página 37 de 38
Módulo Estatística
2. Pesaram-se e mediram-se alguns indivíduos e obtiveram-se os seguintes resultados.

Organizaram-se os dados num diagrama de


dispersão e obteve-se o seguinte gráfico.

É importante a fase de
recolha da amostra? Observa-se que os pontos estão dispostos
                 de forma crescente. As duas variáveis estão
Sim, pois a amostra deve ser
relacionadas positivamente, isto é, à
tão representativa quanto
medida que o peso aumenta, a altura
também aumenta.

A reta de regressão (para efetuar previsões) é:

Y =0,9016 x +109,36

2.1 Efetua uma previsão para a altura de um indivíduo que pese 86 kg.

2.2 Efetua uma previsão para a altura de um indivíduo que pese 50 kg.

Página 38 de 38
Módulo Estatística

Você também pode gostar