Aula Estatística Material de Apoio
Aula Estatística Material de Apoio
Aula Estatística Material de Apoio
Fundamentação Teórica
Referências
Estudo de estatı́stica
06 de fevereiro de 2024
Revisão
objetivo da estatı́stica
A estatı́stica tem como objetivo fornecer infomações(conhecimento)
utilizando quantidades númericas.
Áreas da estatı́stica
•População:
Coleção de todas as observações potenciais sobre um determinado
fenômeno.
•Amostra: Conjunto de dados efetivamente observados ou extraı́dos de
uma população. Sobre os dados da amostra se desenvolvem os estudos,
visando a fazer inferências sobre a população.
•Dados: Respostas coletadas da variável em estudo.
•Censo: Conjunto de dados obtidos através de todos os elementos da
população.
•Variável:
Caracterı́stica de interesse no estudo.
Exemplo
1.2: Vamos classificar as seguintes variáveis:
a) Número de peças defeituosas produzidas em uma linha de montagem.
b) Peso de pacientes.
c) Gosta de Música.
d) Tipo sanguı́neo.
e) Grau de satisfação do consumidor com determinado produto.
Resolução:
a) Variável quantitativa discreta: Pois as possı́veis respostas são 0, 1,
2, 3, etc. (as respostas assumem somente valores inteiros).
b) Variável quantitativa contı́nua: Pois as possı́veis respostas são 58,7;
89,8; etc. (as respostas podem assumir valores decimais).
c)Variável qualitativa nominal: Pois as possı́veis respostas são sim ou
não. (as possı́veis respostas são categóricas).
d) Variável qualitativa nominal: Pois as possı́veis respostas são A, AB,
B ou O (as possı́veis respostas são categóricas).
e) Variável qualitativa ordinal: Pois as possı́veis respostas são nada
satisfeito, pouco satisfeito, satisfeito, muito satisfeito (as possı́veis
respostas são categóricas e possuem uma ordenação natural, do menor
grau de satisfação para o
Revisão
•Amostragem
. Processo de escolha da amostra;
. Parte inicial de qualquer estudo estatı́stico;
. Consiste na escolha criteriosa de elementos a serem submetidos ao
estudo, para que os resultados sejam representativos, toma-se o cuidado
de entrevistar um conjunto de pessoas com caracterı́sticas
sócio-econômicas, culturais, religiosas etc. tão próximas quanto possı́vel
da população.
A escolha da amostra, construção dos instrumentos, entrevistas,
codificação dos dados e apuração dos resultados são etapas deste tipo de
pesquisa.
Levantamentos amostrais
Métodos probabilı́sticos
Exemplos:
Selecionar 10 estudantes de uma sala por sorteio e perguntar a idade.
Gerar uma amostra aleatória de 1000 números de matrı́cula de
estudantes da UFPR (no computador!) e perguntar a idade
Métodos probabilı́sticos
Métodos probabilı́sticos
Amostragem sistemática
Utilizada quando os elementos estão dispostos de maneira organizada
(ex.: fila, lista) e aleatória. Escolhe um ponto de partida e seleciona-se
cada k-ésimo elemento da população (ex.: o 50◦ elemento)
Métodos probabilı́sticos
Amostragem estratificada
Indicada quando a população está dividida em grupos distintos,
denominados estratos. Dentro de cada estrato é realizada uma
amostragem aleatória simples. O tamanho da amostra pode ou não ser
proporcional ao tamanho do estrato.
Métodos probabilı́sticos
TABELA PRIMITIVA
Ao fazer a coleta de dados numéricos, eles com certeza virão
desorganizados (ou seja, não estarão em ordem crescente nem em ordem
decrescente); dados assim formam a TABELA PRIMITIVA.
Figura: 1
Rol
Para facilitar a análise inicial dos dados é interessante dispô-los em ordem
crescente ou decrescente, gerando assim a tabela chamada ROL.
Pela natureza dos dados de nosso exemplo, é mais interessante
organizá-los em ordem crescente. Sendo assim, teremos:
Figura: 2
-
No nosso exemplo, temos 173 – 150 = 23, e escrevemos AA = 23
cm, onde AA é Amplitude Amostral.
-
A partir do rol, fica mais fácil criar outra tabela simples, chamada
DISTRIBUIÇÃO DE FREQUÊNCIA,
-
Em uma tabela de distribuição de frequências cada linha contém um
valor seguido do número de vezes que este valor se repete.
- A primeira coluna é chamada coluna dos valores e a segunda
coluna das frequências.
Figura: 3
Figura: 4
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências
Classe
Classe de frequência ou, simplesmente, classes são intervalos de variação
da variável.
As classe são representadas por i, sendo i=1,2,3,·,k (onde k é o número
total de classes da distribuição).
Limites de classes
Denominamos limite de classe os extremos de cada classe.
O menor número é o limites inferior da classe (li ), e o maior número e
o limite superior da classe (Li ).
hi = Li − li
AT = L(máx.) − l(min.).
Amplitude Amostral
Amplitude amostral (AA) é a diferença entre o valor máximo e o valor
mı́nimo da amostra.
AA = x(máx.) − x(min).
AA = 173 − 150 = 23 ⇒ AA = 23
li + Li
xi =
2
Tipos de frequências
Exemplos
f3 = 11
11
fr3 = 40 = 0, 275 ⇒ fr3 = 0, 275
Fk = f1 + f2 + · · · + fk
ou
X
Fk = f1
com i={1, 2, 3,. . . , k}
Fi
Fri = P
Fi
Exercı́cio de Fixação.
i Estatura(cm) fi xi fri Fi Fri
1 150 ` 150 4
2 154 ` 158 9
3 158 ` 162 11
4 162 ` 166 8
5 166 ` 170 5
6 170 ` 174 3
Exercı́cio de Fixação.
i xi fi fri Fi Fri
1 2 4
2 3 7
3 4 5
4 5 2
5 6 1
6 7 P1
= 20
Histograma
O histograma é formado por uma conjunto de retângulos justapostos,
cujas bases se localizam sobre o eixo horizontal, de tal modo que seus
pontos médios coincidam com os pontos médios dos intervalos de classe.
Polı́gono de frequência
O polı́gono de frequência é um gráfico em linha, sendo as frequência
marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos
pontos médios dos intervalos de classe.
Exemplo 2
A Curva de frequência
Curva polida
Como, em geral, os dados coletados pertencem a uma amostra extraı́da
de uma população, podemos imaginar as amostras tornando-se cada vez
mais amplas e a amplitude das classes ficando cada vez menor, o que
permite concluir que a linha poligonal (contorno do polı́gono de
frequência) tende a se transformar numa curva – Curva de frequência
–, mostrando, de modo mais evidente, a verdadeira naturza da
distribuição da população.
Fórmula
fi−1 + 2 f i + fi+1
fci =
4
fci é a frequência calculada da classe considerada;
fi é a frequência simples da classe considerada;
f1−i é a frequência simples da classe anterior á classe considerada;
f1+i é a frequência simples da classe posterior à classe considerada.
Curvas em forma de U
As curvas em forma de U são caracterizadas por apresentarem ordenadas
máximas em ambas as extremidades.
Distribuição retangular
Essa distribuição, muito rara na verdade, apresenta todos as classes com
a mesma frequência.
medidas de posição.
medidas de variabilidade ou dispersão.
medidas de assimentria.
medidas de curtose.
Medidas de posição
A média aritmética.
A mediana.
a moda
As outras medidas de posição são as separatrizes.
As própria meidana.
Os quartis.
Os decis.
Os percentis.
Medidas de posição
P
xi
(x̄) =
n
Sendo:
(x̄) a média aritmetrica.
xi os valores da variável.
n o número de valores.
Medidas de posição
Medidas de posição
denotamos por di
di = xi − x̄
Exemplo: No exemplo amterior temos;
d1 = x1 − x̄ = 10 − 14 = −4
d2 = x2 − x̄ = 14 − 14 = 0
d3 = x3 − x̄ = 13 − 14 = −1
d4 = x4 − x̄ = 15 − 14 = 1
d5 = x5 − x̄ = 16 − 14 = 2
d6 = x6 − x̄ = 18 − 14 = 4
d7 = x7 − x̄ = 12 − 14 = −2
Propriedades da média
propriedade 1:
A soma algébrica dos desvios tomados em relação a média é numa:
k
X
di = 0
i=1
propriedade 2:
Somando ou subtraindo uma constante (c) de todos os valores de
uma variável, a média do conjunto fica aumentada (ou diminuı́da)
dessa cosntante.
Propriedades da média
propriedade 3:
Multiplicando ou dividindo por uma constante (c) de todos os
valores de uma variável, a média do conjunto fica multiplicada, (ou
dividida), por essa cosntante.
yi = xi · c → ȳ = x̄ · c
xi x̄
yi = → ȳ =
c c
Dados agrupados
P
xi fi
x̄ = P
fi
Observação: O modo mais prático de obtenção da média aritmética
ponderada é abrir, na tabela, uma coluna correspondente oas podutos xi fi
Temos, então:
78
x̄ = = 2, 29
34
Isto é:
x̄ = 2, 29 meninos
Dados agrupados
P
xi fi
x̄ = P
fi
Onde xi é o ponto médio da classe.
Dados agrupado
Exemplo
Dada a tabela baixo temos.
Dados agrupado
Logo temos:
6440
x̄ = = 161
40
Processo breve
Baseia-se em uma mudança de variável x por outra y, tal que
xi − x0
yi =
h
Onde x0 é uma constante arbitrária escolhida convenientemente dentre os
pontos médios da distribuição – de preferencia o de maior frequência.
Fazendo essa mudança de variável, pelos propriedades 2 e 3, vai ocorrer
uma mudança no resultado, basta agora, multiplicamos por h e somamos
por x0 donde obtemos a fórmula.
P
( yi f i ) · h
x̄ = x0 + P
fi
Assim, para o exemplo acima, escolhendo x0 como o ponto média da
maior frequência, temos:
Processo breve
Processo breve
Processo breve
Moda (Mo)
Definição
Denominamos moda o valor que ocorre com maior frequência em uma
série de valores.
Moda (Mo)
l∗ + L∗
Mo =
2
Onde: l∗ é o limite inferior da classe modal.
L∗ é o limite superior da classe modal.
Exemplo:
158 + 162
Mo = = 160
2
Logo temos: M o = 160 cm
Observação
Há, para o cálculo da moda, outros métodos, mais elaborados, como por
exemplo, o uso da fórmula de Czuber.
D1
M o = l∗ + · h∗
D1 + D2
No qual:
l∗ e o limete inferior da classe modal.
h∗ e a amplitude da classe modal.
D1 = f∗ − f(ant).
D2 = f∗ − f(post).
f∗ e a frequência simples da classe modal f(ant) frequência simples
anterior a classe modal f(post) frequência simples posterior a classe modal
Mediana (Me)
mediana
A mediana é uma medida de posição. É, também, uma separatriz, pois
divide o conjunto em duas partes iguais, com o mesmo número de
elementos.
O valor da mediana encontra-se no centro da série estatı́stica organizada,
de tal forma que o número de elementos situados antes desse valor
(mediana) é igual ao número de elementos que se encontram após esse
mesmo valor (mediana).
n par: Para uma série com número par de itens: não há termo central
único, mas, sim, dois termos centrais. Logo;
A mediana será a média aritmética entre os termos centrais.
Exemplo: Dada a série de valores abaixo.
Exemplo:
34
= 17
2
A menor frequência acumulada que supera esse valor é 18. Assim, temos
que a mediana e igual a 2.
Me = 2meninos
observação:
No caso de existir um frequência acumulada (Fi ), tal que:
P
fi
Fi =
2
A mediana será dada por
xi + xi+1
Md =
2
Isto é, a média aritmética entre o valor correspondente a essa frequência
acumulada e a posterior.
Exemplo:
Fi = 8/2 = 4 → F3
Veja que existe na tabela essa frequência. Assim:
15 + 16
Me = = 15, 5
2
Exemplo:
Importante
observação: Usaremos sempre essa fórmula para a mediana em dados
agrupados
(n/2 − Fant )
Me = li + ·h
fi
Onde:
li é o limite inferior da classe mediana;
Fant é a frequência acumulada anteiror limite superior da classe anterior
a classe mediana;
fi é a frequência simples da classe mediana;
h amplitude da classe.
Separatrizes
os quatis
Denominamos Quartis os valores de uma série que a dividem em quatro
partes iguais.
(kn/4 − Fant )
Qk = li + ·h
fi
Onde:
li é o limite inferior da classe mediana;
lant é o limite superior da classe anterior a classe mediana;
fi é a frequência simples da classe mediana;
h amplitude da classe.
Exemplos
1◦ Quartil
40
Temos = 10
4
Assim a classe do 1◦ quatil será a segunda. Pois 13 e a primeira
frequência acumulada superior a 10.
(10 − 4)
Q1 = 154 + · 4 = 156, 66
9
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências
Continuação do exemplo:
3◦ Quartil
3 · 40
Temos = 30
4
Assim a classe do 3◦ quatil será a quarta. Pois 32 e a primeira frequência
acumulada superior a 30.
(30 − 24)
Q3 = 162 + · 4 = 165
8
percentis
Denominamos percentis os 99 valores que dividem a série em 100 partes
iguais.
(kn/100 − Fant )
Pk = li + ·h
fi
Exemplo: Considerando o exemplo anterior calcule P8 .
8 · 40
Solução: Temos que = 3, 2
◦
100
Assim, a classe do 8 será a primeira. Logo:
3, 2 − 0
P8 = 150 + · 4 = 153, 2
4
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências
X̄ = Ȳ = Z̄ = 70
Definição
Chamamos de dispersão ou variabilidade a maior ou menor
diversificação dos valores de uma variável em torno de um valor de
tendência central tomado como ponto de comparação, podemos dizer
que o conjunto X apresenta Dispersão ou Variabilidade nula e que o
conjunto Y apresenta uma dispersão menor que o conjunto Z.
A amplitude total
É a diferença entre o maior e o menor valor observado:
AT=x(máx.)-x(min.)
temos:
AT= 174-150 = 24
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências
A variância e o desvio padrão são medidas que fogem a essa falha, pois
levam em consideração a totalidade dos valores da variável em estudo, o
que faz delas ı́ndices de variabilidade bastante estáveis e, por isso
mesmos, os mais geralmente empregados.
(xi − x̄)2
P
s2 = P
fi
P
Lembre que fi = n
(xi − x̄)2
P
2
s =
n−1
Desvio padrão
Definimos desvio padrão como a raiz quadrada da variância e
representamos por s:
Assim:
sP
(xi − x̄)2
s= P
fi
Essa fórmula além de mais prática e ainda mais precisa, pois quando a
média não e exata e tem de ser arrendondada, cada desvio fica
ligeiramente afetado do erro, devido esse arrendondamento.
Logo:
s = 9, 49
Observação:
20293= 402 + 452 + 482 + 522 + 542 + 622 + 702
sP 2
fi x2i
P
fi xi
s= −
n n
Logo:
s 2
165 63 p p
s= − = 5, 5 − 4, 41 = 1, 09 = 1, 044
30 30
Assim:
s = 1, 04
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências
Exemplo:
s 2
√ √
1.038.080 6.440
s= − = 25.952 − 25.921 = 31 = 5, 567 ∼
= 5, 57
40 40
Profa Lêda Ferreira Cabral Estudo de estatı́stica
Introdução
Fundamentação Teórica
Referências
Logo:
s 2
80 10
= 4 2 − 0, 0625 = 4 1, 9375 = 5, 5676 ∼
p p
s= − = 5, 57
40 40
Referências
Bons Estudos
A todos.