Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Estatística

Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1de 19

PONTOS DE OBSERVAÇÃO

Sumário
Conceitos Iniciais. Medidas de posição. Diagramas de Dispersão. Distribuição de Frequências.....................2
Amostragem.................................................................................................................................................... 9
Distribuição Discretas de Probabilidade........................................................................................................ 11
Teste de Hipóteses.........................................................................................................................................13
Intervalo de Confiança................................................................................................................................... 14
Regressão Linear............................................................................................................................................ 16

1
Conceitos Iniciais. Medidas de posição. Diagramas de Dispersão. Distribuição
de Frequências.
Conceito e Classificação
Estatística Descritiva - Mais focada na organização dos dados
Estatística Probabilística - Usada para generalização (Envolve incerteza)
Estatística Inferencial - Análise e Interpretação para tomada de decisão

População/Amostra/Censo
População - É TUDO
Amostra - Parte da população
Censo - Considera todos os elementos da população

Dados Estatísticos

São os dados obtidos por alguma observação.


Podem ser brutos (sem organização) ou rol (organizados em forma crescente ou decrescente)

Saiba a sistemática do Diagrama de ramos e folhas


Veja que os números da esquerda em vermelho são os números da casa das dezenas, enquanto os da
direita (colunas 2, 3 e 4) são os da casa da unidade.

Variáveis Estatísticas

Quantitativa (numérico)
- Discretas - Assume valores finitos ou infinitos contáveis (Ex: n° de multas que o uno de firma com escada
no teto possui). Apenas números inteiros.
- Contínuas - Varia dentro de um intervalo (Ex: Velocidade de um uno de firma com escada no teto
acelerando na avenida brasil 10 minutos antes da hora do almoço - Vai de 0 até infinito)

Qualitativa (Não numérico - Categóricas)


- Nominais - Não possui ordem ou hierarquia (Ex: Cidades em um país)
- Ordinais - Possui ordem (Exemplo clássico é o nível de instrução: Ensino básico, médio, superior etc)

Exemplos:
1. Sexo (Feminino ou Masculino); Variável qualitativa nominal
2. Idade (em anos); Variável quantitativa discreta (Cabe ressaltar que idade, em geral, é uma
variável contínua. O que a torna discreta é o fato de estar contada em anos).
3. Raça/Cor (Branca, Preta, Amarela, Parda, Indígena, Ignorada); Variável qualitativa nominal
4. Fumante (sim ou não); Variável qualitativa nominal
5. Possui fatores de risco/comorbidades? (Sim, Não, Ignorado); Variável qualitativa ordinal

2
6. Escolaridade (Sem escolaridade/analfabeto, Fundamental 1º ciclo [1º ao 5º ano], Fundamental 2º
ciclo [6º ao 9º ano], Médio [1º ao 3º ano], Superior, Não se aplica, Ignorado). Variável qualitativa
ordinal
7. Unidade da Federação. Variável qualitativa nominal

(Aqui é importante!) Distribuição de Frequências:

Interpretando a tabela para a terceira classe:


Coluna 1 - Note que o intervalo é fechado à esquerda e aberto à direita (o símbolo no meio dos números
possui a barrinha vertical na esquerda), ou seja, contém o número 30 mas não contém o 40. Outra forma
de simbolizar intervalos fechados e abertos é, respectivamente, por “[” e “)”
Coluna 2 - Temos 40 observações nesse intervalo
Coluna 3 - Até a terceira classe, temos 180 observações (Somatório de 50 da classe 1 + 90 da classe 2 + 40
da classe 3). Em outras palavras, as classes 1, 2 e 3 possuem 180 observações de um total de 200
Coluna 4 - as 40 observações da nossa classe representam 20% de todas as observações de todas as classes
Coluna 5 - As classes 1, 2 e 3 representam 90% de todas as observações de todas as classes. Em outras
palavras, até a terceira classe, temos 90% de todas as observações.

Representação Gráfica

Os principais tipos de Gráficos que precisam estar no sangue são:


Histograma - Usado para representar uma distribuição de frequência (variável contínua).
Gráfico de pizza (ou setores) - Usado mais para ver a proporção de uma seção com o todo.
Gráfico de Barras e Colunas - Usado para comparação entre valores.
Gráfico de linhas - Verificar tendências ou comportamentos.
Ogiva - Gráfico de linhas mas para representar frequências acumuladas.
Polígono de frequência - é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao
eixo horizontal, levando em consideração os pontos médios dos intervalos de classe.

Média Aritmética (A): Para um conjunto de valores a fórmula fica:

Propriedades mais importantes da Média:


- Soma: Somando (ou subtraindo) uma constante C de CADA UM dos elementos, a média também será
somada (ou subtraída) de C.

3
- Multiplicação: Multiplicando (ou dividindo) cada elemento por uma constante C, a média será
multiplicada por C.
- Soma dos desvios: é 0 em relação à média. "Desvio" é a diferença de cada termo para a média.

Média Aritmética Ponderada

Em essência, a média ponderada pode ser interpretada como a média para uma distribuição de frequência.
Nesse caso, a forma é ligeiramente diferente, levando em consideração o peso, ou a frequência absoluta,
representada pelo fator F abaixo:

DETALHE IMPORTANTE: Para calcular a média quando temos uma classe, precisamos usar o ponto médio
dessa classe. Vejamos um exemplo:

Faz sentido esse resultado para a média? Note que estamos na classe 2, e isso era totalmente esperado,
uma vez que é nessa classe que estão a maior parte das observações.

Média Geométrica (G)

Repare que agora calcularemos a média pela multiplicação, onde x1, x2, x3 são os dados e "n" a
quantidade total de dados.

Média Harmônica (H)

É definida como o inverso (III) da média aritmética (II) dos inversos (I).

4
Comparação entre as médias

MEDIANA

Antes de qualquer coisa, para se calcular a mediana, há de se colocar os valores em forma crescente
(lembrou de rol?). O conceito é bem simples: é o valor que divide a série de números em duas partes iguais
Sendo "n" a quantidade de valores, a mediana será calculada de duas formas:

Se a quantidade de valores for ímpar: (n+1)/2


Se a quantidade de valores for par: será a média dos dois valores centrais: n/2 e (n/2)+1

Propriedades da Mediana:
- Soma: Somando (ou subtraindo) uma constante C de CADA UM dos elementos, a mediana também será
somada (ou subtraída) de C.
- Multiplicação: Multiplicando (ou dividindo) cada elemento por uma constante C, a mediana será
multiplicada por C.

Mediana para dados agrupados em classes:


Primeiramente precisamos entender que aqui não há o que se falar se a quantidade de valores é par ou
ímpar, ou seja, a mediana estará na posição n/2.
A fórmula para o cálculo da mediana, nesse caso, é:

Quartil: Valores que dividem os dados em 4 partes iguais. Ou seja, temos sempre 3 quartis.

Decil: Valores que dividem os dados em 10 partes iguais. Ou seja, temos sempre 9 decis.

5
OBS: Perceba que o quinto decil e o segundo quartil são popularmente conhecidos como a
mediana.

Assimetria e Box Plot

Basicamente, a Assimetria de um gráfico se refere a como os dados estão distribuídos ao redor da média.

Curtose: também em conceitos objetivos, é a medida que descreve o quão “achatada” é a curva de
distribuição de dados. Ela pode ser:
- Leptocúrtica: Mais pontiaguda, com dados mais aglutinados na média
- Mesocúrtica: Um pouco mais achatada, com dados um pouco mais dispersos
- Platicúrtica: Curva mais parecendo um “platô”, com dados ainda mais dispersos.

6
O conceito de assimetria é particularmente importante para saber como o box-plot é construído.
Nesse momento apenas entenda que a "caixa" do box-plot acompanha o "sino" do gráfico de assimetria,
ok? Na dúvida, veja a figura abaixo:

Box-plot:

Veja que nós temos 5 valores principais do box-plot: O limite mínimo; os quartis 1, 2 e 3; e o limite
máximo
Daí vem o outro nome do box-plot - Diagrama dos cinco números

Outros conceitos e informações importantes do Box-Plot


Intervalo/Amplitude/Desvio/Distância Interquartílico: Q3 - Q1
Amplitude semi-interquartílica/Desvio quartílico: (Q3 - Q1)/2
Limite Máximo = Q3 + 1,5 * (Q3 - Q1)
Limite Mínimo = Q1 - 1,5 * (Q3 - Q1)

O Box-Plot NÃO INFORMA:


- O valor da média
- A quantidade de elementos

Definição de Moda: Formalmente a Moda é definida como o valor que apresenta a maior
frequência.
Ou seja, para variáveis discretas (Ex: 1, 2, 3, 4, 5 ... ), basta olhar a frequência absoluta e extrair o número
cuja frequência é a mais alta.
7
Para intervalos distribuídos em classe:

OBS 1 IMPORTANTE: Não estamos calculando a MODA EXATA com essas fórmulas. Não caia nessa
pegadinha.

OBS 2 IMPORTANTE: Essas fórmulas de CZUBER e KING, como mostradas acima, são utilizadas nos casos
em que a amplitude das classes é constante, ou seja, todas as classes têm a mesma amplitude.
Mas e no caso de não serem iguais ? Nesse caso, devemos substituir as frequências pela densidade
de frequência (d=f/h), onde f é a frequência e h é a amplitude da classe.
A classe modal, nesses casos, será a classe com a maior densidade (não necessariamente com a
maior frequência).

Pequeno macete para ajudar a lembrar a diferença entre as duas fórmulas


O Rei (KING) não tá nem aí para a moda. Ele faz a moda! Tradução ? Na fórmula de KING não se usa a
diferença entre as classes modais, nem a frequência da classe modal. Só se usa o limite inferior da classe
modal (porque tudo tem limite, né? rs)

Moda (Mo) obtida pela relação de Pearson:


Mo = 3 Md − 2 Me

Propriedades importantes da Moda:


- A moda não é influenciada por valores extremos! Veja no exemplo a seguir onde a moda está destacada
em vermelho:
Conjunto 1: { 1, 2, 3, 3, 3, 987.631}
Conjunto 2: { 1, 2, 3, 3, 3, 4}
- Soma: Somando (ou subtraindo) uma constante C de CADA UM dos elementos, a moda também será
somada (ou subtraída) de C.
- Multiplicação: Multiplicando (ou dividindo) CADA ELEMENTO por uma constante C, a moda será
multiplicada (ou dividida) por C.

8
9
Amostragem

Fórmula pra calcular tamanho amostral sem saber o comportamento - Fórmula de Slovin:

10
11
Distribuição Discretas de Probabilidade

12
13
Teste de Hipóteses

14
15
Intervalo de Confiança

16
Estimativa da amostra inicial para uma população suficientemente grande:

Caso a população não seja suficientemente grande, devemos utilizar a Fórmula de Cochran (N é o
tamanho da população):
n = [N . n0] / (N+n0)
Substituindo n0 por 1/e^2, obtemos:
n = N/(1 + N . e^2), que é conhecida como Fórmula de Slovin.

17
Regressão Linear

18
19

Você também pode gostar