Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare uma empresa Scribd logo
BIOESTATÍSTICA A Bioestatística estuda métodos para a  obtenção, organização e  análise de dados  e os métodos de tirar conclusão e fazer predições com base nesses dados. É uma matéria fundamental para a realização de pesquisas com  coleta de dados Os procedimentos estudados na Bioestatística serão utilizados na realização do  TCC
Estatística Descritiva : consistem em resumir as principais características de um conjunto de dados através de tabelas, gráficos e medidas descritivas em forma de resumos numéricos; Inferência Estatística : consiste em generalizar os resultados de uma amostra para todos os elementos da população, isto é realizado basicamente na forma de Estimação Intervalar e de Testes de Hipóteses.
CONCEITOS BÁSICOS População : Conjunto de TODAS as unidades  que se deseja estudar Amostra : Subconjunto da população, são as unidades que iremos observar
CONCEITOS BÁSICOS INDIVÍDUO : cada elemento afetado por uma medida ou enumerado por um índice. VARIÁVEL : determinada característica que, por algum motivo, nos interessa estudar. A escolha da variável de interesse dependerá, em cada caso, dos objetivos do estudo estatístico em questão,  É O QUE MEDIREMOS!!
FASES DE UM TRABALHO ESTATÍSTICO 1ª DEFINIÇÃO DO PROBLEMA .   2ª PLANEJAMENTO 3ª COLETA DE DADOS 4ª APURAÇÃO DOS DADOS 5ª APRESENTAÇÃO DOS DADOS   6ª ANÁLISE E INTERPRETAÇÃO DOS DADOS
Planejamento O QUE MEDIR   – quais variáveis utilizar COMO MEDIR   – como medir estas variáveis DE QUEM MEDIR   – qual será a amostra
Exemplo 1: Realizar uma pesquisa de opinião com os alunos da Faculdade Como medir estar variáveis??  Questionário .  Como aplicar,...   Quais variáveis utilizar??  Quais questões, opções de resposta,... Como será a amostra??  Quantas pessoas, como selecionar,...
Exemplo 2: Verificar a eficiência de um treinamento em jogadores de Basquete  12 a 14 anos jogos colegiais Quais variáveis utilizar??  Velocidade, Impulsão,... Como medir estar variáveis??. Quais Protocolos utilizar. Como será a amostra??  Quantas pessoas,  como selecionar ,...
VARIÁVEIS QUALITATIVAS  (CATEGÓRICAS) NOMINAIS (NÃO TEM ORDEM) ORDINAIS (TEM ORDEM) QUANTITATIVAS DISCRETAS (CONTAGEM) CONTÍNUAS (MENSURAÇÃO)
AMOSTRAGEM Amostra  é parte desta população, é a parte que será realmente estudada, portanto pode-se compreender que ela deva apresentar o melhor possível, a população da qual veio.  Razões para o Uso de Amostra: De ordem prática População hipotética
TIPOS DE AMOSTRAS MAIS USADAS -  Aleatória simples : Sortear indivíduos do total da população (LISTA) -  Aleatória sistemática : Selecionar indivíduos de “k em k” quando não é possível sortear -  Estratificada proporcional : Dividir a população em estratos (grupos) e selecionar a amostra proporcionalmente dentro de cada estrato
Exemplo: Uma população é dividida em 3 grupos da seguinte forma Estrato A (jovens) _____> 120 elementos Estrato B (adultos) _____> 72 elementos Estrato C (3ª idade) _____> 48 elementos Retirar uma amostra de 50 indivíduos dessa população
AMOSTRA POR CONVENIÊNCIA Quando não é possível utilizar nenhum dos planos amostrais anteriores e a única possibilidade é utilizar alguns indivíduos que temos a disposição Obs : Caracterizar bem a amostra para deixar claro qual população ela representa (descrição das características dos indivíduos como:  sexo,   escolaridade classe social , etc.)
TABELAS
GRÁFICOS Barras ou Colunas : Comparar as quantidades Escala  Iniciar do  ZERO !! Pizza ou Setores : Comparar as partes de um todo Apenas Categorias  NOMINAIS No Máximo 5 ou 6 Categorias Linhas : Verificar comportamento  AO LONGO DO TEMPO
CORRELAÇÃO Verificar como 2 variáveis quantitativas se relacionam Diagrama de Dispersão Coeficiente de Correlação de Pearson
DISTRIBUIÇÃO DE FREQUÊNCIA Tabela para variáveis quantitativas
Histograma
MEDIDAS DE TENDÊNCIA CENTRAL Média . É o valor em torno do qual os dados se concentram. Exemplo: Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320
Mediana .  É o valor que divide um conjunto de observações ao meio  Ex 1) Amostra de 5 valores de colesterol:  200 - 250 -  280  - 310 - 320  (n.º de observações ímpares) Md = 280 (mg/dL) Interpretação : 50% dos indivíduos tem colesterol igual ou menor que 280 e os outros 50% tem 280 ou mais.
Ex 2) Amostra de salários de 6 profissionais:  200 – 220 –  250 – 280  –  310 – 320  (n.º de observações par) Md=  250 + 280   2 Md= 265,00 reais Interpretação : metade dos profissionais tem salário igual ou menor que 265,00 reais e os demais tem salário igual ou maior de 265,00 reais.
Moda . É o valor que ocorre com maior freqüência dentro do conjunto de observação. Ex) Idade de alunos (em anos): 18 -  19 - 19 - 19  - 20 - 21 - 22 Mo = 19 anos Interpretação: a idade que mais aparece é 19 anos. 1 moda = unimodal  2 modas = bimodal + de 2 modas = multimodal  não possui moda = amodal
Separatrizes . São valores que dividem um conjunto de observações em partes iguais: Mediana  -- Divide em 2 partes iguais (Md) Quartil ----- Divide em 4 partes iguais (Q) Decil  -------Divide em 10 partes iguais (D) Percentil  ------Divide em 100 partes iguais (P) Ex) P 45  = 23,8 anos Interpretação: 45% das pessoas tem menos de 23,8 anos e 55% tem mais de 23,8 anos
MEDIDAS DE VARIABILIDADE AMPLITUDE (H)   É a diferença entre o valor máximo e o valor mínimo de conjunto de dados H = M – m VARIÂNCIA (S 2 )  É a “média” entre os quadrados das diferenças entre cada elemento do conjunto de dados e sua média.
DESVIO PADRÃO (s)   É a raiz quadrada positiva da variância. Ele mede a dispersão de um conjunto de dados em relação à média. Notas de 4 bimestres na disciplina de Bioestatística de 2 alunos: A) 4 - 6 - 4 - 6 B) 0 - 4 - 6 - 10
1º Passo:  cálculo da média 2º Passo:  cálculo dos desvios 3º Passo:  cálculo dos desvios ao quadrado 4º Passo:  Cálculo da somatória dos desvios ao quadrado 5º Passo:  aplicação da fórmula
COEFICIENTE DE VARIAÇÃO (CV)   É a medida de dispersão relativa porque estabelece uma relação entre o desvio padrão e a média.  Utilizada para comparar a variabilidade relativa ou grau de homogeneidade de diferentes grupos Considera-se um grupo homogêneo quando CV ≤ 30%. Com um CV > 30% o grupo vai perdendo a homogeneidade %
Exemplo: Indique qual grupo é mais homogêneo em relação ao salário: Grupo A : Média R$600 desvio padrão R$50 Grupo B : Média R$1.000 desvio padrão R$70 CV A = 50/600 = 8,33% CV B = 70/1.000 = 7% Grupo B mais homogêneo (CV menor)
Cálculos no Excel: Contar Valores:  =CONT.SE(A1:A20;” C ”) Obs. No lugar de  C  colocar o valor que será contado entre aspas Média:  =MÉDIA(A1:A20) Mediana:  =MED(A1:A20) Percentil:  =PERCENTIL(A1:A20;0, p )   Obs. No lugar de  p  colocar o pecentil desejado Maior Valor:  =MÁXIMO(A1:A20) Menor Valor:  =MÍNIMO(A1:A20) Variância:  =VAR(A1:A20) Desvio Padrão:  =DESVPAD(A1:A20) Coeficiente de Correlação de Pearson:  =CORREL(A1:A20;B1:B20)
INFERÊNCIA ESTATÍSTICA Generalizar os resultados da Amostra para a População Parâmetro  = Verdadeiro valor populacional – Desconhecido (impossível calcular com dados amostrais) Estimativa  = Valor amostral – Conhecido (possível calcular com dados amostrais
Estimação Intervalar Com base no valor amostral calcular a margem de erro para estimar o valor populacional - Ex.:Pesquisa Eleitoral: Candidato A: 30% Candidato B: 27% Margem de erro de  2 pontos percentuais  para mais a para menos Candidato A : 28% a 32% Candidato B: 25% a 29%
CONFIABILIDADE Probabilidade do Intervalo conter o verdadeiro valor populacional (estar certo) 90%  95%  99% SIGNIFICÂNCIA Probabilidade do Intervalo não conter o verdadeiro valor populacional (estar errado) 10%  5%  1%
Cálculo da Margem de Erro: Z = valor da tabela Z com a confiabilidade definida (para 95% = 1,96) P= proporção estimada (usualmente 0,5) n = tamanho da amostra Ex. Com 95% de confiabilidade e amostra de 600 indivíduos margem de erro = 4%
CÁLCULO TAMANHO DA AMOSTRA Ex.: Para uma população de 3.000 pessoas, com 95% de confiabilidade e 5% de erro admissível (margem de erro) n = 384  nc = 340 Amostra de 340 indivíduos
TESTES DE HIPÓTESES COMPARAÇÃO 2 Grupos Diferentes ou Mesmos Indivíduos em 2 Momentos Diferentes OBJETIVO: VERIFICAR SE AS DIFERENÇAS SÃO  SIGNIFICATIVAS Será que a diferença entre as médias das amostras é significativa quando generalizamos os resultados para a população?
Ho  => Hipótese Nula => Indica Igualdade => É a Hipóteses que Será Testada H1  => Hipóteses Alternativa => Indica Diferença O resultado de um teste é uma das seguintes afirmações: REJEITO Ho NÃO REJEITO Ho Hipóteses Estatísticas
Ho: = H1:  ≠ Se o teste indica que  REJEITO Ho   isto significa que  EXISTE DIFERENÇA SIGNIFICATIVA Se o teste indica que  NÃO REJEITO   Ho isto indica que  NÃO EXISTE DIFERENÇA SIGNIFICATIVA
Para a realização de um teste deve-se calcular a  Estatística de Teste   ou  Valor Calculado , definir as  Regiões Críticas   (com base nas tabelas), e fazer a conclusão com base no esquema abaixo:
Procedimentos para realização de um teste de hipóteses  com  Valor Calculado: Formular as hipóteses   ( H 0  e H 1 ) Calcular a  Estatística de Teste   ou   Valor Calculado Determinar as  Regiões Críticas Decidir pela  rejeição , ou   não rejeição , da hipótese nula Interpretar  o resultado .
TESTE F PARA COMPARAR VARIÂNCIAS Ho: VAR A = VAR B  H1: VAR A  ≠ VAR B Distribuição F com  gl Estatística de Teste:
TESTE t PARA COMPARAR MÉDIAS Ho: MÉDIA A = MÉDIA B H1: MÉDIA A  ≠ MÉDIA B OBSERVAÇÕES INDEPENDENTES   COM  VARIÂNCIAS  SUPOSTAMENTE  IGUAIS OBSERVAÇÕES INDEPENDENTES   COM  VARIÂNCIAS  SUPOSTAMENTE  DIFERENTES OBSERVAÇÕES DEPENDENTES
OBSERVAÇÕES INDEPENDENTES: 2 GRUPOS COM INDIVÍDUOS DIFERENTES OBSERVAÇÕES DEPENDENTES: OS MESMOS INDIVÍDUOS EM 2 MOMENTOS DIFERENTES ( ANTES E DEPOIS  OU  PRÉ E PÓS TESTES )
OBSERVAÇÕES INDEPENDENTES   COM  VARIÂNCIAS  SUPOSTAMENTE  IGUAIS Estatística de Teste : Distribuição  t com  n 1 +n 2 –2  gl
OBSERVAÇÕES INDEPENDENTES   COM  VARIÂNCIAS  SUPOSTAMENTE  DIFERENTES Estatística de Teste : Distribuição  t com  gl Onde
OBSERVAÇÕES DEPENDENTES Estatística de Teste : Onde  é a média da diferenças e S d  é o desvio padrão das diferenças  Distribuição  t com n – 1 gl
TESTES DE HIPÓTESES COM VALOR P (P-VALOR) P-VALOR é a probabilidade de errar quando Ho é rejeitado, desta forma: se p-valor for grande :  NÃO REJEITO Ho se p-valor for pequeno: REJEITO Ho
TESTES DE HIPÓTESES COM VALOR P (P-VALOR) Desta forma utilizamos o seguinte critério para a realização de um teste com p-valor: se p-valor for  MAIOR  que a significância  (5% ou 0,05)  :  NÃO REJEITO Ho se p-valor for  MENOR  que a significância  (5% ou 0,05)  : REJEITO Ho
Procedimentos para realização de um teste de hipóteses com  p-valor Formular as hipóteses  ( H0 e H1) Decidir pela  rejeição , ou  não rejeição , da hipótese nula (com base no p-valor) Interpretar  o resultado.
TESTE QUI QUADRADO (  2 ) PARA INDEPENDÊNCIA Utilizado quando a variável medida é  QUALITATIVA  e deseja-se comparar 2 ou mais grupos Consiste em comparar os valores  OBSERVADOS  com os valores  ESPERADOS , se não houvesse diferença nenhuma entre os grupos
TESTE QUI QUADRADO (  2 ) Estatística de teste: Distribuição    2  com (s-1) x (r-1) gl
Cálculos no Excel: Teste F:  =TESTEF(A1:A20;B1:B20) Teste t de student:  =TESTET(A1:A20;A1:B20;1; tipo ) Obs. No lugar de  tipo  colocar: 1 se forem observações dependentes 2 se forram observações independentes  variâncias iguais 3 se forram observações independentes  variâncias diferentes Teste qui-quadrado:  =TESTE.QUI(A1:B2;A4:B5) Obs. Primeiro Intervalo: Valores Observados Segundo Intervalo: Valores Esperados
TESTES NÃO PARAMÉTRICOS 2 grupos Mais de 2 grupos Nível de Mensuração  Dependente Independente Dependente Independente Nominal McNemar  Fisher ou   2  Q Cochran   2 Ordinal Wilcoxon   U Mann-Whitney   Friedman  Kruskal-Wallis
ANOVA  Análise de Variância É utilizada quando a variável é  QUANTITATIVA  e deseja-se comparar  MAIS DE 2 GRUPOS , é uma alternativa ao teste t com observações independentes
ANÁLISE ESTATÍSTICA Quando o objetivo do trabalho é apenas fazer uma descrição e não se pretende fazer uma comparação: Cálculo de medidas descritivas:  Média e desvio padrão para variáveis quantitativas Porcentagem para variáveis qualitativas
ANÁLISE ESTATÍSTICA Quando o objetivo do trabalho é fazer uma comparação entre grupos ou entre o pré teste e o pós teste. Para verificar se existe diferença significativa deve ser utilizado algum dos seguintes testes estatísticos:   Variável quantitativa com pelo menos 15 indivíduos por grupo:  Comparar pré e pós teste: teste t de student para observações dependentes (pareado) Comparar 2 grupos: teste t de student para observações independentes Comparar mais de 2 grupos: ANOVA Comparar 2 grupos ou mais em períodos de tempo diferentes: ANOVA de medidas repetidas
ANÁLISE ESTATÍSTICA Variável quantitativa com menos de 15 indivíduos por grupo ou variável qualitativa ordinal: Comparar pré e pós teste: teste Wilcoxon Comparar 2 grupos: teste U de Mann-Whitney Comparar mais de 2 grupos: teste Kruskal-Wallis Comparar mais de 2 períodos de tempo diferentes: Friedman   Variável qualitativa nominal:  Comparar pré e pós teste: teste McNemar Comparar 2 grupos: teste qui-quadrado ( amostras grandes ) ou teste de Fisher (apenas 2 possíveis respostas) Comparar mais de 2 grupos: teste qui-quadrado ( amostras grandes )
Tamanho da amostra Para justificar amostras de até 100 indivíduos, com 95% de confiabilidade, para a comparação de grupos pode-se utilizar a seguinte tabela, segundo Altman (1991) Referência: ALTMAN D. G. Pratical Statistics for Medical Research.  Chapman and Hall, London, 1991
Tabela com tamanho da amostra para uma confiabilidade de 95%: Tamanho da amostra Poder de teste Diferença padronizada 15 60% 1,2 20 65% 1 25 70% 1 30 80% 1 35 85% 1 40 85% 0,95 50 85% 0,85 60 85% 0,75 70 85% 0,70 80 85% 0,65 90 85% 0,60 100 85% 0,55

Mais conteúdo relacionado

Bioestatística

  • 1. BIOESTATÍSTICA A Bioestatística estuda métodos para a obtenção, organização e análise de dados e os métodos de tirar conclusão e fazer predições com base nesses dados. É uma matéria fundamental para a realização de pesquisas com coleta de dados Os procedimentos estudados na Bioestatística serão utilizados na realização do TCC
  • 2. Estatística Descritiva : consistem em resumir as principais características de um conjunto de dados através de tabelas, gráficos e medidas descritivas em forma de resumos numéricos; Inferência Estatística : consiste em generalizar os resultados de uma amostra para todos os elementos da população, isto é realizado basicamente na forma de Estimação Intervalar e de Testes de Hipóteses.
  • 3. CONCEITOS BÁSICOS População : Conjunto de TODAS as unidades que se deseja estudar Amostra : Subconjunto da população, são as unidades que iremos observar
  • 4. CONCEITOS BÁSICOS INDIVÍDUO : cada elemento afetado por uma medida ou enumerado por um índice. VARIÁVEL : determinada característica que, por algum motivo, nos interessa estudar. A escolha da variável de interesse dependerá, em cada caso, dos objetivos do estudo estatístico em questão, É O QUE MEDIREMOS!!
  • 5. FASES DE UM TRABALHO ESTATÍSTICO 1ª DEFINIÇÃO DO PROBLEMA .   2ª PLANEJAMENTO 3ª COLETA DE DADOS 4ª APURAÇÃO DOS DADOS 5ª APRESENTAÇÃO DOS DADOS   6ª ANÁLISE E INTERPRETAÇÃO DOS DADOS
  • 6. Planejamento O QUE MEDIR – quais variáveis utilizar COMO MEDIR – como medir estas variáveis DE QUEM MEDIR – qual será a amostra
  • 7. Exemplo 1: Realizar uma pesquisa de opinião com os alunos da Faculdade Como medir estar variáveis?? Questionário . Como aplicar,... Quais variáveis utilizar?? Quais questões, opções de resposta,... Como será a amostra?? Quantas pessoas, como selecionar,...
  • 8. Exemplo 2: Verificar a eficiência de um treinamento em jogadores de Basquete 12 a 14 anos jogos colegiais Quais variáveis utilizar?? Velocidade, Impulsão,... Como medir estar variáveis??. Quais Protocolos utilizar. Como será a amostra?? Quantas pessoas, como selecionar ,...
  • 9. VARIÁVEIS QUALITATIVAS (CATEGÓRICAS) NOMINAIS (NÃO TEM ORDEM) ORDINAIS (TEM ORDEM) QUANTITATIVAS DISCRETAS (CONTAGEM) CONTÍNUAS (MENSURAÇÃO)
  • 10. AMOSTRAGEM Amostra é parte desta população, é a parte que será realmente estudada, portanto pode-se compreender que ela deva apresentar o melhor possível, a população da qual veio. Razões para o Uso de Amostra: De ordem prática População hipotética
  • 11. TIPOS DE AMOSTRAS MAIS USADAS - Aleatória simples : Sortear indivíduos do total da população (LISTA) - Aleatória sistemática : Selecionar indivíduos de “k em k” quando não é possível sortear - Estratificada proporcional : Dividir a população em estratos (grupos) e selecionar a amostra proporcionalmente dentro de cada estrato
  • 12. Exemplo: Uma população é dividida em 3 grupos da seguinte forma Estrato A (jovens) _____> 120 elementos Estrato B (adultos) _____> 72 elementos Estrato C (3ª idade) _____> 48 elementos Retirar uma amostra de 50 indivíduos dessa população
  • 13. AMOSTRA POR CONVENIÊNCIA Quando não é possível utilizar nenhum dos planos amostrais anteriores e a única possibilidade é utilizar alguns indivíduos que temos a disposição Obs : Caracterizar bem a amostra para deixar claro qual população ela representa (descrição das características dos indivíduos como: sexo, escolaridade classe social , etc.)
  • 15. GRÁFICOS Barras ou Colunas : Comparar as quantidades Escala Iniciar do ZERO !! Pizza ou Setores : Comparar as partes de um todo Apenas Categorias NOMINAIS No Máximo 5 ou 6 Categorias Linhas : Verificar comportamento AO LONGO DO TEMPO
  • 16. CORRELAÇÃO Verificar como 2 variáveis quantitativas se relacionam Diagrama de Dispersão Coeficiente de Correlação de Pearson
  • 17. DISTRIBUIÇÃO DE FREQUÊNCIA Tabela para variáveis quantitativas
  • 19. MEDIDAS DE TENDÊNCIA CENTRAL Média . É o valor em torno do qual os dados se concentram. Exemplo: Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320
  • 20. Mediana . É o valor que divide um conjunto de observações ao meio Ex 1) Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320 (n.º de observações ímpares) Md = 280 (mg/dL) Interpretação : 50% dos indivíduos tem colesterol igual ou menor que 280 e os outros 50% tem 280 ou mais.
  • 21. Ex 2) Amostra de salários de 6 profissionais: 200 – 220 – 250 – 280 – 310 – 320 (n.º de observações par) Md= 250 + 280 2 Md= 265,00 reais Interpretação : metade dos profissionais tem salário igual ou menor que 265,00 reais e os demais tem salário igual ou maior de 265,00 reais.
  • 22. Moda . É o valor que ocorre com maior freqüência dentro do conjunto de observação. Ex) Idade de alunos (em anos): 18 - 19 - 19 - 19 - 20 - 21 - 22 Mo = 19 anos Interpretação: a idade que mais aparece é 19 anos. 1 moda = unimodal 2 modas = bimodal + de 2 modas = multimodal não possui moda = amodal
  • 23. Separatrizes . São valores que dividem um conjunto de observações em partes iguais: Mediana -- Divide em 2 partes iguais (Md) Quartil ----- Divide em 4 partes iguais (Q) Decil -------Divide em 10 partes iguais (D) Percentil ------Divide em 100 partes iguais (P) Ex) P 45 = 23,8 anos Interpretação: 45% das pessoas tem menos de 23,8 anos e 55% tem mais de 23,8 anos
  • 24. MEDIDAS DE VARIABILIDADE AMPLITUDE (H) É a diferença entre o valor máximo e o valor mínimo de conjunto de dados H = M – m VARIÂNCIA (S 2 ) É a “média” entre os quadrados das diferenças entre cada elemento do conjunto de dados e sua média.
  • 25. DESVIO PADRÃO (s) É a raiz quadrada positiva da variância. Ele mede a dispersão de um conjunto de dados em relação à média. Notas de 4 bimestres na disciplina de Bioestatística de 2 alunos: A) 4 - 6 - 4 - 6 B) 0 - 4 - 6 - 10
  • 26. 1º Passo: cálculo da média 2º Passo: cálculo dos desvios 3º Passo: cálculo dos desvios ao quadrado 4º Passo: Cálculo da somatória dos desvios ao quadrado 5º Passo: aplicação da fórmula
  • 27. COEFICIENTE DE VARIAÇÃO (CV) É a medida de dispersão relativa porque estabelece uma relação entre o desvio padrão e a média. Utilizada para comparar a variabilidade relativa ou grau de homogeneidade de diferentes grupos Considera-se um grupo homogêneo quando CV ≤ 30%. Com um CV > 30% o grupo vai perdendo a homogeneidade %
  • 28. Exemplo: Indique qual grupo é mais homogêneo em relação ao salário: Grupo A : Média R$600 desvio padrão R$50 Grupo B : Média R$1.000 desvio padrão R$70 CV A = 50/600 = 8,33% CV B = 70/1.000 = 7% Grupo B mais homogêneo (CV menor)
  • 29. Cálculos no Excel: Contar Valores: =CONT.SE(A1:A20;” C ”) Obs. No lugar de C colocar o valor que será contado entre aspas Média: =MÉDIA(A1:A20) Mediana: =MED(A1:A20) Percentil: =PERCENTIL(A1:A20;0, p ) Obs. No lugar de p colocar o pecentil desejado Maior Valor: =MÁXIMO(A1:A20) Menor Valor: =MÍNIMO(A1:A20) Variância: =VAR(A1:A20) Desvio Padrão: =DESVPAD(A1:A20) Coeficiente de Correlação de Pearson: =CORREL(A1:A20;B1:B20)
  • 30. INFERÊNCIA ESTATÍSTICA Generalizar os resultados da Amostra para a População Parâmetro = Verdadeiro valor populacional – Desconhecido (impossível calcular com dados amostrais) Estimativa = Valor amostral – Conhecido (possível calcular com dados amostrais
  • 31. Estimação Intervalar Com base no valor amostral calcular a margem de erro para estimar o valor populacional - Ex.:Pesquisa Eleitoral: Candidato A: 30% Candidato B: 27% Margem de erro de 2 pontos percentuais para mais a para menos Candidato A : 28% a 32% Candidato B: 25% a 29%
  • 32. CONFIABILIDADE Probabilidade do Intervalo conter o verdadeiro valor populacional (estar certo) 90% 95% 99% SIGNIFICÂNCIA Probabilidade do Intervalo não conter o verdadeiro valor populacional (estar errado) 10% 5% 1%
  • 33. Cálculo da Margem de Erro: Z = valor da tabela Z com a confiabilidade definida (para 95% = 1,96) P= proporção estimada (usualmente 0,5) n = tamanho da amostra Ex. Com 95% de confiabilidade e amostra de 600 indivíduos margem de erro = 4%
  • 34. CÁLCULO TAMANHO DA AMOSTRA Ex.: Para uma população de 3.000 pessoas, com 95% de confiabilidade e 5% de erro admissível (margem de erro) n = 384 nc = 340 Amostra de 340 indivíduos
  • 35. TESTES DE HIPÓTESES COMPARAÇÃO 2 Grupos Diferentes ou Mesmos Indivíduos em 2 Momentos Diferentes OBJETIVO: VERIFICAR SE AS DIFERENÇAS SÃO SIGNIFICATIVAS Será que a diferença entre as médias das amostras é significativa quando generalizamos os resultados para a população?
  • 36. Ho => Hipótese Nula => Indica Igualdade => É a Hipóteses que Será Testada H1 => Hipóteses Alternativa => Indica Diferença O resultado de um teste é uma das seguintes afirmações: REJEITO Ho NÃO REJEITO Ho Hipóteses Estatísticas
  • 37. Ho: = H1: ≠ Se o teste indica que REJEITO Ho isto significa que EXISTE DIFERENÇA SIGNIFICATIVA Se o teste indica que NÃO REJEITO Ho isto indica que NÃO EXISTE DIFERENÇA SIGNIFICATIVA
  • 38. Para a realização de um teste deve-se calcular a Estatística de Teste ou Valor Calculado , definir as Regiões Críticas (com base nas tabelas), e fazer a conclusão com base no esquema abaixo:
  • 39. Procedimentos para realização de um teste de hipóteses com Valor Calculado: Formular as hipóteses ( H 0 e H 1 ) Calcular a Estatística de Teste ou Valor Calculado Determinar as Regiões Críticas Decidir pela rejeição , ou não rejeição , da hipótese nula Interpretar o resultado .
  • 40. TESTE F PARA COMPARAR VARIÂNCIAS Ho: VAR A = VAR B H1: VAR A ≠ VAR B Distribuição F com gl Estatística de Teste:
  • 41. TESTE t PARA COMPARAR MÉDIAS Ho: MÉDIA A = MÉDIA B H1: MÉDIA A ≠ MÉDIA B OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES OBSERVAÇÕES DEPENDENTES
  • 42. OBSERVAÇÕES INDEPENDENTES: 2 GRUPOS COM INDIVÍDUOS DIFERENTES OBSERVAÇÕES DEPENDENTES: OS MESMOS INDIVÍDUOS EM 2 MOMENTOS DIFERENTES ( ANTES E DEPOIS OU PRÉ E PÓS TESTES )
  • 43. OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS Estatística de Teste : Distribuição t com n 1 +n 2 –2 gl
  • 44. OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES Estatística de Teste : Distribuição t com gl Onde
  • 45. OBSERVAÇÕES DEPENDENTES Estatística de Teste : Onde é a média da diferenças e S d é o desvio padrão das diferenças Distribuição t com n – 1 gl
  • 46. TESTES DE HIPÓTESES COM VALOR P (P-VALOR) P-VALOR é a probabilidade de errar quando Ho é rejeitado, desta forma: se p-valor for grande : NÃO REJEITO Ho se p-valor for pequeno: REJEITO Ho
  • 47. TESTES DE HIPÓTESES COM VALOR P (P-VALOR) Desta forma utilizamos o seguinte critério para a realização de um teste com p-valor: se p-valor for MAIOR que a significância (5% ou 0,05) : NÃO REJEITO Ho se p-valor for MENOR que a significância (5% ou 0,05) : REJEITO Ho
  • 48. Procedimentos para realização de um teste de hipóteses com p-valor Formular as hipóteses ( H0 e H1) Decidir pela rejeição , ou não rejeição , da hipótese nula (com base no p-valor) Interpretar o resultado.
  • 49. TESTE QUI QUADRADO (  2 ) PARA INDEPENDÊNCIA Utilizado quando a variável medida é QUALITATIVA e deseja-se comparar 2 ou mais grupos Consiste em comparar os valores OBSERVADOS com os valores ESPERADOS , se não houvesse diferença nenhuma entre os grupos
  • 50. TESTE QUI QUADRADO (  2 ) Estatística de teste: Distribuição  2 com (s-1) x (r-1) gl
  • 51. Cálculos no Excel: Teste F: =TESTEF(A1:A20;B1:B20) Teste t de student: =TESTET(A1:A20;A1:B20;1; tipo ) Obs. No lugar de tipo colocar: 1 se forem observações dependentes 2 se forram observações independentes variâncias iguais 3 se forram observações independentes variâncias diferentes Teste qui-quadrado: =TESTE.QUI(A1:B2;A4:B5) Obs. Primeiro Intervalo: Valores Observados Segundo Intervalo: Valores Esperados
  • 52. TESTES NÃO PARAMÉTRICOS 2 grupos Mais de 2 grupos Nível de Mensuração Dependente Independente Dependente Independente Nominal McNemar Fisher ou  2 Q Cochran  2 Ordinal Wilcoxon U Mann-Whitney Friedman Kruskal-Wallis
  • 53. ANOVA Análise de Variância É utilizada quando a variável é QUANTITATIVA e deseja-se comparar MAIS DE 2 GRUPOS , é uma alternativa ao teste t com observações independentes
  • 54. ANÁLISE ESTATÍSTICA Quando o objetivo do trabalho é apenas fazer uma descrição e não se pretende fazer uma comparação: Cálculo de medidas descritivas: Média e desvio padrão para variáveis quantitativas Porcentagem para variáveis qualitativas
  • 55. ANÁLISE ESTATÍSTICA Quando o objetivo do trabalho é fazer uma comparação entre grupos ou entre o pré teste e o pós teste. Para verificar se existe diferença significativa deve ser utilizado algum dos seguintes testes estatísticos:   Variável quantitativa com pelo menos 15 indivíduos por grupo: Comparar pré e pós teste: teste t de student para observações dependentes (pareado) Comparar 2 grupos: teste t de student para observações independentes Comparar mais de 2 grupos: ANOVA Comparar 2 grupos ou mais em períodos de tempo diferentes: ANOVA de medidas repetidas
  • 56. ANÁLISE ESTATÍSTICA Variável quantitativa com menos de 15 indivíduos por grupo ou variável qualitativa ordinal: Comparar pré e pós teste: teste Wilcoxon Comparar 2 grupos: teste U de Mann-Whitney Comparar mais de 2 grupos: teste Kruskal-Wallis Comparar mais de 2 períodos de tempo diferentes: Friedman   Variável qualitativa nominal: Comparar pré e pós teste: teste McNemar Comparar 2 grupos: teste qui-quadrado ( amostras grandes ) ou teste de Fisher (apenas 2 possíveis respostas) Comparar mais de 2 grupos: teste qui-quadrado ( amostras grandes )
  • 57. Tamanho da amostra Para justificar amostras de até 100 indivíduos, com 95% de confiabilidade, para a comparação de grupos pode-se utilizar a seguinte tabela, segundo Altman (1991) Referência: ALTMAN D. G. Pratical Statistics for Medical Research. Chapman and Hall, London, 1991
  • 58. Tabela com tamanho da amostra para uma confiabilidade de 95%: Tamanho da amostra Poder de teste Diferença padronizada 15 60% 1,2 20 65% 1 25 70% 1 30 80% 1 35 85% 1 40 85% 0,95 50 85% 0,85 60 85% 0,75 70 85% 0,70 80 85% 0,65 90 85% 0,60 100 85% 0,55