O documento descreve os principais conceitos e métodos da bioestatística, incluindo estatística descritiva para resumir dados, inferência estatística para generalizar resultados amostrais, e planejamento de pesquisas para coleta e análise de dados. É apresentado como uma matéria fundamental para realizar trabalhos de conclusão que envolvam coleta e análise de dados.
1 de 58
Mais conteúdo relacionado
Bioestatística
1. BIOESTATÍSTICA A Bioestatística estuda métodos para a obtenção, organização e análise de dados e os métodos de tirar conclusão e fazer predições com base nesses dados. É uma matéria fundamental para a realização de pesquisas com coleta de dados Os procedimentos estudados na Bioestatística serão utilizados na realização do TCC
2. Estatística Descritiva : consistem em resumir as principais características de um conjunto de dados através de tabelas, gráficos e medidas descritivas em forma de resumos numéricos; Inferência Estatística : consiste em generalizar os resultados de uma amostra para todos os elementos da população, isto é realizado basicamente na forma de Estimação Intervalar e de Testes de Hipóteses.
3. CONCEITOS BÁSICOS População : Conjunto de TODAS as unidades que se deseja estudar Amostra : Subconjunto da população, são as unidades que iremos observar
4. CONCEITOS BÁSICOS INDIVÍDUO : cada elemento afetado por uma medida ou enumerado por um índice. VARIÁVEL : determinada característica que, por algum motivo, nos interessa estudar. A escolha da variável de interesse dependerá, em cada caso, dos objetivos do estudo estatístico em questão, É O QUE MEDIREMOS!!
5. FASES DE UM TRABALHO ESTATÍSTICO 1ª DEFINIÇÃO DO PROBLEMA . 2ª PLANEJAMENTO 3ª COLETA DE DADOS 4ª APURAÇÃO DOS DADOS 5ª APRESENTAÇÃO DOS DADOS 6ª ANÁLISE E INTERPRETAÇÃO DOS DADOS
6. Planejamento O QUE MEDIR – quais variáveis utilizar COMO MEDIR – como medir estas variáveis DE QUEM MEDIR – qual será a amostra
7. Exemplo 1: Realizar uma pesquisa de opinião com os alunos da Faculdade Como medir estar variáveis?? Questionário . Como aplicar,... Quais variáveis utilizar?? Quais questões, opções de resposta,... Como será a amostra?? Quantas pessoas, como selecionar,...
8. Exemplo 2: Verificar a eficiência de um treinamento em jogadores de Basquete 12 a 14 anos jogos colegiais Quais variáveis utilizar?? Velocidade, Impulsão,... Como medir estar variáveis??. Quais Protocolos utilizar. Como será a amostra?? Quantas pessoas, como selecionar ,...
10. AMOSTRAGEM Amostra é parte desta população, é a parte que será realmente estudada, portanto pode-se compreender que ela deva apresentar o melhor possível, a população da qual veio. Razões para o Uso de Amostra: De ordem prática População hipotética
11. TIPOS DE AMOSTRAS MAIS USADAS - Aleatória simples : Sortear indivíduos do total da população (LISTA) - Aleatória sistemática : Selecionar indivíduos de “k em k” quando não é possível sortear - Estratificada proporcional : Dividir a população em estratos (grupos) e selecionar a amostra proporcionalmente dentro de cada estrato
12. Exemplo: Uma população é dividida em 3 grupos da seguinte forma Estrato A (jovens) _____> 120 elementos Estrato B (adultos) _____> 72 elementos Estrato C (3ª idade) _____> 48 elementos Retirar uma amostra de 50 indivíduos dessa população
13. AMOSTRA POR CONVENIÊNCIA Quando não é possível utilizar nenhum dos planos amostrais anteriores e a única possibilidade é utilizar alguns indivíduos que temos a disposição Obs : Caracterizar bem a amostra para deixar claro qual população ela representa (descrição das características dos indivíduos como: sexo, escolaridade classe social , etc.)
15. GRÁFICOS Barras ou Colunas : Comparar as quantidades Escala Iniciar do ZERO !! Pizza ou Setores : Comparar as partes de um todo Apenas Categorias NOMINAIS No Máximo 5 ou 6 Categorias Linhas : Verificar comportamento AO LONGO DO TEMPO
16. CORRELAÇÃO Verificar como 2 variáveis quantitativas se relacionam Diagrama de Dispersão Coeficiente de Correlação de Pearson
19. MEDIDAS DE TENDÊNCIA CENTRAL Média . É o valor em torno do qual os dados se concentram. Exemplo: Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320
20. Mediana . É o valor que divide um conjunto de observações ao meio Ex 1) Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320 (n.º de observações ímpares) Md = 280 (mg/dL) Interpretação : 50% dos indivíduos tem colesterol igual ou menor que 280 e os outros 50% tem 280 ou mais.
21. Ex 2) Amostra de salários de 6 profissionais: 200 – 220 – 250 – 280 – 310 – 320 (n.º de observações par) Md= 250 + 280 2 Md= 265,00 reais Interpretação : metade dos profissionais tem salário igual ou menor que 265,00 reais e os demais tem salário igual ou maior de 265,00 reais.
22. Moda . É o valor que ocorre com maior freqüência dentro do conjunto de observação. Ex) Idade de alunos (em anos): 18 - 19 - 19 - 19 - 20 - 21 - 22 Mo = 19 anos Interpretação: a idade que mais aparece é 19 anos. 1 moda = unimodal 2 modas = bimodal + de 2 modas = multimodal não possui moda = amodal
23. Separatrizes . São valores que dividem um conjunto de observações em partes iguais: Mediana -- Divide em 2 partes iguais (Md) Quartil ----- Divide em 4 partes iguais (Q) Decil -------Divide em 10 partes iguais (D) Percentil ------Divide em 100 partes iguais (P) Ex) P 45 = 23,8 anos Interpretação: 45% das pessoas tem menos de 23,8 anos e 55% tem mais de 23,8 anos
24. MEDIDAS DE VARIABILIDADE AMPLITUDE (H) É a diferença entre o valor máximo e o valor mínimo de conjunto de dados H = M – m VARIÂNCIA (S 2 ) É a “média” entre os quadrados das diferenças entre cada elemento do conjunto de dados e sua média.
25. DESVIO PADRÃO (s) É a raiz quadrada positiva da variância. Ele mede a dispersão de um conjunto de dados em relação à média. Notas de 4 bimestres na disciplina de Bioestatística de 2 alunos: A) 4 - 6 - 4 - 6 B) 0 - 4 - 6 - 10
26. 1º Passo: cálculo da média 2º Passo: cálculo dos desvios 3º Passo: cálculo dos desvios ao quadrado 4º Passo: Cálculo da somatória dos desvios ao quadrado 5º Passo: aplicação da fórmula
27. COEFICIENTE DE VARIAÇÃO (CV) É a medida de dispersão relativa porque estabelece uma relação entre o desvio padrão e a média. Utilizada para comparar a variabilidade relativa ou grau de homogeneidade de diferentes grupos Considera-se um grupo homogêneo quando CV ≤ 30%. Com um CV > 30% o grupo vai perdendo a homogeneidade %
28. Exemplo: Indique qual grupo é mais homogêneo em relação ao salário: Grupo A : Média R$600 desvio padrão R$50 Grupo B : Média R$1.000 desvio padrão R$70 CV A = 50/600 = 8,33% CV B = 70/1.000 = 7% Grupo B mais homogêneo (CV menor)
29. Cálculos no Excel: Contar Valores: =CONT.SE(A1:A20;” C ”) Obs. No lugar de C colocar o valor que será contado entre aspas Média: =MÉDIA(A1:A20) Mediana: =MED(A1:A20) Percentil: =PERCENTIL(A1:A20;0, p ) Obs. No lugar de p colocar o pecentil desejado Maior Valor: =MÁXIMO(A1:A20) Menor Valor: =MÍNIMO(A1:A20) Variância: =VAR(A1:A20) Desvio Padrão: =DESVPAD(A1:A20) Coeficiente de Correlação de Pearson: =CORREL(A1:A20;B1:B20)
30. INFERÊNCIA ESTATÍSTICA Generalizar os resultados da Amostra para a População Parâmetro = Verdadeiro valor populacional – Desconhecido (impossível calcular com dados amostrais) Estimativa = Valor amostral – Conhecido (possível calcular com dados amostrais
31. Estimação Intervalar Com base no valor amostral calcular a margem de erro para estimar o valor populacional - Ex.:Pesquisa Eleitoral: Candidato A: 30% Candidato B: 27% Margem de erro de 2 pontos percentuais para mais a para menos Candidato A : 28% a 32% Candidato B: 25% a 29%
32. CONFIABILIDADE Probabilidade do Intervalo conter o verdadeiro valor populacional (estar certo) 90% 95% 99% SIGNIFICÂNCIA Probabilidade do Intervalo não conter o verdadeiro valor populacional (estar errado) 10% 5% 1%
33. Cálculo da Margem de Erro: Z = valor da tabela Z com a confiabilidade definida (para 95% = 1,96) P= proporção estimada (usualmente 0,5) n = tamanho da amostra Ex. Com 95% de confiabilidade e amostra de 600 indivíduos margem de erro = 4%
34. CÁLCULO TAMANHO DA AMOSTRA Ex.: Para uma população de 3.000 pessoas, com 95% de confiabilidade e 5% de erro admissível (margem de erro) n = 384 nc = 340 Amostra de 340 indivíduos
35. TESTES DE HIPÓTESES COMPARAÇÃO 2 Grupos Diferentes ou Mesmos Indivíduos em 2 Momentos Diferentes OBJETIVO: VERIFICAR SE AS DIFERENÇAS SÃO SIGNIFICATIVAS Será que a diferença entre as médias das amostras é significativa quando generalizamos os resultados para a população?
36. Ho => Hipótese Nula => Indica Igualdade => É a Hipóteses que Será Testada H1 => Hipóteses Alternativa => Indica Diferença O resultado de um teste é uma das seguintes afirmações: REJEITO Ho NÃO REJEITO Ho Hipóteses Estatísticas
37. Ho: = H1: ≠ Se o teste indica que REJEITO Ho isto significa que EXISTE DIFERENÇA SIGNIFICATIVA Se o teste indica que NÃO REJEITO Ho isto indica que NÃO EXISTE DIFERENÇA SIGNIFICATIVA
38. Para a realização de um teste deve-se calcular a Estatística de Teste ou Valor Calculado , definir as Regiões Críticas (com base nas tabelas), e fazer a conclusão com base no esquema abaixo:
39. Procedimentos para realização de um teste de hipóteses com Valor Calculado: Formular as hipóteses ( H 0 e H 1 ) Calcular a Estatística de Teste ou Valor Calculado Determinar as Regiões Críticas Decidir pela rejeição , ou não rejeição , da hipótese nula Interpretar o resultado .
40. TESTE F PARA COMPARAR VARIÂNCIAS Ho: VAR A = VAR B H1: VAR A ≠ VAR B Distribuição F com gl Estatística de Teste:
41. TESTE t PARA COMPARAR MÉDIAS Ho: MÉDIA A = MÉDIA B H1: MÉDIA A ≠ MÉDIA B OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES OBSERVAÇÕES DEPENDENTES
42. OBSERVAÇÕES INDEPENDENTES: 2 GRUPOS COM INDIVÍDUOS DIFERENTES OBSERVAÇÕES DEPENDENTES: OS MESMOS INDIVÍDUOS EM 2 MOMENTOS DIFERENTES ( ANTES E DEPOIS OU PRÉ E PÓS TESTES )
43. OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE IGUAIS Estatística de Teste : Distribuição t com n 1 +n 2 –2 gl
44. OBSERVAÇÕES INDEPENDENTES COM VARIÂNCIAS SUPOSTAMENTE DIFERENTES Estatística de Teste : Distribuição t com gl Onde
45. OBSERVAÇÕES DEPENDENTES Estatística de Teste : Onde é a média da diferenças e S d é o desvio padrão das diferenças Distribuição t com n – 1 gl
46. TESTES DE HIPÓTESES COM VALOR P (P-VALOR) P-VALOR é a probabilidade de errar quando Ho é rejeitado, desta forma: se p-valor for grande : NÃO REJEITO Ho se p-valor for pequeno: REJEITO Ho
47. TESTES DE HIPÓTESES COM VALOR P (P-VALOR) Desta forma utilizamos o seguinte critério para a realização de um teste com p-valor: se p-valor for MAIOR que a significância (5% ou 0,05) : NÃO REJEITO Ho se p-valor for MENOR que a significância (5% ou 0,05) : REJEITO Ho
48. Procedimentos para realização de um teste de hipóteses com p-valor Formular as hipóteses ( H0 e H1) Decidir pela rejeição , ou não rejeição , da hipótese nula (com base no p-valor) Interpretar o resultado.
49. TESTE QUI QUADRADO ( 2 ) PARA INDEPENDÊNCIA Utilizado quando a variável medida é QUALITATIVA e deseja-se comparar 2 ou mais grupos Consiste em comparar os valores OBSERVADOS com os valores ESPERADOS , se não houvesse diferença nenhuma entre os grupos
50. TESTE QUI QUADRADO ( 2 ) Estatística de teste: Distribuição 2 com (s-1) x (r-1) gl
51. Cálculos no Excel: Teste F: =TESTEF(A1:A20;B1:B20) Teste t de student: =TESTET(A1:A20;A1:B20;1; tipo ) Obs. No lugar de tipo colocar: 1 se forem observações dependentes 2 se forram observações independentes variâncias iguais 3 se forram observações independentes variâncias diferentes Teste qui-quadrado: =TESTE.QUI(A1:B2;A4:B5) Obs. Primeiro Intervalo: Valores Observados Segundo Intervalo: Valores Esperados
52. TESTES NÃO PARAMÉTRICOS 2 grupos Mais de 2 grupos Nível de Mensuração Dependente Independente Dependente Independente Nominal McNemar Fisher ou 2 Q Cochran 2 Ordinal Wilcoxon U Mann-Whitney Friedman Kruskal-Wallis
53. ANOVA Análise de Variância É utilizada quando a variável é QUANTITATIVA e deseja-se comparar MAIS DE 2 GRUPOS , é uma alternativa ao teste t com observações independentes
54. ANÁLISE ESTATÍSTICA Quando o objetivo do trabalho é apenas fazer uma descrição e não se pretende fazer uma comparação: Cálculo de medidas descritivas: Média e desvio padrão para variáveis quantitativas Porcentagem para variáveis qualitativas
55. ANÁLISE ESTATÍSTICA Quando o objetivo do trabalho é fazer uma comparação entre grupos ou entre o pré teste e o pós teste. Para verificar se existe diferença significativa deve ser utilizado algum dos seguintes testes estatísticos: Variável quantitativa com pelo menos 15 indivíduos por grupo: Comparar pré e pós teste: teste t de student para observações dependentes (pareado) Comparar 2 grupos: teste t de student para observações independentes Comparar mais de 2 grupos: ANOVA Comparar 2 grupos ou mais em períodos de tempo diferentes: ANOVA de medidas repetidas
56. ANÁLISE ESTATÍSTICA Variável quantitativa com menos de 15 indivíduos por grupo ou variável qualitativa ordinal: Comparar pré e pós teste: teste Wilcoxon Comparar 2 grupos: teste U de Mann-Whitney Comparar mais de 2 grupos: teste Kruskal-Wallis Comparar mais de 2 períodos de tempo diferentes: Friedman Variável qualitativa nominal: Comparar pré e pós teste: teste McNemar Comparar 2 grupos: teste qui-quadrado ( amostras grandes ) ou teste de Fisher (apenas 2 possíveis respostas) Comparar mais de 2 grupos: teste qui-quadrado ( amostras grandes )
57. Tamanho da amostra Para justificar amostras de até 100 indivíduos, com 95% de confiabilidade, para a comparação de grupos pode-se utilizar a seguinte tabela, segundo Altman (1991) Referência: ALTMAN D. G. Pratical Statistics for Medical Research. Chapman and Hall, London, 1991
58. Tabela com tamanho da amostra para uma confiabilidade de 95%: Tamanho da amostra Poder de teste Diferença padronizada 15 60% 1,2 20 65% 1 25 70% 1 30 80% 1 35 85% 1 40 85% 0,95 50 85% 0,85 60 85% 0,75 70 85% 0,70 80 85% 0,65 90 85% 0,60 100 85% 0,55