Teste de Hipotese - INF
Teste de Hipotese - INF
Teste de Hipotese - INF
Teste de Hipóteses
Introdução
É uma metodologia estatística que nos auxilia a tomar decisões sobre uma ou mais populações baseado na informação obtida da
amostra.
Nos permite verificar se os dados amostrais trazem evidência que apoiem ou não uma hipótese estatística formulada.
Ao tentarmos tomar decisões, é conveniente a formulação de suposições ou de conjeturas sobre as populações de interesse, que, em
geral, consistem em considerações sobre parâmetros (μ, σ 2 , p 𝜇, 𝜎2 , 𝑝) das mesmas.
Essas suposições, que podem ser ou não verdadeiras, são denominadas de Hipóteses Estatísticas.
Em muitas situações práticas o interesse do pesquisador é verificar a veracidade sobre um ou mais parâmetros populacionais (
μ, σ 2 , p 𝜇, 𝜎2 , 𝑝) ou sobre a distribuição de uma variável aleatória.
Exemplos:
A produtividade média milho no estado (SC) é de 2500 kg/ha;
A proporção de peças defeituosas no unidade de fabricação é de 0,10;
A propaganda produz efeito positivo nas vendas;
Os métodos de ensino produzem resultados diferentes de aprendizagem
Um dos primeiros trabalhos sobre testes foi publicado em 1710 (John Arbuthnot);
Um dos primeiros procedimentos estatísticos que chega perto de um teste, no sentido moderno foi proposto por Karl Pearson em 1900.
Esse foi o famoso teste do Qui-quadrado, utilizado para comparar uma distribuição de frequência observada com uma distribuição
teoricamente assumida.
A ideia de testar hipóteses foi posteriormente codificada e elaborada por R. A Fischer (1925), que considerou os dados como um vetor
de variáveis aleatórias que pertenciam a uma distribuição de probabilidade…
Uma outra abordagem (competitiva a de Fischer) foi estabelecida por J. Neyman e Egon Pearson (1928)…
Mais tarde, Lehmann (1993) argumentou que de fato era possível unificar as formulação, combinando as melhores características das
duas abordagens…
Hipóteses Estatísticas
Teste de hipótese
O teste de hipóteses fornecem ferramentas que nos permitem rejeitar ou não rejeitar uma hipótese estatística através da evidencia
fornecida pela amostra.
Exemplo 1
Um engenheiro postula a hipótese que a fração de itens defeituosos em um certo processo é de p = 0.10 𝑝 = 0.10.
O experimento é observar uma amostra aleatória do produto em questão, e suponha que n = 100 𝑛 = 100 itens foram testados e
1212 deles eram defeituosos, dessa forma foi estimada uma proporção de p^ = 0.12 𝑝^ = 0.12 a partir da amostra.
É razoável que esta evidência não refuta a condição de que a proporção populacional é p = 0.10 𝑝 = 0.10 ou seja não rejeitamos a
hipótese postulada anteriormente.
No entanto, não rejeitaríamos também se fosse p = 0.12 𝑝 = 0.12 ou talvez p = 0.15 𝑝 = 0.15…
Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:
H 0 : p = 10
H 1 : p ≠ 10
𝐻0 : 𝑝 = 10 𝐻1 : 𝑝 ≠ 10
A hipótese alternativa H 1 𝐻1 ainda pode especificar, < < ou > > além da diferença ≠ ≠ .
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 1/17
13/11/2024, 13:59 Teste de Hipóteses
Exemplo 2
Poderiamos estar interessados em verificar se a taxa média de queima de um propelente é ou não μ = 60 𝜇 = 60 cm/s.
Podemos expressar isso formalmente em termos de um teste de hipótese estatístico como:
H 0 : μ = 60
H 1 : μ ≠ 60
𝐻0 : 𝜇 = 60 𝐻1 : 𝜇 ≠ 60
Mais uma vez a hipótese alternativa H 1 𝐻1 ainda pode especificar, < < ou > > além da diferença ≠ ≠ .
H 0 : μ = 60
H 1 : μ ≠ 60
𝐻0 : 𝜇 = 60 𝐻1 : 𝜇 ≠ 60
Para isso tomaremos uma amostra (tamanho n 𝑛) onde será avaliada a taxa média de queima dessa amostra (x̄¯¯𝑥¯ ). Lembre-se que a
média amostral é uma estimativa da média populacional.
Caso a média amostral x̄¯¯𝑥¯ seja próxima da média populacional μ = 60 𝜇 = 60 podemos supor que μ = 60 𝜇 = 60 é a verdadeira média
populacional (H 0 𝐻0 ), e caso seja um valor muito diferente desse, poderíamos supor que μ ≠ 60 𝜇 ≠ 60 é válida, H 1 𝐻1 . Assim neste
caso a média amostral é a estatística do teste.
Sabemos que a média amostral pode assumir muitos valores distintos, sendo assim podemos supor critérios para se rejeitar ou não
rejeitar a hipótese nula, do tipo, se a média estiver entre 58.5 ≤ x̄¯¯ ≤ 61.5 58.5 ≤ 𝑥¯ ≤ 61.5 não rejeitamos a H 0 𝐻0 , porém se a média
for mais extrema que isso rejeitaremos. Chamaremos o região dos valores extremos de região crítica ou região de rejeição.
Tipos de Erros
Na tomada de decisão conforme estabelcido acima, dado algum critério, podemos obviamente estar comentendo algum erro.
Chamaremos esses erros de erro do tipo I e II.
Erros do tipo I
Erros do tipo II
Erro do Tipo II: Não Rejeitar a hipótese nula H 0 𝐻0 quando ela é falsa
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 2/17
13/11/2024, 13:59 Teste de Hipóteses
A probabilidade do erro do tipo I, α 𝛼 é chamado de nível de significância, ou erro α 𝛼, ou ainda tamanho do teste.
1 − β = P(rejeitar H 0 |H 1 verdadeira)
1 − 𝛽 = 𝑃(𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝐻1 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎)
O poder do teste ou potência é a probabilidade de rejeitar a hipótese nula H 0 𝐻0 , quando a hipótese alternativa H 1 𝐻1 é verdadeira
install.packages("devtools")
library(devtools)
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 3/17
13/11/2024, 13:59 Teste de Hipóteses
install_github("Zibetti/Plothtests")
library(Plothtests)
Agora tomaremos a nossa amostra de cada uma das populações, treinamento A e B, ambas com parâmetros desconhecidos (μ A 𝜇𝐴 ,
μ B 𝜇𝐵 , σ A2 𝜎2𝐴 e σ B2 𝜎2𝐵 ). Para o presente caso tomaremos uma amostra aleatória de tamanho n = 15 𝑛 = 15 para cada treinamento. Uma
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 4/17
13/11/2024, 13:59 Teste de Hipóteses
vez com as amostras calcularemos as estatísticas amostrais (estimadores de parâmetros) e testaremos a hipótese nula para a diferença
das médias.
Code
x̄¯¯A = 𝑥¯ 𝐴 = 11.8751483
x̄¯¯B = 𝑥¯ 𝐵 = 13.2034837
S A2 = 𝑆2𝐴 = 7.3349517
S B2 = 𝑆2𝐵 = 8.3419714
S A = 𝑆𝐴 = 2.7083116
S B = 𝑆𝐵 = 2.8882471
Para este caso faremos um Teste-T (t-student), pois não conhecemos as variâncias populacionais (σ A 2 , σ 2 𝜎2 , 𝜎2 ), dessa forma
B 𝐴 𝐵
2 2
calculamos uma estimativa da mesma (S A , S B 𝑆𝐴 , 𝑆𝐵 ), sendo essas variáveis aleatórias com uma distribuição aproximada pela
2 2
χ 2n−1 𝜒2𝑛 − 1 . Considerando que σ A2 = σ B2 = σ 2 𝜎2𝐴 = 𝜎2𝐵 = 𝜎2 , utilizaremos ambas as informações para calcular uma estimativa única de
σ 2 𝜎2 que chamaremos de S p2 𝑆2𝑝 (essa abordagem é explicada nos exemplos que seguem na próxima seção).
(x A − x B ) − (μ A − μ B )
T = −−−−−−−
S p √ n1A + n1A
(𝑥𝐴 − 𝑥𝐵 ) − (𝜇𝐴 − 𝜇𝐵 )
𝑇=
1 1
𝑆𝑝 √ +
𝑛𝐴 𝑛𝐴
Code
[1] -
1.299
341
Code Observe
que a
estatística diferença entre as médias x̄¯¯A − x̄¯¯B = −1.3283 𝑥¯ 𝐴 − 𝑥¯ 𝐵 = − 1.3283 é tranformada na estatística
t = −1.2993 𝑡 = − 1.2993 na distribuição H 0 𝐻0 . Dessa forma podemos calcular a probabilidade de um valor de diferença entre as
médias ser igual a esse valor ou um valor mais extremo que esse (V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃).
Note que o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 é 0.1022338, o que indica a probabilidade de cometermos o erro do tipo I a partir das evidências, ou
seja a nossa amostra.
Code
$test.statistic
[1] -1.299341
$df
[1] 28
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 5/17
13/11/2024, 13:59 Teste de Hipóteses
$p.value
[1] 0.1022122
Para testar se de fato as variâncias são iguais ou não recorremos ao teste F, também como conhecido como razão de variâncias (pois
nunca tomamos a diferença dessas quantidades).
Testando a hipótese da igualdade entre as variâncias
Primeiramente precisariamos estimar as variâncias, a partir desse ponto precisamos saber se as variâncias (estimadas) são iguais ou
diferentes. O método para determinar o tamanho da relação de uma variância com a outra é dada pela razão de variâncias.
Dessa forma nosso primeiro passo será determinar se as variâncias são iguais ou não.
Vamos então realizar na verdade um teste de hipóteses para a variância.
A variância amostral (ou seja a variável aleatória variância amostral) possui uma distribuição de densidade de probabilidade, que é
aproximadamente uma qui-quadrado χ 2 𝜒2 , ou seja a variável aleatória variância amostral (S 2 𝑆2 ) possui uma distribuição qui-quadrado.
Temos que essa razão de variâncias é nada mais é do que uma função de variáveis aleatórias.
Existe uma distribuição, desenvolvida por Ronald A. Fischer, distribuição F, que é uma função de duas variáveis aleatórias, ou seja a
variável aleatória F é dada por:
Q 1 /gl1
F =
Q 2 /gl2
Q 1 ∼ χ 2n 1 −1
Q 2 ∼ χ 2n 2 −1
𝑄1 / 𝑔𝑙1
𝐹= 𝑄 ∼ 𝜒2𝑛 − 1 𝑄2 ∼ 𝜒2𝑛 − 1
𝑄2 / 𝑔𝑙2 1 1 2
Ou seja a distribuição F é a razão de duas variáveis aleatórias independentes com distribuição de qui-quadrado divido pelos seus
resectivos graus de liberdade (gl 𝑔𝑙). A distribuição possui dois parâmetros, que são os graus de liberdade do numerador e
denominador, F gl 1 ,gl 2 𝐹𝑔𝑙1 , 𝑔𝑙2
George W. Snedecor em seu livro Statisical Methods (1937) descreveu o teste de razão de variâncias, chamando de Teste-F em
homenagem a Ronald A. Fischer.
n−1 𝑛−1
Utilando as quantidades amostrais (
σ2
)S 2 ( 𝜎2 ) 𝑆2 que seguem uma distribuição de qui-quadrado com n − 1 𝑛 − 1 graus de
liberdade temos.
n A −1
( )S A2 /n A − 1
σA2
F = n B −1
( )S B2 /n B − 1
σB2
S A2 σ B2
F = ∼ F gl A ,gl B
S B2 σ A2
𝑛𝐴 − 1
( ) 𝑆2𝐴 / 𝑛𝐴 − 1
𝜎2𝐴 𝑆2𝐴 𝜎2𝐵
𝐹= 𝑛𝐵 − 1 𝐹= ∼ 𝐹𝑔𝑙𝐴 , 𝑔𝑙𝐵
( ) 𝑆2𝐵 / 𝑛𝐵 − 1 𝑆2𝐵 𝜎2𝐴
𝜎2𝐵
Sabemos, que F ∼ F (gl A ,gl B ) 𝐹 ∼ 𝐹(𝑔𝑙𝐴 , 𝑔𝑙𝐵 ) é uma distribuição F (Fischer) com graus de liberdade glA 𝑔𝑙𝐴 do numerador e glB 𝑔𝑙𝐵 do
denominador, e essa distribuição é uma razão de duas variáveis aleatórias χ 2n−1 𝜒2𝑛 − 1 .
Abaixo segue uma simulação do resultado da razão de duas distribuições χ 2n−1 𝜒2𝑛 − 1 e uma verificação da distribuição aproximada
dessa variável aleatória, para fins didáticos. Ainda, o teste de Kolmogorov-Smirnov foi aplicado para verificar a adequação desses dados
(F 𝐹) à uma distribuição F. O resultado da estatística do teste foi D = 0.00061 𝐷 = 0.00061, indicando que não pode ser rejeitado que
esses dados vieram de uma distribuição F com os respectivos graus de liberdade.
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 6/17
13/11/2024, 13:59 Teste de Hipóteses
Note que a simulação não foi apresentada aqui, porém o codigo se encontra abaixo.
Code Para se
verificar
se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência para duas variâncias de populações normais).
H 0 : σ A2 = σ A2
H 1 : σ A2 ≠ σ A2
𝐻0 : 𝜎2𝐴 = 𝜎2𝐴 𝐻1 : 𝜎2𝐴 ≠ 𝜎2𝐴
ou seja, a hipótese nula frente à uma hipótese alternativa, que pode ser, da diferença, ou seja a razão de variâncias ser diferente de 1,
ou superior ou inferior à unidade,
H 0 : σ A2 = σ A2
𝐻0 : 𝜎2𝐴 = 𝜎2𝐴
H 1 : σ A2 ≠ σ A2
H 1 : σ A2 > σ A2
H 1 : σ A2 < σ A2
σ A2
H1 : ≠1
σ A2
σ A2
H1 : >1
σ A2
σ A2
H1 : <1
σ A2
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 7/17
13/11/2024, 13:59 Teste de Hipóteses
S A2
F =
S B2
𝑆2𝐴
𝐹=
𝑆2𝐵
Voltando ao caso das amostras recolhidas A e B, testaremos a hipótese que as variâncias são diferentes entre si.
S A2 = 𝑆2𝐴 = 7.3349517
S B2 = 𝑆2𝐵 = 8.3419714
Hipóteses
2 ≠ σ 2 𝜎2 ≠ 𝜎2 , consequentemente σA2 𝜎2𝐴
Parâmetro de interesse a ser testado: Se σ A B 𝐴 𝐵 =1 =1
σB2 𝜎2𝐵
σA2 𝜎2𝐴
Hipótese nula: H 0 : = 1 𝐻0 : =1
σB2 𝜎2𝐵
σA2 𝜎2
Hipótese alternativa: H 1 : ≠ 1 𝐻1 : 𝜎2𝐴 ≠ 1
σB2 𝐵
Estatística do teste:
Note que por simplicidade no uso das probabilidades da F tabelada opta-se por obter o maior valor de F calculado, neste caso utilizando
no numerador a maior variância amostral da comparação.
S A2
F =
S B2
𝑆2𝐴
𝐹=
𝑆2𝐵
Decisão do teste: Rejeita-se H 0 𝐻0 se o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 (probabilidade de cometer o erro do Tipo I) for menor que α 𝛼.
Erro do Tipo I: é a probabilidade em rejeitar a H 0 𝐻0 sendo ela verdadeira.
Cálculos:
S A2 8.3419
F = = = 1.1372
S B2 7.3349
𝑆2𝐴 8.3419
𝐹= = = 1.1372
𝑆2𝐵 7.3349
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 8/17
13/11/2024, 13:59 Teste de Hipóteses
$test.statistic
[1] 1.137289
$df.num
[1] 14
$df.den
[1] 14
$p.value
[1] 0.8131681
Interpretação
Note que o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 obtido foi de aproximadamente 0.8131681 0.8131681 (área hachurada), teste bilateral, devido a
H 1 𝐻1 ser postulada como a diferença. O V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 indica a probabilidade de comentermos o Erro do Tipo I com base na
amostra, ou seja, rejeitarmos a H 0 𝐻0 sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro na tomada de decisão
é demasiado elevado, superior ao valor arbitrário α = 0.05 𝛼 = 0.05. Podemos dizer que não temos evidência nos dados que
demonstrem diferença significativa entre as variâncias das amostras de preparações A e B.
H 0 : μA − μB = Δ 0
H 1 : μA − μB ≠ Δ 0
𝐻0 : 𝜇𝐴 − 𝜇𝐵 = Δ0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 ≠ Δ0
ou seja, a hipótese nula frente à uma hipótese alteranativa, que pode ser, da diferença entre as médias, ou da superioridade ou
inferioridade de uma das médias,
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 9/17
13/11/2024, 13:59 Teste de Hipóteses
H 0 : μA − μB = 0
𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0
H 1 : μA − μB ≠ 0
H 1 : μA − μB > 0
H 1 : μA − μB < 0
𝐻1 : 𝜇𝐴 − 𝜇𝐵 ≠ 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 > 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 < 0
¯¯¯¯ ¯¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − X B 𝑋¯ 𝐴 − 𝑋¯ 𝐵 é dada por:
¯¯¯¯ ¯¯¯¯ σ2 σ2
V (X A − X B ) = + B
nA nB
𝜎2 𝜎2𝐵
𝑉(𝑋¯ 𝐴 − 𝑋¯ 𝐵 ) = +
𝑛𝐴 𝑛𝐵
2 = σ 2 = σ 2 𝜎2 = 𝜎2 = 𝜎2 , temos que:
Sendo as variâncias iguais σ A B 𝐴 𝐵
¯¯¯¯ ¯¯¯¯ σ2 σ2 1 1
V (X A − X B ) = + B = σ 2( + )
nA nB nA nB
𝜎2 𝜎2𝐵 1 1
𝑉(𝑋¯ 𝐴 − 𝑋¯ 𝐵 ) = + = 𝜎2 ( + )
𝑛𝐴 𝑛𝐵 𝑛𝐴 𝑛𝐵
2 , S 2 𝑆2 , 𝑆2 ) em uma única (S 2 𝑆2 ) parece razoável. O estimador combinado das duas
Dessa forma combinar as duas estimativas (S A B 𝐴 𝐵
variâncias estimadas é também chamado de pooled estimator,S p2 𝑆2𝑝 , e é dado por:
nA − 1 nB − 1
S p2 = ⋅ S A2 + ⋅ S B2
nA + nB − 2 nA + nB − 2
𝑛𝐴 − 1 𝑛𝐵 − 1
𝑆2𝑝 = ⋅ 𝑆2 + ⋅ 𝑆2
𝑛𝐴 + 𝑛𝐵 − 2 𝐴 𝑛𝐴 + 𝑛𝐵 − 2 𝐵
Note que o estimador combinado nada mais é do que uma média das variâncias ponderada pelos tamanhos das amostras.
Assim a grandeza,
¯¯¯¯ ¯¯¯¯
X A − X B − (μ A − μ B )
t= −−−−−−−
S p √ n1 + n1
A B
𝑋¯ 𝐴 − 𝑋¯ 𝐵 − (𝜇𝐴 − 𝜇𝐵 )
𝑡=
1 1
𝑆𝑝 √ 𝑛 + 𝑛
𝐴 𝐵
O teste de hipóteses para a diferença de médias de duas distribuições normais, variâncias desconhecidas e iguais.
Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam iguais.
H 0 : μA − μB = Δ 0 𝐻0 : 𝜇𝐴 − 𝜇𝐵 = Δ0
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 10/17
13/11/2024, 13:59 Teste de Hipóteses
H 1 : μA − μB < Δ 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 < Δ0
H 1 : μA − μB > Δ 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 > Δ0
Hipóteses
Parâmetro de interesse a ser testado: Se μ A = μ B 𝜇𝐴 = 𝜇𝐵 , consequentemente μ A − μ B = 0 𝜇𝐴 − 𝜇𝐵 = 0
Hipótese nula: H 0 : μ A − μ B = 0 𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0
Hipótese alternativa: H 1 : μ A − μ B ≠ 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 ≠ 0
Estatística do teste:
¯¯¯¯ ¯¯¯¯
XA − XB − 0
t0 = −−−−−−−
S p √ n1A + n1B
¯¯¯¯ ¯¯¯¯
XA − XB
t0 = −−−−−−−
S p √ n1A + n1B
x̄¯¯A − x̄¯¯B
t0 = −−−−−−−
s p √ n1A + n1B
𝑋¯ 𝐴 − 𝑋¯ 𝐵 − 0 𝑋¯ 𝐴 − 𝑋¯ 𝐵 𝑥¯ 𝐴 − 𝑥¯ 𝐵
𝑡0 = 𝑡0 = 𝑡0 =
1 1 1 1 1 1
𝑆𝑝 √ 𝑛 + 𝑛𝐵
𝑆𝑝 √ 𝑛 + 𝑛𝐵
𝑠𝑝 √ 𝑛 + 𝑛
𝐴 𝐴 𝐴 𝐵
Decisão do teste: Rejeita-se H 0 𝐻0 se o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 (probabilidade de cometer o erro do Tipo I) for menor que α 𝛼.
Erro do Tipo I: é a probabilidade em rejeitar a H 0 𝐻0 sendo ela verdadeira.
Cálculos:
15 − 1 10 − 1
s 2p = ⋅ 4.12 + ⋅ 3.82
15 + 10 − 2 15 + 10 − 2
s p = 3.9853
15 − 1 10 − 1
𝑠2𝑝 = ⋅ 4.12 + ⋅ 3.82
15 + 10 − 2 15 + 10 − 2
𝑠2𝑝 = (0.6087) ⋅ 4.12 + (0.3913) ⋅ 3.82 = 15.8826
𝑠𝑝 = 3.9853
Code
[1]
3.985
299
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 11/17
13/11/2024, 13:59 Teste de Hipóteses
−
x̄¯¯A x̄¯¯B
t0 = −−−−−−−
s p √ n + n1
1
A B
28 − 26
t0 = −1−−−−1−
3.9853√ 15 + 10
t 0 = 1.23
𝑥¯ 𝐴 − 𝑥¯ 𝐵 28 − 26
𝑡0 = 𝑡0 = 𝑡0 = 1.23
1 1 1 1
𝑠𝑝 √ 𝑛 + 𝑛𝐵
3.9853√ 15 + 10
𝐴
Code
[1]
1.229
262
Code
$test.statistic
[1] 1.229263
$df
[1] 23
$p.value
[1] 0.2314014
Interpretação
Note que o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 obtido foi de aproximadamente V alor − P = 2 ∗ 0.116 = 0.231 𝑉𝑎𝑙𝑜𝑟 − 𝑃 = 2 ∗ 0.116 = 0.231 (área
hachurada), onde temos um teste bilateral, devido a H 1 𝐻1 ser postulada como a diferença. O V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 indica a
probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0 𝐻0 sendo ela verdadeira. Dessa forma a probabilidade de
cometermos tal erro na tomada de decisão é demasiado elevado, V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 = 0.231, superior ao valor de α = 0.05 𝛼 = 0.05.
Podemos dizer que não temos evidência nos dados que demonstrem diferença significativa entre as preparações A e B.
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 12/17
13/11/2024, 13:59 Teste de Hipóteses
As variâncias podem ser testadas para igualdade utilizando um Teste F (Fischer).
Hipóteses
Parâmetro de interesse a ser testado: Se μ A = μ B 𝜇𝐴 = 𝜇𝐵 , consequentemente μ A − μ B = 0 𝜇𝐴 − 𝜇𝐵 = 0
Hipótese nula: H 0 : μ A − μ B = 0 𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0
Hipótese alternativa: H 1 : μ A − μ B > 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 > 0
Estatística do teste:
x̄¯¯A − x̄¯¯B
t0 = −−−−−−−
s p √ n1A + n1B
𝑥¯ 𝐴 − 𝑥¯ 𝐵
𝑡0 =
1 1
𝑠𝑝 √ +
𝑛𝐴 𝑛𝐵
- Decisão do teste: Rejeita-se H 0 𝐻0 se o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 (probabilidade de cometer o erro do Tipo I) for menor que α 𝛼.
17 − 1 17 − 1
s 2p = ⋅ 3.72 + ⋅ 3.82
17 + 17 − 2 17 + 17 − 2
s p = 3.75
17 − 1 17 − 1
𝑠2𝑝 = ⋅ 3.72 + ⋅ 3.82
17 + 17 − 2 17 + 17 − 2
𝑠2𝑝 = (0.5) ⋅ 3.72 + (0.5) ⋅ 3.82 = 14.065
𝑠𝑝 = 3.75
Code
[1]
3.750
333
x̄¯¯A − x̄¯¯B
t0 = −−−−−−−
s p √ n1A + n1B
29 − 26
t0 = −1−−−−1−
3.75√ 17 + 17
t 0 = 2.33
𝑥¯ 𝐴 − 𝑥¯ 𝐵 29 − 26
𝑡0 = 𝑡0 = 𝑡0 = 2.33
1 1 1 1
𝑠𝑝 √ 𝑛 + 𝑛𝐵
3.75√ 17 + 17
𝐴
Code
[1]
2.332
381
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 13/17
13/11/2024, 13:59 Teste de Hipóteses
$test.statistic
[1] 2.332173
$df
[1] 32
$p.value
[1] 0.01307213
Interpretação
Note que o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 obtido foi de aproximadamente V alor − P = 0.0131 𝑉𝑎𝑙𝑜𝑟 − 𝑃 = 0.0131, onde temos um teste
unilateral, devido a H 1 𝐻1 ser postulada como a a superioridade de uma das médias. O V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 indica a probabilidade de
comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0 𝐻0 sendo ela verdadeira. Dessa forma a probabilidade de cometermos tal erro
na tomada de decisão é inferior ao valor de α = 0.05 𝛼 = 0.05, V alor − P = 0.0131 𝑉𝑎𝑙𝑜𝑟 − 𝑃 = 0.0131. Podemos dizer que temos
evidência nos dados que demonstrem um diferença estatísticamente significativa entre as preparações A e B. Em outras palavras o erro
que estaria sendo cometido ao rejeitarmos H 0 𝐻0 é algo em torno de 1.3 %.
2
Caso 2: Variâncias diferentes σ A ≠ σ B2 𝜎2𝐴 ≠ 𝜎2𝐵
Para se verificar se as variâncias são iguais ou não é necessário recorrer ao teste F (inferência para duas variâncias de populações
normais).
Dessa forma suponha que tenhamos duas populações normais independentes com médias desconhecidas e variâncias desconhecidas
porém diferentes, e desejamos testar as hipóteses H 0 𝐻0 versus uma H 1 𝐻1 .
¯¯¯¯ ¯¯¯¯
Sabemos que a variância da diferença entre as variáveis aleatórias X A − X B 𝑋¯ 𝐴 − 𝑋¯ 𝐵 é dada por:
¯¯¯¯ ¯¯¯¯ σ2 σ2
V (X A − XB) = + B
nA nB
𝜎2 𝜎2𝐵
𝑉(𝑋¯ 𝐴 − 𝑋¯ 𝐵 ) = +
𝑛𝐴 𝑛𝐵
Assim a grandeza,
¯¯¯¯ ¯¯¯¯
X A − X B − (μ A − μ B )
t= −−−−−− −
2 2
√ SA + SB
nA nB
𝑋¯ 𝐴 − 𝑋¯ 𝐵 − (𝜇𝐴 − 𝜇𝐵 )
𝑡=
𝑆2𝐴 𝑆2𝐵
+
√ 𝑛𝐴 𝑛𝐵
possui uma distribuição t 𝑡 com v 𝑣 graus de liberadade. Para esse caso os graus de liberdade não serão mais
n A + n B − 2 𝑛𝐴 + 𝑛𝐵 − 2 e sim, calculados pela seguinte expressão:
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 14/17
13/11/2024, 13:59 Teste de Hipóteses
2
S2 S B2
( nA + nB
)
A
v= 2
S2 S2
2
( nA ) ( nB )
A B
n A −1
+ n B −1
2
𝑆2𝐴 𝑆2𝐵
( + )
𝑛𝐴 𝑛𝐵
𝑣= 2 2
2 2
𝑆𝐴 𝑆𝐵
( ) ( )
𝑛𝐴 𝑛𝐵
𝑛𝐴 − 1
+ 𝑛𝐵 − 1
O teste de hipóteses para a diferença de médias de duas distribuições normais, variâncias desconhecidas e diferentes.
Hipótese nula: hipótese de nulidade, onde não há diferença entre as médias, as médias seriam iguais.
H 0 : μA − μB = Δ 0 𝐻0 : 𝜇𝐴 − 𝜇𝐵 = Δ0
H 1 : μA − μB < Δ 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 < Δ0
H 1 : μA − μB > Δ 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 > Δ0
Um psicólogo estava interessado em explorar se os estudantes universitários do sexo masculino e feminino têm ou não diferentes
comportamentos de condução. Havia uma série de maneiras que ela poderia quantificar comportamentos de condução. Ela optou por
se concentrar na velocidade mais rápida já dirigida por um indivíduo. Portanto, a questão estatística em particular que ele formulou foi
a seguinte:
Seria a maior velocidade média conduzida por estudantes universitários do sexo masculino diferente da maior velocidade média
conduzida por estudantes universitários do sexo feminino?
Ele realizou um levantamento de uma amostra aleatória n A = 34 𝑛𝐴 = 34 estudantes universitários do sexo masculino e
n B = 29 𝑛𝐵 = 29 estudantes universitários do sexo feminino.
Existe evidência suficiente no nível α = 0.05 𝛼 = 0.05 para concluir que a maior velocidade média conduzida por estudantes
universitários do sexo masculino difere da maior velocidade média de estudantes universitários do sexo feminino?
Considere as variâncias diferentes.
O resumo descritivo dos resultados de sua pesquisa:
Hipóteses
Parâmetro de interesse a ser testado: Se μ A = μ B 𝜇𝐴 = 𝜇𝐵 , consequentemente μ A − μ B = 0 𝜇𝐴 − 𝜇𝐵 = 0
Hipótese nula: H 0 : μ A − μ B = 0 𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0
Hipótese alternativa: H 1 : μ A − μ B ≠ 0 𝐻1 : 𝜇𝐴 − 𝜇𝐵 ≠ 0
Estatística do teste:
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 15/17
13/11/2024, 13:59 Teste de Hipóteses
−
x̄¯¯A x̄¯¯B
t0 = −−−−−− −
2 2
√ SA + SB
nA nB
𝑥¯ 𝐴 − 𝑥¯ 𝐵
𝑡0 =
𝑆2𝐴 𝑆2𝐵
+
√ 𝑛𝐴 𝑛𝐵
Decisão do teste: Rejeita-se H 0 𝐻0 se o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 (probabilidade de cometer o erro do Tipo I) for menor que α 𝛼.
Erro do Tipo I: é a probabilidade em rejeitar a H 0 𝐻0 sendo ela verdadeira.
Cálculos:
Suposições: Vamos assumir que as variáveis aleatórias maiores velocidades (masculino e feminino) são normalmente distribuidas
e que cada amostra é independente.
Calculando os graus de liberdade, v 𝑣:
2 2
12.22
( 20.1
34
+ 29
)
v= 2 2
= 55.5 = 55
2
( 20.1
34
) ( 12.2
29
)
34−1
+ 29−1
2
20.12 12.22
( 34
+ 29
)
𝑣= 2
= 55.5 = 55
2 12.2
2
20.1 ( )
( ) 29
34
34 − 1
+ 29 − 1
105.5 − 90.9
t0 = −−−−−−−−
2 2−
√ 20.1
34
+ 12.2
29
t 0 = 3.54
105.5 − 90.9
𝑡0 = 𝑡0 = 3.54
20.12 12.22
√ +
34 29
Code
[1]
3.539
453
Code
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 16/17
13/11/2024, 13:59 Teste de Hipóteses
$test.statistic
[1] 3.539453
$df
[1] 55
$p.value
[1] 0.0008242127
Interpretação
O valor crítico para rejeição da hipótese nula H 0 𝐻0 em favor da hipótese alternativa H 1 𝐻1 é:
Esse valor crítico pode ser obtido na tabela da distribuição t para α/2 = 0.05/2 = 0.025 𝛼 / 2 = 0.05 / 2 = 0.025 pois é um teste
bilateral, na curva com graus de liberadade igual a 5555.
Note que o V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 obtido foi de aproximadamente p = 2 ∗ 0.000412 = 0.000824 𝑝 = 2 ∗ 0.000412 = 0.000824 (área
hachurada), onde temos um teste bilateral, devido a H 1 𝐻1 ser postulada como a diferença. O V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 indica a
probabilidade de comentermos o Erro do Tipo I, ou seja, rejeitarmos a H 0 𝐻0 sendo ela verdadeira. Dessa forma a probabilidade de
cometermos tal erro na tomada de decisão é bastante pequeno, V alor − P 𝑉𝑎𝑙𝑜𝑟 − 𝑃 = 0.000824, inferior ao valor de
α = 0.05 𝛼 = 0.05. Podemos dizer que temos evidência nos dados que demonstram diferença significativa entre as velocidades médias
do grupo A 𝐴 e B 𝐵.
https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teste-de-hipoteses.html 17/17