Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Correction TD4

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 9

TD Proba-Stat Tronc commun Polytech Clermont

TD de Probabilité et Statistique

Correction feuille 4 : Test d’hypothèses

Exercice 1 :
Population : individus d’une population de référence
échantillon : n =42 patients
var. intérêt : Xi =glycémie du ième patient∼ N (µ, σ 2 ), µ inconnue
étape 1 : Définition des hypothèses
H0 : ”µ = 1”
H1 : ”µ 6= 1”

α = 0.05
Il faut réaliser un test de comparaison d’une moyenne à une valeur théorique
dans le cas où σ 2 est connue.
étape 2 : Statistique de test
2
X̄ ∼ (1, σn ), Z = X̄−1√σ ∼ N(0; 1) sous H0
n
étape 3 : Zone de rejet
On cherche q > 0 tel que
q
PH0 (|X̄ − 1| > q) = 0.05 ⇔ PH0 (|Z| > ) = 0.05
√σ
n
q
⇔ 2PH0 (Z > ) = 0.05
√σ
n
q
⇔ 2 − 2PH0 (Z < ) = 0.05
√σ
n
q
⇔ PH0 (Z < ) = 0.975
√σ
n
q
⇔ = 1.96
√σ
n
⇔ q = 0.03

R = {|X̄ − 1| > 0.03}


étape 4 : Conclusion
x̄ = 1.06, |x̄ − 1| = 0.06 > 0.03 ∈ R
On rejette H0 . Cet échantillon n’est pas représentatif de la population de
référence.
2

Exercice 2 :
population : individus vivant en milieu rural ou en milieu urbain
échantillons : NU = 200, NR = 300
var d’intérêts :
— XU i : rythme cardiaque du ième individu vivant en milieu urbain
∼ N(mU , σ 2 ) i.i.d.
— XRi : rythme cardiaque du ième individu vivant en milieu rural ∼
N(mR , σ 2 ) i.i.d.
mU , mR , σ 2 sont inconnues
(1)
H0 : ”mU = mR ”
H1 : ”mU > mR ”

(2) estimateur de mU − mR : X¯U − X¯R


E(X¯U − X¯R ) = E(X¯U ) − E(X¯R ) = mU − mR
X¯U − X¯R est un estimateur sans biais.
(3) R = {|T | > c} où T ∼ TnU +n−R−2 = T498 , c > 0 tel que
PH0 (|T | > c) = 0.05 ⇔ PH0 (T < −c) + PH0 (T > c) = 0.05
⇔ PH0 (T < c) = 0.975
⇔ c = 1.9647
R = {|T | > 1.9647}
(4)
1 X X
Sn2U ,nR = ( ((XU i − X¯U )2 + ((XRi − X¯R )2 )
498
1 X X
SU2 = (XU i − X¯U )2 ⇔ (XU i − X¯U )2 = (nU − 1)s2U
nU − 1
1
Sn2U ,nR = (199 ∗ 147 + 299 ∗ 126) = 134.39
498
81 − 76
t = q = 4.72 > 1.9647 ∈ R
1 1
134.39 ∗ ( 200 + 300 )

On rejette H0 . Le rythme cardiaque en milieu urbain est différent de


celui en milieu rural.

Exercice 3 :
population : disques d’un fabriquant
variable d’intérêt : Xi = 1 si le ième CD présente un défaut, Xi = 0 sinon.
(1) Loi de Xi :
— Xi (Ω) = {0; 1}
3

— Si l’on pose p = P(Xi = 1) =proportion de CD défectueux, Xi ∼


B(p), i.i.d., p inconnue.

E(Xi ) = p, V ar(Xi ) = p(1 − p)


P
nbre de CD défectueux Xi
(2) P̂ = n = n , E(P̂ ) = p. P̂ est sans biais.
(3) — Enoncé simplifié : Le fabriquant affirme que 99% de ses CD sont
sans défaut.

H0 : ”p = 0.01”
H1 : ”p 6= 0.01”

Sous H0 et si n ≥ 30 et np(1 − p) ≥ 10, alors


0.01 × 0.99 P̂ − 0.01
P̂ ∼ N(0.01; ), Z = q ∼ N(0; 1)
n 0.01×0.99
n

R = {|P̂ − 0.01| > c} où c tel que


c
PH0 (|P̂ − 0.01| > c) = 0.05 ⇔ PH0 (|Z| > q ) = 0.05
0.01×0.99
n
c
⇔ PH0 (Z ≤ q ) = 0.975
0.01×0.99
n
c
⇔ q = 1.96
0.01×0.99
n
r
0.01 × 0.99
⇔ c = 1.96 ×
n

Application numérique : n = 5000, x = 100


n = 5000 >q30, 5000 × 0.01 × 0.99 = 49.5 > 10
0.01×0.99
c = 1.96 × 5000 = 0.0028, R = {|p̂ − 0.01| > 0.0028}
100
p̂ = = 0.02, |p̂ − 0.01| = 0.01 > 0.0028, p̂ ∈ R. On rejette H0 .
5000
Au risque de 5%, l’affirmation du fabriquant est fausse.
— Enoncé classique : le fabriquant affirme que plus de 99 % de ces
CD sont sans défaut. Donc le fabricant a tord si on trouve plus de
1% de CD défectueux.

H0 : ”p = 0.01”
H1 : ”p > 0.01”
4

(4) Sous H0 et si n ≥ 30 et np(1 − p) ≥ 10, alors

0.01 × 0.99
P̂ ∼ N(0.01; )
n

(5) R = {P̂ − 0.01 > c} = où c tel que


c
PH0 (P̂ − 0.01 > c) = 0.05 ⇔ PH0 (Z > q ) = 0.05
0.01×0.99
n
c
⇔ PH0 (Z < q ) = 0.95
0.01×0.99
n
c
⇔ q = 1.6449
0.01×0.99
n
r
0.01 × 0.99
⇔ c = 1.6449
n

(6) N = 5000 ≤ 30, np(1 − p) = 5000 ∗ 0.01 ∗ 0.99 = 49.5 ≥ 10


c = 0.0023, R = {P̂ ∗ 0.01 > 0.023}
100
p̂ = 5000 , p̂ − 0.01 = 0.02 − 0.01 = 0.01 > 0.0023, p̂ ∈ R. On rejete H0 .
Le fabriquant a tord.

Exercice 4 :
population : les grains lors d’une étude de sédiments
échantillons : nC = 96, nD = 63
var. intérêts :
— XCi : diamètre du ième grains de l’échantillon C ∼ N(mC , σ 2 ), i.i.d.
— XDi : diamètre du ième grains de l’échantillon D ∼ N(mD , σ 2 ), i.i.d.
mC , mD , σ 2 inconnues.
Cette situation est analogue à celle de l’exercice 2. On veut effectuer une
comparaison entre deux moyennes. On va donc procéder de la même façon :
étape 1 : Définition des hypothèses

H0 : ”mC = mD ”
H1 : ”mC 6= mD ”

étape 2 : Statistique de test

X¯C − X¯D
T =q ∼ TnC +nD −2 = T156 sous H0
Sn2C ,nD ( n1C + 1
nD )
5

étape 3 : Zone de rejet


R = {|T | > c} avec c tel que

PH0 (|T | > c) = 0.05 ⇔ 2PH0 (T > c) = 0.05


⇔ 2 − 2PH0 (T < c) = 0.05
⇔ PH0 (T < c) = 0.975
⇔ c = 1.9719

R = {|T | > 1.9719}

étape 4 : Conclusion

1
s2nC ,nD = (95 ∗ 152 + 61 ∗ 122 ) = 193.3
156

63 − 54
t= q = 3.97 > 1.9719 ∈ R
1 1
193.3( 96 + 62 )

On rejette H0 . La taille moyenne des grains est différente selon l’échantillon


prélevé.5

Exercice 5 :
population : une pièce de monnaie
var. intérêt : Xi = 1 si Pile lors du ième lancé et Xi = 0 sinon. Xi ∼ B(p),
i.i.d. p inconnue.
étape 1 : Définition des hypothèses

1
H0 : ”p = ”
2
1
H1 : ”p 6= ”
2

étape 2 : Statistique de test


n = 660 > 30, 660 ∗ 0.5 ∗ 0.5 = 165 ≥ 5. Donc sous H0 ,

nbre de pile 0.5 ∗ 0.5 P̂ − 0.5


P̂ = = X̄ ∼ N(0.5; )⇔Z= q ∼ N(0; 1)
n 660 0.5∗0.5
660
6

étape 3 : Zone de rejet


R = {|P̂ − 0.5| > c} où c tel que

c
PH0 (|P̂ − 0.5| > c) = 0.05 ⇔ 2PH0 (|Z| > q ) = 0.05
0.5∗0.5
660
c
⇔ P(Z < q ) = 0.975
0.5∗0.5
660
c
⇔ q = 1.96
0.5∗0.5
660
r
0.5 ∗ 0.5
⇔ c = 1.96 × = 0.038
660

R = {|P̂ − 0.5| > 0.038}

étape 4 : Conclusion
p̂ = 312
600 = 0.47, |p̂ − 0.5| = |0.47 − 0.5| = 0.03 < 0.038, p̂ ∈
/R
On ne peut pas rejeter H0 . Rien ne prouve que la pièce n’est pas équilibée.

Exercice 6 :
population : patients atteints par une maladie
échantillons : nA = n, nB = n
var. intérêts :
— Xi : réponse de la variable continue pour le patient i du groupe A,
Xi ∼ N(µ1 , σ 2 ) i.i.d.
— Yi : réponse de la variable continue pour le patient i du groupe B,
Xi ∼ N(µ2 , σ 2 ) i.i.d.
µ1 , µ2 inconnues.
2 2
(1) Sous H0 , X̄ ∼ N(µ1 , σn ), Ȳ ∼ N(µ2 , σn ). Comme les Xi et les Yi sont
indépendantes, X̄ et Ȳ sont indépendantes. Donc X̄ − Ȳ ∼ N( ; ).
E(X̄ − Ȳ ) = E(X̄) − E(Ȳ ) = µ1 − µ2 = 0 puisque µ1 = µ2
2
V ar(X̄−Ȳ ) = V ar(X̄)+V ar(Ȳ ) = 2σn puisque X̄ et Ȳ sont indépendantes.

2σ 2 X̄ − Ȳ
X̄ − Ȳ ∼ N(0; ), Z = q ∼ N(0; 1)
n 2σ 2
n
7

(2) On cherche K0 tel que

K0
PH0 (X̄ − Ȳ > K0 ) = 0.05 ⇔ PH0 (Z > q ) = 0.05
2σ 2
n
K0
⇔ PH0 (Z < q ) = 0.95
2σ 2
n
K
⇔ q 0 = 1.6449
2σ 2
n
r
2σ 2
⇔ K0 = 1.6449
n

(3) µ1 − µ2 = ∆. X̄ et Ȳ sont indépendantes. Donc X̄ − Ȳ ∼ N( ; ).


E(X̄ − Ȳ ) = E(X̄) − E(Ȳ ) = µ1 − µ2 = ∆
2
V ar(X̄−Ȳ ) = V ar(X̄)+V ar(Ȳ ) = 2σn puisque X̄ et Ȳ sont indépendantes.

2σ 2 X̄ − Ȳ − ∆
X̄ − Ȳ ∼ N(∆; ), Z = q ∼ N(0; 1)
n 2σ 2
n

(4) On cherche ∆ > 0 tel que

K0 − ∆
P(X̄ − Ȳ > K0 ) = 0.9 ⇔ P(Z > q ) = 0.9
2σ 2
n
K0 − ∆
=> q < 0
2σ 2
n
∆ − K0
⇔ P(Z < q ) = 0.9
2σ 2
n
∆ − K0
⇔ q = 1.2816
2σ 2
n
r
2σ 2
⇔ ∆ = 1.2816 + K0
n
r r
2σ 2 2σ 2
⇔ ∆ = 1.2816 + 1.6449
n n
r
2σ 2
⇔ ∆ = 2.9265
n
8

(5) ∆ = 4, σ 2 = 100
On cherche n tel que
r
2 ∗ 100
4 ≥ 2.9265
n

n ≥ 107.055

Il faudra donc prendre au moins 108 patients dans chaque groupe pour
avoir un niveau de confiance de 5% et une puissance de 90% dans le
cas où l’écart des moyennes est de 4.

Exercice 7 :
population : les techniciens
échantillons : nA = n, nB = n
var. intérêts :
— Xi : rendement du ième technicien sur la machine A, Xi ∼ N(µ1 ; σ 2 )
i.i.d.
— Yi : rendement du ième technicien sur la machine B, Yi ∼ N(µ2 ; σ 2 )
i.i.d.
µ1 , µ2 inconnues.
(1) E(X̄) = E( n1 ni=1 Xi ) = n1 ni=1 E(Xi ) = µ1 . X̄ est un estimateur
P P
sans biais de µ1 .
De la même façon, E(Ȳ ) = µ2 . Ȳ est un estimateur sans biais de µ2 .
2
(2) Comme les Xi sont indépendantes, V ar(X̄) = n12 ni=1 V ar(Xi ) = σn .
P
2
De la même façon, V ar(X̄) = σn
(3) X̄ (resp.Ȳ ) est la somme de v.a. gaussiennes indépendantes. Donc
σ2
X̄ ∼ N(µ1 ; )
n
σ2
Ȳ ∼ N(µ2 ; )
n
(4) Intervalle de confiance IC1 :
 
σ σ
x̄ − c √ ; x̄ + c √
n n
où P(−c ≤ Z ≤ c) = 0.95, Z ∼ N(0; 1)
P(−c ≤ Z ≤ c) = 0.95 ⇔ 2P(Z < c) − 1 = 0.95
⇔ P(Z < c) = 0.975
⇔ c = 1.96

 
σ σ
IC1 = X̄ − 1.96 √ ; X̄ + 1.96 √
n n
9

De la même fao̧n, on obtient :


 
σ σ
IC2 = Ȳ − 1.96 √ ; Ȳ + 1.96 √
n n
(5) — X̄ < Ȳ , |X̄ − Ȳ | = Ȳ − X̄

σ σ
IC1 ∩ IC2 = ⇔ X̄ + 1.96 √ < Ȳ − 1.96 √
n n
σ
⇔ Ȳ − X̄ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n

— Ȳ < X̄, |X̄ − Ȳ | = X̄ − Ȳ

σ σ
IC1 ∩ IC2 = ⇔ Ȳ + 1.96 √ < X̄ − 1.96 √
n n
σ
⇔ X̄ − Ȳ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n

σ
IC1 ∩ IC2 = ⇔ |X̄ − Ȳ | > δ avec δ = 3.92 √
n
2
(6) Sous H0 , X̄ − Ȳ ∼ N(0; 2σn ) puisque X̄ et Ȳ sont indépendantes.
(7)
σ 3.92
PH0 (|X̄ − Ȳ | > 3.92 √ ) = PH0 (|Z| > √ )
n 2
3.92
= 2PH0 (Z > √ )
2
3.92
= 2 − 2PH0 (Z < √ )
2
= 2 − 2 ∗ 0.997197 = 0.0056
(8) La probabilité de se tromper lorsque l’on rejette H0 est très faible.
Pour un intervalle de confiance de 95%, on obtient un niveau de test
de 0.56%. On aura tendance à trop souvent accepter à tord H0 .

Vous aimerez peut-être aussi