Correction TD4
Correction TD4
Correction TD4
TD de Probabilité et Statistique
Exercice 1 :
Population : individus d’une population de référence
échantillon : n =42 patients
var. intérêt : Xi =glycémie du ième patient∼ N (µ, σ 2 ), µ inconnue
étape 1 : Définition des hypothèses
H0 : ”µ = 1”
H1 : ”µ 6= 1”
α = 0.05
Il faut réaliser un test de comparaison d’une moyenne à une valeur théorique
dans le cas où σ 2 est connue.
étape 2 : Statistique de test
2
X̄ ∼ (1, σn ), Z = X̄−1√σ ∼ N(0; 1) sous H0
n
étape 3 : Zone de rejet
On cherche q > 0 tel que
q
PH0 (|X̄ − 1| > q) = 0.05 ⇔ PH0 (|Z| > ) = 0.05
√σ
n
q
⇔ 2PH0 (Z > ) = 0.05
√σ
n
q
⇔ 2 − 2PH0 (Z < ) = 0.05
√σ
n
q
⇔ PH0 (Z < ) = 0.975
√σ
n
q
⇔ = 1.96
√σ
n
⇔ q = 0.03
Exercice 2 :
population : individus vivant en milieu rural ou en milieu urbain
échantillons : NU = 200, NR = 300
var d’intérêts :
— XU i : rythme cardiaque du ième individu vivant en milieu urbain
∼ N(mU , σ 2 ) i.i.d.
— XRi : rythme cardiaque du ième individu vivant en milieu rural ∼
N(mR , σ 2 ) i.i.d.
mU , mR , σ 2 sont inconnues
(1)
H0 : ”mU = mR ”
H1 : ”mU > mR ”
Exercice 3 :
population : disques d’un fabriquant
variable d’intérêt : Xi = 1 si le ième CD présente un défaut, Xi = 0 sinon.
(1) Loi de Xi :
— Xi (Ω) = {0; 1}
3
H0 : ”p = 0.01”
H1 : ”p 6= 0.01”
H0 : ”p = 0.01”
H1 : ”p > 0.01”
4
0.01 × 0.99
P̂ ∼ N(0.01; )
n
Exercice 4 :
population : les grains lors d’une étude de sédiments
échantillons : nC = 96, nD = 63
var. intérêts :
— XCi : diamètre du ième grains de l’échantillon C ∼ N(mC , σ 2 ), i.i.d.
— XDi : diamètre du ième grains de l’échantillon D ∼ N(mD , σ 2 ), i.i.d.
mC , mD , σ 2 inconnues.
Cette situation est analogue à celle de l’exercice 2. On veut effectuer une
comparaison entre deux moyennes. On va donc procéder de la même façon :
étape 1 : Définition des hypothèses
H0 : ”mC = mD ”
H1 : ”mC 6= mD ”
X¯C − X¯D
T =q ∼ TnC +nD −2 = T156 sous H0
Sn2C ,nD ( n1C + 1
nD )
5
étape 4 : Conclusion
1
s2nC ,nD = (95 ∗ 152 + 61 ∗ 122 ) = 193.3
156
63 − 54
t= q = 3.97 > 1.9719 ∈ R
1 1
193.3( 96 + 62 )
Exercice 5 :
population : une pièce de monnaie
var. intérêt : Xi = 1 si Pile lors du ième lancé et Xi = 0 sinon. Xi ∼ B(p),
i.i.d. p inconnue.
étape 1 : Définition des hypothèses
1
H0 : ”p = ”
2
1
H1 : ”p 6= ”
2
c
PH0 (|P̂ − 0.5| > c) = 0.05 ⇔ 2PH0 (|Z| > q ) = 0.05
0.5∗0.5
660
c
⇔ P(Z < q ) = 0.975
0.5∗0.5
660
c
⇔ q = 1.96
0.5∗0.5
660
r
0.5 ∗ 0.5
⇔ c = 1.96 × = 0.038
660
étape 4 : Conclusion
p̂ = 312
600 = 0.47, |p̂ − 0.5| = |0.47 − 0.5| = 0.03 < 0.038, p̂ ∈
/R
On ne peut pas rejeter H0 . Rien ne prouve que la pièce n’est pas équilibée.
Exercice 6 :
population : patients atteints par une maladie
échantillons : nA = n, nB = n
var. intérêts :
— Xi : réponse de la variable continue pour le patient i du groupe A,
Xi ∼ N(µ1 , σ 2 ) i.i.d.
— Yi : réponse de la variable continue pour le patient i du groupe B,
Xi ∼ N(µ2 , σ 2 ) i.i.d.
µ1 , µ2 inconnues.
2 2
(1) Sous H0 , X̄ ∼ N(µ1 , σn ), Ȳ ∼ N(µ2 , σn ). Comme les Xi et les Yi sont
indépendantes, X̄ et Ȳ sont indépendantes. Donc X̄ − Ȳ ∼ N( ; ).
E(X̄ − Ȳ ) = E(X̄) − E(Ȳ ) = µ1 − µ2 = 0 puisque µ1 = µ2
2
V ar(X̄−Ȳ ) = V ar(X̄)+V ar(Ȳ ) = 2σn puisque X̄ et Ȳ sont indépendantes.
2σ 2 X̄ − Ȳ
X̄ − Ȳ ∼ N(0; ), Z = q ∼ N(0; 1)
n 2σ 2
n
7
K0
PH0 (X̄ − Ȳ > K0 ) = 0.05 ⇔ PH0 (Z > q ) = 0.05
2σ 2
n
K0
⇔ PH0 (Z < q ) = 0.95
2σ 2
n
K
⇔ q 0 = 1.6449
2σ 2
n
r
2σ 2
⇔ K0 = 1.6449
n
2σ 2 X̄ − Ȳ − ∆
X̄ − Ȳ ∼ N(∆; ), Z = q ∼ N(0; 1)
n 2σ 2
n
K0 − ∆
P(X̄ − Ȳ > K0 ) = 0.9 ⇔ P(Z > q ) = 0.9
2σ 2
n
K0 − ∆
=> q < 0
2σ 2
n
∆ − K0
⇔ P(Z < q ) = 0.9
2σ 2
n
∆ − K0
⇔ q = 1.2816
2σ 2
n
r
2σ 2
⇔ ∆ = 1.2816 + K0
n
r r
2σ 2 2σ 2
⇔ ∆ = 1.2816 + 1.6449
n n
r
2σ 2
⇔ ∆ = 2.9265
n
8
(5) ∆ = 4, σ 2 = 100
On cherche n tel que
r
2 ∗ 100
4 ≥ 2.9265
n
√
n ≥ 107.055
Il faudra donc prendre au moins 108 patients dans chaque groupe pour
avoir un niveau de confiance de 5% et une puissance de 90% dans le
cas où l’écart des moyennes est de 4.
Exercice 7 :
population : les techniciens
échantillons : nA = n, nB = n
var. intérêts :
— Xi : rendement du ième technicien sur la machine A, Xi ∼ N(µ1 ; σ 2 )
i.i.d.
— Yi : rendement du ième technicien sur la machine B, Yi ∼ N(µ2 ; σ 2 )
i.i.d.
µ1 , µ2 inconnues.
(1) E(X̄) = E( n1 ni=1 Xi ) = n1 ni=1 E(Xi ) = µ1 . X̄ est un estimateur
P P
sans biais de µ1 .
De la même façon, E(Ȳ ) = µ2 . Ȳ est un estimateur sans biais de µ2 .
2
(2) Comme les Xi sont indépendantes, V ar(X̄) = n12 ni=1 V ar(Xi ) = σn .
P
2
De la même façon, V ar(X̄) = σn
(3) X̄ (resp.Ȳ ) est la somme de v.a. gaussiennes indépendantes. Donc
σ2
X̄ ∼ N(µ1 ; )
n
σ2
Ȳ ∼ N(µ2 ; )
n
(4) Intervalle de confiance IC1 :
σ σ
x̄ − c √ ; x̄ + c √
n n
où P(−c ≤ Z ≤ c) = 0.95, Z ∼ N(0; 1)
P(−c ≤ Z ≤ c) = 0.95 ⇔ 2P(Z < c) − 1 = 0.95
⇔ P(Z < c) = 0.975
⇔ c = 1.96
σ σ
IC1 = X̄ − 1.96 √ ; X̄ + 1.96 √
n n
9
σ σ
IC1 ∩ IC2 = ⇔ X̄ + 1.96 √ < Ȳ − 1.96 √
n n
σ
⇔ Ȳ − X̄ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n
σ σ
IC1 ∩ IC2 = ⇔ Ȳ + 1.96 √ < X̄ − 1.96 √
n n
σ
⇔ X̄ − Ȳ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n
σ
IC1 ∩ IC2 = ⇔ |X̄ − Ȳ | > δ avec δ = 3.92 √
n
2
(6) Sous H0 , X̄ − Ȳ ∼ N(0; 2σn ) puisque X̄ et Ȳ sont indépendantes.
(7)
σ 3.92
PH0 (|X̄ − Ȳ | > 3.92 √ ) = PH0 (|Z| > √ )
n 2
3.92
= 2PH0 (Z > √ )
2
3.92
= 2 − 2PH0 (Z < √ )
2
= 2 − 2 ∗ 0.997197 = 0.0056
(8) La probabilité de se tromper lorsque l’on rejette H0 est très faible.
Pour un intervalle de confiance de 95%, on obtient un niveau de test
de 0.56%. On aura tendance à trop souvent accepter à tord H0 .