STAT1001-1 (AF Donneau 2021-2022) - Cours 4-8
STAT1001-1 (AF Donneau 2021-2022) - Cours 4-8
STAT1001-1 (AF Donneau 2021-2022) - Cours 4-8
Professeur
Université de Liège
1 / 33
2 / 33
Quizz Cours 3 -
Voici la matrice corrélation entre 6 variables calculée à partir des données de
16 athlètes.
Age Poids Taille BMI Fréq. Glucose
cardiaque
Age 1.00
Poids 0.54 1.00
Taille −0.12 0.16 1.00
BMI 0.53 0.74 −0.54 1.00
Fréq. cardiaque −0.87 −0.28 0.14 −0.33 1.00
Glucose −0.44 0.0033 −0.11 0.10 0.54 1.00
Quizz Cours 3 -
Sur base des résultats repris ci-dessous, que peut-on déduire concernant les
distributions des variables Age et tour de taille (TTAILLE) ?
Pearson = si variables suivent
une distribution normale
a Les distributions des variables Age et TTAILLE suivent une loi Normale.
b La variable Age et/ou la variable TTAILLE ne suit (suivent) pas une
distribution Normale.
c On ne sait rien déduire sur les distributions de ces variables.
d La variable TTAILLE est qualitative ordinale.
4 / 33
Quizz Cours 3 -
5 / 33
Quizz Cours 3 -
Variable fixée, pas observée simultanément.
On ne peut donc pas utiliser un coefficient de corrélation.
On doit appliquer une régression.
6 / 33
Quizz Cours 3 -
7 / 33
Agenda
Date Matière
24/09 Introduction
01/10 Paramètres de position et de dispersion
08/10 Association
15/10 Intervalle de confiance
01/10 Paramètres de position et de dispersion
22/10 Test d’hypothèses - corrélation - normalité
29/10 Test d’hypothèses - table 2 × 2
05/11 Test d’hypothèses - variable quantitative (I)
12/11 Test d’hypothèses - variable quantitative (II)
8 / 33
Intervalle de confiance - Objectifs
9 / 33
Statistique inférentielle
11 / 33
Les lettres grecques font référence pour un paramètre de position ou de dispersion de la population
12 / 33
Paramètres de population (2)
13 / 33
Echantillonnage (1)
14 / 33
Echantillonnage (2)
15 / 33
x̄ estime µ
p estime π
s estime σ
r estime ρ
..
.
16 / 33
Echantillon et estimation (2)
17 / 33
Théorie de l’échantillonnage
Résultat 1 : La moyenne des x̄i ,
P
x̄i
= µ.
N(n)
18 / 33
Variabilité d’échantillonnage (2)
s
SE (x̄) = √
n
r
p(1 − p)
SE (p) =
n
s
SE (Médiane) = 1.25 √
n
1 − r2
SE (r ) = √
n
qX
SE (b1 ) = sy |x / (x − x̄)2
20 / 33
Variabilité d’échantillonnage - Exemples
21 / 33
22 / 33
Variabilité d’échantillonnage (5)
Mais ce qui nous intéresse c’est de définir un intervalle pour µ et non pour x̄ !
23 / 33
24 / 33
Intervalle de confiance (2)
σ σ
x̄ − 1.96 √ ≤ µ ≤ x̄ + 1.96 √
n n
σ est inconnu ? mais il peut être estimé par s.
s s
x̄ − 1.96 √ ≤ µ ≤ x̄ + 1.96 √ 95% de chance que l’intervalle
n n recouvre la vraie valeur
Dans 95% des cas (c-à-d dans 95% des échantillons extraits de la
s
population), la fourchette x̄ ± 1.96 √ recouvre µ.
n
Simulation VESTAC : http://lstat.kuleuven.be/java/
25 / 33
Dans 95% des cas (c-à-d dans 95% des échantillons extraits de la
population), la fourchette θ̂ ± 1.96 × SE (θ̂) recouvre θ.
26 / 33
Intervalle de confiance (4)
27 / 33
s s
x̄ − 1.96 √ ≤ µ ≤ x̄ + 1.96 √
n n
5.84 5.84
34.46 − 1.96 √ ≤ µ ≤ 34.46 + 1.96 √
216 216
34.46 − 1.96 × 0.396 ≤ µ ≤ 34.46 + 1.96 × 0.396
33.68g /l ≤ µ ≤ 35.24g /l
28 / 33
Intervalle de confiance - Exemples (2)
Asthme (oui - non) : n = 80 p = 13/80 = 0.16
r
0.16(1 − 0.16)
SE (p) = = 0.039
80
Que vaut l’intervalle de confiance à 95% de la proportion d’asthmatiques ?
r r
p(1 − p) p(1 − p)
p − 1.96 ≤ π ≤ p + 1.96
n n
r r
0.16(1 − 0.16) 0.16(1 − 0.16)
0.16 − 1.96 ≤ π ≤ 0.16 + 1.96
80 80
0.16 − 1.96 × 0.039 ≤ π ≤ 0.16 + 1.96 × 0.039
0.08356 ≤ π ≤ 0.2364
30 / 33
Intervalle de confiance - Littérature (2)
Moyenne et écart type = distribution normale
31 / 33
Intervalle de confiance - n
Dans l’exemple précédent, combien de femmes ont été prises en compte dans
le calcul de l’IC95% de la moyenne d’âge ?
7.36
62.61 = 63.57 − 1.96 √
n
n = ?
32 / 33
Intervalle de confiance - Objectifs
33 / 33
Biostatistique I - STAT1001-1
Cours 5 - Test d’hypothèses
Professeur
Université de Liège
1 / 53
2 / 53
Quizz Cours 4 -
3 / 53
Quizz Cours 4 -
4 / 53
Quizz Cours 4 -
Des chercheurs ont étudié le poids d’une tumeur de petite taille prélevée lors
d’une intervention chirurgicale. Ils ont montré que l’intervalle de confiance à
95% pour le poids moyen des tumeurs était égale à [54.02g − 58.38g ]. Quel
est le poids moyen des tumeurs estimé par les chercheurs ?
a 55.36g
b 56.20g
c 48.15g
d Impossible de répondre sans plus d’informations
5 / 53
Quizz Cours 4 -
6 / 53
Quizz Cours 4 -
a [21.7% − 30.3%]
b [21.7% − 50.3%]
c [35.2% − 50.3%]
d Impossible de répondre sans plus d’informations
7 / 53
Quizz Cours 4 -
Fireman et al. ont étudié la prévalence de différents troubles obsessionnels
compulsifs (TOC). A partir de ces résultats, on peut conclure que :
Date Matière
24/09 Introduction
01/10 Paramètres de position et de dispersion
08/10 Association
15/10 Intervalle de confiance
22/10 Test d’hypothèses - corrélation - normalité
29/10 Test d’hypothèses - table 2 × 2
05/11 Test d’hypothèses - variable quantitative (I)
12/11 Test d’hypothèses - variable quantitative (II)
9 / 53
12 / 53
Test d’hypothèses - Tests d’hypothèses
Exemple :
• L’ajout de la molécule A améliore l’efficacité du traitement contre
l’hypertension ?
• Les femmes fument-elles plus que les hommes ?
• Y a-t-il une association entre le cancer du poumon et l’exposition à des
substances toxiques ?
• Est-ce que le nouvel exercice de récupération mis en place pour les
cyclistes est efficace ?
13 / 53
Etape 6 Conclusion
14 / 53
Test d’hypothèses - Etape 1
Le but de la statistique inférentielle c’est d’avoir des statistiques sur la population et pas sur l’échantillon
Les hypothèses
• H0 : µ1 = µ2 vs H1 : µ1 6= µ2
• H0 : π1 = π2 vs H1 : π1 6= π2
• H0 : ρ = 0 vs H1 : ρ 6= 0
Pour montrer la différence on va partir de l’hypothèse que l’on a une égalité et on essaie de la rejeter. On tente de rejeter H0.
Hypothèse H1 c’est l’opposé, de plus général. Ici : ce n’est pas une égalité.
15 / 53
Il faut identifier les données qui ont un intérêt et savoir si elles sont dans la bonne forme. (par exemple en facteur)
Les données
16 / 53
Test d’hypothèses - Etape 3
Le niveau d’incertitude
17 / 53
Distibution t de Student. t peut être négatif ou positif Ici que des t positifs.
19 / 53
Le seuil de décision
En fonction de la loi utilisée, une “zone de rejet” (en rouge) pour H0 peut être
définie en déterminant un seuil de décision. Les seuils de décision sont obtenus dans
les tables statistiques (fin livre d’exercices).
On ne peut pas choisir. On procède par l’absurde en se disant que c’est une égalité.
A cette étape on décide si on garde ou si on réfute H0.
Si la valeut t est dans la zone de rejet on peut rejeter H0. Si on est en dehors on ne pourra pas le rejeter
20 / 53
Test d’hypothèses - Etape 5 (2)
21 / 53
La conclusion
Si P est inférieur à 0,05 (5%) on peut rejeter H0. -> statistiquement significatif
Si ce n’est pas le cas on ne peut pas rejeter H0. -> non significatif
Pour faire la conclusion il faut connaitre les hypothèses et savoir lire un résultat de P.
22 / 53
Test d’hypothèses - P-valeur
23 / 53
α/2 α/2
-T T
-T T 24 / 53
Test d’hypothèses - P-valeur (Exemple)
25 / 53
Il n’y a pas de
différence
significative
entre les
groupe au
niveau de
l’exposition au
soleil durant
l’année
26 / 53
Test d’hypothèses - Tests à voir
Proportions (X binaires)
H0 : π1 = π2
Indépendantes Appariées
test χ² (ν = 1) test Mc Nemar (ν = 1)
27 / 53
28 / 53
Test d’hypothèses - Corrélation (Rappel)
29 / 53
33 / 53
38 / 53
Test d’hypothèses - Littérature (3) - Dans le texte
39 / 53
SD
95%
2.5% 2.5%
x−1.96SD x x+1.96SD X
40 / 53
Rappel sur la loi Normale (1)
41 / 53
●
35
●
●
●
●
●●
●
●
● ●●
Sample Quantiles
●
●
●
30
●●
●
●●
●●
●
●
●●●●
●●
●●
●
●
●
25
● ●
−2 −1 0 1 2
Theoretical Quantiles
Si la variable X suit une distribution Normale, les points du Q-Q plot doivent
être (approximativement) alignés selon une ligne droite.
42 / 53
Rappel sur la loi Normale (3)
On teste la Normalité
• des variables quantitatives
• pour vérifier les conditions d’application des tests d’hypothèses
Outils à disposition :
43 / 53
X log(X)
45 / 53
ALT log(ALT)
70
● ●
●
●
●
4.0
●●●
● ●●●●
60
●
●●
●●
●
●●
●
●
●
●
●●
●
●
Sample Quantiles
●●
Sample Quantiles
● ●
●●
●
●
● ●●
●
●
●●
●
3.5
●●● ●●
50
●●
●
●
● ●●
●
●
● ●
●●
●
●
● ●
● ●
●
●
●
● ●
●●
●
●●
●
●
● ●
●
●
● ●
●
●
●
40
3.0
●
●
● ●
●●
●
●
●
●
●
● ●
●●
●
●
●●
●
●
● ●
●●
●
●●
●
●
●● ●
●
●●
●
●
●
●
●●
●
● ●
●
●
●●
● ●
●
●●
●
●
●
● ●●
●
●●
●●
●
30
●●
● ●
●●
●●
●
●
● ●
●
●●
●●
●
●
●●
2.5
● ●●
●
●●
●
●
●●
●
●
●
●
●
●●
●
●● ●
●●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
● ●●
●
●
●
●●
●
●
●
20
●
●●
●
●
●●
● ●
●●
●
●●
●
●●
●
●
●
●●
●
●
●
●
●● ●●●●
●
●
●
●●
●
●
2.0
●●
●
●●
●
●●
●●
●
● ●
●
●
●●
●●
●
●●
●
●●
●
●
●●
●
●
●●
●
●●
●
●●
●
●
10
●●
●
● ● ●●
●
●●
●●●●
●
●
● ●●
● ●
−3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3
46 / 53
Normalité : Les variables qui sont connues pour ne
pas avoir une distribution Normale
47 / 53
• Grand effectif : On rejettera “presque toujours” H0 (le moindre écart est detecté)
Une p valeur c’est bien mais il faut aussi regarder les chiffres. Une corrélation
peut être statistiquement significative mais non relevante au niveau clinique.
48 / 53
Normalité : La présence de valeurs aberrantes (1)
20
15
Age (années) - n=224
percent
10
18.48
5
22.03
0
20 30 40 50 60 70
22.24 Age (années)
70
●
● ●
60
. ●●●●●●
●●●
●●●
●
Sample Quantiles
●●
●
●●
●●
●
●●
●
●
●
50
●
●●
●
●●
●●
●●
●
●
. ●
●
●●
●
●●
●
●●
●
●●
●
●
●●
●
●
●●
●
●●
●
●
●●
●
●
●●
●
●●
●
●
●●
●
●
●●
●●
●
●
●●
●
●
●●
●
●
●●
●
●
●●
●●
40
●
●
●●
●●●
●
●
●
●●
●
●
●●
●
●
●●
●
●
●●
●
●
●
61.22 ●
●●
●
●
●●
●
●
●●
●
●●
●
●
●●
●
●●
●
●●
●
●
●●
●
●●
●
●
●
●
●●
●
●
30
●
●●
●●
●
●●
●●
●
●●
●●
●●
●●
●
●●
●
●●●●
61.30
●
●●●
●●●
● ● ● ●●
20
68.49 −3 −2 −1 0 1 2 3
Theoretical Quantiles
49 / 53
20
18.48
10
22.03
0
0 50 100 150
22.24 Age (années)
. ●
150
.
Sample Quantiles
100
.
61.22 ●
●●
●●
●●●●●●●●●●●●
●● ● ● ●
50
●●
●●
●
●●
●●
●
●●●
●
●●
●
●●
●
●
●●
●
●●
●
●
●●
●
●●
●
●●
●
●●
●
●●
●
●●
●
●●
●
●
●●
●
●
●●
●●
●
●
●●
● ●
●
●●
●
●
●●●
●
●
●
●
●●
●
●●
●●
●●
●
●●
●●
●
●
●●
●
●
●●
●
●
●●
●
●
●●
●
●
●●
●
●
●●
●
●
●
●
●
●●
●
●
●●
●
●●
●
●
●●
●
●●
●
●
●●
●
●●
●●
●
●●
●●
●
●●
●●
●
●●
●
●●
●
●
●●●
●●
●●
●●
●●●●
● ● ● ●●●●●●●●
61.30 ●
−3 −2 −1 0 1 2 3
50 / 53
Test d’hypothèses - Objectifs
A la fin de cette leçon, vous devrez être capables de :
52 / 53
Test d’hypothèses- Rcmdr Normalité
53 / 53
Biostatistique I - STAT1001-1
Cours 6 - Test d’hypothèses - Table 2 × 2
Professeur
Université de Liège
1/1
2/1
Quizz Cours 5 -
L’application d’un test d’hypothèses sur une base de données fournit une
P-valeur égale à p = 0.19. Quelle est la conclusion de ce test d’hypothèses ?
3/1
Quizz Cours 5 -
4/1
Quizz Cours 5 -
Quizz Cours 5 -
Sur base des résultats repris ci-dessous, quelles hypothèses pourraient être
testées par les auteurs pour obtenir la p-valeur associée à l’association des
variables Age et tour de taille ?
6/1
Agenda
Date Matière
24/09 Introduction
01/10 Paramètres de position et de dispersion
08/10 Association
15/10 Intervalle de confiance
22/10 Test d’hypothèses - corrélation - normalité
29/10 Test d’hypothèses - table 2 × 2
05/11 Test d’hypothèses - variable quantitative (I)
12/11 Test d’hypothèses - variable quantitative (II)
7/1
Proportions (X binaires)
H0 : π1 = π2
Indépendantes Appariées
test χ² (ν = 1) test Mc Nemar (ν = 1)
8/1
Table 2 × 2 - Objectifs
9/1
Table 2 × 2 - Tests
On va utiliser des proportions et il faut des valeurs binaires
H0 : π1 = π2 vs H1 : π1 6= π2 H0 : π1 = π2 vs H1 : π1 6= π2
10 / 1
Table 2 × 2 - Tests
H0 : π1 = π2 vs H1 : π1 6= π2 H0 : π1 = π2 vs H1 : π1 6= π2
11 / 1
12 / 1
Table 2 × 2 - Test d’homogénéité (Exemple)
Des patients schizophrènes ont été traités pendant 2 ans avec soit du Risperidone
(n1 = 137) soit de l’Olanzapine (n2 = 129). La variable X indique si le patient a dû
être hospitalisé (oui/non) durant les deux années de traitement.
Traitement
Hospitalisation Risperidone Olanzapine Total
Non 72 80 152
Oui 65 49 114
Total 137 129 266
13 / 1
(ad − bc)2 n
4. Test : T =
(a + b)(c + d)(a + c)(b + d)
Sous H0 , T est distribué comme un Chi-carré à ν = 1 dl
Traitement
Hospitalisation Risperidone Olanzapine Total
Non 72 80 152
Oui 65 49 114
Total 137 129 266
15 / 1
17 / 1
18 / 1
Table 2 × 2 - Test
19 / 1
Condition 2
Condition 1 X =0 X =1
X =0 a b a+b
X =1 c d c +d
a+c b+d n
156 patients souffrant de sténose spinale lombaire ont subi une intervention
chirurgicale. La capacité de ces patients à marcher plus de 500 m a été observée
avant et après l’intervention.
Après
Avant < 500 m > 500 m Total
< 500 m 56 37 93
> 500 m 20 43 63
Total 76 80 156
21 / 1
(|b − c| − 1)2
4. Test : T =
b+c
Sous H0 , T est distribué comme un Chi-carré à ν = 1 dl
Après
Avant < 500 m > 500 m Total
< 500 m 56 37 93
> 500 m 20 43 63
Total 76 80 156
pAvant = 0.404(63/156)
pApres = 0.513(80/156)
23 / 1
1. Hypothèses : H0 : π1 = π2 vs H1 : π1 6= π2
où π1 est la proportion de sujets capables
de marcher > 500 m avant l’intervention
où π2 est la proportion de sujets capables
de marcher > 500 m après l’intervention
25 / 1
Table 2 × 2 - Objectifs
26 / 1
Table 2 × 2 - Rcmdr (1/2)
Test d’homogénéité - Base de données disponible
27 / 1
28 / 1
Test d’hypothèses - Tests à voir
Proportions (X binaires)
H0 : π1 = π2
Indépendantes Appariées
test χ² (ν = 1) test Mc Nemar (ν = 1)
29 / 1
Biostatistique I - STAT1001-1
Cours 7 - Test d’hypothèses - variable
quantitative (I)
Professeur
Université de Liège
1 / 33
2 / 33
Quizz Cours 6 -
3 / 33
Quizz Cours 6 -
Dans cet article, quel test d’hypothèses a été appliqué par les auteurs pour
comparer l’acceptation du régime diététique par la famille du patient avant et
après l’intervention ?
4 / 33
Quizz Cours 6 -
Avant
Après Succès Echec Total
Succès 25 35 60
Echec 5 35 40
Total 30 70 100
a 25%
b 30% Avant le cours 30%
c 60%
d 40%
5 / 33
Quizz Cours 6 -
a 63/(145+63)
b 63/(378+63)
c 63/(697+208)
d 63
6 / 33
Quizz Cours 6 -
A partir de cette table, quelle est la proportion de hommes parmi les sujets
supplémentés en vitamine D ?
a 63/(145+63)
b 63/(378+63)
c 63/(697+208)
d 63
7 / 33
Quizz Cours 6 -
Avant
Après Succès Echec Total
Succès 25 35 60
Echec 5 35 40
Total 30 70 100
a H0 : p1 = p2 vs H1 : p1 6= p2
b H0 : π1 = π2 vs H1 : π1 6= π2
c H0 : 30% = 60% vs H1 : 30% 6= 60%
d Il n’a pas besoin d’appliquer un test d’hypothèses
8 / 33
Quizz Cours 6 -
Sur base de cette table, que peut-on conclure pour l’intervention mise en
place ?
Agenda
Date Matière
24/09 Introduction
01/10 Paramètres de position et de dispersion
08/10 Association
15/10 Intervalle de confiance
22/10 Test d’hypothèses - corrélation - normalité
30/10 Test d’hypothèses - table 2 × 2
05/11 Test d’hypothèses - variable quantitative (I)
12/11 Test d’hypothèses - variable quantitative (II)
10 / 33
Test d’hypothèses - Tests à voir
Proportions (X binaires)
H0 : π1 = π2
Indépendantes Appariées
test χ² (ν = 1) test Mc Nemar (ν = 1)
11 / 33
12 / 33
Comparaison de 2 moyennes - Tests
13 / 33
14 / 33
Comparaison de 2 moyennes indépendantes - test t - Student
2 conditions d’applications :
1) La variable x doit avoir une distribution normale dans les 2 groupes.
2) Homoscédasticité. La variable x a la même variabilité dans chaque groupe. (La courbe/cloche doit avoir la même forme)
15 / 33
Age (années)
Patients avec traumatisme crânien
Bonne récupération Incapacité sévère
16 / 33
Comparaison de 2 moyennes indépendantes - test t - Student
1. Hypothèses : H0 : µ1 = µ2 vs H1 : µ1 6= µ2
où µ1 est la moyenne de X dans P1
où µ2 est la moyenne de X dans P2
4. Test : s
x̄ − x̄2 (n1 − 1)s12 + (n2 − 1)s22
T = q1 sp =
sp n11 + n12 n1 + n2 − 2
Age (années)
Patients avec traumatisme crânien
Bonne récupération Incapacité sévère
38 29
19 9
17 14
16 3
28 24
12 19
11 23
19 23
18
17
8
11
7
n1 = 13 n2 = 8
x̄1 = 17 x̄2 = 18
s1 = 8.42 s2 = 8.70
18 / 33
Comparaison de 2 moyennes indépendantes - test t - Student (exemple)
1. Hypothèses : H0 : µ1 = µ2 vs H1 : µ1 6= µ2
Age (années)
où µ1 est l’âge moyen des patients en bonne
Patients avec traumatisme crânien récupération
Bonne récupération Incapacité sévère où µ2 est l’âge moyen des patients en incapacité
sévère
Variable binaire : bonne
38 29 2. Données : Voir bas table récupération ou pas. Il
19 9 faut donc en faire des
17 14 3. Niveau d’incertitude : α = 0.05 facteurs.
16 3 4. Test :
28 24 q
12 19 sp = (12 × 8.422 + 7 × 8.702 )/19 = 8.52
11 23
19 23 17 − 18
18 T = q = −0.26
1 1
17 8.52 13 + 8
8 ν = 13 + 8 − 2 = 19
11
7
5. P-Valeur : p = 0.80
n1 = 13 n2 = 8 6. Décision : Puisque p > 0.05, on ne peut
x̄1 = 17 x̄2 = 18 pas rejetter H0 . Il n’y a donc pas de différence
s1 = 8.42 s2 = 8.70 significative au niveau de l’âge entre les deux
groupes de patients.
19 / 33
La glycémie est significativement plus élevée dans le groupe où la maladie est active. 20 / 33
Comparaison de 2 moyennes indépendantes - test t - Student (condition)
Rcmdr :
21 / 33
Si X est ordinale
• Utiliser un test non-paramétrique ⇒ Mann-Whitney
22 / 33
Comparaison de 2 moyennes indépendantes - Mann-Whitney (Exemple)
La durée de vie est-elle comparable entre les patients atteints d’un cancer de
l’estomac et les patients atteints d’un cancer du sein ?
23 / 33
24 / 33
Comparaison de 2 moyennes indépendantes - Mann-Whitney
1. Hypothèses : H0 : Médiane1 = Médiane2 vs H1 : Médiane1 6= Médiane2
où Médiane1 est la médiane de X dans P1
où Médiane2 est la médiane de X dans P2
4. Test :
• Supposons que n1 ≤ n2
• Trier les n1 + n2 observations par ordre croissant et attribuer des rangs
• T = Somme des rangs des n1 observations de l’échantillon 1
• Calculer U = T − n1 (n1 + 1)/2
• On obtient une statistique U (U = test de Mann-Whitney)
26 / 33
Comparaison de 2 moyennes indépendantes - Mann-Whitney (Exemple)
27 / 33
28 / 33
Comparaison de 2 moyennes indépendantes - Mann-Whitney (Littérature)
Non-paramétrique = box-plot
30 / 33
Variable quantitative (I) - Objectifs
31 / 33
Test de Mann-Whitney
32 / 33
Test d’hypothèses - Tests à voir
Proportions (X binaires)
H0 : π1 = π2
Indépendantes Appariées
test χ² (ν = 1) test Mc Nemar (ν = 1)
33 / 33
Biostatistique I - STAT1001-1
Cours 8 - Test d’hypothèses - variable
quantitative (II)
Professeur
Université de Liège
1 / 34
2 / 34
Quizz Cours 7 -
Quel test est le plus approprié pour comparer X entre les deux groupes ?
a Test de Mann-Whitney
b Test t-Student
c Corrélation nulle de Spearman
d Corrélation nulle de Pearson
3 / 34
Quizz Cours 7 -
Dans cet article, quelle est l’hypothèse nulle testée par les auteurs pour
comparer l’âge entre les deux groupes de sujets ?
a H0 : ρ = 0
b H0 : µ1 = µ2
c H0 : Médiane1 = Médiane2
d H 0 : π1 = π2
4 / 34
Quizz Cours 7 -
Sur base des informations disponibles dans cette table, quelle était la décision
des auteurs vis-à-vis de l’hypothèse nulle (H0 : Médiane1 = Médiane2 ) ?
a Rejet de H0 , les sujets supplémentés sont significativement plus âgés que
les non-supplémentés
b Rejet de H0 , les sujets non-supplémentés sont significativement plus âgés
que les supplémentés
c On ne peut pas rejeter H0
d Impossible à dire sans avoir les données complétes
5 / 34
Quizz Cours 7 -
Sur base des informations disponibles dans cette table, que peut-on conclure ?
a Le nombre moyen de médicaments prescrits (Mdrugs) est significativement
plus élevé chez les hommes.
b Le nombre moyen de médicaments prescrits (Mdrugs) est significativement
plus élevé chez les femmes.
c Le nombre moyen de médicaments prescrits (Mdrugs) est indépendant du sexe.
d Impossible à dire.
6 / 34
Agenda
Date Matière
24/09 Introduction
01/10 Paramètres de position et de dispersion
08/10 Association
15/10 Intervalle de confiance
22/10 Test d’hypothèses - corrélation - normalité
30/10 Test d’hypothèses - table 2 × 2
05/11 Test d’hypothèses - variable quantitative (I)
12/11 Test d’hypothèses - variable quantitative (II)
7 / 34
Proportions (X binaires)
H0 : π1 = π2
Indépendantes Appariées
test χ² (ν = 1) test Mc Nemar (ν = 1)
8 / 34
Variable quantitative (II) - Objectifs
9 / 34
10 / 34
Comparaison de 2 moyennes - Tests
11 / 34
• Une variable quantitative X est mesurée à deux reprises sur les individus
d’une même population.
• Mesures répétées / X est mesurée dans différentes “conditions
expérimentales”
• Existe-t-il une différence entre les “conditions expérimentales” ?
⇒ Comparaison des moyennes dans les différentes “conditions
expérimentales”
Exemples :
1. Mesure de la pression artérielle systolique d’un groupe de patients en position
assise et debout
2. Recensement du nombre de patients hospitalisés dans plusieurs hôpitaux au
printemps-été et en automne-hiver.
12 / 34
Comparaison de 2 moyennes appariées - test t Student
13 / 34
14 / 34
Comparaison de 2 moyennes appariées - test t Student
1. Hypothèses : H0 : µ1 = µ2 (∆ = 0) vs H1 : µ1 6= µ2 (∆ 6= 0)
où µ1 est la moyenne de X dans C1
où µ2 est la moyenne de X dans C2
4. Test : d¯ √
T = n
sd
Sous H0 , T est distribué comme un Student t-test avec ν = n − 1 df
16 / 34
Comparaison de 2 moyennes appariées - test t Student (exemple)
17 / 34
18 / 34
Comparaison de 2 moyennes appariées - test t Student (Littérature)
19 / 34
20 / 34
Comparaison 2 populations appariées - Rangs signés Wilcoxon
La normalité doit être vérifier sur la différence. Pas besoin de vérifier pour les 3 colonnes.
21 / 34
22 / 34
Comparaison 2 populations appariées - Rangs signés Wilcoxon (exemple)
●
4
2.0
Sample Quantiles
3
Frequency
1.5
●
2
1.0
● ●
1
0.5
●
● ●
●
0
0.0 0.5 1.0 1.5 2.0 2.5 −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5
23 / 34
4. Test :
• Calculer les différences di = xi1 − xi2 (i = 1, . . . , n)
• Eliminer les différences nulles éventuelles, corriger n
• Trier les valeurs absolues |di | par ordre croissant
• Attribuer un rang à chaque |di |
• Calculer, V+ , la somme des rangs des différences positives (di > 0)
• Calculer, V− , la somme des rangs des différences négatives (di < 0)
• Calculer V = min(V+ , V− )
Temps de coagulation du
plasma (min)
Sujet Trt1 Trt2 Diff.
1 8.4 9.4 −1.0
2 12.8 15.2 −2.4
3 9.6 9.1 +0.5
4 9.8 8.8 +1.0
5 8.4 8.2 +0.2
6 8.6 9.9 −1.3
7 8.9 9 −0.1
8 7.9 8.1 −0.2
25 / 34
26 / 34
Comparaison 2 populations appariées - Rangs signés Wilcoxon (Littérature)
27 / 34
28 / 34
Variable quantitative (II) - Rcmdr
Test t-Student apparié
29 / 34
Proportions (X binaires)
H0 : π1 = π2
Indépendantes Appariées
test χ² (ν = 1) test Mc Nemar (ν = 1)
30 / 34
Objectifs du cours
A la fin de ce cours, vous devrez être capables de :
31 / 34
Evaluation
Evaluation en janvier
• Durée - 2h
32 / 34
Formulaire (1/2)
33 / 34
Formulaire (2/2)
34 / 34