Notes de Cours

Probabilités et Statistique
Note de cours
Mhamed Mesfioui, Ph. D.

mhamed.mesfioui@uqtr.ca
Département de mathématiques et d’informatique Université du Québec à Trois-Rivières
Automne 2021
1/461
Mhamed Mesfioui, Ph. D. mhamed.mesfioui@uqtr.ca STT1001
Notions fondamentales
Paramètres de positionnement et de dispersion
Représentation graphique
Exercices
Partie I
Statistique descriptive
Mhamed Mesfioui, Ph.D.
Automne 2021
2/461
Exercices
Partie I : Statistique descriptive
1 Notions fondamentales
2 Paramètres de positionnement et de dispersion
3 Représentation graphique
4 Exercices
3/461
Notions fondamentales Variable statistique
Paramètres de positionnement et de dispersion Tableau de fréquence
Représentation graphique Nombre de classe
Exercices Tableau de fréquence : Cas de données discrètes
Automne 2021
4/461
Individu : c’est l’unité sur laquelle on observe une ou plusieurs
caractéristiques. Par exemple : personne, ville, plante, machine, etc.
Population : c’est l’ensemble des individus que l’on veut étudier, qui ont
des propriétés communes et pour lesquelles on veut obtenir de
l’information.
Échantillon : c’est un sous-ensemble de la population, soit la partie
qu’on veut examiner.
Taille : on appelle taille d’un échantillon le nombre d’individus dans cet
échantillon. On le note par n. La taille de la population sera noté N.
5/461
Variable statistique
Variable statistique
Une variable statistique est une caractéristique susceptible de
variations observables.
Les modalités d’une variable statistique sont les valeurs possibles à
priori de la variable.
Les données sont les valeurs observées à posteriori de la variable.
6/461
Type de variable
Variable quantitative : elle fait référence à un système de mesure

numérique. On distingue deux cas :
1. Variable quantitative discrète : l’ensemble des modalités est
dénombrable. Par exemple, la variable nombre d’enfants par ménage.
2. Variable quantitative continue : l’ensemble des modalités est un
intervalle. Par exemple, la durée de vie d’un instrument électronique.
7/461
Type de variable
Variable qualitative : elle ne fait pas référence à un système de mesure

numérique. On distingue deux cas :
1. Ordinale : l’ensemble des modalités correspond à une échelle avec un
ordre. Par exemple, niveau de satisfaction, niveau de scolarité.
2. Nominale : l’ensemble des modalités ne correspond à aucune échelle.
Par exemple, la variable sexe.
8/461
Tableau de fréquence
Représentation des données : cas continu

Cas de variables quantitatives continues : données brutes
Exemple 1. Les données ci-dessous représentent les durées de vie (en
heures) d’un certain type d’appareil électronique :
78.9 83.4 90.0 88.2 89.3 60.8

75.0 88.0 92.3 73.1 73.1 76.3
60.3 67.4 84.2 84.2 70.2 97.8
92.1 80.0 77.0 77.0 77.2 84.5
93.7 78.5 65.0 56.5 56.5 84.2
9/461
Données groupées : sont des données obtenues en regroupant les

données brutes ordonnées dans des classes sous la forme d’un tableau
de fréquences.
Notons que les classes sont souvent de la forme [ai , bi [.
La fréquence ou effectif ni relative à une classe [ai , bi [ correspond au
nombre d’observations appartenant à cette classe.
La fréquence relative fi représente le pourcentage d’observations
contenues dans la classe [ai , bi [, elle est déterminée par la formule
ni
fi = .
n
10/461
La valeur centrale mi d’une classe est le milieu de la classe [ai , bi [

ai + bi
mi = .
2
Tableau de fréquences : les données brutes ci-dessus sont résumées
dans le tableau de fréquences suivant :
11/461
Exemple 2.
Fréquences
Classe Fréquences n Valeur centrale m
relatives f
4
[55, 65[ 4 60 30
5
[65, 75[ 5 70 30
13
[75, 85[ 13 80 30
7
[85, 95[ 7 90 30
1
[95, 105[ 1 100 30
n = 30 F =1
12/461
La classe contenant le plus grand nombre d’observations, c’est-à-dire,

celle qui correspond à la plus haute fréquence est appelée classe
modale.
Le centre de la classe modale est appelé le mode.
La classe modale du tableau de fréquence précédent est [75, 85[. Par
contre, le mode sera la valeur centrale de [75, 85[ à savoir 80.
13/461
Nombre de classe
Le nombre p de classes dans un tableau de fréquences est donné par

√
p = n.
√
Dans l’exemple précédent, on a n = 30 et p = 30 ≈ 5 classes.
Toutefois, il existe d’autres méthodes pour déterminer le nombre de
classes :
La règle de Sturge :
p = 1 + 3.3 log(n) pour n = 30, p ≈ 12.
La règle de Yule :
√
p = 2.5 n pour n = 30, p ≈ 14.
La méthode du bon sens reste la meilleure.
14/461
Tableau de fréquence pour des données discrètes
Variables quantitatives discrètes : données brutes

Exemple 3. Nombre de pièces présentant une défectuosité mineure.
0 1 0 2 0
0 1 2 0 0
1 0 1 3 0
1 2 1 0 0
Tableau de fréquences : on peut présenter les données brutes

précédentes selon les modalités dans le tableau de fréquences suivant.
15/461
Tableau de fréquences dans le cas discret
Présentation du tableau de fréquences :

Fréquences
Modalités x Fréquences n
relatives f
0 10 10/20
1 6 6/20
2 3 3/20
3 1 1/20
n = 20 F =1
16/461
Notions fondamentales Moyenne d’un échantillon
Paramètres de positionnement et de dispersion Variance d’un échantillon
Représentation graphique Coefficient de variation
Exercices Étendue
Automne 2021
17/461
Exercices Étendue
Paramètres de position et de dispersion
Moyenne d’un échantillon issu d’une variable continue

Cas de données brutes :
La moyenne d’un échantillon x1 , . . . , xn est donnée par la formule :
n
1X x1 + · · · + xn
x̄ = xi = .
n n
i=1
Par exemple la moyenne des données de l’exemple 1 est :
x̄ = 78.49.
18/461
Exercices Étendue
Moyenne d’un échantillon
Moyenne d’un échantillon issu d’une variable continue

Cas de données groupées
La moyenne des données groupées s’exprime par :
p
1X n1 m1 + · · · + np mp
x̄ = ni mi = .
n n
i=1
Par exemple la moyenne de données groupées de l’exemple 2 est :
x̄ = 78.67.
19/461
Exercices Étendue
Variance d’un échantillon
Variance d’un échantillon issu d’une variable continue

Cas de données brutes :
La variance d’un échantillon x1 , . . . , xn est donnée par la formule :
n
" n ! #
2 1 X 2 1 X 2 2
s = (xi − x̄) = xi − nx̄ .
n−1 n−1
i=1 i=1
Par exemple la variance et l’écart-type des données de l’exemple 1 sont :
s2 = 125.54 et s = 11.20.
20/461
Exercices Étendue
Variance d’un échantillon
Variance d’un échantillon issu d’une variable continue

Cas de données groupées
La variance des données s’exprime par :
" p ! #
2 1 X 2 2
s = ni mi − nx̄ .
n−1
i=1
Par exemple la variance et l’écart-type des données de l’exemple 2 sont :
s2 = 107.96 et s = 10.39.
21/461
Exercices Étendue
Coefficient de variation
Coefficient de variation
Le coefficient de variation est une mesure de dispersion relative à la
moyenne. Il est défini par :
s
CV = .
x̄
Il s’agit d’une mesure utile pour comparer la variabilité de deux ou
plusieurs ensembles de données qui diffèrent considérablement de par
l’ampleur des valeurs observées. Par exemple, on pourrait y recourir afin
de comparer la variabilité de la consommation quotidienne de
l’électricité, en janvier, de maisons unifamiliales situées à Québec et à
Vancouver.
22/461
Exercices Étendue
Étendue
Étendue
L’étendue d’un échantillon x1 , . . . , xn est définie par
R = max(xi ) − min(xi ).
23/461
Notions fondamentales Histogramme
Paramètres de positionnement et de dispersion Diagramme à secteurs circulaires
Représentation graphique Médiane et Quartiles
Exercices Diagramme en boîte
Automne 2021
24/461
Représentations graphiques des données : histogramme

L’histogramme est une visualisation graphique de données issues d’une
variable statistique continue.
Pour construire un histogramme, on inscrit les limites des intervalles des
classes dans l’axe horizontal, puis on calcule la hauteur de chaque
rectangle par la formule :
hauteur du rectangle = fréquence de la classe.
C’est-à-dire :
hi = ni .
25/461
Interprétation de l’histogramme
L’histogramme donne une idée sur le comportement de la distribution

théorique des données. Par exemple, l’histogramme suivant relatif aux
données des durées de vie de l’exemple 1 laisse croire que la
distribution théorique de ces observations est une distribution bimodale.
26/461
Illustration d’un histogramme
Histogramme des durée de vie: données exemple 1

7
6
5
Frequency
4
3
2
1
0
60 70 80 90 100
27/461
Représentation graphique d’une variable qualitative ou quantitative

discrète : diagramme à secteurs circulaires
Le diagramme à secteurs circulaires visualise les fréquences des
modalités dans le cas d’une variable qualitative ou quantitative discrète.
L’idée de cette représentation consiste à représenter graphiquement les
fréquences ni par des secteurs circulaires d’angles αi donnés par la
formule suivante :
360ni
αi =
n
Les données discrètes de l’exemple 3 sont reprises dans le diagramme
circulaire ci-dessous.
28/461
Illustration d’un diagramme à secteurs circulaires
pas de déf
1 déf
2 déf
3 déf
29/461
Diagramme en boîte
Diagramme en boîte (Box PLot)

Le diagramme en boîte est une représentation graphique qui nous
informe sur la symétrie et la dispersion des données. Il permet aussi
d’identifier les valeurs aberrantes et de comparer plusieurs populations.
Construction du diagramme en boîte

Afin de construire le diagramme en boîte, nous allons définir la médiane
et les quartiles d’un échantillon.
30/461
Médiane d’un échantillon

La médiane d’un échantillon c’est la valeur qui partage l’échantillon en
deux parties égales.
Calcul de la médiane M
Soit x1 , . . . , xn un échantillon ordonné. Pour calculer la médiane M, on
distingue deux cas :
1. Cas 1 : si n est impair, alors
M = x n+1
2
Par exemple, la médiane des données 1, 2, 3.5, 5.7, 8, 12.3, 14 sera

M = 5.7.
31/461
2. Cas 2 : si n est pair, alors

x n + x n +1
2 2
M= .
2
Par exemple, la médiane des données 0, 1, 2, 3.5, 5.5, 8, 12.3, 14 sera
M = 4.5.
32/461
Quartiles d’un échantillon
Quartile d’ordre 1
Le quartile d’orde un, noté Q1 est la médiane des observations qui sont
strictement plus petites que la médiane M.
Quartile d’ordre 3
Le quartile d’orde trois Q3 est la médiane des observations qui sont
strictement plus grandes que la médiane M.
Remarque. le quartile d’ordre Q2 n’est nulle autre que la médiane M.
Exemple. Q1 et Q3 des données 0, 1, 2, 3.5, 5.5, 8, 12.4, 14 seront

Q1 = 1.5 et Q3 = 10.2.
33/461
Construction du diagramme en boîte
Voici les étapes à suivre pour construire un diagramme en boîte
1. On calcule les quartiles : Q1 , M et Q3

2. On calcule l’écart interquartile : E = Q3 − Q1
3. On calcule les bornes normales :
bi = Q1 − 1.5E et bs = Q3 + 1.5E
4. On calcule la plus petite et la plus grande valeur normale appartenant à

l’échantillon :
xi : plus petite valeur supérieure ou égale à bi
xs : plus grande valeur inférieure ou égale à bs .
34/461
Illustration d’un diagramme en boîte
Exemple. Ci-après le diagramme en boîte des données suivantes. On

constate que 60 est une valeur aberrante. On remarque aussi que la
distribution de l’échantion est symétrique.
8 10 12 14 16 18 20 22 24 26 40 60
Le diagramme en boîte de cette série ci-après montre que la valeur 60

est aberrante.
35/461
Illustration d’un diagramme en boîte
Boxplot des données précédentes
60
50
40
30
20
10
36/461
Boxplot des durées de vie de l’exemple 1
Diagramme en boîte des durée de vie: données exemple 1
90
80
70
60
37/461
Boxplot des durées de vie de l’exemple 1
Nous constatons du diagramme en boîte précédent que la distribution des

durées de vie présentées dans l’exemple 1 n’est pas symétrique. Car, la
droite passant par la médiane ne partage pas le rectangle en deux parties
égales.
38/461
Autres utilités d’un diagramme en boîte
Le diagramme boîte est aussi utile pour comparer visuellement plusieurs

populations. Pour ce faire, les logiciels statistiques (comme le logiciel R)
donnent la possibilité de présenter plusieurs diagrammes en boîte sur le
même graphique. Ces diagrammes permettent de comparer visuellement les
distributions de plusieurs populations. Le graphe ci-après présente les
diagrammes en boîte de trois échantillons issus de population normales de
moyennes et de variances différentes.
39/461
Boxplot
Boxplots associés à trois échantillons de moyennes 2, 4 et 6
12
10
8
6
4
2
0
40/461
Exercices
Exercices
Automne 2021
41/461
Exercices
Exercice 1
Exercice 1. Deux techniciens effectuent un test de dureté sur des feuilles de

métal avant qu’elles ne soient expédiées. En utilisant le même instrument de
mesure, chaque technicien a effectué 10 lectures sur une feuille de métal.
Les résultats sont présentés dans le tableau suivant :
Technicien A 529 528 426 527 525 525 526 527 528 525
Technicien B 527 522 523 526 523 525 526 524 527 523
42/461
Exercices
Exercice 1
Boxplots associés aux données des deux Techniciens A et B

520
500
480
460
440
43/461
Exercices
Exercice 1
Boxplots des Techniciens A et B sans la VA: 426

529
528
527
526
525
524
523
522
44/461
Exercices
Exercice 1
Exercice 1.
a) Calculez les moyennes et les variances A et B.

b) Calculez la médiane M, et les deux quartiles Q1 et Q3 pour A et B.
c) Est ce qu’il y a des valeurs aberrantes dans la série A ? Justifiez.
d) Même question pour la série B ? Justifiez.
45/461
Exercices
Réponse Exercice 1
Réponse.
a) x̄A = 516.6, sA2 = 1015.32, x̄B = 524.6 et sB2 = 3.38

b) Pour A : Q1 = 525, M = 526.5, Q3 = 528
Pour B : Q1 = 523, M = 524.5 Q3 = 526
c) V .A = 426 pour la série A, car bi = 520.5, bs = 532.5
d) Pas de V .A pour la série B, car bi = 518.5, bs = 530.5.
46/461
Exercices
Exercice 2
Exercice 2. Soit x1 , . . . , xn une série statistique. Posons yi = axi + b où a et

b sont des constantes non nulles. Montrez que
ȳ = ax̄ + b et sy2 = a2 sx2 .
47/461
Exercices
Réponse Exercice 2
Réponse.
a) Puisque yi = axi + b, i = 1, . . . , n. Donc la moyenne des yi sera :
n n
1X 1X
ȳ = yi = (axi + b)
n n
i=1 i=1
n n
!
1 X X
= axi + b
n
i=1 i=1
n
!
1 X
= a xi + nb
n
i=1
= ax̄ + b.
48/461
Exercices
Réponse exercice 2
b) La variance des yi donnée par :

n n
1 X 1 X
sy2 = (yi − ȳ )2 = (axi + b − (ax̄ + b))2
n−1 n−1
i=1 i=1
n
1 X
= {a(xi − x̄)}2
n−1
i=1
n
1 X
= a2 (xi − x̄)2
n−1
i=1
n
1 X
= a2 (xi − x̄)2
n−1
i=1
= a2 sx2 .
49/461
Définition et propriétés d’une probabilité
Analyse Combinatoire appliquée aux calculs de probabilités
Probabilités conditionnelles et indépendance
Formules de Bayes
Partie II
Probabilités et Variables aléatoires
Automne 2021
50/461
Formules de Bayes
Partie II : Probabilités et Variables aléatoires
5 Définition et propriétés d’une probabilité
6 Analyse Combinatoire appliquée aux calculs de probabilités
7 Probabilités conditionnelles et indépendance
8 Formules de Bayes
51/461
Formules de Bayes
Partie II : Probabilités et Variables aléatoires
9 Variables aléatoires discrètes et continues
10 Modèles probabilistes discrets
11 Modèles probabilistes continus
12 Théorème central limite et applications
52/461
Approche fréquentielle
Définition et propriétés d’une probabilité Approche axiomatique
Analyse Combinatoire appliquée aux calculs de probabilités Formules de Morgan
Probabilités conditionnelles et indépendance Définition axiomatique d’une probabilité
Formules de Bayes Espace échantillonnal fini et équiprobable
Propriétés d’une probabilité
Automne 2021
53/461
Vocabulaire
Épreuve aléatoire : C’est une expérience dont le résultat n’est pas

connu avec certitude.
Exemple.
1) Lancer une pièce de monnaie 3 fois.
2) Lancer un dé à six faces 2 fois.
Espace échantillonnal : C’est l’ensemble de tous les résultats

possibles d’une épreuve aléatoire. On le note par S.
Exemple.
1) Pour l’expérience aléatoire 1), on a
S = {PPP, PPF , PFP, FPP, PFF , FPF , FFP, FFF } .
2) Pour l’expérience aléatoire 2), on a
S = {(1, 1), (1, 2), . . . , (1, 6), . . . , (6, 1), (6, 2), . . . , (6, 6)} .
54/461
Vocabulaire
Événement : C’est un sous ensemble de l’espace échantillonnal S.

Exemple. On lance un dé deux fois, définir les événements A et B
suivants :
a) A : la somme des chiffres obtenus soit 5.
b) B : le premier chiffre obtenu soit plus grand que le deuxième.
Solution.
a) L’événement A : la somme des chiffres obtenus est 5 s’écrit :
A = {(1, 4), (2, 3), (3, 2), (4, 1)} .
b) De même, l’événement B : le premier chiffre obtenu est plus grand au
deuxième est donné par :
B = {(i, j) : tel que i > j, i, j = 1, . . . , 6}
= {(2, 1), (3, 1), (3, 2), . . . , (6, 1), (6, 2), (6, 3), (6, 4), (6, 5)} .
Ainsi, Card(B) = 15
55/461
On répète une épreuve aléatoire N fois. On suppose que ces répétitions

se font indépendamment les unes des autres et sous les mêmes
conditions.
On fixe un événement A et on s’intéresse au nombre NA défini par :
NA : Nombre d’apparitions de l’événement A.
La fréquence relative de l’événement A, appelée aussi probabilité

empirique, est définie par :
NA
fA = .
N
56/461
Lorsque on fait tendre N vers l’infini, la probabilité empirique fA

converge vers une valeur théorique appelée probabilité de A, notée
P(A). Ainsi :
NA
P(A) = lim .
N→∞ N
Remarque. On peut utiliser les relations
NA∪B = NA + NB − NA∩B et NA = N − NA .
pour déduire la formule de la probabilité de la réunion de deux

événements donnée par :
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) et P(A) = 1 − P(A).
57/461
En effet :
NA∪B = NA + NB − NA∩B
NA∪B NA NB NA∩B
=⇒ = + −
N N N N
NA∪B NA NB NA∩B
=⇒ lim = lim + lim − lim
N→∞ N N→∞ N N→∞ N N→∞ N
=⇒ P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
58/461
De même, on a
NĀ = N − NA
NĀ NA
=⇒ =1−
N N
NĀ NA
=⇒ lim = 1 − lim
N→∞ N N→∞ N
=⇒ P(Ā) = 1 − P(A).
59/461
Approche axiomatique
Rappel ensembliste
Réunion : La réunion de deux évènements A et B d’un espace
échantillonnal S est l’évènement A ∪ B défini par :
A ∪ B = {x ∈ S : x ∈A ou x ∈ B}
A B
6
BM
B
B
B
A∪B
Notons que la réunion A ∪ B se réalise si A ou B se réalise. 60/461
Intersection : L’intersection de deux évènements A et B d’un espace
échantillonnal S est l’évènement A ∩ B défini par :
A ∩ B = {x ∈ S : x ∈A et x ∈ B}
A B
A∩B
Remarquons que l’intersection A ∩ B se réalise si A et B se réalisent
simultanément. 61/461
Complémentaire : Le complémentaire d’un évènement A est
l’évènement A défini par :
A = {x ∈ S : x∈
/ A}
A
Remarque. A se réalise si A ne se réalise pas. 62/461
Différence : La différence de deux évènements A et B est l’évènement

A − B défini par
A − B = {x ∈ S : x ∈A et x ∈
/ B} .
A − B se réalise si A se réalise et B ne se réalise pas. Remarque.

Notons que A − B peut aussi s’écrire sous forme :
A − B = A ∩ B.
Événements mutuellement exclusifs ou disjoints

Les évènements A1 , . . . , An sont mutuellement exclusifs ou disjoints si
Ai ∩ Aj = ∅ pour tout i 6= j.
63/461
Formules de De Morgan
Formules de De Morgan : cas de deux évènements

Soient A et B deux évènements d’un espace échantillonnal S, alors :
A∪B =A∩B
et
A ∩ B = A ∪ B.
Formules de De Morgan : cas général
Soient A1 . . . , An une suite d’évènements d’un espace échantillonnal S,
alors :
A1 ∪ · · · ∪ An = A1 ∩ · · · ∩ An
et
A1 ∩ · · · ∩ An = A1 ∪ · · · ∪ An .
64/461
Définition axiomatique d’une probabilité
En mathématique, une probabilité est une fonction réelle d’ensembles,

notée P, qui fait correspondre à chaque évènement A d’un espace S un
nombre réel, noté P(A). Pour la fonction
P : A 7→ P(A)
soit une probabilité P(A), elle doit nécessairement satisfaire les axiomes
suivants :
1. 0 ≤ P(A) ≤ 1 pour tout A ⊂ S.
2. P(S) = 1.
3. Si A1 , A2 , . . . une suite infinie d’évènements mutuellement exclusifs, alors
P(A1 ∪ A2 ∪ · · · ) = P(A1 ) + P(A2 ) + · · · .
65/461
Définition axiomatique d’une probabilité
Remarque. L’axiome 3 reste vraie pour une suite finie d’évènements,

c’est-à-dire, si A1 , . . . , Ak sont des évènements mutuellement exclusifs,
alors :
P(A1 ∪ A2 ∪ · · · ∪ Ak ) = P(A1 ) + P(A2 ) + · · · + P(Ak ).
66/461
Espace échantillonnal fini et équiprobable
On dit qu’un espace échantillonnal S est fini et équiprobable si :

1. S = {a1 , . . . , an } .
2. P(a1 ) = P(a2 ) = · · · = P(an ) = 1/n.
Remarque. Les éléments {a1 }, {a2 }, . . . , {an } sont appelés évènements

élémentaires.
67/461
Soulignons que dans le cas d’un espace fini et équiprobable, la

probabilité d’un évènement A est donnée par :
card{A} Nombre de cas favorables
P(A) = = .
n Nombre de cas possibles
où card{A} désigne le nombre d’éléments de A. Par exemple, si
A = {a, b, c, d} alors card{A} = 4.
Exercice. On lance une pièce de monnaie équilibrée 4 fois, quelle est la

probabilité d’obtenir exactement 3 fois pile ?
Réponse. Cette probabilié est donnée par :
4
P {PPPF , PPFP, PFPP, FPPP} = = 0.25
16
68/461
Exemple d’espace fini et non équiprobable
On considère un dé à six faces non équilibré tel que :
P [d’obtenir la face i] = P{i} = ki, i = 1, . . . , 6.
a) Calculez la valeur de k .
b) Quelle est la probabilité d’obtenir un nombre pair.
69/461
Réponse
On considère un dé à six faces non équilibré tel que :

a) La valeur de k s’obtient en utilisant P(1) + · · · + P(6) = 1 qui est équivalent
à:
1
k + 2k + 3k + 4k + 5k + 6k = 1 implique k = .
21
b) La probabilité d’obtenir un nombre pair est
12 4
P(2) + P(4) + P(6) = 12k = = .
21 7
70/461
Les propriétés suivantes sont très utiles pour faire les exercices :
1. P(Ā) = 1 − P(A).
2. P{∅} = 0.
3. P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
4.
P(A ∪ B ∪ C) = P(A) + P(B) + P(C)
− P(A ∩ B) − P(B ∩ C) − P(A ∩ C)
+ P(A ∩ B ∩ C).
5. P(A − B) = P(A ∩ B̄) = P(A) − P(A ∩ B).
71/461
Exercice 1.
Soient les évènements F , G et H tels que :
P(F ) = 0.7, P(G) = 0.6, P(H) = 0.4,
P(F ∩ G) = 0.4, P(F ∩ H) = 0.3, P(G ∩ H) = 0.2,
P(F ∩ G ∩ H) = 0.1.
Calculer :
a) P(F ∪ G), P(F ∩ G), P(F ∩ G) et P(F ∪ G).
Rep : 0.9, 0.1, 0.2 et 0.8
b) P(F ∪ G ∪ H), P(F ∩ G ∩ H) et P(F ∪ G ∪ H) .

Rep : 0.9, 0.1 et 0.7
72/461
Réponse de l’exercice 1.
Calculons P(F ∪ G) :
P(F ∪ G) = P(F ) + P(G) − P(F ∩ G) = 0.9.
Calculons P(F ∩ G). En utilisant la loi de De Morgan, il vient que :
P(F ∩ G) = P(F ∪ G) = 1 − P(F ∪ G) = 0.1.
Calculons P(F ∩ G) :
P(F ∩ G) = P(G) − P(F ∩ G) = 0.2.
73/461
Calculons P(F ∪ G). En appliquons la loi de De Morgan, on voit que
P(F ∪ G) = 1 − P(F ∪ G)
= 1 − P(F ∩ G)
= 1 − [P(F ) − P(F ∩ G)] = 0.7.
Calculons P(F ∪ G ∪ H)
P(F ∪ G ∪ H) = P(F ) + P(G) + P(H)

−P(F ∩ G) − P(F ∩ H) − P(G ∩ H)
+P(F ∩ G ∩ H) = 0.9.
74/461
Calculons P(F ∩ G ∩ H). En appliquons la loi de De Morgan, on voit que
P(F ∩ G ∩ H) = P(F ∪ G ∪ H) = 1 − P(F ∪ G ∪ H) = 0.1.
Calculons P(F ∪ G ∪ H). En appliquons la loi de De Morgan, on voit que
P(F ∪ G ∪ H) = 1 − P(F ∪ G ∪ H)
= 1 − P(F ∩ G ∩ H)
= 1 − [P(F ∩ G) − P(F ∩ G ∩ H)] = 0.7.
75/461
Exercice 2.
Un client du rayon des costumes d’un magasin achètera un costume avec
une probabilité de 0.22, une chemise avec une probabilité de 0.30 et une
cravate avec une probabilité de 0.28. Le client achètera un costume et une
chemise avec une probabilité de 0.11, un costume et une cravate avec une
probabilité de 0.14 et une chemise et une cravate avec une probabilité de
0.10. Un client achètera les trois vêtements avec une probabilité de 0.06.
Quelle la probabilité qu’un client
a) achète au moins un de ces trois vêtements ? Rep : 0.51
b) achète exactement deux de ces trois vêtements ? Rep : 0.17
c) achète exactement un de ces trois vêtements ? Rep : 0.28
d) achète un costume ou une cravate, mais n’achète pas une chemise ?
Rep : 0.21
76/461
Définissons d’abord les événements suivants :
A = Le client achète un costume ;

B = Le client achète une chemise ;
C = Le client achète une cravate.
Nous avons :
P(A) = 0.22, P(B) = 0.30, P(C) = 0.28,
P(A ∩ B) = 0.11, P(A ∩ C) = 0.14, P(B ∩ C) = 0.10,

P(A ∩ B ∩ C) = 0.06.
Ces événements sont décrits par le diagramme de Venn suivant :
77/461
78/461
a) L’événement achète au moins un de ces trois vêtements est donné par :
P(A ∪ B ∪ C) = P(A) + P(B) + P(C)

− P(A ∩ B) − P(A ∩ C) − P(B ∩ C)
+ P(A ∩ B ∩ C)
= 0.51.
79/461
b) L’événement achète exactement deux de ces trois vêtements est donné
par :
P(A ∩ B ∩ C) + P(A ∩ B ∩ C) + P(A ∩ B ∩ C) = 0.17.
Car :
P(A ∩ B ∩ C) = P(A ∩ B) − P(A ∩ B ∩ C) = 0.05;

P(A ∩ B ∩ C) = P(A ∩ C) − P(A ∩ B ∩ C) = 0.08;
P(A ∩ B ∩ C) = P(A ∩ C) − P(A ∩ B ∩ C) = 0.04.
80/461
c) L’événement achète exactement un de ces trois vêtements est donné
par :
P(A ∩ B ∩ C) + P(A ∩ B ∩ C) + P(A ∩ B ∩ C) = 0.28.
Car :
P(A ∩ B ∩ C) = P(A) − P(A ∩ B) − P(A ∩ C) + P(A ∩ B ∩ C)

= 0.03;
P(A ∩ B ∩ C) = P(B) − P(A ∩ B) − P(B ∩ C) + P(A ∩ B ∩ C)
= 0.15;
P(A ∩ B ∩ C) = P(C) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)
= 0.10.
81/461
d) L’événement achète achète un costume ou une cravate, mais n’achète
pas une chemise est donné par :
n o
P (A ∪ C) ∩ B = P (A ∪ C ∪ B) − P (B) = 0.21.
82/461
Analyse Combinatoire appliquée aux calculs de probabilités Combinaison
Probabilités conditionnelles et indépendance Permutation
Formules de Bayes
Automne 2021
83/461
Formules de Bayes
Combinaison
Combinaison
Une combinaison consiste en un arrangement d’objets distincts et ne
diffère d’une autre que si son contenu n’est pas le même. L’ordre n’a ici
aucune importance.
Exemple : Combien d’équipes de 2 joueurs peut-on former à partir de 4

joueurs A,B,C et D ? Il y a 6 équipes possibles :
{A, B}, {A, C}, {A, D}, {B, C}, {B, D}, {C, D}.
Ce nombre se note et se calcule de la manière suivante :

4
= Nombre d’équipes possibles = 6.
2
84/461
Formules de Bayes
Combinaison
Formule générale
Le nombre de groupes de r objets distincts qu’il est possible de

composer sans répétition à partir d’un total de n objets est

n n!
= .
r r !(n − r )!
Par exemple, le nombre d’équipes à 3 joueurs qu’on peut construire à

partir de 8 joueurs sera :

8 8!
= = 56.
3 3! × 5!
85/461
Formules de Bayes
Combinaison
Applications aux calculs de probabilités

Exercice 1. Un comité de 5 personnes doit être choisi parmi les 6
hommes et 9 femmes d’un groupe. Si le choix est le résultat du hasard,
quelle est la probabilité que le comité soit composé de 3 hommes et 2
femmes ?
Réponse.

6 9
×
3 2 240
= = 0.2398.
15 1001
5
86/461
Formules de Bayes
Combinaison
Exercice 2. Pour le jeu Lotto 6/49. Calculez la probabilité des événements
suivants :
1. A : avoir exactement 3 bons numéros sur 6.
2. B : avoir exactement 4 bons numéros sur 6.
3. C : avoir exactement 5 bons numéros sur 6.
4. D : avoir les 6 numéros.
5. E : avoir au moins 3 bons numéros sur 6 (appelé prix en argent à Lotto
6/49).
Réponse.
1. La probabilité de l’événement A est :
! !
6 43
×
3 3 20 × 12341
P(A) = ! = = 0.0176504.
49 13983816
6
87/461
Formules de Bayes
Combinaison
2. La probabilité de l’événement B est :

! !
6 43
×
4 2 15 × 903
P(B) = ! = = 0.0009686197.
49 13983816
6
3. La probabilité de l’événement C est :

! !
6 43
×
5 1 15 × 903
P(C) = ! = = 0.0000184499.
49 13983816
6
88/461
Formules de Bayes
Combinaison
4. La probabilité de l’événement D est :

! !
6 43
×
6 0 1
P(D) = ! = = 0.00000007151124.
49 13983816
6
5. La probabilité de l’événement E est :
P(D) = P(A ∪ B ∪ C ∪ D)
= P(A) + P(B) + P(C) + P(D)
= 0.01863754.
89/461
Formules de Bayes
Combinaison
Exercice théorique
1. Montrez que pour tout 0 ≤ k ≤ n, on a
! !
n n
= .
k n−k
2. Montrez que pour tout 0 ≤ k ≤ n, on a

! ! !
n n−1 n−1
= + .
k k k −1
90/461
Formules de Bayes
Permutation
Une permutation consiste en un arrangement ordonné d’objets distincts.

Deux permutations diffèrent l’une de l’autre si
1. leurs contenu n’est pas le même
ou bien
2. si leurs éléments sont ordonnés différemment
Exemple : Considérons quatre jetons qui se distinguant chacun par une

lettre différente, a, b, c et d. Voici toutes les permutations des ces jetons pris
deux à la fois :
ab, ac, ad, bc, bd, cd,

ba, ca, da, cb, db, dc.
91/461
Formules de Bayes
Permutation
Les permutations ab et ba diffèrent l’une de l’autre parce que leurs

éléments ne sont pas dans le même ordre.
Les permutation ab et ac diffèrent l’une de l’autre parce que leurs
contenu n’est pas le même.
92/461
Formules de Bayes
Permutation
Formule calculant le nombre de permutations

Supposons qu’on dispose de n objets distincts à partir desquels on veut
obtenir des permutations de r objets (r ≤ n).
Le nombre de permutations possibles correspond sera :
Prn = n(n − 1)(n − 2)(n − 3) · · · (n − r + 1)

n!
= !.
(n − r )
Relation entre combinaison et permutation
!
n n
Pk = k !.
k
93/461
Formules de Bayes
Permutation
Exercice 1 : Combien de nombres formés par 3 chiffres différents peut-on

écrire à partir des chiffres 1, 2, 4, 8 et 9. Rep : P35 = 60.
Exercice 2 : Combien de mots formés par des lettres différentes peut-on
écrire à partir des lettres a, b, c et d. Rep : P14 + P24 + P34 + P44 = 64.
Exercice 3 : On veut disposer 10 livres sur un rayon de sa bibliothèque.
Quatre d’entre eux sont des livres de mathématique, trois de chimie, deux
d’histoire et un de langue. On veut ranger ces livres de sorte que tous les
livres traitant du même sujet restent groupés. Combien y a-t-il de dispositions
possibles. Rep : 4! × 4! × 3! × 2! × 1! = 6912.
94/461
Formules de Bayes
Permutation
Exercice 4 : Problème d’anniversaire. Il y a n personnes dans une pièce.

On veut déterminer la probabilité que deux ou plusieurs personnes d’entre
elles aient le même mois et le même jour de naissance. Supposons ici qu’il y
a 365 jours dans une année et que l’anniversaire de chaque personne peut
aussi bien tomber sur un jour que sur l’autre. Soit l’événement B défini par
B : deux ou plusieurs personnes ont le même mois et le même jour de
naissance.
a) Déterminer P(B) en fonction de n.

b) Faire un tableau qui donne P(B) en fonction de n = 10, 20, 30, 40, 50.
Conclure ?
95/461
Formules de Bayes
Solution de l’exercice 4.
a) Il est plus commode de calculer P(B̄). En effet :
Pn365
P(B̄) = .
365n
Par conséquent :
Pn365
P(B) = 1 − P(B̄) = 1 − .
365n
b)
n 10 20 30 40 50
P(B) 0.1169 0.4114 0.7063 0.8912 0.9704
96/461
Définition et propriétés d’une probabilité Probabilités conditionnelles
Analyse Combinatoire appliquée aux calculs de probabilités Règle de multiplication
Probabilités conditionnelles et indépendance Indépendance d’événements
Formules de Bayes Probabilité totale
Automne 2021
97/461
Probabilités conditionnelles
Définition
Soient A et B deux événements de S. On appelle probabilité
conditionnelle de B étant donné A, la probabilité de réalisation de B
sachant que l’événement A s’est réalisé. On la note par P (B|A). Sa
valeur est donnée par :
P (A ∩ B)
P (B|A) = , P (A) > 0.
P (A)
De même,
P (A ∩ B)
P (A|B) = , P (B) > 0.
P (B)
98/461
Remarques.
1. P(B) peut être vue comme une probabilité conditionnelle par rapport à tout
l’espace échantillonnal S :
P(B) = P(B|S).
2. P(B) et P(B|A) sont en général deux probabilités différentes.
Exemple. On lance une pièce de monnaie trois fois et on s’intéresse aux

événements suivants :
A = " Obtenir au moins deux piles (P) ",
B = " Obtenir pile (P) dans le premier essai ",
C = " Obtenir face (F ) dans le premier essai ".
Calculez P(A), P(A|B) et P(A|C).
99/461
Réponse.
A = {PPP, PPF , PFP, FPP};
B = {PPP, PPF , PFP, PFF };
C = {FPP, FPF , FFP, FFF };
A ∩ B = {PPP, PPF , PFP};
A ∩ C = {FPP};
P(A) = 4/8 = 1/2;
P(A ∩ B) 3/8 3
P(A|B) = = = ;
P(B) 4/8 4
P(A ∩ C) 1/8 1
P(A|C) = = = .
P(C) 4/8 4
100/461
Conclusion. P(A|C) < P(A) < P(A|B). Donc, une probabilité inconditionnelle
d’un événement donné peut être plus petite comme elle peut être plus
grande que sa probabilité conditionnelle.
Remarque. P(Ā|B) est aussi une probabilité, donc elle satisfait à toutes les
propriétés d’une probabilité. En particulier,
P(Ā|B) = 1 − P(A|B).
101/461
Règle de multiplication
Cas de deux événements :
Pour évaluer la probabilité de l’intersection de deux événements A et B,
on utilise la loi suivante :
P(A ∩ B) = P(A)P(B|A),
ou encore,
P(A ∩ B) = P(B)P(A|B).
Notons que cette règle est une conséquence de la définition de P(B|A).
En effet, il est clair que
P(A ∩ B)
P(B|A) = ⇒ P(A ∩ B) = P(A)P(B|A).
P(A)
102/461
Cette règle peut-être représentée graphiquement comme suit :
B
A∩B P(A)P(B|A)
A
A∩B
B
B
A∩B
A
A∩B
B
103/461
Cas de trois événements :
Soient A, B et C sont trois événements :
P(A ∩ B ∩ C) = P(A)P(B|A)P(C|A ∩ B)
C A∩B∩C P(A)P(B|A)P(C|A ∩ B)
A C ...
B ...
A ...
En général, cette règle s’écrit :

P(A1 ∩ A2 ∩ · · · ∩ An ) = P(A1 )P(A2 |A1 ) · · · P(An |A1 ∩ · · · ∩ An−1 ).
104/461
Exercice 1. On tire sans remise deux boules d’une urne contenant trois
boules blanches et cinq boules noires. Calculez la probabilité que les deux
boules aient la même couleur.
Réponse.
Bi = "la i e boule tirée est blanche", i = 1, 2;

Ni = "la i e boule tirée est noire", i = 1, 2.
Par conséquent,
P([B1 ∩ B2 ] ∪ [N1 ∩ N2 ]) = P(B1 ∩ B2 ) + P(N1 ∩ N2 )

= P(B1 )P(B2 |B1 ) + P(N1 )P(N2 |N1 )
3 2 5 4 26 13
= · + · = = .
8 7 8 7 56 28
105/461
Exercice 2.
On considère un échantillon de taille 3 tiré de la manière suivante :
On dispose au départ d’une urne contenant 5 boules blanches et 7 rouges. à
chaque tirage, une boule est tirée et sa couleur enregistrée. La boule est
alors réintroduite dans l’urne ainsi qu’une nouvelle boule de même couleur.
Trouver la probabilité que l’échantillon comprenne précisément une boule
blanche.
Réponse.
Bi = "la i e boule tirée soit blanche", i = 1, 2, 3;

Ri = "la i e boule tirée soit rouge", i = 1, 2, 3.
La probabilité que l’échantillon comprenne précisément une boule blanche

est exprimée par :
106/461

P (B1 ∩ R2 ∩ R3 ) ∪ (R1 ∩ B2 ∩ R3 ) ∪ (R1 ∩ R2 ∩ B3 )
840
= P(B1 ∩ R2 ∩ R3 ) + P(R1 ∩ B2 ∩ R3 ) + P(R1 ∩ R2 ∩ B3 ) =
2184
car :
P(B1 ∩ R2 ∩ R3 ) = P(B1 ) × P(R2 |B1 ) × P(R3 |B1 ∩ R2 )
5 7 8 280
= × × = ,
12 13 14 2184
P(R1 ∩ B2 ∩ R3 ) = P(R1 ) × P(B2 |R1 ) × P(R3 |R1 ∩ B2 )

7 5 8 280
= × × = ,
12 13 14 2184
P(R1 ∩ R2 ∩ B3 ) = P(R1 ) × P(R2 |R1 ) × P(B3 |R1 ∩ R2 )

7 8 5 280
= × × = .
12 13 14 2184
107/461
Indépendance d’événements
Définition. Deux événements A et B sont dits indépendants si la

réalisation de l’un n’est pas influencée par la réalisation de l’autre.
L’indépendance de A et B est ainsi définie par :
P(A|B) = P(A),
ou
P(B|A) = P(B).
Ceci est équivalent à :
P(A ∩ B) = P(A)P(B).
108/461
Cas de trois événements :

A, B et C sont dits mutuellement indépendants si
1 P(A ∩ B) = P(A)P(B),
2 P(A ∩ C) = P(A)P(C),
3 P(B ∩ C) = P(B)P(C),
4 P(A ∩ B ∩ C) = P(A)P(B)P(C).
Propriétés. Si A et B sont deux événements indépendants alors,

1 A et B sont indépendants,
2 A et B sont indépendants,
3 A et B sont indépendants.
Preuves à faire en exercice.
109/461
Exercice 1. Soient A, B et C trois événements indépendants tels que

P(A) = 0.2, P(B) = 0.3 et P(C) = p.
a) Calculer P(A ∪ B).
b) Sachant que P(A ∪ C) = 0.9, déterminer p.
110/461
a) Calculons P(A ∪ B).
P(A ∪ B) = 1 − P(A ∪ B)
= 1 − P(Ā ∩ B̄) : Loi de De Morgan
= 1 − P(Ā) × P(B̄) : Ā et B̄ sont indépendants
= 1 − 0.8 × 0.7 = 0.44.
111/461
b) Déterminons la valeur de p. Pour ce faire, simplifions d’abord P(A ∪ C̄)

comme suit :

P(A ∪ C̄) = 1 − P A ∪ C̄
= 1 − P(Ā ∩ C)
= 1 − P(Ā) × P(C)
= 1 − 0.8p.
Donc :
1
P(A ∪ C̄) = 0.9 ⇐⇒ 1 − 0.8p = 0.9 ⇐⇒ p = .
8
112/461
Exercice 2.
Dans les schémas suivants la probabilité de fermeture de chaque relais des
circuits est p = 0.90. Si tous les relais fonctionnent indépendamment,
déterminer la probabilité qu’un courant circule entre A et B.
a) b)
1 2 1 2
A B
3 4
3 4
A B
Rép : 0.9639
5 6
7 8
Rép : 0.9987
113/461
Réponse de la situation a).

Définissons d’abord les événements suivants :
Fi : le relais i soit fermé, i = 1, 2, 3, 4.

Puisque les relais fonctionnent indépendamment les uns des autres, donc les
événements F1 , F2 , F3 et F4 sont indépendants. On cherche à calculer la
probabilité de l’événement :
H : le courant passe entre les points A et B.
114/461
En utilisant la loi de de Morgan, on voit que :
P(H) = P [(F1 ∩ F2 ) ∪ (F3 ∩ F4 )]

h i
= 1 − P (F1 ∩ F2 ) ∪ (F3 ∩ F4 )
h i
= 1 − P (F1 ∩ F2 ) ∩ (F3 ∩ F4 )
h i h i
= 1 − P (F1 ∩ F2 ) × P (F3 ∩ F4 ) car les Fi sont IND
= 1 − [1 − P (F1 ∩ F2 )] [1 − P (F3 ∩ F4 )]
= 1 − [1 − P (F1 ) × P (F2 )] [1 − P (F3 ) × P (F4 )] car les Fi sont IND
= 1 − [1 − p × p] [1 − p × p]
= 1 − (1 − p2 )2 = 0.9639
115/461
Réponse de la situation b).

On cherche à calculer la probabilité de l’événement :
K : le courant passe entre les points A et B.
On voit que K est équivalent à :
(F1 ∩ F2 ) ∪ (F3 ∩ F4 ) ∪ (F5 ∩ F6 ) ∪ (F7 ∩ F8 ).
Un raisonnement semblable au précédent permet de conclure que :
P(K ) = 1 − (1 − p2 )4 = 0.9987.
116/461
Probabilité totale
Partition de l’espace S
On dit que les événements A1 , A2 , . . . , Ak forment une partition de S si
1. A1 , A2 , . . . , Ak sont mutuellement exclusifs, c’est-à-dire,
Ai ∩ Aj = ∅ pour tout i 6= j.
2. A1 , A2 , . . . , Ak couvrent l’espace S, c’est-à-dire,
A1 ∪ A2 ∪ · · · ∪ Ak = S.
117/461
Probabilité totale
Illustration :
A1
A5
A6
S
A2 A4
A3
Ici, A1 , A2 , A3 , A4 , A5 et A6 forment une partition de S.
Remarque : Les événements A et A forment une partition de S, car
A ∩ A = ∅,
A ∪ A = S.
118/461
Probabilité totale
Règle. Soient A1 , A2 , . . . , Ak des événements formant une partition de

S, alors pour tout C ⊂ S, on a :
P(C) = P(C|A1 )P(A1 ) + P(C|A2 )P(A2 ) + · · · + P(C|Ak )P(Ak )
S
C
119/461
Probabilité totale
Exercice 1. On prend un premier chiffre au hasard parmi 0, 1, . . . , 9. Ensuite

on prend un second chiffre au hasard parmi les chiffres qui restent. Calculer
la probabilité que le second chiffre soit pair.
Réponse.
Ai = "le i e chiffre est pair", i = 1, 2,
Bi = "le i e chiffre est impair", i = 1, 2.
On cherche P(A2 ). Puisque A1 et B1 forment une partition de S, alors
P(A2 ) = P(A2 |A1 )P(A1 ) + P(A2 |B1 )P(B1 )

4 5 5 5 1
= × + × = .
9 10 9 10 2
120/461
Probabilité totale
Exercice 2. On dispose de deux urnes X et Y . X contient 2 boules blanches

et 3 noires. Y contient 3 boules blanches et 2 noires. On échange au hasard
une boule de chaque urne, puis on extrait une de X . Quelle est la probabilité
qu’elle soit blanche ?
Réponse. Soient les événements suivants :
BX = La boule tirée de l’urne X soit blanche,

BY = La boule tirée de l’urne Y soit blanche,
NX = La boule tirée de l’urne X soit noire,
NY = La boule tirée de l’urne Y soit noire.
Considérons la partition :
A1 = BX ∩ BY , A2 = BX ∩ NY ,
A3 = NX ∩ BY , A4 = NX ∩ NY .
121/461
Probabilité totale
Finalement posons,
B = La boule tirée de l’urne X , après ce

double transfert, soit blanche.
On veut calculer P(B), d’après la loi totale :

4
X
P(B) = P(B|Ai )P(Ai ).
i=1
Remarquons que :
2 1 3 2
P(B|A1 ) = , P(B|A2 ) = , P(B|A3 ) = , P(B|A4 ) = .
5 5 5 5
122/461
De même, nous avons :

2 3
P(A1 ) = P(BX )P(BY ) = × ,
5 5
2 2
P(A2 ) = P(BX )P(NY ) = × ,
5 5
3 3
P(A3 ) = P(NX )P(BY ) = × ,
5 5
3 2
P(A4 ) = P(NX )P(NY ) = × .
5 5
Par conséquent :
4
X 55 11
P(B) = P(B|Ai )P(Ai ) = = = 0.44.
125 25
i=1
123/461
Formules de Bayes
Formules de Bayes
Automne 2021
124/461
Formules de Bayes
Formules de Bayes
La formule de Bayes permet de calculer des probabilités à posteriori. Une

probabilité a posteriori est une probabilité conditionnelle étant donné une
information obtenue à partir de l’observation d’un évènement.
Les hypothèses de la loi de Bayes sont :
1. On dispose d’une partition A1 , A2 , . . . , Ak de S telle que les probabilités a

priori P(A1 ), P(A2 ), . . . , P(Ak ) sont connues.
2. On observe un évènement B pour lequel les probabilités conditionnelles

P(B|A1 ), P(B|A2 ), . . . , P(B|Ak ) sont connues.
125/461
Formules de Bayes
Formules de Bayes
On s’intéresse alors à évaluer les probabilités a posteriori

P(A1 |B), P(A2 |B), . . . , P(Ak |B) après la nouvelle information donnée par B.
Règle :
P(B|Ai )P(Ai )
P(Ai |B) = , i = 1, . . . , n.
P(B)
ou encore :
P(B|Ai )P(Ai )
P(Ai |B) = Pn , i = 1, . . . , n.
j=1 P(B|Aj )P(Aj )
126/461
Formules de Bayes
Formules de Bayes
Exercice 1. Dans une population occidentale, environ 5 hommes sur 100 et

25 femmes sur 10 000 sont daltoniens. Une personne est prise au hasard
dans une telle population où il y a autant d’hommes que de femmes. étant
donné que cette personne est daltonienne, quelle est la probabilité que ce
soit un homme ?
127/461
Formules de Bayes
Formules de Bayes
Réponse. Considérons les événements suivants :
H = "la personne choisie est un homme";

F = "la personne choisie est une femme";
D = "la personne choisie est daltonienne".
On sait que,
1
P(H) = P(F ) = = 0.5;
2
5
P(D|H) = = 0.05;
100
25
P(D|F ) = = 0.0025.
10000
128/461
Formules de Bayes
Formules de Bayes
Exercice 1 (suite).
On veut évaluer la probabilité a posteriori P(H|D).
P(D|H)P(H)
P(H|D) =
P(D)
P(D|H)P(H)
=
P(D|H)P(H) + P(D|F )P(F )
0, 05 × 0, 5
=
0, 05 × 0, 5 + 0, 0025 × 0, 5
0, 05
= = 0, 95.
0, 0525
Nous constatons que la probabilité a posteriori est largement plus grande
que la probabilité a priori.
129/461
Formules de Bayes
Formules de Bayes
Exercice 2. Soit une urne contenant trois boules blanches et cinq boules
noires. On tire deux boules au hasard et sans remise. Sachant que la
deuxième est noire, quelle est la probabilité que la première soit blanche ?
130/461
Formules de Bayes
Formules de Bayes
Réponse.
Bi = "la i e boule tirée est blanche", i = 1, 2,

Ni = "la i e boule tirée est noire", i = 1, 2.
P(N2 |B1 )P(B1 )

P(B1 |N2 ) =
P(N2 |B1 )P(B1 ) + P(N2 |N1 )P(N1 )
5
7
· 83
= 5 3
7
· 8
+ 74 · 5
8
15 15 3
= = = .
15 + 20 35 7
131/461
Formules de Bayes
Formules de Bayes
Exercice 3. Une boite contient trois pièces. La première est normale, la

seconde porte deux fois pile et la troisième est biaisée de telle manière que
pile sorte trois fois sur 4. Une pièce est tirée au hasard puis lancée. Sachant
qu’on a obtenu pile, quelle est la probabilité qu’il s’agisse de la pièce à deux
faces identiques ?
Réponse : Posons :
A1 = La pièce tirée soit normale.

A2 = La pièce tirée porte deux fois pile.
A3 = La pièce tirée soit biaisée.
A = Obtenir pile.
On cherche à évaluer la probabilité a posteriori P(A2 |A).
132/461
Formules de Bayes
Formules de Bayes
D’après la loi de Bayes, on a :

P(A|A2 )P(A2 )
P(A2 |A) =
P(A)
P(A|A2 )P(A2 )
=
P(A|A1 )P(A1 ) + P(A|A2 )P(A2 ) + P(A|A3 )P(A3 )
1
1× 3 4
= 1 1 1 3 1
= .
2
× 3
+1× 3
+ 4
× 3
9
133/461
Formules de Bayes
Formules de Bayes
Exercice 4. On suppose qu’un test de dépistage de cancer est caractérisé

par une fiabilité de 95% aussi bien pour ceux qui sont malades que ceux qui
n’ont pas cette maladie. Dans la population, 0.4% des gens ont le cancer.
Quelle est la probabilité qu’une personne ait le cancer, sachant que son test
l’indique ?
134/461
Formules de Bayes
Formules de Bayes
Réponse. Définissons les événements suivants :
C = Avoir le cancer,
D = Le test indique le cancer.
Par hypothèse, on a :
P(C) = 0.004, P(D|C) = P(D|C) = 0.95.
Par conséquent, d’après la loi de Bayes, on a :

P(D|C)P(C)
P(C|D) =
P(D|C)P(C) + P(D|C)P(C)
0.95 × 0.004
= = 0.07090.
0.95 × 0.004 + 0.05 × 0.996
135/461
Formules de Bayes
Formules de Bayes
Exercice 5. Un entrepôt est muni d’un dispositif d’alarme. Lorsqu’il y a

tentative de cambriolage, le dispositif se déclenche avec une probabilité
égale à 99%. Lorsqu’il n’y a pas tentative de cambriolage, le dispositif se
déclenche tout de même par erreur au cours d’une journée avec une
probabilité égale à 1%. En supposant qu’une tentative de cambriolage au
cours d’une journée ait lieu avec une probabilité égale à 0.1%. Sachant que
le dispositif d’alarme s’est déclenché, quelle est la probabilité qu’il le soit par
une tentative de cambriolage ?
136/461
Formules de Bayes
Formules de Bayes
Réponse. Soient les événements :
T = "Tentative de cambriolage",
D = "Dispositif se déclenche".
On sait que,
P(T ) = 0.001, P(D|T ) = 0.99, P(D|T̄ ) = 0.01.
D’après la loi de Bayes, on a

P(D|T )P(T )
P(T |D) =
P(D)
P(D|T )P(T )
=
P(D|T )P(T ) + P(D|T̄ )P(T̄ )
0.99 × 0.001
= = 0.090.
0.99 × 0.001 + 0.01 × 0.999
137/461
Variables aléatoires discrètes et continues
Introduction
Modèles probabilistes discrets
Variables aléatoires discrètes
Modèles probabilistes continus
Variables aléatoires continues
Théorème central limite et applications
Automne 2021
138/461
Introduction
Introduction
Introduction
Après avoir réalisé une expérience, il arrive bien souvent qu’on
s’intéresse plus à une fonction du résultat qu’au résultat lui-même.
Exemple. Lorsqu’on lance une pièce trois fois, il peut être intéressant de
connaître le nombre de fois où pile est apparue plutôt que la séquence
détaillée des piles et des faces. La variable "nombre de piles apparues"
notée X , est appelée variable aléatoire. Elle est définie de l’espace
échantillonnal S vers R par :
139/461
Introduction
Introduction
S −→ R
FFF 7−→ 0
FFP 7−→ 1
FPF 7−→ 1
X :
PFF 7−→ 1
FPP 7−→ 2
PFP 7−→ 2
PPF 7−→ 2
PPP 7−→ 3
Dans cet exemple, les valeurs possibles de la variable X sont 0, 1, 2, 3.
140/461
Introduction
Introduction
Nous distinguons deux types de variables aléatoires : les variables

aléatoires discrètes et les variables aléatoires continues. Nous
commencerons par examiner les variables aléatoires discrètes.
141/461
Introduction
Variables aléatoire discrète

Une variable aléatoire X est dite discrète si l’ensemble des valeurs
possibles de X est un ensemble dénombrable, c’est-à-dire de la forme :
{x1 , x2 , . . . , xn }.
Notons que la variable aléatoire de l’exemple précédent est discrète car

l’ensemble de ces valeurs possibles est {0, 1, 2, 3} qui est dénombrable.
142/461
Introduction
Fonction de masse
Soit X une variable aléatoire discrète dont les valeurs possibles sont :
x1 , x2 , . . . , xi , . . . . On appelle fonction de masse associée à la variable X ,
la fonction P(x) définie par :
p(x1 ) = P[X = x1 ],
p(x2 ) = P[X = x2 ],
.. ..
. .
p(xi ) = P[X = xi ],
.. ..
. .
Notons que : X
p(xi ) = 1.
i
143/461
Introduction
Dans l’exemple précédent, la fonction de masse est donnée par :

1
p(0) = P[X = 0] = P{FFF } = ,
8
3
p(1) = P[X = 1] = P{FFP, FPF , PFF } = ,
8
3
p(2) = P[X = 2] = P{FPP, PFP, PPF } = ,
8
1
p(3) = P[X = 3] = P{PPP} = .
8
Densité d’une variable aléatoire discrète
La densité d’une variable aléatoire discrète est représentée par le
tableau suivant :
x x1 x2 ...
p(x) p(x1 ) p(x2 ) ...
144/461
Introduction
La densité de l’exemple précédent est :

x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
La représentation graphique de la fonction de masse précédente est :
P(x)
1 6
1
2
1
4
1
8
- xi
0 1 2 3
145/461
Introduction
Espérance d’une variable aléatoire discrète

L’espérance d’une variable aléatoire X est une moyenne pondérée des
valeurs possibles de X , les poids étant les probabilités que ces valeurs
soient prises.
On calcule l’espérance µ de X à partir de sa densité :
x x1 x2 ...
p(x) p(x1 ) p(x2 ) ...
de la manière suivante :
µ = E(X ) = x1 p(x1 ) + x2 p(x2 ) + x3 p(x3 ) + · · ·
c’est-à-dire : X
µ = E(X ) = xi p(xi ).
i
146/461
Introduction
Puisque la densité de notre exemple est de la forme :

x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
donc,
1 3 3 1
µ = E(X ) = 0× +1× +2× +3×
8 8 8 8
3+6+3 12
= = = 1.5.
8 8
L’espérance peut-être interprétée graphiquement comme l’abcisse du
centre de gravité du système formé par les masses p(0), p(1), p(2) et
p(3).
147/461
Introduction
Graphe représentatif de l’espérance d’une variable aléatoire

discrète
P(x)
1 6
1
2
1
4
1
8
- xi
0 1 62 3
E(X ) = 1, 5
148/461
Introduction
Variance d’une variable aléatoire discrète

Soit une variable aléatoire discrète X de densité :
x x1 x2 ···
p(x) p(x1 ) p(x2 ) · · ·
La variance de X est définie par :
σ 2 = var(X ) = E (X − E(X ))2 = ni=1 (xi − E(X ))2 p(xi ).

P
Pour l’exemple de la diapo 58, la variance est calculée comme suit :

1 3
σ2 = (0 − 1.5)2 × + (1 − 1.5)2 ×
8 8
3 1
+(2 − 1.5)2 × + (3 − 1.5)2 × = 0.75.
8 8
149/461
Introduction
Formule pratique de la variance

La variance d’une variable aléatoire peut s’écrire sous forme :
σ 2 = var(X ) = E(X 2 ) − [E(X )]2
avec :
n
X
E(X 2 ) = xi2 p(xi ).
i=1
Pour notre exemple :

1 3 3 1 24
E(X 2 ) = 02 × + 12 × + 22 × + 32 × = = 3.
8 8 8 8 8
Par conséquent :
σ 2 = E(X 2 ) − µ2 = 3 − 1.52 = 0.75.

150/461
Introduction
Exercice 1. Le nombre de véhicules retounés à une agence de location peut

être de 0, 1, 2, 3, 4 ou 5 en une journée, avec une probabilité de
1/6, 1/6, 1/3, 1/12, 1/6 ou k /12 respectivement.
a) Déterminez la valeur de k . Rep : k = 1
b) Déterminez l’espérance du nombre de véhicules retournés. Rep :
E(X ) = 2.17
c) Déterminez la variance
pdu nombre de véhicules retournés.Rep :
var(X ) = 2.29 et σ = var(X ) = 1.51.
151/461
Introduction
Réponse.
a) La valeur de k s’obtient en utilisant le fait que :
p(0) + p(1) + p(2) + p(3) + p(4) + p(5) = 1,
ce qui est équivalent à :

1 1 1 1 1 k
+ + + + + = 1 ⇐⇒ k = 1.
6 6 3 12 6 12
b) L’espérance du nombre de véhicules retournés est :
1 1 1 1 1 1
E(X ) = 0 × +1× +2× +3× +4× +5× = 2.17.
6 6 3 12 6 12
152/461
Introduction
Réponse.
c) La variance du nombre de véhicules retournés.
var(X ) = E(X 2 ) − [E(X )]2 = E(X 2 ) − 2.172 ,
avec
1 1 1 1 1 1
E(X 2 ) = 02 × + 12 × + 22 × + 32 × + 42 × + 52 × = 7.
6 6 3 12 6 12
Donc :
var(X ) = 7 − 2.172 = 2.29.
153/461
Introduction
Définition :
Une variable aléatoire X est dite continue si l’ensemble de toutes ses
valeurs possibles est un intervalle [a, b] de R.
Exemples :
Les variables aléatoires suivantes sont continues :
1 X : durée de vie en heures d’un dispositif électronique
2 Y : température d’une région pendant 24 heures.
Densité :
On associe à chaque variable aléatoire continue X une fonction positive
f (x) appelée densité. Son rôle consiste à évaluer la probabilité que X
soit dans un intervalle [a, b]. Ainsi :
Z b
P(a ≤ X ≤ b) = f (x)dx.
a
154/461
Introduction
La probabilité P(a ≤ X ≤ b) est représentée graphiquement par la

surface suivante :
f (x) 6
P(a ≤ X ≤ b)

=
- x
6
a b
a≤X ≤b
155/461
Introduction

Propriétés d’une densité :
Si f (x) est la densité d’une variable aléatoire continue alors
1. f (x) ≥ 0,
R +∞
2. −∞ f (x)dx = 1.
f (x) 6 R∞
−∞
f (x)dx = 1

=
- x
156/461
Introduction
Remarque : Si X est une variable aléatoire continue, alors
1. P(X = x) = 0 ∀x ∈ R,
2. P(X < x) = P(X ≤ x),
3. P(X > x) = P(X ≥ x),
4. P(a < X < b) = P(a ≤ X ≤ b).
157/461
Introduction
Espérance d’une variable aléatoire continue

Soit X une variable aléatoire continue de densité f (x). L’espérance
mathématique (ou moyenne) de X est donnée par la formule suivante :
Z +∞
µ = E(X ) = xf (x)dx.
−∞
Variance d’une variable aléatoire continue

La variance d’une v.a X de densité f (x) se calcule par :
σ 2 = var(X ) = E(X 2 ) − [E(X )]2 ,
avec :
Z +∞
E(X 2 ) = x 2 f (x)dx.
−∞
158/461
Introduction
Fonction de répartition d’une variable aléatoire continue

Soit X une variable aléatoire continue de densité f (x). On appelle
fonction de répartition de X , la fonction F (x) définie par :
Z x
F (x) = P(X ≤ x) = f (t)dt.
−∞
f (x) 6 F (x) = P(X ≤ x)

=
-x
x
159/461
Introduction
Le rôle de la fonction de répartition est de faciliter le calcul de

probabilités pour des variables aléatoires continues. Ainsi :
P(a ≤ X ≤ b) = F (b) − F (a).
Médiane d’une variable aléatoire continue

On appelle médiane d’une variable aléatoire continue X , la valeur réelle
m telle que :
P(X ≤ m) = P(X ≥ m) = 1/2.
Remarque. La médiane m d’une variable aléatoire X de fonction de

répartition F est déterminée par :
F (m) = 1/2.
160/461
Introduction
Remarque. La densité f (x) et la fonction de répartition F (x) d’une variable

aléatoire continue sont liées par les formules suivantes :
Z x
F (x) = f (t)dt et F 0 (x) = f (x).
−∞
161/461
Introduction
Exercice 1.
Soit X une variable aléatoire continue de densité

 x + 1/2 si 0 ≤ x ≤ 1,
f (x) =
0 sinon.

1. Vérifiez que f (x) est une densité.

2. Calculez E(X ). Rep : E(X ) = 7/12.
3. Calculez var(X ). Rep : var(X ) = 11/144
4. Calculez la fonction de répartition de X .
5. En déduire P(1/4 ≤ X ≤ 3/4). Rep : 1/2
√
6. Quelle est la médiane de X ? Rep : m = ( 5 − 1)/2 = 0.618
162/461
Introduction
Réponse.
1) f (x) est une densité, car d’une part f (x) ≥ 0 pour tout x ∈ R et d’autre
part :
∞ 1 1
x2
Z Z
x 1 1
f (x)dx = (x + 1/2)dx = + = + = 1.
−∞ 0 2 2 0 2 2
2) L’espérance de X est :
Z ∞ Z 1
E(X ) = xf (x)dx = x(x + 1/2)dx
−∞ 0
1
x3 x2

= +
3 4 0
1 1 7
= + = .
3 4 12
163/461
Introduction
Réponse.
3) Pour calculer la variance de X , on évalue d’abord E(X 2 ) comme suit :
Z ∞ Z 1
E(X 2 ) = x 2 f (x)dx = x 2 (x + 1/2)dx
−∞ 0
1
x4 x3

= +
4 6 0
1 1 5
= + = .
4 6 12
Donc
2
5 7 11
var(X ) = E(X 2 ) − [E(X )]2 = − = .
12 12 144
164/461
Introduction
Réponse.
4) Fonction de répartition de X est définie par F (x) = P(X ≤ x) pour tout
x ∈ R. Elle se calcule comme suit :

 0 si x < 0,




F (x) = x 2 +x
2
si 0 ≤ x ≤ 1,





1 x > 1.
Car si x < 0, on a F (x) = 0, si x > 1, on a F (x) = 1 et si 0 ≤ x ≤ 1, on

a: Z x
x2 x x2 + x
F (x) = (t + 1/2)dt = + = .
0 2 2 2
165/461
Introduction
Réponse.
5) Calculons P(1/4 ≤ X ≤ 3/4). Notons que
P(1/4 ≤ X ≤ 3/4) = F (3/4) − F (1/4)

3 2 1 2
+ 34 1

4 4
+ 4
= −
2 2
1
= .
2
166/461
Introduction
Réponse.
6) La médiane de X est la valeur m telle que P(X ≤ m) = 1/2, c’est-à-dire
F (m) = 1/2. Ce qui revient à résoudre
m2 + m 1
= ⇐⇒ m2 + m − 1 = 0.
2 2
Cette dernière équation possède deux solutions :
√ √
−1 − 5 −1 + 5
m= < 0 et m = > 0.
2 2
Donc la médiane sera :
√
−1 + 5
m= = 0.6180
2
167/461
Loi de Bernoulli
Variables aléatoires discrètes et continues Loi Binomiale
Modèles probabilistes discrets Loi géométrique
Modèles probabilistes continus Loi de Pascal
Théorème central limite et applications Modèle de Poisson
Loi Hypergéométrique
Automne 2021
168/461
Loi de Bernoulli
Loi de Bernoulli
Épreuve de Bernoulli
Une épreuve de Bernoulli est une expérience aléatoire qui présente deux
résultats possibles interprétés comme un échec ou un succès. L’espace
échantillonnal associé à cette expérience sera :
S = {succès, échec}.
Exemples.
1. On lance une pièce, deux résultats sont possibles : pile P ou face F .
P : succès F : échec.
2. On lance un dé et on s’intéresse à la face 1. On définit
{1} : succès {2, 3, 4, 5, 6} : échec.
169/461
Loi de Bernoulli
Loi de Bernoulli
Variable aléatoire de Bernoulli

On associe à chaque épreuve de Bernoulli une variable aléatoire X
définie par :

1 si on observe un succès,
X =
0 si on observe un échec.
Une telle variable aléatoire est appelée variable aléatoire de Bernoulli.

La probabilité p = P(X = 1) est appelée probabilité de succès. On note
alors X ∼ Ber(p).
La variable aléatoire de Bernoulli associée à l’exemple 2 est :

1 si on observe 1,
X =
0 si on observe 2, 3, 4, 5 ou 6.
Par conséquent X ∼ Ber 16 .

170/461
Loi de Bernoulli
Loi de Bernoulli
Espérance et variance d’une variable aléatoire de Bernoulli

Notons que la densité d’une variable aléatoire X de Bernoulli est :
x 0 1
p(x) 1−p p
Par suite l’espérance et la variance de X seront données par :
E(X ) = p et var(X ) = p(1 − p).

Preuve à faire en exercice.
171/461
Loi de Bernoulli
Loi Binomiale
Définition de la loi binomiale

On répète n épreuves de Bernouilli indépendantes de même probabilité de
succès p. On s’intéresse à la variable X définie par :
X : Nombre de succès obtenus parmi n essais.
Cette variable aléatoire suit une loi appelée loi binomiale de paramètres n et
p. On note :
X ∼ B(n, p).
172/461
Loi de Bernoulli
Loi Binomiale
Fonction de masse de la loi B(n, p)

La fonction de masse d’une variable aléatoire X de loi binomiale est
définie par :

n
P(k ) = P(X = k ) = pk (1 − p)n−k , k = 0, 1, 2, . . . , n
k
avec :

n n! Nombre de façons d’obtenir exactement k
= :
k k !(n − k )! succès parmi n.
et
La probabilité d’obtenir exactement k suc-
pk (1 − p)n−k :
cès parmi n essais pour un ordre fixé.
173/461
Loi de Bernoulli
Loi Binomiale
Exercice. Une pièce de monnaie équilibrée est lancée à cinq reprises.

Quelle est la probabilité d’avoir pile au moins trois fois ?
Réponse.
X : Nombre de piles obtenus parmi cinq essais

p = P(succès) = P(pile) = 21 .
D’où, X ∼ B(n = 5, p = 0.5), par conséquent :
P(X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5)
174/461
Loi de Bernoulli
Loi Binomiale
Il en résulte que :

5
P(X ≥ 3) = (0.5)3 (1 − 0.5)5−3
3

5
+ (0.5)4 (1 − 0.5)5−4
4

5
+ (0.5)5 (1 − 0.5)5−5
5
= 10 × (0.5)5 + 5 × (0.5)5 + (0.5)5
= 0.5
175/461
Loi de Bernoulli
Loi Binomiale
Remarque.
1. Il est clair que B(1, p) = Ber(p).
2. Pour toute v.a X de loi binomiale B(n, p), alors il existe une suite de v.a
X1 , . . . , Xn indépendantes et identiquement distriduées de loi de
Bernoulli de paramètre p telles que
X = X1 + · · · + Xn .
Espérance et variance de la loi binomiale

Soit X une variable aléatoire de loi B(n, p), alors
E(X ) = np et var(X ) = np(1 − p).
176/461
Loi de Bernoulli
Loi Binomiale
Exercice 1. On veut transmettre un message électronique composé des

digits 0 et 1. Les conditions imparfaites de transmission font de sorte qu’il y a
une probabilité égale à 0.1 qu’un 0 soit changé en un 1 et un 1 en 0 lors de la
réception, et ce de manière indépendante pour chaque digit. Pour améliorer
la qualité de la transmission, on propose de transmettre le bloc 00000 au lieu
de 0 et le bloc 11111 au lieu de 1 et de traduire une majorité de 0 dans un
bloc lors de la réception par 0 et une majorité de 1 par 1.
a) Quelle est la probabilité de recevoir une majorité de 1 si 00000 est
transmis ?
b) Est ce que ce procédé a amélioré la qualité de la transmission ?
Justifier ?
177/461
Loi de Bernoulli
Loi Binomiale
Solution de l’exercice 1. Soit X la variable aléatoire définie par
X : nombre de 0 changé en 1 lorsque le bloc 00000 est envoyé.
Il est clair que X suit une loi binomiale B(n = 5, p = 0.10).

a) La probabilité de recevoir une majorité de 1 si 00000 est transmis est
équivalent P(X ≥ 3) qui se calcule comme suit :
P(X = 3) + P(X = 4) + P(X = 5)

! ! !
5 3 2 5 4 5 5
= p (1 − p) + p (1 − p)1 + p (1 − p)0
3 4 5
= 0.00856.
b) Le procédé a effectivement amélioré la qualité de transmission, car il a

réduit l’erreur de transmission de 0.10 à 0.00856.
178/461
Loi de Bernoulli
Loi Binomiale
Exercice 2. On sait que les disquettes produites par une certaine firme sont
défectueuses avec une probabilité de 0.05, indépendamment les unes des
autres. La compagnie vend les disquettes par lot de 10. On choisi un lot par
hasard, quelle est la probabilité qu’il contient
a) Au moins deux disquettes défectueuses.
b) La firme garantie avec remboursement qu’au plus 1 des 10 disquettes
du lot est défectueuse. à l’achat de 5 lots, quelle est la probabilité que 2
lots exactement doivent être retournés ?
179/461
Loi de Bernoulli
Loi Binomiale
a) Pour calculer qu’un lot pris au hasard contient au moins deux disquettes
défectueuses, on considère la variable aléatoire
X = Nombre de pièce défectueuses parmi 10
On voit que X suit une loi binomiale B(n = 10, p = 0.05). Ainsi la
probabilité qu’un lot pris au hasard contient au moins 2 disquettes
défectueuses est
P(X ≥ 2) = 1 − P(X < 2) = 1 − P(X = 0) − P(X = 1)

! !
10 0 10 10 1
= 1− p (1 − p) − p (1 − p)9 = 0.0861.
0 1
180/461
Loi de Bernoulli
Loi Binomiale
b) On considère la variable aléatoire Y définie par
Y = Nombre de lot à retourner parmi 5
il est clair que Y suit une loi binomiale B(n = 5, p = 0.0861) car p
désigne la probabilité qu’un lot contient au moins deux disquettes
défectueuses que nous avons calculé en a). Finalement,
P[que deux lots exactement doivent être retournés]

= P(Y = 2)
!
5
= (0.0861)2 (1 − 0.0861)3 = 0.0566.
2
181/461
Loi de Bernoulli
Loi Binomiale
Exercice 3. On joue à pile ou face avec une pièce de monnaie équilibrée

selon la règle suivante : si la pièce montre face à la suite d’un jet, on gagne
1$, sinon on perd 1$. On suppose qu’on joue 10 fois. On définie les variables
aléatoires
X : nombre de faces obtenues parmi 10 lancers de la pièce.
Y : Gain net à la fin du jeu.
a) Donnez la loi de X .
b) Établissez une relation entre X et Y .
c) Calculez la probabilité qu’à la fin du jeu :
1. le gain net soit supérieur ou égal à 4$.
2. le gain net soit nul.
182/461
Loi de Bernoulli
Loi Binomiale
a) La loi de X est une binomiale B(n = 10, p = 0.5)
b) La relation entre X et Y est :
Y = 1$ × X + (−1)$ × (10 − X ) = 2X − 10
c.1) La probabilité qu’à a fin du jeu, le gain net soit supérieur ou égal à 4
égale
P(Y ≥ 4) = P(2X − 10 ≥ 4)
= P(X ≥ 7)
= P(X = 7) + P(X = 8) + P(X = 9) + P(X = 10)
! !
10 7 3 10
= 0.5 × 0.5 + 0.58 × 0.52
7 8
! !
10 9 1 10
+ 0.5 × 0.5 + 0.510 × 0.50 = 0.1719.
9 10
183/461
Loi de Bernoulli
Loi Binomiale
c.2) La probabilité qu’à a fin du jeu, le gain net soit nul égale
P(Y = 0) = P(2X − 10 = 0)
= P(X = 5)
!
10
= 0.55 × 0.55 = 0.2461.
5
184/461
Loi de Bernoulli
Loi géométrique
Loi géométrique
On considère une série d’épreuves de Bernouilli indépendantes et de même
probabilité de succès p. On s’intéresse à la variable aléatoire X définie par :
X : Nombre d’essais nécessaires pour observer le 1er succès.
Cette variable aléatoire suit une loi géométrique de paramètre p et on

note :
X ∼ G(p).
185/461
Loi de Bernoulli
Loi géométrique
Fonction de masse d’une loi géométrique

La fonction de masse d’une variable aléatoire X de loi G(p) de
paramètre p est déterminée de la manière suivante :
X =1 ↔ S ↔ p(1) = p
X =2 ↔ ES ↔ p(2) = (1 − p)p
X =3 ↔ EES ↔ p(3) = (1 − p)2 p
.. .. ..
. . .
X =k ↔ E . . . ES ↔ p(k ) = (1 − p)k −1 p.
.. .. ..
. . .
186/461
Loi de Bernoulli
Loi géométrique
Par conséquent, la fonction de masse de X est :
p(k ) = P(X = k ) = (1 − p)k −1 p, k = 1, 2, 3, 4, . . .
Espérance et variance d’une loi géométrique

Si X ∼ G(p) alors,
E(X ) = 1/p et var(X ) = (1 − p)/p2 .

Remarque. Les lois binomiale et géométrique ont les mêmes
hypothèses. Pour la loi binomiale, le nombre d’essais, noté n, est fixé à
l’avance mais pour la loi géométrique, le nombre d’essais n’est pas fixé
à l’avance et on s’arrête au premier succès.
187/461
Loi de Bernoulli
Loi géométrique
Propriété : Soit X une variable aléatoire de loi G(p), alors :
1. P[X > k ] = (1 − p)k ,

2. P(X = n + m|X > m) = P(X = n).
Notons que cette dernière propriété est appelée propriété sans

mémoire.
188/461
Loi de Bernoulli
Loi géométrique
Exercice 1. Un archer atteint la cible 3 fois sur 5 en moyenne. Cet archer

effectue une série de tirs indépendants. Calculez :
a) la probabilité qu’il atteigne la cible la première fois au cinquième tir ;
b) la probabilité qu’il atteigne la cible la première fois en plus de 4 tirs ;
c) la probabilité qu’il atteigne la cible la première fois au dixième tir étant
donné qu’il ne l’a pas atteinte aux 3 premiers tirs.
189/461
Loi de Bernoulli
Loi géométrique
Solution de l’exercice 1. La variable aléatoire X : le nombre de tire pour

atteindre la cible suit une loi G(p) avec p = 3/5 = 0.6.
a) La probabilité qu’il atteigne la cible la première fois au cinquième tir est
donnée par
P(X = 5) = (1 − p)4 p = 0.44 × 0.6 = 0.01536.
b) la probabilité qu’il atteigne la cible la première fois en plus de 4 tirs est
P(X > 4) = (1 − p)4 = 0.44 = 0.0256.
190/461
Loi de Bernoulli
Loi géométrique
c) la probabilité qu’il atteigne la cible la première fois au dixième tir étant

donné qu’il ne la pas atteinte aux 3 premiers tirs sera :
P(X = 10|X > 3) = P(X = 7) : propriété sans mémoire

= (1 − p)6 p = 0.46 × 0.6 = 0.00246.
191/461
Loi de Bernoulli
Loi géométrique
Exercice 2. Supposons que le coût d’une expérience soit de 1 000$. Si

l’expérience rate, il y a des frais supplémentaires de 300$ pour des
réparations qu’il faut effectuer avant le prochain essai. Si à chaque essai, la
probabilité de succès est 0.2, que les essais sont indépendants et que l’on
continue les expériences jusqu’à ce qu’on obtienne un résultat couronné de
succès, quelle est l’espérance du coût de la procédure complète ?
192/461
Loi de Bernoulli
Loi géométrique
Solution de l’exercice 2. Considérons la variable aléatoire :
X : nombre d’expériences jusqu’a ce qu’on obtienne un résultat couronné de succès.
Il est clair que X ∼G(p = 0.2). Posons,
Y : coût de la procédure complète.
Les variables aléatoires X et Y sont liées par l’équation :
Y = 1300(X − 1) + 1000 = 1300X − 300.
Donc l’espérance du coût de la procédure complète est :

1300 1300
E(Y ) = 1300E(X ) − 300 = − 300 = − 300 = 6200$.
p 0.2
193/461
Loi de Bernoulli
Loi de Pascal
Loi binomiale négative appelée aussi loi de Pascal

On exécute une série d’épreuves de Bernouilli indépendantes et de même
probabilité de succès p. On fixe un nombre r et on s’intéresse à la variable
aléatoire X définie par :
X : nombre d’essais minimal nécessaire pour obtenir r succès.
La loi de cette v.a X est appelée loi de Pascal ou loi binomiale

négative de paramètres r et p, et on note :
X ∼ BN(r , p)
où
r : désigne le nombre de succès fixé à l’avance,
et
p : désigne probabilité de succès.
194/461
Loi de Bernoulli
Loi de Pascal
Fonction de masse d’une binomiale négative

Notons que les valeurs possibles d’une variable aléatoire X de loi
BN(r , p) sont : r , r + 1, r + 2, . . . .
La fonction de masse de X est :

k −1
P(k ) = P(X = k ) = (1 − p)k −r pr k = r , r + 1, r + 2, . . .
r −1

k −1 Nombre de façons d’obtenir exactement r −
:
r −1 1 succès parmi k − 1 essais.
et
La probabilité d’obtenir exactement r suc-
(1 − p)k −r pr :
cès parmi k essais pour un ordre fixé.
195/461
Loi de Bernoulli
Loi de Pascal
Remarques.
1. La loi géométrique est un cas particulier de loi Pascal pour r = 1.
2. Toute variable aléatoire de loi de Pascal BN(r , p) peut-être vue comme

la somme de r variables aléatoires indépendantes et de même loi
géométrique G(p). En effet, définissons les variables aléatoires
suivantes :
Y1 : nombre d’essais nécessaires pour le premier succès,
Y2 : nombre d’essais nécessaires supplémentaires pour le 2e succès,
Y3 : nombre d’essais nécessaires supplémentaires pour le 3e succès,
..
.
Yr : nombre d’essais nécessaires supplémentaires pour le r e succès.
196/461
Loi de Bernoulli
Loi de Pascal
Il est clair que les variables aléatoires Y1 , . . . , Yr sont indépendantes et

de même loi géométrique G(p), et que la variable aléatoire :
Y = Y1 + Y2 + · · · + Yr
est nécessairement distribuée selon loi de Pascal BN(r , p).

Conclusion. Pour toute variable aléatoire Y de loi de Pascal BN(r , p), il
existe r v.a Y1 , . . . , Yk indépendantes, et de loi géométrique G(p) telles
que :
Y = Y1 + Y2 + · · · + Yr .
197/461
Loi de Bernoulli
Loi de Pascal
Espérance et variance d’une loi binomiale négative

Si X ∼ BN(r , p) alors,
E(X ) = r /p, et var(X ) = r (1 − p)/p2 .
198/461
Loi de Bernoulli
Loi de Pascal
Exercice 1. Deux équipes de sportifs disputent une série de matchs. La

première équipe à enregistrer 4 victoires est déclarée gagnante de la série.
On admet que l’une d’elles est plus forte que l’autre et remporte un match
avec probabilité 0.6, indépendamment de l’issue des autres parties.
a) Trouvez la probabilité que l’équipe la plus forte remporte la série en 6
jeux exactement.
b) Sachant que l’équipe la plus forte a gagné les deux premiers matchs,
quelle est la probabilité qu’elle remporte la série en 7 jeux exactement.
199/461
Loi de Bernoulli
Loi de Pascal
Solution de l’exercice 1. Soit X le nombre de jeux nécessaires pour que

l’équipe la plus forte reporte la série. On voit que X ∼ BN(r = 4, p = 0.6)
a) La probabilité pour que l’équipe la plus forte remporte la série en 6 jeux
exactement est :
! !
6−1 4 6−4 5
P(X = 6) = p (1 − p) = 0.64 × 0.42 = 0.20736.
4−1 3
b) Soit Y le nombre de jeux additionnels pour que l’équipe la plus forte

reporte la série sachant qu’elle a gagné les deux premiers matchs. Il est
clair que Y ∼ BN(r = 2, p = 0.6). Donc, la probabilité désirée sera :
! !
5−1 2 5−2 4
P(Y = 5) = p (1 − p) = 0.62 × 0.43 = 0.09216.
2−1 1
200/461
Loi de Bernoulli
Loi de Pascal
Exercice 2. Il se présente un client potentiel à l’heure chez un

concessionnaire automobile où un vendeur a chaque fois une chance sur 10
de conclure une transaction. Cet employé est déterminé à continuer de
travailler jusqu’à ce qu’il ait vendu trois véhicules. Calculez la probabilité :
a) qu’il doive travailler exactement huit heures. Rép : 0.0124,
b) qu’il doive travailler plus que huit heures. Rép : 0.9619.
201/461
Loi de Bernoulli
Loi de Pascal
Solution de l’exercice 2. Considérons la variable aléatoire :
X = nombre d’heures de travail nécessaires pour vendre 3 véhicules.
Cette variable suit la loi BN(r = 3, p) où p = 0.1 représente la probabilité

pour que le vendeur conclue une transaction durant une heure.
a) La probabilité pour que le vendeur faille travailler exactement huit heures
est :
! !
8−1 3 8−3 7
P(X = 8) = p (1 − p) = 0.13 × 0.95 = 0.0124.
3−1 2
202/461
Loi de Bernoulli
Loi de Pascal
b) La probabilité qu’il lui faille travailler plus que huit heures :
P(X > 8) = 1 − P(X ≤ 8)

8
X
= 1− P(X = k )
k =3
8
!
X k −1 3
= 1− p (1 − p)k −3
3−1
k =3
203/461
Loi de Bernoulli
Loi de Pascal
Cette dernière se devient ;

! ! !
2 3 3 3 4 3
P(X > 8) = 1− p − p (1 − p) − p (1 − p)2
2 2 2
! !
5 3 3 6 3
− p (1 − p) − p (1 − p)4
2 2
!
7 3
− p (1 − p)5 = 0.9619.
2
204/461
Loi de Bernoulli
Modèle de Poisson
Modèle de Poisson
Dans plusieurs situations pratiques, on s’intéresse au nombre de réalisations
d’un événement dans un intervalle de temps donné ou dans un espace
donné.
Exemples.
X = le nombre d’appels téléphoniques vers une destination
donnée en une heure.
1 heure
6 6
X = le nombre de pannes d’un réseau informatique enregis-
trées en une année.
1 année
• • •
205/461
Loi de Bernoulli
Modèle de Poisson
X = le nombre de graines ou météorites qui tombent sur une

portion de sol délimitée.
. espace
. . .
..

donné
Le modèle probabiliste approprié pour décrire de tels phénomènes est

appelé modèle de Poisson. Son principe est le suivant :
On fixe un intervalle unitaire de temps [0, 1] et un événement A particulier.
On s’intéresse à la variable aléatoire
X = nombre de réalisations de l’événement A dans [0, 1].
206/461
Loi de Bernoulli
Modèle de Poisson
Cette variable aléatoire suit une loi particulière appelée loi de Poisson de
paramètre λ. On écrit :
X ∼ P(λ)
où λ désigne le nombre moyen de réalisations dans [0, 1]. On le détermine
expérimentalement.
Fonction de masse
Si X ∼ P(λ) alors sa fonction de masse est donnée par
λk e−λ
p(k ) = P(X = k ) = , k = 0, 1, 2, . . . ,
k!
où p(k ) est la probabilité que l’événement se réalise k fois pendant une unité
de temps fixée.
207/461
Loi de Bernoulli
Modèle de Poisson
Remarque : p(k )} est bien une fonction de masse, car :

∞ ∞ ∞
X X λk e−λ X λk
p(k ) = = e−λ = e−λ eλ = e0 = 1.
k! k!
k =0 k =0 k =0
Espérance et variance d’une variable de la loi de Poisson

Si X ∼ P(λ) alors
E(X ) = λ
et
var(X ) = λ.
208/461
Loi de Bernoulli
Modèle de Poisson
Processus de Poisson
Le processus de Poisson décrit le nombre de réalisations dans un
intervalle de temps quelconque [0, t]. Ainsi, la variable aléatoire définie
par :
Nt : nombre de réalisations d’un événement dans [0, t]
suit une loi de Poisson de paramètre λt :
Nt ∼ P(λt)
où λ est le nombre moyen de réalisations pendant une unité de temps.

La fonction de masse de Nt est donnée par :
(λt)k e−λt
pt (k ) = , k = 0, 1, 2, . . . .
k!
209/461
Loi de Bernoulli
Modèle de Poisson
Exercice 1. En un point A d’une autoroute, le nombre de véhicules qui

passent en une minute dans une direction suit une loi de Poisson de
paramètre λ = 2.
a) Quelle est la probabilité qu’il y ait exactement trois véhicules qui passent
en une minute ?
b) Quelle est la probabilité qu’il y ait exactement trois véhicules qui passent
en cinq minutes ?
210/461
Loi de Bernoulli
Modèle de Poisson
Solution de l’exercice 1. Le nombre X de véhicules qui passent en une

minute dans une direction d’une autoroute est une variable aléatoire qui suit
une loi de Poisson de paramètre λ = 2
a) La probabilité qu’il y ait exactement trois véhicules qui passent en une
minute est :
λk e−λ 23 e−2
P(X = 3) = = = 0.180447.
k! 3!
b) Le nombre Y de véhicules qui passent en 5 minute dans une direction
de cette autoroute est une variable aléatoire qui suit une loi de Poisson
de paramètre λ = 5 × 2 = 10. Donc, la probabilité qu’il y ait exactement
trois véhicules qui passent en cinq minutes est :
λk e−λ 103 e−10

P(Y = 3) = = = 0.00757.
k! 3!
211/461
Loi de Bernoulli
Modèle de Poisson
Exercice 2. Soit X une variable aléatoire qui suit une loi de Poisson de
paramètre λ. Sachant que P(X = 0) = 0.1, calculer : P(X = 1), P(X > 3) et
P(X = 2|X > 1). Rép : 0.2303, 0.2011 et 0.3958.
212/461
Loi de Bernoulli
Modèle de Poisson
Solution de l’exercice 2. Soit X ∼ P(λ) telle que P(X = 0) = 0.1. On

cherche d’abord la valeur de λ telle que P(X = 0) = 0.1. C’est-à-dire :
λ0 e−λ
= 0.1 ce qui implique λ = − ln(0.1) = 2.302585.
0!
a) La probabilité P(X = 1) est
λ1 e−λ
P(X = 1) = = 2.302585 × e−2.302585 = 0.2305.
1!
213/461
Loi de Bernoulli
Modèle de Poisson
b) La probabilité P(X > 3) est
P(X > 3) = 1 − P(X ≤ 3)

= 1 − P(X = 0) − P(X = 1)
−P(X = 2) − P(X = 3)
2.3025852 × e−2.302585
= 1 − 0.1 − 0.2305 −
2!
2.3025853 × e−2.302585
−
3!
= 0.2011.
214/461
Loi de Bernoulli
Modèle de Poisson
c) La probabilité P(X = 2|X > 1) est
P(X = 2 ∩ X > 1)
P(X = 2|X > 1) =
P(X > 1)
P(X = 2)
=
1 − P(X = 0) − P(X = 1)
0.2650949
= = 0.3959.
1 − 0.1 − 0.2305
215/461
Loi de Bernoulli
Modèle de Poisson
Exercice 3. On admet que le nombre d’accidents survenant sur une

autoroute quotidiennement est une variable aléatoire qui suit une loi de
Poisson de moyenne 0.1.
a) Quelle est la probabilité qu’il survienne exactement 1 accident durant
une semaine ?
b) Quelle est la probabilité qu’il surviennent au moins 3 accidents en quatre
jours ?
c) Sachant qu’au moins un accident a eu lieu en un jour, quelle est la
probabilité qu’il surviennent au moins 3 accidents en un jour ?
216/461
Loi de Bernoulli
Modèle de Poisson
Solution de l’exercice 3. Le nombre d’accidents survenant sur une

autoroute quotidiennement est une variable aléatoire X ∼ P(λ = 0.1).
a) Notons que le nombre d’accidents survenant sur cette autoroute en une
semaine est Y ∼ P(λ = 7 × 0.1 = 0.7). Ainsi, la probabilité qu’il
surviennent exactement 1 accident durant une semaine est :
λ1 e−λ
P(Y = 1) = = 0.7 × e−0.7 = 0.3476.
1!
217/461
Loi de Bernoulli
Modèle de Poisson
b) De même, le nombre d’accidents survenant sur cette autoroute en

quatre jours est Z ∼ P(λ = 4 × 0.1 = 0.4). Donc, la probabilité qu’il
surviennent au moins 3 accidents en quatre jours est :
P(Z ≥ 3) = 1 − P(Z < 3)

= 1 − {P(Z = 0) + P(Z = 1) + P(Z = 2)}
0.42 × e−0.4

= 1 − e−0.4 + 0.4 × e−0.4 +
2
= 0.0079.
218/461
Loi de Bernoulli
Modèle de Poisson
c) La probabilité qu’il surviennent au moins 3 accidents en un jour sachant

qu’au moins un accident a eu lieu en un jour est :
P(X ≥ 3 ∩ X ≥ 1)
P(X ≥ 3|X ≥ 1) =
P(X ≥ 1)
P(X ≥ 3)
=
P(X ≥ 1)
1 − P(X < 3)
=
1 − P(X < 1)
1 − P(X = 0) − P(X = 1) − P(X = 2)
=
1 − P(X = 0)
e−0.1
1 − e−0.1 − 0.1 × e−0.1 − 0.12 × 2!
=
1 − e−0.1
= 0.0016.
219/461
Loi de Bernoulli
Loi hypergéométrique
La loi hypergéométrique est la loi d’une variable aléatoire qui gère les tirages
sans remise. Plus précisément, soit une population qui contient a succès et b
échecs. La taille totale de la population est N.
a + b = N.
On prélève m individus sans remise de cette population et on s’intéresse

au nombre de succès parmi ces m individus :
X = nombre de succès parmi les m individus.
La loi de cette variable aléatoire est appelée loi hypergéométrique et on

écrit :
X ∼ h(N, m, a, b).
220/461
Loi de Bernoulli
Fonction de masse d’une loi hypergéométrique

Soit X une variable aléatoire qui suit la loi ∼ h(N, m, a, b). La fonction de
masse de X peut être déterminée de la manière suivante :
nombre de cas favorables
P(k ) = P(X = k ) = .
nombre de cas possibles
Il est clair que le nombre de cas possibles est :

N
.
m
Par contre, le nombre de cas favorables est :

a b
k m−k
221/461
Loi de Bernoulli
Ceci découle du fait que :
a b
S E

A
K
A
k succès m − k échecs
l l
a b
k m−k
222/461
Loi de Bernoulli
Par conséquent, la fonction de masse de X sera :

a b
k m−k
P(k ) = , k = 0, 1, . . . , min(m, a).
N
m
223/461
Loi de Bernoulli
Espérance et variance de la loi hypergéométrique
Si X ∼ h(N, m, a, b) alors,
ma ma(N − a)(N − m)
E(X ) = et var(X ) = .
N N 2 (N − 1)
224/461
Loi de Bernoulli
Exercice 1. Une urne contient 15 boules rouges et 20 noires. On a tiré 10

boules. Calculer la probabilité d’obtenir exactement 4 noires.
a) Si le tirage était avec remise.
b) Si le tirage était sans remise.
225/461
Loi de Bernoulli
Solution de l’exercice 1. Soit X la variable aléatoire définie par :X =nombre

de boules noires parmi 10 tirées d’une urne contenant 15 rouges et 20
noires.
a) Si le tirage était avec remise alors X ∼ B(n = 10, p = 20/35). Dans ce
cas, la probabilité d’obtenir exactement 4 noires est :
!
4 6
10 20 15
P(X = 4) = = 0.1387.
4 35 35
b) Si le tirage était sans remise alors

X ∼ h(N = 35, m = 10, a = 20, b = 15). Dans ce cas, la probabilité
d’obtenir exactement 4 noires est :
20 15

4
P(X = 4) = 35
6 = 0.1321.
10
226/461
Loi de Bernoulli
Exercise 2. Un électricien achète des composants par paquets de 10. Sa

technique de contrôle est de n’examiner que trois des composants, tirés au
hasard dans le paquet, et de n’accepter le lot de 10 que si les trois
composants examinés sont sans défaut. Si chaque paquet contient 4
composants défectueux, quelle proportion des paquets cet électricien
rejettera-t-il ?
227/461
Loi de Bernoulli
Solution de l’exercice 2. Soit X la variable aléatoire définie par X =nombre

de pièces défectueuses parmi 3 tirées d’un paquet de 10 contenant 4
défectueuses. Cette variable aléatoire suit la loi
h(N = 10, m = 3, a = 4, b = 6). La proportion des paquets rejetée par cet
électricien sera :
4 6

0 3 5
P(X ≥ 1) = 1 − P(X = 0) = 1 − 10 = .
3
6
228/461
Variables aléatoires discrètes et continues Loi Uniforme
Modèles probabilistes discrets Loi Exponentielle
Modèles probabilistes continus Loi Gamma
Théorème central limite et applications Loi Normale
Automne 2021
229/461
Loi Uniforme
Loi uniforme
Une variable aléatoire X est dite uniformément distribuée sur un intervalle
[a, b] si sa densité est de la forme :

 1/(b − a) si a ≤ x ≤ b,
f (x) =
0 sinon.

On écrit X ∼ U[a,b] et on lit X suit une loi uniforme sur [a, b].
230/461
Loi Uniforme
Graphique de la densité de la loi uniforme U[a,b]
f (x)
6 surface = 1
1
b−a

- x
a b
231/461
Loi Uniforme
Espérance et variance de la loi uniforme

Si X suit une loi uniforme sur [a, b], alors :
a+b (b − a)2
E(X ) = et var(X ) = .
2 12
Fonction de répartition de la loi uniforme
La fonction de répartition d’une variable aléatoire X de loi U[a,b] est
donnée par

 0
 si x ≤ a,



F (x) = (x − a)/(b − a) si a ≤ x ≤ b,




1 si x ≥ b.

232/461
Loi Uniforme
Conséquence : Si X ∼ U[a,b] alors :
d −c
P(c ≤ X ≤ d) = ∀ c, d ∈ [a, b].
b−a
f (x)
d−c
6 P(c ≤ X ≤ d) = b−a
1
b−a

/

- x
a c d b
233/461
Loi Uniforme
Exercice 1. Vous arrivez à un arrêt de bus à 10h sachant que le bus arrivera
à un certain instant qui est distribué selon une loi uniforme entre 10h et
10h30.
a) Quelle est la probabilité que vous deviez attendre plus que 10 minutes ?
b) Si à 10h15 le bus n’est pas encore arrivé, quelle est la probabilité que
vous deviez attendre au moins 10 minutes supplémentaires ?
234/461
Loi Uniforme
Solution de l’exercice 1. Considérons la variable aléatoire définie par
X : instant d’arrivée du bus.
Pour simplifier l’exercice, on remplacera l’intervalle de temps [10h,10h30] par

[0, 30]. Il est clair que X ∼ U[0,30] .
a) La probabilité d’attendre plus que 10 minutes est :
30 − 10 20 2
P(10 ≤ X ≤ 30) = = = .
30 − 0 30 3
235/461
Loi Uniforme
b) Si à 10h15 le bus n’est pas encore arrivé, la probabilité que vous deviez
attendre au moins 10 minutes supplémentaires est :
P(25 ≤ X ≤ 30, 15 ≤ X ≤ 30)
P(25 ≤ X ≤ 3015 ≤ X ≤ 30) =
P(15 ≤ X ≤ 30)
P(25 ≤ X ≤ 30)
=
P(15 ≤ X ≤ 30)
30−25
30−0 5 1
= 30−15
= = .
30−0
15 3
Remarquons que cette probabilité peut être calculée en utilisant la v.a

Y ∼ U[15,30] . En effet, la probabilité précédente se calcule directement en
fonction de Y comme suit :
30 − 25 5 1
P(25 ≤ Y ≤ 30) = = = .
30 − 15 15 3
236/461
Loi Uniforme
Exercice 2. Les trains à destination de A arrivent à la gare toutes les 15

minutes à partir de 7h du matin, et les trains à destination de B arrivent
toutes les 15 minutes également, mais à partir de 7h 05 du matin. Un certain
passager arrive à la gare à une heure qui suit une loi uniforme entre 7h et 8h
du matin et prend le premier train qui se présente.
a) Avec quelle probabilité se rendra-t-il à la destination A ?
b) Sachant qu’il a raté le troisième train à destination B, avec quelle
probabilité se rendra-t-il à la destination A ?
237/461
Loi Uniforme
Solution de l’exercice 2. Soit X l’instant d’arrivée du passager. Pour

simplifier le problème, on peut remplacer l’intervalle de temps [7h,8h] par
[0, 60]. On voit que X ∼ U[0,60] .
a) La probabilité pour que le passager se rende à la destination A est :
P(5 ≤ X ≤ 15) + P(20 ≤ X ≤ 30) + P(35 ≤ X ≤ 45) + P(50 ≤ X ≤ 60).
Cette dernière se calcule comme suit :

15 − 5 30 − 20 45 − 35 60 − 50 40 2
+ + + = = .
60 − 0 60 − 0 60 − 0 60 − 0 60 3
238/461
Loi Uniforme
b) La probabilité que le passager se rende à la destination A sachant qu’il a

raté le troisième train à destination B est :

P(35 ≤ X ≤ 45 ou 50 ≤ X ≤ 6035 ≤ X ≤ 60)

= P(35 ≤ X ≤ 4535 ≤ X ≤ 60) + P( 50 ≤ X ≤ 6035 ≤ X ≤ 60)
P(35 ≤ X ≤ 45) P(50 ≤ X ≤ 60)
= +
P(35 ≤ X ≤ 60) P(35 ≤ X ≤ 60)
10 10 20 4
= + = = .
25 25 25 5
Une autre méthode consiste à consider la variable aléatoire Y ∼ U[35,60] .
La probabilité précédente se calcule alors comme suit :
45 − 35 60 − 50 20 4
P(35 ≤ Y ≤ 45) + P(50 ≤ Y ≤ 60) = + = = .
60 − 35 60 − 35 25 5
239/461
Loi Exponentielle
Loi exponentielle
En pratique, on s’intéresse souvent aux variables aléatoires qui modélisent le
temps d’attente avant l’arrivée d’un événement spécifique.
Par exemple :
1. X : le temps qui nous sépare du prochain appel téléphonique.
2. Y : le temps entre deux pannes consécutives d’un réseau informatique.
Lorsque les réalisations d’un événement sont gérées par un processus de
Poisson de fréquence λ, le temps X entre deux réalisations consécutives de
cet événement sera distribué selon la loi exponentielle de paramètre λ. On
note X ∼ Exp(λ).
240/461
Loi Exponentielle
Densité et fonction de répartition de la loi exponentielle

La densité d’une variable aléatoire de loi exponentielle est donnée par :
 λe−λx

si x ≥ 0,
f (x) =
0 sinon.

Sa fonction de répartition est de la forme :
 1 − e−λx

si x ≥ 0,
F (x) =
0 sinon.

Espérance et variance d’une loi exponentielle

Si X ∼ Exp(λ) alors,
1 1
E(X ) = et var(X ) = .
λ λ2
241/461
Loi Exponentielle
Remarques.
1. λ : représente le nombre moyen de réalisations de l’événement sur une
période unitaire de temps.
2. 1/λ : désigne le temps moyen entre deux réalisations de l’événement.
Formule utile : Soit X une variable aléatoire de loi Exp(λ), alors
P(X > t) = e−λt .
242/461
Loi Exponentielle
Propriété sans mémoire de la loi exponentielle

La loi exponentielle est la seule distribution continue qui satisfait à la
propriété sans mémoire suivante :
P(X > t + s|X > s) = P(X > t).
Preuve à faire en exercice.
243/461
Loi Exponentielle
Exercice 1. Le temps d’attente pour recevoir un service suit une loi

exponentielle de moyenne égale à 5 minutes.
a) Quelle est la probabilité d’attendre plus que 10 minutes ?
b) Quelle est la probabilité d’attendre encore au moins 5 minutes étant
donné qu’on a déjà attendu 5 minutes ?
244/461
Loi Exponentielle
Solution de l’exercice 1. Le temps d’attente pour recevoir un service est

une variable aléatoire X qui suit une loi exponentielle de moyenne égale à
µ = 5 minutes. Par conséquent, λ = 1/µ = 1/5 = 0.2
1 La probabilité d’attendre plus que 10 minutes est :
P(X > 10) = e−λx = e−0.2×10 = e−2 = 0.135.
2 En utilisant la propriété sans mémoire de la loi exponentielle, on voit que

la probabilité d’attendre encore au moins 5 minutes étant donné qu’on a
déjà attendu 5 minutes est :

P(X > 10X > 5) = P(X > 5)
= e−0.2×5
= e−1 = 0.368.
245/461
Loi Exponentielle
Exercice 2. La durée de fonctionnement avant défaillance d’un certain

transistor obéit à une loi exponentielle de moyenne 20 000 heures. Or, un tel
transistor, utilisé à une fin particulère, fonctionne déjà depuis 20 000 heures.
Quelle est la probabilité qu’il fonctionne moins de 30 000 heures ?
246/461
Loi Exponentielle
Solution de l’exercice 2. La durée de fonctionnement avant défaillance d’un

certain transistor est une variable aléatoire X ∼ExP(λ = 1/20000).
1 Sachant que ce transistor fonctionne déjà depuis 20000 heures alors la
probabilité qu’il fonctionne moins de 30000 heures est

P(X ≤ 30000X > 20000) = 1 − P(X > 30000X > 20000)
= 1 − P(X > 10000)
1
= 1 − e−10000× 20000
= 1 − e−0.5 = 0.393.
247/461
Loi Gamma
Loi gamma
La loi gamma de paramètres n et λ représente la distribution du temps
d’attente avant la n ième occurrence d’un processus de Poisson de
fréquence λ. On s’intéresse alors à la variable :
X : temps d’attente avant d’observer la n ième réalisation d’un processus de
Poisson de fréquence λ
La loi de X est appelée loi gamma de paramètres n et λ. On écrit alors :
X ∼ gamma(n, λ).
248/461
Loi Gamma
Relation entre la loi gamma et le processus de Poisson
Soit {Nt } un processus de Poisson de fréquence λ et soit X une variable
aléatoire de loi gamma(n, λ).
Ces deux quantités sont liées par l’équation suivante :
P[X > t] = P[Nt ≤ n − 1].
Cette constatation nous permet de déterminer la fonction de répartition F (t)
de X . En effet :
P[X > t] = P[Nt ≤ n − 1]
n−1
X
= P[Nt = k ]
k =0
n−1
X
= (λt)k e−λt /k !.
k =0
Par conséquent :
n−1
X
F (t) = 1 − P[X > t] = 1 − (λt)k e−λt /k !, t ≥ 0.
k =0
249/461
Loi Gamma
Propriété : Si X une variable aléatoire de loi gamma(n, λ), alors il existe

n variables aléatoires X1 , . . . , Xn indépendantes et de même loi
exponentielle Exp(λ) telles que :
X = X1 + · · · + Xn .
Espérance et variance la loi gamma

Si X ∼ gamma(n, λ), alors :
n n
E(X ) = et var(X ) = .
λ λ2
250/461
Loi Gamma
Exercice 1. Soit X une variable aléatoire de loi Gamma(n = 4, λ = 0.25).

Calculer
1) P[X > 4],
2) P[4 < X < 6],
3) P[4 < X < 6|X > 5].
251/461
Loi Gamma
Solution de l’exercice 1. Soit X ∼ Gamma(n = 4, λ = 0.25).

1) Calculons P(X > 4)
3
X (λt)k e−λt
P(X > 4) =
k!
k =0
3
X (0.25 × 4)k e−0.25×4
=
k!
k =0
3
X e−1
=
k!
k =0

1 1 1
= e−1 1 + + + = 0.98.
1! 2! 3!
252/461
Loi Gamma
2) Calculons P(4 < X < 6). Pour ce faire, remarquons d’abord que
P(4 < X < 6) = P(X > 4) − P(X > 6) = 0.98 − P(X > 6).
Il reste donc à évaluer P(X > 6).
253/461
Loi Gamma
Cette dernière se calcule comme suit :

3
X (λt)k e−λt
P(X > 6) =
k!
k =0
3
X (0.25 × 6)k e−0.25×6
=
k!
k =0
3
X (1.5)k e−1.5
=
k!
k =0
1.52 1.53

1.5
= e−1.5 1 + + + = 0.93.
1! 2! 3!
Donc :
P(4 < X < 6) = P(X > 4) − P(X > 6) = 0.98 − 0.93 = 0.05.
254/461
Loi Gamma

3) Calculons P(4 < X < 6X > 5)
P(4 < X < 6, X > 5)
P(4 < X < 6X > 5) =
P(X > 5)
P(5 < X < 6)
=
P(X > 5)
P(X > 5) − P(X > 6)
= .
P(X > 5)
Comme P(X > 6) = 0.93, il reste à calculer P(X > 5).
255/461
Loi Gamma
En effet
3
X (λt)k e−λt
P(X > 5) =
k!
k =0
3
X (0.25 × 5)k e−0.25×5
=
k!
k =0
3
X (1.25)k e−1.25
=
k!
k =0
1.252 1.253

1.25
= e−1.25 1 + + + = 0.96.
1! 2! 3!
Finalement :
P(X > 5) − P(X > 6) 0.96 − 0.93
P(4 < X < 6X > 5) = = = 0.03.
P(X > 5) 0.96
256/461
Loi Gamma
Exercice 2. Un certain système électronique a une durée de vie X1

distribuée selon une loi exponentielle de moyenne 400 heures. Ce système
est supporté par deux autres systèmes X2 et X3 indépendants et de même loi
que X1 . On s’intéresse à la durée de vie totale du système :
Y = X1 + X2 + X3 .
1. Quelle est la loi de Y . Préciser ses paramètres ?

2. Calculer la probabilité que la durée totale Y dépasse 1 200 heures ?
257/461
Loi Gamma
Solution de l’exercice 2. Soient X1 , X2 et X3 des variables aléatoires

indépendantes telles que Xi ∼Exp(λ = 1/400). Posons
Y = X1 + X2 + X3 .
1. La variable Y est distribuée selon la loi gamma de paramètres n = 3 et

λ = 1/400, c’est-à-dire,
X ∼Gamma(n = 3, λ = 1/400).
258/461
Loi Gamma
2. La probabilité que la durée totale Y dépasse 1200 heures est :

2
X (λt)k e−λt
P(Y > 1200) = =
k!
k =0
2 k 1
X 1
400
× 1200 e− 400 ×1200
=
k!
k =0
2
X 3k e−3
=
k!
k =0
32

3
= e−3 1 + + = 0.423.
1! 2!
259/461
Loi Normale
La loi normale est le modèle le plus utilisé en statistique. Elle possède

l’avantage d’approcher des distributions de sommes de variables
indépendantes. Elle fut découverte par Karl Friedrich Gauss (1777-1855).
Définition : On dit qu’une variable aléatoire X de moyenne µ et de variance

σ 2 suit une loi normale si sa densité est de la forme :
1 (x−µ)2
−
f (x) = √ e 2σ2 , pour tout nombre réel x.
σ 2π
La loi normale de moyenne µ et de variance σ 2 est notée N(µ, σ 2 ).
260/461
Loi Normale
Graphe d’une loi normale

La courbe de la densité de la loi normale a une forme de cloche. Elle est
symétrique par rapport à la droite verticale passant par la moyenne µ.
L’écart type σ représente la distance entre l’axe de symétrie et le point
d’inflexion de la courbe (changement de courbure).
σ-

261/461
Loi Normale
Effet de la moyenne µ
Lois normales de variances égales mais de moyennes différentes.
N(µ1 , σ 2 ) N(µ2 , σ 2 )
HH
j
H

µ1 µ2
La moyenne µ est un paramètre d’échelle, car sa variation permet de

translater la courbe de densité sans changer sa forme.
262/461
Loi Normale
Effet de la variance σ 2
Lois normales de moyennes égales mais de variances différentes.
N(µ, σ12 )

N(µ, σ22 )

µ
Dans ce cas, on a : σ12 < σ22 . On voit que l’allure de la courbe de densité
est affectée par la variance σ 2 . Cette dernière est appelée alors
paramètre de forme.
263/461
Loi Normale
Loi normale centrée réduite

La loi normale de moyenne µ = 0 et de variance σ 2 = 1 est appelée la
loi normale centrée réduite. La variable aléatoire qui suit une loi normale
centrée réduite est notée Z :
Z ∼ N(0, 1).
Fonction de répartition de la loi normale centrée réduite

La fonction de répartition de la loi normale N(0, 1) nous permet le calcul
des probabilités par la table de la loi normale. Elle est définie par :
φ(x) = P(Z ≤ x).
264/461
Loi Normale
Elle représente la surface, située à gauche de x, entre la courbe de densité

et l’axe des abscisses :
φ(x)
Z Densité de Z ∼ N(0, 1)
Z
~
Z

0 x
265/461
Loi Normale
Propriétés de la fonction répartition φ(x)
1. φ(−x) = 1 − φ(x);
2. P[Z > x] = 1 − φ(x);
3. P[a ≤ Z ≤ b] = φ(b) − φ(a).
266/461
Loi Normale
Exercice. Calculez
1) P(0 ≤ Z ≤ 2.31);
2) P(Z ≤ 2.31) ;
3) P(Z ≥ 1.32) ;
4) P(Z > 1.32) ;
5) P(−2.45 ≤ Z ≤ −1.69).
267/461
Loi Normale
Supposons que Z ∼ N(0, 1).

1. Calculons P(0 ≤ Z ≤ 2.31)
P(0 ≤ Z ≤ 2.31)φ(2.31) − φ(0) = 0.9896 − 0.5 = 0.4896.
2. Calculons P(Z ≤ 2.31)
P(Z ≤ 2.31) = φ(2.31) = 0.9896.
3. Calculons P(Z ≥ 1.32)
P(Z ≥ 1.32) = 1 − φ(1.32) = 1 − 0.9066 = 0.0934.
268/461
Loi Normale
4. Calculons P(Z > 1.32)
P(Z > 1.32) = 1 − φ(1.32) = 1 − 0.9066 = 0.0934.
5. Calculons P(−2.45 ≤ Z ≤ −1.69)
P(−2.45 ≤ Z ≤ −1.69) = P(1.69 ≤ Z ≤ 2.45)

= φ(2.45) − φ(1.69)
= 0.9929 − 0.9545 = 0.0384.
Cette probabilité peut aussi être obtenue d’une autre manière à savoir :
P(−2.45 ≤ Z ≤ −1.69) = φ(−1.69) − φ(−2.45)

= (1 − φ(1.69)) − (1 − φ(2.45))
= φ(2.45) − φ(1.69) = 0.0384.
269/461
Loi Normale
Calcul de probabilité d’une loi normale quelconque

Propriété : Si X ∼ N(µ, σ 2 ) alors :
X −µ
Z = ∼ N(0, 1).
σ
Exercice. Soit X ∼ N(4, 25), calculez :
1. P(X ≤ 9) ;
2. P(2 ≤ X ≤ 10).
270/461
Loi Normale
Réponse. Soit X ∼ N(4, 25).
1. Calculons P(X ≤ 9)

X −4 9−4
P(X ≤ 9) = P ≤
5 5
= P (Z ≤ 1) = φ(1) = 0.8413.
2. Calculons P(2 ≤ X ≤ 10)

2−4 X −4 10 − 4
P(2 ≤ X ≤ 10) = P ≤ ≤
5 5 5
= P (−0.4 ≤ Z ≤ 1.2)
= φ(1.2) − φ(−0.4)
= φ(1.2) − (1 − φ(0.4))
= 0.8849 − (1 − 0.6554) = 0.5403
271/461
Loi Normale
Exercice 1. Les notes obtenues par des étudiants dans un concours se

répartissent selon une variable aléatoire X de loi normale N(68, 100).
a) On choisit un candidat au hasard. Quelle est la probabilité qu’il ait une
note entre 60 et 70 ?
b) Les examinateurs du concours veulent donner la cote A+ aux 5% des
étudiants ayant obtenu les meilleures notes. Déterminer la note
minimale nécessaire pour obtenir A+.
272/461
Loi Normale
Solution de l’exercice 1. Les notes obtenues par des étudiants dans un

concours se répartissent selon une variable aléatoire
X ∼ N(µ = 68, σ 2 = 100).
a) On choisit un candidat au hasard. La probabilité qu’il ait une note entre
60 et 70 est :

60 − 68 X − 68 70 − 68
P(60 ≤ X ≤ 70) = P ≤ ≤
10 10 10
= P (−0.8 ≤ Z ≤ 0.2)
= φ(0.2) − φ(−0.8)
= φ(0.2) − (1 − φ(0.8))
= 0.5793 − (1 − 0.7881) = 0.3674.
273/461
Loi Normale
b) Déterminons la note minimale a nécessaire pour obtenir A+. Puisque les
examinateurs du concours veulent donner la cote A+ aux 5% des
étudiants ayant obtenu les meilleures notes. Donc, on cherche a de
sorte que :
P(X > a) = 0.05 ⇐⇒ P(X ≤ a) = 0.95

X − 68 a − 68
⇐⇒ P ≤ = 0.95
10 10

a − 68
⇐⇒ P Z ≤ = 0.95
10

a − 68
⇐⇒ φ = 0.95
10
a − 68
⇐⇒ = 1.645
10
⇐⇒ a = 84.45.
274/461
Loi Normale
Exercice 2. On suppose que la taille, en centimètres, d’un homme âgé de 25

ans est une variable normale de moyenne 175 cm et de variance 36 cm2 .
a) Quel est le pourcentage d’hommes de 25 ans ayant une taille supârieure
à 185 cm ?
b) Parmi les hommes mesurant plus de 180 cm, quel pourcentage d’entre
eux dépassent 192 cm ?
275/461
Loi Normale
Solution de l’exercice 2. On suppose que la taille, en centimètres, d’un

homme âgé de 25 ans est une variable aléatoire X ∼ N(µ = 175, σ 2 = 36).
a) Le pourcentage d’hommes de 25 ans ayant une taille supérieure à 185
cm est :

X − 175 185 − 175
P(X ≥ 185) = P ≥
6 6
= P (Z ≥ 1.67)
= 1 − φ(1.67)
= 1 − 0.9525 = 0.0475.
276/461
Loi Normale
b) Parmi les hommes mesurant plus de 180 cm, le pourcentage d’entre eux
qui dépassent 192 cm est
P(X ≥ 192 ∩ X ≥ 180)
P(X ≥ 192X ≥ 180) =
P(X ≥ 180)
P(X ≥ 192)
=
P(X ≥ 180)
P X −175 ≥ 192−175

6 6
=
P X −175 ≥ 180−175

6 6
P (Z ≥ 2.83)
=
P (Z ≥ 0.83)
1 − φ (2.83)
=
1 − φ (0.83)
1 − 0.9977
= = 0.0113.
1 − 0.7967
277/461
Loi Normale
Propriété d’additivité de la loi normale

Soit n variables aléatoires indépendantes, notées X1 , . . . , Xn telles que :
Xi ∼ N(µi , σi2 ) pour i = 1, . . . , n.
Posons
Y = a1 X1 + · · · + an Xn ,
alors
Y ∼ N(µY , σY2 ),
avec
n
X n
X
µY = ai µi et σY2 = ai2 σi2 .
i=1 i=1
278/461
Loi Normale
Exercice. Soient X1 , X2 et X3 des variables aléatoires indépendantes telles

que
X1 ∼ N(12, 0.02),
X2 ∼ N(24, 0.03),
X3 ∼ N(18, 0.04).
On pose Y = X1 + X2 + X3 et T = X1 − X2 + X3 .
1. Déterminer les lois de Y et de T .
2. Calculer : P(53.8 ≤ Y ≤ 54.02) et P(5.8 ≤ T ≤ 6.2).
279/461
Loi Normale
Soient X1 , X2 et X3 des variables aléatoires indépendantes telles que
X1 ∼ N(µ1 = 12, σ12 = 0.02),

X2 ∼ N(µ2 = 24, σ22 = 0.03),
X3 ∼ N(µ3 = 18, σ32 = 0.04).
1. Déterminons les lois de Y = X1 + X2 + X3 et T = X1 − X2 + X3 . Puisque

X1 , X2 et X3 sont des variables aléatoires normales indépendantes,
donc :
Y ∼ N(µ1 + µ2 + µ3 , σ12 + σ22 + σ32 ) = N(54, 0.09),
et
T ∼ N(µ1 − µ2 + µ3 , σ12 + σ22 + σ32 ) = N(6, 0.09).
280/461
Loi Normale
2. Calculons P(53.8 ≤ Y ≤ 54.02) et P(5.8 ≤ T ≤ 6.2). Il est clair que :

53.8 − 54 Y − 54 54.02 − 54
P(53.8 ≤ Y ≤ 54.02) = P √ ≤ √ ≤ √
0.09 0.09 0.09
= P (−0.67 ≤ Z ≤ 0.07)
= φ(0.07) − φ(−0.67)
= φ(0.07) − (1 − φ(0.67))
= 0.5279 − (1 − 0.7486) = 0.2765.
281/461
Loi Normale
De même, nous avons

5.8 − 6 T −6 6.2 − 6
P(5.8 ≤ T ≤ 6.2) = P √ ≤ √ ≤ √
0.09 0.09 0.09
= P (−0.67 ≤ Z ≤ 0.07)
= φ(0.67) − φ(−0.67)
= φ(0.67) − (1 − φ(0.67))
= 2φ(0.67) − 1 = 2 × 0.7486 − 1 = 0.4972.
282/461
Loi Normale
Exercice. Soient X1 , X2 et X3 des variables aléatoires indépendantes telles

que
X1 ∼ N (µ1 = 16, σ12 = 1),
X2 ∼ N (µ2 = 4, σ22 = 2),
X3 ∼ N (µ3 = 45, σ32 = 4).
1. Déterminez la loi de Y = 2X1 − 5X2 + 3X3 .

2. Calculez : P(130 ≤ Y ≤ 165).
3. Trouvez a tel que : P(Y ≥ a) = 0.05.
4. Trouvez b tel que : P(Y ≥ b) = 0.90.
283/461
Loi Normale
Réponse.
1. Puisque X1 , X2 et X3 sont des variables aléatoires normales
indépendantes, donc la loi de Y = 2X1 − 5X2 + 3X3 est :
Y ∼ N (2µ1 − 5µ2 + 3µ3 , 4σ12 + 25σ22 + 9σ32 ) = N (147, 90)
2. Calculons P(130 ≤ Y ≤ 165) :

130 − 147 165 − 147
P(130 ≤ Y ≤ 165) = P √ ≤Z ≤ √
90 90
= P (−1.79 ≤ Z ≤ 1.90)
= φ(1.90) − φ(−1.79)
= φ(1.90) − (1 − φ(1.79))
= 0.9713 − (1 − 0.9633) = 0.9346.
284/461
Loi Normale
3. Calculons a tel que P(Y ≥ a) = 0.05.
P(Y ≥ a) = 0.05 ⇐⇒ P(Y ≤ a) = 0.95

a − 147
⇐⇒ P Z ≤ √ = 0.95
90

a − 147
⇐⇒ φ √ = 0.95
90
a − 147
⇐⇒ √ = 1.645
90
√
⇐⇒ a = 1.645 × 90 + 147 = 162.6058.
285/461
Loi Normale
4. Calculons b tel que P(Y ≥ b) = 0.90.
P(Y ≥ b) = 0.90 ⇐⇒ P(Y ≤ b) = 0.10

b − 147
⇐⇒ P Z ≤ √ = 0.10
90

b − 147
⇐⇒ φ √ = 0.10
90

147 − b
⇐⇒ φ √ = 0.90
90
147 − b
⇐⇒ √ = 1.285
90
√
⇐⇒ b = 147 − 1.285 × 90 = 134.8094.
286/461
Théorème central limite
Théorème (De Moivre - Laplace)
Correction pour la continuité
Automne 2021
287/461

Le théorème central représente le résultat le plus important en probabilité et
statistique.
Version générale du théorème central limite
Soit X1 , X2 , . . . , Xn une suite de variables aléatoires indépendantes telles
que E(Xi ) = µi et var(Xi ) = σi2 . Si Yn = X1 + X2 + · · · + Xn , alors dans
certaines conditions générales, la variable
Yn ≈ N(µn , σn2 ), quand n→∞
avec
µn = µ1 + · · · + µ n et σn2 = σ12 + · · · + σn2 .
288/461
Version particulière du théorème central limite

Soit X1 , X2 , . . . , Xn une suite de variables aléatoires indépendantes et
identiquement distribuées, telles que E(Xi ) = µ et var(Xi ) = σ 2 . Alors la
variable aléatoire
Yn = X1 + X2 + · · · + Xn
obéit approximativement à une loi normale N(nµ, nσ 2 ) lorsque n tend
vers l’infini, c’est-à-dire
Yn ≈ N(nµ, nσ 2 ), quand n → ∞.
Remarque. En pratique, l’approximation par le théorème central limite

est assez bonne pour n ≥ 30.
289/461
Exercice 1. Une assurance a 10 000 automobilistes assurés. L’indemnité

annuelle demandée par un assuré i est une variable aléatoire Xi de moyenne
240$ et d’écart-type 8 000$. Soit
Y = X1 + · · · + X10000
les indemnités totales annuelles demandées par les 10 000 assurés. En

utilisant le théorème central limite, évaluez approximativement la probabilité
que ces indemnités annuelles totales dépassent 2 700 000$.
290/461
Solution de l’exercice 1. Soit Y = X1 + · · · + X10000 où X1 , . . . , X10000 sont

des v.a indépendantes et identiquement
p distribuées telles que
µ = E(Xi ) = 240$ et σ = var(Xi ) = 8000$. Évaluons approximativement la
probabilité que ces indemnités annuelles totales Y dépassent 2700000. Ceci
revient à calculer P(Y > 2700000) approximativement en utilisant le
théorème central limite.
291/461
Pour ce faire, notons d’abord que
Y = X1 + · · · + X10000 ≈ N(nµ, nσ 2 ) = N(10000 × 240, 10000 × 80002 ).
C’est-à-dire : Y ≈ N(24 × 105 , 64 × 1010 ). Il en resulte que
P(Y > 2700000) = P(Y > 27 × 105 )

Y − 24 × 105 27 × 105 − 24 × 105

= P √ > √
64 × 1010 64 × 1010

3
= P Z >
8

3
= 1−φ = 1 − φ(0.38) = 1 − 0.6480 = 0.3520.
8
292/461
Exercice 2. On dispose de 100 ampoules dont les durées de vie sont des
variables aléatoires indépendantes et de même loi exponentielle de moyenne
5 heures. Si on allume une ampoule à la fois et qu’une ampoule grillée est
instantanément remplacée par une neuve, quelle est la probabilité qu’il reste
encore une ampoule intacte après 525 heures ?
293/461
Solution de l’exercice 2. Soit Xi la durée de vie de la ampoule i. On sait que

Xi ∼ Exp(λ = 1/5). Soit
Y = X1 + · · · + X99
la durée de vie des 99 premières ampoules. D’après le théorème central

limite, on a
Y ≈ N (nµ, nσ 2 ), µ = 1/λ = 5, σ 2 = 1/λ2 = 25, n = 99.
Donc
Y ≈ N (495, 2475).
294/461
On cherche à évaluer la probabilité que Y ≥ 525 :

Y − 495 525 − 495
P(Y ≥ 525) = P √ ≥ √
2475 2475
= P (Z ≥ 0, 60)
= 1 − φ(0.60) = 0, 2743.
295/461
Exercice 3. Soient X1 , . . . , Xn une suite de variables aléatoires inépendantes

et identiquement distribuées telles E(Xi ) = µ = 10 et var(Xi ) = σ 2 = 4. On
pose
Sn = X1 + · · · + Xn .
Pourvu que n ≥ 30, le théorème central limite garantie que la loi de Sn est
approximativement normale de moyenne nµ = 10n et variance nσ 2 = 4n,
c-à-d :
Sn ≈ N(10n, 4n).
Déterminez la valeur de n telle que
P[Sn > 430] ≥ 0.99.
296/461
Solution de l’exercice 3. Déterminons la valeur de n telle que

P[Sn > 430] ≥ 0.99. En utilisant Sn ≈ N(10n, 4n), on voit que :

Sn − 10n 430 − 10n
P[Sn > 430] ≥ 0.99 ⇐⇒ P √ > √ ≥ 0.99
4n 4n

430 − 10n
⇐⇒ P Z > √ ≥ 0.99
4n

430 − 10n
⇐⇒ 1 − φ √ ≥ 0.99
2 n

10n − 430
⇐⇒ φ √ ≥ 0.99
2 n
10n − 430
⇐⇒ √ ≥ 2.325. (1)
2 n
297/461
On cherche les racines de l’équation :

10n − 430
√ = 2.325
2 n
√
Pour ce faire, on pose x = n. Ainsi, l’équation précédente devient :
10x 2 − 430
= 2.325 ⇐⇒ 10x 2 − 4.65x − 430 = 0
2x
⇐⇒ x = −6.329059 ou x = 6.794059
√
Comme x = n > 0, donc la solution sera x = 6.794059. Par suite, le plus
petit n satisfaisant l’inéquation (1) sera l’entier supérieur à
6.7940592 = 46.15924 à savoir
n = 47.
298/461

La loi binomiale est approximée par la loi normale de la faÃS
Son
suivante :
B(n, p) ≈ N[np, np(1 − p)]
pour n assez grand.
Remarque : Par expérience, cette approximation est généralement

assez bonne tant que :
np > 5 et n(1 − p) > 5.
299/461

Pour avoir une meilleure approximation de la loi binomiale par la loi normale,
on doit utiliser le principe de correction pour la contnuité :
Si X ∼ B(n, p) et Xc ∼ N[np, np(1 − p)]
alors
1 1
p(k ) = P(X = k ) ≈ P k − ≤ Xc ≤ k + .
2 2
6
P(k ) @
I
@
Densité de Xc
-
1 1
k− 2
k k+ 2
300/461
Exercice. Si X ∼ B(100, 0.2), calculer P(X = 15).

On a :
Xc ∼ N[np, np(1 − p)] = N(20, 16).
Donc,
P(X = 15) ≈ P(15 − 0.5 ≤ Xc ≤ 15 + 0.5)

= P(14.5 ≤ Xc ≤ 15.5)

14.5 − 20 15.5 − 20
= P ≤Z ≤
4 4
= Φ(P(−1.375 ≤ Z ≤ −1.125))
= Φ(−1.125) − Φ(−1.375)
= Φ(1.375) − Φ(1.125)
= 0.046.
301/461
Propriété : Soit X ∼ B(n, p) et Xc ∼ N[np, np(1 − p)], alors

1
1. P(X = k ) = P(k − 2
≤ Xc ≤ k + 12 ) ;
2. P(X ≤ k ) = P(Xc ≤ k + 21 ) ;
3. P(X < k ) = P(Xc ≤ k − 21 ) ;
4. P(X ≥ k ) = P(Xc ≥ k − 21 ) ;
5. P(X > k ) = P(Xc ≥ k + 21 ) ;

1
6. P(k ≤ X ≤ p) = P(k − 2
≤ Xc ≤ p + 12 ) ;
1
7. P(k < X < p) = P(k + 2
≤ Xc ≤ p − 12 ).
302/461
Exercice. Si X ∼ B(100, 0.2), calculez

a) P(X ≤ 15);
b) P(X < 18) ;
c) P(X ≥ 22) ;
d) P(18 < X < 21).
303/461

Réponse.
a) Calculons P(X ≤ 15)
P(X ≤ 15) ≈ P(Xc ≤ 15.5)

Xc − 20 15.5 − 20
= P ≤
4 4
= P (Z ≤ −1.13)
= φ(−1.13) = 1 − φ(1.13) = 1 − 0.8708 = 0.1292.
b) Calculons P(X < 18)
P(X < 18) ≈ P(Xc ≤ 17.5)

Xc − 20 17.5 − 20
= P ≤
4 4
= P (Z ≤ −0.63)
= φ(−0.63) = 1 − φ(0.63) = 1 − 0.7357 = 0.2643.
304/461
c) Calculons P(X ≥ 22)
P(X ≥ 22) ≈ P(Xc ≥ 21.5)

Xc − 20 21.5 − 20
= P ≥
4 4
= P (Z ≥ 0.38)
= 1 − φ(0.38) = 1 − 0.6480 = 0.352.
305/461
d) Calculons P(18 < X < 21)
P(18 < X < 21) ≈ P(18.5 ≤ Xc ≤ 20.5)

18.5 − 20 Xc − 20 20.5 − 20
= P ≤ ≤
4 4 4
= P (−0.38 ≤ Z ≤ 0.13)
= φ(0.13) − φ(−0.38)
= φ(0.13) − 1 + φ(0.38)
= 0.5517 − 1 + 0.6480 = 0.1997.
306/461
Échantillonnage et Estimation des paramètres
Estimation par intervalle de confiance
Test d’hypothèse
Test de comparaison
Partie III
Estimation et tests d’hypothèses
Automne 2021
307/461
Test d’hypothèse
Test de comparaison
Partie III : Estimation et tests d’hypothèses
13 Échantillonnage et Estimation des paramètres
14 Estimation par intervalle de confiance
15 Test d’hypothèse
16 Test de comparaison
308/461
Qualité d’un estimateur
Échantillonnage et Estimation des paramètres Distribution d’échantillonnage
Estimation par intervalle de confiance Loi Khi-Carré
Test d’hypothèse Loi de Student
Test de comparaison Loi de Fisher
Exercices
Automne 2021
309/461
Exercices
Échantillon, Paramètre et Statistique
Échantillon aléatoire
Un échantillon aléatoire est une suite de variables aléatoires X1 , . . . , Xn
indépendantes et de même loi qu’une caractéristique X d’une population.
Paramètre
Un paramètre est un nombre qui décrit une caractéristique de la population
étudiée. Citons, à titre d’exemples, la moyenne µ, la variance σ 2 , la médiane
M et la proportion p d’une population. Notons que les paramètres sont
souvent inconnus.
Statistique
Une statistique est une fonction de l’échantillon qui permet d’estimer un
paramètre de la population.
310/461
Exercices
Échantillon, paramètre et statistique
Par exemple :
1) La moyenne µ d’une population est estimée par la moyenne X̄ d’un
échantillon de cette population :
n
1X
X̄ = Xi.
n
i=1
2) La variance σ 2 d’une population est estimée par la variance s2 d’un

échantillon de cette population :
n
" n #
2 1 X 2 1 X 2 2
S = Xi − X̄ = Xi − nX̄ .
n−1 n−1
i=1 i=1
311/461
Exercices
Échantillon, paramètre et statistique
3) Soit une population ayant une caractéristique qualitative (une maladie

particulière), la proportion p des individus ayant cette caractéristique
dans la population est estimée par :
Xn
p̂ =
n
où Xn désigne le nombre d’individus de l’échantillon qui possèdent cette
caractéristique.
Remarque. Les statistiques X̄ , S 2 et p̂ sont appelées aussi estimateurs. Par
contre, la valeur calculée par un estimateur pour un échantillon donné est
appelée estimation ponctuelle.
312/461
Exercices
Estimateur sans biais
Définition : Un estimateur T d’un paramètre θ est dit sans biais si son

espérance mathématique est égale à la vraie valeur du paramètre à estimer :
E(T ) = θ.
Notons qu’un estimateur sans biais ne surestime ni sous-estime

systématiquement le paramètre. On dit d’un estimateur sans biais qu’il est
bien centré.
Remarque. Notons que X̄ , S 2 et p̂ sont respectivement des estimateurs sans
biais des paramètres µ, σ 2 et p, c’est-à-dire :
E(X̄ ) = µ, E(S 2 ) = σ 2 et E(p̂) = p.
313/461
Exercices
Estimateur efficace
Définition : Soient T1 et T2 deux estimateurs sans biais d’un paramètre

inconnu θ. On dit que T1 est plus efficace que T2 si :
var(T1 ) < var(T2 ).
L’estimateur doit avoir une variance aussi petite que possible, afin d’être
aussi précis que possible. Ainsi les variances des estimateurs X̄ et p̂ sont :
σ2 p(1 − p)
var(X̄ ) = et var(p̂) = .
n n
314/461
Exercices
Ces formules montrent que les variances de X̄ et p̂ diminuent lorsque la taille

n de l’échantillon augmente. Donc, plus l’échantillon est grand, plus les
estimateurs X̄ et p̂ sont précis.
315/461
Exercices
Distribution d’échantillonnage
Un estimateur est par définition basé sur un échantillon qui n’est qu’une
partie de la population étudiée. Il est donc fort improbable que la valeur
prise par cet estimateur coïncide avec le paramètre étudié.
Définition : La distribution d’échantillonnage d’un estimateur est la

distribution de toutes les valeurs possibles de cet estimateur. Ces
valeurs sont calculées à partir d’échantillons de même taille et issus de
la même population.
Afin étudier les distributions d’échantillonnage de quelques estimateurs

intéressants, nous allons d’abord définir certaines distributions très utiles
en statistique.
316/461
Exercices
Rappel : Loi Normale
La loi normale est le modèle le plus utilisé en statistique. Elle fut

découverte par Karl Friedrich Gauss (1777-1855).
Définition : On dit qu’une variable aléatoire X de moyenne µ et de

variance σ 2 suit une loi normale si sa densité est de la forme :
1 (x−µ)2
−
f (x) = √ e 2σ2 , pour tout nombre réel x.
σ 2π
La loi normale de moyenne µ et de variance σ 2 est notée N(µ, σ 2 ).
317/461
Exercices
La courbe de la densité de la loi normale a une forme de cloche. Elle est

symétrique par rapport à la droite verticale passant par la moyenne µ. L’écart
type σ représente la distance entre l’axe de symétrie et le point d’inflexion de
la courbe (changement de courbure).
σ-

318/461
Exercices
La table de loi normale centrée réduite N(0, 1) nous donne les valeurs de la
fonction φ(x) de Z ∼ N(0, 1).
φ(x)
Densité de Z ∼ N(0, 1)
Z
Z~
Z

0 x
Quantile d’ordre α de la loi normale

En statistique, on s’intéresse plutôt au quantile zα d’ordre α défini par :
P(Z ≥ zα ) = α.
319/461
Exercices
Cela signifie qu’on cherche zα de sorte que
φ(zα ) = 1 − α.
Tableau important
Le tableau ci-après nous fournit les valeurs de zα les plus fréquentes en
statistique :
α 0.10 0.05 0.025 0.01 0.005
zα 1.285 1.645 1.96 2.325 2.575
320/461
Exercices
Résultats très utiles en statistique
Théorème : Soit X1 , . . . , Xn un échantillon issu d’une population de loi

normale N(µ, σ 2 ), alors
X̄ − µ
Z = √ ∼ N(0, 1).
σ/ n
321/461
Exercices
Théorème centrale limite

inconnue alors
X̄ − µ
Z = √
σ/ n
suit approximativement une loi normale centrée réduite N(0, 1) quand n tend
vers l’infini. En pratique, l’approximation est considérée bonne pour n ≥ 30.
322/461
Exercices
Loi Khi-Carré
Soient Z1 , . . . , Zk des variables aléatoires indépendantes et identiquement

distribuées de loi normale centrée réduite N(0, 1). La variable aléatoire
χ2 = Z12 + · · · + Zk2 (2)
suit une distribution appelée loi de khi-carré à k degrés de liberté, notée χ2k .
On écrit alors :
χ2 ∼ χ2k .
323/461
Exercices
Loi Khi-Carré
Espérance et variance de la loi khi-carré

Si X est une variable aléatoire de loi χ2k , alors :
E(X ) = k et var(X ) = 2k .
Table de la loi khi-carré

La table de la loi khi-carré donne les valeurs χ2α,k telles que :
P(χ2k > χ2α,k ) = α.
Exemple. En utilisant la table de la loi khi-carré, trouvez les valeurs χ20.05,12 et

χ20.01,10 . La lecture dans la table de khi-deux qui se trouve sur le portail du
cours nous nous fournit :
χ20.05,12 = 21.026, χ20.01,10 = 23.209.
324/461
Exercices
Loi Khi-Carré
Résultat suivant est très utile en pratique

normale N(µ, σ 2 ), alors :
(n − 1)S 2
∼ χ2n−1
σ2
où S 2 désigne la variance échantillonnale.
325/461
Exercices
Loi de Student
La loi de Student constitue une importante distribution d’échantillonnage.

Définition : Soient Z et V deux variables aléatoires indépendantes telles
que :
Z ∼ N(0, 1) et V ∼ χ2k
alors
Z
T = q
V
k
suit une distribution appelée loi de Student à k degrés de liberté, notée tk . On

écrit alors
T ∼ tk .
326/461
Exercices
Loi de Student
Table de la loi de Student

La table de la loi de Student donne les valeurs tα,k telles que :
P(tk > tα,k ) = α.
Exemple. En utilisant la table de la loi de Student, trouvez les valeurs t0.05,12 ,

t0.01,10 et t0.025,20 . En effet, la lecture dans la table de loi de Student qui se
trouve sur le portail du cours nous donne :
t0.05,12 = 1.782;
t0.01,10 = 1.372;
t0.025,20 = 2.086.
327/461
Exercices
Loi de Student
Espérance et variance de la loi de Student
k
E(tk ) = 0 et var(tk ) = , k > 2.
k −2
328/461
Exercices
Loi de Student
Résultat très important en statistique

normale N(µ, σ 2 ), alors
X̄ − µ
S
∼ tn−1
√
n
où X̄ et S désignent respectivement la moyenne et l’écart-type de

l’échantillon.
329/461
Exercices
Loi de Fisher
Loi de Fisher
La loi de Fisher représente aussi une importante distribution
d’échantillonnage.
Définition : Soient U et V deux variables aléatoires indépendantes telles
que :
U ∼ χ2n et V ∼ χ2m
alors
U/n
F =
V /m
est distribuée selon la loi de Fisher à n degrés de liberté au numérateur et m
degrés de liberté au dénominateur, notée Fn,m . On écrit alors :
F ∼ Fn,m .
330/461
Exercices
Loi de Fisher
Moyenne et variance de la loi de Fisher
n 2n2 (n + m − 2)
E(Fn,m ) = et var(Fn,m ) = , n > 4.
n−2 m(n − 2)2 (n − 4)
Tables de la loi de Fisher
Les tables de la loi de Fisher donnent les valeurs Fα,n,m telles que :
P(Fn,m > Fα,n,m ) = α.
331/461
Exercices
Loi de Fisher
Remarque. La relation suivante est utile lors de la lecture dans la table de
Fisher
1
F1−α,n,m = .
Fα,m,n
Exemple. En utilisant les tables de la loi de Fisher, trouvez les valeurs

F0.05,12,15 , F0.95,10,12 F0.01,10,15 et F0.99,12,14 . La lecture dans la table de loi de
Fisher qui se situe sur le portail du cours nous donne :
F0.05,12,15 = 2.475;
1 1
F0.95,10,12 = = = 0.3433;
F0.05,12,10 2.913
F0.01,10,15 = 3.805;
1 1
F0.99,12,14 = = = 0.2468.
F0.01,14,12 4.052
332/461
Exercices
Loi de Fisher
Théorème utile en statistique

Théorème : Soient deux populations normales N(µ1 , σ12 ) et N(µ2 , σ22 ) et
deux échantillons indépendants, l’un de taille n1 tiré de la population 1 et
l’autre de taille n2 tiré de la population 2. Si S12 et S22 représentent les
variances de ces échantillons, alors :
S12 /σ12
F = ∼ Fn1 −1,n2 −1 .
S22 /σ22
333/461
Exercices
Exercices
Exercice 1. Soit X̄ la moyenne d’un échantillon aléatoire issu d’une

population de moyenne µ.
a) Montrez que X̄ est un estimateur sans biais de µ.
b) Déterminez la variance de X̄ .
Exercice 2. Soit S 2 la variance d’un échantillon aléatoire issu d’une
population de moyenne µ et de variance σ 2 . Montrez que S 2 est un
estimateur sans biais de σ 2 .
Exercice 3. Soit X1 , . . . , X7 un échantillon aléatoire tiré d’une population
de moyenne µ et de variance σ 2 . L’un des deux estimateurs de µ définis
ci-après est-il sans biais ? Lequel de ces deux estimateurs est le
meilleur ?
X1 + · · · + X7 2X1 + 3X4 − X6
µ̂1 = , µ̂2 = .
7 4
334/461
Exercices
Réponses
Réponse Exercice 1.
a) Montrons que X̄ est un estimateur sans biais de µ. Pour ce faire, on doit
montrer que E(X̄ ) = µ. En effet,
n
!
1X
E(X̄ ) = E Xi
n
i=1
n
1X
= E(Xi )
n
i=1
n
1X
= µ
n
i=1
nµ
= = µ.
n
335/461
Exercices
Réponses
b) Déterminons la variance de X̄ . Puisque les v.a X1 . . . , Xn sont

indépendante, donc :
n
!
1X
var(X̄ ) = var Xi
n
i=1
n
1 X
= var(Xi )
n2
i=1
n
1 X 2
= 2
σ
n
i=1
2
nσ σ2
= 2
= .
n n
336/461
Exercices
Réponses
Réponse Exercice 2. Montrez que S 2 est un estimateur sans biais de

σ 2 . On doit prouver que E(S 2 ) = σ 2 .
( n
!)
2 1 X 2 2
E(S ) = E Xi − nX̄
n−1
i=1
( n )
1 X 2 2
= E(Xi ) − nE(X̄ ) . (3)
n−1
i=1
Les termes E(Xi2 ) 2

et E(X̄ ) se calculent en fonction des variances de Xi
et X̄ comme suit :
E(Xi2 ) = var(Xi ) + [E(Xi )]2 = σ 2 + µ2 (4)
et
σ2
E(X̄ 2 ) = var(X̄ ) + [E(X̄ )]2 = + µ2 . (5)
n
337/461
Exercices
Réponses
En insérant (4) et (5) dans (3), il vient que :

( n 2 )
2 1 X 2 2 σ 2
E(S ) = (σ + µ ) − n +µ
n−1 n
i=1
1 n o
= n(σ 2 + µ2 ) − σ 2 − nµ2
n−1
1 n 2 o
= nσ + nµ2 − σ 2 − nµ2
n−1
1
= × (n − 1)σ 2
n−1
= σ 2 cqfd.
338/461
Exercices
Réponses
Réponse Exercice 3. Notons que les estimateurs

X1 + · · · + X7 2X1 + 3X4 − X6
µ̂1 = , µ̂2 = .
7 4
sont sans biais car :
E(X1 ) + · · · + E(X7 ) µ + ··· + µ 7µ
E(µ̂1 ) = = = =µ
7 7 7
et
2E(X1 ) + 3E(X4 ) − E(X6 ) 2µ + 3µ − µ 4µ
E(µ̂2 ) = = = = µ.
4 4 4
339/461
Exercices
Réponses
Donc, le meilleur estimateur sera celui qui possède la plus petite

variance. Donc, on doit calculer les variances de µ̂1 et µ̂2 pour conclure.
Ainsi,
var(X1 ) + · · · + var(X7 ) σ2 + · · · + σ2 7σ 2 σ2
var(µ̂1 ) = 2
= = =
7 49 49 7
et
4var(X1 ) + 9var(X4 ) + var(X6 )
var(µ̂2 ) =
42
4σ 2 + 9σ 2 + σ 2 14σ 2 7σ 2
= = = .
16 16 8
On constate que var(µ̂1 ) < var(µ̂2 ), donc µ̂1 est le meilleur estimateur.
340/461
Intervalle de confiance de la moyenne
Intervalle de confiance d’une proportion
Intervalle de confiance d’une variance
Test d’hypothèse
Choix de la taille d’Échantillon
Test de comparaison
Exercices
Automne 2021
341/461
Test d’hypothèse
Test de comparaison
Exercices
La moyenne X̄ calculée à partir d’un échantillon donné est presque toujours

un peu plus grande ou un peu plus petite que la vraie moyenne de la
population µ. Nous ne pouvons pas s’attendre que notre estimateur X̄ soit
exactement égale à µ. On cherche plutôt une approche qui tient compte de la
marge d’erreur d’estimation. Cette estimation se présente alors sous la
forme :
X̄ ± E.
La marge d’erreur E est appelée précision de l’estimateur X̄ .
342/461
Test d’hypothèse
Test de comparaison
Exercices
Ainsi l’estimation par intervalle de confiance de µ consiste à déterminer

l’erreur E de façon que
µ ∈ [X̄ − E, X̄ + E]
avec une probabilité égale à 1 − α appelée niveau de confiance.

Par exemple, on peut déterminer un intervalle de confiance qui contient la
valeur de µ avec un niveau de confiance égal à 95%. Cela veut dire que si on
répète la même procédure d’estimation 100 fois, la moyenne sera dans 95
intervalles parmi les 100 intervalles établis. Cela signifie que si on construit
un intervalle de confiance par un seul échantillon, il y aura un risque de 5%
que la valeur de µ ne soit pas dans cet intervalle.
343/461
Test d’hypothèse
Test de comparaison
Exercices
Construction de l’intervalle de confiance de µ

Soit [X̄ − E, X̄ + E] un intervalle de confiance de µ. Afin de déterminer la
précision E, on distingue quatre cas :
Cas 1 : Si X1 , . . . , Xn est un échantillon issu d’une population de loi normale
de variance σ 2 connue, alors l’intervalle de confiance de niveau 1 − α de µ
est :

σ σ
X̄ − zα/2 √ , X̄ + zα/2 √ .
n n
Ainsi la précision de l’estimation sera : E = zα/2 √σn .
344/461
Test d’hypothèse
Test de comparaison
Exercices
Cas 2 : Si X1 , . . . , Xn est un échantillon issu d’une population de loi normale

de variance σ 2 inconnue, alors l’intervalle de confiance de niveau 1 − α de µ
est :

S S
X̄ − tα/2,n−1 √ , X̄ + tα/2,n−1 √ .
n n
La précision de l’estimation dans ce cas sera : E = tα/2,n−1 √Sn .
345/461
Test d’hypothèse
Test de comparaison
Exercices
Cas 3 : Si X1 , . . . , Xn est un échantillon issu d’une population de loi inconnue,

alors pourvue que la taille n soit assez grande (n ≥ 30), l’intervalle de
confiance de niveau 1 − α de µ est :

S S
X̄ − zα/2 √ , X̄ + zα/2 √ .
n n
De même, la précision de l’estimation dans ce cas est : E = zα/2 √Sn .
346/461
Test d’hypothèse
Test de comparaison
Exercices
Cas 4 : Si X1 , . . . , Xn est un échantillon choisi sans remise à partir d’une

population de taille finie N et de loi inconnue, alors pourvu que la taille n soit
assez grande (n ≥ 30), l’intervalle de confiance de niveau 1 − α est :
" r r #
S N −n S N −n
X̄ − zα/2 √ , X̄ + zα/2 √ .
n N −1 n N −1
q
Dans cette situation la précision sera : E = zα/2 √Sn N−n
N−1
.
347/461
Test d’hypothèse
Test de comparaison
Exercices
Cas 1 : Taille de la population N inconnue

Soit p la proportion d’individus dans la population ayant une caractéristique
qualitative donnée. L’intervalle de confiance de niveau 1 − α de p est de la
forme :
" r r #
p̂(1 − p̂) p̂(1 − p̂)
p̂ − zα/2 , p̂ + zα/2
n n
pourvu que la taille n soit assez grande et que np̂ ≥ 5 et n(1 − p̂) ≥ 5.
348/461
Test d’hypothèse
Test de comparaison
Exercices
Cas 2 : Taille de la population N connue

Si la taille de la population N est connue, alors l’intervalle de confiance de p
devient :
" r r r r #
p̂(1 − p̂) N − n p̂(1 − p̂) N − n
p̂ − zα/2 , p̂ + zα/2 .
n N −1 n N −1
Remarque. Si N est très grand, le facteur

r
N −n
→ 1.
N −1
Dans ce cas, on retrouve l’intervalle de confiance précédent.
349/461
Test d’hypothèse
Test de comparaison
Exercices
Soit X1 , . . . , Xn un échantillon issu d’une population de loi normale N(µ, σ 2 ),

et dont la variance échantionnale est S 2 . L’intervalle de confiance de σ 2 est
donné par :
" #
(n − 1)S 2 (n − 1)S 2
,
χ2α/2,n−1 χ21−α/2,n−1
où
n
1 X
S2 = (Xi − X̄ )2 .
n−1
i=1
350/461
Test d’hypothèse
Test de comparaison
Exercices
Exemple. Déterminez un intervalle de confiance de σ 2 pour les données

suivantes :
17.19 42.25 41.61 14.97 22.25 47.24 33.87
Rep. IC = [71.5974, 836.1266], car S 2 = 172.4232, χ20.025,6 = 14.4494 et

χ20.975,6 = 1.2373
351/461
Test d’hypothèse
Test de comparaison
Exercices
Choix de la taille d’échantillon
La qualité d’un intervalle de confiance se mesure par son degré de

confiance 1 − α et sa marge d’erreur E. Un choix adéquat de la taille de
l’échantillon permet de contrôler simultanément ces deux facteurs.
352/461
Test d’hypothèse
Test de comparaison
Exercices
Cas d’une moyenne µ : taille de la population N inconnue

Dans le cas d’une population normale de variance connue (cas 1), nous
pouvons déterminer la taille minimale requise de l’échantillon pour avoir un
intervalle de confiance de niveau 1 − α et de précision fixés à l’avance :
σzα/2 2

n≥ .
E
Lorsque σ est inconnu, on le remplacera par une pré-estimation s.
353/461
Test d’hypothèse
Test de comparaison
Exercices
Cas d’une moyenne µ : taille la population N connue

Si la population est de taille finie N et le tirage est sans remise, alors :
1) La taille requise pour la moyenne sera :
2
Nzα/2 σ2
n≥ 2
.
(N − 1)E 2 + zα/2 σ2
Ainsi si la variance est inconnue, on la remplace par une pré-estimation

s2 .
354/461
Test d’hypothèse
Test de comparaison
Exercices
Cas d’une proportion p : taille de la population N inconnue

Dans le cas d’une proportion, si l’on dispose d’une pré-estimation p̂ de p, la
taille minimale sera :
zα/2 2

n≥ p̂(1 − p̂).
E
Par contre, si la pré-estimation n’est pas disponible, on remplacera dans la

formule précédente p̂ par 0.5.
355/461
Test d’hypothèse
Test de comparaison
Exercices
Cas d’une proportion p : taille de la population N connue

La taille requise pour la proportion sera :
2
Nzα/2 p̂(1 − p̂)
n≥ 2
.
(N − 1)E 2 + zα/2 p̂(1 − p̂)
De même lorsqu’on ne possède pas de pré-estimation p̂, on prendra p̂ = 0.5.
356/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 1
Exercice 1. On suppose que le poids (en milliers de Kg) d’un camion

remorque empruntant une autoroute obéit à la loi N(µ, 2). On a pesé 20
camions remorques choisis au hasard et observé X̄ = 7.4 comme moyenne.
a) Donnez un intervalle de confiance de niveau 90% pour µ. Préciser
l’erreur d’estimation.
b) Quelle taille d’échantillon devriez-vous avoir afin que la marge d’erreur
d’un intervalle de confiance de niveau 90% pour la moyenne µ soit
inférieure à 0.05 ? rep : n = 2165.
357/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 1
a) Puisque la variable d’étude qui est le poids des camions suit une loi
normale de variance connue σ 2 = 2, donc, il s’agit du cas 1. Par suite,
l’intervalle de confiance au niveau 90% de la moyenne de la population
µ est :

σ σ
IC = X̄ − z α2 × √ , X̄ + z α2 × √
n n
" √ √ #
2 2
= 7.4 − z0.05 × √ , 7.4 + z0.05 × √
20 20
" √ √ #
2 2
= 7.4 − 1.645 × √ , 7.4 + 1.645 × √
20 20
= [6.879805, 7.920195] .
358/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 1
Ainsi, l’erreur d’estimation est :

√
2
E = 1.645 × √ = 0.5201947.
20
b) On cherche la taille de l’échantillon n de sorte que la marge d’erreur

associée à l’intervalle de confiance est plus petite que E = 0.05 avec
une confiance 1 − α = 0.90, c-à-d, z α2 = 1.645. Ceci s’obtient à l’aide
de la formule :
α 2 √ !2
σz 2 2 × 1.645
n≥ = = 2164.82
E 0.05
Donc, la taille requise sera : n = 2165.
359/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 2
Exercice 2. Une compagnie qui fabrique des piles s’intéresse à la durée de

vie moyenne µ (en heures) de celles-ci. Un technicien mesure donc la durée
de vie pour chacune des piles d’un échantillon de taille 150. La moyenne et la
variance observées sont 4.7 et 0.07 respectivement.
a) Donnez un intervalle de confiance de niveau 95% pour µ. Préciser
l’erreur d’estimation.
b) Déterminer la taille d’échantillon afin que la marge d’erreur d’un
intervalle de confiance de niveau 95% pour la moyenne µ soit inférieure
à 0.02 ?
360/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 2
a) La variable à l’étude est la durée de vie des piles de loi inconnue. Mais
la taille de l’échantillon est n = 150 ≥ 30. Donc, on calcule l’intervalle de
confiance selon le cas 3. Ainsi, l’intervalle de confiance au niveau 95%
de la moyenne de la population µ est :

S S
IC = X̄ − z α2 × √ , X̄ + z α2 × √
n n
√ √
0.07 0.07
= 4.7 − z0.025 × √ , 4.7 + z0.025 × √
150 150
√ √
0.07 0.07
= 4.7 − 1.96 × √ , 4.7 + 1.96 × √
150 150
= [4.657659, 4.742341] .
361/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 2
L’erreur d’estimation est alors donnée par :

√
0.07
E = 1.96 × √ = 0.04234084
150
b) Cherchons la taille de l’échantillon n de sorte que la marge d’erreur

associée à l’intervalle de confiance soit plus petite que E = 0.02 avec
une confiance 1 − α = 0.95, c-à-d, z α2 = 1.96. Ceci s’obtient à l’aide de
la formule :
√ 2
s × z α2 2

0.07 × 1.96
n≥ = = 672.28.
E 0.02
Donc, la taille requise sera : n = 673.
362/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 3
Exercice 3. Les lectures de tension artérielle systolique (en mm Hg) sur un

individu à la même heure pendant 7 jours consécutifs sont :
161 155 142 157 150 158 156
Supposons que la tension artérielle suit une loi normale.

1. Déterminez un intervalle de confiance, au niveau de 95%, de la
moyenne µ de la tension artérielle de cet individu.
2. Déterminer la taille d’échantillon afin que la marge d’erreur d’un
à 4 mm Hg ?
3. Déterminez un intervalle de confiance, au niveau de 95%, de l’écart-type
σ de la tension artérielle de cet individu.
363/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 3
Solution de exercice 3.
1. La tension artérielle est la variable à l’étude supposée suivre une loi
normale de variance inconnue σ 2 , donc, il s’agit du cas 2. Par
conséquent, l’intervalle de confiance au niveau 95% de la moyenne de la
population µ est :

S S
IC = X̄ − t α2 ,n−1 × √ , X̄ + t α2 ,n−1 × √
n n

6, 31 6, 31
= 154, 14 − t0.025,6 × √ , 154, 14 + t0.025,6 × √
7 7

6.31 6.31
= 154.14 − 2, 4469 × √ , 154.14 + 2, 4469 × √
7 7
= [148.3076, 159.9782] .
364/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 3
Notons que l’erreur d’estimation associée l’intervalle de confiance précédent

est :
6.31
E = 2.4469 × √ = 5.835748.
7
2. Cherchons la taille de l’échantillon n de sorte que la marge d’erreur

associée à l’intervalle de confiance soit plus petite que E = 4 mm Hg
avec une confiance 1 − α = 0.95, c-à-d, z α2 = 1.96. Ceci s’obtient à
l’aide de la formule :
s × z α2 2
2
6.31 × 1.96
n≥ = = 16.99528.
E 4
Donc, la taille requise sera n = 17.
365/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 3
3. Puisque X1 , ..., X7 est un échantillon issu d’une population de loi normale

N(µ, σ 2 ), et dont la variance échantillonnalle vaut 6, 312 trouvée en
a),l’intervalle de confiance au niveau 95% de la variance de la
population σ 2 est :
" #
(n − 1)S 2 (n − 1)S 2
IC = ,
χ2α ,n−1 χ21− α ,n−1
2 2
" #
6 × 6, 312 6 × 6, 312
= ,
χ20.025,6 χ20.975,6

238, 86 238, 86
= ,
14, 4494 1, 2373
= [16, 53, 193, 04] .
366/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 3
Puisqu’on cherche l’intervalle de confiance pour σ , alors on a

hp p i
IC = 16, 53, 193, 04
= [4, 07, 13, 89] .
367/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 4
Exercice 4. Vous avez prélevé un échantillon sur un caractère X obéissant à

la loi N(µ, 4). Avec 5 observations, vous avez construit un intervalle de
confiance au niveau de 95% pour µ. L’intervalle obtenu est [7.7869, 11.2931].
Par la suite, vous vous rendez compte que vous avez oublié 3 observations
qui valent 10.6, 10.7 et 10.9. Reconstruisez votre intervalle de confiance de
niveau 95% pour µ en tenant compte de ces nouvelles observations.
rep : I.C = [8.601570709, 11.37342929]
368/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 4
a) Trouvons la moyenne X̄5 basée sur l’échantillon de taille n = 5. On sait
que X̄5 est le milieu de l’intervalle de confiance

σ σ
IC = X̄5 − z 2 × √ , X̄5 + z 2 × √
α α = [7.7869, 11.2931] .
n n
Donc,
7.7869 + 11.2931
X̄5 = = 9.54.
2
369/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 4
b) En ajoutant les 3 données, la valeur de la moyenne basée sur les 8

observations sera
x6 + x7 + x8 + 5 × X̄5 10.6 + 10.7 + 10.9 + 5 × 9.54
X̄8 = =
8 8
= 9.9875.
Donc le nouveau intervalle de confiance sera :

σ σ
IC = X̄8 − z α2 × √ , X̄8 + z α2 × √
8 8

2 2
= 9, 9875 − 1.96 × √ , 9, 9875 + 1.96 × √
8 8
= [8.601570709, 11.37342929] .
370/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 5
Exercice 5. En 1976, la commission Carnegie effectua une étude portant sur

les N = 2700 institutions de l’enseignement supérieur des USA à l’aide d’un
échantillon aléatoire de taille n = 225. On a observé une moyenne de
X̄ = 3700 étudiants inscrits par institution, avec un écart-type s = 6000.
1. Trouver un intervalle de confiance de niveau de 95% pour µ, la moyenne
d’inscrits par institution. Donner l’erreur d’estimation relative à cet
intervalle de confiance.
2. Déterminer la taille d’échantillon afin que la marge d’erreur d’un
à 600 étudiants.
371/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 5
1. La variable à l’étude est le nombre d’inscriptions par institutions de loi
inconnue. Puisque l’échantillon est choisi sans remise à partir d’une
population de taille finie N = 2700 et de loi inconnue. Puisque la taille de
l’échantillon est n = 225 ≥ 30. Donc, on calcule l’intervalle de confiance
selon le cas 4. Par suite, l’intervalle de confiance au niveau 95% de la
moyenne de la population µ est :
372/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 5
" r r #
S N −n S N −n
IC = X̄ − z α ×√ × , X̄ + z α2 × √ ×
2
n N −1 n N −1
" r #
6000 2700 − 225
= 3700 ± z0.025 × √ ×
225 2700 − 1
" r #
6000 2700 − 225
= 3700 ± 1.96 × √ ×
225 2700 − 1
= [2949.23, 4450.76] .
L’erreur d’estimation est alors

r
6000 2700 − 225
E = 1.96 × √ × = 718.9329.
225 2700 − 1
373/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 5
2. Déterminons la taille d’échantillon afin que la marge d’erreur d’un

à 600 étudiants. Puisque la taille de la population N est disponible, la
taille de l’échantillon s’obtient alors par la formule :
2
Nzα/2 s2 2700 × 1.962 × 60002
n≥ 2
=
(N − 1)E 2 + zα/2 s2 2699 × 6002 + 1.962 × 60002
= 336.4185.
Par conséquent la taille d’échantillon requise est : n = 337.
374/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 6
Exercice 6. On désire estimer la proportion p de pièces défectueuses parmi

celles produites dans une usine au cours d’une journée. On sait que 100 000
pièces sont produites chaque jour. Pour se faire, on prélève un échantillon de
n pièces d’une journée donnée.
a) Si n = 300 et que 21 pièces sont défectueuses dans cet échantillon,
donnez un intervalle de confiance de niveau de 95% de p.
b) On veut construire un intervalle de confiance au niveau de 95% pour p.
Quelle est la taille minimale d’échantillon nécessaire afin que la marge
d’erreur soit d’au plus 0.005 ?
rep : a) [0.04112793, 0.09887207] b) n = 9095
375/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 6
a) Puisque la taille de la population est connue : N = 100000. L’intervalle
de confiance de p sera :
" r r #
p̂(1 − p̂) N −n
IC = p̂ ± z 2 ×
α ×
n N −1
" r r #
0.07 × 0.93 100000 − 300
= 0.07 ± z0.025 × ×
300 100000 − 1
" r r #
0.07 × 0.93 100000 − 300
= 0.07 ± 1.96 × ×
300 100000 − 1
= [0.04112793, 0.09887207] .
376/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 6
b) On cherche alors la taille de l’échantillon n de sorte que E = 0.005 et

z α2 = 1.96. Il suffit d’appliquer la formule suivante :
Nz 2α p̂(1 − p̂)
2
n ≥
(N − 1)E 2 + z 2α p̂(1 − p̂)
2
100000 × 1.962 × 0.07 × 0.93

=
99999 × 0.0052 + 1.962 × 0.07 × 0.93
= 9094.11
ce qui implique que la taille requise est n = 9095.
377/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 7
Exercice 7. Une firme de sondage désire estimer la proportion de personnes

en faveur d’un parti politique. Elle s’est fixée une marge d’erreur d’au plus 3%
et ce 19 fois sur 20. Combien de répondants lui faut-il ? Considérez le cas N
grand et N = 5 000.
rep : n1 = 1068 cas infini, et n2 = 880 cas N = 5000.
378/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 7
Solution de l’exercice 7. Sachant que l’erreur de sondage est fixée à

E = 3% = 0.03 et que la confiance est 1 − α = 19/20 = 95%, c’est-à-dire,
z α2 = 1.96. Puisqu’on ne dispose pas de pré-estimation p̂ de p, on prendra
alors p̂ = 0.5.
a) Sous ces conditions, la taille de l’échantillon requise lorsque la taille de
la population N est grande est donnée par la formule ci-dessous :
α 2 2
z2

1.96
n≥ p̂(1 − p̂) = × 0.52 = 1067.11.
E 0.03
Donc, n = 1068.
379/461
Test d’hypothèse
Test de comparaison
Exercices
Exercice 7
b) Par contre lorsque la taille de la population est connue, N = 5000, la

taille de l’échantillon requise sera calculée à partir de la formule
suivante :
Nz 2α p̂(1 − p̂)
2
n ≥
(N − 1)E 2 + z 2α p̂(1 − p̂)
2
5000 × 1.962 × 0.52

=
4999 × 0.032 + 1.962 × 0.52
= 879.56
ce qui nous donne n = 880.
Nous constatons qu’il est avantageux d’inclure dans les calculs la taille de la
population lorsqu’elle est connue. Ceci réduira la taille de sondage et permet
d’obtenir des économies.
380/461
Risque d’erreur
Comment exécuter un test d’hypothèse
Test sur une moyenne
Test d’hypothèse
Test sur une proportion
Test de comparaison
Test sur une variance
Test d’hypothèse
Automne 2021
381/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Test d’hypothèse
Exemple introductif
À la suite d’une compagne publicitaire portant sur les économies d’énergie,
un échantillon de 400 factures mensuelles révèle une consommation
moyenne de 480 kWh par mois et par logement avec un écart-type de 100
kwh. Avant cette campagne publicitaire, la consommation moyenne était de
490 kWh. On s’interroge sur l’effet de la campagne publicitaire. Cela revient à
confronter deux hypothèses :
H0 : La baisse de consommation observée est simplement due au hasard.
H1 : La baisse de consommation observée est réellement due à la
campagne publicitaire.
382/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Test d’hypothèse
Il s’agit de décider si l’on rejette l’hypothèse nulle H0 au profit de la seconde

H1 ou l’inverse. L’hypothèse nulle H0 représente habituellement l’hypothèse
conservatrice, celle qu’on accepte a priori, à moins que les observations ne
réussissent pas à nous convaincre du contraire.
Posons µ la consommation moyenne de la population après la publicité et
reformulons nos deux hypothèses de la manière suivante :
H0 : µ = 490 kWh : Campagne publicitaire n’a pas eu d’effet sur la
consommation.
H1 : µ < 490 kWh : Campagne publicitaire a porté fruit.
383/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Test d’hypothèse
Principe : L’idée générale d’un test est de supposer que H0 est vraie et
de ne la rejeter que si elle rend les résultats des observations trop
improbables.
Analyse : Supposons que H0 : µ = 490 kWh est vraie. Dans ce cas,
selon le théorème central limite, les fluctuations de X̄ sont
approximativement√ régies par la loi normale de moyenne µ = 490 et
d’écart-type σ/ n = 100/20 = 5. Maintenant, toujours sous H0 ,
évaluons les chances d’observer une valeur de X̄ aussi petite que 480,
c’est-à-dire si on répète notre sondage un grand nombre de fois,
combien de fois observerait-on une consommation moyenne de 480
kWh ou moins ? Ceci se calcule par :
P[X̄ ≤ 480|µ = 490] = P[Z ≤ −2] = 2.28%.
384/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Test d’hypothèse
Cette probabilité est appelée le seuil de signification empirique ou

probabilité empirique. De nombreux logiciels statistiques utilisent le mot
anglais “P-value".
Donc, si jamais la campagne publicitaire n’a pas réellement eu d’effet
significatif, des sondages auprès de 400 foyers nous donneraient une
consommation moyenne de 480 kWh ou moins dans 2.28% des cas
seulement !
385/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Test d’hypothèse
Étant donné qu’une probabilité de 2.28% peut être considérée assez

faible, la valeur de X̄ = 480 semble improbable sous H0 . Nous devrions
rejeter H0 et accepter H1 , c’est-à-dire la campagne publicitaire a porté
fruit. On dira que X̄ = 480 est statistiquement significative.
Le terme statistiquement significatif est un terme technique indiquant
simplement que l’on a suffisamment d’évidences pour croire que le
résultat observé n’est pas dû au simple hasard.
386/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Test d’hypothèse
Remarquons que si au lieu de X̄ = 480, notre sondage nous avait donné

X̄ = 485 alors dans le cas où µ = 490, les chances d’observer une
moyenne aussi petite que 485 auraient été
Pc = P[X̄ ≤ 485|µ = 490] = P[Z ≤ −1] = 15.87%.
Cela veut dire que lorsque la campagne publicitaire est sans effet, un
sondage auprès de 400 foyers nous donnerait une moyenne aussi petite
que 485 kWh environ 16 fois sur 100. Cela semble donc supporter H0 .
L’écart observé pourrait être attribuable au hasard et non à la campagne
publicitaire. Notons que plus le seuil de signification Pc est petit, plus
l’évidence est suffisamment forte pour rejeter H0 .
387/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Risque d’erreur
Dans un test d’hypothèse, on ne peut pas être certain de rejeter l’hypothèse

nulle H0 . On distingue deux types d’erreurs :
1) Erreur du type I : c’est la probabilité de rejeter H0 à tort
α = P[RH0 |H0 : vraie].
2) Erreur du type II : c’est la probabilité d’accepter H0 alors qu’elle est

fausse
β = P[H0 |H0 : fausse].
Remarque. La puissance du test qui mesure la qualité d’un test est définie
par :
π = 1 − β = P[RH0 |H0 : fausse].
388/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Nous adoptons les étapes suivantes permettant d’élaborer un test

d’hypothèse :
1. Formulez les hypothèses H0 et H1 à tester.
2. Fixez d’avance le seuil de signification α qui représente le risque de
rejeter à tort H0 .
3. Précisez les conditions d’application du test.
4. Spécifiez la statistique qui convient pour faire le test.
5. Adoptez une règle de décision qui conduira au rejet ou non de
l’hypothèse nulle.
6. Décision et conclusion.
389/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
On veut tester si la moyenne µ d’une population est statistiquement égale à

une valeur hypothétique, notée µ0 . On distingue trois types de tests :
1. H0 : µ = µ0 H1 : µ 6= µ0 : test bilatéral
2. H0 : µ = µ0 H1 : µ > µ0 : test unilatéral à droite.
3. H0 : µ = µ0 H1 : µ < µ0 : test unilatéral à gauche.
Pour exécuter ces tests, on distingue trois situations.
390/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Cas 1 : Si la variable à l’étude suit une loi normale de variance connue. Dans
ce cas la statistique du test sera :
Statistique de test :
X̄ − µ0
Z = √ ∼ N(0, 1) sous H0 .
σ/ n
Règles de décision :
1. Pour le test 1), on rejette H0 si |Z | > zα/2 .
2. Pour le test 2), on rejette H0 si Z > zα .
3. Pour le test 3), on rejette H0 si Z < −zα .
391/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Cas 2 : la variable à l’étude suit une loi inconnue de variance inconnue et la

taille de l’échantillon est assez grande (n ≥ 30).
X̄ − µ0
Z = √ ≈ N(0, 1) sous H0 .
S/ n
392/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Cas 3 : la population est normale de variance inconnue et la taille de

l’échantillon est petite (n < 30).
X̄ − µ0
T = √ ∼ tn−1 sous H0 .
S/ n
1. Pour le test 1), on rejette H0 si |T | > tα/2,n−1 .
2. Pour le test 2), on rejette H0 si T > tα,n−1 .
3. Pour le test 3), on rejette H0 si T < −tα,n−1 .
393/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
On veut vérifier si la proportion p d’une population est statistiquement égale

à une proportion proposée p0 . La taille de l’échantillon doit être suffisamment
grande de sorte que les conditions np0 ≥ 5 et n(1 − p0 ) ≥ 5 soient
satisfaites. Les tests se présentent comme suit :
1. H0 : p = p0 H1 : p 6= p0 : test bilatéral.
2. H0 : p = p0 H1 : p > p0 : test unilatéral à droite.
3. H0 : p = p0 H1 : p < p0 : test unilatéral à gauche.
394/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Statistique du test :
p̂ − p0
Z = q ≈ N(0, 1) sous H0
p0 (1−p0 )
n
où p̂ désigne la proportion estimée.

395/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Remarque importante
Pour tous les tests qui se basent sur la statistique du test Z ∼ N(0, 1), le plus
petit seuil αmin permettant de rejeter l’hypothèse nulle H0 sera :
1. Pour un test bilatéral αmin = 2(1 − φ(|Z |)).
2. Pour un test unilatéral à droite αmin = 1 − φ(Z ).
3. Pour un test unilatéral à gauche αmin = φ(Z ).
Cela signifie que si α > αmin on rejette H0 , sinon l’accepte.
396/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Supposons qu’on désire tester l’hypothèse que la variance σ 2 d’une

population normale N(µ, σ 2 ) est égale à une valeur spécifique σ02 . Soit un
échantillon aléatoire X1 , . . . , Xn issu de cette population et dont S 2 est sa
variance échantillonnale. On distingue trois tests :
1. H0 : σ 2 = σ02 H1 : σ 2 6= σ02 : test bilatéral.
2
2. H0 : σ = σ02 H1 : σ 2 > σ02 : test unilatéral à droite.
3. H0 : σ 2 = σ02 H1 : σ 2 < σ02 : test unilatéral à gauche.
397/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
(n − 1)S 2
χ2 = ∼ χ2n−1 sous H0 .
σ02
1. Pour le test 1), on rejette H0 si χ2 ∈
/ χ21−α/2,n−1 , χ2α/2,n−1 .

2. Pour le test 2), on rejette H0 si χ2 > χ2α,n−1 .

3. Pour le test 3), on rejette H0 si χ2 < χ21−α,n−1 .
398/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 1
Exercice 1. On s’intéresse au quotient intellectuel (caractère X ) des

étudiants de l’UQTR. On sait que X obéit à la loi N(µ, σ 2 ). Un chercheur croit
que le Q.I. moyen des étudiants de l’UQTR est supérieur à celui de la
population en général qui est de 100 (c’est la norme). Il prélève donc un
échantillon de 15 étudiants et observe X̄ = 107, 4 et s2 = 83, 2. Testez
l’hypothèse du chercheur en utilisant un seuil expérimental de 5%.
399/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 1
Solution exercice 1. Soient µ0 = 100 le QI moyen de la population et µ le QI

moyen des étudiants de l’UQTR. Pour vérifier l’hypothèse formulée par le
chercheur, on doit confronter les hypothèses suivantes :
H0 : µ = 100 contre H1 : µ > 100.
La population à l’étude X qui est le QI suit une loi normale de variance

inconnue. Donc, il s’agit du cas 3 relatif au test d’hypothèse sur une
moyenne. Dans ce cas, la statistique du test sera de la forme suivante :
X̄ − µ0 107.4 − 100
T = S
= √ = 3.142069.
√ √83.2
n 15
400/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 1
Règle de décision : Comme c’est un test unilatéral à droite basé sur la

loi de Student, on doit donc comparer T à tα,n−1 = t0.05,14 = 1.76131.
Ainsi, puisque
T = 3.142069 > tα,n−1 = 1.76131
donc, on rejette H0 et on accepte H1 .
Conclusion : Au seuil α = 5%, le QI moyen des étudiants est

significativement plus grand que celui de la population.
401/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 2
Exercice 2. à la suite d’une campagne publicitaire d’économie d’énergie, afin

de faire diminuer la consommation d’électricité qui s’élève jusque là en
moyenne à 490 kWh par mois et par logement. Un échantillon de 400
factures mensuelles révèle une consommation moyenne de 480 kWh par
mois et par logement avec un écart-type de 100 kWh. Peut-on conclure que
l’effet de la campagne publicitaire est significatif au seuil 10% ?
402/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 2
Solution de l’exercice 2. Soit µ0 = 490 kWh la consommation moyenne

d’électricité par mois et par logement avant la publicité. Soit µ la
consommation moyenne de la population après la publicité. Pour vérifier
l’hypothèse formulée par la campagne publicitaire, on doit confronter les
hypothèses suivantes :
H0 : µ = 490 contre H1 : µ < 490.
La population à l’étude X qui est la consommation d’électricité par mois par

logement suit une loi inconnue, mais la taille d’échantillon n = 400 > 30, il
s’agit donc du cas 2 relatif au test d’hypothèse sur une moyenne. Dans ce
cas, la statistique du test sera de la forme suivante :
403/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 2.
X̄ − µ0 480 − 490
Z = S
= 100
= −2.
√ √
n 400
Règle de décision : Puisque c’est un test unilatéral à gauche basé sur

la loi normale, on doit donc comparer Z à −zα = −z0.10 = −1.285.
Ainsi, puisque
Z = −2 < −zα = −1.285
Conclusion : Au seuil α = 10%, la consommation moyenne d’électricité

a diminué d’une significative, ce qui permet de conclure que l’effet de la
publicité est significatif au seuil 10%.
404/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 3
Exercice 3. Des données recueillies avant 1980 permettent d’affirmer que la

température annuelle moyenne (en o C) à un endroit du globe obéit à une loi
normale de moyenne 10. Les températures annuelles moyennes observées à
cet endroit de 1980 à 1990 ont été les suivantes :
10.5 9.7 10.2 10.9 9.2 10.1 10.3 10.8 10.6 11.1 11.4
Avec un niveau de signification de 5% peut-on penser que la température
annuelle moyenne à cet endroit a augmenté ?
405/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 3
Solution de l’exercice 3. Soit µ0 = 10 la température annuelle moyenne à

un endroit du globe avant 1980 et soit µ sa température moyenne après
1980. Pour vérifier l’hypothèse formulée par le chercheur, on doit confronter
les hypothèses suivantes :
H0 : µ = 10 contre H1 : µ > 10.
La population à l’étude X qui est la température suit une loi normale de

variance inconnue. Donc, il s’agit du cas 3 relatif au test d’hypothèse sur une
moyenne. Dans ce cas, la statistique du test sera de la forme suivante :
406/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 3
X̄ − µ0 10.436 − 10
T = S
= √ = 2.286403.
√ √0.4
n 11

loi de Student, on doit donc comparer T à tα,n−1 = t0.05,10 = 1.812461.
Ainsi, puisque
T = 2.286403 > tα,n−1 = 1.812461
Conclusion : Au seuil α = 5%, la hausse de la température est

significative.
407/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 4
Exercice 4. Un fabricant de disques compacts affirme que 99% de ses

disques n’ont aucune défectuosité. Pour vérifier cette affirmation, on teste
500 disques et on en trouve 10 défectueux.
a) Avec un niveau de signification de 5%, peut-on contester l’affirmation du
fabricant ?
b) Quel est le plus petit α qui permet de rejeter l’hypothèse nulle H0 ?
408/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 4
a) Soit p0 = 0.01 la proportion de disques compacts défectueux affirmée
par le fabricant. Soit p la vraie proportion de disques compacts
défectueux. Pour vérifier l’affirmation du fabricant à propos de la
proportion des de disques compacts défectueux, on doit confronter les
hypothèses suivantes :
H0 : p = 0.01 contre H1 : p > 0.01.
La population à l’étude X qui est le nombre de disque sans défectuosité.

Pour éxcuter le test, on doit vérifier les deux inéquations suivantes :
np0 ≥ 5 et n(1 − p0 ) ≥ 5.
Ces dernières sont satisfaites, car np0 = 5 et n(1 − p0 ) = 495.
409/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 4
Puisque il s’agit d’un test d’hypothèse sur une proportion, la statistique du

test est donc de la forme suivante :
p̂ − p0 0.02 − 0.01
Z = √ = √ = 2.2473333.
p0 (1−p0 ) √0.0099
√ 500
n

loi Normale, on doit donc comparer Z à zα = z0.05 = 1.645. Ainsi,
puisque
Z = 2.2247333 > zα = 1.645
donc on rejette H0 et on accepte H1 .
410/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 4
Conclusion : Au seuil α = 5%, on peut contester que 0.99 des disques

du fabricant est non défectueux.
b) Pour trouver le plus petit α, il suffit d’évaluer φ(Z ) car nous sommes en
présence d’un test unilatéral à droite.
αmin = 1 − φ(Z ) = 1 − φ(2.22) = 0.0132.
Donc, αmin = 0.0132 est le plus petit α qui permet de rejeter l’hypothèse
nulle H0 . Par exemple, on accepte H0 pour un risque α = 1% et la
rejette pour un risque α = 5%.
411/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 5
Exercice 5. Sur 1000 candidats au baccalauréat, 675 ont réussi.

1. Testez au niveau de 5% l’hypothèse selon laquelle la probabilité de
réussite est 0.7.
2. Quel est le plus petit α qui permet de rejeter l’hypothèse nulle H0 ?
412/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 5
1. Soit p la proportion d’étudiants qui ont réussi le baccalauréat. On veut

comparer cette proportion à une probabilité hypothétique, p0 = 0.70.
Pour ce faire, on doit confronter les hypothèses suivantes :
H0 : p = 0.70 contre H1 : p 6= 0.70.
Vérification des conditions du test : Pour éffectuer ce test, on doit

d’abord vérifier les inéquations suivantes :
np0 ≥ 5 et n(1 − p0 ) ≥ 5.
Ces dernières sont satisfaites car np0 = 700 et n(1 − p0 ) = 300.
413/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 5
Il s’agit d’un test d’hypothèse sur une proportion. Dans ce cas, la statistique
du test sera de la forme suivante :
p̂ − p0 0.675 − 0.70
Z = √ = √ = −1.725.
p0 (1−p0 )
√ √ 0.21
n 1000
Règle de décision : C’est un test bilatéral basé sur la loi Normale, on

doit donc comparer |Z | à z α2 = z0.025 = 1.96. Puisque
|Z | = 1.725 < z α2 = 1.96.
Donc, on accepte H0 .
Conclusion : Au seuil α = 5%, on peut affirmer que la probabilité de

réussir le baccalauréat est de 0.7.
414/461
Risque d’erreur
Test d’hypothèse
Test de comparaison
Exercice 5.
2. Puisque le test est bilatéral, le plus petit α permettant de rejeter H0 est

donnée par :
αmin = 2(1 − φ(|Z |))

= 2(1 − φ(1.73))
= 2 × (1 − 0.9582) = 0.0836 = 8.36%.
415/461
Échantillonnage et Estimation des paramètres Comparaison de deux moyennes : Cas d’échantillons indépendants
Estimation par intervalle de confiance Comparaisons de deux variances de lois normales
Test d’hypothèse Comparaisons de deux proportions
Test de comparaison Comparaisons de deux moyennes : Cas d’échantillons dépendants
Test de comparaison
Automne 2021
416/461
Comparaison de deux moyennes : Cas d’échantillons indépendants
On veut déterminer si deux populations sont semblables ou nettement

différentes par rapport à une caractéristique particulière.
Exemple. le ministère de l’éducation veut savoir si les enseignants sont
mieux payés que les enseignantes pour une tâche d’enseignement
équivalente. Soient µ1 et µ2 les salaires moyens des enseignants et des
enseignantes. Cela revient à tester si
417/461
Comparaison de deux moyennes : Cas d’échantillons indépendants
H0 : µ1 = µ2 : aucune différence significative entre les salaires moyens.

contre :
H1 : µ1 > µ2 : les enseignants sont mieux payés que les enseignantes.
418/461
Échantillons indépendants
Considérons deux populations différentes de moyennes µ1 et µ2 , et de

variances σ12 et σ22 . On s’intéresse aux tests d’hypothèses suivants :
1. H0 : µ1 = µ2 H1 : µ1 6= µ2 : test bilatéral.
2. H0 : µ1 = µ2 H1 : µ1 > µ2 : test unilatéral à droite.
3. H0 : µ1 = µ2 H1 : µ1 < µ2 : test unilatéral à gauche.
Pour élaborer ces tests, on prélève deux échantillons indépendants de ces
deux populations. On distingue trois cas possibles.
419/461
Cas 1 : Populations normales de variances σ12 et σ22 connues.

X̄1 − X̄2
Z = q ≈ N(0, 1) sous H0 : µ1 = µ2
σ1 /n1 + σ22 /n2
2
Règles de décision : Les règles de décision seront :

420/461
Cas 2 : Populations normales de variances inconnues mais égales :

σ12 = σ22 = σ 2 .
Puisque les deux lois normales possèdent une variance commune, il est
donc commode d’utiliser les deux échantillons pour estimer σ 2 par la
variance échantillonnale combinée définie par :
(n1 − 1)S12 + (n2 − 1)S22

Sc2 = .
n1 + n2 − 2
Ainsi la statistique du test sera :
421/461
X̄ − X̄2
T = p 1 ≈ tn1 +n2 −2 sous H0 : µ1 = µ2 .
Sc 1/n1 + 1/n2
1. Pour le test 1), on rejette H0 si |T | > tα/2,n1 +n2 −2 .
2. Pour le test 2), on rejette H0 si T > tα,n1 +n2 −2 .
3. Pour le test 3), on rejette H0 si T < −tα,n1 +n2 −2 .
422/461
Cas 3 : Les deux tailles d’échantillons n1 et n2 sont ≥ 30.

Dans ce cas, il suffit d’appliquer le théorème central limite pour conclure que
X̄1 − X̄2
Z = q ≈ N(0, 1) sous H0 : µ1 = µ2 .
S12 /n1 + S22 /n2
423/461
Exercice 1
Exercice 1. Une entreprise de marketing croit que le prix moyen d’un certain
type de pantalons est plus bas à Montréal qu’à Québec. Elle choisit au
hasard 30 magasins à Montréal et trouve que la moyenne du prix est 42.36$
avec un écart-type de 3.96$. Elle choisit un autre échantillon, au hasard, de
30 magasins à Québec et trouve que la moyenne des prix est 45.49$ avec un
écart-type de 4.07$. Testez au seuil 5% l’hypothèse proposée ?
424/461
Exercice 1
Réponse.
- µ1 : prix moyen de pantalons à Montréal
- µ2 : prix moyen de pantalons à Québec
- Populations de loi inconnues, mais avec les tailles d’échantillon
n1 = n2 = 30 ≥ 30, donc cette situation correspond bien au cas 3
Hypothèses à tester :
H 0 : µ1 = µ2 contre H1 : µ1 < µ2 .
425/461
Exercice 1
X̄1 − X̄2
Z = r ≈ N (0, 1).
S12 S22
n1
+ n2
Puisque X̄1 = 42.36, X̄2 = 45.49, S1 = 3.96, S2 = 4.07 et n1 = n2 = 30,

donc
Z = −3.019
Règle de décision :
Z = −3.019 < −zα = −z0.05 = −1.645, donc on rejette H0 et on
accepte H1 . On conclut qu’au seuil 5%, les prix de ce type de pantalons
est significativement plus bas à Montréal qu’à Québec.
426/461
Exercice 2
Exercice 2. On suppose que la longévité (nombre d’années vécues) d’un

individu est distribuée selon une loi normale. D’après des études actuarielles
récentes, la longévité des hommes a un écart-type de 4 ans, tandis que celle
des femmes à un écart-type de 6 ans. On voulait savoir si les femmes vivent
significativement plus longtemps que les hommes. Pour ce faire, on recueille
un échantillon de 60 personnes, dont 28 sont des femmes. La durée de vie
moyenne des hommes est 72 ans tandis que celle des femmes est de 75
ans. Quelle est la conclusion si on prend un seuil de 5% ?
427/461
Exercice 2
Réponse.
- µ1 : longévité moyenne chez les hommes

- µ2 : longévité moyenne chez les femmes
- Populations de loi normales de variances connues. Il s’agit donc du cas
1
H 0 : µ1 = µ2 contre H1 : µ1 < µ2 .
428/461
Exercice 2
X̄1 − X̄2
Z = r ∼ N (0, 1).
σ12 σ22
n1
+ n2
Puisque X̄1 = 72, X̄2 = 75, σ1 = 4, σ2 = 6, n1 = 32 et n2 = 28, donc

Z = −2.2450.
Z = −2.2450 < −zα = −z0.05 = 1.645,
ce implique qu’on rejette H0 et on accepte H1 . Au seuil 5%, on conclut

que les femmes vivent significativement plus longtemps que les
hommes.
429/461
Exercice 3
Exercice 3. Deux employés postulent à un même poste. Se prétendant plus

qualifié que son confrère, l’employé A affirme qu’il règle ses dossiers en un
temps moyen inférieur à celui de B. Afin de vérifier ses dires, la direction
relève le temps pris par chacun de ces employés pour compléter un
échantillon de 15 dossiers. Elle calcule, pour ces échantillons, un temps
moyen de 4.25h par dossier pour l’employé A et de 4.75h pour l’employé B
avec des variances respectives de 0.4 et 0.36h. D’autre part, on estime que
le temps nécessaire pour compléter ce type de dossier est distribué
normalement. On suppose que les variances des temps des employés sont
égales. Utilisez un seuil de 5% pour tester l’affirmation de l’employé A.
430/461
Exercice 3
Réponse.
- µ1 : temps moyen de traitement de dossiers par l’employé A
- µ2 : temps moyen de traitement de dossiers par l’employé B
- Populations de loi normales de variances inconnues, mais supposées
égales. Il s’agit donc du cas 2.
H 0 : µ1 = µ2 contre H1 : µ1 < µ2 .
431/461
Exercice 3
X̄1 − X̄2
T = q ∼ tn1 +n2 −2 .
Sc n1 + n1
1 2
avec
(n1 − 1)S12 + (n2 − 1)S22
Sc2 =
n1 + n2 − 2
Puisque X̄1 = 4.25, X̄2 = 4.75, S12 = 0.4, S22 = 0.36, n1 = 15 et n2 = 15,
donc Sc2 = 0.38. d’où : T = −2.22
432/461
Exercice 3
T = −2.22 < −tα,n1 +n2 −2 = −t0.05,28 = −1.697, donc on rejette H0 et on
accepte H1 . Donc, au seuil 5%, l’employé A traite significativement plus
rapidement ses dossiers que l’employé B.
433/461
Comparaisons de deux variances de lois normales
Le cas 2 concernant le test comparant deux moyennes de deux

populations normales, se fait sous la supposition que les variances des
populations sont inconnues, mais égales. Pour vérifier cette dernière
condition, nous établirons une procédure statistique permettant de tester
l’égalité des variances de deux populations de lois normales.
434/461
Nous disposons de deux échantillons issus de deux lois normales de

variances respectives σ12 et σ22 , et nous désirons tester l’égalité de ces
variances. Désignons par S12 et S22 les variances échantillonales calculées à
partir de ces échantillons. Le test sera :
H0 : σ12 = σ22
H1 : σ12 6= σ22 : test bilatéral.
435/461
S12
F = ≈ Fn1 −1,n2 −1 sous H0 : σ12 = σ22 ,
S22
où Fn1 −1,n2 −1 désigne la loi de Fisher à n1 − 1 et n2 − 1 degrés de liberté.
Règles de décision. On rejette H0 si
F ∈
/ [F1−α/2,n1 −1,n2 −1 , Fα/2,n1 −1,n2 −1 ].
436/461
Remarque. Rappelons que la relation suivante est très utile lors de la lecture
dans la table de Fisher
1
F1−α,n,m = .
Fα,m,n
437/461
Exercice 1
Exercice 1. Deux employés postulent à un même poste. Se prétendant plus

qualifié que son confrère, l’employé A affirme qu’il règle ses dossiers en un
temps moyen inférieur à celui de B. Afin de vérifier ses dires, la direction
relève le temps pris par chacun de ces employés pour compléter un
échantillon de 15 dossiers. Elle calcule, pour ces échantillons, un temps
moyen de 4.25h par dossier pour l’employé A et de 4.75h pour l’employé B
avec des variances respectives de 0.4 et 0.36h. D’autre part, on estime que
le temps nécessaire pour compléter ce type de dossier est distribué
normalement. Utilisez un seuil de 5% pour tester l’égalité des variances des
temps des deux employés A et B.
438/461
Exercice 1
Réponse.
- σ12 : variance du temps utilisé par l’employé A
- σ22 : variance du temps utilisé par l’employé B
- S12 = 0.4 : variance échantillonale de l’employé A
- S22 = 0.36 : variance échantillonale de l’employé B
- Populations de lois normales
H0 : σ12 = σ22 contre H1 : σ12 6= σ22 .
439/461
Exercice 1
S12 0.4
F = 2
= = 1.11
S2 0.36
Règle de décision : Nous avons :
Fα/2,n1 −1,n2 −1 = F0.025,14,14 = 2.979,
1 1
F1−α/2,n1 −1,n2 −1 = F0.975,14,14 = = = 0.3357.
F0.025,14,14 2.979,
Puisque F = 1.11 ∈ [0.3357, 2.979], donc on accepte H0 , l’hypothèse
selon laquelle les deux variances sont significativement égales.
440/461
Exercice 2
Exercice 2. Deux machines fabriquent des pièces métalliques. On

s’intéresse à comparer les poids moyens des pièces fabriquées par ces
machines. On suppose la normalités des populations. Voici les données
recueillies :
1. Machine 1 : n1 = 25, X̄1 = 0.984 et S12 = 13.46
2. Machine 2 : n2 = 30, X̄2 = 0.907 et S22 = 9.65
a) Testez, au seuil α = 0.05, l’hypothèse selon laquelle les variances des
deux machines sont égales.
b) Testez, au seuil α = 0.05, l’hypothèse selon laquelle les deux machines
fabriquent des pièces ayant le même poids moyen.
441/461
Exercice 2
Réponse a).
- σ12 : variance du poids des pièces fabriquées par la machine 1
- σ22 : variance du poids des pièces fabriquées par la machine 2
- S12 = 13.46 : variance échantillonale de la machine 1
- S22 = 9.65 : variance échantillonale de la machine 2
- Populations de lois normales
H0 : σ12 = σ22 contre H1 : σ12 6= σ22 .
442/461
Exercice 2
S12 13.46
F = = = 1.3948.
S22 9.65
Règle de décision : Nous avons :
Fα/2,n1 −1,n2 −1 = F0.025,24,29 = 2.1540,
1 1
F1−α/2,n1 −1,n2 −1 = F0.975,24,29 = = = 0.4510
F0.025,29,24 2.2175
Puisque F = 1.3948 ∈ [0.4510, 2.1540], donc on accepte H0 ,
l’hypothèse selon laquelle les deux variances sont significativement
égales.
443/461
Exercice 2
Réponse b).
- Populations normales avec variances inconnues, mais égales d’après a).
H 0 : µ1 = µ2 contre H1 : µ1 6= µ2 .
Calculons d’abord la variance combinée :
(n1 − 1)S12 + (n2 − 1)S22
Sc2 = = 11.38.
n1 + n2 − 2
444/461
Exercice 2
Ainsi, la statistique du test sera donnée par :
X̄ − X̄2
T = p 1 = 0.0843.
Sc 1/n1 + 1/n2
Puisque |T | = 0.0843 < t α2 ,n1 +n2 −2 = t0.025,53 ≈ 2.009, donc on accepte
H0 . On peut alors conclure, au seuil 5%, que les deux machines
fabriquent des pièces ayant le même poids moyen.
445/461
Comparaisons de deux proportions
Le but est de comparer deux proportions p1 et p2 d’un même caractère dans

deux populations différentes. Lestests se présentent comme suit :
1. H0 : p1 = p2 H1 : p1 6= p2 : test bilatéral.
2. H0 : p1 = p2 H1 : p1 > p2 : test unilatéral à droite.
3. H0 : p1 = p2 H1 : p1 < p2 : test unilatéral à gauche.
446/461
Lorsque les tailles n1 et n2 des deux échantillons sont assez grandes de
sorte que n1 p̂ ≥ 5, n1 (1 − p̂) ≥ 5, n2 p̂ ≥ 5, n2 (1 − p̂) ≥ 5, où p̂ désigne
l’estimateur combiné calculé par la formule :
n1 p̂1 + n2 p̂2
p̂ = .
n1 + n2
Ainsi, la statistique du test appropriée sera :
p̂1 − p̂2
Z = r ≈ N(0, 1) sous H0 .
p̂(1 − p̂) n1 + 1
n2
1
447/461

448/461
Exercice 1
Exercice 1. Deux traitements expérimentaux, A et B, sont utilisés contre une

maladie. Le traitement A est administré à 250 malades et le traitement B à
175 malades. Le traitement A donne lieu à 75 guérisons et le traitement B à
44 guérisons. Avec un seuil de signification de 10%, peut-on considérer que
les taux de guérison des 2 traitements ne sont pas identiques ? Quel est le
plus petit seuil α permettant de rejeter l’hypothèse nulle.
449/461
Exercice 1
Réponse.
- p1 : taux de guérison du traitement A
- p2 : taux de guérison du traitement B
- La proportion combinée p̂ est :
75 44
n1 p̂1 + n2 p̂2 250 × 250 + 175 × 175
p̂ = = = 0.28.
n1 + n2 250 + 175
450/461
Exercice 1
Vérification des conditions du test : En effet, les inégalités n1 p̂ ≥ 5,

n1 (1 − p̂) ≥ 5, n2 p̂ ≥ 5 et (1 − n2 )p̂ ≥ 5 sont satisfaites car :
n1 p̂ = 70, n1 (1 − p̂) = 180, n2 p̂ = 49 n2 (1 − p̂) = 126.
H0 : p1 = p2 contre H1 : p1 6= p2 .
451/461
Exercice 1
p̂1 − p̂2
Z = r = 1.10.
p̂(1 − p̂) n1 + 1
n2
1
Règle de décision : Puisque |Z | = 1.10 est plus petite que

z α2 = z0.05 = 1.645, donc on ne rejette pas l’hypothèse H0 . On conclut
alors au seuil α = 10% que les deux remèdes ont le mème taux de
guérison.
452/461
Exercice 1
Calcul du plus petit seuil : Puisque, il s’agit d’un test bilatéral basé sur
la loi normale. Donc, le plus petit seuil α permettant de rejeter H0 est :
αmin = 2(1 − φ(|Z |)) = 2(1 − φ(1.10)) = 2(1 − 0.8643) = 27.14%.
Ceci signifie que pour rejeter H0 , il faut prendre un risque de premier

espèce au moins égale 27.14%. Ce qui montre que l’hypothèse H0 est
très solide.
453/461
Échantillons dépendants (appariés)
Exemple. 10 individus ont été pesés avant et après avoir cessé de fumer
durant une période d’un mois. On veut tester l’hypothèse selon laquelle le fait
de cesser de fumer n’a aucun effet sur le poids. Cela revient à tester
H0 : µ1 = µ2 où µ1 et µ2 désignent respectivement les poids avant et après
avoir cessé de fumer. Pour exécuter le test on mesure les poids avant et
après avoir cessé de fumer de 10 individus :
Sujet 1 2 3 4 5 6 7 8 9 10
X1 : Poids
78 70 90 81 55 68 76 60 73 74
avant
X2 : Poids
78 69 92 83 55 72 74 63 74 76
après
D = X1 − X2 0 1 −2 −2 0 −4 2 −3 −1 −2
454/461
Il est clair que les variables X1 et X2 sont dépendantes via les individus.
Par conséquent les deux échantillons sont dépendants. On ne peut donc
pas utiliser la procédure du test établie dans le cas des échantillons
indépendants. Pour élaborer la procédure de test convenable, on pose
µD = µ1 − µ2 , par conséquent
H 0 : µ1 = µ2 ⇔ H0 : µD = 0.
Nous remarquons que µD = µ1 − µ2 est la moyenne de la variable

D = X1 − X2 .
455/461
Ainsi, les tests de comparaison de moyennes deviennent s’exprimeront

en fonction de la moyenne D comme suit :
1. HD : µD = 0 H1 : µD 6= 0 : test bilatéral.
2. HD : µD = 0 H1 : µD > 0 : test unilatéral à droite.
3. HD : µD = 0 H1 : µD < 0 : test unilatéral à gauche.
Pour établir ces tests, on distingue deux cas possibles :
456/461
Cas 1 : la différence D = X1 − X2 suit une loi normale.

On calcule la moyenne D̄ et la variance SD2 de la variable D = X1 − X2 . La
statistique du test sera alors :
D̄
T = √ ≈ tn−1 sous H0 : µD = 0.
SD / n
1. Pour le test 1), on rejette H0 si |T | > tα/2,n−1 .
2. Pour le test 2), on rejette H0 si T > tα,n−1 .
3. Pour le test 3), on rejette H0 si T < −tα,n−1 .
457/461
Cas 2 : la différence D = X1 − X2 de loi inconnue, mais la taille est assez

grande (n ≥ 30).
On calcule la moyenne et la variance et de la variable . La statistique du test
sera alors :
D̄
Z = √ ≈ N(0, 1) sous H0 : µD = 0.
SD / n
458/461
Exercice
Exercice 1. On désire vérifier si le taux hypothécaire des banques a changé

durant deux trimestres consécutifs. Pour cela on recueille (en %) le taux X1
du premier et le taux X2 du deuxième trimestre de 9 banques. Posons
D = X1 − X2
Banque 1 2 3 4 5 6 7 8 9
X1 12 12.5 11.7 12 12.9 13 11.9 12.4 12.7
X2 12 12.5 11.6 12 12.8 13.1 11.9 12.3 12.5
D 0 0 0.1 0 0.1 −0.1 0 0.1 0.2
459/461
Exercice
Question : On suppose que la différence D suit une loi normale.

D’après ces résultats, peut-on affirmer que les taux hypothécaires sont
demeurés stables ? Prenez un seuil de signification de 5%.
Hypothèse à tester :
H 0 : µD = 0 contre H1 : µD 6= 0.
460/461
Exercice
n n
1X 1 X
D̄ = di = .0444 et SD2 = (di − D̄)2 = 0.008.
n n−1
i=1 i=1
Donc
D̄
T = √ = 1.50.
SD / n
Puisque |t| = 1.50 < t0.025,8 = 2.3060, donc on accepte H0 .
Conclusion :
On conclut au seuil α = 5% que le taux hypothécaire des banques n’a
pas changé durant ces deux trimestres consécutifs.
461/461

Notes de Cours

Transféré par

Droits d'auteur :

Formats disponibles

Notes de Cours

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Notes de Cours

Transféré par

Droits d'auteur :

Formats disponibles

Probabilités et Statistique

Mhamed Mesfioui, Ph. D.

Département de mathématiques et d’informatique Université du Québec à Trois-Rivières

Mhamed Mesfioui, Ph.D.

Partie I : Statistique descriptive

2 Paramètres de positionnement et de dispersion

Mhamed Mesfioui, Ph. D.

Variable quantitative : elle fait référence à un système de mesure

Variable qualitative : elle ne fait pas référence à un système de mesure

Représentation des données : cas continu

78.9 83.4 90.0 88.2 89.3 60.8

Données groupées : sont des données obtenues en regroupant les

La valeur centrale mi d’une classe est le milieu de la classe [ai , bi [

La classe contenant le plus grand nombre d’observations, c’est-à-dire,

Le nombre p de classes dans un tableau de fréquences est donné par

Tableau de fréquence pour des données discrètes

Variables quantitatives discrètes : données brutes

Tableau de fréquences : on peut présenter les données brutes

Tableau de fréquences dans le cas discret

Présentation du tableau de fréquences :

Paramètres de positionnement et de dispersion

Mhamed Mesfioui, Ph. D.

Paramètres de position et de dispersion

Moyenne d’un échantillon issu d’une variable continue

Par exemple la moyenne des données de l’exemple 1 est :

Moyenne d’un échantillon

Moyenne d’un échantillon issu d’une variable continue

Par exemple la moyenne de données groupées de l’exemple 2 est :

Variance d’un échantillon

Variance d’un échantillon issu d’une variable continue

Par exemple la variance et l’écart-type des données de l’exemple 1 sont :

Variance d’un échantillon

Variance d’un échantillon issu d’une variable continue

Par exemple la variance et l’écart-type des données de l’exemple 2 sont :

Mhamed Mesfioui, Ph. D.

Représentations graphiques des données : histogramme

hauteur du rectangle = fréquence de la classe.

L’histogramme donne une idée sur le comportement de la distribution

Illustration d’un histogramme

Histogramme des durée de vie: données exemple 1

Représentation graphique d’une variable qualitative ou quantitative

Illustration d’un diagramme à secteurs circulaires

Diagramme en boîte (Box PLot)

Construction du diagramme en boîte

Médiane d’un échantillon

Médiane d’un échantillon

Par exemple, la médiane des données 1, 2, 3.5, 5.7, 8, 12.3, 14 sera

Médiane d’un échantillon

2. Cas 2 : si n est pair, alors

Quartiles d’un échantillon

Remarque. le quartile d’ordre Q2 n’est nulle autre que la médiane M.

Exemple. Q1 et Q3 des données 0, 1, 2, 3.5, 5.5, 8, 12.4, 14 seront

Construction du diagramme en boîte

Voici les étapes à suivre pour construire un diagramme en boîte

1. On calcule les quartiles : Q1 , M et Q3

4. On calcule la plus petite et la plus grande valeur normale appartenant à

Illustration d’un diagramme en boîte

Exemple. Ci-après le diagramme en boîte des données suivantes. On

Le diagramme en boîte de cette série ci-après montre que la valeur 60

Illustration d’un diagramme en boîte