SIC2014 Poly 2
SIC2014 Poly 2
SIC2014 Poly 2
Exercices
Exercice 2 Dans un pays, les voitures ont des plaques d’immatriculation composées de deux lettres (leur
alphabet a 26 caractères) suivies de trois chi↵res. Combien de plaques possibles y-a-t-il ?
Exercice 3 Un professeur dispose de 32 livres sur un rayon de sa bibliothèque. 23 d’entre eux sont des
livres de mathématiques et 9 de physique. Le professeur aimerait ranger ses livres de façon que tous les
livres traitant du même sujet restent groupés. Combien y a-t-il de dispositions possibles ?
Exercice 4 4 Américains, 3 Suisses et 5 Anglais doivent s’asseoir sur un même banc. Les gens de même
nationalité doivent rester ensemble. Combien de dispositions peut-on imaginer ?
Exercice 5 On veut former un comité comprenant 4 des 23 personnes d’un groupe. Combien y a-t-il de
ces comités ?
Exercice 6 Combien de mains de poker existe-t-il ? Le jeu comprend 52 cartes, une main en contient 5.
Exercice 8 Un laboratoire de recherche en psychologie du rêve dispose de 4 chambres à deux lits. Trois
paires de vrais jumeaux sont étudiées. On veut placer chaque paire dans une chambre et assigner à chacun
un lit bien déterminé. De combien de manières peut-on organiser l’expérience ?
Exercice 9 Démontrer par le calcul que la construction du triangle de Pascal est correcte, c’est-à-dire
que
Cnk = Cnk 11 + Cnk 1
Exercice 10 n personnes dont A et B se mettent au hasard dans une rangée. Combien des manières
y-a-t-il d’avoir k personnes entre A et B ?
Exercice 11 Un dé est jeté jusqu’a ce qu’un 6 sorte, ce qui marque la fin de l’expérience.
a) Quel est l’ensemble fondamental pour cette expérience ?
b) Notons par En l’événement “l’expérience s’arrête au neme jet”. Quels points de l’ensemble fonda-
c
mental sont contenus dans En ? Décrire ([11 En ) .
Exercice 12 On jette deux dés. On note par E l’evénement “la somme des dés est impaire”, par F
l’evénement “au moins l’un des dés montre 1”, et par G “la somme des dés est 5”. Décrire
a) E \ F ,
b) E [ F ,
c) F \ G,
d) E \ F c ,
e) E \ F \ G.
Exercice 13 Trois joueurs, A, B et C, jettent une pièce à tour de rôle : A joue d’abord, puis B, puis C,
puis A etc. Le premier qui obtient pile a gagné. L’ensemble fondamental ⌦ de cette expérience peut être
décrit comme suit : ⇢
1, 01, 001, 0001, . . . ,
S=
0000 · · ·
1
a) Donner une interprétation des points de S.
b) Décrire les événements suivants en termes de ces points :
i) ”A gagne” ;
ii) ”B gagne” ;
iii) (A [ B)c .
Exercice 15 Quelle est la probabilité de tirer au moins un 6 lorsqu’on jette un dé quatre fois ?
Exercice 16 On répète n fois le lancer de deux dés. Calculer la probabilité que le six apparaisse au
moins une fois. Quelle valeur donner à n pour que cette probabilité atteigne 1/2 ?
Exercice 17 Combien de personnes faut-il pour que la probabilité qu’au moins deux d’entre elles aient
leur anniversaire le même mois soit au moins 1/2 ? Admettre que tous les mois sont équiprobables.
Exercice 18 Un récepteur se bloque si la durée entre les instants de réception de deux signaux est
inférieure au temp mort ✓. On sait que les deux signaux atteignent le récepteur dans l’intervalle de temps
(0, t), et arrivent indépendamment l’un de l’autre et au “hasard”.
a) Décrire l’ensemble fondamental ⌦ associé à cette experience stochastique.
b) Quelle est la probabilité que le récepteur se bloque ?
c) Simplifier votre résultat en admettant que ✓ ⌧ t.
Exercice 19 a) On jète une pièce n fois, n 2. On note Pn la probabilité que des piles successifs
n’apparaissent jamais lors des n jets. Montrer que
1 1
Pn = Pn 1 + Pn 2 n 4.
2 4
b) Montrer que limn!1 Pn = 0.
c) Soit Qn la probabilité que la suite P F P P P F F P n’apparaisse jamais lors de n jets. Montrer que
limn!1 Qn = 0.
Indication : La probabilité Qn que la suite P F P P P F F P n’apparaisse jamais lors de n jets est plus
petite que la probabilité Rn que la même suite n’apparaisse jamais entre le jet numéro 8i et le jet numéro
8(i + 1) 1 où i est un entier plus petit ou égal à n/8 8.
Exercice 21 On jette deux pièces équilibrées. Quelle est la probabilité que l’une des deux pièces tombe
sur pile ?
Exercice 22 En 1654 de Méré propose à Pascal le problème suivant : Est-il plus probable d’obtenir au
moins un 6 avec 4 dés que d’obtenir au moins un double 6 lors de 24 jets de deux dés ?
Donner la réponse à cette question.
Exercice 23 Soit S la somme des valeurs de trois dés jetés simultanément. Il y a six configurations
di↵érentes qui permettent d’obtenir 9 ou 10 :
pour S = 9 : (6,2,1), (5,3,1), (5,2,2), (4,4,1), (4,3,2) et (3,3,3),
pour S = 10 : (6,3,1), (6,2,2), (5,4,1), (5,3,2), (4,4,2) et (4,3,3).
Peut-on en conclure que
P (S = 9) = P (S = 10)?
Exercice 24 D’une urne contenant 20 boules numérotées de 1 à 20, on tire sans remplacement 3 des
boules. Quelqu’un parie qu’au moins une des boules tirées portera un numéro égal ou supérieur à 17.
Quelle est la probabilité qu’il gagne ?
2
Exercice 25 Une urne contient 25 boules, 15 sont rouges et 10 sont vertes. Cinq boules sont tirées au
hasard, sans remise.
a) Trouver la probabilité que la première, la troisième et la cinquième boule soient rouges et que la
deuxième et la quatrième soient vertes.
b) Trouver la probabilité que la première, la deuxième et la troisième boule soient rouges et que la
quatrième et la cinquième soient vertes.
c) Trouver la probabilité que la la deuxième et la troisième boule soient rouges et que la première, la
quatrième et la cinquième soient vertes.
Exercice 26 Même exercice que le problème 36 ! ! !
Exercice 27 On considère 3 cartes à jouer de même forme. Cependant, les deux faces de la première
carte ont été colorées en noir, les deux faces de la deuxième carte en rouge tandis que la troisième porte
une face noire et l’autre rouge. On mélange les trois cartes au fond d’un chapeau, puis une carte tirée au
hasard en est extraite et placée au sol. Si la face apparente est rouge, quelle est la probabilité que l’autre
soit noire ?
Exercice 28 Pour dépister une maladie, on applique un test. Si le patient est e↵ectivement atteint, le
test donne un résultat positif dans 99% des cas. Mais il se peut aussi que le résultat du test soit positif
alors que le consultant est en bonne santé, et ceci se produit dans 2% des cas. Sachant qu’en moyenne
un consultant sur 1000 est atteint de la maladie à dépister, calculer la probabilité pour qu’un client soit
atteint sachant que son test a été positif. Que penser de ce résultat ?
Exercice 29 Les jours peuvent être ensoleillés ou nuageux. Le temps du lendemain est le même que
celui d’aujourd’hui avec probabilité p, et di↵érent avec probabilité q, où p + q = 1. S’il est ensoleillé
aujourd’hui, montrez que la probabilité sn qu’il soit ensoleillé le neme jour suivant satisfait
sn = (p q)sn 1 + q; n 1
où s0 = 1. En déduire que
1
sn = (1 + (p q)n ); n 0.
2
Exercice 30 Une unité de production comprend deux machines automatiques fonctionnant indépendamment
l’une de l’autre. Chaque machine a la fiabilité p au cours d’une journée, ce qui signifie que sa probabilité
de tomber en panne pendant cette période est égale à 1 p. Dans ce cas, elle sera réparée pendant la
nuit et se retrouvera en état de marche le lendemain. Une seule machine peut être réparée à la fois.
On note Xn = nombre de machines en panne au début de la nième journée, n = 1, 2, . . .. Calculer les
probabilités conditionnelles P (Xn+1 = 0|Xn = 0), P (Xn+1 = 1|Xn = 0), P (Xn+1 = 0|Xn = 1) et
P (Xn+1 = 1|Xn = 1).
Exercice 31 Les pièces fabriquées par une usine sont soumises à un contrôle, mais le mécanisme de
contrôle n’est pas entièrement fiable. En e↵et, si une pièce est bonne, elle est acceptée avec une probabilité
de 0.9, par contre si elle est défectueuse, elle est refusée avec une probabilité de 0.8.
a) Si un lot comprend trois pièces bonnes et une pièce défectueuse, quelle est la probabilité que ces
quatre pièces soient acceptées lors du contrôle ?
b) Quelle est la probabilité qu’il y ait une erreur lors du contrôle d’une pièce si l’on sait qu’il y a en
moyenne 20% de pièces défectueuses dans la production ?
c) Quelle est la probabilité qu’une pièce acceptée par le contrôle soit défectueuse (si l’on admet de
nouveau qu’il y a en moyenne 20% de pièces défectueuses dans la production) ?
Exercice 32 Un couple a deux enfants. Quelle est la probabilité que les deux soient des filles sachant
que l’aı̂née en est une ?
Exercice 33 On jette deux dés équilibrés. Quelle est la probabilité qu’au moins l’un d’entre eux montre
6, sachant que les deux résultats sont di↵érents ?
Exercice 34 On choisit trois cartes au hasard et sans remise dans un jeu ordinaire de 52 cartes. Calculer
la probabilité que la première carte tirée soit un pique, sachant que les deux dernières en sont.
Exercice 35 On admet que 5% des hommes et 0, 25% des femmes sont daltoniens. On sélectionne une
personne daltonienne au hasard. Quelle est la probabilité qu’il s’agisse d’un homme ? On admettra que les
hommes sont aussi nombreux que les femmes. Si au contraire il y en avait deux fois plus que de femmes,
que deviendrait le résultat ?
3
Exercice 36 La couleur des yeux d’une personne est déterminée par une unique paire de gènes. Si les
deux sont des gènes yeux bleus, la personne aura les yeux bleus ; si les deux sont des gènes yeux marrons,
la personne aura les yeux marrons ; si l’un est un gène oeil bleu et l’autre un gène oeil marron, la personne
aura les yeux marrons (car le gène oeil marron est dominant par rapport au gène oeil bleu). Un nouveau-né
reçoit indépendamment un gène oeil de chacun de ses parents et le gène qu’il reçoit d’un de ses parents a
autant de chances d’être l’un des deux gènes oeil de ce parent. Supposons que Xavier et ses deux parents
ont les yeux marrons, mais que la soeur de Xavier a les yeux bleus.
a) Quelle est la probabilité que Xavier ait un gène oeil bleu ?
b) Si la femme de Xavier a les yeux bleus, quelle est la probabilité que leur premier enfant ait les yeux
bleus ?
Exercice 37 a) On tire au hasard n boules sans remise d’une urne en contenant N de couleur blanche
et M de couleur noire. Donner la fonction de masse de la variable aléatoire X qui compte le nombre de
boules blanches tirées. Démontrer que l’espérance de X est N n/(M + N ).
Indication : écrire le nombre de boules blanches tirées comme la somme de Xi , 1 i N , où Xi est égal
à 1 si la i-ème boule blanche a été tirée parmi les n boules, et 0 sinon.
b) Une urne contient N boules blanches et M noires. On prélève des boules une à une jusqu’à ce que
la première boule blanche apparaisse. Si on désigne par X le nombre de boules alors prélevées, quelle est
l’espérance de X ?
Exercice 38 On jette simultanément deux dés à six faces jusqu’à l’obtention d’une somme de 5 ou de 7.
a) Le jeu s’est arrêté au jième lancer. Quelle est la probabilité qu’on ait obtenu une somme de 5 au
jième lancer ?
b) Quelle est la probabilité de finir de jouer avec une somme de 5 ?
c) Quel est le nombre moyens de jets jusqu’à l’arrêt du jeu ?
Exercice 39 On jette une pièce n fois. Supposons que lors de chaque jet, la probabilité d’obtenir pile
est p, où p 2 [0, 1]. Les résultats sont supposés indépendants.
a) Donner la loi de probabilité de la variable X qui compte le nombre de piles obtenus.
b) Donner l’espérance et la variance de X.
Exercice 40 a) Un parc contient L lions et T tigres. Un employé du parc est chargé de silloner le parc.
Chaque fois qu’il voit un lion ou un tigre, il note sur un calepin le type d’animal (lion ou tigre) qu’il a vu.
Il s’arrête une fois qu’il a noté n animaux pour faire un rapport à son chef. Quelle est la loi du nombre
de lions notés dans le rapport ? Donner la probabilité que k lions aient été notés.
b) Dans un parc concurrent, une autre statégie est adoptée : chaque fois que l’employé (courageux !)
voit un lion ou un tigre, il le capture. Après avoir capturé n animaux, l’employé fait un rapport à son
chef. Quelle est la loi du nombre de lions notés dans le rapport ? Donner la probabilité que k lions aient
été capturés.
Exercice 41 42800 mariages ont été célébrés en Suisse en 2010. En expliquant vos hypothèses et en
donnant les lois de probabilités correspondantes, calculer la probabilité que pour exactement 2 de ces
couples :
a) les deux époux soient nés un 1er janvier,
b) les deux époux aient le même jour d’anniversaire.
4
Exercice 44 Soient X et Z deux variables à valeurs entières 0. On suppose que :
a) Z est une variable de Poisson de paramètre .
b) X Z et :
8n 0 , 8k n , P {X = k|Z = n} = Cnk pk (1 p)(n k)
Exercice 45 Calculer les deux premiers moments d’une variable aléatoire X distribuée géométriquement
(paramètre p) en utilisant sa fonction génératrice des moments.
Exercice 46 On considère le jeu suivant, qui peut être joué autant de fois que voulu. Chaque tour est
indépendant et à chaque fois, la probabilité de gagner est p. A chaque tour, le joueur parie une certaine
quantité x, quelconque. En cas de réussite, le joueur récupère le double de sa mise. En cas d’échec, le
joueur perd sa mise. Arnaud applique une stratégie simple : il joue tant qu’il n’a pas gagné. Au premier
tour, il parie 100CHF. A chaque tour perdu, il parie le double de sa mise au tour précédent. Dès qu’il a
gagné une fois, il s’arrête.
a) Quelle est la quantité misée par Arnaud au tour n ?
b) Quelle est la loi du nombre de tours joués par Arnaud jusqu’au premier succès ?
c) Montrer que la valeur moyenne de la mise d’Arnaud au tour où il s’arrête est
⇢ 100p
2(1 p) si p > 1/2
1 si p 1/2
Exercice 47 Un livre de 350 pages contient 450 erreurs d’impression réparties au hasard. Calculer de
deux façons di↵érentes la probabilité pour qu’il y ait au moins trois erreurs dans une page déterminée.
Exercice 48 Montrer que si X et Y sont deux variables indépendantes suivant les lois de Poisson de
paramètres respectifs 1 et 2 alors Z = X + Y suit la loi de Poisson de paramètre 1 + 2 :
a) Par calcul direct de la fonction de masse.
b) En utilisant la fonction génératrice des moments.
Exercice 49 On suppose que la taille, en centimètres, d’un homme âgé de 25 ans est une variable
aléatoire normale de paramètres m = 175 et 2 = 36. Quelle est la pourcentage d’hommes de 25 ans
ayant une taille supérieure à 185 cm ? Parmi les hommes mesurant plus de 180 cm, quel pourcentage
d’entre eux dépassent 192 cm ?
Exercice 50 Le nombre de kilomètres couverts par une batterie de voiture avant défaillance est distribué
exponentiellement et sa valeur moyenne est de 10000 kilomètres. Une personne souhaite se lancer dans un
voyage de 5000 kilomètres. Avec quelle probabilité terminera-t-elle son voyage sans avarie de batterie ?
Exercice 51 Pour fonctionner, un système utilise une cellule interchangeable. On dispose de la pièce
originale et d’une cellule de rechange. Si le système a une durée de vie aléatoire X et si sa densité est
donnée (en mois) par : ⇢
cxe x/2 x>0
f (x) =
0 x0
quelle est la probabilité que le système fonctionne pendant au moins 5 mois ?
Exercice 52 La vitesse d’une molécule au sein d’un gaz homogène en état d’équilibre est une variable
aléatoire, dont la fonction de densité est donnée par
⇢ 2
ax2 e bx x 0
f (x) =
0 x<0
5
Exercice 53 Si X admet la densité de probabilité fX (x) = ⇡1 1+x
1
2 , on dit que X est une variable aléatoire
Exercice 55 Les pièces d’une voiture sont souvent copiées, et vendues comme des pièces originales. On
veut remplacer certaines pièces d’une voiture. Avec probabilité 1/4 on achète une pièce pirate, et avec
probabilité 3/4 on achète une pièce originale. La durée de vie est une variable aléatoire exponentielle de
paramètre 5 pour une pièce pirate, et de paramètre 2 pour une pièce originale. Appelons T la durée de
vie de la pièce que l’on achète. Supposons que la pièce ait survécu jusqu’au temps t après son installation.
Quelle est la probabilité ⇡(t) que cette pièce soit pirate ? Trouver la limite de ⇡(t) lorsque t ! 1.
Exercice 56 Soit X une variable normale centrée réduite et Y = eX (on dit que Y est une variable
lognormale). Calculer la moyenne et la variance de Y .
Indication : on donne la fonction génératrice des moments de X : MX (t) = exp(t2 /2), t 2 R.
Exercice 57 On dispose de deux composants électroniques dont les durées de vie (temps avant la panne),
exprimées en années, sont modélisées par des variables aléatoires X et Y indépendantes. On suppose que
la durée de vie moyenne du premier composant est un an, alors que le deuxième composant a une durée
de vie moyenne de 6 mois.
a) Donner les lois de X et Y .
b) Calculer leurs fonctions de répartition FX et FY .
On considère deux montages possibles pour ces composants : en série ou en parallèle. Le système
monté en série tombe en panne dès que l’un des composants tombe en panne. Le système monté en
parallèle tombe en panne lorsque les deux composants sont tombés en panne. On note S la durée de vie
du système en série et T celle du système en parallèle.
c) Calculer la fonction de répartition FT de T .
d) Calculer la fonction de répartition FS de S.
e) Calculer la probabilité que le composant de durée de vie X fonctionne toujours à l’instant x (x > 0)
sachant que le système en série est tombé en panne avant cet instant.
f) Sachant que le composant de durée de vie X est tombé en panne avant l’instant x, quelle est la
probabilité que le système en parallèle fonctionne toujours à un instant t (avec t > x) ?
Exercice 60 Soit X une variable aléatoire normale d’espérance nulle et de variance 1. Calculer la densité
de la loi de Y = eX (on dit que Y est une variable lognormale).
Exercice 61 Soient X et Y deux variables aléatoires avec une densité conjointe f (x, y). Calculer la loi
de X et de Y dans les cas suivants et déterminer dans chaque cas si X et Y sont idépendantes :
a) f (x, y) = xe x(1+y) pour x, y 0, et f (x, y) = 0 sinon.
b) f (x, y) = 60xy 2 pour x, y 0 et x + y 1, et f (x, y) = 0 sinon.
Exercice 62 Donner une expression pour la fonction de répartition et pour la densité du maximum Z
puis du minimum Z̃ de deux variables aléatoires continues indépendantes X et Y .
6
c) La fonction génératrice des moments d’une variable aléatoire G de loi gamma de paramètres ↵,
est donnée par :
MG (t) = ( )↵ , t < .
t
Déduire du b) sous quelle condition sur 1 et 2 , la variable Z est-elle de loi Gamma et quels en sont
alors les paramètres ?
Exercice 65 On lance deux dés équilibrés. On note X1 (resp. X2 ) le plus grand (resp. le plus petit) des
deux résultats. Donner les fonction de masse de X1 et de X2 et les tracer.
x 0 1 2 3
P1 (x) 0.5 0.2 0.2 0.1
P2 (x) 0.7 0.2 0.1 0
a) Vérifier que P1 et P2 sont bien des fonctions de masse.
b) Tracer les fonctions de répartition de X1 et X2 .
c) Calculer la fonction de masse de Y = X1 + X2 , le nombre total d’erreurs dans le programme.
d) Tracer sa fonction de répartition.
Exercice 67 Les variables aléatoires X et Y sont telles que X est de moyenne 1 et de variance 4, Y est
de moyenne 2 et de variance 9, et corr(X, Y ) = 1/3. Quelle est la variance de 3X 2Y + 1 ? Quelle est la
covariance de X + 2Y avec X Y ? Si Z est une autre variable aléatoire vérifiant E(3X 2Y + Z) = 0,
quelle est la moyenne de Z ?
Exercice 69 Soit X et Y deux variables aléatoires indépendantes, la première avec moyenne 2 et variance
3, la seconde avec moyenne 4 et variance 5.
a) Quelle est la moyenne de 5X 3Y + 9 ? Quelle est la variance de 3Y 2X ?
2
b) Supposant que X et Y sont de même variance , si X + Y est de variance 96 et X Y de variance
64, que vaut la corrélation corr(X, Y ) ?
Exercice 70 On lance un dé équilibré n fois. Soit X1 le nombre total de 1 obtenus pendant les n lancés,
et X2 le nombre total de 2.
a) Quelles sont les distributions de X1 et X2 ? Pourquoi ?
b) Quelles sont les variances de X1 et X2 ?
c) On pose la variable aléatoire U = X1 + X2 . Que représente-t-elle ? En considérant la distribution de
la variable aléatoire U et de là obtenant sa variance, déduire que le coefficient de corrélation de X1
avec X2 est ⇢ = 1/5.
d) Quelle est la variance de V = X1 X2 , et quelle est sa corrélation avec U ?
Exercice 71 On suppose que X et Y sont des variables aléatoires indépendantes suivant chacune la loi
uniforme sur [0, 1]. Montrer que Z = X + Y admet pour densité
8
< z si 0 z 1
fZ (z) = 2 z si 1 z 2 .
:
0 sinon
7
Exercice 72 Soit Z le total des points obtenus à pile ou face, avec 0 le gain pour pile et 1 pour face, et
en lançant indépendamment un dé équilibré, dont la face indique le nombre de points obtenus. Donner
la fonction de densité de Z et l’espérance conditionnelle E(Z | X = x), où X représente le résultat de
pile ou face. Calculer également la variance conditionnelle var(Z | X = x) et vérifier que les résultats
concordent avec le théorème 167.
Exercice 74 Un programme informatique est composé de trois sections : une section d’initialisation A,
une section de calcul B composée de 100 cycles de calcul identiques et indépendants, et une section finale
C. On a enregistré les temps de calcul du programme pour chacune des trois sections. Le tableau suivant
résume les temps de calcul obtenus.
Exercice 75 Un professeur sait par expérience que la note de test d’un étudiant se présentant à un
examen final est une variable aléatoire d’espérance 75.
a) Donner une borne supérieure à la probabilité que la note de test d’un étudiant dépasse 85.
Supposons maintenant que le professeur sache en plus que la variance de la note de test d’un étudiant
est 25.
b) Que peut-on dire de la probabilité qu’un étudiant obtienne une note comprise entre 65 et 85 ?
c) Combien faudrait-il qu’il se présente d’étudiants à cet examen pour assurer, avec une probabilité
d’au moins 0,9, que la moyenne de la classe soit de 75 plus ou moins 5 ? Ne pas utiliser le théorème central
limite.
d) Utiliser le théorème central limite pour résoudre la partie c).
Exercice 77 On arrondit 50 nombres à l’entier le plus proche et on e↵ectue la somme. Si les erreurs
d’arrondi individuelles sont distribuées uniformément sur ( 0, 5, 0, 5), quelle est la probabilité que la
somme obtenue ait un écart de plus de 3 par rapport à la somme exacte ?
8
Exercice 78 On a 100 ampoules dont les durées de vie sont des variables aléatoires indépendantes
exponentielles de moyenne 5 heures. Si l’on allume une ampoule à la fois et que chaque ampoule grillée
est instantanément remplacée par une neuve, qu’elle est la probabilité qu’il reste encore au moins une
ampoule intacte après 525 heures ?
Exercice 79 Un local doit être éclairé en permanence ; lorsque l’ampoule tombe en panne, elle est
immédiatement remplacée par une nouvelle ampoule. Il en existe de deux qualités : une qualité A de
durée de vie (en heure) exponentielle de paramètre A = 0.01 et une qualité B de durée de vie (en
heures) exponentielle de paramètre B = 0.02. On a stocké 40 ampoules de qualités A et 60 de qualité B.
Quelle est la probabilité que cette réserve soit suffisante pour une illumination de 6500 heures du local ?
Exercice 80 Quelle est la probabilité qu’un dé équilibré jeté 120 fois produise moins de 16 fois le nombre
six ?
Exercice 81 Une pièce est lancée 500 fois. Quelle est la probabilité pour que le nombre de faces di↵ère
de 250 d’au plus 10 ?
Exercice 82 Soit X une variable aléatoire distribuée uniformément dans l’intervalle (0, 1), i.e. : X prend
ses valeurs dans (0, 1) et P {↵ < X < } = ↵, si 0 ↵ < 1.
a) On pose Y = ln X. Calculer l’espérance de Y et la variance de Y .
b) Si X1 , . . . , X100 sont 100 variables indépendantes de même loi que X et si Z = X1 X2 . . . X100 ,
donner une approximation de P {Z < 10 40 }. Indication : passer au logarithme et utiliser a).
Exercice 83 Expliquer brièvement les termes ⌧ robuste et ⌧ mesure de localisation dans l’énoncé
⌧la médiane est une mesure de localisation robuste .
Exercice 87 Lesquelles des affirmations suivantes s’appliquent à la covariance empirique sXY ? Justifier.
a) Mesure l’association des variables X et Y
b) Est comprise entre 1 et 1.
c) Ne peut jamais être exactement zéro.
d) Dépend des unités dans lesquelles sont exprimées X et Y .
Exercice 88 On a pesé dix pommes cueillies aléatoirement sur un arbre, et on donne leur poids en
grammes ci-dessous.
121.9 164.4 167.3 170.1 178.6 99.2 96.4 187.1 144.6 172.9
9
Exercice 89 Lors d’un test, on a demandé à 120 personnes qui était Jean-Jacques Rousseau, et 12
d’entre elles ont répondu qu’il était plongeur. Estimer la proportion de la population qui a donné une
mauvaise réponse. Obtenir un intervalle de confiance à 95% pour cette proportion. (Question subsidiaire :
qui était vraiment Jean-Jacques Rousseau ?)
Exercice 90 Une entreprise analyse la durée des conversations téléphoniques de ses employés de bureau.
Neuf conversations consécutives avaient pour durée, en minutes :
a) Calculer la moyenne empirique x̄ et la variance empirique s2 de ces observations. Quelles sont les
unités de x̄ et de s2 ?
b) Si on ajuste une distribution normale à ces observations, quelle est la probabilité que qu’une conver-
sation téléphonique dure plus de 10 minutes ?
c) Tester au niveau 5% si la durée moyenne des conversations téléphoniques égale huit minutes contre
son alternative qu’elle ne dure pas huit minutes.
Exercice 92 On observe les données x1 , . . . , x6 , distribuées selon la loi N (m1 ; 12 ), et y1 , . . . , y12 dis-
tribuées selon la loi N (m2 ; 22 ) (m1 , m2 , 12 et 22 sont inconnus, et les variables sont supposées indépendantes
dans leur ensemble). Pour le premier échantillon, les moyenne et variance empirique sont de : m̂x =
1
P6 2 1
P6
6 k=1 xk = 49, 2 et ˆx = 5 k=1 (xk m̂x )2 = 2, 8, tandis que pour le deuxième échantillon on obtient :
2
m̂y = 48, 4 et ˆy = 3, 04.
a) Construire des intervalles de confiance à 95% pour m1 et pour m2 .
b) On dispose à présent de plus d’information qu’au point a) : les variances 12 et 22 sont maintenant
supposées connues, de valeurs respectives 2, 5 et 3. Donner de nouveaux intervalles de confiance à 95%
pour m1 et m2 .
c) En supposant toujours que 12 = 2, 5 et 22 = 3, donner la distribution de la di↵érence (m̂X m̂Y )
des moyennes empiriques de chaque échantillon, puis construire un intervalle de confiance à 90% pour
(m1 m2 ).
Exercice 93 Les poids en grammes de 1000 pots de confiture sortis successivement d’une machine à
conditionner ont été les suivants (les résultats sont donnés par classes de longueur 2, l’origine de la 1ère
classe étant 2000 et l’extrémité de la dernière 2024) :
classe 1 2 3 4 5 6 7 8 9 10 11 12
nombre de pots 9 21 58 131 204 213 185 110 50 16 3 0
On admet que les poids X des pots sont indépendants de loi N (m; 2 ).
a) Donner une estimation de m et 2 .
b) Donner des intervalles de confiance de niveau 95% et 99% pour m.
Exercice 94 Une étude e↵ectuée sur 300 employés d’une entreprise a révélé que le nombre moyen, X,
de cafés bus annuellement à la cafétéria de l’entreprise par un employé suit une loi normale de moyenne
500 et d’écart-type 100. Donner un intervalle de confiance à 95% de la moyenne et de la variance de X.
Exercice 95 Une entreprise souhaite recruter un ingénieur informaticien mais n’a pas encore décidé
quel salaire annuel proposer pour l’embauche. Ne voulant pas proposer un salaire trop éloigné des salaires
moyens proposés dans les autres entreprises, le recruteur décide d’interroger 1000 ingénieurs sur leurs
salaires annuels. Il ressort de l’enquête que le salaire moyen des 1000 ingénieurs est de 48000 CHF avec
un écart-type de 12000 CHF.
a) Donner l’intervalle de confiance au seuil 90% du salaire moyen.
b) Est-il raisonnable de dire que grosso-modo le salaire moyen d’un ingénieur est de 50000 CHF ?
10
Exercice 96 On observe un échantillon y1 , . . . , yn d’une distribution Gamma(3, ✓) de densité
1 ✓y
f (y) = ✓e (✓y)2 y > 0.
2
Déterminer les estimateurs du maximum de vraisemblance de ✓.
Exercice 97 Donner l’estimateur de vraisemblance d’une distribution de Poisson (2✓) à partir d’un
échantillon z1 , . . . , zm .
Exercice 98 Dans la population des ménages d’un pays lointain on considère le montant des économies
mensuelles X (exprimées en milliers de maravedis) qui possède la distribution de densité
f (x) := k 2 xe kx
1[0,+1] (x) x 2 R,
où le paramètre k est inconnu. On prélève un échantillon de 400 ménages et on a calculé la moyenne
x̄ = 2.
a) Estimer k en utilisant la méthode de maximum de vraisemblance.
b) En donner un intervalle de confiance au seuil 95%.
c) Quel est le pourcentage des familles qui économisent moins de 1000 maravedis par mois (on oublie
l’erreur d’estimation de k) ?
Exercice 100 Soit X1 , . . . , Xn un échantillon aléatoire issu de la loi uniforme U (0, b). Trouver l’estima-
teur de maximum de vraisemblance de b.
Exercice 101 On considère un n échantillon X1 , . . . , Xn de loi p U [0, a] + (1 p) U[0, b], i.e. que Xi suit
la loi uniforme sur [0, a] avec la probabilité p et la loi uniforme sur [0, b] avec la probabilité 1 p. On
suppose a < b avec a et b fixés et connus.
a) Déterminer la fonction de répartition et la densité de X1 .
b) Considérons Na la variable aléatoire égale au nombre d’individus Xi compris entre 0 et a. Quelle
est la loi de Na ? En déduire son espérance et sa variance.
c) Déterminer l’estimateur de maximum de vraisemblance de p.
Exercice 102 On observe (X1 , . . . , Xn ), n-échantillon de la loi uniforme sur [a, b], de moyenne théorique
a+b a+b 2
2 . Quelle est l’erreur quadratique E{(X 2 ) } de la moyenne empirique ?
Exercice 103 On observe le temps d’attente de n personnes à un feu rouge, temps notés t1 , . . . , tn . On
fait l’hypothèse que les temps d’attente sont indépendants et de même loi uniforme U[0, ✓]. La durée
d’attente maximale à ce feu rouge est Pdonc ✓, paramètre inconnu et strictement positif.
N
a) Monter que ✓1 = 2T̄ où T = n1 i=1 Ti est un estimateur sans biais de ✓ et que sa variance converge
vers 0 quand n ! 1.
b) Calculer la fonction de répartition et la densité de la variable aléatoire Mn = maxni=1 Ti . Calculer
son espérance et sa variance.
c) En déduire un deuxième estimateur sans biais ✓2 de ✓. Montrer que sa variance converge également
vers 0 quand n ! 1.
d) Lequel des deux estimateurs ✓1 et ✓2 choisiriez-vous pour estimer ✓ ?
e) Montrer que Mn et ✓2 convergent en probabilité vers ✓.
Exercice 104 La durée T séparant deux arrivées successives de requêtes à un serveur suit une loi expo-
nentielle de paramètre ✓ et de densité :
✓t
f (t|✓) = ✓e pour t > 0.
On suppose que le paramètre ✓ est stochastique et suit une loi exponentielle de paramètre connu, de
densité
g(✓) = e ✓
11
La densité g(✓) représente donc la densité a priori sur le paramètre ✓.
a) Montrer que la densité a posteriori de ✓ est proportionnelle à ✓e ✓(t+ ) .
b) On observe un échantillon de n durées t1 , . . . , tn . Déterminer à partir des observations ti les esti-
mateurs du maximum a posteriori de ✓.
Exercice 105 Une entreprise produit des composants électroniques. Le responsable de la chaı̂ne de
production affirme que seul 5% des composants produits sont défectueux. Un inspecteur de qualité af-
firme quant à lui que la proportion de composants défectueux est plus élevée et l’estime à 10%. Afin
de déterminer lequel des deux est le plus près de la réalité, un échantillon de 20 composants est prélevé
aléatoirement et testé. Le test révèle 3 composants défectueux.
On se place dans un cadre bayésien. On note p la variable aléatoire égale à la probabilité qu’un compo-
sant soit défectueux et X la variable aléatoire égale au nombre de composants défectueux parmi les 20
composants. En l’absence d’information supplémentaires, on suppose a priori que les taux de défaillance
de 5% et 10% sont équiprobables.
a) Traduire l’énoncé en termes probabilistes sur p et X.
b) Calculer la probabilité marginale que X = 3.
c) Calculer la fonction de masse a posteriori de p et interpréter le résultat.
d) Calculer la moyenne a posteriori de p et sa variance a posteriori.
e) Conclure.
12
Probabilités et Statistique pour SIC
Problèmes
Problème 1 Un mot de passe est consitué de six lettres, sans tenir compte de leur casse. Combien de
mots de passe existe-il ? Combien de mots de passe ne contiennent que des lettres distinctes ?
Problème 2 Pour constituer une équipe de football (11 joueurs), on a le choix entre 20 postulants. En
supposant que chaque joueur est polyvalent (il peut jouer à tous les postes), combien peut-on constituer
d’équipes différentes ? Si parmi les 20 postulants, 17 sont joueurs de champ et 3 sont gardiens, combien
d’équipes distinctes peut-on alors constituer ?
Problème 3 Combien de nombres de 3 chiffres distincts peut-on former à l’aide des six chiffres 2, 3, 5,
6, 7, 9 ? Combien de ces nombres sont :
a) inférieurs à 500 ?
b) impairs ?
c) pairs ?
d) multiples de 5 ?
Problème 4 Six serveurs sont connectés par une ligne de communication. A chaque instant, un serveur
donné est soit prêt à transmettre, soit déjà occupé.
a) Combien d’états du système formé des six serveurs y a-t-il ?
b) Combien y a-t-il de possibilités que 3 serveurs exactement soient prêts à transmettre à un instant
donné ?
Problème 5 Combien de façons y-a-t-il de mettre 4 tours sur un échiquier de sorte qu’aucune tour n’en
menace une autre ?
Problème 7 Raymond a oublié son mot de passe pour accéder à sa messagerie électronique. Il se souvient
néanmoins que son mot de passe contient r occurrences de la lettre “c”, dont en dernière position. Les
autres symboles ne peuvent être que “a” ou “b“. Combien de mots de passe de longueur n pourraient
être celui de Raymond ?
Problème 8 Afin de pouvoir mieux organiser les nombreux fichiers associés à un logiciel (fichiers de
données, de code, ...), on impose un nouveau système pour nommer ceux-ci. Dans un tel système, un
nom de fichier se compose d’un identificateur et d’une extension reliés par un point. Un identificateur de
fichier comporte de 1 à 5 caractères dont le premier est une lettre, les caractères suivants sont soit une
lettre soit un chiffre. Une extension comporte de 1 à 3 caractères, le premier est une lettre, les suivants
une lettre ou un chiffre. De façon à ne pas avoir des noms trop imprononçables, on n’utilise que 20 lettres
de A à T, toutes en minuscule.
a) Combien d’identificateurs de fichiers peut-on avoir ?
b) Combien de noms de fichier existe-t-il ?
c) Les fichiers dont l’extension commencent par la lettre “d” sont des fichiers de données. Combien
de possibilités y a-t-il pour nommer les fichiers de données ?
Problème 9 Calculer le nombre de diagonales d’un polygone à n ≥ 3 côtés. Existe-t-il un polygone où
le nombre de côtés soit égal au nombre de diagonales ?
13
Problème 10 4 composants éléctroniques de type A, 3 composants de type B et 5 composants de type
C doivent être montés en série. La seule contrainte au fonctionnement du système est que les composants
de même type doivent rester groupés. Combien de dispositions peut-on imaginer ?
Problème 11 Il faut répartir 14 ordinateurs dans deux bureaux de 7 personnes chacun. Combien y a-t-il
de répartitions possibles entre les deux bureaux
a) en supposant que la répartition au sein des bureaux a de l’importance ?
b) en supposant que la répartition au sein des bureaux est sans importance ?
Problème 12 Quatre bits sont transmis à travers un canal. On regarde à la réception l’état de ces
quatre bits, dans l’ordre de réception. Chaque bit est soit correctement reçu, soit reçu avec erreur de
transmission. On note d un bit reçu sans erreur et e un bit reçu avec erreur.
a) Quel est l’ensemble fondamental Ω pour cette expérience aléatoire ?
b) Lister les événements tels que au plus un bit soit reçu avec erreur.
c) Dénombrer les événements tels que plus de la moitié des bits soient transmis avec erreur.
Problème 13 Un contrôle de qualité est effectué chaque heure sur des cartes à puce. A chaque test,
la carte à puce testée est classée selon son bon ou mauvais fonctionnement. Le contrôle s’arrête lorsque
deux cartes à puce consécutives sont défectueuses, ou lorsque quatre cartes à puces ont été testées. Quel
est l’ensemble fondamental Ω de cette expérience ?
Problème 14 Dans une fabrique de processeurs, on prélève toutes les heures les trois derniers processeurs
produits et on note dans l’ordre de prélèvement l’état de ces trois processeurs. Chacun est classé dans
une des deux categories : en état de marche, codé 1, et défectueux, codé 0.
a) Décrivez l’espace fondamental associé à cette expérience aléatoire.
b) Décrivez (en termes ensemblistes) les événements suivants :
i) le premier processeur est défectueux,
ii) le dernier processeur est en état de marche,
iii) deux processeurs sont défectueux,
iv) au moins deux processeurs sont en état de marche.
Problème 15 Un disque dur a 1% de chance de tomber en panne. Par conséquent, il est muni de deux
backups, chacun ayant 2% de chance de tomber en panne. L’information est perdue uniquement lorsque
les trois composants sont en panne. En supposant que les trois composants fonctionnent indépendamment
les uns des autres, quelle est la probabilité que l’information soit sauvée ?
Problème 16 Trois terminaux sont reliés à un ordinateur via 2 lignes de communication. Le terminal
1 a sa propre ligne alors que les terminaux 2 et 3 partagent une ligne de telle sorte qu’à chaque instant
un seul de ces deux terminaux peut être utilisé. Durant une journée de travail, le terminal 1 est utilisé
30 minutes chaque heure, le terminal 2 est utilisé 10 minutes chaque heure et terminal 3 est utilisé 5
minutes chaque heure. En supposant que les lignes de communication opèrent de manière indépendantes,
quelle est la probabilité qu’au moins un terminal soit opératif à un moment quelconque de la journée de
travail ?
Problème 17 Quelle est la probabilité pour que l’écriture décimale d’un nombre entier tiré au hasard
entre 0 et 9999 comporte au moins une fois le chiffre 1 ?
Indication : utiliser la formule d’inclusion-exclusion.
Problème 18 Au jeu de loto, sous contrôle d’un huissier, 6 numéros parmi 49 numéros de 1 à 49 sont
tirés au hasard. Un joueur de loto doit jouer 6 numéros distincts (on ignore ici la notion de “numéro
complémentaire”). On dit qu’on a gagné la cagnotte si les 6 numéros joués correspondent aux 6 numéros
tirés.
a) Quel est l’espace fondamental associé aux tirages ?
b) Quelle est la probabilité de gagner la cagnotte ?
c) La société organisatrice du loto envisage de passer de 49 numéros à 60 numéros avec un tirage de
8 numéros plutôt que 6. Aura-t-on plus de chances de gagner la cagnotte ?
Problème 19 Sophie veut parier à une course de chevaux mais n’a aucune idée des performances des
jockeys et chevaux. Elle décide donc de parier au hasard.
a) Sophie a-t-elle plus de chance de trouver les 3 chevaux de tête dans l’ordre lors d’une course de 17
chevaux, ou les 4 premiers chevaux dans l’ordre lors d’une course de 18 chevaux ?
b) Même question que précédemment mais dans le désordre.
14
Problème 20 Des bits sont envoyés à la suite sur un canal. Un bit donné prend la valeur 1 avec la
probabilité p. Les bits envoyés sont indépendants.
a) On enregistre deux bits à la suite b0 et b1 .
i) Quelle est la probabilité que les deux bits aient des valeurs différentes ?
ii) Quelle est la probabilité que le second bit soit égal à 1 si le premier est égal à 0 ?
b) On note maintenant la valeur de quatre bits envoyés à la suite.
i) Trouver la probabilité d’avoir au moins deux bits égaux à 1 parmi les quatre.
ii) Trouver la probabilité d’avoir au moins deux bits égaux à 1 et le quatrième bit à 0.
Problème 21 Un logiciel libre programmé par un étudiant de l’EPFL contient 5 bugs, répartis uni-
formément dans le code. Le code comporte 10 000 lignes dont 3000 de commentaire. Une certaine exécution
du logiciel passe par 1/3 des lignes exécutables. Quelle est la probabilité que le programme s’exécute cor-
rectement ?
Problème 23 Le Daily Mail du 13 octobre 2010 rapporte que la famille Allali (Angleterre) vient juste
d’avoir son troisième enfant et que, fait surprenant, ses trois enfants sont tous nés le même jour (un 7
octobre, en 2005, 2007 et 2010). Le journaliste affirme qu’il y a moins d’une chance sur 48 millions que
trois enfants d’une famille (ni jumeaux, ni triplets) naissent un même jour. Que pensez-vous de cette
affirmation ?
Problème 24 Vous venez d’installer un module de détection de courriers indésirables dans votre client de
courrier électronique. Le module réussit à identifier les courriers indésirables dans 99% des cas. Néanmoins
le module annonce qu’un message est indésirable alors qu’il ne l’est pas dans 2% des cas. Les statistiques
officielles indiquent que 10% des courriers électroniques reçus sont indésirables. Quelle est la probabilité
qu’un message soit effectivement indésirable lorsque le module indique que c’est le cas ?
Problème 25 A un test de fin d’année, trois élèves, Alain, Boris et Charles, ont oublié de mettre leur
nom sur les copies. Le professeur sait quels sont ces trois élèves mais ne sait pas quelle copie appartient à
chacun d’entre eux. Il estime néanmoins que Alain a 80% de chance d’avoir réussi l’examen, Boris 70% et
Charles 60%. Après correction des trois copies, il s’avère que deux ont réussi l’examen et un l’a échoué.
En supposant que les étudiants ont travaillé indépendamment, quelle est la probabilité que ce soit Charles
qui ait échoué à l’examen ?
Problème 26 L’envoi d’un paquet du serveur S1 au serveur S2 sur internet passe par deux routeurs
intermédiaires R1 et R2 . La probabilité que le paquet se perde sur chaque segment du chemin S1 →
R1 → R2 → S2 est p. On constate, au niveau du serveur S2 la perte du paquet. Quelle est la probabilité
qu’il ait été perdu au niveau de S1 ? de R1 ? de R2 ?
Problème 27 Un routeur reçoit l’essentiel des paquets qu’il fait transiter depuis deux autres routeurs
R1 et R2 , en proportion équilibrée. On constate qu’environ un paquet sur 200 est endommagé lorsque
ceux-ci proviennent de R1 , alors que seulement un paquet sur 1000 est endommagé lorsqu’ils proviennent
de R2 . On considère un paquet reçu de l’un de ces deux routeurs R1 ou R2 . Le paquet inspecté n’est pas
endommagé. Quelle est la probabilité qu’il provienne de R1 ?
Problème 28 100 programmes informatiques sont testés contre diverses sources d’erreurs. Il est trouvé
que 20 d’entre eux ont des erreurs de syntaxe, 10 des erreurs d’entrée/sortie qui ne sont pas des erreurs de
syntaxe, 5 ont d’autres types d’erreurs, 6 ont à la fois des erreurs de sytaxe et des erreurs d’entrée/sortie,
3 ont des erreurs de syntaxe ainsi que d’autres types d’erreur et un seul a les trois types d’erreur. Un
programme est sélectionné aléatoirement parmi ces 100 programmes.
a) Exprimer sous forme de probabilités les quantités données dans l’énoncé.
b) Quelle est la probabilité que le programme sélectionné ait des erreurs de syntaxe ou des erreurs
d’entrée/sortie ou les deux ?
c) On sait que le programme sélectionné a une erreur de syntaxe. Quelle est la probabilité qu’il ait
également une erreur d’entrée/sortie ?
15
Problème 29 Des requêtes sont effectuées sur des serveurs via 5 lignes de communication. Les lignes
de communication ne sont pas utilisées égalitairement : les pourcentages des requêtes envoyées sur les
lignes 1, 2, 3, 4 et 5 sont respectivement de 20, 30, 10, 15 et 25. De plus la ligne sur laquelle est envoyée
la requête dépend de la longueur de la requête : la probabilité qu’une requête excède 100 caractères sur
les lignes 1 à 5 est respectivement de 0.4, 0.5, 0.6, 0.2 et 0.8. Quelle est la probabilité qu’une requête
quelconque excède 100 caractères ?
Problème 30 On tire au hasard deux chiffres entre 0 et 9. Quelle est la probabilité que le premier chiffre
soit 6, sachant que la somme des deux est 6 ?
Problème 31 Un magasin d’électronique a remarqué que la probabilité pn que n clients entrent dans le
magasin un jour donné est pn (1 − p), n = 0, 1, . . .. De plus, lorsqu’un client visite le magasin, il en ressort
avec un achat deux fois sur trois. Néanmoins, le client n’est pas satisfait de cet achat et le rapporte au
magasin une fois sur quatre. On suppose que le fait d’acheter un produit et le fait d’en être satisfait sont
des événements indépendants.
a) Quelle est la probabilité qu’un client achète un produit et en soit satisfait ?
b) Si on sait que k produits vendus n’ont pas été rapportés au magasin, montrer que la probabilité
conditionnelle que le magasin ait reçu la visite de n clients est donnée par
Problème 32 La probabilité pour que la durée de vie d’un composant dépasse 10 000 heures est de 80%
et on admet que les pannes des différents composants sont indépendantes.
a) Avec 3 composants, on réalise un montage “en série”. Il suffit que l’un des composants tombe en
panne pour que le système ne fonctionne plus. Quelle est la probabilité pour que celui-ci fonctionne au
moins 10000 heures ?
b) Avec les mêmes composants que précédemment, on réalise un deuxième montage “en parallèle”.
Dans ce cas pour que le système ne fonctionne plus il faut que tous les trois composants soient en panne.
i) Quelle est la probabilité pour que le système fonctionne au moins 10000 heures ?
ii) Sachant que le système, qui a été sous tension 10000 heures, est en état de fonctionnement,
quelle est la probabilité qu’un composant au moins soit défectueux ?
Problème 33 Dans une assemblée de n personnes, on doit constituer un comité de s personnes puis
désigner un président parmi celles-ci. Les n personnes n’arrivant pas à se mettre d’accord pour former le
comité, elles décident après des heures de débat de procéder par tirage au sort, aussi bien pour désigner
les s personnes du comité que son président. M. Truc, membre de l’assemblé, n’est pas le président du
comité. Quelle est est la probabilité que celui-ci fasse néanmoins partie du comité ?
Problème 34 On met au point un algorithme pour détecter si une page web écrite en anglais est rédigée
par un natif (quelqu’un dont l’anglais est la langue maternelle). On évalue que 55% des pages web en
anglais sont écrites par des natifs. L’algorithme réussit à détecter correctement que la page est écrite par
un natif dans 95% des cas lorsque la page est effectivement écrite par un natif. Elle affirme cependant
incorrectement que la page est écrite par un natif alors que ce n’est pas le cas avec probabilité 1%.
Quelle est la probabilité qu’une page soit écrite par un natif lorsque l’algorithme l’affirme ?
Problème 35 Un étudiant passe un test sous la forme d’un questionnaire à choix multiple ; pour chacune
des questions posées, il y a 5 réponses proposées, dont une seule réponse juste. Si l’étudiant connaı̂t la
réponse juste, il la choisit. Dans le cas contraire, il choisit une réponse au hasard parmi les 5 réponses
proposées. L’étudiant connait la réponse juste à 70% des questions.
a) Quelle chance a l’étudiant de répondre correctement à une question donnée ?
b) Si pour une question l’étudiant a répondu correctement, quelle est la probabilité qu’il ait répondu
en connaissance de cause (c’est-à-dire pas au hasard) ?
Problème 36 Une requête peut être envoyée de manière équiprobable sur six serveurs, quatre étant de
type X et deux serveurs étant de type Y . Deux requêtes consécutives ne peuvent pas être envoyées sur
le même serveur. On considère deux requêtes consécutives.
a) Décrire l’ensemble fondamental Ω de cette expérience stochastique.
b) Définissons les événements suivants B1 = “la première requête est envoyée sur un serveur de type
X” et B2 = “la seconde requête est envoyée sur un serveur de type X”.
i) Calculer les probabilités P (B1 ), P (B2 |B1 ), P (B2 |B1c ) et P (B2 ).
ii) Vérifier que P (B1 ∩ B2 ) + P (B1c ∩ B2 ) + P (B1 ∩ B2c ) + P (B1c ∩ B2c ) = 1.
16
Problème 37 Vous êtes directeur de cabinet du ministre de la santé. Une maladie est présente dans
la population, dans la proportion d’une personne malade sur 10000. Un responsable d’un grand labo-
ratoire pharmaceutique vient vous vanter son nouveau test de dépistage : si une personne est malade,
le test est positif à 99%. Si une personne n’est pas malade, le test est positif à 0.1%. Autorisez-vous la
commercialisation de ce test ?
Problème 38 On considère le jeu de dé suivant : pour participer au jeu, on mise 3 CHF. Puis on lance
le dé et on récupère 15 CHF si le nombre obtenu est 6. Le jeu est-il en moyenne rentable ? A partir de
quel gain pour l’obtention d’un 6 devriendrait-il rentable ?
Problème 39 On considère l’algorithme naı̈f ci-dessous pour trouver le plus grand élément, noté M ,
dans une liste non vide L de n éléments :
1. On initialise le maximum M avec la valeur du premier élément de la liste.
2. On parcourt ensuite la liste, du 2ième au dernier élément, et on affecte cet élément à M si celui-ci
est plus grand que la valeur courante de M .
Lors du traitement d’une liste de taille n :
a) Quel est le nombre de comparaisons effectuées ?
b) Quel est le nombre d’affectations à M dans le cas le plus favorable ? le plus défavorable ?
Dans la suite, on suppose que les éléments de la liste sont deux-à-deux distincts et que les n! permu-
tations possibles ont la même probabilité d’apparaı̂tre dans la liste. Soit p(n, k) la probabilité pour que,
lors du déroulement de l’algorithme sur une liste (aléatoire) L de taille n, k affectations soient nécessaires.
c) Montrer la récurrence suivante, pour n ≥ 2 et k ≥ 1 :
1 n−1
p(n, k) = p(n − 1, k − 1) + p(n − 1, k)
n n
Indication : Raisonner selon que le nième élément est maximal ou non.
d) Soit En l’espérance mathématique du nombre d’affectations effectuées lors du traitement d’une
liste de taille n. Déduire de la récurrence ci-dessus la récurrence sur En :
1
En = + En−1
n
et donner une approximation de En (en fonction de n) lorsque n → +∞.
! 40 Soit X une variable aléatoire prenant ses valeurs dans les nombres naturels. Montrer que
Problème
E(X) = ∞ n=1 P (X ≥ n).
Problème 41 On désire estimer le nombre N de poissons dans un lac sans avoir à tous les compter. Une
méthode pour cela est la méthode dite de la capture-recapture : dans un premier temps, M poissons sont
capturés, marqués d’une certaine façon pour les distinguer, puis relachés dans le lac. Quelques minutes
plus tard (le temps que les poissons aient pu se mélanger), n poissons sont capturés, et on note X le
nombre de poissons qui sont marqués, parmi ces n poissons.
(Cette méthode a été introduite par Laplace en 1768 pour estimer la population de la France.)
a) Calculer la fonction de masse de X.
b) L’application de cette méthode au lac Léman donne X = k. Déterminer alors le nombre de poissons
du lac Léman, N , le plus probable, i.e. trouver N̂ maximisant la probabilité P (X = k) (on parle de
maximum de vraisemblance).
c) Montrer que l’espérance de N̂ est infinie.
Problème 42 Un joueur tourne une roue. A chaque essai, il a une probabilité 1 − p de tomber sur une
case lui rapportant 1 CHF et p de tomber sur la case banqueroute qui lui fera tout perdre et l’éliminera
du jeu. Il débute avec une somme initiale nulle et souhaite atteindre un gain G0 , après quoi il quittera
le jeu – s’il n’y a pas déjà été contraint avant. Les résultats successifs obtenus en tournant la roue sont
supposés indépendants.
a) Quelle est la probabilité que le joueur atteigne le gain G0 qu’il s’était fixé ?
b) En déduire l’espérance du gain final.
Problème 43 Une requête est envoyée sur un réseau. On suppose qu’il a une probabilité p ∈ [0, 1] que
cette requête reçoive une réponse. Dans le cas contraire, la requête est renvoyée jusqu’à ce qu’une réponse
soit reçue. On note T le nombre d’essais nécessaires à cela. Donner la fonction de masse de T .
17
Problème 44 Pour la nouvelle année, un fournisseur internet décide de proposer une offre spéciale
d’abonnement pour attirer de nouvels utilisateurs. Chaque nouvel utilisateur reçoit l’offre spéciale avec
une probabilité de 0.2. 20 nouvels utilisateurs s’inscrivent à ce fournisseur internet. Par quelle loi peut-on
modéliser le nombre d’entre eux qui bénéficient de l’offre spéciale ? Calculer la probabilité qu’au moins le
quart d’entre eux en bénéficient.
Problème 45 Un chef d’entreprise, pour éviter l’attente des camions venant livrer, envisage de construire
de nouveaux poste de déchargement. Actuellement, 5 postes sont en activité. Pour simplifier l’étude, on
considère qu’il faut une journée entière pour décharger un camion. On désigne par X la variable aléatoire
mesurant le nombre de camions venant livrer chaque jour. Une enquête statistique préalable a montré
qu’on pouvait assimiler la loi de X à une loi de Poisson de paramètre 4.
a) Quelle est la probabilité de n’avoir aucun camion en attente ?
b) Combien faudrait-il de postes de déchargement pour porter cette probabilité à plus de 0.9 ?
Problème 46 Un concierge rentre de soirée. Il dispose de n clés dont une seule ouvre la porte de son
domicile mais il ne sait plus laquelle.
a) Il essaie les clés les unes après les autres en éliminant après chaque essai la clé qui n’a pas convenu.
Quelle est la probabilité que la porte ouvre après le kième essai ?
b) En réalité la soirée a été bien arrosée et le concierge ne pense pas à mettre de côté la mauvaise clé
après l’avoir essayée. Donner la loi du nombre d’essais nécessaires pour trouver la bonne clé. Quelle est
la probabilité que la porte ouvre après le kième essai ?
Problème 47 Pour l’étude des sols d’une région, on effectue des tests à partir d’échantillons prélevés sur
le terrain. Cinq échantillons doivent être soumis aux tests et on sait que la probabilité qu’un échantillon
prélevé s’avère être inadéquat (endommagé par exemple) est de 0.2. Si l’on veut être assuré de disposer
de cinq échantillons utilisables avec une probabilité au moins égale à 0.99, combien d’échantillons faut-il
prélever ?
Problème 48 Une version avancée d’un jeu sur console sort. 60% des joueurs ont passé tous les niveaux
de la version précédente. 30% d’entre eux décident d’acheter la version avancée alors que seulement 10%
des joueurs n’ayant pas passé tous les niveaux décident de l’acheter.
a) Quelle est la probabilité qu’un joueur achète la version avancée du jeu ?
b) Sur 10 joueurs, quel est le nombre moyen de personnes achetant la version avancée ?
c) Quelle est la probabilité qu’au moins trois joueurs l’achètent ?
Problème 50 On considère une classe composée de N ≥ 60 élèves, N pair, qu’on regroupe aléatoirement
deux par deux. On s’intéresse aux N/2 “couples” distincts ainsi formés.
a) Donner la loi du nombre de “couples” ayant leur anniversaire le même jour, c’est-à-dire au nombre
de couples formés de deux personnes nées un même jour de l’année (mais pas nécessairement une même
année). On supposera pour simplifier qu’une année est composée de 365 jours.
b) Calculer de deux façons, en fonction de N , la probabilité qu’au moins un couple ait son anniversaire
le même jour .
Indication : utiliser l’approximation par la loi de Poisson (en la justifiant).
c) Quel doit être le nombre minimal d’étudiants dans la classe pour que cette probabilité soit supérieure
à 60% ? Faire le calcul de deux façons.
Problème 51 A un instant t donné, n serveurs cherchent à envoyer une réponse chacun (n réponses au
total pour les n serveurs) via n canaux de transmission indépendants. Ces canaux étant partagés par
d’autres serveurs, il y a une probabilité p qu’un canal soit déjà occupé à cet instant. Lorsqu’un serveur
essaie d’envoyer une réponse sur un canal occupé, l’envoi échoue et la réponse est mise en attente jusqu’au
pas de temps suivant (t+1) lorsque le serveur retente l’envoi, et ainsi de suite jusqu’à ce que les n réponses
aient été envoyées.
a) On considère une réponse particulière à envoyer,
18
i) Quelle est la loi du nombre de pas de temps nécessaires à l’envoi de cette réponse ?
ii) Quelle la probabilité que moins de k pas de temps soient nécessaires ?
b) On considère les n réponses à envoyer,
i) Quelle est la probabilité que moins de k pas de temps soient nécessaires à l’envoi de ces n
réponses ?
ii) En déduire la probabilité qu’exactement k pas de temps soient nécessaires.
Problème 52 n serveurs sont connectés via une ligne de communication. On estime le réseau tel que,
chaque minute, un serveur reçoit avec une probabilité p une requête sur cette ligne. De plus, durant une
minute quelconque, un serveur ne peut recevoir plus d’une requête.
a) Quelle est la loi du nombre de requêtes reçues par minute par les n serveurs ?
b) En déduire l’espérance et la variance de la proportion de requêtes reçues par serveur sur une minute.
Problème 53 Une enquête réalisée auprès de clients fréquentant un magasin révèle que, une fois entrés
dans le magasin, 40% d’entre eux font un achat. Sur 1000 clients entrés dans le magasin, on désigne par
X le nombre de ceux qui ont réellement acheté quelque chose.
a) Quelle est la fonction de masse de X ? Calculer son espérance et sa variance.
b) Calculer la probabilité que moins de 300 personnes aient fait des achats.
c) Calculer la probabilité que plus de 500 personnes aient fait des achats.
Problème 54 L’utilisation d’un logiciel de reconnaissance d’écriture a produit, à partir de 1000 pages
de texte, 1500 erreurs réparties au hasard.
a) Donner une valeur exacte de la probabilité qu’une page retranscrite par le logiciel contienne moins
de 2 erreurs.
b) Calculer la probabilité de cet événement si on remplace la loi du nombre d’erreurs par une loi de
Poisson bien choisie.
Problème 55 Un serveur dessert 1000 postes via 50 lignes à haut débit. Aux heures de pointe, chaque
poste est occupé en moyenne pendant 2, 5 secondes par minute. On suppose les postes indépendants.
Quelle est la probabilité de saturation du réseau pendant une durée moyenne d’une minute de pointe ?
Problème 57 La durée de vie d’un composant (en années) est une variable aléatoire continue de fonction
de densité " k
x4 si x ≥ 1
f (x) =
0 si x < 1
a) Trouver k.
b) Calculer la fonction de répartition de la durée de vie du composant.
c) Calculer la probabilité que la durée de vie du composant excède 3 ans.
d) Quelle est la durée de vie moyenne du composant ?
e) Quel est l’écart-type de durée de vie ?
Problème 59 On suppose que le temps d’attente entre deux “jobs” successifs d’une imprimante est en
moyenne de 1/4 d’heure.
a) Quelle loi utiliser pour le temps d’attente (en heure) entre deux jobs ?
b) Quelle est la probabilité que le job suivant soit envoyé dans les 5 minutes ?
19
Problème 60 La durée de vie d’un processeur a une moyenne µ = 12 ans et un écart-type σ = 4 ans.
a) En déduire la valeur des paramètres de la loi (à préciser) décrivant la durée de vie du processeur.
b) Calculer la probabilité que le processeur ait une durée de vie entre 10 et 15 ans.
Problème 61 On admet que la température moyenne en hiver à Rome suit une loi normale de moyenne
de 10◦ C et d’écart-type 4◦ C. Pour un hiver de température moyenne inférieure à 4◦ C, l’état de grand
froid est décrété. On suppose les températures indépendantes d’un hiver à l’autre.
a) Quelle est la probabilité que l’état de grand froid soit décrété un hiver donné ?
b) Quelle est la probabilité que l’état de grand froid ne soit pas décrété sur une période de 10 ans ?
Problème 62 On joue à pile ou face, et le résultat X vaut 0 pour pile et 1 pour face. Si la pièce tombe
sur face, on jette encore un dé équilibré, et on obtient le résultat Y ∈ {1, . . . , 6}. Soit Z = X + Y le
score total. Calculer les espérance et variance conditionnelles de Z sachant X et les utiliser pour vérifier
le théorème 167.
Problème 63 Un examen d’algèbre linéaire consiste en 20 questions à choix multiples, chacune avec
quatre choix à disposition, dont un seulement correct. Il faut répondre correctement à 10 questions pour
réussir l’examen. Ayant pris ses révisions un peu à la légère, un étudiant décide de répondre aux questions
de manière aléatoire. Trouver l’espérance et la variance du total des points qu’il obtiendra. Quelle est la
probabilité qu’il réussisse son examen ? Une fois l’examen terminé, il discute avec ses amis, et ils concluent
qu’il a coché la bonne réponse à six questions, et une fausse réponse à quatre autres questions. Quel est
l’espérance du total de points obtenus, conditionnée sur cette nouvelle information ? Quelle est à présent
la probabilité qu’il réussisse l’examen ?
Problème 64 Le téléchargement d’un logiciel se fait via deux miroirs possibles, l’un situé en Europe
et l’autre aux Etats-Unis. On estime que, selon l’état du réseau, le téléchargement via l’un de ces deux
miroirs met entre a et b secondes, toute durée entre ces deux valeurs étant équiprobable. Les temps de
téléchargements via les deux miroirs sont indépendants.
a) Quelle est la loi du temps nécessaire au téléchargement en passant par l’un des deux miroirs ?
Donner sa fonction de répartition.
b) Adrien demande simultanément le téléchargement du logiciel par les deux miroirs.
i) Quelle est la fonction de répartition du temps au bout duquel le premier téléchargement du
logiciel sera terminé ?
ii) Calculer son espérance et sa variance.
Problème 65 Un calcul sur ordinateur nécessite l’appel à n fonctions, dont les temps de calculs sont
indépendants et de loi normales N (µi , σi ). On suppose que le programme principal appelant ces fonctions
ajoute un temps b, fixe, au temps total de calcul. Quelle est la loi du temps total de calcul ?
Problème 66 Le nombre N de moustiques dans ma chambre d’hôtel une fois la nuit tombée suit une
distribution de Poisson de moyenne λ, et chacun d’eux me pique indépendamment avec probabilité p.
Trouver les moyenne et variance conditionnelles du nombre Z de piqûres que j’aurai le matin, sachant qu’il
y avait N = n moustiques. Utilisant ces résultats, trouver les moyenne et variance non conditionnelles de
Z. Utiliser les espérances conditionnelles pour calculer la fonction génératrice des moments de Z. Quelle
est la distribution de Z ?
Problème 67 Les variables aléatoires X et Y sont toutes deux discrètes avec une fonction de probabilité
conjointe définie dans le tableau ci-dessous.
Y
X 0 1 2
0 p 2p p
1 3p 2p p
Calculer la fonction de probabilité marginale PX (x) de X. Que vaut p ? Calculer également E(Y 2 ) et
E(XY ).
Problème 68 On suppose que la durée de vie d’un individu est une variable aléatoire de densité
" 2
ct (t − 100)2 si t ∈ [0, 100]
f (t) = .
0 sinon
a) Calculer la constante c.
b) Quelle est l’espérance de vie moyenne d’un individu ?
c) Quelle est la probabilité qu’un individu ait une durée de vie entre 50 et 80 ans ?
20
Problème 69 Un système a une durée de vie aléatoire X de densité donnée (en mois) par :
"
cxe−x/2 x>0
f (x) =
0 x≤0
Quelle est la probabilité que le système fonctionne pendant au moins 5 mois ?
Problème 70 Les timbres produits par la poste sont théoriquement de forme carrée de côté l = 1.5 cm.
Néanmoins, la machine étant mal calibrée, les timbres produits ne sont pas toujours exactement de côté
l mais restent toujours carrés. On suppose que l’erreur de production est de +/- 0.2 cm par côté et que
toutes les valeurs entre ces deux bornes sont équiprobables.
a) Par quelle loi peut on modéliser les longueurs mesurées ? Donner sa fonction de répartition.
b) Quelle est la fonction de répartition de l’aire du timbre ?
Problème 71 Adèle attend l’ascenseur, dont la capacité maximale est de 750 kilos. L’ascenseur arrive
avec 10 adultes dedans. On suppose que le poids moyen d’un adulte suit une loi normale de moyenne 70
kilos et d’écart-type de 12 kilos.
a) Quelle est la loi du poids des 10 personnes dans l’ascenseur ?
b) Est-il raisonnable qu’Adèle, 55 kilos, entre dans l’ascenseur ?
Problème 72 Des ingénieurs civils ayant participé à la construction du pont de Millau ont estimé que le
poids W (en milliers de kilos) que la travée du pont peut supporter sans subir de dommage au niveau de
sa structure, suit une loi normale, de moyenne 400 et d’écart-type 40. Supposons que le poids (également
en milliers de kilos) d’une voiture est une variable aléatoire normale de moyenne 3 et d’écart-type 0.3.
Combien de voitures devraient se trouver sur cette travée pour que la probabilité de rupture soit supérieure
à 0.1 ?
Problème 73 Soit Y une variable aléatoire de loi Gamma de paramètres α = 1/2 et λ = 1. On rappelle
que sa densité est " 1 −y
√ e , y>0
πy
fY (y) = .
0, y ≤ 0
Soit X une autre variable aléatoire dont on ne connait que la loi conditionnellement à Y : la loi de X
1
sachant Y est la loi normale N (0, 2Y ).
a) Calculer la densité du couple (X, Y ).
b) Calculer la densité X.
c) Calculer et reconnaı̂tre la densité conditionnelle de Y sachant X.
Problème 74 Soit X une variable gaussienne centrée réduite et % une variable indépendante de X telle
que P (% = 1) = P (% = −1) = 1/2. On note Y = %X.
a) Calculer Cov(X, Y ).
b) Le vecteur (X, Y ) est-il gaussien ?
c) Les variables X et Y sont-elles indépendantes ?
Problème 75 Soit (X, Y ) un vecteur aléatoire de densité conjointe
c(x2 + xy
"
fX,Y (x, y) = 2 ) si 0 ≤ x ≤ 1, 0 ≤ y ≤ 2
0 sinon
a) Déterminer la constante c.
b) Déterminer la densité marginale de X et celle de Y . Les variables aléatoires X et Y sont-elles
indépendantes ?
c) Calculer P (X > Y ).
Problème 76 On a calculé qu’un certain logiciel produit en moyenne 25 erreurs toutes les 1000 heures
d’utilisation, avec un écart-type de 2. Donner un majorant de la probabilité d’avoir plus de 30 erreurs en
1000 heures d’utilisation. Qu’en est-il si l’écart-type passe à 4 ?
Problème 77 Un serveur reçoit des requêtes de 8 lignes de communication. On sait que le nombre de
requêtes issues d’une quelconque de ces lignes est en moyenne de 20 requêtes par seconde. On suppose
de plus que le nombre de requêtes est indépendant de la ligne. On souhaite savoir si le nombre total de
requêtes reçues par le serveur n’excède pas le seuil de 500 requêtes par seconde, qui est un seuil critique
pour le serveur.
a) Utiliser l’inégalité de Markov pour obtenir un majorant de cette probabilité.
b) Qu’obtenez-vous en utilisant l’inégalité de Chebyshov ?
21
Problème 78 Un disque dur a 350 gigabytes de disponibles. Cela est-il vraisemblablement suffisant pour
stocker 300 films de taille moyenne 1.1 gigabyte et d’écart-type 0.4 ?
Problème 79 La mise à jour d’un logiciel nécessite l’installation de 85 fichiers, installés séquentiellement.
Le temps d’installation est aléatoire, mais prend en moyenne 15 secondes par fichier, avec un écart-type
de 4 secondes. Quelle est la probabilité que le logiciel soit mis à jour en moins de 20 minutes ?
Problème 80 280 messages indépendants sont envoyés d’un centre de transmission. Les messages sont
traités séquentiellement et le durée de transmission d’un message suit une loi exponentielle de paramètre
λ = 5 min−1 . Quelle est la probabilité que les 280 messages soient transmis en moins d’une heure ?
Problème 81 Un serveur reçoit 1000 requêtes par minute. Néanmoins, suite à des problèmes sur les
lignes de communication, on estime que la probabilité qu’un requête échoue est de 4%. On suppose
l’échec ou non des requêtes indépendants.
a) Quelle est exactement la probabilité pour que plus de 30 requêtes échouent en une minute ?
b) Donner deux approximations de la probabilité a), en les justifiant.
Problème 82 N touristes veulent se rendre à Zermatt et doivent donc prendre le train à Täsch. Or le
train ne comporte que deux wagons de n places chacuns. On admet que les choix des touristes de monter
dans la voiture de tête ou de queue sont indépendants les uns des autres et qu’un touriste quelconque a
une chance sur deux de monter dans le premier wagon.
a) Quelle est la probabilité p que tous les touristes ne puissent pas monter dans la voiture qu’ils ont
choisi ?
b) Combien aurait-il fallu de places dans le train si on sait que N = 1000 et si on veut que p soit
inférieur à 0,01 ?
Problème 83 Une entreprise assemble 25 ordinateurs par jour. Les contrôles de qualité montrent que
95% des ordinateurs assemblés fonctionnent correctement.
Donner une bonne approximation de la probabilité qu’au moins 600 ordinateurs sans défaut aient été
assemblés à l’issue de 25 journées de travail.
Problème 84 Le nombre de clients entrant dans un magasin un jour donné suit une loi de Poisson de
paramètre 12. Quelle est la probabilité de ne pas tomber en-dessous de 250 clients sur un mois de 22
jours ouvrables ? On fera les hypothèses d’indépendance qui s’imposent.
Problème 85 A partir d’un échantillon aléatoire de 500 temps de réponse d’un serveur, on a trouvé un
temps de réponse moyen de 5 millisecondes avec un écart-type 2 millisecondes.
a) Donner un intervalle de confiance à 95% du temps de réponse moyen.
b) Si l’on souhaite que la longueur de l’intervalle de confiance n’excède pas 0.3 ms, quelle devrait être
la taille de l’échantillon testé ?
Problème 86 On admet que la durée de vie d’un composant (en mois) est de distribution normale
N (µ, 9). On teste 20 de ces composants pour trouver une durée de vie moyenne ȳ = 100.9. Au seuil 99%,
rejette-on l’hypothèse µ = 100 ?
Problème 87 Les connexions internet sont parfois ralenties dû à la latence de transmission du réseau.
On souhaite quantifier cette latence. On envoie pour cela 500 paquets sur le réseau. On obtient une latence
moyenne de 0.8 seconde, avec un écart-type de 0.1 seconde. Donner un intervalle de confiance au seuil
99.5% de la latence moyenne dans le réseau.
Problème 88 L’utilisation d’un ordinateur consomme de l’électricité. Sur 9 ordinateurs on a obtenu les
coûts journaliers suivantes exprimés en CHF :
1, 2 0, 8 0, 6 1, 1 1, 2 0, 9 1, 5 0, 9 1, 0
a) Calculer la moyenne et la variance de cet échantillon.
b) On suppose que le coût journalier de l’utilisation d’un ordinateur suit une loi normale. Rejette-on
l’hypothèse d’un coût journalier moyen de 1 CHF au seuil 95% ?
22
Problème 90 Soit Y1 , . . . , Yn un échantillon aléatoire provenant d’une distribution de Poisson avec
moyenne θ. Trouver le test optimal pour tester l’hypothèse H0 : θ = θ0 et son alternative H1 : θ > θ0 .
Montrer qu’il n’est pas toujours possible de trouver une région de rejet de taille α, et proposer une
approximation pour la région de rejet si ce n’est pas le cas.
Problème 91 Dans le cas d’un procès où un individu est accusé de crime, quel jugement erroné cor-
respond à une erreur statistique de type I ? (Considérer l’hypothèse nulle comme étant l’innocence de
l’accusé.) Un étudiant en droit s’intéresse aux sentences appliquées à de jeunes adultes convaincus de
grave crime à l’arme blanche en Angleterre et dans le Pays de Galles. Il sélectionne aléatoirement un
échantillon de 26 cas tirés des dossiers de justice pour la fin de l’année 2009 ; il trouve que la durée
moyenne de la peine est de 6.87 mois, avec un écart-type de 2.2 mois.
a) Construire un intervalle de confiance à 95% pour la durée moyenne de la peine.
b) Quelles sont précisément les hypothèses faites en a) ?
c) Supposer que tous ces condamnés ont purgé la moitié de leur peine. Quelle sont les espérance et
écart-type empiriques du temps de peine restant pour son échantillon aléatoire de 26 cas ?
d) Utiliser les résultats du point précédent pour tester au niveau 1% l’hypothèse que le temps moyen
passé en prison était d’au moins 5 mois pour les jeunes adultes convaincus de grave crime à l’arme
blanche en Angleterre et dans le Pays de Galles.
Problème 92 Supposer que les variables aléatoires X1 et X2 ont pour moyenne µ1 et µ2 respectivement
et pour variance σ12 et σ22 , avec corr(X1 , X2 ) = ρ.
a) Si a1 , a2 , b1 et b2 sont constant, prouver que
2 %
% 2
cov(a1 X1 + a2 X2 , b1 X1 + b2 X2 ) = ai bj cov(Xi , Xj ),
i=1 j=1
σ2 σ2
& ' & '
X̄1 ∼ N µ1 , 1 X̄2 ∼ N µ2 , 2 ,
n1 n2
Etudiante 10 40 20 10 20 45 20 5 5 5
Etudiant 20 25 30 25 40 20 40 20 15 40
Tester au niveau 5% si le temps moyen de trajet pour les étudiantes et pour les étudiants est identique.
e) Pourquoi est-il raisonnable de penser que les donnée du point précédent peuvent être considérées
comme ! deux échantillons indépendants" ?
Problème 93 Un sondage auprès de 123 étudiants de statistiques a mis en lumière que durant la nuit du
17 au 18 mars 2010, 62 étudiants se sont couchés après 3 heures du matin. Estimer la probabilité qu’un
étudiant de statistiques de cette université se soit couché après 3 heures du matin cette nuit-là. Donner
l’approximation d’un intervalle de confiance à 95% pour la proportion de la population correspondant à
tous les élèves de statistiques de cette université s’étant couché après 3 heures du matin.
23
Problème 94 Un ingénieur compare l’épaisseur de peinture sur des voitures de deux lignes de production
(A) et (B) sélectionnées aléatoirement. Il a reporté ses résultats dans le tableau ci-dessous.
(A) 0.23 0.13 0.28 0.19 0.22 0.34 0.28 0.34 0.17 0.22
(B) 0.11 0.23 0.32 0.06 0.16 0.21 0.15 0.20 0.27 0.19
Est-ce que ces résultats indiquent qu’il y a une différence significative d’épaisseur de peinture sur les deux
lignes de production ? Quelles sont les hypothèses faites dans le point précédent ? Obtenir un intervalle
de confiance à 98% pour l’épaisseur de peinture sur la ligne de production (A).
Problème 95 On dit qu’une variable aléatoire Y suit une loi log-normale de paramètres (m,σ 2 ) si X =
ln Y suit une loi normale N (m,σ 2 ). On dispose d’un échantillon de neuf observations d’une loi log-normale
de paramètres (m,σ ) inconnus :
Problème 98 Chaque année, la hauteur maximale H de la crue d’un fleuve est mesurée. On estime
qu’une crue supérieure à 6 mètres serait catastrophique. On a modélisé la loi de la variable aléatoire H
comme étant de Rayleigh, i.e la densité de H est
x − x2
fH (x) =
e 2a , x > 0,
a
où a est un paramètre inconnu strictement positif. Pendant 8 ans on a observé les hauteurs de crue
(en m)
2, 5 2, 9 1, 8 0, 9 1, 7 2, 1 2, 2 2, 8
a) Donner l’estimateur du maximum de vraisemblance de a.
b) Une compagnie d’assurance estime qu’une catastrophe n’arrive en moyenne qu’au plus une fois
tous les mille ans. Ceci peut-il être justifié par les observations ?
Problème 100 Sur 100 ampoules électriques choisies au hasard, une durée totale de 88 912 heures a été
trouvée. Les durées de vie des ampoules peuvent être modélisées par une loi exponentielle de paramètre
λ, inconnu.
a) Donner l’estimateur de maximum de vraisemblance de λ.
b) Donner un intervalle de confiance à 90% de λ.
c) Au seuil 90%, rejette-on l’hypothèse λ = 0.001 ?
24
Problème 101 Une chaı̂ne de fabrication de composants électroniques produit un pourcentage 100 × p
de produits défectueux. p est inconnu mais on sait que p ≤ 0.08. On teste n composants.
a) Quel est l’estimateur du maximum de vraisemblance de p ?
b) Quelle doit être la taille de l’échantillon pour que l’erreur quadratique moyenne associée à p soit
inférieur ou égal à 0,002 ?
Problème 102 Les temps T1 , T2 , . . . , Tn entre deux pannes successives d’un ordinateur sont des variables
aléatoires indépendantes distribuées identiquement selon la loi Gamma de paramètres α = 2 et λ = 1θ ,
qui a pour fonction de densité :
y −y
f (y) = e θ si y > 0, 0 sinon.
θ2
θ est un paramètre > 0 inconnu et à estimer.
a) On observe les n premiers temps t1 , t2 , . . . , tn entre deux pannes successives ; estimer θ à l’aide de
t1 , t2 , . . . , tn par la méthode du maximum de vraisemblance.
b) Donner le biais et l’erreur quadratique de l’estimateur de maximum de vraisemblance de θ.
Problème 103 On s’intéresse au nombre moyen de pannes réseau hebdomadaires sur un certain réseau.
On se place dans un cadre bayésien et on considère donc que ce nombre moyen, θ, est une variable
aléatoire.
a) On note X la variable aléatoire égale au nombre de pannes réseau sur une semaine donnée. On
suppose que la répartition des pannes sur la semaine est aléatoire. Quelle loi proposez-vous pour X,
conditionnellement à θ ?
b) On a trouvé sur des réseaux similaires un nombre moyen de 4 pannes par semaine avec un écart-
type de 2 pannes par semaine. Proposer un choix simple de loi a priori pour θ et préciser ses paramètres.
Indication : pensez à la densité conjuguée de la loi proposée en 1).
c) Deux pannes se sont produites sur le réseau la semaine dernière, et aucune panne cette semaine.
Donner la loi a posteriori de θ, son espérance a posteriori et sa variance a posteriori.
Problème 104 Un opérateur téléphonique désire mettre à jour la statistique des appels qu’il traite. Les
dernières statistiques donnaient une moyenne de 1000 appels par heure, avec un écart-type de 200 appels.
Du fait de l’extension du réseau, le nombre moyen θ d’appels traités peut avoir évolué. On propose
de donner une estimation bayésienne de θ. Une nouvelle enquête est donc menée. Elle révèle que, au
cours de 10 heures choisies aléatoirement, 7265 appels ont été traités. On note θ la fréquence des appels
téléphoniques et X le nombre d’appels durant une heure donnée. On suppose que, conditionnellement à
θ, X suit une loi de Poisson de paramètre θ :
e−θ θk
P (X = k|θ) = , k = 0, 1, . . .
θ!
On suppose de plus que θ est de loi Gamma(α,λ ).
a) En se basant sur les chiffres de la précédente enquête, quelles valeurs de α et λ préconisez-vous ?
b) Déterminer la loi a posteriori de θ (la nommer et donner ses paramètres).
c) Donner la moyenne et l’écart-type a posteriori de θ.
d) Déterminer l’intervalle de crédibilité au niveau 95% de θ.
Problème 105 Le nombre de fautes X et le nombre de cartons Y distribués dans le groupe B lors de la
coupe du monde de football de 2006 sont donnés dans le tableau qui suit.
Match 1 2 3 4 5 6
X 26 19 34 34 31 39
Y 3 4 6 8 3 4
25
Probabilités et Statistique pour SIC
Corrigés aux Exercises
Corrigé 1 668
Corrigé 2 262 103
Corrigé 3 23!9!2!
Corrigé 4 4!3!5!3!
4
Corrigé 5 C23
5
Corrigé 6 C52
3
Corrigé 7 Remarquons qu’il y a C10 C83 = 6720 façons de choisir un comité de 3 hommes et 3 femmes
dans un groupe de 10 femmes et 8 hommes.
a) Le nombre de comités de 3 hommes qui contiennent les deux hommes qui refusent d’être ensemble
est C61 = 6. Alors, le nombre de comités de 3 hommes qui ne contiennent pas les 2 hommes qui refusent
d’être ensembles est C83 6 = 50. Il s’en suit que la réponse cherchée est
3
C10 (C83 6) = 120 · 50 = 6000.
b) Le raisonemment ici est similaire. On obtient :
3
(C10 C81 )C83 = (120 8) · 56 = 6272.
c) Le nombre des comités avec l’homme et la femme qui refusent d’être ensemble est C92 C72 = 756.
Alors la réponse est
3
C10 C83 C92 C72 = 6720 756 = 5964.
Corrigé 8 Il y a 4! = 24 façons de placer les trois paires de jumeaux dans les 4 chambres. D’autre part,
pour chaque placement, il y a 23 = 8 façons de distribuer les trois paires de jumeaux dans les lits. Il y a
donc 4!23 = 192 façons d’organiser l’expérience.
Corrigé 9 On a
(n 1)! (n 1)! (n 1)!(k + n k)
Cnk 1
1 + Cnk 1 = + = = Cnk
(n k)!(k 1)! (n k 1)!k! (n k)!k!
Corrigé 10 On s’apercoit d’abord qu’il y a 1 + (n k 2) = n k 1 manières de placer le bloc “A . . .
B” de longeur k + 2 dans la rangée. Il faut ensuite tenir compte des permutations de A et B : 2! = 2. Et
des permutations des (n 2) personnes di↵érentes de A et B : (n 2)!. Il y a donc 2(n 2)!(n k 1)
façons d’avoir k personnes entre A et B.
Corrigé 11 a) L’ensemble fondamental de cette expérience est ⌦ =⌦ 1 [ ⌦2 où⌦ 1 = {(D1 , D2 , . . .) où
Di 2 {1, 2, 3, 4, 5} 1 i < 1} (l’événement “aucun 6 ne sort”) et⌦ 2 = [1 n=1 {(D1 , D2 , . . . , Dn 1 , 6) où
Di 2 {1, 2, 3, 4, 5} 1 i n 1} (l’événement que l’expérience s’arrête).
b) Les points de l’ensemble fondamental qui sont contenus dans En sont de la forme (D1 , . . . , Dn 1 , 6).
L’ensemble⌦ 1 = ([1 c
1 En ) est égal à l’événement “aucun 6 ne sort”, c’est à dire⌦ 1 .
Corrigé 12 a) E \ F = {(1, 2), (1, 4), (1, 6), (2, 1), (4, 1), (6, 1)}.
b) E [ F est égal à l’événement “la somme des dés est impaire ou bien l’un des dés montre 1”.
c) F \ G = {(1, 4), (4, 1)}.
d) E \ F c est égal à l’événement “la somme des dés est impaire et chaque dé montre un nombre plus
grand ou égal à 2”.
e) E \ F \ G = F \ G.
26
Corrigé 13 a) Le point {000 . . .} réprésente l’événement “personne ne gagne”. Les autres points corres-
pondent à des événements où A, B ou C gagne.
b) i) Ceux où le numéro 1 se situe dans la place 3n + 1 pour n entier, correspond à l’evénement où A
gagne.
ii) Ceux où le numéro 1 se situe dans la place 3n + 2 pour n entier, correspond à l’evénement où
B gagne.
iii) Ceux où le numéro 1 se situe dans la place 3n pour n entier, correspond à l’evénement où C
gagne. Finalement, (A [ B)c est égal à l’evénement que C gagne ou personne ne gagne.
Corrigé 14 a) L’ensemble fondamental est formé de tous les arrangements ordonnés possibles de n
personnes. Donc #(⌦) = n!.
b) Soit l’événement Ek =“il y a k personnes entre A et B”. Déterminons #(Ek ) =“nombre de cas
favorables de Ek ” :
On considère d’abord le bloc “A . k!
. . B” de longueur k+2. On s’aperçoit qu’il y a 1+(n k 2) = (n k 1)
manières de le placer dans la rangée.
Il faut ensuite tenir compte des permutations
- de A et B : 2! = 2 permutations,
- des (n 2) personnes di↵érentes de A et B : (n 2)! configurations di↵érentes.
Ainsi,
#(Ek ) = 2 · (n k 1)(n 2)!
et
#(Ek ) 2 · (n k 1)(n 2)! 2 · (n k 1)
P (Ek ) = = = .
#(⌦) n! n(n 1)
Pn 2 2·(n k 1)
Remarque : On peut contrôler que k=0 n(n 1) = 1.
c) Il est facile d’établir la liste des 3! = 6 cas possibles. On obtient alors que
4 2 2 1
P (k = 0) = = et P (k = 1) = = ,
6 3 6 3
ce qui correspond bien à l’expression trouvée sous b).
Remarque : On a bien P (k = 0) + P (k = 1) = 1.
5 4
Corrigé 15 La probabilité de ne tirer aucun 6 est de 6 ' 0.4822. Alors, la probabilité de tirer au
5 4
moins un 6 est de 1 6 ' 0.5177.
5 2n
Corrigé 16 La probabilité de que le six apparaisse au moins une fois est 1 6 . Pour que cette
5 2n
probabilité atteigne 1/2 il faut que 1 6 1/2. C’est à dire que
ln 2
n
2 ln 65
donc n 2.
Corrigé 17 La probabilité que les anniversaires de n personnes soient dans des mois di↵érents est
12 · 11 · · · · (12 n + 1)
12n
Alors, la probabilité qu’au moins deux personnes entre n personnes aient leur anniversaire le même mois
est
12 · 11 · · · · (12 n + 1)
1
12n
Finalement, il faut au moins 5 personnes pour que cette probabilité soit au moins 1/2.
Corrigé 18 a) Deux signaux S1 et S2 atteignent le récepteur dans l’intervalle (0, t). Soient X1 : le temps
d’arrivée de S1 et X2 : le temps d’arrivée de S2 . L’ensemble fondamental ou espace des résultats possibles
est donc :
⌦ = (x1 , x2 ) 2 R2 | 0 x1 t , 0 x2 t .
27
Un élément de cet ensemble (un couple (x1 , x2 )) représente une issue possible de cette expérience (c’est-à-
dire un événement élémentaire de l’ensemble fondamental) : “le signal S1 arrive au temps x1 et le signal
S2 arrive au temps x2 ”.
b) L’événement A qui nous intéresse (i.e. “le récepteur se bloque”) est un sous-ensemble de ⌦ défini
par : n o
A = (x1 , x2 ) 2 ⌦ |x1 x2 | < ✓ .
Le fait d’admettre que “les deux signaux arrivent indépendamment l’un de l’autre et au “hasard”” nous
permet d’affirmer qu’on a a↵aire à un modèle équiprobable. On peut alors calculer la probabilité de
l’événement A comme suit :
✓)2
aire de A t2 2 · (t 2 2✓t ✓2
P (A) = = = .
aire de⌦ t2 t2
c) Si ✓ ⌧ t, on peut négliger ( ✓t )2 par rapport à 2 ✓t , et donc P (A) ' 2✓
t .
Corrigé 19 a) Soit Sn le jet numéro n et En l’événement “deux piles successifs n’apparaissent pas”.
Remarquons que Pn = P (En ) et que
P (En ) = P (En \ {Sn = P }) + P (En \ {Sn = F })
Mais
1
P (En \ {Sn = F }) = P (En 1 \ {Sn = F }) = P (En 1)
2
et
1
P (En \ {Sn = P }) = P (En 2 \ {Sn 1 = F } \ {Sn = P }) = P (En 2)
4
On en déduit que
1 1
Pn = Pn 1 + Pn 2 (1)
2 4
b) Remarquons que Pn est une fonction décroisante de n (c’est à dire que Pn+1 Pn ). On en déduit
que la limite limn!1 Pn existe. Appelons la P1 . En prenant la limite n ! 1 dans l’équation (1) on
déduit que
3
P 1 = P1
4
Ceci étant possible seulement si P1 = 0.
c) Soit Gn,i égale à l’événement “{S8i = P, S8i+1 = F, S8i+2 = P, S8i+3 = P, S8i+4 = P, S8i+5 =
F, S8i+6 = F, S8(i+1) 1 = P }”, et Rn,i = Gcn,i (c’est à dire l’événement “la suite Sj , 8i j 8(i + 1) 1,
n/8 8
est di↵érente de P, F, P, P, P, F, F, P ”). Soit Rn = \i=1 Rn,i . Par l’indépendance des événements Rn,i ,
1 i n/8, on a
n/8
Y ✓ ◆n/8
1
P (Rn ) = P (Rn,i ) = 1 (2)
i=1
28
où dans la dernière égalité on a employé le fait que P (Rn,i ) = 1 218 . De l’équation (2), on déduit que
limn!1 P (Rn ) = 0. Mais clairement P (Qn ) P (Rn ) (parce que Qn ⇢ Rn ). Alors, limn!1 P (Qn ) = 0.
Corrigé 20 a) L’ensemble fondamental de cette expérience est ⌦= {(Y1 , Y2 , Y3 ) où 1 Y1 , Y2 , Y3
6}.
b) Soit X1 le dé qui montre la valeur la plus petite, X3 le dé qui montre la valeur la plus grande et X2
le dé qui montre une valeur entre X1 et X3 (c’est-à dire X1 X2 X3 ). On veut calculer la probabilité
de l’événement “X1 + X2 + X3 15”. On appellera cet événement par E. La table ci-dessous donne les
valeurs de X1 , X2 et X3 qui rend leur somme plus grande ou égale à 15.
28
La cinquième colonne correspond au nombre de façons qu’il y a d’obtenir les valeurs de X1 , X2 et X3
données. Et la sixième colonne correspond à la probabilité de chaque configuration (c’est-à-dire 1/63 =
1/216). Alors, la probabilité recherchée est égale à
(3 + 6 + 3 + 1 + 3 + 3 + 1) 20
P (E) = = ' 0.0926.
216 216
Corrigé 21 La probabilité qu’aucune des deux pièces ne tombe sur pile est égale à la probabilité d’obtenir
(F, F ). C’est à dire 1/4. Alors, la réponse récherchée est 1 1/4 = 3/4.
Corrigé 22 On utilise le fait que l’événement “avoir au moins un succès” est le complémentaire de
l’événement “n’avoir aucun succès”. La probabilité d’obtenir au moins un 6 avec 4 dés est donc de
1 4
1 (1 ) ' 0, 518,
6
et la probabilité d’obtenir au moins un double 6 lors de 24 jets de deux dés est de
1 24
1 (1 ) ' 0, 491.
36
Corrigé 23 On ne peut pas en conclure que P (S = 9) = P (S = 10) car les configurations ne sont pas
équiprobables. Si l’on tient compte de l’ordre elles le sont, il faut donc tenir compte des permutations
possibles de chaque configuration. Ainsi (3,3,3) ne “compte qu’une fois” alors que (5,2,2) “compte triple”
et (5,3,1) “compte six fois”. On obtient P (S = 9) = 25 27
63 et P (S = 10) = 63 .
16⇥15⇥14
Corrigé 24 P {”il gagne”} = 1 P {”il perd”} = 1 20⇥19⇥18 .
Corrigé 27 Soient RR, N N et RN respectivement les événements, “la carte choisie est entièrement
rouge”, “entièrement noire” et “bicolore”. Soit encore R l’événement, “la face apparente de la carte tirée
est rouge”. On aura
P (R|RN )P (RN )
P (RN |R) =
P (R|RR)P (RR) + P (R|RN )P (RN ) + P (R|N N )P (N N )
1 1
2 3
= 1 1 1 1
1· 3 + 2 3 +0· 3
1
=
3
Corrigé 28 Soit M l’événement “le patient est atteint”, B l’événement “le patient est en bonne santé”,
et + l’événement “le résultat du test est positif”. De la formule de Bayes on a
P (+|M )P (M )
P (M |+) =
P (+|M )P (M ) + P (+|B)P (B)
99 1
100 1000
= 99 1 2 999
100 1000 + 100 1000
99
= ' 0.0472
2097
Ceci n’est pas un très bon résultat. Pour essayer de l’améliorer il faudrait répéter le test...
29
Corrigé 29 Soit Sn l’événement “le neme jour est ensoleillé” et Nn l’événement “le nème jour est nua-
geux”. Alors,
sm+1 = (p q)sm + q
✓ ◆
1 1
= (p q) + (p q)m + q
2 2
p+q 1
= + (p q)m+1
2 2
1
= 1 + (p q)m+1 .
2
Ceci montre que le résultat est vrai pour m + 1. Donc sn = 12 (1 + (p q)n ) pour tout n 0.
Corrigé 30 Xn ne peut prendre que les valeurs 0 et 1. En e↵et, il ne peut y avoir plus d’une machine
en panne au début d’une journée. On a
P (E) = 0, 1 · 0, 8 + 0, 2 · 0, 2 = 0, 12.
P (A|B c ) · P (B c ) P (A|B c ) · P (B c )
d) P (B c |A) = = ' 0, 053.
P (A) P (A|B) · P (B) + P (A|B c ) · P (B c )
Corrigé 32 L’ensemble fondamental de cette expérience est ⌦= {(E1 , E2 ) où E1 est le sexe du premier
enfant et E2 est le sexe du deuxième}. L’événement “les deux enfants sont des filles” est A = {(F, F )},
et “l’aı̂née en est une” est B = {(F, F ), (F, G)}. La probabilité recherchée est
P (A \ B) P (A) 1/4 1
P (A|B) = = = = .
P (B) P (B) 1/2 2
P (A \ B)
P (A|B) = .
P (B)
6·5 5
Mais, P (B) = 6·6 = 6 et
30
5 5·4 5 5
P (A \ B) = P (B) P (Ac \ B) = = .
6 6·6 6 9
Alors, la probabilité recherchée est
6
P (A|B) = 1 = 1/3.
9
Corrigé 34 Soit A l’événement “la première carte tirée est un pique” et B l’événement “les deux
dernières en sont”. Remarquons que
13 12 11
P (A \ B) =
52 51 50
13 12 11 39 13 12
P (B) = P (A \ B) + P (A \ B c ) = +
52 51 50 52 51 50
13·12·11 11
Alors, la probabilité recherchée est égale à P (A|B) = 13·12·11+39·13·12 = 50 .
Corrigé 35 Soit D l’événement “la personne selectionée est un daltonien”, H l’événement “elle est un
homme” et F l’événement “c’est une femme”. Tout d’abord, par la formule de Bayes on a
P (D|H)P (H)
P (H|D) =
P (D|H)P (H) + P (D|M )P (M )
Si on admet que les hommes sont aussi nombreux que les femmes, alors P (H) = P (F ) = 1/2 et
5 1
100 · 2 5 20
P (H|D) = 5 1 0,25 1
= = .
100 · 2 + 100 · 2
5.25 21
Si au contraire il y avait deux fois plus de femmes que des hommes, on aurait,
5 2
100 · 3 10 40
P (H|D) = 5 2 0,25 1
= = .
100 · 3 + 100 · 3
10.25 41
Corrigé 36 D’abord remarquons que si Xavier et ses deux parents ont les yeux marrons et si la soeur de
Xavier a les yeux bleus, il faut que les deux parents aient chacun un gène oeil bleu et un autre marron.
a) Xavier peut avoir des gènes (M, M ), (M, B) et (B, M ), alors, la probabilité que Xavier ait un gène
oeil bleu est 2/3.
b) On définira par GX , GF et GE les gènes yeux de Xavier, de sa femme et de son enfant. Alors,
1 21 1
P (GE = (B, B)) = P (GX 2 {(M, B), (B, M )}) = = .
2 32 3
Corrigé 37 a) On numérote les boules blanches de 1 à N . Soit Xi la v.a. définie par : Xi = 1 si la boule
blanche numéro i a été tirée, 0 sinon.
On a
M +N 1 M +N 2 M +N n M +N n
P {Xi = 0} = . ... = ,
M +N M +N 1 M +N n+1 M +N
n
P {Xi = 1} = .
M +N
PN
Comme X = i=1 Xi , on en déduit que :
N
X Nn
E(X) = E(Xi ) = .
i=1
M +N
31
Corrigé 38 a) On appelle Xi la somme de 2 dés au i–ème jet : Xi 2 {2, . . . , 12}. On a P (Xi = 5) = 1/9
et P (Xi = 7) = 1/6. On appelle ⌧ le temps d’arrêt du jeu, ⌧ = 1, 2, . . ., et Fj = {⌧ = j} est l’événement
que le jeu s’arrête au j–ème jet. On note que on peut ecrire l’événement Fj comme
h i
{Xj = 5 ou Xj = 7} \ \ji=11 {Xi 6= 5 et Xi 6= 7}
c) Par définition de ⌧ et Fj on a
1
X
E(⌧ ) = jP (Fj ).
j=1
32
Corrigé 41 On suppose que les dates d’anniversaire sont également réparties sur l’année et, pour sim-
plifier, qu’une année comporte 365 jours.
a) La probabilité qu’une personne au hasard soit née un 1er janvier est alors de 1/365. La probabilités
que les deux époux soient nées un 1er janvier est, en supposant l’indépendance, 1/3652 . Sur les 42800
couples mariés en 2010, le nombre de ceux dont les deux époux sont nés un 1er janvier, X, suit une loi
binomiale de paramètres n = 42800 et p = 1/3652 . On a donc
✓ ◆42798
2 1 1
P (X = 2) = C42800 1 = 0.0374.
3654 3652
b) La probabilité pour que les deux époux soient nés un même jour est 365 fois plus élevée que la
probabilité qu’ils soient nés un 1er janvier. Le nombre Y de couple mariés ayant leur anniversaire le même
jour suit donc une loi binomiale de paramètres n = 42800 et p = 1/365. On a donc
✓ ◆42798
2 1 1
P (X = 2) = C42800 1 ' 0.
3652 365
Corrigé 42 T est une variable aléatoire géométrique, sa fonction de masse est donnée par
P (T = n) = p(1 p)n 1
n 1.
On a
1
X 1
X 1
X 1
d X d 1 1 1
E(T ) = n P (T = n) = n p(1 p)n 1
=p n(1 p)n 1
= p (1 p)n = p = p⇥ 2 = .
n=1 n=1 n=1
dp n=1 dp p p p
D’autre part,
1 1 1
( 1
)
X X X d X
2 2 2 n 1 2 n 1 n
E(T ) = n P (T = n) = n p(1 p) =p n (1 p) = p n(1 p)
n=1 n=1 n=1
dp n=1
( 1
) ⇢
d X d 1 2 1 2 1
n 1
= p (1 p) n(1 p) = p (1 p) = p( + 2) = 2 .
dp n=1
dp p2 p3 p p p
(p )k X k n k
k!(n k)!
= e Cn (1 p)n k
k! n! (n k)!
n k
(p )k X (1 p)n k n k
= e
k! (n k)!
n k
k
(p ) (1 p)
= e e
k!
(p )k
= e p ,
k!
33
X est donc poissonienne de paramètre p .
Ensuite, pour l entier 0 fixé :
X
P {Y = l} = P {Y = l|Z = n}P {Z = n}
n l
X
= P {X = n l|Z = n}P {Z = n}
n l
X n
= Cnl pn l (1 p)l e
n!
n l
(1 p) ((1 p) )l
= e ,
l!
Y est aussi poissonienne de paramètre (1 p) . Enfin :
X
8k, l , P {X = k et Y = l} = P {X = k et Y = l|Z = n}P {Z = n}
n 0
= P {X = k et Y = l|Z = k + l}P {Z = k + l}
(
k k + l)
= Ck+l pk (1 p)l e
l!
p (p )k (1 p) ((1 p) )l
= e e ,
k! l!
X et Y sont bien indépendantes.
P (X = n) = p(1 p)n 1
,
P (N = n) = p(1 p)n 1
, n = 1, 2, . . .
En e↵et, l’événement {N = n} a lieu si les (n 1) premiers tours ont été perdus et le nième a été gagné.
c) Soit Y : le montant investi au dernier pari, c’est-à-dire lorsque Arnaud gagne pour la première fois.
On a Y = 100 ⇥ 2N 1 où N est la variable aléatoire du nombre de tours jusqu’au premier succès. On a
1
X 1
X
E(Y ) = E(100 ⇥ 2N 1
)= (100 ⇥ 2n 1
)P (N = n) = (100 ⇥ 2n 1
)p(1 p)n 1
n=1 n=1
1
X ⇢ 100p
si p > 1/2
= 100p {2(1 p)}n 1
= 1 2(1 p)
n=1
1 si p 1/2
Si p 1/2 il faut être en moyenne infiniment riche pour pouvoir suivre cette stratégie ! Si p > 1/2, une
fortune finie sera en moyenne suffisante.
34
Corrigé 47 Considérons pour fixer les idées la première page. Une erreur donnée apparait sur cette page
avec la probabilité 1/350 puisque les erreurs sont équiréparties (c’est-à-dire réparties au hasard) et il y a
350 pages au total. Le nombre d’erreurs d’impression X sur la première page est donc distribué selon un
loi de Bernouilli B(n = 450, p = 1/350), d’où
2
X ✓ ◆i ✓ ◆450 i
i 1 349
P (X 3) = 1 P (X 2) = C450 ' 0, 14.
i=0
350 350
Puisque n est grand et p est petit, on peut aussi faire l’approximation de cette binomiale par une loi de
Poisson de paramètre = np ' 1.29 et on obtient alors
2
P (X 3) = 1 P (X 2) = 1 e 1+ + /2 ' 0, 14.
Or :
1
X k
1 t
MX (t) = e 1
etk =e 1
e 1e
= exp( 1 (e
t
1)) .
k!
k=0
t t t
Ainsi : MZ (t) = exp( 1 (e 1)) exp( 2 (e 1)) = exp(( 1 + 2 )(e 1)),
on retrouve le fait que Z est poissonienne de paramètre ( 1 + 2 ).
et
P (X > 192)
P (X > 192|X > 180) = ' 1, 14 %.
P (X > 180)
Corrigé 50 Soit X le nombre de kilomètres couverts par une batterie de voiture avant défaillance.
X ⇠ E( ) avec = 1/10000.
Z 1
1
P (X > 5000) = e x dx = e 5000 = e 2 .
5000
R +1
Corrigé 51 Il faut d’abord calculer c. Pour que f soit une densité on doit avoir 1
f (x)dx = 1,
c’est–à–dire
1
c = R1 .
0
x exp( x/2)dx
On fait une intégration par parties et on obtient
Z 1 Z 1
1
x exp( x/2)dx = 2x exp( x/2) 0
+2 exp( x/2)dx = 4,
0 0
donc c=1/4. Par conséquent la probabilité que le système fonctionne au moins 5 mois est égale à
Z 1
x 1 1 1 5
exp( x/2)dx = exp( x/2) 5 x exp( x/2) 5 = e 5/2 + e 5/2 ' 0.287.
5 4 2 2
35
R1
Corrigé 52 On doit trouver a tel que 1
f (x)dx = 1. Donc
1
a = R1 .
0
x2 exp( bx2 )dx
p
Si on fait le changement de variable y/ 2b = x on obtient
Z 1 ✓ ◆3 Z 1 ✓ ◆3 p Z +1
2 2 1 2 2 1 2⇡ y2
x exp( bx )dx = p y exp( y /2)dy = p ⇥ p exp( y 2 /2)dy.
0 2b 0 2b 2 1 2⇡
La dernière intégrale est égale à 1 (c’est la variance d’une variable normale standard) et donc
4
a = p b3/2 .
⇡
Corrigé 53 Z Z Z
1 0 1
x x x
E(X) = dx = dx + dx.
1 ⇡(1 + x2 ) 1 ⇡(1 + x2 ) 0 ⇡(1 + x2 )
et comme Z 1
x 1
dx = ln 1 + x2 |1
0 = 1,
0 ⇡(1 + x2 ) 2⇡
diverge, on en déduit que X n’admet pas d’espérance mathématique.
Corrigé 54 a) On calcule
Z 1
y ↵ 1 1
(↵) = e y y ↵ 1 dx = e y |0 + (↵ 1) (↵ 1) = (↵ 1) (↵ 1) (↵ > 1).
0
Corrigé 56 La fonction génératrice des moments est définie par MX (t) = E(etX ). Ainsi
Corrigé 57 a) X et Y étant des durées de vie, on utilise la loi exponentielle. D’après l’énoncé, X suit
une loi exponentielle de paramètre 1 et Y une loi exponentielle de paramètre 2.
b) On a ⇢ ⇢
e t si t 0 2e 2t si t 0
fX (t) = et fY (t) =
0 sinon 0 sinon
donc Z ⇢ ⇢
t
1 e t si t 0 1 e 2t si t 0
FX (t) = fX (x)dx = et FY (t) =
1 0 sinon 0 sinon
36
c) FT (x) = P (T x) = P ([X x] \ [Y x]). X et Y étant indépendantes, on a
FT (x) = P (X x)P (Y x) = FX (x)FY (x)
⇢
(1 e x )(1 e 2x ) = 1 e x e 2x
+e 3x
si x 0
=
0 sinon
d) FS (x) = P (S x) = P ([X x][[Y x]) = 1 P ([X > x]\[Y > x]). X et Y étant indépendantes,
on a
FS (x) = 1 P ([X > x])P ([Y > x]) = 1 (1 FX (x))(1 FY (x))
⇢
1 e x e 2x = 1 e 3x si x 0
=
0 sinon
e) On cherche P (X > x|S x). On a
P (X > x \ S x) P (X > x \ Y x)
P (X > x|S x) = =
P (S x) P (S x)
(1 FX (x))FY (x) e (1 e 2x )
x
= =
FS (x) 1 e 3x
f) On cherche P (T > t|X x). On a
P (T > t \ X x) P (Y > t \ X x)
P (T > t|X x) = =
P (X > x) P (X x)
(1 FY (t))FX (x)
= = 1 FY (t) = e 2t .
FX (x)
Corrigé 58 Tout d’abord remarquons que
P (min(X1 , . . . , Xn ) t) = P (X1 t, . . . , Xn t) = P (X1 t)n
t
Mais P (X1 t) = e . D’où
tn
P (min(X1 , . . . , Xn ) t) = e ,
et donc la fonction de répartition de min(X1 , . . . , Xn ) est
tn
P (min(X1 , . . . , Xn ) t) = 1 e .
On en déduit que min(X1 , . . . , Xn ) est une variable aléatoire exponentielle de paramètre n.
Corrigé 59 On regarde pour y 2 R
Z y
P (Y y) = fY (z)dz.
1
Du fait que la fonction logarithme soit inversible (elle est strictemement croissante), on peut écrire
Z exp(y)
P (Y y) = P (log X y) = P {X exp(y)} = exp( x)dx.
0
d’où
fY (z) = exp{z exp(z)}.
Corrigé 60 Tout d’abord nous calculerons la loi de Y . C’est-à-dire,
Z 1
1 y2
P (Y x) = P (X ln x) = p e 2 dy
2⇡ ln x
Z 1
1 (ln y 0 )2 1
= p e 2 dy 0
2⇡ x y0
où dans la dernière égalité on a fait le changement de variable y ! ln y 0 . On en déduit que la densité de
la loi de Y est ( (ln y)2
p1 e 2
1
si y 0
f (y) = 2⇡ y
0 si y < 0
37
Corrigé 61 a) Soit fX la densité de X et fY la densité de Y . Remarquons que
Z 1 1 1
xe x(1+y) e x(1+y)
1
fY (y) = f (x, y)dx = + =
0 (1 + y) 0 (1 + y)2 0 (1 + y)2
a
On en déduit que Y a une loi donnée par P (Y < a) = 1+a . D’autre part,
Z 1
x
fX (x) = f (x, y)dy = e
0
On en déduit que X est une variable aléatoire exponentielle de paramètre 1. X et Y ne sont pas
indépendantes parce que f (x, y) 6= fX (x)fY (y).
b) Soit fX la densité de X et fY la densité de Y . Remarquons que
Z 1 x Z 1 x
fX (x) = f (x, y)dy = 60x y 2 dy = 20x(1 x)3
0 0
D’autre part, Z Z
1 y 1 y
2
fY (y) = f (x, y)dx = 60y xdx = 30y 2 (1 y)2
0 0
Puis
Corrigé 63 a) On a
Z t Z t u
1u 2v
8t 0, P {Z t} = 1 2 e { e dv}du
0 0
Z t
1u 2 (t u)
= 1 e (1 e )du
0
Z t
1t 2t
= (1 e ) 1e e( 2 1 )u
du
0
⇢
(1 e 1 t ) + 1
(e 1t
e 2t
) si 1 6= 2
= 1
t
2
1 (1 + t)e si 1 = 2 =
b) Rappelons que :
d’où :
1 2
8 t < min( 1, 2 ), MZ (t) = .
1 t 2 t
c) On déduit du b) que si 1 = 2, Z est une variable Gamma de paramètres ↵ = 2 et .
38
Corrigé 64 a) On a p
Z 1 x2
1 2p
f (x) = p dy = 1 x2 ,
1 x2 ⇡ ⇡
pour 1 x 1. De même
2p
1 y2 , g(y) =
⇡
pour 1 y 1. X et Y ne sont pas indépendantes car h(x, y) 6= f (x)g(y).
b) Cov(X, Y ) = 0 par symétrie.
Corrigé 65 L’ensemble des valeurs possibles prises par X1 est S = {1, 2, 3, 4, 5, 6}. L’énumération des
di↵érents cas possibles donne :
De même, pour X2 ,
0.4
0.3
0.3
P(x)
P(x)
0.2
0.2
0.1
0.1
0.0
0.0
1 2 3 4 5 6 1 2 3 4 5 6
x x
1.0
0.8
0.8
0.6
0.6
F(x)
F(x)
0.4
0.4
0.2
0.2
0.0
0.0
−1 0 1 2 3 4 −1 0 1 2 3 4
x x
39
P (Y = 2) = 0.23 P (Y = 3) = 0.13.
P (Y = 4) = 0.04.
P (Y = 5) = 0.01.
On vérifie : 0.35 + 0.24 + 0.23 + 0.13 + 0.04 + 0.01 = 1.
d) FY (0) = 0.35, FY (1) = 0.59, FY (2) = 0.82, FY (3) = 0.95, FY (4) = 0.99, FY (5) = 1.
Fonction de repartition de Y
1.0
0.8
0.6
F(y)
0.4
0.2
0.0
−1 0 1 2 3 4 5 6
y
d’où l’on déduit var(X) = var(Y ) = 40 et cov(X, Y ) = 16. La corrélation est alors donnée par
p 16 = 0.4.
40⇥40
Corrigé 70 a) X1 et X2 sont distribuées selon une loi binomiale de paramètres (n, 1/6). En e↵et, la
loi binomiale est une somme de lois Bernoulli, qui représentent chacune la probabilité d’un succès ou
d’un échec.
1 1 5
b) On a var(X1 ) = var(X2 ) = n ⇥ 6 ⇥ (1 6) =n⇥ 36 .
c) La variable U représente le nombre total de 1 et de 2 obtenus pendant n lancés. Elle est Bin(n, 1/3),
donc sa variance vaut n ⇥ 29 . On a que cov(X1 , X2 ) = 12 [var(X1 ) + var(X2 ) var(X1 + X2 )] = 36 n
.
n 5n 1
D’où corr(X1 , X2 ) = 36 / 36 = 5 .
12n cov(U,V )
d) On a var(V ) = var(X1 ) + var(X2 ) 2cov(X1 , X2 ) = 36 . En outre, corr(U, V ) = p , où
var(U )var(V )
10n
cov(U, V ) = var(X1 ) + var(X2 ). Ainsi, corr(U, V ) = p .
4 6
Corrigé 71 On utilise Z 1
fZ (z) = fX (x)fY (z x)dx
1
fX (x)fY (z x) = 1 si 0 x 1 et z 1 x z, 0 sinon.
40
Corrigé 72 Enumérant les événements possibles, on observe que P(Z = 1) = P(Z = 7) = 1/12 et que
P(Z = 2) = · · · = P(Z = 6) = 1/6. E(Z | X = x) = 3.5 + x. On calcule d’abord var(Z | X = 0) = E(Z 2 |
X = 0) E(Z | X = 0)2 = 1/6(62 + · · · + 12 ) 3.52 = 35/12, par ailleurs var(Z | X = 1) correspond à la
même loi, transposée d’une unité. Ainsi, var(Z | X = x) = 35/12 ne dépend pas de x. Le théorème 167 est
1
vérifié, puisque E(Z) = 1 ⇥ 12 + 2 ⇥ 16 + . . . + 6 ⇥ 16 + 7 ⇥ 12
1
= 4 et Ex {E(Z | X = x)} = 12 ⇥ (3.5 + 4.5) = 4.
Corrigé 74 On note A, B, C les variables aléatoires des temps de calcul pour chacune des trois sections
du programme.
a) On a cov(A, C) = corr(A, C) A C = 0.2 ⇥ 2.5 ⇥ 1.3 = 0.65.
b) On a
E(T ) = E(A + B + C) = E(A) + E(B) + E(C) = 5.5 + 3.4 + 4.5 = 13.4,
et
var(T ) = var(A + B + C)
= var(A + C) + var(B)
= var(A) + var(C) + 2cov(A, C) + var(B)
= 2.52 + 1.32 + 2 ⇥ 0.65 + 2.62
= 16.
c) Le temps de calcul de la section B est la somme de 100 temps de calculs identiquement distribués et
indépendants. D’après le théorème central limite, la distribution de B est approximativement normale.
Ses paramètres sont ceux obtenus empiriquement, B ' N (3.4, 6.76).
d) La loi de T est approximativement normale comme somme de lois normales avec T ' N (13.4, 16). On
a alors ✓ ◆
T 13.4 10 13.4
Pr(T 10) = Pr p p = ( 0.85) ⇡ 0.20,
16 16
et ✓ ◆
T 13.4 20 13.4
Pr(T 20) = Pr p p =1 (1.65) ⇡ 0.05.
16 16
Corrigé 75 a) Comme X est une variable aléatoire positive, par l’inégalité de Markov, :
X 75
P {X > 85} E( )= ' 0, 88.
85 85
b) La connaissance du 2ième moment de X permet d’améliorer la majoration précédente, par l’inégalité
de Chebyshov :
2
1 + E(X)2 25 + 752
P {X > 85} = P {X 2 > 852 } E(X 2 ) = = ' 0, 78.
852 852 852
On a aussi :
2
P {65 X 85} = P {|X E(X)| 10} = 1 P {|X E(X)| > 10} 1 = 3/4.
102
c) Puisque les notes de chacun des n étudiants sont des variables indépendantes, leur moyenne
arithmétique
n
1X
Xn = Xk
n
k=1
1
est encore d’espérance 75, et sa variance vaut n2 (n.25) = 25/n. On a ensuite :
25/n n 1
P {|X n E(X n )| 5} = 1 P {|X n E(X n )| > 5} 1 = ,
25 n
avec 10 étudiants notre probabilité vaut au moins 0, 9 .
41
d) Voyons s’il est pertinent d’utiliser le T.C.L. Si celui-ci s’applique, on a :
Z 5
5 5
P {|X n E(X n )| 5} ' = P ( 5 Zn 5) = P ( p Z p )
5 25/n 25/n
(où Zn est normale centrée de variance 25/n et Z normale centrée réduite). Le nombre minimum
d’étudiants obtenu est cette fois n = 3 , un résultat franchement di↵érent ! Avec n = 10, on est en
e↵et pas dans ls cas asymptotique et le TCL ne s’applique donc pas.
Corrigé 76 a) ↵ = ✓22 .
b) Par définition FMn (x) = P (max1in Xi x). Alors,
✓Z x ◆n ✓ 2 ◆n ⇣ ⌘
n x x 2n
FMn (x) = ↵ydy =↵ =
0 2 ✓
dFMn (x)
D’autre part fMn (x) = dx . Alors,
2n 2n 1
fMn (x) = x
✓2n
et
Z ✓
2n 2n 1 2n ✓2n+1 2n
µ1 = E(Mn ) = x x dx = = ✓
0 ✓2n ✓2n 2n + 1 2n + 1
Z ✓
2n 2n 2n ✓2n+2 n 2
µ2 = E(Mn2 ) = x2 x 1
dx = = ✓
0 ✓2n ✓2n 2n + 2 n+1
c) Il faut montrer que pour tout ✏ > 0 on a ; limn!1 P (|Mn ✓| ✏) = 0. Mais, par l’inégalité de
Chebyschov,
1
P (|Mn ✓| ✏) E((Mn ✓)2 )
✏2
1
= E(M 2 2Mn ✓ + ✓2 )
✏2 ✓ n ◆
✓2 n 4n
= + 1
✏2 n + 1 2n + 1
✓2 1
=
✏2 (2n + 1)(n + 1)
d’où le résultat.
Corrigé 77 Soient X1 , X2 , . . . , X50 les nombres considérés, A1 , . . . , A50 leurs arrondies et U1 , U2 , . . . , U50
les variables d’erreur correspondantes.
P P50 On a donc Xk = Ak + Uk . La somme obtenue en arrondissant est
50
A
k=1 k et la somme exacte est i=k Xk , donc l’erreur sur la somme est
50
X 50
X 50
X
Xk Ak = Uk .
k=1 k=1 k=1
P50
La variable k=1 Uk est centrée (son espérance est nulle), de variance 50 ⇥ 1/12 (par indépendance). On
a donc, par application du T.C.L :
50
X 3 3
P {| Uk | > 3} ' P (|Z| > p ) = 2 ⇥ P (Z > p ) ' 0, 144.
k=1
50/12 50/12
42
Corrigé 79 Dans notre problème, une première ampoule de durée de vie X1 est placée puis, lorsque
celle-ci est en fin de vie, on la change par une autre ampoule de durée de vie X2 , etc.
On s’intéresse à la somme des durées de vie de ces ampoules. Puisqu’on s’intéresse à la somme, l’ordre
des Xi importe peu.
Appelons XA la somme des durées de vie des ampoules de type A. Puisque 40 30 et que l’on peut
estimer que la durée de vie d’une ampoule est indépendante d’une autre, on peut appliquer le théorème
central limite qui nous dit que la somme XA obéit approximativement à une loi normale de moyenne
µA = 40A = 4000 [heures] et de variance A 2
= 402 = 400000 [heures2 ].
A
De même, si l’on appele XB la somme des durées de vie des ampoules de type B, on obtient grâce
au TCL (et à l’indépendance des durées de vie) que XB obéit approximativement à une loi normale de
moyenne µB = 60B = 3000[heures] et de variance B 2
= 602 = 150000 [heures2 ].
B
On s’intéresse ici à la somme des durées de vie de toutes les ampoules qui est X = XA + XB . Grâce à
l’additivité de la loi normale et à l’indépendance des durées de vie, X est approximativement une variable
normale de moyenne µ = µA + µB = 7000 et de variance 2 = A 2
+ B 2
= 550000. Ayant obtenu la loi de
X on peut maintenant calculer notre probabilité
✓ ◆
6500 7000
P (X 6500) = 1 P (X 6500) = 1 p =1 ( 0.67) = 0.75.
550000
Corrigé 80 Le nombre de six obtenus lors de 120 jets suit une loi binomiale de paramètres n = 120
et p = 1/6. Cette variable aléatoire a pour moyenne np = 120 · 1/6 = 20 et variance np(1 p) =
120 · 1/6 · 5/6 ' 16, 7. Par le TCL, on approxime le nombre de six obtenus lors de 120 jets par une
variable aléatoire X normale de moyenne µ = 20 et de variance 2 = 16, 7. La probabilité d’avoir moins
de 16 fois le nombre six est alors donné par
15, 5 µ
P (X < 15, 5) = P (Z < ) = P (Z < 1, 1) ' 0, 135,
et Z 1
2 2
var(Y ) = E Y (E(Y )) = (ln x)2 dx 1 = x(ln x)2 2x ln x + 2x|10 1 = 1.
0
b) On observe que la fonction ln est strictement croissante et donc
40
P Z < 10 = P (ln Z < 40 ln 10) ,
et que, si on pose Yi = ln Xi , on obtient
100
X
ln Z = Yi ,
i=1
c’est–à–dire ln Z est la somme de 100 variable indépendentes avec la même distribution (et on a calculé
en (a) l’espérance et la variance de Yi ). On va donc utiliser le TCL et remplaçer ln Z par la variable W
de loi N ( 100, 100) . Finalement on obtient
!
40 W E(W ) 40 ln 10 + 100
P Z < 10 ' P (W < 40 ln 10) = P p < ' (0.790) ' 0.78.
var(W ) 10
43
Corrigé 83 La médiane est une mesure de localisation au même titre que la moyenne (confondues dans
le cas gaussien par exemple). La médiane est très peu influencée par une perturbation importante d’une
observation, et donc peu sensible à la présence d’ouliers, au contraire de la moyenne par exemple.
Corrigé 86 La corrélation empirique mesure l’association (linéaire) des variables X et Y et est toujours
comprise entre 1 et 1. On peut donner comme contre-exemple à d) les observations (x1 , y1 ) = (1, 1)
et (x2 , y2 ) = (1, 1), pour lesquelles la corrélation est nulle.
Corrigé 87 La covariance empirique mesure l’association des variables X et Y mais n’est pas bornée.
On peut donner comme contre-exemple à c) les observations (x1 , y1 ) = (1, 1) et (x2 , y2 ) = (1, 1), pour
lesquelles la covariance est nulle. Contrairement à la corrélation, la covariance n’est pas standardisée et
dépend des unités de X et Y .
Corrigé 88 a) La moyenne empirique vaut 150.3 grammes et l’écart-type empirique 33.2 grammes.
Supposant le poids des pommes normalement distribué, alors les bornes d’un intervalle de confiance à
90% se calculent comme suit : 150.3±0.9⇥33.2, autrement dit un intervalle de confiance [120.4, 180.1].
b) Un intervalle de confiance à 90% pour la moyenne recouvre en moyenne (si on cueille plusieurs autres
échantillons de pommes) 9 fois sur 10 la ⌧ vraie moyenne.
Corrigé 89 On estime la proportion de la population qui a donné une mauvaise réponse à 12/120 =
0.1. On pose X comme la variable aléatoire représentant le nombre de bonnes réponses, c’est-à-dire
X ⇠ Bin(120, 0.1). On applique le théorème central limite pour déduire un intervalle de confiance, ici
[0.1 ± 1.96 ⇥ 0.1⇥(1
120
0.1)
] = [0.099, 0.102].
Corrigé 90 a) On a x̄ = 9 et s2 = 6.25.
b) Si X est la variable aléatoire pour le temps de conversation, on cherche P(X 10). On suppose
X ⇠ N (x̄, s2 ), et écrivant X̃ = X s X̄ , la probabilité recherchée est P(X̃ 0.4) = 1 (0.4) = 0.345.
c) On utilise le test du rapport de vraisemblances 2{`0 (8) `a (x̄)} = 2( 21.24 + 20.52) = 1.44. Le
quantile à 95% de la loi 21 étant 3.84, on ne peut rejeter l’hypothèse nulle au niveau 5%.
44
p
12(m̂Y m2 )
De même, ˆY suit une loi de Student à 11 degrés de liberté, la probabilité P {m̂Y a0 m2
p
12
m̂Y + a0 } vaut donc 0, 95 pour 0
ˆY .(a ) ' 2, 2, ainsi
Iy = [47, 29; 49, 51].
p
b) 6( m̂X 1
m1
) suit une loi normale centrée réduite, et :
p p
6 p m̂X m1 6
P {|m̂X m1 | a} = P { a 6( )a },
1 1 1
p
6
vaut 0, 95 pour a 1
' 1, 96, i.e. : a ' 1, 265. Le nouvel intervalle de confiance à 95% pour m1 est donc
Jx = [47, 935; 50, 465].
Pour le deuxième échantillon, les calculs donnent : a0 ' 1,96
2 ' 0, 98, et le nouvel intervalle de confiance
à 95% pour m2 est donc
Jy = [47, 42; 49, 38].
c) (m̂X m̂Y ) est encore normale, d’espérance (m1 m2 ) et de variance : 12 /6 + 22 /12 = 2/3,
p p
I = [(49, 2 48, 4) 1, 64. 2/3; (49, 2 48, 4) + 1, 64. 2/3] = [ 0, 54; 2, 14]
fournit donc un intervalle de confiance à 90% pour la di↵érence (m1 m2 ).
Corrigé 93 a) On a :
1
m̂ = (9 ⇥ 2001 + 21 ⇥ 2003 + . . . + 3 ⇥ 2023) ' 2010, 73,
1000
1
S2 = (9 ⇥ (2001 2010, 73)2 + 21 ⇥ (2003 2010, 73)2 + . . . + 3 ⇥ (2023 2010, 73)2 ) ' 12, 81.
999
b) Soit Z une variable N (0; 1). On a : P {Z > 1, 96} ' 0, 025, P {Z > 2, 58} ' 0, 005 . L’intervalle de
confiance à 95% pour la moyenne m est donc :
1, 96 ⇥ S 1, 96 ⇥ S
[m̂ p ; m̂ + p ] ' [2010, 51; 2010, 95].
1000 1000
L’intervalle de confiance à 99% pour la moyenne m est :
2, 58 ⇥ S 2, 58 ⇥ S
[m̂ p ; m̂ + p ] ' [2010, 44; 2011, 02].
1000 1000
Corrigé 94 On note X la variable aléatoire égale au nombre de cafés bus annuellement par un employé.
D’après l’énoncé, X est normal. Noons µ et 2 respectivement sa moyenne et variance, tous deux inconnus.
A partir des quantité de cafés X1 , . . . , Xn bus annuellement par les n = 300 employés, on a trouvé une
moyenne empirique X̄ = 500 et une variance empirique S 2 = 1002 des quantités de café bus annuellement
par un employé. Un intervalle de confiance à 95% de la moyenne annuelle µ est alors donné par :
p p
[X̄ tn 1 (1 ↵/2)S/ n, X̄ + tn 1 (1 ↵/2)S/ n],
où n = 300 et tn 1 (1 ↵) est le (1 ↵)-quantile de la loi de Student à (n 1) degrés de liberté (égal ici
à z1 ↵ car n = 300 est grand), ↵ = 0.05. On trouve alors l’IC à 95% de µ :
[488.66, 508.79].
Note : Avec la table, on utilise tn 1 (1 ↵) = t1 (1 ↵) = z1 ↵ le (1 ↵) quantile de la loi normale
centrale réduite et on obtient l’IC à 95% de µ :
[488.68, 511.32].
2
Un intervalle de confiance à 95% de la variance de X est donné par :
(n 1)S 2 (n 1)S 2
[ 2 , 2 ],
n 1 (1 ↵/2) n 1 (↵/2)
2 2
où n 1 (↵) est le ↵-quantile de la loi du à (n 1) degrés de liberté. On obtient l’IC :
[8572.39, 11818.53].
45
Corrigé 95 a) Puisque n = 1000 est asez large, on peut supposer que le salaire moyen suit une loi
normale. Un intervalle de confiance au seuil 90% du salaire moyen est (avec ↵ = 0.1)
p p
[X̄ z1 ↵/2 S/ n, X̄ + z1 ↵/2 S/ n] = [47375, 48624].
b) Cela revient à tester l’hypothèse H : ”le salaire moyen est ǵal à 50000 CHF”. D’après la question
précd́ente, on rejette cette hypothèse au seuil 90%, donc on conclut que l’affirmation n’est pas raisonnable.
puis : ( )
n
X
8✓ > 0, L(✓) = Cte ⇥ exp ✓ yi + 3n log ✓ ,
i=1
Pn
✓ 7! 3n log ✓ ✓ i=1 yi atteint son maximum en
3n
✓ˆ = Pn ,
i=1 yi
i=1
n X o
= Cte exp 800 log k k xi ,
P
k 7! 800 log k k xi atteint son maximum en
800 2
k̂ = P = = 1.
xi x
b) La log-vraisemblance vaut
X
`(k) = Cte + 800 log k k xi ,
46
d’où
X
`0 (k) = 800/k xi ,
`00 (k) = 800/k 2 .
L’information observée en k̂ vaut donc J(k̂) = 800/k̂ 2 = 800. Un IC approximatif pour k au niveau
(1 ↵) = 95% est
[k̂ J(k̂) 1/2 z1 ↵/2 , k̂ + J(k̂) 1/2 z1 ↵/2 ] = [0.93, 1.07].
c) La proportion de familles économisant moins de 1000 maravedis est donc :
Z 1
x 2
⇢= xe dx = 1 ' 26%.
0 e
Corrigé 99 a) On a : ⇢ ⇡r 2
= ( Rr )2 , si 0 r R,
P {⇢ r} = ⇡R2
1, si r > R.
La fonction de densité fR de la variable ⇢ est donc nulle en dehors de l’intervalle [0; R] et telle que :
2r
8r 2 [0; R], fR (r) = .
R2
b) Puisque les variables ⇢1 , . . . , ⇢n sont indépendantes :
n
Y
L(R) = fR (⇢i ).
i=1
On a donc ⇢
0 Q si 0 R < max1in ⇢i ,
L(R) = n
2n ( i=1 ⇢i )/R2n si R max1in ⇢i
et la fonction de vraisemblance L(.) atteint son maximum en :
R̂ = max ⇢i .
1in
2n 2n 1
fR̂ (r) = r , r > 0,
R2n
et le bias de R̂ vaut Z R
2n 2n
E(R̂) = r ⇥ r2n 1
dr = R.
R2n 0 2n + 1
Un estimateur sans biais de R est donc
2n + 1
R̃ = max ⇢i .
2n 1in
47
Corrigé 101 a) En notant Ua (resp. Ub ) : “X1 provient provient de la loi uniforme sur [0, a]”, on a
8
< 0 si x < 0
FX1 (x) = P (X1 x|Ua )P (Ua ) + P (X1 x|Ub )P (Ub ) si 0 x b
:
1 si x > b
8
>
> 0 si x < 0
<
p xa + (1 p) xb si 0 x a
=
>
> p + (1 p) xb si a x b
:
1 si x > b
(la variance d’une somme de variables indépendantes centrées vaut la somme de leurs variances et Xi /n
2
est de loi uniforme sur [ na , nb ], donc de variance (b12na)2 ).
2
✓ ✓2
Corrigé 103 a) On a E(T̄ ) = ✓/2 et V ar(T̄ ) = 12n donc E(✓1 ) = ✓ et V ar(✓1 ) = 3n ! 0.
b) P (Mn < m) = P (T1 < m et T2 < m . . . et Tn < m), donc
8
< (m/✓)n si m 2 [0, ✓]
P (Mn < m) = 1 si m > ✓
:
0 si m 0
n✓ n✓ 2 n✓ 2
Par intégration, E(Mn ) = n+1 et E(Mn2 ) = n+2 donc V ar(Mn ) = (n+2)(n+1)2 .
n+1 ✓2
c) On prend ✓2 = n Mn . On a E(✓2 ) = ✓ et V ar(✓2 ) = n(n+2) ! 0 quand n ! 1.
d) Puisque la variance de ✓2 est plus faible que la variance de ✓1 (donc risque quadratique plus faible),
il est préférable d’utiliser ✓2 .
e) Mn et ✓2 convergent vers ✓ en probabilité car :
✓ ✏
8✏ > 0, P {|Mn ✓| > ✏} = P {(✓ Mn ) > ✏} = ( )n ! 0
✓
et
n n n n
P {|✓ˆ2 ✓| > ✏} = P {|Mn ✓| > ✏} = P {Mn < (✓ ✏)} + P {Mn > (✓ + ✏)} ! 0.
n+1 n+1 n+1 n+1
48
Corrigé 104 a) La densité a posteriori s’écrit
i=1
c) Parmi les 20 composants, 3 composants ont été détectés comme défecteux. Les probabilités a
posteriori de p = 0.05 et p = 0.1 sont, d’après le théorème de Bayes,
Il est a posteriori trois fois plus probable que 10% des composants soient défectueux, plutôt que 5%.
d) L’espérance a posteriori de p est
e) La moyenne a posteriori de p n’est ni en accord avec le chef de production (qui affirme que p = 0.05),
ni en accord avec l’inspecteur (qui estime que p = 0.1). Néanmoins, la valeur donnée par l’inspecteur est
la plus proche de la moyenne a posteriori.
49