Mathématiques 1: 4 Heures Calculatrices Autorisées
Mathématiques 1: 4 Heures Calculatrices Autorisées
Mathématiques 1: 4 Heures Calculatrices Autorisées
2017
TSI
4 heures Calculatrices autorisées
Objectif du problème
Ce problème aborde la question de la mesure quantitative de l’information.
La première partie étudie quelques propriétés de la fonction logarithme népérien utiles pour les autres parties
du problème.
La deuxième partie vise à construire les fonctions permettant de modéliser l’information contenue dans les évé-
nements de probabilité non nulle d’un espace probabilisé. L’information contenue dans un tel événement
correspond intuitivement à l’effet de surprise provoqué par la réalisation de cet événement.
La troisième partie aborde la notion d’entropie d’une variable aléatoire discrète à valeurs entières.
La quatrième partie aborde l’entropie d’un couple de variables aléatoires et la notion d’entropie conditionnelle.
L’exemple traité dans la cinquième partie établit le lien entre la quantité d’information contenue dans un message
aléatoire et le nombre minimal de questions que le récepteur du message doit poser à son émetteur pour pouvoir
identifier sans ambiguïté l’une des réalisations de ce message.
Notations
− Pour 𝑥 ∈ ℝ+∗ , ln 𝑥 désigne le logarithme népérien de 𝑥.
− Pour 𝑛 ∈ ℕ, ⟦0, 𝑛⟧ désigne les entiers naturels compris entre 0 et 𝑛.
I Questions préliminaires
I.A – Représenter graphiquement la fonction logarithme népérien.
I.B – Démontrer que, pour tout 𝑥 ∈ ℝ+∗ , ln(𝑥) ⩽ 𝑥 − 1 et que ln(𝑥) = 𝑥 − 1 si et seulement si 𝑥 = 1.
I.C – Donner une interprétation graphique de ces deux résultats.
I.D – Montrer que la fonction 𝑔 définie sur [0, 1] par 𝑔(0) = 0 et ∀𝑥 ∈ ]0, 1], 𝑔(𝑥) = 𝑥 ln(𝑥) est continue sur
[0, 1] et dérivable sur ]0, 1]. Représenter graphiquement la fonction 𝑔.
III.A.3)
a) 𝑋0 est une variable aléatoire suivant la loi uniforme sur ⟦0, 𝑛⟧. Calculer 𝐻(𝑋0 ).
b) En appliquant l’inégalité de la question I.B à un nombre réel 𝑥 bien choisi, démontrer que
∀𝑘 ∈ ⟦0, 𝑛⟧ − 𝑝𝑘 ln(𝑝𝑘 ) + 𝑝𝑘 ln ( 1 )⩽ 1 −𝑝
𝑛+1 𝑛+1 𝑘
c) En déduire que 𝐻(𝑋) ⩽ 𝐻(𝑋0 ) avec égalité si et seulement si 𝑋 suit la même loi que 𝑋0 (pour le cas
d’égalité on pourra utiliser le cas d’égalité de la question I.B). Interpréter ce résultat en terme de quantité
moyenne d’information.
III.B – Dans cette sous-partie, on s’intéresse à des variables aléatoires discrètes définies sur un espace proba-
bilisé (Ω, 𝑃 ) et prenant leurs valeurs dans ℕ∗ . Si 𝑋 est une telle variable pour laquelle 𝑃 (𝑋 = 𝑘) est noté 𝑝𝑘 , on
dit qu’elle est d’entropie finie si la série ∑ 𝑝𝑘 ln(𝑝𝑘 ) est absolument convergente et on définit alors son entropie
par
+∞
𝐻(𝑋) = − ∑ 𝑝𝑘 ln(𝑝𝑘 )
𝑘=1
c) Démontrer que
+∞
−𝐻(𝑋1 ) ⩽ ∑ 𝑝𝑘 ln(𝑞𝑘 )
𝑘=1
d) En déduire que
+∞
𝑞
𝐻(𝑋) − 𝐻(𝑋1 ) ⩽ ∑ 𝑝𝑘 ln ( 𝑝𝑘 )
𝑘
𝑘=1
puis que
𝐻(𝑋) ⩽ 𝐻(𝑋1 )
IV Quatrième partie
Dans cette partie, 𝑚 et 𝑛 sont des entiers naturels non nuls. (𝑋, 𝑌 ) et (𝑋 ′ , 𝑌 ′) sont deux couples de variables
aléatoires discrètes. 𝑋 et 𝑋 ′ sont à valeurs dans ⟦0, 𝑛⟧, 𝑌 et 𝑌 ′ sont à valeurs dans ⟦0, 𝑚⟧. Pour 𝑖 ∈ ⟦0, 𝑛⟧ et
𝑗 ∈ ⟦0, 𝑚⟧, on note 𝑝𝑖 = 𝑃 (𝑋 = 𝑖), 𝑞𝑗 = 𝑃 (𝑌 = 𝑗), 𝜆𝑖𝑗 = 𝑃 (𝑋 = 𝑖; 𝑌 = 𝑗) et 𝜆′𝑖𝑗 = 𝑃 (𝑋 ′ = 𝑖; 𝑌 ′ = 𝑗).
On suppose que, pour tout (𝑖, 𝑗) ∈ ⟦0, 𝑛⟧ × ⟦0, 𝑚⟧, 𝜆𝑖𝑗 ≠ 0 et 𝜆′𝑖𝑗 ≠ 0.
Notations
On définit l’entropie du couple (𝑋, 𝑌 ) par
𝑛 𝑚
𝐻(𝑋, 𝑌 ) = − ∑ ∑ 𝜆𝑖𝑗 ln(𝜆𝑖𝑗 )
𝑖=0 𝑗=0
𝑛 𝑚 𝜆′𝑖𝑗 𝜆′𝑖𝑗
𝐾(𝑋, 𝑌 , 𝑋 ′ , 𝑌 ′) = − ∑ ∑ 𝜆𝑖𝑗 (ln ( )− + 1)
𝑖=0 𝑗=0
𝜆𝑖𝑗 𝜆𝑖𝑗
Donner une condition nécessaire et suffisante pour que cette inégalité soit une égalité.
Remarque — L’inégalité (IV.1) a été obtenue en supposant, pour tout (𝑖, 𝑗) ∈ ⟦0, 𝑛⟧ × ⟦0, 𝑚⟧, 𝜆𝑖𝑗 ≠ 0 et 𝜆′𝑖𝑗 ≠ 0.
On admet qu’elle reste vraie même en dehors de cette condition
V Une application
Un jeu oppose deux joueurs A et B. Une urne contient 2016 boules indiscernables au toucher numérotées de 0
à 2015. Le joueur A tire une boule au hasard dans l’urne. On note 𝑌 la variable aléatoire égale au numéro de
la boule tirée par le joueur A. Le joueur B pose alors au joueur A une série de 𝑁 questions amenant la réponse
« oui » ou « non » lui permettant de déterminer sans ambiguïté la valeur prise par 𝑌. Le but de cette partie est
de trouver la valeur minimale de 𝑁 si B procède par dichotomies successives.
V.A – Déterminer l’entropie de 𝑌.
V.B – La première question posée par B est « 𝑌 est-il compris entre 1008 et 2015 ? » La réponse fournie par
A lui permet de positionner 𝑌 par rapport 1008. Si la réponse de A est « oui », B posera 𝑋1 = 1 et cherchera
ensuite à positionner 𝑌 par rapport à 1512. Si la réponse à la première question est « non », B posera 𝑋1 = 0
et cherchera à positionner 𝑌 par rapport à 504. Il continue selon le même procédé.
Expliquer pourquoi le joueur B finira par trouver la valeur de 𝑌. Au bout de combien de questions ?
V.C – On se propose de donner une interprétation de ce résultat en terme d’entropie. Les variables aléatoires
(𝑋1 , 𝑋2 , …, 𝑋𝑁 ) sont renseignées par les réponses données par A à la première, la deuxième, …, la 𝑁-ième
question.
𝑁
On pose 𝑋 = ∑ 𝑋𝑁+1−𝑖 2𝑖−1 . On admet que 𝑋 est une variable aléatoire.
𝑖=1
Montrer qu’elle prend ses valeurs dans ⟦0, 2𝑁 − 1⟧. On ne cherchera pas la loi de 𝑋.
V.D – Démontrer que 𝐻(𝑋) ⩽ 𝑁 ln(2).
On pourra utiliser l’inégalité vue à la question III.A.3.
V.E – Expliquer en langage courant pourquoi 𝐻𝑌 (𝑋) = 0. En déduire que 𝐻(𝑋, 𝑌 ) = 𝐻(𝑌 ).
V.F – Montrer que 𝐻𝑋 (𝑌 ) ⩾ ln(2016) − 𝑁 ln(2).
V.G – En combien de questions le joueur B est-il certain de pouvoir trouver à coup sûr la valeur de 𝑌 ?
Comparer au résultat de la question V.B.
• • • FIN • • •