Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Chaines Markov

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 12

ECE2-B 2019-2020

TP8/9 : Chaînes de Markov

Pré-requis : je vous invite à consulter les chapitres de cours correspondants sur ma page (support
informatique). Pour ce TP, on pourra en particulier se reporter à la section « Tracés d’histogrammes »
du CH 8.
I Dans votre dossier Info_2a, créer le dossier TP_8.

I. Notion de chaîne de Markov : illustration sur un exemple


I.1. Énoncé du problème
Doudou le hamster passe son temps entre ses trois activités favorites : dormir, manger et faire de la
roue. Au début de la journée, il mange, et à chaque heure, il change d’activité selon les critères suivants.
1) Si, à l’heure n, il est en train de manger, alors il va dormir l’heure suivante avec probabilité 0.7 et
faire de l’exercice avec probabilité 0.3.
2) Si, à l’heure n, il est en train de dormir, alors il continue à dormir l’heure n + 1 avec probabilité
0.4, il va manger avec probabilité 0.3 et il va faire de l’exercice avec probabilité 0.3.
3) Si, à l’heure n, il est en train de faire de la roue, il va manger l’heure suivante avec probabilité 0.5
et il va dormir avec probabilité 0.5.
On s’intéresse ici à l’évolution du comportement de Doudou. On souhaite notamment déterminer si
l’une de ses activités prendra, à terme, le dessus sur les autres.

I.2. Modélisation mathématique


On modélise ce problème comme suit.
• On commence par numéroter les activités par un entier entre 1 et 3.
• On note Xn la v.a.r. égale à l’état du hamster à l’heure n.
Ainsi, la suite de v.a.r. (Xn ) représente l’évolution des activités du hamster.
• Cette évolution peut être modélisée par le graphe suivant.
0.4

D (2)
0.7 0.3

0.3 0.5
0.3
M (1) R (3)

0.5

• On définit enfin la matrice de transition A associée au problème. Il s’agit de la matrice :


A = (ai,j ) où ai,j = P[Xn =j] ([Xn+1 = i])
(ai,j représente la probabilité de passage de l’état j à l’état i)

1
ECE2-B 2019-2020

I.3. Étude de la matrice de transition


I Déterminer la matrice de transition du problème précédent.
Écrire l’appel permettant de la stocker dans une variable A.

0 1
0 0.3 0.5
A = @ 0.7 0.4 0.5 A
0.3 0.3 0
En Scilab : A = [0, 0.3, 0.5 ; 0.7, 0.4, 0.5 ; 0.3, 0.3, 0]

I Déterminer P[X0 =j] ([X1 = i]). À quel cœfficient de la matrice A cela correspond-il ?

On a :
P[X0 =j] ([X1 = i]) = P[Xn =j] ([Xn+1 = i])
Ceci permet de démontrer que la matrice de transition est indépendante de n.
Cette propriété est appelée homogénéité.

I Soit (i0 , . . . , in , in+1 ) 2 J1, 3Kn+2 . Que vaut P[X0 =i0 ]\...\[Xn =in ] ([Xn+1 = in+1 ]) ?

On a :
P[X0 =i0 ]\...\[Xn =in ] ([Xn+1 = in+1 ]) = P[Xn =in ] ([Xn+1 = in+1 ])
Cette propriété est appelée propriété de Markov.
On la retient souvent par la phrase :
Le futur (la position Xn+1 à l’instant n + 1) ne dépend du passé (positions X0 , . . . , Xn )
que par le présent (la position Xn à l’instant n).

Ces deux propriétés font de (Xn ) une chaîne de Markov homogène.

Remarque
• Il est classique de faire l’étude d’une grandeur aléatoire qui varie dans le temps discret. Par exemple,
on peut étudier :
⇥ l’évolution du prix d’une action jour après jour,
⇥ l’évolution du gain d’un joueur après chaque partie d’un jeu,
⇥ le déplacement d’un mobile (d’une puce) sur les sommets d’un carré (ou sur un axe gradué),
(c’était le cas du sujet EDHEC 2017)
⇥ ...
Lorsque l’évolution se fait de sorte que l’état à un instant ne dépend que de l’état à l’instant précédent,
on est dans le cadre de la chaîne de Markov.
• Même si le mot chaîne de Markov n’apparaît que dans le programme d’informatique (et donc pas
dans celui de maths), il est fréquent de voir ce type d’étude aux concours. Comme on va le voir,
cela permet de faire un sujet qui mêle les résultats des chapitres Probabilités (FPT, sce) et algèbre
linéaire (étude d’une matrice et des ses puissances).

2
ECE2-B 2019-2020

I.4. Matrice de transition et évolution de la loi de Xn


Dans la suite, on considère le vecteur Un qui définit la loi de Xn :
0 1
P([Xn = 1])
Un = @ P([Xn = 2]) A
P([Xn = 3])
I Déterminer la probabilité P([Xn+1 = 1]) en fonction de P([Xn = 1]), P([Xn = 2]) et P([Xn = 3]) et
des cœfficients de la matrice A.

La famille ([Xn = 1] , [Xn = 2] , [Xn = 3]) est un système complet d’événements.


Ainsi, d’après la formule des probabilités totales :

P
3
P([Xn+1 = 1]) = P([Xn = k] \ [Xn+1 = 1])
k=1
P3
= P([Xn = k]) ⇥ P[Xn =k] ([Xn+1 = 1])
k=1
= P([Xn = 1]) ⇥ P[Xn =1] ([Xn+1 = 1])
+ P([Xn = 2]) ⇥ P[Xn =2] ([Xn+1 = 1])
+ P([Xn = 3]) ⇥ P[Xn =3] ([Xn+1 = 1])

= a1,1 ⇥ P([Xn = 1]) + a1,2 ⇥ P([Xn = 2]) + a1,3 ⇥ P([Xn = 3])

I Déterminer de même P([Xn+1 = 2]) et P([Xn+1 = 3]).


En déduire que pour tout n
021N, Un+1 = A ⇥ Un . Exprimer enfin Un en fonction de A et de U0 .
1
Que signifie le choix U0 = @0A ? Comment obtient-on Un dans ce cas ?
0

En procédant de la même manière, on obtient :


• P([Xn+1 = 2]) = a2,1 ⇥ P([Xn = 1]) + a2,2 ⇥ P([Xn = 2]) + a2,3 ⇥ P([Xn = 3])
• P([Xn+1 = 3]) = a3,1 ⇥ P([Xn = 1]) + a3,2 ⇥ P([Xn = 2]) + a3,3 ⇥ P([Xn = 3])

On en déduit que : 8n 2 N, Un+1 = A ⇥ Un .


Par une récurrence immédiate, on obtient : 8n 2 N, Un = An ⇥ U0 .
0 1
1
Si U0 = @0A, c’est que P([X0 = 1]) = 1. Ce choix signifie donc que le hamster est
0
initialement dans l’état 1. En appliquant la formule précédente, on obtient la valeur de Un
correspondant à ce choix initial.
D’après la formule, cette valeur de Un est le contenu de la première colonne de An .

I Déterminer A5 , A10 et A20 . Que remarque-t-on ?

On remarque que la suite des puissances itérées (An ) semble converger vers une matrice
proche de : 0 1
0.27 0.27 0.27
@ 0.5 0.5 0.5 A
0.23 0.23 0.23

3
ECE2-B 2019-2020

II. Simulation des trajectoires en Scilab


II.1. Évolution de l’état du hamster partant d’un état x0 fixé
Dans ce qui suit, et sauf mention du contraire, on fait l’hypothèse que le hamster se trouve initialement
dans l’état x0 = 2. Autrement dit : P([X0 = x0 ]) = 1.
I Que vaut U0 dans ce cas ? Et U1 ?

0 1 0 1
0 0.3
Dans ce cas, on a U0 = @1A et U1 = A ⇥ U0 = @0.4A
0 0.3

I Faire le lien entre U1 et A. En Scilab, quel appel sur A permet de récupérer U1 ?

U1 est la deuxième colonne de A.


On récupère cette colonne à l’aide de l’appel : A(:,2).

I Rappeler l’ensemble image de X1 . Décrire le comportement que doit avoir une fonction simulant
X1 .

X1 (⌦) = J1, 3K. Une fonction simulant X1 doit renvoyer :


• 1 avec probabilité 0.3 (= A(1, 2)), • 3 avec probabilité 0.3 (= A(3, 2)).
• 2 avec probabilité 0.4 (= A(2, 2)),

I Écrire, à l’aide de la fonction rand, une fonction simuX1 (sans paramètre d’entrée et dont la sortie
est stocké dans une variable x1) permettant de simuler la v.a.r. X1 dans le cas où x0 = 2.
On testera la fonction une dizaine de fois et on commentera le résultat obtenu.

• Lorsque l’on exécute une dizaine de fois la


1 function x1 = simuX1()
fonction simuX1, elle renvoie à peu près le
2 r = rand()
même nombre de 1, de 2 et de 3.
3 if r < 0.3 then
4 x1 = 1 • En vertu de la LfGN, il faudrait exécuter un
5 elseif r < 0.7 then grand nombre de fois cette fonction pour
6 x1 = 2 vérifier si elle simule correctement la v.a.r.
7 else // r < 1 X1 . Par exemple, si on exécute N = 10000
8 x1 = 3 fois cette fonction, on obtiendra environ 3000
9 end fois le nombre 1, 4000 fois le nombre 2 et
10 endfunction 3000 fois le nombre 3.

I Modifier cette fonction afin de l’adapter au cas où x0 est quelconque.

4
ECE2-B 2019-2020

On prendra la valeur x0 en paramètre ainsi que la matrice de transition A.

1 function x1 = simuX1(x0, A)
2 r = rand()
On peut faire le même
3 if r < A(1,x0) then
commentaire que dans
4 x1 = 1
le cas de la fonction
5 elseif r < A(1,x0) + A(2,x0) then
précédente. On gardera
6 x1 = 2
en tête le lien fort lien
7 else // r < A(1,x0) + A(2,x0) + A(3,x0)
simulation informatique
8 x1 = 3
et LfGN.
9 end
10 endfunction

5
ECE2-B 2019-2020

II.2. Parenthèse : simulation d’une v.a.r. suivant une loi finie quelconque
Dans la section précédente, on a codé une fonction permettant de simuler la v.a.r. X1 . On cherche ici
à écrire une fonction permettant de simuler une v.a.r. Y discrète finie quelconque.
On note Y (⌦) = {y1 , . . . , yn } et pour tout k 2 J1, nK, pn = P([Y = k]).
I Que vaut p1 + . . . + pn ?

La famille ([Y = k])k2J1,nK est un système complet d’événements.


P
n
On en déduit que : P([Y = k]) = 1.
k=1

I Décrire le comportement que doit avoir une fonction simulant Y .

Une fonction simulant Y doit renvoyer :


• y1 avec probabilité p1 , • ...
• y2 avec probabilité p2 , • yn avec probabilité pn .
• ...

I Comment coder une telle fonction à l’aide de la fonction rand ?

Pour ce faire, on effectue un tirage r = rand() et on teste si r est dans l’intervalle :

• [0, p1 ] ]p1 + p2 , p1 + p2 + p3 ]

(cela se produit avec probabilité p1 ),(cela se produit avec probabilité p3 ),
• ]p1 , p1 + p2 ] • ...
(cela se produit avec probabilité p2 ),
• ]p1 + . . . + pn 1 , p1 + . . . + pn ]
(cela se produit avec probabilité pn ).
On rappelle que l’appel cumsum(P) permet d’obtenir [p1 , p1 + p2 , . . . , p1 + . . . + pn ].

I Coder la fonction simuY qui prend en paramètre une matrice ligne Y contenant les valeurs de Y (⌦)
et une matrice ligne P contenant les probabilités associées.
Cette fonction doit mettre en œuvre la stratégie précédente.

1 function res = simuY(Y, P)


2 r = rand()
3 tabProbCumul = cumsum(P)
4 k = 1
5 while tabProbCumul(k) < r
6 k = k + 1
7 end
8 res = Y(k)
9 endfunction

I Écrire une fonction simuMarkovEtape qui prend en paramètre l’état initial x0 du hamster et la
matrice A et renvoie un état possible du hamster (avec la bonne probabilité) au bout d’une heure.

1 function x = simuMarkovEtape(x0, A)
2 x = simuY(1:3, A(:,x0))
3 endfunction

6
ECE2-B 2019-2020

II.3. Évolution de l’état du hamster après n heures


I Écrire une fonction simuMarkov(x0,A,n) qui prend en paramètre l’état initial x0 et la matrice de
transition A et renvoie une simulation de la v.a.r. Xn .

Il s’agit simplement d’itérer la fonction précédente.

1 function x = simuMarkov(x0, A, n)
2 x = x0
3 for i = 1:n
4 x = simuMarkovEtape(x, A)
5 end
6 endfunction

II.4. Simulation d’une trajectoire


• Pour ! 2 ⌦, on appelle trajectoire de taille n la suite finie (X0 (!), X1 (!), . . . , Xn (!)).
• Simuler une trajectoire de taille n c’est donc obtenir une suite (x0 , x1 , . . . , xn ) où xi est le résultat
de la simulation de Xi .
I Écrire une fonction simuTrajectoire(x0, P, n) qui simule une trajectoire de taille n.

1 function tab = simuTrajectoire(x0, P, n)


2 tab = zeros(1, n+1)
3 tab(1) = x0
4 for i = 1:n
5 tab(i+1) = simuMarkovEtape(tab(i), P)
6 end
7 endfunction

Fonctionnalité Scilab
La simulation d’une trajectoire de taille n est implémentée dans Scilab.
Plus précisément, la commande grand(n,'markov', P',x0)

permet de simuler une trajectoire ayant les caracatéristiques suivantes :


⇥ la trajectoire est de taille n,

⇥ elle démarre de l’état initial x0.

(où P est la matrice de transition de la chaîne de Markov)


On notera que l’on considère la transposée de la matrice P dans cet appel.

 Il faut faire attention lorsque l’on utilise l’appel grand(n,'markov',P',x0) :


⇥ la trajectoire obtenue ne contient pas x0,
⇥ les états sont nommés 1, 2, . . ., m où m est le nombre de lignes de la matrice carrée P .

I Par quel appel utilisant la fonction grand peut-on obtenir le même type de simulation que l’appel
simuTrajectoire(x0, P, n) ?

[x0, grand(n,'markov',P',x0)]

7
ECE2-B 2019-2020

II.5. Représentation de trajectoires


I Étant donné un état initial x0 et une population de taille N, quel appel permet de représenter une
trajectoire simulée de taille n donnée ? On utilisera la fonction plot2d.

plot2d((0:n), simuTrajectoire(x0, transitionP(N), n))

I Écrire un programme :
⇥ qui demande à l’utilisateur d’entrer la taille des trajectoires à simuler et stocke cette information
dans une variable tailleTraj,
⇥ qui demande à l’utilisateur d’entrer l’état initial et le stocke dans une variable x0,
⇥ qui calcule une trajectoire de longueur tailleTraj partant de l’état initial x0,
⇥ qui représente cette trajectoire à l’aide de la commande plot2d.

1 tailleTraj = input("Entrez la taille souhaitée pour la trajectoire : ")


2 x0 = input("Entrez l''état initial de la chaîne de Markov : ")
3 P = transitionP(N)
4 plot2d((0:tailleTraj), simuTrajectoire(x0, P, tailleTraj))

I Comment modifier ce programme afin qu’il permette l’affichage de plusieurs trajectoires ?


On demandera initialement à l’utilisateur d’entrer le nombre de trajectoires souhaitées (à stocker
dans une variable nbTraj).
(indication : on pourra effectuer une boucle)

1 N = input("Entrez la taille N de la population : ")


2 nbTraj = input("Entrez le nombre de trajectoires souhaitées : ")
3 tailleTraj = input("Entrez la taille souhaitée pour les trajectoires : ")
4 x0 = input("Entrez l''état initial de la chaîne de Markov : ")
5 P = transitionP(N)
6 for k = 1:nbTraj
7 plot2d((0:tailleTraj), simuTrajectoire(x0, P, tailleTraj), style=k)
8 end

8
ECE2-B 2019-2020

III. Comportement asymptotique du hamster


On souhaite conjecturer le comportement de la loi de Xn lorsque n tend vers +1.
Pour ce faire, on compare :
⇥ la valeur théorique de Un (loi de Xn ) pour n grand,
⇥ une valeur approchée de Un obtenue en recueillant les effectifs de chaque état à la suite de N
simulations de trajectoires de taille n.
I Partant de l’état initial x0, par quel appel obtient-on Un ?

On stocke tout d’abord le résultat de An dans une matrice B : B = A ^ n


et on sélectionne la colonne correspondant à l’état x0 : B(:,x0)

I Compléter le programme suivant.

1 // Valeur des paramètres


2 N = input('Entrez le nombre N de simulations souhaitées : ')
3 n = input('Entrez la taille n de chaque trajectoire simulée : ')
4 x0 = input('Entrez l''état initial : ')
5

6 // Distribution théorique
7 B = A^n
8 P = B(:,x0)
9

10 // Valeurs observées
11 Obs = zeros(1, N)
12 for i = 1:N
13 Obs(i) = simuMarkov(x0, A, n)
14 end
15

16 // Calcul des effectifs observés


17 v = tabul(Obs)
18

19 clf()
20 // Diagramme des fréquences observées
21 bar(v(:, 1) + 0.5, v(:,2)/N, width = 0.4, 'red')
22 // Diagramme de la distribution théorique
23 bar(1:3, P, width = 0.4)

9
ECE2-B 2019-2020

I Exécutez ce programme pour N = 1000, n = 50, et x0 = 2.


On obtient le diagramme suivant :

I Quel diagramme obtient-on si l’on part intialement avec un autre état x0 ?

On obtient les mêmes diagrammes en partant des états initiaux 1 et 3.

I Que peut-on en conclure sur le comportement à terme du hamster ?

À terme, le hamster mange avec une probabilité d’environ 0.27, dort avec une probabilité
d’environ 0.5 et tourne dans sa roue avec une probabilité d’environ 0.23.

I Si l’on est capable de démontrer que la suite (Un ) converge vers une limite notée U1 , quelle relation
peut-on établir entre U1 et A ?

Si l’on est capable de montrer que Un converge (i.e. si tous ses cœfficients convergent) et si
on note U1 sa limite, l’égalité Un+1 = A ⇥ Un nous fournit, par passage à la limite :

U1 = A ⇥ U1

Une telle loi U1 est dite stationnaire (ou invariante).


On peut démontrer les propriétés suivantes.
• Une loi invariante est un vecteur propre de la matrice de transition A.
• Une chaîne de Markov homogène sur un espace d’étas fini S admet au moins une loi
invariante.
• Avec une hypothèse supplémentaire (la chaîne de Markov est irréductible) on peut
démontrer qu’une telle chaîne de Markov admet une unique loi invariante.

10
ECE2-B 2019-2020

IV. Les chaînes de Markov aux concours (EDHEC 2017)


L’épreuve EDHEC 2017 portait sur le déplacement au cours du temps d’un mobile sur les 4 sommets
d’un carré. Voici une retranscription de l’énoncé.
Les sommets d’un carré sont numérotés 1, 2, 3, et 4 de telle façon que les côtés relient le sommet 1 au
sommet 2, le sommet 2 au sommet 3, le sommet 3 au sommet 4 et le sommet 4 au sommet 1.
Un mobile se déplace aléatoirement sur les sommets de ce carré selon le protocole suivant :
• Au départ, c’est à dire à l’instant 0, le mobile est sur le sommet 1.

• Lorsque le mobile est à un instant donné sur un sommet, il se déplace à l’instant suivant sur l’un
quelconque des trois autres sommets, et ceci de façon équiprobable.
Pour tout n 2 N, on note Xn la variable aléatoire égale au numéro du sommet sur lequel se situe le
mobile à l’instant n. D’après le premier des deux points précédents, on a donc X0 = 1.

IV.1. Les résultats de l’énoncé


Voici les principaux résultats qu’il fallait démontrer :
1
1) 8n 2 N, P ([Xn+1 = 1]) = (P ([Xn = 2]) + P ([Xn = 3]) + P ([Xn = 4]))
3
1 1
puis : 8n 2 N, P([Xn+1 = 1]) = P([Xn = 1]) +
3 3
✓ ◆n
1 3 1
et enfin : 8n > 2, P([Xn = 1]) = +
4 4 3
1
2) 8n 2 N, P ([Xn+1 = 2]) = (P ([Xn = 1]) + P ([Xn = 3]) + P ([Xn = 4]))
3
1
3) 8n 2 N, P ([Xn+1 = 3]) = (P ([Xn = 1]) + P ([Xn = 2]) + P ([Xn = 4]))
3
1
4) 8n 2 N, P ([Xn+1 = 4]) = (P ([Xn = 1]) + P ([Xn = 2]) + P ([Xn = 3]))
3
On considérait alors, pour tout n de N, la matrice-ligne Un 2 M1,4 (R) et la matrice A :
0 1
0 1 1 1
1B 1 0 1 1C
Un = P ([Xn = 1]) P ([Xn = 2]) P ([Xn = 3]) P ([Xn = 4]) et A= B C
3 @1 1 0 1A
1 1 1 0
(ce choix correspond à prendre la transposée du vecteur Un choisi dans ce TP)
Cela permettait d’obtenir les résultats suivants.
5) 8n 2 N, Un+1 = Un A
6) 8n 2 N, Un = U0 An
I En déduire la première ligne de An .

La première ligne de An est obtenue en prenant U0 = 1 0 0 0 .

I Expliquer comment choisir la position du mobile au départ pour trouver les trois autres lignes de
la matrice An .

Les lignes suivantes de An sont obtenues en prenant successivement :


⇥ U0 = 0 1 0 0 ,
⇥ U0 = 0 0 1 0 ,
⇥ U0 = 0 0 0 1 .

11
ECE2-B 2019-2020

1 1
On écrivait alors A sous la forme : A = I + J avec les matrices I et J suivantes :
3 3
0 1 0 1
1 0 0 0 1 1 1 1
B0 1 0 0C B1 1 1 1C
I=B
@0
C et J =B C
0 1 0A @1 1 1 1A
0 0 0 1 1 1 1 1
✓ ◆n
1 1
et on déterminait An = I+ J par la formule du binôme de Newton.
3 3

IV.2. La partie informatique


I Compléter le script Scilab suivant pour qu’il affiche les 100 premières positions autres que celle
d’origine, du mobile dont le voyage est étudié dans ce problème, ainsi que le nombre n de fois où il
est revenu sur le sommet numéroté 1 au cours de ses 100 premiers déplacements (on pourra utiliser
la commande sum).

1 A = [–––] /3
2 x = grand(100,'markov',A,1)
3 n = –––
4 disp(x)
5 disp(n)

1 A = [0, 1, 1, 1; 1, 0, 1, 1; 1, 1, 0, 1; 1, 1, 1, 0] /3
2 x = grand(100,'markov',A,1)
3 n = sum(x==1)
4 disp(x)
5 disp(n)

I Après avoir exécuté cinq fois ce script, les réponses concernant le nombre de fois où le mobile est
revenu sur le sommet 1 sont : n = 23, n = 28, n = 23, n = 25, n = 26.
En quoi est-ce normal ?

À chaque fois que 100 déplacements sont effectués, on note environ 25 retours en position
1. Cela correspond à la formule obtenue précédemment :
✓ ◆m
1 3 1
P([Xm = 1]) = +
4 4 3
✓ ◆m
1
avec qui se rapproche rapidement de 0.
3

12

Vous aimerez peut-être aussi