Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Exos Jeux 19-20corriges

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 5

Exercices théorie des jeux - 2019/2020

H. Fargier

28 octobre 2019

Pour tout doute, typo ou erreur, merci de contacter fargier@irit.fr

1 Strategies pures et mixtes


Pour chaque jeux-type suivant :
 donner la stratégie de sécurité de chaque joueur
 determiner les equilibres de Nash en strategie pure (si il y en a) ; sont ils Pareto optimaux ?
 donner un equilibre en stratégie mixte

fonce devie
 jeu de la poule mouillee fonce -3 ; -3 2; 0
dévie 0; 2 1 ;1
travaille ne travaille pas
 dilemne du samaritain charitable 3; 2 -1 ; 3
pas charitable -1 ; 1 0; 0
cerf lapin
 jeu de la chasse au cerf cerf 4; 4 0; 1
lapin 1 ; 0 1 ; 1
theatre foot
 jeu de la bataille des cerfs theatre 2; 1 0; 0
foot 0; 0 1; 2

2 Equilibres de Nash pur et mixte (dilemne du samaritain)


Dans le jeu suivant (dilemme du samaritain), l'étudiant typique peut se prendre en charge ("étudier", trouver
un travail...) ou réclamer l'assistance du gouvernement ("bloquer" la fac, et exiger de l'Etat un diplôme, un
emploi, une retraite...). Le gouvernement peut aider l'étudiant ou refuser toute assistance. Les gains sont indiqués
dans le tableau suivant :

étudier bloquer
aider 2; 2 -2 ; 3
refuser -1 ; 1 1; 0

Montrer que le jeu n'admet pas d'équilibre de Nash en stratégies pures. Déterminez l'équilibre de Nash en
stratégies mixtes.
Réponse :
Pas d'equilibre de Nash pur - en a, e l'etudiant a interet à passer à l'action b , en (a, b) l'etat à interet à
passer à l'action r, etc.
Soit p la proba que choisit l'etudiant pour "etudier" (2 − p pour "bloquer") et q la proba que l'etat chosit
pour "aider" (1 − q pour "ne pas aider).
Uetat (p, q) = 2.p.q − 2.(1 − p).q − 1.(1 − q).p + (1 − p).(1 − q) Uetudiant (p, q) = 2.p.q + 3.(1 − p).q + 1.(1 − q).p +

1
0.(1 − p).(1 − q)

A l'equilibre de Nash mixte, p est tel que Uetat ne depend pas de la strategie de ce joueur (de q) ;
Uetat (p, q) = 2.p.q − 2.(1 − p).q − 1.(1 − q).p + (1 − p).(1 − q)
Uetat (p, q) = q(2.p − 2.p − p + 1 − p) − p + 1 − p
Uetat (p, q) = q(1 − 2.p) − p + 1 − p
A l'EN mixte, p = 12 .
De meme :
Uetudiant (p, q) = 2.p.q + 3.(1 − p).q + 1.(1 − q).p + 0.(1 − p).(1 − q)
Uetudiant (p, q) = p.(2.q − 3q + 1 − q) + 3q
Uetudiant (p, q) = p.(1 − 2.q) + 3q
A l'EN mixte, q = 21 .
A l'EN mixte p = q = 12 , Uetat = 0 et Uetudiant = 3
2

3 Modélisation et equilibre de Nash


Deux étudiants, Arthur et Béatrice doivent se répartir 100 eu-ros trouvés à la sortie de l'amphi. Pour cela, ils
ne peuvent faire que trois annonces (simultanées) exprimant leurs revendications sur la somme découverte : 0, 50
ou 100. Si leurs annonces sont compatibles (la somme des annonces est inférieure ou égale à 100), chacun obtient
le montant qu'il ou elle a annoncé. Si leurs annonces sont incompatibles (la somme des annonces est strictement
supérieure à 100), ils se disputent nécessairement et leur incivilité est découverte. La mauvaise réputation qu'ils
doivent endurer dans ce cas est représentée par un gain négatif de -200 pour chacun.

a. Décrire l'ensemble des joueurs et leurs stratégies possibles et représenter le jeu sous forme normale.
Réponse :
0 50 100
0 0; 0 0 ; 50 0 ; 100
50 50 ; 0 50 ; 50 -200 ; -200
100 100 ; 0 -200 ; -200 -200 ;-200
b. Les joueurs ont-ils une stratégie dominante ?
Réponse :
non
c. Trouver le ou les équilibre(s) de Nash.
Réponse :
(50; 50) (0; 50) (100; 0) sonnt les equilibre de Nash purs de ce jeu
d. Dans une variante du jeu, Arthur joue le premier, met une somme dans une enveloppe, puis Beatrice
ouvre l'enveloppe puis accepte ou refuse l'ore. Si elle refuse ils ont tous deux un gain de zero. Dessiner le
jeu sous forme extensive correspondant ; A quelle condition sur l'utilité de Beatrice Arthur va il jouer 50 ?
Réponse :
Les actions sont donc pour Arthur 0,50,100 et pour Beatrice Accepter et Ref user. Pour Arthur, la stra-
tegie 0 a une utilité de 0 quelle que soit l'action de Beatrice ; si il joue 50, Beatrice va accepter pour avoir
une utilité supérieure à 0. si il joue 100, on peut penser que lorsqu'elle recoit 0, l'utilité de Beatrice est
legerement plus haute en refusant qu'en acceptant, donc elle refusera. Arthur va donc jouer 50
4 Modélisation et Equilibre de Nash : le problème du penalty
Soient un tireur de pénalty et un gardien de but. Au moment de jouer le pénalty, aucun joueur ne peut
observer la stratégie de l'autre. Une stratégie consiste dans le fait de choisir un des deux côtés du but (à gauche
ou à droite du but, lorsqu'on le regarde du centre du terrain). Un but marqué/non marqué vaut un gain unitaire
pour le tireur/gardien. Sinon le gain est nul. Si le gardien choisit le même côté que le tireur il empêche le but.
Le ballon passe à côté de la cage lorsqu'il est tiré à droite avec une probabilité 1 − πd et est raté lorsqu'il est
tiré à gauche avec une probabilité 1 − πg .

a. Représenter le jeu sous forme normale et trouver le ou les équilibre(s) de Nash en stratégies pures.
Réponse :
GG GD
TG 0; 1 πg ; 1 − πg
TD πd ; 1 − πd 0; 1
Pas d equilibre de Nash en strategie pure
b. Trouver le ou les équilibre(s) de Nash en stratégies mixtes.
Soit p la probabilité avec laquelle le tireur a choisi de tirer à gauche et q la probabilité avec laquelle le
goal a choisi de plonger à gauche.

UT (p, q) = p.(1 − q).πg + (1 − p).q.πd


UT (p, q) = p.(πg − q.πg − q.πd ) + πd .q
π π
πg − d.πg − q.πd = 0 ssi q = pid +π
g
g
. La valeur de q qui annule l'inuence de p sur UT (p, q) est q = pid +π
g
g
πg
Le tireur (qui decide de p) va xer p = 1 cad tirer à gauche si πg − q.πg − q.πd > 0 , i.e. si q < pid +π g
et
à droite sinon.

UG (p, q) = p.q + p.(1 − q).(1 − πg ) + (1 − p).q.(1 − πd ) + (1 − p).(1 − q) La valeur de p qui annule l'inuence
de q sur UG (p, q) est pidπ+π
d
g
. Le gardien, qui decide de q , va xer q = 1 (plonger à gauche) si p < pidπ+π d
g
et plonger à droite si p > pidπ+π d
g

5 Equilibre en dominance parametrée


On considère le matrice de gains suivante :

G D
H a; b c, 2
M 1; 1 1; 0
B 3; 2 0; 1
Pour quelles valeurs de a, b et c, le prol de stratégies (H ,G) est-il un équilibre en stratégies dominantes ?
Réponse :
il faut que b > 2 et a > 3
Pour quelles valeurs de a, b et c, le prol de stratégies (T ,L) est-il un équilibre de Nash en stratégies pures ?
Réponse :
meme reponse (tout equilibre en strategie dominante est un EN pur

6 Equilibre en dominance itérée


Dans le jeu sous forme normale suivant, existe il un equilibre de en strategie dominante ?
G C D
H 2; 0 1; 1 4 : 2
M 3; 4 1; 2 2; 3
B 1; 3 0; 2 3; 0
 existe il un equilibre de en strategie dominante ?
Réponse :
non
 quelles stratégies survivent au processus d'élimination itérée des stratégies strictement dominées ?
Réponse :
H domine B, qui est eliminée ; dans le jeu resultant, D domine C qui est eliminée. Reste donc les strategies
G et D (pour le joueur colone) et H et M (pour le joueur ligne), soit le jeu :
G D
H 2; 0 4; 2
M 3; 4 2; 3
 Quels sont les équilibres de Nash en stratégies pures ? Quels sont les équilibres de Nash en stratégies
mixtes ?
Réponse :
Dans ce jeu (M, G) et (H, D) sont des equilibres de Nash purs. Ce sont egalement des equilibres mixtes ((
pG = 1, pM = 1) et ( pG = 0, pM = 0) car tout equilibre pur est un equilibre mixte).

7 Jeux sous forme extensive


On suppose que deux joueurs jouent le jeu dit Jeu de l'Ultimatum. Dans ce jeu séquentiel, le joueur A reçoit
une somme d'argent S et doit proposer un partage de cette somme (x,1-x) entre lui-même et le joueur B. Si
le partenaire accepte le deal, les deux négociateurs remportent les sommes respectives ; si le partenaire rejette
l'ore, la somme d'argent S est perdue pour les deux joueurs.

On suppose que la fonction d'utilité du joueur i ∈ {1, 2} est de la forme ui(xi, xj) = xi .

a. En raisonnant à rebours, déterminez la stratégie optimale du joueur 1.


Réponse :
Dans un tel cas de gure, le joueur B devrait accepter toute ore supérieure à zéro de la part du joueur
A, et le joueur A, anticipant la réponse du joueur B, devrait faire la plus petite ore positive possible.
b. Dans la réalité on observe rarement l'équilibre de Nash de la première question. En eet, en faisant
jouer ce jeu à des employés d'un centre de distribution aux États-Unis, Carpenter et al. (2005) trouvent
pourS = 100 que les employés dans le rôle du joueur 1 proposent en moyenne 45 % de la somme au joueur
2 qui rejette l'ore en moyenne dans 7 % des cas.
Donnez une explication pour le comportement du joueur 1. Comment modieriez-vous la fonction d'utilité
des joueurs pour tenir compte des résultats observés ?
Réponse :
Une explication est que le joueur A est altruiste et integre dans sa fonction d'utilité une notion de justice ;
l'autre explication est que B intègre dans sa fonction d'utilité une notion de frustration (colère) et que
u2(xi, xj) > xj si xj < 45 ; anticipant ce fait (raisonnant à rebour sur le jeu extensif) le joueur A pense
que si il fait une ore faible, l'autre refusera puisque le refus lui procure une utilité superieure ( et donc
lui même aura une utilité nulle) alors que si il fait une ore plus equitable, l'autre acceptera et donc A
fera un gain non nul
8 Dilemne de de Bertrand
Deux soldeurs S1 et S2 disposent chacun d'un stock de 120 ordinateurs d'un même modèle ; ils sont libres de
choisir les prix, p1 ≥ 0 et p2 ≥ 0 ; auxquels ils essaieront de les vendre. Ceux qu'ils ne vendront pas tout de suite
resteront dénitivement invendus. Ils cherchent donc à maximiser le gain résultant de la vente. Les acheteurs
achèteront tous dans le magasin proposant le prix le plus bas ; en cas de prix égaux, la moitié achètera à S1,
l'autre à S2.

a. Exprimer les gains de S1 et S2 en fonction du couple (p1 ; p2).


Réponse :
Dans ce jeu, les actions des joueurs sont les valeurs de p1 (pour le joueur 1) et de p2 pour le joueur 2
.
Si p1 > p2, G1=120*p1 et G2=0 ; si p1 < p2, G1=0 et G2=120*p2 ; si p1 = p2, G1 = 120/2 ∗ p1 = G2.
b. Y a t il un equilibre de Nash en strategie pure ? lequel ? Réponse :
p1 = p2 = 0 est le seul equilibre de Nash en strategie pure ; en eet, pour toute stratégie jointe (p1, p2) où
p1 > p2, le joueur 1 ne gagne rien : il a interet à changer d'action pour prendre un p1' inférieur ou egal à
p2 ; symetriquement, en eet, pour toute stratégie jointe (p1, p2) où p1 < p2, le joueur 2 ne gagne rien :
il a interet à changer d'action pour prendre un p2' inférieur ou egal à p2' ; enn, si p1 = p2, n importe
quel joueur a interet à baisser son prix, pour augmenter son gain et passer de 60 ∗ pi à 120 ∗ pi, ce qu il
peut toujours faire à moins que p1 = p2 = 0. Enn si p1 = p2 = 0, le seul mouvement qu peut faire un
joueur est d'augmenter son son prix, ce qui ne lui rapportera pas plus

Vous aimerez peut-être aussi