Apuntes Docentes de Teor - A de Juegos
Apuntes Docentes de Teor - A de Juegos
Apuntes Docentes de Teor - A de Juegos
Apuntes docentes
Contenidos
Capítulo 1: Introducción
1
Apuntes de Teoría de Juegos
2
Apuntes de Teoría de Juegos
Capítulo Uno
Introducción
1.1.- Qué es la teoría de juegos
La teoría de juegos es una disciplina que tiene como objetivo principal el estudio de
decisiones multipersonales, es decir, cuando la decisión de una persona afecta el
bienestar de otra. En ese contexto, el concepto clave es la interdependencia estratégica.
1.2. Objetivos
Este documento está orientado a estudiar los pilares de la teoría de juegos. Desarrolla
ejemplos y aplicaciones centradas en el campo de la toma de decisiones estratégicas.
Está dirigido a estudiantes que están cursando sus últimos cursos de pregrado y a
estudiantes de postgrado no iniciados en la teoría. Está dirigido también a profesionales
que deben tomar decisiones estratégicas.
El objetivo general del documento es apoyar el curso de Teoría de Juegos que se dicta a
nivel universitario. Los objetivos específicos son:
3
Apuntes de Teoría de Juegos
El documento está dividido en tres capítulos. En los capítulos dos y tres se revisan
diversos juegos con las siguientes características:
4
Apuntes de Teoría de Juegos
5
Apuntes de Teoría de Juegos
Capítulo Dos
Juegos Simultáneos
2.1. Objetivos del capítulo
6
Apuntes de Teoría de Juegos
Es muy importante considerar que cuando se habla de juegos simultáneos, la clave está
en la falta de información más que en el timing. No es condición necesaria que dos
jugadores decidan una estrategia en el mismo segundo para que el juego sea
considerado simultáneo. La condición es que los jugadores no conozcan la estrategia
decidida por el otro al momento de elegir su estrategia. En otras palabras, los jugadores
deciden sus estrategias con información imperfecta.
Los jugadores son racionales en el sentido que buscan maximizar sus ganancias.
7
Apuntes de Teoría de Juegos
1. Todos los jugadores conocen la función de ganancias; cada jugador sabe que todos
conocen las funciones de ganancias; y todos los jugadores saben que todos los
jugadores saben que todos los jugadores conocen las funciones de ganancias.
2. Los jugadores son racionales; los jugadores saben que todos los jugadores son
racionales; y los jugadores saben que todos los jugadores saben que todos los
jugadores saben que son racionales.
8
Apuntes de Teoría de Juegos
Instrucciones: Suponga un juego entre dos jugadores. Ambos jugadores deben decidir
de manera simultánea entre la estrategia α y la estrategia β. Las ganancias de cada uno
dependen de la combinación de estrategias:
1.- Si el jugador uno elige α y el jugador dos elige β, el jugador uno obtendrá una nota A
y el jugador dos obtendrá una nota C.
2.- Si ambos jugadores eligen la estrategia α, ambos obtendrán una nota B-.
3.- Si ambos jugadores eligen la estrategia β, ambos obtendrán una nota B+.
4.- Si el jugador uno elige β y el jugador dos elige α, el jugador uno obtendrá una nota C
y el jugador dos obtendrá una nota A.
2 2
1 α β 1 α β
α B- A α B- C
β C B+ β A B+
9
Apuntes de Teoría de Juegos
2
1 α β
α B-,B- A,C
β C,A B+,B+
Figura 2.3
Note en primer lugar, que estas matrices son de resultados y no de ganancias (recuerde
que las ganancias deben ser expresadas en números). Por lo tanto, aún no hemos
representado el juego ya que falta la tercera condición.
10
Apuntes de Teoría de Juegos
Ahora que se han valorizado los resultados, se tienen los tres ingredientes necesarios
(los jugadores, las estrategias y las ganancias) para representar el juego en forma
estratégica. Para eso se recurre a la matriz de ganancias:
2
1 α β
α 0,0 3,-1
β -1,3 1,1
Figura 2.5
2.- El número antes de la coma corresponde a la ganancia del jugador uno y el número
después de la coma corresponde a la ganancia del jugador dos.
4.- A cada perfil estratégico le corresponde una ganancia para cada jugador:
11
Apuntes de Teoría de Juegos
Pregunta 2.1
Una estrategia 𝑠𝑖´ está estrictamente dominada por la estrategia 𝑠𝑖" cuando la
desigualdad estricta:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) < 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )
se cumple para toda combinación de estrategias 𝑠−𝑖 (las estrategias del resto de los
jugadores, es decir, de todos los jugadores menos el jugador i).
Se dice que una estrategia 𝑠𝑖´ está débilmente dominada por la estrategia 𝑠𝑖" cuando la
desigualdad débil:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) ≤ 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )
Volviendo a la figura 2.5 se puede concluir que para ambos jugadores la estrategia β
es estrictamente dominada por la estrategia α. Analicemos porqué:
El jugador uno reflexionará: “si el jugador dos juega α entonces me convendrá jugar α y
no β porque la ganancia que obtengo es cero que es mayor que menos uno. Y si el jugador
dos juega β entonces me convendrá jugar α y no β porque la ganancia que obtengo es tres
que es mayor que uno”.
12
Apuntes de Teoría de Juegos
Analice en segundo lugar al jugador dos. Éste reflexionará: “si el jugador uno juega α
entonces me convendrá jugar α y no β porque la ganancia que obtengo es cero que es
mayor que menos uno. Y si el jugador uno juega β entonces me convendrá jugar α y no β
porque la ganancia que obtengo es tres que es mayor que uno”.
Ahora bien, si el jugador uno “se pone en los zapatos” del jugador dos, reflexionará que
éste, que es un jugador racional que busca maximizar sus ganancias, no jugará nunca la
estrategia β porque la ganancia que obtiene al jugar aquella estrategia es menor que la
que obtendría al jugar la estrategia α, independientemente de lo que él juegue.
Al mismo tiempo, si el jugador dos “se pone en los zapatos” del jugador uno, reflexionará
que éste tampoco jugará la estrategia β porque la ganancia que obtiene al jugar aquella
estrategia es menor que la que obtendría al jugar la estrategia α, independientemente
de lo que él juegue.
Esta conclusión permite desarrollar un método para resolver algunos tipos de juegos.
El método consiste en la eliminación iterada de estrategias dominadas.
13
Apuntes de Teoría de Juegos
2
1 α β
3,-1
α 0,0
β -1,3 1,1
Figura 2.6
De esta forma, al eliminar las estrategias que nunca se jugarán el juego se puede, en
primer lugar, representar de una forma mucho más sencilla y, en segundo lugar,
permite obtener una solución.
2
1 α
α 0,0
Figura 2.6.1
La solución del juego es el perfil estratégico {α, α} que lleva asociado una ganancia de
(0, 0). Cuando, luego de eliminar de manera iterada todas las estrategias dominadas
sobrevive sólo un perfil estratégico dicho perfil es un equilibrio de Nash.
14
Apuntes de Teoría de Juegos
Note que la solución del juego es una solución sub óptima: ambos jugadores podrían
estar mejor si el equilibrio hubiese sido {β, β}. Las ganancias asociadas a dicho
equilibrio hubiesen sido (1, 1) mayores a (0, 0).
Una característica fundamental del equilibrio {β, β}, que se puede considerar un
equilibrio cooperativo, es que es un equilibrio inestable: ambos jugadores tienen
incentivo a desviarse.
El juego que se acaba de analizar pertenece a la familia de los juegos de dilema (del
prisionero). Su principal característica es que la solución es peor para ambos jugadores
que la solución cooperativa (que no es equilibrio de Nash) en la cual cada jugador juega
una estrategia dominada.
Pregunta 2.2.
¿Cómo se pueden lograr equilibrios cooperativos de largo plazo?3
3Para estudiar en profundidad las soluciones cooperativas del dilema del prisionero, revisar Axelrod, R.
(1985).
15
Apuntes de Teoría de Juegos
2
1 L M R
Figura 2.7
Observe en primer lugar que las estrategias del jugador uno son {U, M, D} y las
estrategias del jugador dos son {L, M, R}. Las ganancias de cada uno dependen de la
combinación de estrategias elegidas por ambos jugadores. Por ejemplo, si el jugador
uno elige U y el jugador dos elige R, la ganancia del jugador uno es 6 y la ganancia del
jugador es 2.
Para determinar las estrategias dominadas, comience por el jugador uno de acuerdo al
siguiente razonamiento:
16
Apuntes de Teoría de Juegos
Continúe analizando las posibles estrategias dominadas del jugador dos utilizando el
mismo razonamiento:
Como se supone que el jugador dos es un jugador racional se deduce que no jugará una
estrategia dominada. Por lo tanto, se puede eliminar de su conjunto estratégico la
estrategia M. Al eliminar M, el juego queda representado de la siguiente forma:
17
Apuntes de Teoría de Juegos
2
1 L R
U 4,3 6,2
M 2,1 3,6
D 3,0 2,8
Figura 2.7.1
Como se supone que el jugador uno no jugará una estrategia dominada, el juego se
puede representar de una forma reducida:
18
Apuntes de Teoría de Juegos
2
1 L R
U 4,3 6,2
D 3,0 2,8
Figura 2.7.2
Continúe el proceso:
• Compare U y D. Si el jugador dos juega L, U domina a D. Si el jugador dos juega R, U
domina a D. Por lo tanto, D es una estrategia dominada por U porque
independientemente de lo que juegue el jugador dos (L o R), la ganancia que obtiene
el jugador uno al jugar D es menor que la que obtiene de jugar U.
2
1 L R
U 4,3 6,2
Figura 2.7.3
Continúe:
• Compare L y R. Si el jugador uno juega U, la estrategia L domina a la estrategia R
porque la ganancia de 3 es mayor que 2. Al eliminar esta última estrategia dominada
sobrevive un único perfil estratégico:
2
1 L
U 4,3
Figura 2.7.4
19
Apuntes de Teoría de Juegos
Tarea 2.1.
Compruebe en el juego original que ninguno de los dos jugadores tiene incentivo a
desviarse desde el equilibrio {U, L}.
Ejercicio 2.1: Suponga treinta jugadores que deben elegir, de manera simultánea, es
decir, con información imperfecta, un número entre el uno y el cien. El ganador será
aquel jugador que elija el número más cercano a dos tercios del promedio. Por ejemplo,
si el promedio es 30, el ganador será aquel jugador que haya elegido el número más
cercano a 20 (2/3 por 30 = 20). Por eliminación de estrategias dominadas y “poniéndose
en los pantalones del otro”, resuelva el equilibrio de Nash.
Suponga dos candidatos (jugadores) a una elección popular. Cada candidato debe
decidir entre diez posiciones (estrategias) del espectro político.
1 2 3 4 5 6 7 8 9 10
Ejemplos:
20
Apuntes de Teoría de Juegos
Las ganancias de cada candidato son el porcentaje de votos. Como ambos son
racionales, tienen como objetivo maximizar la votación.
Solución:
Sólo con este paso es suficiente para determinar que, antes de eliminar la posición 1, la
posición 3 no domina a la posición 2. Esto porque la ganancia del candidato uno,
21
Apuntes de Teoría de Juegos
2 3 4 5 6 7 8 9
Hay que aclarar que lo que se eliminó fueron las estrategias 1 y 10. No se eliminan los
votantes que se sienten identificados con dichas posiciones políticas. Esto implica que
el universo electoral sigue siendo el mismo. En este caso, los votantes de la posición 1 y
10, votarán por el candidato que se ubique más cerca de sus preferencias.
Por racionalidad, se deduce que los candidatos no utilizarán las estrategias 2 y 8 porque
son dominadas. En virtud esto, ambas estrategias pueden ser eliminadas.
Si continuamos iterando, las únicas estrategias que sobrevivirán serán las estrategias 5
y 6. En este caso, aquellas estrategias son un equilibrio de Nash.
22
Apuntes de Teoría de Juegos
Suponga que Pat y Cris son dos vendedores de helado (jugadores) que trabajan en la
misma playa. La playa está dividida en nueve sectores. Debido a que necesitan
electricidad, deben decidir de manera independiente y simultánea, donde localizarse.
El día anterior deben llamar a la administración e informar en cual sector se ubicarán
(estrategias).
1 2 3 4 5 6 7 8 9
El precio de los helados es el mismo y cada uno gana una comisión de $25 por helado.
La demanda está estimada en 500 helados por sector. Si un vendedor atiende a un
sector y vende 500 helados, sus ventas serán de $12.500. Como los helados son iguales,
los consumidores deciden comprar en el lugar más cercano al que están ubicados. Si los
consumidores son indiferentes, asuma que comprarán 250 helados a Pat y 250 helados
a Cris.
Por ejemplo:
• Si Pat se localiza en el sector 3 y Cris en el sector 8, entonces Pat venderá a todos los
consumidores localizados en los sectores 1 a 5, y Cris venderá a todos los
consumidores ubicados en los sectores 6 a 9.
Solución:
23
Apuntes de Teoría de Juegos
2 3 4 5 6 7 8
Al igual que en la aplicación anterior se debe recalcar que los consumidores de los
sectores 1 y 9 seguirán comprando helados. Lo que se ha eliminado son dos estrategias
posibles, no porque las estrategias no sigan estando presentes, sino porque suponemos
que jugadores racionales no jugarán estrategias dominadas.
Se observa que independientemente donde se ubique Cris, la ganancia que obtiene Pat
al ubicarse en el sector 3 es mayor que la ganancia que obtiene al ubicarse en el sector
2. Lo mismo se puede deducir respecto a Cris: independientemente donde se ubique
Pat, la ganancia que obtiene al ubicarse en el sector 3 es mayor que la ganancia que
obtiene al ubicarse en el sector 2. Por simetría, se concluye que, para ambos jugadores,
la ganancia de ubicarse en el sector 7 es mayor que la ganancia que tienen de ubicarse
en el sector 8.
24
Apuntes de Teoría de Juegos
3 4 5 6 7
Tarea 2.2
Una compañía aérea pierde dos maletas pertenecientes a dos viajeros diferentes.
Ambas maletas resultan ser idénticas y contienen artículos idénticos. El gerente de la
línea aérea encargada de resolver las reclamaciones de los viajeros explica que la
compañía aérea es responsable por un máximo de $100.000 por maleta (él es incapaz
de averiguar directamente el precio de los artículos), y con el fin de determinar un valor
honesto de tasación de la mercancía, el gerente de reclamaciones separa a los viajeros
para que no puedan acordar nada, y les pide que escriban un valor de la maleta mayor
a $20.000 y menor de $100.000. También les dice, si ambos escriben el mismo número,
él va a tratar ese número como el valor monetario real de las maletas y reembolsará a
los viajeros dicha cantidad. Sin embargo, si uno escribe un número más pequeño que el
otro, este número más pequeño se tomará como el valor verdadero, y cada uno de los
viajeros recibirá esa cantidad junto con una recompensa o un castigo de $20.000: el
viajero que escribió el valor más bajo recibirá el valor más bajo más una recompensa
de $20.000 y la persona que escribió la cantidad más alta recibirá el valor más bajo
menos una deducción de $20.000.
25
Apuntes de Teoría de Juegos
En ocasiones hay juegos en que los jugadores no tienen estrategias dominadas o bien si
las tienen, la eliminación iterada de éstas no permite llegar a un perfil único. En tales
casos, la eliminación de estrategias dominadas pierde eficiencia como método para
encontrar el equilibrio de Nash.
2
1 L C R
Figura 2.8
Observe en primer lugar que el jugador uno no tiene estrategias dominadas. En el caso
del jugador dos, la estrategia C domina a la estrategia R. En tal caso, podemos eliminar
del conjunto estratégico del jugador dos la estrategia R y representar el juego en una
forma reducida:
2
1 L C
T 5,-1 11,3
B 6,4 0,2
Figura 2.8.1
26
Apuntes de Teoría de Juegos
Luego de eliminar la estrategia R, se llega al hecho que ninguno de los dos jugadores
tiene estrategias dominadas. Como es obvio, si no hay estrategias dominadas el método
de la eliminación pierde mucho de su valor.
Una estrategia 𝑠̂𝑖 es una mejor respuesta (𝑅𝑖 ) respecto a la estrategia 𝑠𝑖´ para el jugador
i ante la estrategia 𝑠−𝑖 del resto de los jugadores si se cumple que la ganancia de jugar
𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ :
Ambos procesos funcionan bajo el supuesto de que la estructura del juego (conjuntos
estratégicos y funciones de ganancias) y la racionalidad de los jugadores son de
conocimiento común.
27
Apuntes de Teoría de Juegos
De lo anterior se puede deducir que los jugadores no jugarán una estrategia que no sea
la mejor respuesta a las creencias que tengan acerca de las estrategias del resto de los
jugadores. Además, se debe suponer que los jugadores supondrán que el resto de los
jugadores también jugarán una mejor respuesta.
Para entender mejor el método vuelva a la figura 2.8.1. En esta figura están las
estrategias que sobrevivieron a la eliminación de estrategias dominadas. El método de
la mejor respuesta consiste en:
28
Apuntes de Teoría de Juegos
2
1 L C
T 5,-1 11,3
B 6,4 0,2
Figura 2.8.2
En el juego se han encontrado dos perfiles estratégicos que cumplen con una
característica esencial: las estrategias elegidas por los jugadores constituyen las mejores
respuestas ante las mejores respuestas de los otros jugadores.
En nuestro ejemplo, hay dos equilibrios de Nash. Observe que desde ninguno de los
equilibrios los jugadores tienen incentivo a desviarse.
En un juego G, las estrategias (𝑠1∗ , … , 𝑠𝑛∗ ) son un equilibrio de Nash si, para cada jugador
i, 𝑠𝑖∗ es, al menos, la mejor respuesta a las estrategias especificadas por el resto de los
jugadores tal que:
𝑈𝑖 (𝑠𝑖∗ , 𝑠−𝑖
∗ ∗
) > 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )
∗
Max 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )
𝑠𝑖 ∈ 𝑆𝑖
Quinta conclusión: el equilibrio de Nash entrega una solución más fuerte que el concepto
de estrategias dominadas ya que puede haber estrategias que superen la eliminación y no
29
Apuntes de Teoría de Juegos
ser un equilibrio de Nash; en cambio un equilibrio de Nash implica que las estrategias si
superan la eliminación iterada de estrategias dominadas.
Ejercicio 2.2.
Considere el siguiente juego6:
2
1 L C R
Figura 2.9
Vuelva por un momento al ejemplo 2.1. En aquel ejemplo, los jugadores debían elegir
entre α y β. La combinación de estrategias llevaba asociada diversos resultados para
cada uno de los jugadores:
30
Apuntes de Teoría de Juegos
2
1 α β
α B-,B- A,C
β C,A B+,B+
Figura 2.10
Se decía que aquella representación no constituía un juego porque faltaba uno de los
tres ingredientes necesarios para representar un juego en forma estratégica. El
ingrediente faltante eran las ganancias que debían ser expresadas en números de
manera que pudiesen ordenarse. Aquella tarea se hizo valorando para cada jugador (de
manera arbitraria) los resultados obtenidos7.
En esta sección se supondrá que los jugadores tienen valoraciones diferentes. Antes se
supuso que los jugadores no tenían preocupación por las notas que obtenían los
compañeros. En su curso el profesor Polack (2007) los llama con una nota de humor
“diablos despiadados”.
Ahora supondremos que los jugadores (el profesor Polack los llama “ángeles
indignados”) tienen una legítima preocupación por sus notas, pero también tienen una
preocupación por los resultados que obtienen los compañeros.
En este caso, la ganancia del ángel se ve alterada por alguna emoción como la rabia o la
culpa. La nueva valoración de ganancias se sintetiza en la siguiente figura:
31
Apuntes de Teoría de Juegos
Tenga presente que este es una simulación. Dicho eso, con los resultados valorizados,
el juego se puede representar en forma estratégica.
2
1 α β
α 0,0 -1,-3
β -3,-1 1,1
Figura 2.12
Este juego es totalmente distinto al juego de la figura 2.5. El presente juego tiene tres
características:
3° Uno de los equilibrios es superior en el sentido de que ambos jugadores podrían estar
mejor con el equilibrio {β, β}.
32
Apuntes de Teoría de Juegos
Así como el tipo de juego analizado en la figura 2.5 se conocen como juegos de dilema,
este tipo de juegos se conocen como juegos de coordinación. La principal
característica de los juegos de coordinación es que tienen equilibrios múltiples (más de
un equilibrio de Nash). En general hay dos tipos de juegos de coordinación:
α 1,1 0,0
β 0,0 1,1
Figura 2.13
33
Apuntes de Teoría de Juegos
Ángel
Diablo α β
α 0,0 3,-3
β -1,-1 1,1
Figura 2.14
Observe que:
Tarea 2.3.
Represente y resuelva el juego en que el jugador uno sea un ángel y el jugador dos sea
un diablo.
34
Apuntes de Teoría de Juegos
el delito menor. Son interrogados en celdas separadas. La policía les plantea dos
estrategias: callar y confesar. Ambos saben eso y saben las penas asociadas a cada perfil
estratégico. Si los dos callan serán absueltos del delito principal y serán condenados por
el delito menor (un año de cárcel); si ambos confiesan, serán condenados por el delito
mayor y se les rebajará la pena en un año por confesar (cuatro años de cárcel); y si uno
confiesa y el otro calla, el primero será liberado (cero años de cárcel) y el otro será
condenado (cinco años de cárcel).
2
1 Callar Confesar
Figura 2.15
Considere en primer lugar, que en este juego los jugadores tienen como función objetivo
minimizar sus años de condena. Segundo, la estrategia callar es una estrategia
dominada para ambos jugadores (observe que para ninguno es una mejor respuesta).
ambos sospechosos tienen como estrategia. Tercero, el equilibrio de Nash está en el
perfil estratégico {confesar, confesar}, Cuarto, la solución al juego es un Pareto
ineficiente, es decir, ambos, podrían obtener condenas menores a cuatro años.
35
Apuntes de Teoría de Juegos
2
1 Cine Fútbol
Figura 2.16
Los juegos con la estructura de la batalla de los sexos son una combinación de juegos de
conflicto puro y mutua dependencia.
36
Apuntes de Teoría de Juegos
3. Matching pennies
Dos jugadores están dotados con una moneda y deben escoger de manera simultánea
entre cara y sello. Si ambos escogen lo mismo el jugador uno gana 1 y el jugador dos
pierde 1. Si ambos escogen diferente, el jugador uno pierde uno y el jugador dos gana
1. A continuación, se representa el juego en la forma estratégica:
2
1 Cara Sello
Figura 2.17
Primero, este es un juego que se conoce como de juego de conflicto puro. Un jugador
gana y el otro pierde. También se conocen como juegos de suma cero ya que la suma de
las ganancias es cero. Segundo, ninguno de los dos jugadores tiene estrategias
dominadas. Tercero, no tiene equilibrio de Nash en estrategias puras. Sin embargo,
como se verá más adelante, tiene un equilibrio de Nash en estrategias mixtas.
37
Apuntes de Teoría de Juegos
juego de sustitutos estratégicos. Usted notará que las funciones de mejor respuesta
tienen pendiente negativa.
Los jugadores son dos estudiantes que han sido contratados para una asesoría por un
pequeño empresario. La función de beneficios de la empresa se describe así: “cuatro
veces el esfuerzo del jugador uno más cuatro veces el esfuerzo del jugador dos más
cuatro veces el producto de sus esfuerzos multiplicados por un parámetro b”. El
parámetro b se puede considerar como un elemento que recoge la sinergia que genera
que ambos estudiantes trabajen de manera conjunta como un equipo. Por simplicidad,
suponga que el parámetro b puede ser mayor o igual a cero y menor o igual a ¼ (0 ≤ b
≤ ¼)
Los esfuerzos se medirán de manera individual y cada uno decidirá cuanto esfuerzo,
medido en tiempo, le dedicará a la empresa. El número de horas (estrategias) que le
puede dedicar cada estudiante está en el rango entre cero y cuatro horas.
En síntesis:
38
Apuntes de Teoría de Juegos
Solución:
Cada jugador debe decidir el esfuerzo que le dedicarán al trabajo con el objetivo de
maximizar su función de ganancias:
𝑑𝑈1
= 2 + 2 b 𝑠2 – 2𝑠1
𝑑𝑠1
2 + 2 b 𝑠2 – 2 𝑠̂1 = 0
𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )
donde 𝑠̂1 = 𝑅1 (𝑠2 ) es la función de mejor repuesta del estudiante uno. Observe que su
función depende de la estrategia del estudiante dos y que tiene pendiente (el parámetro
b) positiva.
𝑑𝑈2
= 2 + 2 b 𝑠1 – 2𝑠2
𝑑𝑠2
2 + 2 b 𝑠1 – 2 𝑠̂ 2 = 0
𝑠̂2 = 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )
39
Apuntes de Teoría de Juegos
donde 𝑠̂2 = 𝑅2 (𝑠1 ) es la función de mejor repuesta del estudiante dos. Observe que su
función depende de la estrategia del estudiante uno y que su pendiente (parámetro b)
es positiva.
Los rangos de trabajo que van entre 0 y 1 y entre 2 y 4 son estrategias dominadas. La
mejor respuesta de ambos jugadores estará entre 1 y 2 horas de trabajo, es decir, para
ninguno de los dos será una mejor respuesta trabajar menos de una hora ni tampoco
será una mejor respuesta trabajar más de dos horas.
Note que por eliminación de estrategias dominadas (que nunca serán una mejor
respuesta) el equilibrio converge hasta el punto en que las funciones de mejor
respuesta son iguales. Ese punto es el equilibrio de Nash y se caracteriza porque
ninguno de los dos tiene incentivos a desviarse o de tomar una estrategia distinta
(trabajar más o menos horas en el proyecto).
𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )
𝑠̂ 2= 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )
40
Apuntes de Teoría de Juegos
1
𝑠1∗ = 𝑠2∗ = (1−𝑏)
el resultado depende del valor que tome el parámetro b (recuerde que en términos
matemáticos el parámetro b es la pendiente de las funciones de mejor respuesta). Por
ejemplo:
Pregunta 2.3.
¿Por qué cree que los estudiantes destinan tan pocas horas al proyecto?
Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, los vienen
son sustitutos perfectos.
Suponga que la demanda inversa del bien que las empresas producen está determinada
por la siguiente función:
P(q) = 12 – q, donde q = 𝑞1 + 𝑞2
Las ganancias son los beneficios económicos, es decir, la diferencia entre los ingresos
(I) y los costos totales (C). Los ingresos totales es el producto de lo que produce
(suponga que vende todo lo que produce) y el precio. Por simplicidad suponga que los
costos totales son iguales a cero. Las funciones de ganancias se expresan a continuación:
𝑈1 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞1 − 0
41
Apuntes de Teoría de Juegos
𝑈2 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈2 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞2 − 𝐶2
𝑈2 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞2 − 0
𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2
Solución:
𝑑𝑈1
= 12 − 2𝑞1 − 𝑞2
𝑑𝑞1
12 − 2𝑞1 − 𝑞2 = 0
𝑞2
𝑞̂1 = 𝑅1 (𝑞2 ) = 6 - 2
Donde 𝑞̂1 = 𝑅1 (𝑞2 ) es la función de mejor respuesta de la empresa uno. Note que es
función de la cantidad que decida producir la empresa dos.
42
Apuntes de Teoría de Juegos
𝑑𝑈2
= 12 − 𝑞1 − 2𝑞2
𝑑𝑞2
12 − 𝑞1 − 2𝑞2 = 0
𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 - 2
Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que es
función de la cantidad que decida producir la empresa uno.
Note la línea de colusión. En esta línea las empresas están produciendo entre ambas 6
unidades, que es la cantidad de monopolio. Cuando las empresas se ubican en colusión,
es necesario que estas cooperen para mantenerlo, por lo que se encuentran en un
43
Apuntes de Teoría de Juegos
equilibrio inestable, puesto que existen incentivos para desviarse de estas estrategias
cooperativas, aumentando la cantidad de producción unilateralmente, ya que esto
incrementaría el beneficio individual.
𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 - 2
Suponga que las empresas sólo tienen tres estrategias: producir tres unidades, producir
cuatro unidades o producir seis unidades11, es decir:
• S1 = {3, 4, 6}
• S2 = {3, 4, 6}
44
Apuntes de Teoría de Juegos
Por ejemplo
• 𝑈1 (4, 3) = [12 – (4 + 3)] * 4 = 20
• 𝑈2 (4, 3) = [12 – (4 + 3)] * 3 = 15
Es decir, si la empresa uno decide producir cuatro unidades y la empresa dos decide
producir tres unidades, las ganancias que obtienen son 20 y 15 respectivamente.
Haciendo ejercicio para los nueve perfiles estratégicos Ui (3, 3), Ui (3, 4), Ui (3, 6), Ui (4,
3), Ui (4, 4), Ui (4, 6), Ui (6, 3), Ui (6, 4), Ui (6, 6), el juego se puede representar
estratégicamente:
2
1 3 4 6
Figura 2.20
45
Apuntes de Teoría de Juegos
Tarea 2.4.12
Suponga dos empresas que producen un bien homogéneo. Ambas deben decidir de
manera simultánea que precio cobrarán. Suponga que la función de demanda de la
empresa uno (𝑞1 ) es: 𝑎 − 𝑝1 cuando 𝑝1 > 𝑝2 ; 0 cuando 𝑝1 < 𝑝2 ; y (𝑎 − 𝑝1 )⁄2, cuando 𝑝1
= 𝑝2 . Suponga que no hay costos fijos y que ambas empresas tienen un costo marginal
de c, donde c < 𝑎. Muestre que el único equilibrio de Nash es que ambas empresas
cobran el precio c.
Emilia, Nina y Talía son tres vecinas que deben decidir simultáneamente si contribuyen
(C) o no contribuyen (NC) a la creación de un jardín en el pasaje que viven. Dependiendo
de las contribuciones, el tamaño del jardín será pequeño, mediano o grande. Emilia es
la jugadora uno, Nina la jugadora dos y Talía la jugadora tres. Talía debe decidir una de
las dos matrices. Si elige la matriz I decide contribuir; si decide la matriz II, decide no
contribuir al proyecto.
46
Apuntes de Teoría de Juegos
Nina Nina
Emilia C NC Emilia C NC
• Encuentre las mejores respuestas de Emilia ante las posibles jugadas de Nina:
o En la figura 2.21, si Nina decide contribuir, la mejor respuesta de Emilia es no
contribuir porque la ganancia de 6 es mayor que 5. Si Nina decide no contribuir,
la mejor respuesta de Emilia es no contribuir porque 4 es mayor que 3.
o En la figura 2.22, si Nina decide contribuir, la mejor respuesta de Emilia es no
contribuir porque 4 es mayor que 3. Si Nina decide no contribuir, la mejor
respuesta de Emilia es no contribuir porque 2 es mayor que 1.
• Encuentre las mejores respuestas de Nina ante las posibles jugadas de Emilia:
o En la figura 22.1, si Emilia decide contribuir, la mejor respuesta de Nina es no
contribuir porque 6 es mayor que 5. Si Emilia decide no contribuir, la mejor
respuesta de Nina es no contribuir porque 4 es mayor que 3.
o En la figura 22.2, si Emilia decide contribuir, la mejor respuesta de Nina es no
contribuir porque 4 es mayor que 3. Si Emilia decide no contribuir, la mejor
respuesta de Nina es no contribuir porque 2 es mayor que 1.
• Encuentre las mejores respuestas de Talía ante las combinaciones de estrategias de
Emilia y Nina:
o Si Emilia y Nina deciden contribuir, la mejor respuesta de Talía es no contribuir
(elegir la matriz de la figura 22.2) porque la ganancia de 6 es mayor que 5.
47
Apuntes de Teoría de Juegos
Como se puede observar, el equilibrio de Nash de este juego es {NC, NC, NC} que lleva
asociado ganancias de (2,2,2). Es un equilibrio Pareto dominado ya que las tres
jugadoras hubiesen obtenido ganancias más altas si hubiesen contribuido. Este es un
juego de dilema.
Nina Nina
Emilia C NC Emilia C NC
en caso que Talía contribuya y 2 es mayor que 1 en caso que Talía no contribuya). Se
deduce entonces que la estrategia contribuir está dominada por la estrategia no
contribuir. Como suponemos que Nina es una jugadora racional, sabemos que no jugará
la estrategia contribuir y, por lo tanto, se puede eliminar de su conjunto estratégico. El
juego queda reducido a:
Nina Nina
Emilia NC Emilia NC
NC 4,4,1 NC 2,2,2
Nina
Emilia NC
NC 2,2,2
Talía no contribuye
Figura 2.27
El único perfil estratégico que sobrevivió fue {NC, NC, NC} que constituye un equilibrio
de Nash.
49
Apuntes de Teoría de Juegos
Las tres jugadoras tenían una estrategia dominada. Aquí se comenzó con Emilia y
finalizó con Talía, pero el orden pudiese sido diferente y el resultado el mismo.
Note que las estrategias dominadas “contribuir” no son una estrategia de mejor
respuesta y las estrategias de mejor respuesta de “no contribuir” no son estrategias
dominadas.
2
1 L R
U 5,1 0,2
M 1,3 4,1
D 4,2 2,3
Figura 2.28
3° Cuando el jugador uno tiene una creencia (y le asigna una probabilidad igual a uno a
dicha creencia) sobre lo que jugará el jugador dos, la estrategia D no es nunca una mejor
respuesta.
50
Apuntes de Teoría de Juegos
Con estos antecedentes, el jugador uno puede calcular su ganancia esperada (UE1)
considerando:
1° Sus estrategias
14 Una estrategia es pura cuando la probabilidad que le asigna un jugador a su creencia respecto a
lo que jugará el otro jugador es igual a uno.
15 La suma de las probabilidades debe ser siempre igual a uno. Por lo tanto, las probabilidades están
51
Apuntes de Teoría de Juegos
La ganancia esperada del jugador uno de jugar U con la creencia que el jugador dos
jugará L con probabilidad P2(L):
Por ejemplo, se podría hacer una especulación y suponer que el jugador dos jugará L
con una probabilidad de ½ y, por lo tanto, jugará R con una probabilidad de ½.
La ganancia esperada del jugador uno de jugar U, con la creencia que el jugador dos
jugará L con probabilidad de ½, es:
UE1 (U) vs. [(P2(L), P2(R)] = UE1 (U) vs. [1/2, 1/2) = [(1/2) * 5] + [(1/2) * 0] = 2,5
El mismo ejercicio se puede realizar para calcular las ganancias esperadas del jugador
uno de jugar M o D, dada la creencia arbitraria que el jugador dos jugará L con una
probabilidad de ½:
UE1 (M) vs. [(P2(L), P2(R)] = UE1 (M) vs. (1/2, 1/2) = [(1/2) * 1] + [(1/2) * 4] = 2,5
UE1 (D) vs. [(P2(L), P2(R)] = UE1 (D) vs. (1/2, 1/2) = [(1/2) * 4] + [(1/2) * 2] = 3
Entonces, si la creencia del jugador uno es que el jugador dos jugará L con una
probabilidad de 1/2 (y por lo tanto jugará R con una probabilidad de 1/2), la mejor
respuesta del jugador uno ante esa creencia es jugar D porque la ganancia esperada es
3 mayor a 2,5 que son las ganancias esperadas que obtendría al jugar U o M.
Un punto crucial es cómo se configuran las creencias. Suponga que la creencia del
jugador uno cambia y la probabilidad que le asigna a que el jugador dos juegue L fuese
de 2/3. En tal caso, el cálculo de las ganancias esperadas también cambia haciendo del
proceso de toma de decisiones algo muy complicado y lento.
Con el fin de simplificar y facilitar el proceso de la toma de decisiones, se presenta un
método gráfico – algebraico. Procedimiento:
1° Trace tres líneas que representen las ganancias esperadas del jugador uno para cada
una de sus estrategias (U, M o D). Las ganancias esperadas del jugador uno son función
52
Apuntes de Teoría de Juegos
de la probabilidad que le asigna a que el jugador dos juegue R. Por este motivo, en el eje
de las abscisas (eje X) se representa la variable P2 (R).
• UE1 [U, P2(R)] = [5 * (1 - P2(R))16 + 0 * P2(R)]
Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos juegue
R, es decir: P2(R) = 0, está implícitamente asignando una probabilidad de uno a
que juegue L, es decir: P2(L) = 1. Si este fuese el caso la ganancia esperada del
jugador uno de jugar U ante esa creencia sería 5.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos juegue
R, es decir: P2(R) = 1, está implícitamente asignando una probabilidad de cero a
que juegue L, es decir, P2(L) = 0. Si este fuese el caso la ganancia esperada del
jugador uno de jugar U ante esa creencia sería 0.
• UE1 [M, P2(R)] = [1 * (1 - P2(R)) + 4 * P2(R)]
Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar M ante esa creencia sería 1.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar M ante esa creencia sería 4.
• UE1 [D, P2(R)] = [4 * (1 - P2(R)) + 2 * P2(R)]
Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar D ante esa creencia sería 4.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar D ante esa creencia sería 2.
53
Apuntes de Teoría de Juegos
Para trazar las tres líneas (una para cada estrategia del jugador uno) una los puntos de
las ganancias esperadas cuando las probabilidades que el jugador dos juega R sean cero
y uno.
2° Las líneas se cruzan en tres puntos (sólo dos puntos son relevantes, ¿por qué?).
Dichos cruces implican que la ganancia esperada del jugador uno es la misma. Si la
ganancia esperada es la misma, el jugador uno debe ser indiferente entre las dos
estrategias. El objetivo es encontrar la probabilidad que el jugador dos juegue R que
hace que las dos estrategias del jugador uno, sean indiferentes.
Para determinar una política de decisión para el jugador uno proceda, sólo con los
puntos relevantes, de la siguiente manera:
a) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno sea
indiferente entre jugar U o D. Como se dijo, si son indiferentes, las ganancias
esperadas son iguales:
P2(R) = 1/3
54
Apuntes de Teoría de Juegos
Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará R es
igual a 1/3, el jugador uno será indiferente entre jugar U o D porque la ganancia
esperada es igual.
b) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno sea
indiferente entre jugar M o D:
P2(R)) = 3/5
Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará R es
igual a 3/5, el jugador uno será indiferente entre jugar M o D porque la ganancia
esperada es la misma.
3° Generar una política de decisión para el jugador uno en función de las creencias
sobre las estrategias del jugador dos:
55
Apuntes de Teoría de Juegos
Definición: una estrategia 𝑠̂ 𝑖 es una mejor respuesta del jugador i (𝑅𝑖 ), respecto a la
creencia p (donde p representa la distribución de probabilidades) acerca de las
elecciones del resto de los jugadores (-i), si se cumple que la ganancia esperada de jugar
𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ para toda combinación de probabilidades de las
estrategias 𝑆−𝑖 (las estrategias de todo el resto de los jugadores, es decir, de todos los
jugadores menos el jugador i):
Ejercicio 2.3
De acuerdo al siguiente juego:
2
1 C S
C 1,2 0,0
S 0,0 2,1
B -1,4 3,1
Figura 2.30
56
Apuntes de Teoría de Juegos
Para que el par de estrategias mixtas {𝑝1∗ , 𝑝2∗ } sea un equilibrio de Nash se deben
satisfacer dos condiciones:
Condición 1: 𝑈𝐸1 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸1 {𝑝1 , 𝑝2∗ }, para cada distribución de probabilidad de
p1 sobre S1, y
Condición 2: 𝑈𝐸2 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸2 {𝑝1∗ , 𝑝2 }, para cada distribución de probabilidad de
p2 sobre S2.
En la figura 2.31 se reproduce la batalla de los sexos representada en la figura 2.16. Una
pareja se pone de acuerdo para salir al día siguiente después del trabajo. Las estrategias
son ir al cine (C) o ir al fútbol (F). Cuando llega la tarde del día siguiente, ambos se dan
cuenta que no habían coordinado el lugar en el que se reunirían. Por lo tanto, cada uno
de manera simultánea, con información imperfecta, debería decidir si iba al fútbol o iba
al cine. Ambos prefieren ir al mismo sitio porque desean estar juntos, sin embargo, la
novia prefiere el cine y el novio el fútbol.
57
Apuntes de Teoría de Juegos
En estrategias puras, el juego tiene dos equilibrios de Nash: {Cine, Cine} y {Fútbol,
Fútbol}. En adelante, se procederá a encontrar el equilibrio de Nash en estrategias
mixtas17.
2
1 C F
C 2,1 0,0 p
q 1-q
Q
Figura 2.31
• P es la mezcla con que el jugador uno está jugando C y F. La estrategia mixta del
jugador uno es (p, 1 – p), es decir, jugar C con una probabilidad de p y jugar F con
una probabilidad de 1 – p.
17 Aunque todos los juegos tienen equilibrio de Nash en estrategias puras y/o mixtas, hay juegos que
tienen equilibrio de Nash sólo en estrategias puras (como los juegos de dilema); hay otros que tienen
equilibrios de Nash sólo en estrategias mixtas (como los juegos de conflicto puro); hay otros juegos
que tienen equilibrios de Nash en estrategias puras y estrategias mixtas (como los juegos de
negociación).
58
Apuntes de Teoría de Juegos
• Q es la mezcla con que el jugador dos está jugando C y F. La estrategia mixta del
jugador dos es (q, 1 – q), es decir, jugar C con una probabilidad de q y jugar F con
una probabilidad de 1 – q.
El jugador uno cree que el jugador dos jugará C con una probabilidad q y que jugará F
con una probabilidad 1 – q.
El jugador dos cree que el jugador uno jugará C con una probabilidad p y que jugará F
con una probabilidad 1 – p.
Solución:
1° Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente entre ir al
cine o al fútbol.
2q = 1 – q
q = 1/3
Para el jugador uno, las estrategias cine y fútbol son indiferentes, si el jugador dos va al
cine con una probabilidad de q = 1/3 y al fútbol con una probabilidad 1 – q = 2/3.
59
Apuntes de Teoría de Juegos
¿Cuál es la ganancia esperada del jugador uno al jugar C contra la estrategia mixta del
jugador dos Q = (1/3, 2/3)? ¿Cuál es la ganancia esperada del jugador uno al jugar F
contra la estrategia mixta del jugador dos Q = (1/3, 2/3)?
Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/3, 2/3), las
ganancias esperadas del jugador uno al jugar cine o fútbol son iguales.
Pregunta 2.4
¿Cuál sería la mejor respuesta del jugador uno si su creencia fuese que el jugador dos
jugará C con una probabilidad mayor a 1/3? ¿Cuál sería la mejor respuesta del jugador
uno si su creencia fuese que el jugador dos jugará C con una probabilidad menor a 1/3?
2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre ir al
cine o al fútbol.
p = 2/3
Para el jugador dos, las estrategias cine y fútbol son indiferentes, si el jugador uno va al
cine con una probabilidad de p = 2/3 y al fútbol con una probabilidad 1 – p = 1/3.
60
Apuntes de Teoría de Juegos
¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta del
jugador uno P = (2/3, 1/3)? ¿Cuál es la ganancia esperada del jugador dos al jugar F
contra la estrategia mixta del jugador uno P = (2/3, 1/3)?
Queda comprobado entonces que si el jugador uno jugara la mezcla P = (2/3, 1/3), las
ganancias esperadas del jugador al jugar cine o fútbol dos son iguales.
Pregunta 2.5
¿Cuál sería la mejor respuesta del jugador dos si su creencia fuese que el jugador uno
jugará C con una probabilidad mayor a 2/3? ¿Cuál sería la mejor respuesta del jugador
dos si su creencia fuese que el jugador uno jugará C con una probabilidad menor a 2/3?
Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (2/3,
1/3) versus la estrategia mixta Q= (1/3, 2/3) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta Q del
jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.
61
Apuntes de Teoría de Juegos
Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/3,
2/3) versus la estrategia mixta P= (2/3, 1/3) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta P del
jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.
6° En conclusión, el juego tiene tres equilibrios de Nash {C, C}, {F, F} y {(2/3, 1/3), (1/3,
2/3)} con sus respectivas ganancias (2, 1), (1, 2) y (2/3, 2/3).
Pregunta 2.6
¿Por qué los jugadores podrían aleatorizar sus estrategias si las ganancias que obtienen
de sus estrategias mixtas son tan pobres, incluso comparadas con la ganancia más baja
de los equilibrios en estrategias puras?
2
1 C S
C 1,-1 -1,1 p
q 1-q
Q
62
Apuntes de Teoría de Juegos
Figura 2.32
Solución:
1° Encontrar la mezcla Q = (q, 1 – q) del jugador dos que hace al jugador uno indiferente
entre jugar cara o sello.
Para el jugador uno, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:
4q = 2
q = 1/2
Para el jugador uno, las estrategias cara y sello son indiferentes si el jugador dos elige
cara con una probabilidad de q = 1/2 y elige sello con una probabilidad 1 – q = 1/2.
¿Cuál es la ganancia esperada del jugador uno al jugar cara contra la estrategia mixta
del jugador dos Q = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador uno al jugar
sello contra la estrategia mixta del jugador dos Q = (1/2, 1/2)?
63
Apuntes de Teoría de Juegos
Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/2 1/2), las
ganancias esperadas del jugador uno al jugar cara o sello son iguales.
2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre jugar
cara o sello.
Para el jugador dos, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta P del jugador uno) son iguales, es decir, si:
p = 1/2
¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta del
jugador uno P = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador dos al jugar S
contra la estrategia mixta del jugador uno P = (1/2, 1/2)?
64
Apuntes de Teoría de Juegos
Queda comprobado entonces que si el jugador uno jugara la mezcla P = (1/2 1/2), las
ganancias esperadas del jugador dos de jugar cara o sello son iguales.
UE1 (P, Q) = 0
Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (1/2,
1/2) versus la estrategia mixta Q = (1/2, 1/2) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta Q del
jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.
UE2 (P, Q) = 0
Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/2,
1/2) versus la estrategia mixta P = (1/2, 1/2) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta P del
jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.
65
Apuntes de Teoría de Juegos
Ejercicio 2.4.
Encuentre el o los equilibrios de Nash en estrategias puras y estrategias mixtas del
juego de cachipún representado en su forma estratégica en la siguiente figura:
2
1 Roca Tijera Papel
Figura 2.33
66
Apuntes de Teoría de Juegos
Capítulo Tres
Juegos Dinámicos
3.1. Objetivos del capítulo
67
Apuntes de Teoría de Juegos
Al igual que en el capítulo dos se supone que: (1) los jugadores tienen información
completa, es decir, conocen la función de ganancias de cada jugador; (2) los jugadores
son racionales en el sentido que buscan maximizar sus ganancias, y (3) los jugadores
tienen conocimiento común respecto a las funciones de ganancias y a la racionalidad.
1° Conjunto de jugadores.
2° El orden del juego representado por un árbol; quien mueve, cuando mueve.
3° La información que poseen los jugadores al momento de mover y elegir sus acciones.
4° El conjunto de posibles acciones que tiene cada jugador.
5° Las ganancias como función del desarrollo del juego.
Un árbol es una colección finita de nodos con una relación entre ellos que se expresa en
su conexión mediante ramas. Entre los nodos hay una relación de precedencia. Para la
construcción del árbol, se establecen dos supuestos:
68
Apuntes de Teoría de Juegos
Luego de los nodos terminales se deben especificar las ganancias de cada jugador
asociadas a las secuencias de movimientos que culminan en un nodo terminal.
Los nodos están conectados por ramas que representan acciones. De cada nodo pueden
surgir múltiples ramas. Un perfil estratégico es una secuencia de nodos conectados por
ramas que (1) comienzan en el nodo inicial, (2) finaliza en un nodo terminal y (3) tiene
la propiedad que los nodos sucesores son nodos sucesivos en la secuencia. Cada perfil
estratégico es un camino a través de las ramas del árbol.
Subjuegos
69
Apuntes de Teoría de Juegos
Note que:
1.- El juego G es siempre un subjuego de G.
2.- Se llaman subjuegos propios de G a aquellos subjuegos que no coinciden con G, es
decir, que no comienzan en el nodo inicial de G.
3.- Si G es un juego de información perfecta, cualquier parte que comience en un nodo
de decisión y contenga todos los nodos que le suceden es un subjuego.
4.- También se considera un subjuego a aquellos en que sólo intervendrá un solo
jugador.
70
Apuntes de Teoría de Juegos
1° Se identifican todos los subjuegos propios que se producen en el último estado del
juego, es decir, aquellos que comienzan en los últimos nodos de decisión antes de los
nodos terminales de cada perfil estratégico.
2° Estos subjuegos tienen un solo jugador. Se asume que jugadores racionales jugarán
las acciones con las que maximizan su ganancia por lo que la acción elegida es un
equilibrio de Nash.
3° En la medida que se van resolviendo, los subjuegos se van eliminando (el árbol se va
podando), quedando el nodo de decisión como nodo terminal y se le atribuyen las
ganancias asociadas a la acción óptima.
4° Al hacer esto el árbol se va reduciendo. El proceso continúa hasta llegar al nodo
inicial del juego global.
Ejemplo 3.1
Resuelva el siguiente juego por inducción hacia atrás.
El juego comienza con el jugador uno que debe decidir si juega L o R. Si juega L le
corresponde el turno al jugador dos, que debe decidir entre a o b. Si decide la acción a
el juego termina con ganancias de 5 para el jugador uno y de 2 para el jugador dos. Si
decide la acción b el juego termina con ganancias de 3 para el jugador uno y de 1 para
el jugador dos. Si el jugador uno, decide R, le corresponde al jugador dos que debe
71
Apuntes de Teoría de Juegos
decidir entre c o d. Si juega c, el juego termina con ganancias de 4 para el jugador uno y
de 1 para el jugador dos. Si el jugador dos, juega d, le corresponde jugar nuevamente al
jugador uno, quien debe decidir entre S o T. Si decide la acción S el juego termina con
ganancias de 1 para el jugador uno y de 2 para el jugador dos. Si decide la acción T el
juego termina con ganancias de 0 para el jugador uno y de 3 para el jugador dos.
Solución
2° Se va a los dos últimos subjuegos (aquel que comienza en los últimos nodos de
decisión) y se asume que el jugador dos jugará una acción óptima.
En estos nodos, si el jugador uno decide L, el jugador dos debe decidir entre a o b. Por
racionalidad elegirá a porque la ganancia de 5 es mayor que 3.
72
Apuntes de Teoría de Juegos
Si el jugador uno decide R, el jugador dos debe decidir entre c o d. Por racionalidad
elegirá d porque anticipa que si juega aquella opción, el jugador uno elegirá S y la
ganancia que obtendrá es 2 que es mayor que 1.
Una vez resueltos estos dos subjuegos, se representa el juego en una forma más
reducida, donde el jugador deberá decidir si juega L o R:
3° El jugador uno debe resolver cómo comienza el juego. Para determinar su decisión
ha ido resolviendo todos los subjuegos propios asumiendo que el jugador dos decidirá
con racionalidad y asumiendo que el jugador dos asume que él decidirá con
racionalidad. Bajo estos supuestos, el jugador uno jugará L porque la ganancia que
obtendrá es 5 que es mayor que 2 si jugará R.
La clave en el método de la inducción hacia atrás es que los jugadores pueden anticipar
las posteriores decisiones. El jugador uno anticipa lo que jugará el jugador dos con
cualquiera de sus dos acciones iniciales y el jugador sabe que el jugador uno anticipará su
jugada. Luego el jugador decide, anticipando lo que jugará el jugador uno y el jugador
uno sabe que el jugador anticipará su jugada posterior.
En consecuencia, la solución del juego por inducción hacia atrás es {(L, S), (a, d)}: el
jugador uno jugaría L en su primer nodo de decisión y S en su segundo nodo de decisión.
73
Apuntes de Teoría de Juegos
Note que, si el jugador uno juega L, el jugador dos no deberá decidir entre c y d. No
obstante, en la solución se debe registrar lo “que haría si” el juego llegará a ese nodo.
Este modelo es una variante de Cournot. La diferencia crucial es que los jugadores
juegan de manera secuencial.
Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, son
sustitutos perfectos. Las empresas deben decidir cuánto producir (estrategias) de
manera secuencial, es decir, la empresa líder (jugador uno) decide primero, la empresa
74
Apuntes de Teoría de Juegos
seguidora (empresa dos) observa la decisión de la empresa líder, y luego decide cuánto
producir
Suponga que la demanda inversa del bien que las empresas producen está determinada
por la siguiente función:
𝑃(𝑞) = 12 − 𝑞, donde 𝑞 = 𝑞1 + 𝑞2
Solución:
Como este es un juego dinámico de información completa y perfecta, se utilizará el
método de inducción hacia atrás, es decir, se comenzará por la empresa dos que es
aquella que debe decidir en los nodos previos a los nodos terminales:
1° Encontrar la función de mejor respuesta de la empresa dos. Como se supone que la
empresa es racional y que tiene como objetivo la maximización de sus ganancias,
planteamos el problema como un problema de optimización:
𝑀𝑎𝑥 𝑈2 (𝑞1 , 𝑞2 ) = 𝑀𝑎𝑥[12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2
𝑞2 𝑞2
Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que es
función de la cantidad que decida producir la empresa uno.
75
Apuntes de Teoría de Juegos
Observe que la empresa uno considera la respuesta de la empresa dos como un dato. La
función de ganancias de la empresa uno se expresa a continuación:
𝑈1 (𝑞1 , 𝑞̂2 ) = [12 − (𝑞1 + 𝑞̂2 )] ∗ 𝑞1
𝑈1 (𝑞1 , 𝑞̂2 ) = 12 𝑞1 − 𝑞12 − 𝑞1 ∗ 𝑞̂2
𝑞1
𝑈1 (𝑞1 , 𝑞̂2 ) = 12 𝑞1 − 𝑞12 − 𝑞1 ∗ (6 − )
2
𝑞12
𝑈1 (𝑞1 , 𝑞̂2 ) = 6 𝑞1 −
2
Observe que la función de ganancias de la empresa uno depende sólo de su decisión y
no de la decisión de la empresa dos.
𝑞12
𝑀𝑎𝑥 𝑈1 (𝑞1 , 𝑞̂2 ) = 𝑀𝑎𝑥 6 𝑞1 −
2
𝑞1 𝑞1
e igualar a cero:
𝑞1 = 6
𝑞1
Si, 𝑞1 = 6 y 𝑞2 = 6 − , entonces: 𝑞2 = 3
2
76
Apuntes de Teoría de Juegos
Por inducción hacia atrás la solución es que la empresa líder decide producir seis
unidades. Esta decisión la toma luego de anticipar que la mejor respuesta de la empresa
dos sería producir cuatro unidades si ésta produce tres; cuatro unidades si ésta produce
cuatro y tres unidades si ésta decidiese producir seis.
77
Apuntes de Teoría de Juegos
La solución del juego por inducción hacia atrás es {R, (R´, L´)}, es decir, si el juego llega
al primer nodo de decisión del jugador dos, luego de que el jugador uno jugara L, su
mejor respuesta sería jugar R´. Si el juego llega al segundo nodo de decisión del jugador
dos, luego de que el jugador uno jugara R, su mejor respuesta sería jugar L´. El jugador
uno que anticipa las mejores respuestas del jugador dos, jugaría al comienzo del juego,
la estrategia R:
78
Apuntes de Teoría de Juegos
• El jugador uno tiene un nodo de decisión y tiene dos acciones (L o R). Por lo tanto,
tiene dos estrategias.
• El jugador dos tiene dos nodos de decisión y tiene dos acciones en cada nodo (L´ o
R´). Por lo tanto, tiene cuatro estrategias:
o Estrategia 1: (L´, L´): si el jugador uno juega L, entonces juega L´. Si el jugador uno
juega R, entonces juega L´.
o Estrategia 2: (L´, R´): si el jugador uno juega L, entonces juega L´. Si el jugador
uno juega R, entonces juega R´.
o Estrategia 3: (R´, L´): si el jugador uno juega L, entonces juega R´. Si el jugador
uno juega R, entonces juega L´.
o Estrategia 4: (R´, R´): si el jugador uno juega L, entonces juega R´. Si el jugador
uno juega R, entonces juega R´.
Cada estrategia del jugador dos le indica una acción a seguir en caso que tuviese que
decidir.
La representación del juego en forma estratégica se ilustra a continuación:
2
1 (L´, L´) (L´, R´) (R´, L´) (R´, R´)
79
Apuntes de Teoría de Juegos
80
Apuntes de Teoría de Juegos
La solución por inducción hacia atrás sugiere que al comienzo del juego el jugador uno
juega L y el juego termina con ganancias de 2 y 0 respectivamente.
2
1 L´ R´
L, L” 2,0 2,0
L, R” 2,0 2,0
R, L” 1,1 3,0
R, R” 1,1 0,2
Figura 3.5.219
19 Note que las dos primeras filas son redundantes porque expresan las mismas ganancias. El motivo
es que, si el jugador uno juega L al comienzo de juego, éste finaliza. No obstante, debido a la
definición de estrategia que se ha adoptado como un plan de acción en todas las contingencias o
nodos de decisión, es necesario escribirla pese a su no plausibilidad. El razonamiento es “que haría
si…”. A lo largo del documento se continuará representando de esta forma a pesar de que existe una
forma reducida de presentar (para detalles sobre como representar la matriz en una forma reducida
ver Osborne y Rubinstein.
81
Apuntes de Teoría de Juegos
El juego tiene dos equilibrios de Nash: {(L, L”), L´} y {(L, R”), L´}. Sólo el equilibrio {(L,
L”), L´} induce un equilibrio de Nash en cada subjuego. En efecto, este equilibrio es
consistente con la solución por inducción hacia atrás. El segundo equilibrio es no
plausible porque descansa en una amenaza no creíble: que el jugador uno jugará R” en
su segundo nodo de decisión.
Tarea 3.1
Represente el juego de Stackelberg con variables discretas en forma estratégica. Pista:
La empresa uno tiene tres estrategias y la empresa dos tiene 9 estrategias.
82
Apuntes de Teoría de Juegos
Solución:
1° Encontrar los equilibrios de Nash del subjuego 1: El subjuego 1, es aquel que
comienza en el segundo nodo de decisión del jugador uno. La representación extensiva
y estratégica del subjuego se presenta a continuación:
83
Apuntes de Teoría de Juegos
3° Encontrar los equilibrios de Nash del juego completo: El último subjuego es el juego
completo, es decir, aquel que comienza en el nodo inicial. La representación extensiva
y estratégica del subjuego se presenta a continuación:
4° Se analizan los tres equilibrios de Nash con el objetivo de determinar cuál o cuáles
son equilibrios de Nash perfecto en subjuegos:
• El primer equilibrio es un equilibrio perfecto porque induce un equilibrio de
Nash en los dos subjuegos. Señala que el equilibrio de Nash en el primer
subjuego es u y que el equilibrio de Nash en el segundo subjuego es [u, l].
• El segundo equilibrio no es un equilibrio perfecto porque a pesar que señala que
el equilibrio de Nash en el primer subjuego es u; señala que el equilibrio de Nash
en el segundo subjuego es [u, r], el cual no es un equilibrio de Nash, ya que, si el
jugador uno juega u, la mejor respuesta del jugador dos es l y si el jugador dos
juega r, la mejor respuesta del jugador uno es d.
• El tercer equilibrio no es un equilibrio perfecto porque señala que el equilibrio
de Nash en el primer subjuego es d, la que no es una mejor respuesta del jugador
uno en ese nodo de decisión. Esta es una condición suficiente para concluir que
no es un equilibrio de Nash perfecto a pesar que señala que en el segundo
subjuego el equilibrio de Nash es [d, r], el cual efectivamente es uno de los dos
84
Apuntes de Teoría de Juegos
5° Resolver por inducción hacia atrás: se decía que el método de la inducción hacia atrás
elimina las respuestas que no son equilibrios de Nash. En el juego la solución es: {(Uu),
l}, es decir, el jugador uno juega U en el primer nodo de decisión y u en su segundo nodo
de decisión. El jugador dos en tanto, juega l en su nodo de decisión.
Ejercicio 3.1
Instrucciones: J1 elige U o D, donde D termina el juego con ganancia de 3 para J1 y 2
para J2. Si J1 eligió U entonces J2 elige L o R, donde R finaliza el juego con ganancias de
2 para J1 y 3 para J2. Si J2 elige L entonces J1 elige entre u y d, y el juego finaliza. Si elige
85
Apuntes de Teoría de Juegos
2
1 l m r
86
Apuntes de Teoría de Juegos
En una representación extensiva, la línea discontinua que une los nodos de decisión
denota la simultaneidad del juego.
En la primera representación, esto quiere decir que el jugador dos sabe que el jugador
uno jugó, pero no sabe que jugó, es decir, no sabe en cuál de sus dos nodos está. En la
segunda representación, el jugador uno sabe que el jugador dos jugó, es decir, sabe que
el juego está en su conjunto de información, pero no sabe en cuál de sus tres nodos de
decisión está.
87
Apuntes de Teoría de Juegos
En este tipo de juegos, una estrategia es un completo plan de acción que específica una
acción para el jugador en cada conjunto de información en que pueda ser llamado a
decidir.
1° Cada conjunto de información contiene nodos de decisión para sólo uno de los
jugadores.
2° Todos los nodos en un conjunto de información deben contener el mismo número de
sucesores inmediatos.
3° Los nodos deben tener el mismo conjunto de acciones disponibles en las ramas que
llevan a los sucesores.
Ejemplo 3.2.
Resolviendo por inducción hacia atrás el argumento es que el jugador uno no elige U o
M porque su elección será observada por el jugador dos, y éste elegirá d o u y la
88
Apuntes de Teoría de Juegos
ganancia del jugador uno será 0. Jugador uno elegirá D porque anticipa que el jugador
dos elegirá u y por lo tanto tendrá una ganancia de 1 que es mayor que 0.
Ahora, si el jugador uno eligió D, el jugador dos sabe en que nodo está. Sin embargo, si
el jugador uno eligió U o M el jugador dos no sabe en que nodo está, es decir, no sabe si
el jugador uno eligió U o M y el jugador uno sabe que el jugador dos no sabe en que nodo
está. En este caso ya no es tan obvio que el jugador uno juegue D. El jugador uno podría
pensar que el jugador dos mezclará sus acciones (estrategias mixtas), por ejemplo,
jugando ½ de las veces u y ½ de las veces d y, por lo tanto, la ganancia esperada del
jugador uno producto de la estrategia mixta del jugador dos será 2 que es mayor que 1
que es la ganancia que obtendría al jugar D.
89
Apuntes de Teoría de Juegos
Ejemplo 3.3.
Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego20:
Solución:
1° Resuelva los dos subjuegos propios:
90
Apuntes de Teoría de Juegos
2° Una vez que se ha determinado cómo se jugará en cada uno de los subjuegos propios,
el jugador uno se enfrenta a la decisión de jugar I, C o D, que le producirían ganancias
de 6, 5 o 2, respectivamente. Represente el juego en forma reducida y resuelva por
inducción hacia atrás:
91
Apuntes de Teoría de Juegos
Ejercicio 3.4
Observe que este juego denota el problema con el método de la inducción hacia atrás.
El último subjuego propio es un juego de suma cero, sin estrategias dominadas ni
equilibrio de Nash en estrategias puras.
Solución:
92
Apuntes de Teoría de Juegos
2
1 C D
C 2, -2 -2, 2 p
D -2, 2 2, -2 1–p
q 1-q
Q
Figura 3.11.1
2.1 Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente entre
jugar cara o sello y calcular las ganancias esperadas:
q = 1/2
Para el jugador uno, las estrategias C y D son indiferentes, si el jugador dos elige C con
una probabilidad de q = 1/2 y elige D con una probabilidad 1 – q = 1/2.
Ganancias esperadas:
93
Apuntes de Teoría de Juegos
2.2 Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre
jugar C o D.
p = 1/2
Ganancias esperadas:
2.3 Determinar las ganancias esperadas de ambos jugadores al jugar las mezclas P y
Q:
UE1 (P, Q) = 0
UE2 (P, Q) = 0
94
Apuntes de Teoría de Juegos
4° El equilibrio de Nash perfecto en subjuegos es {[R, (1⁄2 , 1⁄2)], [L, (1⁄2 , 1⁄2)]}. Este
equilibrio indica que el jugador uno jugará R en su primer nodo de decisión y jugará A
con una probabilidad de 1⁄2 y jugará B con una probabilidad de 1⁄2 si el juego llega a su
segundo nodo de decisión. El jugador dos por su parte, jugará L en su primer nodo de
decisión y jugará C con una probabilidad de 1⁄2 y jugará D con una probabilidad de 1⁄2
si el juego llega a su segundo nodo de decisión.
La predicción del desarrollo del juego es que el jugador uno jugará R y luego terminará
con la decisión del jugador dos jugando L. Este equilibrio trae asociadas ganancias de 3
y 1, respectivamente.
Ejercicio 3.5
95
Apuntes de Teoría de Juegos
Solución:
2
1 A B
A -2, -2 4, 2
B 1, 4 -1, -1
Figura 3.12.1
Note que este subjuego tiene dos equilibrios de Nash: (A, B) y (B, A).
96
Apuntes de Teoría de Juegos
2° Reemplazar en el árbol original las ganancias asociadas a los dos equilibrios de Nash
y resolver por inducción hacia atrás:
3° El juego tiene dos equilibrios de Nash perfectos: {DA, B} y {IB, A}. Si (A, B) es el
equilibrio de Nash que se supone se jugará en el subjuego, la elección óptima del jugador
uno al comienzo del juego sería jugar D. Si (B, A) es el equilibrio de Nash que se supone
se jugará en el subjuego, la elección óptima del jugador uno al comienzo del juego sería
jugar I y terminar el juego.
97