Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Apuntes Docentes de Teor - A de Juegos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 98

TEORÍA DE JUEGOS

Apuntes docentes

Rodrigo Carrasco Gaubert


@ Todos los derechos reservados
Apuntes de Teoría de Juegos

Contenidos

Capítulo 1: Introducción

1.1. Qué es la teoría de juegos


1.2. Objetivos
1.3. Estructura del documento

Capítulo 2: Juegos simultáneos

2.1. Objetivos del capítulo


2.2. Aprendizajes esperados
2.3. Lecturas esenciales
2.4. Lecturas opcionales
2.5. Introducción al capítulo dos
2.6. Representación normal o estratégica de un juego simultáneo
2.7. Estrategias dominadas
2.8. Eliminación iterada de estrategias dominadas
2.9. Aplicaciones sobre eliminación iterada de estrategias dominadas
2.10. El método de la mejor respuesta
2.11. Juegos de coordinación
2.12. Revisión de algunos de los juegos más conocidos
2.13. Aplicaciones sobre el equilibrio de Nash
2.14. Juegos de tres jugadores
2.15. Introducción a las estrategias mixtas
2.16. Equilibrio de Nash en estrategias mixtas

Capítulo 3: Juegos dinámicos

3.1. Objetivos del capítulo


3.2. Aprendizajes esperados
3.3. Lecturas esenciales
3.4. Lecturas opcionales

1
Apuntes de Teoría de Juegos

3.5. Introducción al capítulo tres


3.6. Representación extensiva de un juego dinámico
3.7. Inducción hacia atrás
3.8. Aplicación sobre el método de inducción hacia atrás
3.9. Representación estratégica de juegos dinámicos
3.10. Equilibrio de Nash perfecto en subjuegos
3.11. Juegos dinámicos con información imperfecta

2
Apuntes de Teoría de Juegos

Capítulo Uno

Introducción
1.1.- Qué es la teoría de juegos

La teoría de juegos es una disciplina que tiene como objetivo principal el estudio de
decisiones multipersonales, es decir, cuando la decisión de una persona afecta el
bienestar de otra. En ese contexto, el concepto clave es la interdependencia estratégica.

El estudio sistemático de una teoría de interacción estratégica nos familiarizará con un


lenguaje que permite converger e intercambiar ideas acerca del comportamiento
humano, desarrollar modelos de situaciones y ofrecer un pensamiento lógico sobre las
implicancias de tales comportamientos, en determinadas situaciones.

La teoría de juegos tiene su campo de aplicación en aquellas áreas en que se está en


presencia de interacción. En consecuencia, es común encontrar aplicaciones de teoría
de juegos en economía, ciencia política, relaciones internacionales, negociación,
estrategia, biología; entre otros.

1.2. Objetivos

Este documento está orientado a estudiar los pilares de la teoría de juegos. Desarrolla
ejemplos y aplicaciones centradas en el campo de la toma de decisiones estratégicas.

Está dirigido a estudiantes que están cursando sus últimos cursos de pregrado y a
estudiantes de postgrado no iniciados en la teoría. Está dirigido también a profesionales
que deben tomar decisiones estratégicas.

El objetivo general del documento es apoyar el curso de Teoría de Juegos que se dicta a
nivel universitario. Los objetivos específicos son:

1. Entregar los principios y conceptos fundamentales de la materia.


2. Desarrollar en profundidad los principales y más populares juegos.
3. Desarrollar en profundidad algunas aplicaciones de la teoría de juegos.

3
Apuntes de Teoría de Juegos

4. Explorar nuevas formas de razonamiento estratégico en situaciones de


interdependencia estratégica.

El documento propone desde la teoría de juegos: (1) modelar y resolver juegos no


cooperativos de información completa con un sentido matemático preciso y (2) analizar
el comportamiento estratégico de individuos estrictamente racionales que toman
decisiones individuales con efecto en el bienestar de otros individuos.

1.3. Estructura del documento

El documento está dividido en tres capítulos. En los capítulos dos y tres se revisan
diversos juegos con las siguientes características:

1. Juegos de información completa, donde los jugadores conocen las ganancias


asociadas a cada uno de los perfiles estratégicos.
2. Juegos con jugadores estrictamente racionales, es decir, jugadores que tienen
como objetivo maximizar sus funciones de ganancia.
3. Juegos de conocimiento común, donde los jugadores tienen conocimiento
acerca de las ganancias; tienen conocimiento acerca del conocimiento del resto
de los jugadores y tienen conocimiento acerca del conocimiento del
conocimiento del resto de los jugadores.

El capítulo dos se concentra en juegos simultáneos de información imperfecta, es decir


en juegos en que los jugadores deciden (juegan) sin conocer la decisión del resto de los
jugadores.

El capítulo tres se enfoca en juegos dinámicos, es decir, la decisión de un jugador es


conocida y luego, con ese conocimiento juega el otro jugador. Se analizarán dos tipos de
estos juegos. En los primeros, los juegos son de información perfecta y en los segundos
los juegos son de información imperfecta, es decir, en algún estado del juego los
jugadores deben jugar de manera simultánea.

4
Apuntes de Teoría de Juegos

A lo largo del documento se resuelven ejercicios y ejemplos; y se proponen tareas y


preguntas que servirán de base para que los interesados puedan seguir profundizando
los diferentes tópicos que se ofrecen en el texto.

5
Apuntes de Teoría de Juegos

Capítulo Dos

Juegos Simultáneos
2.1. Objetivos del capítulo

Introducir los juegos simultáneos de información completa; su representación en forma


normal o estratégica y cómo resolverlos.

2.2. Aprendizajes esperados

• Representar los juegos en forma estratégica


• Reconocer estrategias dominadas
• Aprender el método de la eliminación iterada de estrategias dominadas
• Aprender el método de la mejor respuesta.
• Determinar el equilibrio de Nash en estrategias puras y estrategias mixtas.
• Aprender aplicaciones prácticas de la teoría
• Reconocer diversos tipos de juegos: de dilema, coordinación, negociación y conflicto
puro.

2.3. Lecturas esenciales

• Gibbons, R. 1992. A primer in Game Theory. Prentice Hall.


• Polack, B. 2007. Econ 159: Game Theory. Open Yale Courses.
• Watson, J. 2008. Strategy. W.W. Norton & Co.

2.4. Lecturas opcionales

• Axelrod, R. The Evolution of Cooperation. 1985.


• Dixit, A. y Skeath, S. 2004. Games of Strategy. W.W. Norton & Co.
• Fundenberg, D. y Tirole, J. 1991. Game Theory. MIT Press, Cambridge.
• Osborne, M. y Rubinstein, A. 1994. A Course in Game Theory. The MIT Press.
• Schelling Thomas. The strategy of conflict.
• Tirole, J. Organización industrial.

6
Apuntes de Teoría de Juegos

2.5. Introducción al capítulo dos


Como se decía en la introducción, el concepto clave en la teoría de juegos es el concepto
de la interdependencia estratégica: mi bienestar no sólo depende de mi decisión sino
también depende de la decisión de otro y al mismo tiempo el bienestar del otro no sólo
depende de su decisión sino también depende de mi decisión.

Este capítulo se concentra en los juegos simultáneos o de información imperfecta.


Esto quiere decir que cuando las personas (en adelante jugadores) tomen sus
decisiones (en adelante jugadas) lo harán de manera simultánea, es decir, sin
conocimiento de la estrategia que está tomando el resto de los jugadores.

Es muy importante considerar que cuando se habla de juegos simultáneos, la clave está
en la falta de información más que en el timing. No es condición necesaria que dos
jugadores decidan una estrategia en el mismo segundo para que el juego sea
considerado simultáneo. La condición es que los jugadores no conozcan la estrategia
decidida por el otro al momento de elegir su estrategia. En otras palabras, los jugadores
deciden sus estrategias con información imperfecta.

Se supone que el bienestar de los jugadores puede ser cuantificado en ganancias. La


función de ganancias es aquella que determina la ganancia de un jugador como
resultado de la combinación de estrategias elegidas por él y por el resto de los
jugadores. Es una condición necesaria que las ganancias estén expresadas en números
de manera que éstos se puedan ordenar.

Los jugadores tienen información completa1, es decir, conocen la función de


ganancias de cada jugador.

Los jugadores son racionales en el sentido que buscan maximizar sus ganancias.

Los jugadores tienen conocimiento común respecto a dos aspectos:

1 No confundir con información perfecta.

7
Apuntes de Teoría de Juegos

1. Todos los jugadores conocen la función de ganancias; cada jugador sabe que todos
conocen las funciones de ganancias; y todos los jugadores saben que todos los
jugadores saben que todos los jugadores conocen las funciones de ganancias.
2. Los jugadores son racionales; los jugadores saben que todos los jugadores son
racionales; y los jugadores saben que todos los jugadores saben que todos los
jugadores saben que son racionales.

El concepto clave que se aprenderá en este capítulo es el equilibrio de Nash donde


cada jugador elige su mejor estrategia dada las mejores estrategias del resto de los
jugadores.

2.6. Representación normal o estratégica de un juego simultáneo


La representación estratégica de un juego simultáneo G requiere cumplir tres
condiciones:
1° La determinación del conjunto J = {1, 2, …, n} de jugadores donde un jugador
arbitrario es llamado jugador i. El resto de los jugadores distintos a i se denotan –i.
2° La definición del conjunto de estrategias puras Si de cada jugador i de J. El elemento
si es un miembro arbitrario de Si, es decir, una estrategia que pertenece al conjunto
estratégico del jugador i, donde si ∈ Si.
3° La determinación de la función de ganancias Ui de cada jugador i. Cada combinación
de estrategias le reporta una determinada ganancia. Por lo tanto, Ui = U (s1, s2, …, si, …,
sn), es decir, la ganancia del jugador i es función de su propia estrategia (si) y de las
estrategias del resto de los jugadores (s-i).
En resumen, una representación estratégica de un juego G de n jugadores se denota:

G = {S1, S2, …, Sn; u1, u2, …, un}

8
Apuntes de Teoría de Juegos

Ejemplo 2.1.- El juego de las notas2.

Instrucciones: Suponga un juego entre dos jugadores. Ambos jugadores deben decidir
de manera simultánea entre la estrategia α y la estrategia β. Las ganancias de cada uno
dependen de la combinación de estrategias:

1.- Si el jugador uno elige α y el jugador dos elige β, el jugador uno obtendrá una nota A
y el jugador dos obtendrá una nota C.

2.- Si ambos jugadores eligen la estrategia α, ambos obtendrán una nota B-.

3.- Si ambos jugadores eligen la estrategia β, ambos obtendrán una nota B+.

4.- Si el jugador uno elige β y el jugador dos elige α, el jugador uno obtendrá una nota C
y el jugador dos obtendrá una nota A.

Para comenzar, se representan los resultados anteriores en dos matrices de


resultados. La figura 2.1 sintetiza las notas del jugador uno y la matriz 2.2 sintetiza las
notas del jugador dos.

2 2
1 α β 1 α β

α B- A α B- C

β C B+ β A B+

Figura 2.1 Figura 2.2

Para continuar fusionaremos ambas matrices en una matriz única:

2 Este ejemplo fue tomado del curso de Polack (2007).

9
Apuntes de Teoría de Juegos

2
1 α β

α B-,B- A,C

β C,A B+,B+

Figura 2.3

Note en primer lugar, que estas matrices son de resultados y no de ganancias (recuerde
que las ganancias deben ser expresadas en números). Por lo tanto, aún no hemos
representado el juego ya que falta la tercera condición.

La primera conclusión es que resultados no es igual a ganancias. Las ganancias se


representan con números y estos números representan utilidades o “útiles”.

Para avanzar en la representación del juego se procederá a valorizar (de manera


arbitraria) los resultados:

Resultados Ganancias jugador 1 Ganancias jugador 2


(A,C) 3 -1
(B+,B+) 1 1
(B-,B-) 0 0
(C,A) -1 3
Figura 2.4

Si ambos hubiesen elegido la estrategia α, ambos hubiesen obtenido un resultado B-.


Esa combinación de resultados es valorada de la misma forma por ambos jugadores:
ambos hubiesen valorizado dichos resultados con una ganancia de 0.

En cambio, si el jugador uno eligió la estrategia α y el jugador dos eligió la estrategia β,


el jugador uno obtiene una nota A y el jugador dos una nota C. Esa combinación de
resultados es valorizada de forma diferente por ambos jugadores: el jugador uno
percibe una ganancia de tres útiles mientras que el jugador dos recibe una ganancia de
menos un útil.

10
Apuntes de Teoría de Juegos

Ahora que se han valorizado los resultados, se tienen los tres ingredientes necesarios
(los jugadores, las estrategias y las ganancias) para representar el juego en forma
estratégica. Para eso se recurre a la matriz de ganancias:

2
1 α β

α 0,0 3,-1

β -1,3 1,1

Figura 2.5

Para entender la matriz considere:

1.- El jugador uno es el jugador fila y el jugador dos es el jugador columna.

2.- El número antes de la coma corresponde a la ganancia del jugador uno y el número
después de la coma corresponde a la ganancia del jugador dos.

3.- Cada combinación de estrategias representada en los cuadrantes de la matriz


corresponde a un perfil estratégico. Nuestro ejemplo tiene cuatro perfiles estratégicos:
(α, α), (α, β), (β, α) y (β, β).

4.- A cada perfil estratégico le corresponde una ganancia para cada jugador:

U1 (α, α) = 0: la ganancia del jugador uno correspondiente al perfil (α, α) es cero.


U1 (α, β) = 3: la ganancia del jugador uno correspondiente al perfil (α, β) es tres.
U1 (β, α) = -1: la ganancia del jugador uno correspondiente al perfil (β, α) es menos uno.
U1 (β, β) = 1: la ganancia del jugador uno correspondiente al perfil (β, β) es uno.

U2 (α, α) = 0: la ganancia del jugador dos correspondiente al perfil (α, α) es cero.


U2 (α, β) = -1: la ganancia del jugador dos correspondiente al perfil (α, β) es menos uno.
U2 (β, α) = 3: la ganancia del jugador uno correspondiente al perfil (β, α) es tres.
U2 (β, β) = 1: la ganancia del jugador uno correspondiente al perfil (β, β) es uno.

11
Apuntes de Teoría de Juegos

Pregunta 2.1

¿Si usted fuese el jugador uno, que estrategia elegiría?

2.7. Estrategias dominadas

Una estrategia estrictamente dominada es aquella que, independientemente lo que


juegue el otro jugador, arroja una ganancia estrictamente menor en comparación a la
ganancia que entrega jugar otra estrategia.

Una estrategia 𝑠𝑖´ está estrictamente dominada por la estrategia 𝑠𝑖" cuando la
desigualdad estricta:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) < 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )

se cumple para toda combinación de estrategias 𝑠−𝑖 (las estrategias del resto de los
jugadores, es decir, de todos los jugadores menos el jugador i).

Se dice que una estrategia 𝑠𝑖´ está débilmente dominada por la estrategia 𝑠𝑖" cuando la
desigualdad débil:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) ≤ 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )

se cumple para toda combinación de estrategias 𝑠−𝑖 , es decir, al jugador i le conviene


elegir la estrategia 𝑠𝑖" al menos tanto como la estrategia 𝑠𝑖´ .

Volviendo a la figura 2.5 se puede concluir que para ambos jugadores la estrategia β
es estrictamente dominada por la estrategia α. Analicemos porqué:

El jugador uno reflexionará: “si el jugador dos juega α entonces me convendrá jugar α y
no β porque la ganancia que obtengo es cero que es mayor que menos uno. Y si el jugador
dos juega β entonces me convendrá jugar α y no β porque la ganancia que obtengo es tres
que es mayor que uno”.

Es decir, independientemente si el jugador dos juega α o β, al jugador uno le convendrá


jugar α: la estrategia β está estrictamente dominada por la estrategia α o, en otras
palabras, la estrategia α domina a la estrategia β.

12
Apuntes de Teoría de Juegos

Analice en segundo lugar al jugador dos. Éste reflexionará: “si el jugador uno juega α
entonces me convendrá jugar α y no β porque la ganancia que obtengo es cero que es
mayor que menos uno. Y si el jugador uno juega β entonces me convendrá jugar α y no β
porque la ganancia que obtengo es tres que es mayor que uno”.

Es decir, independientemente si el jugador uno juega α o β, al jugador dos le convendrá


jugar α: la estrategia β está estrictamente dominada por la estrategia α o, en otras
palabras, la estrategia α domina a la estrategia β.

Ahora bien, si el jugador uno “se pone en los zapatos” del jugador dos, reflexionará que
éste, que es un jugador racional que busca maximizar sus ganancias, no jugará nunca la
estrategia β porque la ganancia que obtiene al jugar aquella estrategia es menor que la
que obtendría al jugar la estrategia α, independientemente de lo que él juegue.

Al mismo tiempo, si el jugador dos “se pone en los zapatos” del jugador uno, reflexionará
que éste tampoco jugará la estrategia β porque la ganancia que obtiene al jugar aquella
estrategia es menor que la que obtendría al jugar la estrategia α, independientemente
de lo que él juegue.

La segunda conclusión es que jugadores racionales no jugarán nunca una estrategia


estrictamente dominada porque las ganancias que obtienen de jugar estrategias
dominadas son estrictamente menores que las que se obtienen de las otras estrategias,
independientemente de lo que jueguen el resto de los jugadores.

Esta conclusión permite desarrollar un método para resolver algunos tipos de juegos.
El método consiste en la eliminación iterada de estrategias dominadas.

2.8. Eliminación iterada de estrategias dominadas.

Si jugadores racionales no jugarán nunca estrategias dominadas entonces se pueden


eliminar de sus conjuntos estratégicos factibles. En el ejemplo, si ninguno de los dos
jugadores jugará la estrategia β entonces ésta se puede eliminar del conjunto
estratégico factible de ambos:

13
Apuntes de Teoría de Juegos

2
1 α β
3,-1
α 0,0

β -1,3 1,1

Figura 2.6

De esta forma, al eliminar las estrategias que nunca se jugarán el juego se puede, en
primer lugar, representar de una forma mucho más sencilla y, en segundo lugar,
permite obtener una solución.

2
1 α

α 0,0

Figura 2.6.1

La solución del juego es el perfil estratégico {α, α} que lleva asociado una ganancia de
(0, 0). Cuando, luego de eliminar de manera iterada todas las estrategias dominadas
sobrevive sólo un perfil estratégico dicho perfil es un equilibrio de Nash.

Aunque no se entra aún en la definición de un equilibrio de Nash, podemos adelantar


su principal característica: el equilibrio de Nash es un equilibrio estable, es decir, los
jugadores no tienen incentivo a desviarse de su decisión.

Si el jugador uno decidiese cambiar su decisión y en vez de elegir α eligiese β, su


ganancia caería de cero a menos uno. Al mismo tiempo, si el jugador dos decidiese
cambiar su decisión, su ganancia caería a menos uno. En conclusión, ninguno de los
jugadores tiene incentivos a desviarse de su decisión.

14
Apuntes de Teoría de Juegos

Note que la solución del juego es una solución sub óptima: ambos jugadores podrían
estar mejor si el equilibrio hubiese sido {β, β}. Las ganancias asociadas a dicho
equilibrio hubiesen sido (1, 1) mayores a (0, 0).

Una característica fundamental del equilibrio {β, β}, que se puede considerar un
equilibrio cooperativo, es que es un equilibrio inestable: ambos jugadores tienen
incentivo a desviarse.

Observe que si el jugador uno se desvía de β a α (y el jugador dos mantiene su elección


en α), las ganancias del primero aumentan de uno a tres (por lo tanto, tiene un incentivo
a desviarse) y las ganancias del otro disminuyen de uno a menos uno.

Al mismo tiempo, si el jugador dos se desvía de β a α (y el jugador uno mantiene su


elección en α), las ganancias del primero aumentan de uno a tres (por lo tanto, también
tiene un incentivo a desviarse) y las ganancias del otro disminuyen de uno a menos uno.

Tercera conclusión: en algunas ocasiones, elecciones racionales (ningún jugador jugará


estrategias dominadas) puede llevar a equilibrios no eficientes o sub-óptimos en el sentido
de Pareto.

El juego que se acaba de analizar pertenece a la familia de los juegos de dilema (del
prisionero). Su principal característica es que la solución es peor para ambos jugadores
que la solución cooperativa (que no es equilibrio de Nash) en la cual cada jugador juega
una estrategia dominada.

Pregunta 2.2.
¿Cómo se pueden lograr equilibrios cooperativos de largo plazo?3

3Para estudiar en profundidad las soluciones cooperativas del dilema del prisionero, revisar Axelrod, R.
(1985).

15
Apuntes de Teoría de Juegos

Ejercicio resuelto 2.1.


Encuentre y elimine las estrategias dominadas del siguiente juego:

2
1 L M R

U 4,3 5,1 6,2

M 2,1 8,4 3,6

D 3,0 9,6 2,8

Figura 2.7

Observe en primer lugar que las estrategias del jugador uno son {U, M, D} y las
estrategias del jugador dos son {L, M, R}. Las ganancias de cada uno dependen de la
combinación de estrategias elegidas por ambos jugadores. Por ejemplo, si el jugador
uno elige U y el jugador dos elige R, la ganancia del jugador uno es 6 y la ganancia del
jugador es 2.

Para determinar las estrategias dominadas, comience por el jugador uno de acuerdo al
siguiente razonamiento:

• Compare U y M: si el jugador dos juega L, U domina a M porque la ganancia de 4 es


mayor que 2. Sin embargo, si el jugador dos juega M, M domina a U porque 8 es mayor
que 4. Por lo tanto, podemos concluir que U no es una estrategia dominada por M y
que M no es una estrategia dominada por U porque dependiendo de lo que juegue el
jugador dos, al jugador uno le convendrá jugar U o M.
• Compare M y D: si el jugador dos juega L, D domina a M porque 3 es mayor que 2. Si
el jugador dos juega M, D domina a M porque 9 es mayor que 8. Sin embargo, si el
jugador dos juega R, M domina a D porque 3 es mayor que 2. Por lo tanto, podemos

16
Apuntes de Teoría de Juegos

concluir que la estrategia M no domina a la estrategia D y que la estrategia D no


domina a la estrategia M.
• Compare U y D: si el jugador dos juega L, U domina a D porque 4 es mayor que 3. Si
el jugador dos juega M, D domina a U porque 9 es mayor que 5. Por lo tanto, podemos
concluir que la estrategia U no domina a la estrategia D y que la estrategia D no
domina a la estrategia U.

Preliminarmente se concluye que el jugador uno no tiene estrategias dominadas.

Continúe analizando las posibles estrategias dominadas del jugador dos utilizando el
mismo razonamiento:

• Compare L y M. Si el jugador uno juega U, L domina a M porque 3 es mayor que 1. Sin


embargo, si el jugador uno juega M, M domina a L porque 4 es mayor que 1. Por lo
tanto, podemos concluir que la estrategia L no domina la estrategia M y que la
estrategia M no domina a la estrategia L.
• Compare L y R. Si el jugador uno juega U, L domina a R porque 3 es mayor que 2. Sin
embargo, si el jugador uno juega M, R domina a L porque 6 es mayor que 1. Por lo
tanto, la estrategia L no domina a la estrategia R y la estrategia R no domina a la
estrategia L.
• Compare M y R. Si el jugador uno juega U, M es dominada por R porque 1 es menor
que 2. Si el jugador uno juega M, M es dominada por R porque 4 es menor que 6. Si el
jugador uno juega D, M es dominada por R porque 6 es menor que 8. Observe que la
estrategia M es dominada por la estrategia R porque la ganancia que obtiene el
jugador dos es menor, independientemente de lo que juegue el jugador uno.

Como se supone que el jugador dos es un jugador racional se deduce que no jugará una
estrategia dominada. Por lo tanto, se puede eliminar de su conjunto estratégico la
estrategia M. Al eliminar M, el juego queda representado de la siguiente forma:

17
Apuntes de Teoría de Juegos

2
1 L R

U 4,3 6,2

M 2,1 3,6

D 3,0 2,8

Figura 2.7.1

El concepto de iteración sugiere que se debe seguir en la búsqueda de estrategias


dominadas.

• Compare U y M. Si el jugador dos juega L, la estrategia U domina a la estrategia M


porque 4 es mayor que 2. Si el jugador dos juega R, la estrategia U domina a la
estrategia M porque 6 es mayor que 3. Concluimos entonces que la estrategia U
domina a la estrategia M porque independientemente de lo que juega el jugador dos
(L o R) la ganancia que obtiene el jugador uno es mayor cuando juega U en vez de M.
Es interesante recordar que antes de la eliminación de la estrategia M del conjunto
estratégico del jugador dos, el jugador uno no tenía estrategias dominadas.

Como se supone que el jugador uno no jugará una estrategia dominada, el juego se
puede representar de una forma reducida:

18
Apuntes de Teoría de Juegos

2
1 L R

U 4,3 6,2

D 3,0 2,8

Figura 2.7.2

Continúe el proceso:
• Compare U y D. Si el jugador dos juega L, U domina a D. Si el jugador dos juega R, U
domina a D. Por lo tanto, D es una estrategia dominada por U porque
independientemente de lo que juegue el jugador dos (L o R), la ganancia que obtiene
el jugador uno al jugar D es menor que la que obtiene de jugar U.

2
1 L R

U 4,3 6,2

Figura 2.7.3

Continúe:
• Compare L y R. Si el jugador uno juega U, la estrategia L domina a la estrategia R
porque la ganancia de 3 es mayor que 2. Al eliminar esta última estrategia dominada
sobrevive un único perfil estratégico:

2
1 L

U 4,3

Figura 2.7.4

19
Apuntes de Teoría de Juegos

El perfil estratégico {U, L} es el único que sobrevivió al proceso de eliminación iterada


de estrategias dominadas y, por lo tanto, es un equilibrio de Nash. El equilibrio de Nash
trae asociado ganancias de 4 y 3 para el jugador uno y dos, respectivamente.

Tarea 2.1.

Compruebe en el juego original que ninguno de los dos jugadores tiene incentivo a
desviarse desde el equilibrio {U, L}.

Ejercicio 2.1: Suponga treinta jugadores que deben elegir, de manera simultánea, es
decir, con información imperfecta, un número entre el uno y el cien. El ganador será
aquel jugador que elija el número más cercano a dos tercios del promedio. Por ejemplo,
si el promedio es 30, el ganador será aquel jugador que haya elegido el número más
cercano a 20 (2/3 por 30 = 20). Por eliminación de estrategias dominadas y “poniéndose
en los pantalones del otro”, resuelva el equilibrio de Nash.

2.9. Aplicaciones sobre eliminación iterada de estrategias dominadas.

Primera Aplicación: Teorema del votante mediano

Suponga dos candidatos (jugadores) a una elección popular. Cada candidato debe
decidir entre diez posiciones (estrategias) del espectro político.

1 2 3 4 5 6 7 8 9 10

La posición número 1 representa la posición de extremo izquierda y la posición 10 la


extrema derecha. En cada posición hay un 10% de los votos. Los electores votan por el
candidato más cercano a su posición política. Si ambos candidatos se ubican en la misma
posición el número de votos se reparte en partes iguales.

Ejemplos:

• Si ambos candidatos se ubican en la posición 1, ambos obtendrían el 50% de los


votos.

20
Apuntes de Teoría de Juegos

• Si el candidato uno se ubica en la posición 1 y el candidato dos se ubica en la posición


2, el candidato uno obtiene el 10% de los votos y el candidato dos, el 90% de los
votos.
• Si el candidato uno se ubica en la posición 1 y el candidato dos en la posición 3, el
candidato uno obtendría el 15% de los votos (10% de la posición 1 más el 5% de la
posición 2) y el candidato dos obtendría el 85% de los votos (5% de la posición 2
más 80% de las posiciones 3 a 10).

Las ganancias de cada candidato son el porcentaje de votos. Como ambos son
racionales, tienen como objetivo maximizar la votación.

Solución:

1° Determinar si la posición 2 domina a la posición 1:

U1 (1,1) = 50% < U1 (2,1) = 90%


U1 (1,2) = 10% < U1 (2,2) = 50%
U1 (1,3) = 15% < U1 (2,3) = 20%
U1 (1,4) = 20% < U1 (2,4) = 25%
… …
U1 (1,10) = 50% < U1 (2,10) = 55%

Observe que independientemente donde se ubique el candidato dos, la votación que


obtiene el candidato uno por ubicarse en la posición 2 es siempre mayor que la votación
que obtiene al ubicarse en la posición 1. Por lo tanto, se puede concluir que la posición
2 domina a la posición 1. Por simetría, se puede deducir que la posición 9 domina la
posición 10. Esto implica que las posiciones 1 y 10 pueden ser eliminadas del conjunto
estratégico de los candidatos.

2° Antes de eliminar la posición 1, determinar si la posición 3 domina a la posición 2:

U1 (2,1) = 90% > U1 (3,1) = 85%

Sólo con este paso es suficiente para determinar que, antes de eliminar la posición 1, la
posición 3 no domina a la posición 2. Esto porque la ganancia del candidato uno,

21
Apuntes de Teoría de Juegos

asumiendo que el candidato dos se ubica en la posición 1, es mayor por ubicarse en la


posición 2 que en la 3.

3° Luego de eliminar la posición 1 y 10, determinar si la posición 3 (y 8) domina a la


posición 2 (y 9):

Ahora el conjunto estratégico de los candidatos está reducido al siguiente espectro.

2 3 4 5 6 7 8 9

Hay que aclarar que lo que se eliminó fueron las estrategias 1 y 10. No se eliminan los
votantes que se sienten identificados con dichas posiciones políticas. Esto implica que
el universo electoral sigue siendo el mismo. En este caso, los votantes de la posición 1 y
10, votarán por el candidato que se ubique más cerca de sus preferencias.

U1 (2,2) = 50% < U1 (3,2) = 80%

U1 (2,3) = 20% < U1 (3,3) = 50%

U1 (2,4) = 25% < U1 (3,4) = 30%

U1 (2,5) = 30% < U1 (3,5) = 35%


… …
U1 (2,9) = 50% < U1 (3,9) = 55%

Observe que luego de eliminar la estrategia 1, la estrategia 2 es dominada por la


estrategia 3. Independientemente de la estrategia que decida el candidato dos, la
ganancia que obtiene el candidato uno al ubicarse en la posición 3 es mayor a la
ganancia que obtiene al ubicarse en la posición 2. Por simetría, se puede deducir que la
estrategia 8 domina a la estrategia 9.

Por racionalidad, se deduce que los candidatos no utilizarán las estrategias 2 y 8 porque
son dominadas. En virtud esto, ambas estrategias pueden ser eliminadas.

Si continuamos iterando, las únicas estrategias que sobrevivirán serán las estrategias 5
y 6. En este caso, aquellas estrategias son un equilibrio de Nash.

22
Apuntes de Teoría de Juegos

Segunda Aplicación: Modelo de locación4

Suponga que Pat y Cris son dos vendedores de helado (jugadores) que trabajan en la
misma playa. La playa está dividida en nueve sectores. Debido a que necesitan
electricidad, deben decidir de manera independiente y simultánea, donde localizarse.
El día anterior deben llamar a la administración e informar en cual sector se ubicarán
(estrategias).

1 2 3 4 5 6 7 8 9

El precio de los helados es el mismo y cada uno gana una comisión de $25 por helado.
La demanda está estimada en 500 helados por sector. Si un vendedor atiende a un
sector y vende 500 helados, sus ventas serán de $12.500. Como los helados son iguales,
los consumidores deciden comprar en el lugar más cercano al que están ubicados. Si los
consumidores son indiferentes, asuma que comprarán 250 helados a Pat y 250 helados
a Cris.

Por ejemplo:

• Si Pat se localiza en el sector 3 y Cris en el sector 8, entonces Pat venderá a todos los
consumidores localizados en los sectores 1 a 5, y Cris venderá a todos los
consumidores ubicados en los sectores 6 a 9.

Solución:

1° Determinar si el sector 2 domina al sector 1:

UP (1,1) = 56.250 < UP (2,1) = 100.000


UP (1,2) = 12.500 < UP (2,2) = 56.250
UP (1,3) = 18.750 < UP (2,3) = 25.000
UP (1,4) = 25.000 < UP (2,4) = 31.250
… …
UP (1,9) = 56.250 < UP (2,9) = 62.500

4 Para más detalles ver Watson, J. (2008).

23
Apuntes de Teoría de Juegos

Observe que independientemente donde se ubique Cris, la ganancia de Pat al ubicarse


en el sector 2 es mayor a la ganancia que obtiene al ubicarse en el sector 1. Se concluye
que para Pat la estrategia 1 es dominada por la estrategia 2 para ambos jugadores. Por
simetría podemos deducir que la estrategia 9 es dominada por la estrategia 8 para
ambos jugadores.

Utilizando el método de la eliminación de estrategias dominadas, el conjunto


estratégico de ambos jugadores (que se supone no jugarán estrategias dominadas) se
reduce a:

2 3 4 5 6 7 8

Al igual que en la aplicación anterior se debe recalcar que los consumidores de los
sectores 1 y 9 seguirán comprando helados. Lo que se ha eliminado son dos estrategias
posibles, no porque las estrategias no sigan estando presentes, sino porque suponemos
que jugadores racionales no jugarán estrategias dominadas.

2° Determinar si el sector 3 domina al sector 2.

UP (2,2) = 56.250 < UP (3,2) = 100.000


UP (2,3) = 25.000 < UP (3,3) = 56.250
UP (2,4) = 31.250 < UP (3,4) = 25.000
UP (2,5) = 37.500 < UP (3,5) = 31.250
… …
UP (2,8) = 56.250 < UP (3,8) = 62.500

Se observa que independientemente donde se ubique Cris, la ganancia que obtiene Pat
al ubicarse en el sector 3 es mayor que la ganancia que obtiene al ubicarse en el sector
2. Lo mismo se puede deducir respecto a Cris: independientemente donde se ubique
Pat, la ganancia que obtiene al ubicarse en el sector 3 es mayor que la ganancia que
obtiene al ubicarse en el sector 2. Por simetría, se concluye que, para ambos jugadores,
la ganancia de ubicarse en el sector 7 es mayor que la ganancia que tienen de ubicarse
en el sector 8.

24
Apuntes de Teoría de Juegos

La conclusión es que las estrategias 2 y 8 son estrategias dominadas y como asumimos


que Pat y Cris son racionales podemos deducir que ninguno jugará aquellas estrategias.
El conjunto estratégico se reduce a:

3 4 5 6 7

Continuando con el proceso iterativo de determinar y eliminar estrategias dominadas,


llegamos a que la solución es que ambos jugadores jugarán la estrategia 5. Como este
es el único perfil estratégico que sobrevivió a la eliminación iterada de estrategias
dominadas, este perfil es un equilibrio de Nash.

Tarea 2.2

El dilema del viajero

Una compañía aérea pierde dos maletas pertenecientes a dos viajeros diferentes.
Ambas maletas resultan ser idénticas y contienen artículos idénticos. El gerente de la
línea aérea encargada de resolver las reclamaciones de los viajeros explica que la
compañía aérea es responsable por un máximo de $100.000 por maleta (él es incapaz
de averiguar directamente el precio de los artículos), y con el fin de determinar un valor
honesto de tasación de la mercancía, el gerente de reclamaciones separa a los viajeros
para que no puedan acordar nada, y les pide que escriban un valor de la maleta mayor
a $20.000 y menor de $100.000. También les dice, si ambos escriben el mismo número,
él va a tratar ese número como el valor monetario real de las maletas y reembolsará a
los viajeros dicha cantidad. Sin embargo, si uno escribe un número más pequeño que el
otro, este número más pequeño se tomará como el valor verdadero, y cada uno de los
viajeros recibirá esa cantidad junto con una recompensa o un castigo de $20.000: el
viajero que escribió el valor más bajo recibirá el valor más bajo más una recompensa
de $20.000 y la persona que escribió la cantidad más alta recibirá el valor más bajo
menos una deducción de $20.000.

¿Qué valor (estrategia) debe seguir cada uno de los viajeros?

25
Apuntes de Teoría de Juegos

2.10 El método de la mejor respuesta

En ocasiones hay juegos en que los jugadores no tienen estrategias dominadas o bien si
las tienen, la eliminación iterada de éstas no permite llegar a un perfil único. En tales
casos, la eliminación de estrategias dominadas pierde eficiencia como método para
encontrar el equilibrio de Nash.

Por ejemplo, observe el siguiente juego:

2
1 L C R

T 5,-1 11,3 0,0

B 6,4 0,2 2,0

Figura 2.8

Observe en primer lugar que el jugador uno no tiene estrategias dominadas. En el caso
del jugador dos, la estrategia C domina a la estrategia R. En tal caso, podemos eliminar
del conjunto estratégico del jugador dos la estrategia R y representar el juego en una
forma reducida:

2
1 L C

T 5,-1 11,3

B 6,4 0,2

Figura 2.8.1

26
Apuntes de Teoría de Juegos

Luego de eliminar la estrategia R, se llega al hecho que ninguno de los dos jugadores
tiene estrategias dominadas. Como es obvio, si no hay estrategias dominadas el método
de la eliminación pierde mucho de su valor.

La cuarta conclusión es que cuando sobrevive más de un perfil estratégico a la


eliminación iterada de estrategias dominadas, porque no hay estrategias dominadas ni
dominantes, el proceso puede producir predicciones no adecuadas.

La pregunta es cómo resolver el juego. Para eso nos basaremos en el concepto de la


racionabilidad y utilizaremos el método de la mejor respuesta. El método consiste
en encontrar la mejor respuesta de los jugadores ante todas las estrategias factibles de
ser jugadas por el resto de los jugadores.

Una estrategia 𝑠̂𝑖 es una mejor respuesta (𝑅𝑖 ) respecto a la estrategia 𝑠𝑖´ para el jugador
i ante la estrategia 𝑠−𝑖 del resto de los jugadores si se cumple que la ganancia de jugar
𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ :

𝑈𝑖 (𝑠̂𝑖 , 𝑠−𝑖 ) > 𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 )

También se puede expresar que la estrategia 𝑠̂ 𝑖 resuelve el problema de optimización:

Max 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )


𝑠𝑖

Al igual que el concepto de dominancia estricta, el concepto de racionabilidad impone


restricciones a los juegos.

Ambos procesos funcionan bajo el supuesto de que la estructura del juego (conjuntos
estratégicos y funciones de ganancias) y la racionalidad de los jugadores son de
conocimiento común.

Mientras la eliminación iterada de estrategias dominadas supone que los jugadores no


jugarán estrategias dominadas; la racionabilidad supone que los jugadores jugarán
aquellas estrategias que son la mejor respuesta a las creencias que ellos podrían tener
acerca de las estrategias jugadas por el resto de los jugadores.

27
Apuntes de Teoría de Juegos

De lo anterior se puede deducir que los jugadores no jugarán una estrategia que no sea
la mejor respuesta a las creencias que tengan acerca de las estrategias del resto de los
jugadores. Además, se debe suponer que los jugadores supondrán que el resto de los
jugadores también jugarán una mejor respuesta.

Una estrategia dominada nunca es una estrategia de mejor respuesta y al mismo


tiempo, una estrategia de mejor respuesta no es nunca una estrategia dominada.

El conjunto de estrategias racionalizables (o de mejor respuesta) está contenido en el


conjunto de estrategias que sobreviven a la eliminación iterada de dominancia.

Para entender mejor el método vuelva a la figura 2.8.1. En esta figura están las
estrategias que sobrevivieron a la eliminación de estrategias dominadas. El método de
la mejor respuesta consiste en:

• El jugador uno se pregunta, ¿cuál es mi mejor respuesta si el jugador dos juega L? La


mejor respuesta es jugar B porque la ganancia que entrega es 6 que es mayor a 5 que
es la ganancia que obtendría si jugara T. En la matriz se subraya la ganancia asociada
a la mejor respuesta (note que el jugador dos se preguntará, ¿cuál es la mejor
respuesta del jugador uno si yo juego L?).
• El jugador uno se pregunta, ¿cuál es mi mejor respuesta si el jugador dos juega C? La
mejor respuesta es jugar T porque la ganancia que entrega es 11 que es mayor a 0
que es la ganancia que obtendría si jugara B. En la matriz se subraya la ganancia a la
mejor respuesta.
• El jugador dos se pregunta, ¿cuál es mi mejor respuesta si el jugador uno juega T? La
mejor respuesta es jugar C porque la ganancia que entrega es 3 que es mayor a -1
que es la ganancia que obtendría si jugara L. En la matriz se subraya la ganancia
asociada a la mejor respuesta.
• El jugador dos se pregunta, ¿cuál es mi mejor respuesta si el jugador uno juega B? La
mejor respuesta es jugar L porque la ganancia que entrega es 4 que es mayor a 2 que
es la ganancia que obtendría si jugara C. En la matriz se subraya la ganancia asociada
a la mejor respuesta.

28
Apuntes de Teoría de Juegos

2
1 L C

T 5,-1 11,3

B 6,4 0,2

Figura 2.8.2

En el juego se han encontrado dos perfiles estratégicos que cumplen con una
característica esencial: las estrategias elegidas por los jugadores constituyen las mejores
respuestas ante las mejores respuestas de los otros jugadores.

Tal definición corresponde a un equilibrio de Nash. Luego de encontrar un equilibrio


de Nash, ningún jugador tiene incentivos a desviarse de su decisión: el equilibrio es
estratégicamente estable.

Decir que la solución no es un equilibrio de Nash es equivalente a decir que existe al


menos un jugador que no jugó su mejor respuesta y, por lo tanto, aquel jugador tiene
incentivo para desviarse de su decisión.

En nuestro ejemplo, hay dos equilibrios de Nash. Observe que desde ninguno de los
equilibrios los jugadores tienen incentivo a desviarse.

En un juego G, las estrategias (𝑠1∗ , … , 𝑠𝑛∗ ) son un equilibrio de Nash si, para cada jugador
i, 𝑠𝑖∗ es, al menos, la mejor respuesta a las estrategias especificadas por el resto de los
jugadores tal que:
𝑈𝑖 (𝑠𝑖∗ , 𝑠−𝑖
∗ ∗
) > 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )

En otra forma, la estrategia 𝑠𝑖∗ resuelve el problema de optimización:


Max 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )
𝑠𝑖 ∈ 𝑆𝑖

Quinta conclusión: el equilibrio de Nash entrega una solución más fuerte que el concepto
de estrategias dominadas ya que puede haber estrategias que superen la eliminación y no

29
Apuntes de Teoría de Juegos

ser un equilibrio de Nash; en cambio un equilibrio de Nash implica que las estrategias si
superan la eliminación iterada de estrategias dominadas.

Sexta conclusión: el equilibrio de Nash es estratégicamente estable. Esto implica que


ningún jugador tiene incentivos a desviarse de sus decisiones.

Séptima conclusión: En juegos con jugadores y estrategias finitas siempre existe al


menos un equilibrio de Nash, ya sea en estrategias puras y/o estrategias mixtas5.

Ejercicio 2.2.
Considere el siguiente juego6:

2
1 L C R

T 0,4 4,0 5,3

M 4,0 0,4 5,3

B 3,5 3,5 6,6

Figura 2.9

a) Encuentre estrategias dominadas.


b) Encuentre el o los equilibrios de Nash a través del método de la mejor respuesta.

2.11. Juegos de coordinación

Vuelva por un momento al ejemplo 2.1. En aquel ejemplo, los jugadores debían elegir
entre α y β. La combinación de estrategias llevaba asociada diversos resultados para
cada uno de los jugadores:

5 Más adelante se repasará el concepto de estrategias mixtas.


6 La solución a este juego está en el capítulo uno de Gibbons, R.

30
Apuntes de Teoría de Juegos

2
1 α β

α B-,B- A,C

β C,A B+,B+

Figura 2.10

Se decía que aquella representación no constituía un juego porque faltaba uno de los
tres ingredientes necesarios para representar un juego en forma estratégica. El
ingrediente faltante eran las ganancias que debían ser expresadas en números de
manera que pudiesen ordenarse. Aquella tarea se hizo valorando para cada jugador (de
manera arbitraria) los resultados obtenidos7.

En esta sección se supondrá que los jugadores tienen valoraciones diferentes. Antes se
supuso que los jugadores no tenían preocupación por las notas que obtenían los
compañeros. En su curso el profesor Polack (2007) los llama con una nota de humor
“diablos despiadados”.

Ahora supondremos que los jugadores (el profesor Polack los llama “ángeles
indignados”) tienen una legítima preocupación por sus notas, pero también tienen una
preocupación por los resultados que obtienen los compañeros.

En este caso, la ganancia del ángel se ve alterada por alguna emoción como la rabia o la
culpa. La nueva valoración de ganancias se sintetiza en la siguiente figura:

Resultados Ganancias jugador 1 Ganancias jugador 2


(A,C) -1 -3
(B+,B+) 1 1
(B-,B-) 0 0
(C,A) -3 -1
Figura 2.11

7 Ver figura 2.5

31
Apuntes de Teoría de Juegos

Aunque esta valoración sigue siendo arbitraria y tiene un estricto objetivo


metodológico, se intentará una justificación:

• (A, C) = -1 se obtiene de la suma de +3 + (-4), donde la ganancia +3 es porque el


estudiante valora de esa forma haber obtenido una A y la ganancia -4 es por la “culpa”
que siente porque su compañera obtuvo una C. La “culpa” es porque supone que la
compañera actuó bajo la creencia que también elegiría β.
• (C, A) = -3 se obtiene de la suma de -1 + -2, donde la ganancia -1 es porque el
estudiante valora de esa forma haber obtenido una C y la ganancia -2 es por la
“indignación” que siente porque su compañera obtuvo una A “a costa” de que ella
ingenuamente eligió β bajo la creencia que ella también elegiría β.

Tenga presente que este es una simulación. Dicho eso, con los resultados valorizados,
el juego se puede representar en forma estratégica.

Primera Variante: ángel versus ángel

2
1 α β

α 0,0 -1,-3

β -3,-1 1,1

Figura 2.12

Este juego es totalmente distinto al juego de la figura 2.5. El presente juego tiene tres
características:

1° Ninguno de los jugadores tiene estrategias dominadas.

2° Es un juego de equilibrios múltiples {α, α} y {β, β}.

3° Uno de los equilibrios es superior en el sentido de que ambos jugadores podrían estar
mejor con el equilibrio {β, β}.

32
Apuntes de Teoría de Juegos

Así como el tipo de juego analizado en la figura 2.5 se conocen como juegos de dilema,
este tipo de juegos se conocen como juegos de coordinación. La principal
característica de los juegos de coordinación es que tienen equilibrios múltiples (más de
un equilibrio de Nash). En general hay dos tipos de juegos de coordinación:

1. Juegos de Pareto coordinación que se caracterizan porque uno de los equilibrios es


superior al resto y por lo tanto son de fácil predicción. En nuestro ejemplo se debería
esperar que ambos jugadores eligieran la estrategia β.
2. Juegos de coordinación pura que se caracterizan porque al menos hay dos equilibrios
con las mismas ganancias para los jugadores8 y son de difícil predicción. Un ejemplo
de un juego de coordinación pura se presenta en la siguiente figura:
2
1 α β

α 1,1 0,0

β 0,0 1,1

Figura 2.13

Segunda Variante: diablo versus ángel


Suponga que el jugador uno es un “diablo despiadado” y el jugador dos es un “ángel
indignado”. La representación estratégica del juego es:

8 Para detalles y un análisis profundo de este tipo de juegos ver Schelling, T.

33
Apuntes de Teoría de Juegos

Ángel

Diablo α β

α 0,0 3,-3

β -1,-1 1,1

Figura 2.14

Observe que:

1. El jugador uno tiene a β como estrategia dominada.


2. Jugador dos no tiene estrategias dominadas.
3. Por racionalidad, el jugador uno debe elegir α. La mejor respuesta del jugador dos
es α.
4. El equilibrio de Nash es Pareto ineficiente: ambos jugadores podrían estar mejor
en el equilibrio {β, β} el que, sin embargo, no es un equilibrio de Nash (el jugador
uno tiene incentivos a desviarse).

Tarea 2.3.
Represente y resuelva el juego en que el jugador uno sea un ángel y el jugador dos sea
un diablo.

2.12. Revisión de algunos de los juegos más conocidos

En esta sección se revisarán tres de los principales juegos simultáneos y se resolverán


los equilibrios de Nash en estrategias puras9.

1.- Dilema del prisionero.

Dos delincuentes habituales (jugadores) son arrestados cuando se acaba de cometer un


delito grave y uno menor. No hay pruebas por el delito grave, pero si hay algunas sobre

9 Más adelante se hará referencia al concepto de estrategias puras.

34
Apuntes de Teoría de Juegos

el delito menor. Son interrogados en celdas separadas. La policía les plantea dos
estrategias: callar y confesar. Ambos saben eso y saben las penas asociadas a cada perfil
estratégico. Si los dos callan serán absueltos del delito principal y serán condenados por
el delito menor (un año de cárcel); si ambos confiesan, serán condenados por el delito
mayor y se les rebajará la pena en un año por confesar (cuatro años de cárcel); y si uno
confiesa y el otro calla, el primero será liberado (cero años de cárcel) y el otro será
condenado (cinco años de cárcel).

La representación en forma estratégica es la siguiente:

2
1 Callar Confesar

Callar -1,-1 -5,0

Confesar 0,-5 -4,-4

Figura 2.15

Considere en primer lugar, que en este juego los jugadores tienen como función objetivo
minimizar sus años de condena. Segundo, la estrategia callar es una estrategia
dominada para ambos jugadores (observe que para ninguno es una mejor respuesta).
ambos sospechosos tienen como estrategia. Tercero, el equilibrio de Nash está en el
perfil estratégico {confesar, confesar}, Cuarto, la solución al juego es un Pareto
ineficiente, es decir, ambos, podrían obtener condenas menores a cuatro años.

2.- Batalla de los sexos


Una pareja de novios se pone de acuerdo para salir al día siguiente después del trabajo.
Las alternativas (estrategias) son ir al cine o ir al fútbol. Cuando llega la tarde del día
siguiente, ambos se dan cuenta que no habían coordinado el lugar en el que se reunirían.
Por lo tanto, cada uno de manera simultánea debería decidir si iba al fútbol o iba al cine.
Ambos prefieren ir al mismo sitio porque desean estar juntos, sin embargo, la novia

35
Apuntes de Teoría de Juegos

prefiere el cine y el novio el fútbol. A continuación, se representa el juego en la forma


estratégica:

2
1 Cine Fútbol

Cine 2,1 0,0

Fútbol 0,0 1,2

Figura 2.16

Primero, los jugadores no tienen estrategias dominadas. Segundo, por el método de la


mejor respuesta se encuentran dos equilibrios de Nash: {Cine, Cine} y (Fútbol, Fútbol}.
Más adelante este juego será revisitado y se comprenderá que hay un tercer equilibrio
en estrategias mixtas. Tercero, pasar de un equilibrio a otro implica necesariamente
que la ganancia de un jugador aumenta y del otro disminuye. Cuarto, la predicción de la
solución del juego no es del todo clara. Hay un riesgo latente que no se produzca el
encuentro en ninguno de los dos sitios, es decir, que uno vaya al cine y el otro al fútbol.
En ese escenario las ganancias son cero para ambos.

Los juegos con la estructura de la batalla de los sexos son una combinación de juegos de
conflicto puro y mutua dependencia.

Por su característica de conflicto puro, no se debería esperar colaboración. Por su


característica de mutua dependencia, se espera que exista algún tipo de colaboración o
mutua acomodación.

Se consideran como juegos de negociación. En este tipo de juegos está presente el


elemento esencial de los juegos de estrategia: la mejor respuesta de cada uno depende
espera de lo que cada jugador espere que haga el otro jugador.

36
Apuntes de Teoría de Juegos

3. Matching pennies

Dos jugadores están dotados con una moneda y deben escoger de manera simultánea
entre cara y sello. Si ambos escogen lo mismo el jugador uno gana 1 y el jugador dos
pierde 1. Si ambos escogen diferente, el jugador uno pierde uno y el jugador dos gana
1. A continuación, se representa el juego en la forma estratégica:

2
1 Cara Sello

Cara 1,-1 -1,1

Sello -1,1 1,-1

Figura 2.17

Primero, este es un juego que se conoce como de juego de conflicto puro. Un jugador
gana y el otro pierde. También se conocen como juegos de suma cero ya que la suma de
las ganancias es cero. Segundo, ninguno de los dos jugadores tiene estrategias
dominadas. Tercero, no tiene equilibrio de Nash en estrategias puras. Sin embargo,
como se verá más adelante, tiene un equilibrio de Nash en estrategias mixtas.

2.13 Aplicaciones sobre el equilibrio de Nash

A continuación, se revisarán dos aplicaciones del equilibrio de Nash. A diferencia de los


ejemplos que se han revisado anteriormente, en que los jugadores tenían estrategias
discretas, en estas aplicaciones, los jugadores deben decidir sobre estrategias
continuas. Por este motivo, la representación estratégica se realiza con gráficos y no
con matrices.

La primera aplicación es un juego de complementarios estratégicos. Usted notará que


las curvas de mejor respuesta tienen pendiente positiva. La segunda aplicación es un

37
Apuntes de Teoría de Juegos

juego de sustitutos estratégicos. Usted notará que las funciones de mejor respuesta
tienen pendiente negativa.

Aplicación 3.- El modelo del mínimo esfuerzo

Los jugadores son dos estudiantes que han sido contratados para una asesoría por un
pequeño empresario. La función de beneficios de la empresa se describe así: “cuatro
veces el esfuerzo del jugador uno más cuatro veces el esfuerzo del jugador dos más
cuatro veces el producto de sus esfuerzos multiplicados por un parámetro b”. El
parámetro b se puede considerar como un elemento que recoge la sinergia que genera
que ambos estudiantes trabajen de manera conjunta como un equipo. Por simplicidad,
suponga que el parámetro b puede ser mayor o igual a cero y menor o igual a ¼ (0 ≤ b
≤ ¼)

Los esfuerzos se medirán de manera individual y cada uno decidirá cuanto esfuerzo,
medido en tiempo, le dedicará a la empresa. El número de horas (estrategias) que le
puede dedicar cada estudiante está en el rango entre cero y cuatro horas.

Las ganancias de los jugadores corresponden a un medio de los beneficios de la


empresa menos sus costos. La función de costos es individual y es igual al esfuerzo
individual al cuadrado.

En síntesis:

• Jugadores: {Estudiante uno y estudiante dos}


• Estrategias: 𝑆𝑖 = [0, 4 horas]
• Ganancias de los jugadores:

𝑈1 (𝑠1 , 𝑠2 ) = ½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠12

𝑈2 (𝑠1 , 𝑠2 ) = ½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠22

Donde, la función de beneficio de la empresa es 4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )

38
Apuntes de Teoría de Juegos

Solución:

Cada jugador debe decidir el esfuerzo que le dedicarán al trabajo con el objetivo de
maximizar su función de ganancias:

Función objetivo del jugador uno:

Max 𝑈1 (𝑠1 , 𝑠2 ) = Max {½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠12 }


𝑠1 𝑠1
Para encontrar la cantidad de esfuerzo óptima se debe derivar la función objetivo:

𝑑𝑈1
= 2 + 2 b 𝑠2 – 2𝑠1
𝑑𝑠1

Y luego, de acuerdo a la condición de primer orden para encontrar un máximo (o un


𝑑𝑈1
mínimo) se debe igualar a cero ( = 0):
𝑑𝑠1

2 + 2 b 𝑠2 – 2 𝑠̂1 = 0

𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )

donde 𝑠̂1 = 𝑅1 (𝑠2 ) es la función de mejor repuesta del estudiante uno. Observe que su
función depende de la estrategia del estudiante dos y que tiene pendiente (el parámetro
b) positiva.

De manera simétrica se determina la función de mejor respuesta del jugador dos:

Max 𝑈2 (𝑠1 , 𝑠2 ) = Max {½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠22 }


𝑠2 𝑠2
Para encontrar la cantidad de esfuerzo óptima se debe derivar la función objetivo:

𝑑𝑈2
= 2 + 2 b 𝑠1 – 2𝑠2
𝑑𝑠2

Y luego, de acuerdo a la condición de primer orden para encontrar un máximo se debe


𝑑𝑈2
igualar a cero ( = 0):
𝑑𝑠2

2 + 2 b 𝑠1 – 2 𝑠̂ 2 = 0

𝑠̂2 = 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )

39
Apuntes de Teoría de Juegos

donde 𝑠̂2 = 𝑅2 (𝑠1 ) es la función de mejor repuesta del estudiante dos. Observe que su
función depende de la estrategia del estudiante uno y que su pendiente (parámetro b)
es positiva.

Los rangos de trabajo que van entre 0 y 1 y entre 2 y 4 son estrategias dominadas. La
mejor respuesta de ambos jugadores estará entre 1 y 2 horas de trabajo, es decir, para
ninguno de los dos será una mejor respuesta trabajar menos de una hora ni tampoco
será una mejor respuesta trabajar más de dos horas.

Note que por eliminación de estrategias dominadas (que nunca serán una mejor
respuesta) el equilibrio converge hasta el punto en que las funciones de mejor
respuesta son iguales. Ese punto es el equilibrio de Nash y se caracteriza porque
ninguno de los dos tiene incentivos a desviarse o de tomar una estrategia distinta
(trabajar más o menos horas en el proyecto).

Para determinar el equilibrio de Nash se debe resolver el sistema de ecuaciones


formados por las funciones de mejor respuesta de ambos jugadores:

𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )

𝑠̂ 2= 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )

40
Apuntes de Teoría de Juegos

y el resultado que se obtiene es la estrategia óptima para cada jugador:

1
𝑠1∗ = 𝑠2∗ = (1−𝑏)

el resultado depende del valor que tome el parámetro b (recuerde que en términos
matemáticos el parámetro b es la pendiente de las funciones de mejor respuesta). Por
ejemplo:

• Si b = 1/4 entonces 𝑠1∗ = 𝑠2∗ = 1,33 horas.


• Si b = 1/5 entonces 𝑠1∗ = 𝑠2∗ = 1,25 horas.

Pregunta 2.3.

¿Por qué cree que los estudiantes destinan tan pocas horas al proyecto?

Aplicación 4.- El modelo de Cournot

Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, los vienen
son sustitutos perfectos.

Las empresas deben decidir cuánto producir (estrategias)

Suponga que la demanda inversa del bien que las empresas producen está determinada
por la siguiente función:

P(q) = 12 – q, donde q = 𝑞1 + 𝑞2

Donde, 𝑞1 representa la producción de la empresa uno y 𝑞2 representa la producción de


la empresa dos.

Las ganancias son los beneficios económicos, es decir, la diferencia entre los ingresos
(I) y los costos totales (C). Los ingresos totales es el producto de lo que produce
(suponga que vende todo lo que produce) y el precio. Por simplicidad suponga que los
costos totales son iguales a cero. Las funciones de ganancias se expresan a continuación:

𝑈1 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞1 − 0

41
Apuntes de Teoría de Juegos

𝑈1 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1

𝑈2 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈2 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞2 − 𝐶2
𝑈2 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞2 − 0
𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2

Solución:

1° Encontrar la función de mejor respuesta de la empresa uno. Como se supone que la


empresa es racional y que tiene como objetivo la maximización de sus ganancias,
planteamos el problema como un problema de optimización:

Max 𝑈1 (𝑞1 , 𝑞2 ) = Max [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1


𝑞1 𝑞1

para luego derivar:

𝑑𝑈1
= 12 − 2𝑞1 − 𝑞2
𝑑𝑞1

e igualar a cero (condición de primer orden para un máximo):

12 − 2𝑞1 − 𝑞2 = 0

𝑞2
𝑞̂1 = 𝑅1 (𝑞2 ) = 6 - 2

Donde 𝑞̂1 = 𝑅1 (𝑞2 ) es la función de mejor respuesta de la empresa uno. Note que es
función de la cantidad que decida producir la empresa dos.

2° Encontrar la función de mejor respuesta de la empresa dos. Como se supone que la


empresa es racional y que tiene como objetivo la maximización de sus ganancias,
planteamos el problema como un problema de optimización:

Max 𝑈2 (𝑞1 , 𝑞2 ) = Max [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2


𝑞2 𝑞2

para luego derivar:

42
Apuntes de Teoría de Juegos

𝑑𝑈2
= 12 − 𝑞1 − 2𝑞2
𝑑𝑞2

e igualar a cero (condición de primer orden para un máximo):

12 − 𝑞1 − 2𝑞2 = 0

𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 - 2

Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que es
función de la cantidad que decida producir la empresa uno.

El equilibrio de Nash se encuentra en la intersección de ambas funciones de mejor


respuesta. Desde el equilibrio de Nash, las empresas no tienen incentivos a desviarse.
No obstante este resultado, el equilibrio de Cournot es un equilibrio Pareto dominado,
es decir, si ambas empresas cooperaran (se coludieran10) podrían aumentar sus
ganancias.

Note la línea de colusión. En esta línea las empresas están produciendo entre ambas 6
unidades, que es la cantidad de monopolio. Cuando las empresas se ubican en colusión,
es necesario que estas cooperen para mantenerlo, por lo que se encuentran en un

10 Tenga presente que la colusión no es legal.

43
Apuntes de Teoría de Juegos

equilibrio inestable, puesto que existen incentivos para desviarse de estas estrategias
cooperativas, aumentando la cantidad de producción unilateralmente, ya que esto
incrementaría el beneficio individual.

Lo descrito comienza con una de las dos empresas desviándose de la colusión,


aumentando su producción, por consiguiente, la otra decide adoptar la misma
estrategia y así hasta que alcanzan una cantidad de equilibrio, correspondiente a 4
unidades para cada empresa.

Cuando ocurre lo anterior, en el gráfico se puede apreciar un movimiento que se


asemeja al del teorema de la telaraña, de tipo convergente, en el cual se explica la
interdependencia en las decisiones que existe entre cada jugador.

Por lo tanto, colusión no es un equilibrio estable ya que no está en la función de mejor


respuesta de las empresas (excepto cuando la respuesta de una empresa sea producir
cero) por lo que ambas empresas poseen incentivos a desviarse hasta el equilibrio de
Nash.

Para determinar el equilibrio de Nash se debe resolver el sistema de ecuaciones


formados por las funciones de mejor respuesta de ambos jugadores:
𝑞2
𝑞̂1 = 𝑅1 (𝑞2 ) = 6 - 2

𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 - 2

Obteniendo el siguiente resultado:


q∗1 = q∗2 = 4

El modelo de Cournot con estrategias discretas.

Suponga que las empresas sólo tienen tres estrategias: producir tres unidades, producir
cuatro unidades o producir seis unidades11, es decir:
• S1 = {3, 4, 6}
• S2 = {3, 4, 6}

11 Estrategia de colusión, estrategia de Cournot y la estrategia de monopolio, respectivamente.

44
Apuntes de Teoría de Juegos

Para estimar las ganancias se debe reemplazar en las funciones respectivas:


• 𝑈1 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1
• 𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2

Por ejemplo
• 𝑈1 (4, 3) = [12 – (4 + 3)] * 4 = 20
• 𝑈2 (4, 3) = [12 – (4 + 3)] * 3 = 15

Es decir, si la empresa uno decide producir cuatro unidades y la empresa dos decide
producir tres unidades, las ganancias que obtienen son 20 y 15 respectivamente.
Haciendo ejercicio para los nueve perfiles estratégicos Ui (3, 3), Ui (3, 4), Ui (3, 6), Ui (4,
3), Ui (4, 4), Ui (4, 6), Ui (6, 3), Ui (6, 4), Ui (6, 6), el juego se puede representar
estratégicamente:

2
1 3 4 6

3 18,18 15,20 9,18

4 20,15 16,16 8,12

6 18,9 12,8 0,0

Figura 2.20

En primer lugar, la estrategia de producir seis unidades es una estrategia dominada


para ambos jugadores. Observe que para ninguna empresa jugar seis es una mejor
respuesta.

En segundo lugar, el equilibrio de Nash se encuentra en el punto que ambas empresas


deciden producir cuatro unidades. Observe que ninguna de las empresas tiene
incentivos a desviarse a cualquiera de las otras dos estrategias. Si se desviasen a

45
Apuntes de Teoría de Juegos

producir tres unidades sus ganancias caerían a 15 y si se desviasen a producir seis


unidades sus ganancias caerían 12.

Por último, el equilibrio cooperativo o colusivo es aquel en que ambas empresas


decidiesen producir tres unidades (es decir, seis unidades conjuntamente que es la
cantidad de monopolio). Este equilibrio es, sin embargo, inestable: ambas empresas
tienen incentivos a desviarse. Si una de las empresas se desviase a producir cuatro
unidades en tanto la otra se mantuviera en tres, las ganancias de la primera
aumentarían a 20.

Tarea 2.4.12
Suponga dos empresas que producen un bien homogéneo. Ambas deben decidir de
manera simultánea que precio cobrarán. Suponga que la función de demanda de la
empresa uno (𝑞1 ) es: 𝑎 − 𝑝1 cuando 𝑝1 > 𝑝2 ; 0 cuando 𝑝1 < 𝑝2 ; y (𝑎 − 𝑝1 )⁄2, cuando 𝑝1
= 𝑝2 . Suponga que no hay costos fijos y que ambas empresas tienen un costo marginal
de c, donde c < 𝑎. Muestre que el único equilibrio de Nash es que ambas empresas
cobran el precio c.

2.14 Juegos de tres jugadores

Emilia, Nina y Talía son tres vecinas que deben decidir simultáneamente si contribuyen
(C) o no contribuyen (NC) a la creación de un jardín en el pasaje que viven. Dependiendo
de las contribuciones, el tamaño del jardín será pequeño, mediano o grande. Emilia es
la jugadora uno, Nina la jugadora dos y Talía la jugadora tres. Talía debe decidir una de
las dos matrices. Si elige la matriz I decide contribuir; si decide la matriz II, decide no
contribuir al proyecto.

La representación estratégica del juego se presenta a continuación13:

12 Revise el modelo de Bertrand en Tirole, J.


13 Para más detalles de este juego, consultar Dixit y Skeath.

46
Apuntes de Teoría de Juegos

Nina Nina
Emilia C NC Emilia C NC

C 5,5,5 3,6,3 C 3,3,6 1,4,4

NC 6,3,3 4,4,1 NC 4,1,4 2,2,2

Talía contribuye Talía no contribuye


Figura 2.21 Figura 2.22

Solución por mejor respuesta

• Encuentre las mejores respuestas de Emilia ante las posibles jugadas de Nina:
o En la figura 2.21, si Nina decide contribuir, la mejor respuesta de Emilia es no
contribuir porque la ganancia de 6 es mayor que 5. Si Nina decide no contribuir,
la mejor respuesta de Emilia es no contribuir porque 4 es mayor que 3.
o En la figura 2.22, si Nina decide contribuir, la mejor respuesta de Emilia es no
contribuir porque 4 es mayor que 3. Si Nina decide no contribuir, la mejor
respuesta de Emilia es no contribuir porque 2 es mayor que 1.
• Encuentre las mejores respuestas de Nina ante las posibles jugadas de Emilia:
o En la figura 22.1, si Emilia decide contribuir, la mejor respuesta de Nina es no
contribuir porque 6 es mayor que 5. Si Emilia decide no contribuir, la mejor
respuesta de Nina es no contribuir porque 4 es mayor que 3.
o En la figura 22.2, si Emilia decide contribuir, la mejor respuesta de Nina es no
contribuir porque 4 es mayor que 3. Si Emilia decide no contribuir, la mejor
respuesta de Nina es no contribuir porque 2 es mayor que 1.
• Encuentre las mejores respuestas de Talía ante las combinaciones de estrategias de
Emilia y Nina:
o Si Emilia y Nina deciden contribuir, la mejor respuesta de Talía es no contribuir
(elegir la matriz de la figura 22.2) porque la ganancia de 6 es mayor que 5.

47
Apuntes de Teoría de Juegos

o Si Emilia decide contribuir y Nina decide no contribuir, la mejor respuesta de


Talía es no contribuir porque 4 es mayor que 3.
o Si Emilia decide no contribuir y Nina decide contribuir, la mejor respuesta de
Talía es no contribuir porque 4 es mayor que 3.
o Si Emilia y Nina deciden no contribuir, la mejor respuesta de Talía es no
contribuir porque la ganancia de 2 es mayor que 1.

Como se puede observar, el equilibrio de Nash de este juego es {NC, NC, NC} que lleva
asociado ganancias de (2,2,2). Es un equilibrio Pareto dominado ya que las tres
jugadoras hubiesen obtenido ganancias más altas si hubiesen contribuido. Este es un
juego de dilema.

Solución por dominancia

1° Encuentre si Emilia tiene estrategias dominada. Observe que independientemente


de lo que decida Nina y Talía, es decir, en las dos matrices, la ganancia que obtiene
Emilia por contribuir es menor que la ganancia que obtiene por no contribuir. Se deduce
entonces que la estrategia contribuir está dominada por la estrategia no contribuir.
Como suponemos que Emilia es una jugadora racional, sabemos que no jugará la
estrategia contribuir y, por lo tanto, se puede eliminar de su conjunto estratégico. El
juego queda reducido a:

Nina Nina
Emilia C NC Emilia C NC

NC 6,3,3 4,4,1 NC 4,1,4 2,2,2

Talía contribuye Talía no contribuye


Figura 2.23 Figura 2.24

2° Encuentre si Nina tiene estrategias dominadas. Observe que independientemente de


lo que decida Talía (sabemos que Emilia contribuirá), la ganancia que obtiene Nina por
contribuir es menor que la ganancia que obtiene por no contribuir (4 es mayor que 3
48
Apuntes de Teoría de Juegos

en caso que Talía contribuya y 2 es mayor que 1 en caso que Talía no contribuya). Se
deduce entonces que la estrategia contribuir está dominada por la estrategia no
contribuir. Como suponemos que Nina es una jugadora racional, sabemos que no jugará
la estrategia contribuir y, por lo tanto, se puede eliminar de su conjunto estratégico. El
juego queda reducido a:

Nina Nina
Emilia NC Emilia NC

NC 4,4,1 NC 2,2,2

Talía contribuye Talía no contribuye


Figura 2.25 Figura 2.26

3° Determine se Talía tiene estrategias dominadas: Luego de haber eliminado las


estrategias dominadas de Emilia y Nina, la estrategia de Talía de contribuir es dominada
por la estrategia no contribuir porque la ganancia de 2 es mayor que 1. En virtud de la
racionalidad de Talía, la estrategia contribuir puede ser eliminada. La nueva
representación del juego se presenta a continuación:

Nina
Emilia NC

NC 2,2,2

Talía no contribuye
Figura 2.27

El único perfil estratégico que sobrevivió fue {NC, NC, NC} que constituye un equilibrio
de Nash.

49
Apuntes de Teoría de Juegos

Las tres jugadoras tenían una estrategia dominada. Aquí se comenzó con Emilia y
finalizó con Talía, pero el orden pudiese sido diferente y el resultado el mismo.

Note que las estrategias dominadas “contribuir” no son una estrategia de mejor
respuesta y las estrategias de mejor respuesta de “no contribuir” no son estrategias
dominadas.

2.15 Introducción a las estrategias mixtas

Considere el siguiente juego:

2
1 L R

U 5,1 0,2

M 1,3 4,1

D 4,2 2,3

Figura 2.28

El juego ilustrado en la figura anterior tiene tres características principales:

1° Ningún jugador tiene estrategias dominadas

2° No hay equilibrio de Nash en estrategias puras.

3° Cuando el jugador uno tiene una creencia (y le asigna una probabilidad igual a uno a
dicha creencia) sobre lo que jugará el jugador dos, la estrategia D no es nunca una mejor
respuesta.

La creencia de un jugador respecto a lo que va a jugar el otro jugador se configura


matemáticamente a través de la asignación de probabilidades. Cuando se asigna una

50
Apuntes de Teoría de Juegos

probabilidad igual a uno a la creencia que un determinado jugador tiene respecto a la


estrategia que jugará el otro jugador, decimos que aquella estrategia es una estrategia
pura14 y resolvemos en el mundo de la certidumbre. Por ejemplo:

• Si el jugador uno tuviese certeza que el jugador dos jugará L, es decir, la


probabilidad que le asigna a la ocurrencia del evento es igual a uno, entonces su
mejor respuesta sería jugar U porque 5 es mayor que 1 y 4. Entonces U es la
mejor respuesta para L.
• Si el jugador uno tuviese certeza que el jugador dos jugará R, es decir, le asigna
una probabilidad igual a uno a dicha creencia, entonces su mejor respuesta sería
jugar M porque 4 es mayor que 0 y 2. Entonces M es la mejor respuesta para R.

Sin embargo, la inexistencia de un equilibrio de Nash en estrategias puras nos entrega


incertidumbre respecto a lo que puede decidir el jugador dos.

La probabilidad que el jugador dos juegue L la denotaremos P2(L) y la probabilidad que


el jugador dos juegue R la denotaremos P2(R). Por definición:

P2(L) + P2(R) = 115

Por lo tanto, considere algunos casos:

• si P2(L) = 1 y P2(R) = 1 - P2(L) entonces P2(R) = 0


• si P2(L) = 1/2 y P2(R) = 1 - P2(L) entonces P2(R) = 1/2
• si P2(L) = 1/3 y P2(R) = 1 - P2(L) entonces P2(R) = 2/3
• si P2(L) = 1/4 y P2(R) = 1 - P2(L) entonces P2(R) = 3/4
• si P2(L) = 0 y P2(R) = 1 - P2(L) entonces P2(R) = 1

Con estos antecedentes, el jugador uno puede calcular su ganancia esperada (UE1)
considerando:

1° Sus estrategias

14 Una estrategia es pura cuando la probabilidad que le asigna un jugador a su creencia respecto a
lo que jugará el otro jugador es igual a uno.
15 La suma de las probabilidades debe ser siempre igual a uno. Por lo tanto, las probabilidades están

en un rango entre cero y uno, inclusive.

51
Apuntes de Teoría de Juegos

2° Sus creencias sobre la decisión del jugador dos.

La ganancia esperada del jugador uno de jugar U con la creencia que el jugador dos
jugará L con probabilidad P2(L):

UE1 (U) vs. [(P2(L), P2(R)] = [P2(L) * 5] + [P2(R) * 0]

Por ejemplo, se podría hacer una especulación y suponer que el jugador dos jugará L
con una probabilidad de ½ y, por lo tanto, jugará R con una probabilidad de ½.

La ganancia esperada del jugador uno de jugar U, con la creencia que el jugador dos
jugará L con probabilidad de ½, es:

UE1 (U) vs. [(P2(L), P2(R)] = UE1 (U) vs. [1/2, 1/2) = [(1/2) * 5] + [(1/2) * 0] = 2,5

El mismo ejercicio se puede realizar para calcular las ganancias esperadas del jugador
uno de jugar M o D, dada la creencia arbitraria que el jugador dos jugará L con una
probabilidad de ½:

UE1 (M) vs. [(P2(L), P2(R)] = UE1 (M) vs. (1/2, 1/2) = [(1/2) * 1] + [(1/2) * 4] = 2,5

UE1 (D) vs. [(P2(L), P2(R)] = UE1 (D) vs. (1/2, 1/2) = [(1/2) * 4] + [(1/2) * 2] = 3

Entonces, si la creencia del jugador uno es que el jugador dos jugará L con una
probabilidad de 1/2 (y por lo tanto jugará R con una probabilidad de 1/2), la mejor
respuesta del jugador uno ante esa creencia es jugar D porque la ganancia esperada es
3 mayor a 2,5 que son las ganancias esperadas que obtendría al jugar U o M.

Un punto crucial es cómo se configuran las creencias. Suponga que la creencia del
jugador uno cambia y la probabilidad que le asigna a que el jugador dos juegue L fuese
de 2/3. En tal caso, el cálculo de las ganancias esperadas también cambia haciendo del
proceso de toma de decisiones algo muy complicado y lento.
Con el fin de simplificar y facilitar el proceso de la toma de decisiones, se presenta un
método gráfico – algebraico. Procedimiento:

1° Trace tres líneas que representen las ganancias esperadas del jugador uno para cada
una de sus estrategias (U, M o D). Las ganancias esperadas del jugador uno son función

52
Apuntes de Teoría de Juegos

de la probabilidad que le asigna a que el jugador dos juegue R. Por este motivo, en el eje
de las abscisas (eje X) se representa la variable P2 (R).
• UE1 [U, P2(R)] = [5 * (1 - P2(R))16 + 0 * P2(R)]

Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos juegue
R, es decir: P2(R) = 0, está implícitamente asignando una probabilidad de uno a
que juegue L, es decir: P2(L) = 1. Si este fuese el caso la ganancia esperada del
jugador uno de jugar U ante esa creencia sería 5.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos juegue
R, es decir: P2(R) = 1, está implícitamente asignando una probabilidad de cero a
que juegue L, es decir, P2(L) = 0. Si este fuese el caso la ganancia esperada del
jugador uno de jugar U ante esa creencia sería 0.
• UE1 [M, P2(R)] = [1 * (1 - P2(R)) + 4 * P2(R)]

Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar M ante esa creencia sería 1.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar M ante esa creencia sería 4.
• UE1 [D, P2(R)] = [4 * (1 - P2(R)) + 2 * P2(R)]

Note que:

o si el jugador uno le asigna una probabilidad de cero a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar D ante esa creencia sería 4.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos juegue
R, la ganancia esperada del jugador uno de jugar D ante esa creencia sería 2.

16 Recuerde que (1 - P2(R)) = P2(L)

53
Apuntes de Teoría de Juegos

Para trazar las tres líneas (una para cada estrategia del jugador uno) una los puntos de
las ganancias esperadas cuando las probabilidades que el jugador dos juega R sean cero
y uno.

2° Las líneas se cruzan en tres puntos (sólo dos puntos son relevantes, ¿por qué?).
Dichos cruces implican que la ganancia esperada del jugador uno es la misma. Si la
ganancia esperada es la misma, el jugador uno debe ser indiferente entre las dos
estrategias. El objetivo es encontrar la probabilidad que el jugador dos juegue R que
hace que las dos estrategias del jugador uno, sean indiferentes.

Para determinar una política de decisión para el jugador uno proceda, sólo con los
puntos relevantes, de la siguiente manera:

a) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno sea
indiferente entre jugar U o D. Como se dijo, si son indiferentes, las ganancias
esperadas son iguales:

UE1 [U, P2(R)] = UE1 [D, P2(R)]

[5 * (1 - P2(R)) + 0 * P2(R)] = [4 * (1 - P2(R)) + 2 * P2(R)]

P2(R) = 1/3

54
Apuntes de Teoría de Juegos

Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará R es
igual a 1/3, el jugador uno será indiferente entre jugar U o D porque la ganancia
esperada es igual.

La ganancia esperada es 10/3 y se obtiene evaluando el resultado en las funciones de


ganancia esperada:

UE1 [U, 1/3] = [5 * (1 – 1/3)) + 0 * 1/3] = 10/3

UE1 [D, 1/3] = [4 * (1 – 1/3)) + 2 * 1/3] = 10/3

b) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno sea
indiferente entre jugar M o D:

UE1 [M, P2(R)] = UE1 [D, P2(R)]

[1 * (1 - P2(R)) + 4 * P2(R)] = [4 * (1 - P2(R)) + 2 * P2(R)]

P2(R)) = 3/5

Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará R es
igual a 3/5, el jugador uno será indiferente entre jugar M o D porque la ganancia
esperada es la misma.

La ganancia esperada es 14/5 y se obtiene evaluando el resultado en las funciones de


ganancia esperada:

UE1 [M, 3/5] = [1 * (1 – 3/5)) + 4 * 3/5] = 14/5

UE1 [D, 3/5] = [4 * (1 – 3/5)) + 2 * 3/5] = 14/5

3° Generar una política de decisión para el jugador uno en función de las creencias
sobre las estrategias del jugador dos:

Si: 0 ≤ P2(R) < 1/3 juegue U


Si: P2(R) = 1/3 juegue U o D
Si: 1/3 < P2(R) < 3/5 juegue D
Si: P2(R) = 3/5 juegue M o D

55
Apuntes de Teoría de Juegos

Si: 3/5 < P2(R) ≤ 1 juegue M

Definición: una estrategia 𝑠̂ 𝑖 es una mejor respuesta del jugador i (𝑅𝑖 ), respecto a la
creencia p (donde p representa la distribución de probabilidades) acerca de las
elecciones del resto de los jugadores (-i), si se cumple que la ganancia esperada de jugar
𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ para toda combinación de probabilidades de las
estrategias 𝑆−𝑖 (las estrategias de todo el resto de los jugadores, es decir, de todos los
jugadores menos el jugador i):

𝑈𝐸𝑖 (𝑠̂𝑖 , p) > 𝑈𝐸𝑖 (si´, p)

También se puede expresar que la estrategia 𝑠̂𝑖 resuelve el problema de optimización:

Max 𝑈𝐸𝑖 (𝑆𝑖 , 𝑆−𝑖 )


𝑠𝑖

Ejercicio 2.3
De acuerdo al siguiente juego:
2
1 C S

C 1,2 0,0

S 0,0 2,1

B -1,4 3,1

Figura 2.30

Genere una política de decisión para el jugador uno.

56
Apuntes de Teoría de Juegos

2.16. Equilibrio de Nash en estrategias mixtas

Las estrategias mixtas es una aleatorización de estrategias puras, es decir, describe la


selección aleatoria entre posibles estrategias puras, lo que determina una distribución
de probabilidad sobre el vector de estrategias de cada jugador.

La ganancia esperada del jugador i de una estrategia mixta Pi (P por probabilidad) es


un promedio ponderado de las ganancias esperadas de cada una de las estrategias
puras consideradas en la mezcla.

Definición: En la representación estratégica de un juego de dos jugadores G = {S 1, S2; u1,


u2}, las estrategias mixtas {𝑝1∗ , 𝑝2∗ } son un equilibrio de Nash si cada estrategia mixta es
una mejor respuesta a las estrategias mixtas del otro jugador.

Para que el par de estrategias mixtas {𝑝1∗ , 𝑝2∗ } sea un equilibrio de Nash se deben
satisfacer dos condiciones:

Condición 1: 𝑈𝐸1 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸1 {𝑝1 , 𝑝2∗ }, para cada distribución de probabilidad de
p1 sobre S1, y

Condición 2: 𝑈𝐸2 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸2 {𝑝1∗ , 𝑝2 }, para cada distribución de probabilidad de
p2 sobre S2.

Ejemplo 1.- La batalla de los sexos revisitada

En la figura 2.31 se reproduce la batalla de los sexos representada en la figura 2.16. Una
pareja se pone de acuerdo para salir al día siguiente después del trabajo. Las estrategias
son ir al cine (C) o ir al fútbol (F). Cuando llega la tarde del día siguiente, ambos se dan
cuenta que no habían coordinado el lugar en el que se reunirían. Por lo tanto, cada uno
de manera simultánea, con información imperfecta, debería decidir si iba al fútbol o iba
al cine. Ambos prefieren ir al mismo sitio porque desean estar juntos, sin embargo, la
novia prefiere el cine y el novio el fútbol.

57
Apuntes de Teoría de Juegos

En estrategias puras, el juego tiene dos equilibrios de Nash: {Cine, Cine} y {Fútbol,
Fútbol}. En adelante, se procederá a encontrar el equilibrio de Nash en estrategias
mixtas17.

Antes de proceder recuerde que definimos este juego como de negociación,


caracterizado por ser una combinación de juegos de conflicto puro y mutua
dependencia.

Por su componente de mutua dependencia, se espera que exista algún tipo de


colaboración o mutua acomodación y por su componente de conflicto puro, no se
debería esperar colaboración.

A continuación, se representa el juego en la forma estratégica:

2
1 C F

C 2,1 0,0 p

F 0,0 1,2 1–p

q 1-q
Q
Figura 2.31

• P es la mezcla con que el jugador uno está jugando C y F. La estrategia mixta del
jugador uno es (p, 1 – p), es decir, jugar C con una probabilidad de p y jugar F con
una probabilidad de 1 – p.

17 Aunque todos los juegos tienen equilibrio de Nash en estrategias puras y/o mixtas, hay juegos que
tienen equilibrio de Nash sólo en estrategias puras (como los juegos de dilema); hay otros que tienen
equilibrios de Nash sólo en estrategias mixtas (como los juegos de conflicto puro); hay otros juegos
que tienen equilibrios de Nash en estrategias puras y estrategias mixtas (como los juegos de
negociación).

58
Apuntes de Teoría de Juegos

• Q es la mezcla con que el jugador dos está jugando C y F. La estrategia mixta del
jugador dos es (q, 1 – q), es decir, jugar C con una probabilidad de q y jugar F con
una probabilidad de 1 – q.

Lo anterior se interpreta de la siguiente forma:

El jugador uno cree que el jugador dos jugará C con una probabilidad q y que jugará F
con una probabilidad 1 – q.

El jugador dos cree que el jugador uno jugará C con una probabilidad p y que jugará F
con una probabilidad 1 – p.

Solución:

La solución y comprobación del equilibrio de Nash en estrategias mixtas se obtiene a


través de una serie de pasos:

1° Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente entre ir al
cine o al fútbol.

Se calculan e igualan las ganancias esperadas de jugador uno al jugar C y F versus la


mezcla del jugador dos (Q):

UE1 (C, Q) = 2*q + 0*(1- q)

UE1 (F, Q) = 0*q + 1*(1- q)

Para el jugador uno, la decisión de ir al cine o al fútbol es indiferente si sus ganancias


esperadas (versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:

UE1 (C, Q) = UE1 (F, Q)

2*q + 0*(1- q) = 0*q + 1*(1- q)

2q = 1 – q

q = 1/3

Para el jugador uno, las estrategias cine y fútbol son indiferentes, si el jugador dos va al
cine con una probabilidad de q = 1/3 y al fútbol con una probabilidad 1 – q = 2/3.

59
Apuntes de Teoría de Juegos

¿Cuál es la ganancia esperada del jugador uno al jugar C contra la estrategia mixta del
jugador dos Q = (1/3, 2/3)? ¿Cuál es la ganancia esperada del jugador uno al jugar F
contra la estrategia mixta del jugador dos Q = (1/3, 2/3)?

UE1 (C, Q) = 2*q + 0*(1- q) = 2 * (1/3) + 0 * (2/3) = 2/3

UE1 (F, Q) = 0*q + 1*(1- q) = 0 * (1/3) + 1 * (2/3) = 2/3

Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/3, 2/3), las
ganancias esperadas del jugador uno al jugar cine o fútbol son iguales.

Pregunta 2.4

¿Cuál sería la mejor respuesta del jugador uno si su creencia fuese que el jugador dos
jugará C con una probabilidad mayor a 1/3? ¿Cuál sería la mejor respuesta del jugador
uno si su creencia fuese que el jugador dos jugará C con una probabilidad menor a 1/3?

2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre ir al
cine o al fútbol.

Se calculan e igualan las ganancias esperadas de jugador dos al jugar C y F versus la


mezcla del jugador uno (P):

UE2 (P, C) = 1*p + 0*(1- p)

UE2 (P, F) = 0*p + 2*(1- p)

Para el jugador dos, la decisión de ir al cine o al fútbol es indiferente si sus ganancias


esperadas (versus la estrategia mixta P del jugador uno) son iguales, es decir, si:

UE2 (P, C) = UE2 (P, F)

1*p + 0*(1- p) = 0*p + 2*(1- p)

p = 2/3

Para el jugador dos, las estrategias cine y fútbol son indiferentes, si el jugador uno va al
cine con una probabilidad de p = 2/3 y al fútbol con una probabilidad 1 – p = 1/3.

60
Apuntes de Teoría de Juegos

¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta del
jugador uno P = (2/3, 1/3)? ¿Cuál es la ganancia esperada del jugador dos al jugar F
contra la estrategia mixta del jugador uno P = (2/3, 1/3)?

UE2 (P, C) = 1*p + 0*(1- p) = 1 * (2/3) + 0 * (1/3) = 2/3

UE2 (P, F) = 0*p + 2*(1- p) = 0 * 2/3 + 2 * (1/3) = 2/3

Queda comprobado entonces que si el jugador uno jugara la mezcla P = (2/3, 1/3), las
ganancias esperadas del jugador al jugar cine o fútbol dos son iguales.

Pregunta 2.5

¿Cuál sería la mejor respuesta del jugador dos si su creencia fuese que el jugador uno
jugará C con una probabilidad mayor a 2/3? ¿Cuál sería la mejor respuesta del jugador
dos si su creencia fuese que el jugador uno jugará C con una probabilidad menor a 2/3?

3° Determinar si la ganancia esperada del jugador uno al jugar la mezcla P versus la


mezcla del jugador dos Q.

UE1 (P, Q) = p * [UE1 (C, Q)] + (1 - p) * [UE1 (F, Q)]

UE1 (P, Q) = 2/3 * (2/3) + 1/3 * (2/3)

UE1 (P, Q) = 2/3

Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (2/3,
1/3) versus la estrategia mixta Q= (1/3, 2/3) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta Q del
jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.

4° Determinar si la ganancia esperada del jugador dos al jugar la mezcla Q versus la


mezcla del jugador uno P.

UE2 (P, Q) = q * [UE2 (P, C)] + (1 - q) * [UE2 (P, F)]

UE2 (P, Q) = 1/3 * (2/3) + 2/3 * (2/3)

UE2 (P, Q) = 2/3

61
Apuntes de Teoría de Juegos

Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/3,
2/3) versus la estrategia mixta P= (2/3, 1/3) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta P del
jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.

5° El equilibrio de Nash en estrategias mixtas es:

[(p, 1 – p), (q, 1 – q)] = [(2/3, 1/3), (1/3, 2/3)]

6° En conclusión, el juego tiene tres equilibrios de Nash {C, C}, {F, F} y {(2/3, 1/3), (1/3,
2/3)} con sus respectivas ganancias (2, 1), (1, 2) y (2/3, 2/3).

Pregunta 2.6

¿Por qué los jugadores podrían aleatorizar sus estrategias si las ganancias que obtienen
de sus estrategias mixtas son tan pobres, incluso comparadas con la ganancia más baja
de los equilibrios en estrategias puras?

Ejemplo 2. Matching pennies

Recuerde el juego de la figura 2.17 representado nuevamente en la figura 2.32. Dos


jugadores están dotados con una moneda y deben escoger de manera simultánea entre
cara (C) y sello (S). Si ambos escogen lo mismo el jugador uno gana 1 y el jugador dos
pierde 1. Si ambos escogen diferente, el jugador uno pierde uno y el jugador dos gana
1. A continuación, se representa el juego en la forma estratégica:

2
1 C S

C 1,-1 -1,1 p

S -1,1 1,-1 1–p

q 1-q
Q

62
Apuntes de Teoría de Juegos

Figura 2.32

Como se observa el juego no tiene equilibrio de Nash en estrategias puras.

Solución:

1° Encontrar la mezcla Q = (q, 1 – q) del jugador dos que hace al jugador uno indiferente
entre jugar cara o sello.

Se calculan e igualan las ganancias esperadas de jugador uno al jugar C y S versus la


mezcla del jugador dos (Q):

UE1 (C, Q) = 1*q + -1*(1- q)

UE1 (S, Q) = -1*q + 1*(1- q)

Para el jugador uno, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:

UE1 (C, Q) = UE1 (S, Q)

1*q + -1*(1- q) = -1*q + 1*(1- q)

4q = 2

q = 1/2

Para el jugador uno, las estrategias cara y sello son indiferentes si el jugador dos elige
cara con una probabilidad de q = 1/2 y elige sello con una probabilidad 1 – q = 1/2.

La política de decisión del jugador uno debe ser:

Si: q > ½, elija cara


Si: q = ½, elija cara o sello
Si: q < ½, elija sello

¿Cuál es la ganancia esperada del jugador uno al jugar cara contra la estrategia mixta
del jugador dos Q = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador uno al jugar
sello contra la estrategia mixta del jugador dos Q = (1/2, 1/2)?

63
Apuntes de Teoría de Juegos

UE1 (C, Q) = 1*q + -1*(1- q) = 1 * (1/2) + -1 * (1/2) = 0

UE1 (S, Q) = -1*q + 1*(1- q) = -1 * (1/2) + 1 * (1/2) = 0

Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/2 1/2), las
ganancias esperadas del jugador uno al jugar cara o sello son iguales.

2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre jugar
cara o sello.

Se calculan e igualan las ganancias esperadas de jugador dos al jugar C y S versus la


mezcla del jugador uno (P):

UE2 (P, C) = -1*p + 1*(1- p)

UE2 (P, S) = 1*p + -1*(1- p)

Para el jugador dos, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta P del jugador uno) son iguales, es decir, si:

UE2 (P, C) = UE2 (P, S)

-1*p + 1*(1- p) = 1*p + -1*(1- p)

p = 1/2

La política de decisión del jugador dos debe ser:

Si: p > ½, elija sello


Si: p = ½, elija cara o sello
Si: p < ½, elija cara
Para el jugador dos, las estrategias cara y sello son indiferentes, si el jugador uno elige
cara con una probabilidad de p = 1/2 y elige sello con una probabilidad 1 – p = 1/2.

¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta del
jugador uno P = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador dos al jugar S
contra la estrategia mixta del jugador uno P = (1/2, 1/2)?

UE2 (P, C) = 1*p + -1*(1- p) = 1 * (1/2) + -1 * (1/2) = 0

64
Apuntes de Teoría de Juegos

UE2 (P, S) = -1*p + 1*(1- p) = -1 * 1/2 + 1 * (1/2) = 0

Queda comprobado entonces que si el jugador uno jugara la mezcla P = (1/2 1/2), las
ganancias esperadas del jugador dos de jugar cara o sello son iguales.

3° Determinar la ganancia esperada del jugador uno al jugar la mezcla P versus la


mezcla del jugador dos Q.

UE1 (P, Q) = p * [UE1 (C, Q)] + (1 - p) * [UE1 (S, Q)]

UE1 (P, Q) = 1/2 * (0) + 1/2 * (0)

UE1 (P, Q) = 0

Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (1/2,
1/2) versus la estrategia mixta Q = (1/2, 1/2) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta Q del
jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.

4° Determinar la ganancia esperada del jugador dos al jugar la mezcla Q versus la


mezcla del jugador uno P.
UE2 (P, Q) = q * [UE2 (P, C)] + (1 - q) * [UE1 (P, S)]

UE2 (P, Q) = 1/2 * (0) + 2/3 * (0)

UE2 (P, Q) = 0

Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/2,
1/2) versus la estrategia mixta P = (1/2, 1/2) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta P del
jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.

5° El equilibrio de Nash en estrategias mixtas es:


[(p, 1 – p), (q, 1 – q)] = [(1/2, 1/2), (1/2, 1/2)]

Octava conclusión: En la representación estratégica de un juego de n jugadores G = {S 1,


S2,…,Sn; u1, u2,…, un}, si n es finito y Si es finito para cada i entonces existe al menos un
equilibrio de Nash.

65
Apuntes de Teoría de Juegos

Ejercicio 2.4.
Encuentre el o los equilibrios de Nash en estrategias puras y estrategias mixtas del
juego de cachipún representado en su forma estratégica en la siguiente figura:

2
1 Roca Tijera Papel

Roca 0,0 1,-1 -1,1

Tijera -1,1 0,0 1,-1

Papel 1,-1 -1,1 0,0

Figura 2.33

66
Apuntes de Teoría de Juegos

Capítulo Tres

Juegos Dinámicos
3.1. Objetivos del capítulo

Introducir los juegos dinámicos de información completa; su representación en forma


extensiva y estratégica; y cómo resolverlos.

3.2. Aprendizajes esperados

• Representar en forma extensiva


• Representar en forma estratégica
• Aprender el método de inducción hacia atrás
• Determinar el equilibrio de Nash Perfecto en Subjuegos
• Reconocer juegos dinámicos de información perfecta e imperfecta

3.3. Lecturas esenciales

• Gibbons, R. 1992. A primer in Game Theory. Prentice Hall.


• Polack, B. 2007. Econ 159: Game Theory. Open Yale Courses.
• Watson, J. 2008. Strategy. W.W. Norton & Co.

3.4. Lecturas opcionales

- Dixit, A. y Nalebuff, B. Pensar estratégicamente


- Fudenberg, D. y Tirole, J. 1991. Game Theory. MIT Press, Cambridge.
- Osborne, M. y Rubinstein, A. 1994. A Course in Game Theory. The MIT Press.
- Selten, R. ( ). The Chain Store Paradox
- Tirole, J. Organización industrial.

67
Apuntes de Teoría de Juegos

3.5. Introducción al capítulo tres

Este capítulo se concentra en los juegos dinámicos tanto de información perfecta


como imperfecta.

En un juego dinámico los jugadores deciden de manera secuencial, es decir, el jugador


uno decide su acción, el jugador dos observa la decisión del jugador uno, y con ese
conocimiento decide su acción. En un juego dinámico de información imperfecta, los
jugadores deben, en algún estado del juego, jugar de manera simultánea.

Al igual que en el capítulo dos se supone que: (1) los jugadores tienen información
completa, es decir, conocen la función de ganancias de cada jugador; (2) los jugadores
son racionales en el sentido que buscan maximizar sus ganancias, y (3) los jugadores
tienen conocimiento común respecto a las funciones de ganancias y a la racionalidad.

El concepto clave que se aprenderá en este capítulo es el Equilibrio de Nash Perfecto


en Subjuegos que es un refinamiento del equilibrio de Nash.

3.6. Representación extensiva de un juego dinámico


La representación extensiva de un juego dinámico puede ser vista como una
generalización de un árbol de decisiones, pero con múltiples jugadores.

La forma extensiva requiere contener la siguiente información:

1° Conjunto de jugadores.
2° El orden del juego representado por un árbol; quien mueve, cuando mueve.
3° La información que poseen los jugadores al momento de mover y elegir sus acciones.
4° El conjunto de posibles acciones que tiene cada jugador.
5° Las ganancias como función del desarrollo del juego.

Un árbol es una colección finita de nodos con una relación entre ellos que se expresa en
su conexión mediante ramas. Entre los nodos hay una relación de precedencia. Para la
construcción del árbol, se establecen dos supuestos:

68
Apuntes de Teoría de Juegos

1° La relación de precedencia es transitiva. Si x es antes de x´ y x´ es antes de x”, entonces


x es antes de x”.

2° La relación de precedencia es asimétrica. Si x es antes de x´, entonces x´ no es antes


de x.

Los nodos representan conjuntos de información. Son una completa descripción de


todos los eventos que lo precedieron. Para asegurar que cada nodo sea una descripción
completa de los eventos que lo precedieron, se requiere que cada uno (excepto el nodo
inicial) tenga exactamente un predecesor inmediato. Hay tres tipos de nodos: el nodo
inicial, los nodos de decisión y los nodos terminales.

El nodo inicial da comienzo al juego y es el único que no tiene predecesores, pero si


tienen sucesores. Los nodos de decisión tienen predecesores y sucesores. Los nodos
terminales sólo tienen predecesores y no tienen sucesores.

Luego de los nodos terminales se deben especificar las ganancias de cada jugador
asociadas a las secuencias de movimientos que culminan en un nodo terminal.

Los nodos están conectados por ramas que representan acciones. De cada nodo pueden
surgir múltiples ramas. Un perfil estratégico es una secuencia de nodos conectados por
ramas que (1) comienzan en el nodo inicial, (2) finaliza en un nodo terminal y (3) tiene
la propiedad que los nodos sucesores son nodos sucesivos en la secuencia. Cada perfil
estratégico es un camino a través de las ramas del árbol.

En la representación extensiva de un juego dinámico, la longitud del juego se mide


contando la cantidad de ramas que van desde el nodo inicial hasta el nodo terminal por
el perfil (camino) más largo.

Subjuegos

Dada una representación extensiva de un juego G y un nodo de decisión x (distinto al


nodo inicial) de G, se dice que G´ es un subjuego de G con inicio en x, si G´ es una parte
de G que cumple lo siguiente:

1° Contiene el nodo x y a todos sus nodos sucesores, y sólo a ellos.

69
Apuntes de Teoría de Juegos

2° El nodo x es un nodo de decisión unitario.


3° Si el nodo x´ pertenece al subjuego G´, también pertenecen a G´ todos los nodos del
conjunto de información al que pertenece x´, es decir, G´ no rompe ningún conjunto de
información.

Note que:
1.- El juego G es siempre un subjuego de G.
2.- Se llaman subjuegos propios de G a aquellos subjuegos que no coinciden con G, es
decir, que no comienzan en el nodo inicial de G.
3.- Si G es un juego de información perfecta, cualquier parte que comience en un nodo
de decisión y contenga todos los nodos que le suceden es un subjuego.
4.- También se considera un subjuego a aquellos en que sólo intervendrá un solo
jugador.

3.7 Inducción hacia atrás

Los juegos representados en forma extensiva con información completa y perfecta, se


pueden resolver a través del método conocido como inducción hacia atrás.

El método consiste en una serie de pasos que se detallan a continuación:

70
Apuntes de Teoría de Juegos

1° Se identifican todos los subjuegos propios que se producen en el último estado del
juego, es decir, aquellos que comienzan en los últimos nodos de decisión antes de los
nodos terminales de cada perfil estratégico.
2° Estos subjuegos tienen un solo jugador. Se asume que jugadores racionales jugarán
las acciones con las que maximizan su ganancia por lo que la acción elegida es un
equilibrio de Nash.
3° En la medida que se van resolviendo, los subjuegos se van eliminando (el árbol se va
podando), quedando el nodo de decisión como nodo terminal y se le atribuyen las
ganancias asociadas a la acción óptima.
4° Al hacer esto el árbol se va reduciendo. El proceso continúa hasta llegar al nodo
inicial del juego global.

Ejemplo 3.1
Resuelva el siguiente juego por inducción hacia atrás.

El juego comienza con el jugador uno que debe decidir si juega L o R. Si juega L le
corresponde el turno al jugador dos, que debe decidir entre a o b. Si decide la acción a
el juego termina con ganancias de 5 para el jugador uno y de 2 para el jugador dos. Si
decide la acción b el juego termina con ganancias de 3 para el jugador uno y de 1 para
el jugador dos. Si el jugador uno, decide R, le corresponde al jugador dos que debe

71
Apuntes de Teoría de Juegos

decidir entre c o d. Si juega c, el juego termina con ganancias de 4 para el jugador uno y
de 1 para el jugador dos. Si el jugador dos, juega d, le corresponde jugar nuevamente al
jugador uno, quien debe decidir entre S o T. Si decide la acción S el juego termina con
ganancias de 1 para el jugador uno y de 2 para el jugador dos. Si decide la acción T el
juego termina con ganancias de 0 para el jugador uno y de 3 para el jugador dos.

Solución

1° Se va al último subjuego (aquel que comienza en el último nodo de decisión) y se


asume que el jugador uno jugará una acción óptima. En este nodo el jugador uno, debe
decidir entre S o T. Por racionalidad elegirá S porque la ganancia de 1 es mayor que 0.
Una vez resuelto el subjuego, se representa el juego en una forma más reducida:

2° Se va a los dos últimos subjuegos (aquel que comienza en los últimos nodos de
decisión) y se asume que el jugador dos jugará una acción óptima.

En estos nodos, si el jugador uno decide L, el jugador dos debe decidir entre a o b. Por
racionalidad elegirá a porque la ganancia de 5 es mayor que 3.

72
Apuntes de Teoría de Juegos

Si el jugador uno decide R, el jugador dos debe decidir entre c o d. Por racionalidad
elegirá d porque anticipa que si juega aquella opción, el jugador uno elegirá S y la
ganancia que obtendrá es 2 que es mayor que 1.

Una vez resueltos estos dos subjuegos, se representa el juego en una forma más
reducida, donde el jugador deberá decidir si juega L o R:

3° El jugador uno debe resolver cómo comienza el juego. Para determinar su decisión
ha ido resolviendo todos los subjuegos propios asumiendo que el jugador dos decidirá
con racionalidad y asumiendo que el jugador dos asume que él decidirá con
racionalidad. Bajo estos supuestos, el jugador uno jugará L porque la ganancia que
obtendrá es 5 que es mayor que 2 si jugará R.

La clave en el método de la inducción hacia atrás es que los jugadores pueden anticipar
las posteriores decisiones. El jugador uno anticipa lo que jugará el jugador dos con
cualquiera de sus dos acciones iniciales y el jugador sabe que el jugador uno anticipará su
jugada. Luego el jugador decide, anticipando lo que jugará el jugador uno y el jugador
uno sabe que el jugador anticipará su jugada posterior.

En consecuencia, la solución del juego por inducción hacia atrás es {(L, S), (a, d)}: el
jugador uno jugaría L en su primer nodo de decisión y S en su segundo nodo de decisión.

73
Apuntes de Teoría de Juegos

El jugador dos, jugaría a en su primer nodo de decisión, si el jugador uno juega L y d en


su segundo nodo de decisión, si el jugador uno juega R.

Note que, si el jugador uno juega L, el jugador dos no deberá decidir entre c y d. No
obstante, en la solución se debe registrar lo “que haría si” el juego llegará a ese nodo.

La solución gráfica se registra en la siguiente figura:

Primera conclusión: Las claves en el proceso de inducción hacia atrás es la credibilidad


y la anticipación.

3.8 Aplicación sobre el método de inducción hacia atrás


El modelo de Stackelberg

Este modelo es una variante de Cournot. La diferencia crucial es que los jugadores
juegan de manera secuencial.

Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, son
sustitutos perfectos. Las empresas deben decidir cuánto producir (estrategias) de
manera secuencial, es decir, la empresa líder (jugador uno) decide primero, la empresa

74
Apuntes de Teoría de Juegos

seguidora (empresa dos) observa la decisión de la empresa líder, y luego decide cuánto
producir

Suponga que la demanda inversa del bien que las empresas producen está determinada
por la siguiente función:

𝑃(𝑞) = 12 − 𝑞, donde 𝑞 = 𝑞1 + 𝑞2

Donde, 𝑞1 representa la producción de la empresa uno y 𝑞2 representa la producción de


la empresa dos.
Las ganancias son los beneficios económicos, es decir, la diferencia entre los ingresos
(I) y los costos totales (C). Los ingresos totales es el producto de lo que produce
(suponga que vende todo lo que produce) y el precio. Por simplicidad suponga que los
costos totales son iguales a cero.

Solución:
Como este es un juego dinámico de información completa y perfecta, se utilizará el
método de inducción hacia atrás, es decir, se comenzará por la empresa dos que es
aquella que debe decidir en los nodos previos a los nodos terminales:
1° Encontrar la función de mejor respuesta de la empresa dos. Como se supone que la
empresa es racional y que tiene como objetivo la maximización de sus ganancias,
planteamos el problema como un problema de optimización:
𝑀𝑎𝑥 𝑈2 (𝑞1 , 𝑞2 ) = 𝑀𝑎𝑥[12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2
𝑞2 𝑞2

para luego derivar:


𝑑𝑈2
= 12 − 𝑞1 − 2𝑞2
𝑑𝑞2

e igualar a cero (condición de primer orden para un máximo):


12 − 𝑞1 − 2𝑞2 = 0
𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 − 2

Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que es
función de la cantidad que decida producir la empresa uno.

75
Apuntes de Teoría de Juegos

2° La empresa líder conoce la función de mejor respuesta de la empresa dos. Esta


información le da la ventaja de poder anticipar las respuestas de la empresa dos ante
sus decisiones de producción. Además, como la empresa uno sabe que la pendiente de
la función de mejor respuesta de la empresa dos es negativa, anticipa que en la medida
que aumente la producción, la empresa uno disminuirá la suya.

Con estos antecedentes, el problema de la empresa uno es:


𝑀𝑎𝑥 𝑈1 (𝑞1 , 𝑞̂2 )
𝑞1

Observe que la empresa uno considera la respuesta de la empresa dos como un dato. La
función de ganancias de la empresa uno se expresa a continuación:
𝑈1 (𝑞1 , 𝑞̂2 ) = [12 − (𝑞1 + 𝑞̂2 )] ∗ 𝑞1
𝑈1 (𝑞1 , 𝑞̂2 ) = 12 𝑞1 − 𝑞12 − 𝑞1 ∗ 𝑞̂2
𝑞1
𝑈1 (𝑞1 , 𝑞̂2 ) = 12 𝑞1 − 𝑞12 − 𝑞1 ∗ (6 − )
2
𝑞12
𝑈1 (𝑞1 , 𝑞̂2 ) = 6 𝑞1 −
2
Observe que la función de ganancias de la empresa uno depende sólo de su decisión y
no de la decisión de la empresa dos.

Por lo tanto, el problema de la empresa uno es encontrar la cantidad de producción 𝑞1


que le permita maximizar su ganancia:

𝑞12
𝑀𝑎𝑥 𝑈1 (𝑞1 , 𝑞̂2 ) = 𝑀𝑎𝑥 6 𝑞1 −
2
𝑞1 𝑞1

para luego derivar:


𝑑𝑈1
= 6 − 𝑞1
𝑑𝑞1

e igualar a cero:
𝑞1 = 6
𝑞1
Si, 𝑞1 = 6 y 𝑞2 = 6 − , entonces: 𝑞2 = 3
2

76
Apuntes de Teoría de Juegos

El modelo de Stackelberg con estrategias discretas.


Suponga que las empresas sólo tienen tres acciones: producir tres unidades, producir
cuatro unidades o producir seis unidades, es decir:
• 𝐴1 = {3, 4, 6}
• 𝐴2 = {3, 4, 6}

Para estimar las ganancias se debe reemplazar en las funciones respectivas:


• 𝑈1 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1
• 𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2

La representación extensiva del juego y su solución por inducción hacia atrás se


muestra en la siguiente figura:

Por inducción hacia atrás la solución es que la empresa líder decide producir seis
unidades. Esta decisión la toma luego de anticipar que la mejor respuesta de la empresa
dos sería producir cuatro unidades si ésta produce tres; cuatro unidades si ésta produce
cuatro y tres unidades si ésta decidiese producir seis.

3.9 Representación estratégica de juegos dinámicos

En esta sección se revisará la forma en que los juegos dinámicos se representan en su


forma estratégica.

77
Apuntes de Teoría de Juegos

Juego 1.- Considere el siguiente juego:

La solución del juego por inducción hacia atrás es {R, (R´, L´)}, es decir, si el juego llega
al primer nodo de decisión del jugador dos, luego de que el jugador uno jugara L, su
mejor respuesta sería jugar R´. Si el juego llega al segundo nodo de decisión del jugador
dos, luego de que el jugador uno jugara R, su mejor respuesta sería jugar L´. El jugador
uno que anticipa las mejores respuestas del jugador dos, jugaría al comienzo del juego,
la estrategia R:

Previo a representar el juego en su forma estratégica se hace necesario redefinir el


concepto de estrategia en juegos dinámicos. Una estrategia es un completo plan de
acción que específica una acción para el jugador en cada contingencia (nodo de decisión)
en que pueda ser llamado a decidir.

78
Apuntes de Teoría de Juegos

En el juego de la figura 3.4:

• El jugador uno tiene un nodo de decisión y tiene dos acciones (L o R). Por lo tanto,
tiene dos estrategias.
• El jugador dos tiene dos nodos de decisión y tiene dos acciones en cada nodo (L´ o
R´). Por lo tanto, tiene cuatro estrategias:
o Estrategia 1: (L´, L´): si el jugador uno juega L, entonces juega L´. Si el jugador uno
juega R, entonces juega L´.
o Estrategia 2: (L´, R´): si el jugador uno juega L, entonces juega L´. Si el jugador
uno juega R, entonces juega R´.
o Estrategia 3: (R´, L´): si el jugador uno juega L, entonces juega R´. Si el jugador
uno juega R, entonces juega L´.
o Estrategia 4: (R´, R´): si el jugador uno juega L, entonces juega R´. Si el jugador
uno juega R, entonces juega R´.

Cada estrategia del jugador dos le indica una acción a seguir en caso que tuviese que
decidir.
La representación del juego en forma estratégica se ilustra a continuación:
2
1 (L´, L´) (L´, R´) (R´, L´) (R´, R´)

L 3,1 3,1 1,2 1,2

R 2,1 0,0 2,1 0,0


Figura 3.4.2
La representación estratégica del juego permite determinar la existencia de dos
equilibrios de Nash: {R, (R´, L´)} y {L, (R´, R´)}.
Análisis de los equilibrios:
• El equilibrio {R, (R´, L´)} corresponde a todas las sendas de la solución por
inducción hacia atrás. Este equilibrio no sólo especifica el camino entre el nodo inicial
y uno de los nodos terminales sino también especifica que haría el jugador dos si el
jugador uno jugase L. Es decir, este equilibrio detalla una estrategia completa para el
jugador dos.

79
Apuntes de Teoría de Juegos

La solución de este equilibrio es la misma que sugiere el método de inducción hacia


atrás. Esto significa que los jugadores están tomando decisiones óptimas en todos los
subjuegos, es decir, hay un equilibrio de Nash en cada uno. Este equilibrio es un
equilibrio de Nash perfecto en subjuegos (ENPS)18.
• El equilibrio {L, (R´, R´)} especifica que el jugador dos jugará R´ en caso que el
jugador uno juegue L y que jugará R´ en caso que el jugador uno juegue R, lo que no es
plausible ya que jugar R´ en ese nodo no es una mejor respuesta.
La estrategia {L, (R´, R´)} se puede interpretar como una amenaza del jugador dos al
jugador uno si este juega R, con el fin de inducirlo a que juegue L. Sin embargo, es una
“amenaza no creíble” ya que si el jugador uno juega R la mejor respuesta del jugador
dos es jugar L´.
El equilibrio {L, (R´, R´)} no es un equilibrio de Nash perfecto en subjuegos porque las
acciones elegidas no constituyen un equilibrio de Nash en uno de sus subjuegos. En
particular, la decisión R´ no es óptimo en el subjuego que comienza en el nodo de
decisión que sigue la acción R por parte del jugador uno.
Segunda conclusión: en juegos dinámicos de información completa y perfecta, la
inducción hacia atrás elimina amenazas no creíbles.

Juego 2.- Considere el siguiente juego:

La solución por inducción hacia atrás es {(L, L”), L´}:

18 En la próxima sección se definirá el equilibrio de Nash perfecto en subjuegos.

80
Apuntes de Teoría de Juegos

La solución por inducción hacia atrás sugiere que al comienzo del juego el jugador uno
juega L y el juego termina con ganancias de 2 y 0 respectivamente.

Elementos para la representación en forma estratégica del juego:


• Acciones jugador uno: A1 = {L, R, L”, R”}
• Acciones jugador dos: A2 = {L´, R´}
• Estrategias jugador uno: S1 = {(L, L”), (L, R”), (R, L”), (R, R”)}
• Estrategias jugador dos: S2 = (L´, R´)

2
1 L´ R´

L, L” 2,0 2,0

L, R” 2,0 2,0

R, L” 1,1 3,0

R, R” 1,1 0,2
Figura 3.5.219

19 Note que las dos primeras filas son redundantes porque expresan las mismas ganancias. El motivo
es que, si el jugador uno juega L al comienzo de juego, éste finaliza. No obstante, debido a la
definición de estrategia que se ha adoptado como un plan de acción en todas las contingencias o
nodos de decisión, es necesario escribirla pese a su no plausibilidad. El razonamiento es “que haría
si…”. A lo largo del documento se continuará representando de esta forma a pesar de que existe una
forma reducida de presentar (para detalles sobre como representar la matriz en una forma reducida
ver Osborne y Rubinstein.

81
Apuntes de Teoría de Juegos

El juego tiene dos equilibrios de Nash: {(L, L”), L´} y {(L, R”), L´}. Sólo el equilibrio {(L,
L”), L´} induce un equilibrio de Nash en cada subjuego. En efecto, este equilibrio es
consistente con la solución por inducción hacia atrás. El segundo equilibrio es no
plausible porque descansa en una amenaza no creíble: que el jugador uno jugará R” en
su segundo nodo de decisión.

Tarea 3.1
Represente el juego de Stackelberg con variables discretas en forma estratégica. Pista:
La empresa uno tiene tres estrategias y la empresa dos tiene 9 estrategias.

3.10 Equilibrio de Nash Perfecto en Subjuegos

Un equilibrio de Nash es perfecto en subjuegos si las estrategias de los jugadores


constituyen un equilibrio de Nash en cada subjuego. Para entender lo anterior,
considere el siguiente juego en su representación extensiva:

82
Apuntes de Teoría de Juegos

Solución:
1° Encontrar los equilibrios de Nash del subjuego 1: El subjuego 1, es aquel que
comienza en el segundo nodo de decisión del jugador uno. La representación extensiva
y estratégica del subjuego se presenta a continuación:

2° Encontrar los equilibrios de Nash del subjuego 2: El subjuego 2, es aquel que


comienza en el nodo de decisión del jugador dos. La representación extensiva y
estratégica del subjuego se presenta a continuación:

83
Apuntes de Teoría de Juegos

3° Encontrar los equilibrios de Nash del juego completo: El último subjuego es el juego
completo, es decir, aquel que comienza en el nodo inicial. La representación extensiva
y estratégica del subjuego se presenta a continuación:

4° Se analizan los tres equilibrios de Nash con el objetivo de determinar cuál o cuáles
son equilibrios de Nash perfecto en subjuegos:
• El primer equilibrio es un equilibrio perfecto porque induce un equilibrio de
Nash en los dos subjuegos. Señala que el equilibrio de Nash en el primer
subjuego es u y que el equilibrio de Nash en el segundo subjuego es [u, l].
• El segundo equilibrio no es un equilibrio perfecto porque a pesar que señala que
el equilibrio de Nash en el primer subjuego es u; señala que el equilibrio de Nash
en el segundo subjuego es [u, r], el cual no es un equilibrio de Nash, ya que, si el
jugador uno juega u, la mejor respuesta del jugador dos es l y si el jugador dos
juega r, la mejor respuesta del jugador uno es d.
• El tercer equilibrio no es un equilibrio perfecto porque señala que el equilibrio
de Nash en el primer subjuego es d, la que no es una mejor respuesta del jugador
uno en ese nodo de decisión. Esta es una condición suficiente para concluir que
no es un equilibrio de Nash perfecto a pesar que señala que en el segundo
subjuego el equilibrio de Nash es [d, r], el cual efectivamente es uno de los dos

84
Apuntes de Teoría de Juegos

equilibrios de Nash de ese subjuego, ya que, si el jugador uno juega d, la mejor


respuesta del jugador dos es r.
Juego completo
Equilibrios de Nash [Uu, l] [Du, r] [Dd, r]
Subjuego 1 [u] cumple cumple no cumple
[u, l] cumple no cumple no cumple
Subjuego 2
[d, r] no cumple no cumple cumple

5° Resolver por inducción hacia atrás: se decía que el método de la inducción hacia atrás
elimina las respuestas que no son equilibrios de Nash. En el juego la solución es: {(Uu),
l}, es decir, el jugador uno juega U en el primer nodo de decisión y u en su segundo nodo
de decisión. El jugador dos en tanto, juega l en su nodo de decisión.

En conclusión, el equilibrio de Nash [Uu, l] es un equilibrio de Nash perfecto en


subjuegos.

Ejercicio 3.1
Instrucciones: J1 elige U o D, donde D termina el juego con ganancia de 3 para J1 y 2
para J2. Si J1 eligió U entonces J2 elige L o R, donde R finaliza el juego con ganancias de
2 para J1 y 3 para J2. Si J2 elige L entonces J1 elige entre u y d, y el juego finaliza. Si elige

85
Apuntes de Teoría de Juegos

u, J1 obtiene una ganancia de 5 y J2 una ganancia de 4; si elige d, J1 obtiene una ganancia


de 4 y J2 una ganancia de 2.
a) Represente el juego en forma extensiva.
b) Represente los subjuegos en forma estratégica y encuentre el(os) equilibrio de Nash
de cada uno.
c) Represente el juego completo en forma estratégica y encuentre el(os) equilibrio de
Nash.
d) Encuentre el equilibrio de Nash perfecto en sub juegos.
e) Resuelva por inducción hacia atrás.

3.11 Juegos dinámicos con información imperfecta

Hasta el momento, se han analizado juegos simultáneos y juegos dinámicos de


información perfecta. En los juegos simultáneos, los jugadores juegan con información
imperfecta, es decir, decidían sin conocimiento sobre la decisión del otro jugador. En
los juegos dinámicos de información perfecta, los jugadores jugaban de manera
secuencial, con perfecta información sobre la historia del juego.

Los juegos dinámicos de información imperfecta combinan ambos tipos de juegos:


dinámicos y simultáneos, esto es, en algún estado del juego, los jugadores deben jugar
con información imperfecta.

A lo largo del capítulo, los juegos simultáneos se representaron en forma estratégica


utilizando matrices de ganancias. Observe el siguiente juego simultáneo representado
en forma estratégica:

2
1 l m r

U a1, a2 b1, b2 c1, c2

D d1, d2 e1, e2 f1, f2


Figura 3.7

86
Apuntes de Teoría de Juegos

El juego se puede representar en forma extensiva de dos formas equivalentes. En la


primera el jugador uno comienza el juego; en la segunda, el jugador dos inicia el juego.
Observe que en este caso el timing no tiene importancia porque los jugadores están
jugando sin conocer la decisión del otro, es decir, el orden de las jugadas es indiferente.

En una representación extensiva, la línea discontinua que une los nodos de decisión
denota la simultaneidad del juego.

En los juegos dinámicos de información perfecta, los nodos representan conjuntos de


información. En aquellos juegos, los conjuntos de información están compuestos por
nodos unitarios, es decir, cada nodo representa un conjunto de información. En la
representación extensiva de un juego de información imperfecta, los conjuntos de
información son no unitarios, es decir, están conformados por más de un nodo.

En la primera representación, esto quiere decir que el jugador dos sabe que el jugador
uno jugó, pero no sabe que jugó, es decir, no sabe en cuál de sus dos nodos está. En la
segunda representación, el jugador uno sabe que el jugador dos jugó, es decir, sabe que
el juego está en su conjunto de información, pero no sabe en cuál de sus tres nodos de
decisión está.

87
Apuntes de Teoría de Juegos

En este tipo de juegos, una estrategia es un completo plan de acción que específica una
acción para el jugador en cada conjunto de información en que pueda ser llamado a
decidir.

Algunas reglas para representar juegos de información imperfecta:

1° Cada conjunto de información contiene nodos de decisión para sólo uno de los
jugadores.
2° Todos los nodos en un conjunto de información deben contener el mismo número de
sucesores inmediatos.
3° Los nodos deben tener el mismo conjunto de acciones disponibles en las ramas que
llevan a los sucesores.

Ejemplo 3.2.

Resuelva por inducción hacia atrás el siguiente juego de información perfecta:

Resolviendo por inducción hacia atrás el argumento es que el jugador uno no elige U o
M porque su elección será observada por el jugador dos, y éste elegirá d o u y la

88
Apuntes de Teoría de Juegos

ganancia del jugador uno será 0. Jugador uno elegirá D porque anticipa que el jugador
dos elegirá u y por lo tanto tendrá una ganancia de 1 que es mayor que 0.

Ahora resuelva el juego incorporando información imperfecta:

Ahora, si el jugador uno eligió D, el jugador dos sabe en que nodo está. Sin embargo, si
el jugador uno eligió U o M el jugador dos no sabe en que nodo está, es decir, no sabe si
el jugador uno eligió U o M y el jugador uno sabe que el jugador dos no sabe en que nodo
está. En este caso ya no es tan obvio que el jugador uno juegue D. El jugador uno podría
pensar que el jugador dos mezclará sus acciones (estrategias mixtas), por ejemplo,
jugando ½ de las veces u y ½ de las veces d y, por lo tanto, la ganancia esperada del
jugador uno producto de la estrategia mixta del jugador dos será 2 que es mayor que 1
que es la ganancia que obtendría al jugar D.

Tercera conclusión: si el juego no es de información perfecta, es decir, si hay en la forma


extensiva algún conjunto de información no unitario, el algoritmo de inducción hacia
atrás puede ser no aplicable. Para resolver juegos dinámicos con información imperfecta
se pueden determinar el o los equilibrios de Nash perfectos en subjuegos utilizando el
algoritmo de inducción hacia atrás generalizada; esto es, un procedimiento para

89
Apuntes de Teoría de Juegos

determinar ENPS cuando existen subjuegos propios con conjuntos de información no


unitarios para al menos un jugador.

Ejemplo 3.3.
Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego20:

Solución:
1° Resuelva los dos subjuegos propios:

20 Ver Pérez, Jimeno y Cerda.

90
Apuntes de Teoría de Juegos

2° Una vez que se ha determinado cómo se jugará en cada uno de los subjuegos propios,
el jugador uno se enfrenta a la decisión de jugar I, C o D, que le producirían ganancias
de 6, 5 o 2, respectivamente. Represente el juego en forma reducida y resuelva por
inducción hacia atrás:

91
Apuntes de Teoría de Juegos

En conclusión, el equilibrio de Nash perfecto en subjuegos es el perfil estratégico {(I-I´),


(i-i´)}.

Ejercicio 3.4

Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego21:

Observe que este juego denota el problema con el método de la inducción hacia atrás.
El último subjuego propio es un juego de suma cero, sin estrategias dominadas ni
equilibrio de Nash en estrategias puras.

Se procede, en este caso, a encontrar el equilibrio de Nash en estrategias mixtas. Luego


de encontrar el equilibrio, se procede a podar el árbol y poner en el último las ganancias
esperadas asociadas al equilibrio mixto.

Solución:

1° Representa el subjuego en la forma estratégica:

21 Ver Fundenberg y Tirole

92
Apuntes de Teoría de Juegos

2
1 C D

C 2, -2 -2, 2 p

D -2, 2 2, -2 1–p

q 1-q
Q
Figura 3.11.1

2° Encontrar el equilibrio de Nash en estrategias mixtas:

2.1 Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente entre
jugar cara o sello y calcular las ganancias esperadas:

Se calculan e igualan las ganancias esperadas de jugador uno al jugar C y S versus la


mezcla del jugador dos (Q):

• UE1 (C, Q) = 2*q + -2*(1- q)

• UE1 (D, Q) = -2*q + 2*(1- q)

Para el jugador uno, la decisión de jugar C o D es indiferente si sus ganancias esperadas


(versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:

UE1 (C, Q) = UE1 (D, Q)

q = 1/2

Para el jugador uno, las estrategias C y D son indiferentes, si el jugador dos elige C con
una probabilidad de q = 1/2 y elige D con una probabilidad 1 – q = 1/2.

Ganancias esperadas:

UE1 (C, Q) = 2*q + -2*(1- q) = 2 * (1/2) + -2 * (1/2) = 0

UE1 (D, Q) = -2*q + 2*(1- q) = -2 * (1/2) + 2 * (1/2) = 0

93
Apuntes de Teoría de Juegos

2.2 Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre
jugar C o D.

Se calculan e igualan las ganancias esperadas de jugador dos al jugar C y D versus la


mezcla del jugador uno (P):

UE2 (P, C) = -2*p + 2*(1- p)

UE2 (P, D) = 2*p + -2*(1- p)

Para el jugador dos, la decisión de jugar C o D es indiferente si sus ganancias esperadas


(versus la estrategia mixta P del jugador uno) son iguales, es decir, si:

UE2 (P, C) = UE2 (P, D)

p = 1/2

Ganancias esperadas:

UE2 (P, C) = 2*p + -2*(1- p) = 2 * (1/2) + -2 * (1/2) = 0

UE2 (P, D) = -2*p + 2*(1- p) = -2 * 1/2 + 2 * (1/2) = 0

2.3 Determinar las ganancias esperadas de ambos jugadores al jugar las mezclas P y
Q:

UE1 (P, Q) = p * [UE1 (C, Q)] + (1 - p) * [UE1 (S, Q)]

UE1 (P, Q) = 1/2 * (0) + 1/2 * (0)

UE1 (P, Q) = 0

UE2 (P, Q) = q * [UE2 (P, C)] + (1 - q) * [UE1 (P, S)]

UE2 (P, Q) = 1/2 * (0) + 2/3 * (0)

UE2 (P, Q) = 0

2.4 El equilibrio de Nash en estrategias mixtas del subjuego es:

[(p, 1 – p), (q, 1 – q)] = [(1/2, 1/2), (1/2, 1/2)]

94
Apuntes de Teoría de Juegos

2.5 Las ganancias asociadas al equilibrio son (0, 0).

3° Reemplazar las ganancias esperadas del equilibrio de Nash en el árbol reducido


y resolver por inducción hacia atrás:

4° El equilibrio de Nash perfecto en subjuegos es {[R, (1⁄2 , 1⁄2)], [L, (1⁄2 , 1⁄2)]}. Este
equilibrio indica que el jugador uno jugará R en su primer nodo de decisión y jugará A
con una probabilidad de 1⁄2 y jugará B con una probabilidad de 1⁄2 si el juego llega a su
segundo nodo de decisión. El jugador dos por su parte, jugará L en su primer nodo de
decisión y jugará C con una probabilidad de 1⁄2 y jugará D con una probabilidad de 1⁄2
si el juego llega a su segundo nodo de decisión.

La predicción del desarrollo del juego es que el jugador uno jugará R y luego terminará
con la decisión del jugador dos jugando L. Este equilibrio trae asociadas ganancias de 3
y 1, respectivamente.

Ejercicio 3.5

Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego22:

22 Ver Pérez, Jimeno y Cerda.

95
Apuntes de Teoría de Juegos

Solución:

1° Representar el subjuego propio, que comienza en el nodo de decisión del jugador


dos, en forma estratégica y encontrar los equilibrios de Nash:

2
1 A B

A -2, -2 4, 2

B 1, 4 -1, -1

Figura 3.12.1

Note que este subjuego tiene dos equilibrios de Nash: (A, B) y (B, A).

96
Apuntes de Teoría de Juegos

2° Reemplazar en el árbol original las ganancias asociadas a los dos equilibrios de Nash
y resolver por inducción hacia atrás:

3° El juego tiene dos equilibrios de Nash perfectos: {DA, B} y {IB, A}. Si (A, B) es el
equilibrio de Nash que se supone se jugará en el subjuego, la elección óptima del jugador
uno al comienzo del juego sería jugar D. Si (B, A) es el equilibrio de Nash que se supone
se jugará en el subjuego, la elección óptima del jugador uno al comienzo del juego sería
jugar I y terminar el juego.

97

También podría gustarte