Resnik Tº de La Decisión
Resnik Tº de La Decisión
Resnik Tº de La Decisión
1. Introducción
1-1. ¿Qué es la teoría de la decisión?
La teoría de la decisión es el resultado de los esfuerzos conjuntos de economistas, matemáticos,
filósofos, científicos sociales y estadísticos por explicar cómo toman o cómo deberían tomar decisiones
los individuos y los grupos. Los teóricos de la decisión con marcada inclinación matemática prefieren
investigar las consecuencias lógicas de las distintas reglas que se aplican a la toma de decisiones, o
explorar las características matemáticas de las diferentes descripciones del comportamiento racional.
Se suele dividir la teoría de la decisión en dos ramas principales: la teoría de la decisión normativa (o
prescriptiva) y la teoría de la decisión descriptiva. Los teóricos de la decisión descriptiva buscan
descubrir cómo se toman las decisiones, es decir, se dedican a investigarnos a nosotros, los comunes
mortales. De sus colegas en teoría de la decisión normativa se espera en cambio que prescriban cómo
se deberían tomar las decisiones, es decir, que estudien los agentes idealmente racionales.
El hombre económico racional es un ser hipotético idealmente racional cuyas elecciones se
corresponden siempre con las que con mayor probabilidad maximizarán su beneficio personal. Los
economistas admiten también que la noción de hombre económico no es un modelo descriptivo. Ni
siquiera personas de mente fría y gran olfato para los negocios logran cumplir este ideal. Algunas veces
dejamos a un lado la motivación de obtener beneficios. O nos proponemos obtener beneficios, pero
calculamos mal. Así, el modelo que utiliza el hombre económico racional no tiene una intención
normativa o descriptiva, sino que es una idealización explicativa.
Los juegos son situaciones en las que la toma de decisiones incluye siempre a más de un individuo,
pero son decisiones de grupo porque cada individuo elige una acción determinada con el ánimo de
promover sus propios fines. Esta decisión se basa en sus expectativas acerca de cómo elegirán los otros
participantes. Pero, a diferencia de lo que pasa en una decisión de grupo, no se hace ningún esfuerzo
por desarrollar una línea de conducta que se aplique a todos los participantes.
1-2. El esquema básico
Una decisión implica una elección entre dos o más opciones o actos, cada uno de los cuales produce
uno o varios resultados.
Todas las decisiones incluyen tres componentes –actos, estados y resultados, siendo estos últimos
normalmente relativos al acto y al estado bajo los cuales tienen lugar. En la teoría de la decisión
construimos el término “estado” con un sentido muy amplio que incluye condiciones tanto físicas como
no-físicas.
Quien analiza la decisión tiene que determinar el conjunto de actos, estados y resultados relevantes para
caracterizar el problema. El análisis se puede representar en una tabla de decisión. En general, una
tabla de decisión contiene una fila por cada acto, una columna por cada estado y una entrada en cada
casilla que corresponde al resultado del acto de esa fila y del estado de esa columna.
Al especificar un conjunto de actos, estados y resultados, o al dibujar una tabla de decisión,
establecemos una especificación del problema.
Para que una especificación del problema sea definitiva y completa, los estados deben ser mutuamente
excluyentes y exhaustivos, esto es, uno y sólo uno de los estados debe obtenerse.
Asegurar que las especificaciones de estado son mutuamente excluyentes exige un análisis
extremadamente cuidadoso, aunque podemos garantizar fácilmente la exhaustividad si añadimos a la
lista de estados no exhaustivos la descripción no se da ninguno de los estados anteriores.
1-2a. Algunos problemas filosóficos acerca de las especificaciones de problemas
En realidad, seleccionar la especificación de un problema es una dificultad que surge al aplicar la teoría
de la decisión. Nosotros dejaremos al margen este tipo de problemas y asumiremos que estamos
tratando con especificaciones de problemas cuyos estados son mutuamente excluyentes y exhaustivos.
Cualquier problema de decisión contiene algunos resultados que son considerados como mejores por
quien toma la decisión. En caso contrario, ninguna elección sería más valiosa que otra cualquiera. Así
pues, se podría especificar cualquier decisión en términos de las descripciones de estado las cosas salen
bien/no salen bien.
El principio de dominancia: Decimos que un acto A domina otro acto B si, en una comparación de
estado a estado, A produce resultados que son, al menos, tan buenos como los producidos por B y si en
algunos estados los resultados son incluso mejores. El principio de dominancia sugiere que eliminemos
los actos dominados. Si hay un acto que domina todos los otros, el principio lo elige. Sin embargo, no
siempre podemos confiar en el principio de dominancia.
No siempre está claro cuándo una descripción de estado es adecuada. Tampoco hay algoritmos para
decidir si un conjunto de estados es o no relevante.
Para evitar un regreso infinito en los análisis de decisión, cualquier aplicación de la teoría tiene que
estar basada, en último término, en elecciones que se efectúan sin ayuda de la teoría. Esas decisiones se
llaman decisiones inmediatas.
No siempre es racional utilizar la teoría de la decisión, puesto que los costes de tiempo o de dinero son
a menudo demasiado elevados. Por otra parte, no siempre es racional tomar una decisión inmediata.
¿Cómo decidimos cuándo debemos hacer un análisis de la decisión, y cuándo debemos tomar una
decisión inmediata? Hay que seguir una regla de conducta no escrita en la que mis instintos se encargan
de la elección. Y esto es justamente lo que es racional hacer, ya que un conductor sensato, en buen
estado de salud y con experiencia hace normalmente lo que es adecuado en tales situaciones.
Podemos distinguir entre decisiones correctas y decisiones racionales. Las decisiones de los agentes
son correctas cuando dan lugar a resultados que los agentes consideran al menos tan satisfactorios
como cualesquiera de los otros resultados a los que podría haber conducido su acción. La mayoría de
nuestras decisiones deben basarse en lo que creemos que podría ocurrir o en lo que creemos que
probablemente ocurrirá, de modo que no podemos estar seguros de que nuestras decisiones vayan a
traducirse en los mejores resultados posibles. Aun así, nuestras elecciones deberían estar basadas tanto
en la información que tenemos a nuestro alcance, como en una estimación precisa de los riesgos
asociados, puesto que ésta es claramente la única aproximación racional a la toma de decisiones.
1-3. Certeza, ignorancia y riesgo
Hay veces en que podemos estar bastante seguros de que nuestros actos producirán ciertos resultados
concretos. Algunas veces, sin embargo, sólo podemos saber con cierta probabilidad si nuestra elección
conducirá a un determinado resultado. Por último, a veces ocurre que no tenemos ni la más remota idea
de la relación que existe entre una acción que emprendemos y su posible resultado.
Cuando al tomar una decisión podemos estar seguros de que nuestros actos son como en el primer
ejemplo, nuestra elección es una decisión bajo certeza. En estos casos, la única dificultad estriba en
determinar qué resultado nos gusta más, ya que conocemos qué acto conduce con toda seguridad a él.
Esto no ocurre a menudo.
Cuando en un problema de decisión se pueden asignar probabilidades a todos los resultados de cada
acto, el problema se llama una decisión bajo riesgo. Realizamos decisiones bajo riesgo cuando, por
ejemplo, apostamos a lanzamientos de moneda, ruletas o dados no trucados.
Cuando no tiene sentido asignar probabilidades a los resultados producidos por uno o más actos, el
problema de decisión se llama una decisión bajo ignorancia (o bajo incertidumbre). La ignorancia
puede ser total o parcial, puesto que a veces es posible asignar probabilidades sólo a algunos de los
resultados de los actos.
Esta clasificación es una idealización. Hay muchas decisiones que no caen estrictamente bajo una
categoría u otra. Sin embargo, si las incertidumbres que se pueden plantear en una decisión son
despreciables resulta legítimo abordar el problema como una decisión bajo certeza. Y cuando podemos
establecer límites superiores e inferiores para las probabilidades, podemos entonces descomponer el
problema de decisión en varios problemas bajo riesgo, resolver cada uno de ellos y comparar los
resultados.
1-3a. Algunos detalles de formulación
Decimos que un estado es independiente de un acto cuando la probabilidad condicional del estado,
supuesto el acto, es la misma que la probabilidad incondicional de ese estado.
Cuando algunos de los estados no son independientes de los actos en una decisión bajo riesgo, tenemos
que usar probabilidades de los estados condicionados a los actos. Cuando todos los estados son
independientes de los actos, no importa qué probabilidades usemos ya que, según la definición de
independencia, no hay diferencia entre ellas.
1-4. Árboles de decisión
A menudo es más rápido analizar un problema de decisión como una secuencia de decisiones durante
un periodo de tiempo, que considerarlo como una decisión singular en un momento singular en un
momento concreto. Para ello utilizamos un árbol de decisión en vez de una tabla. Un árbol de decisión
es un diagrama que consiste en líneas que se dividen y que están conectadas a cuadrados y círculos.
Los cuadrados se llaman nudos de decisión y representan las decisiones que hay que tomar en
determinado momento a lo largo de las secuencias de decisión. Los círculos se llaman nudos del
destino y representan los estados relevantes a esa altura de la decisión. Cada línea que sale de un nudo
identifica uno de los actos o estados asociados con él y suele llamarse igual que la descripción del acto
o estado.
En estado de ignorancia parcial se puede asignar algunas probabilidades a los estados que corresponden
a sus actos. Aquí se revisará a toma de decisiones bajo ignorancia completa.
Recurriendo a las funciones de utilidad ordinales podemos formular una regla muy sencilla para tomar
decisiones bajo ignorancia, la regla maximín invita al agente a comparar las utilidades mínimas de los
distintos actos y a elegir aquel acto cuya utilidad mínima tenga el máximo valor, la regla dice que se
maximicen las utilidades mínimas. Cuando existen 2 o mas actos cuyas utilidades mínimas son
máximas, la regla maximín considera que ambos son igual de buenos, se rompen empates aplicando
esta regla que dice que eliminemos primero todas las filas excepto las que están empatadas, que
tacemos luego los números mínimos y que comparemos por último las restantes entradas inferiores.
La aplicación de la regla maximín representa una aproximación del corte conservador a las decisiones
bajo ignorancia. Al asumir que, con independencia de lo que se haga, ocurrirá lo peor, la regla maximín
consigue seleccionar el acto menos perjudicial de todos.
Ejemplos como el anterior (cuadro extraño de la pág. 58) donde el agente rechazaba la idea de ganar
1.000.000 pts. para evitar una pérdida potencial de 50 pts. , sugieren que en algunas situaciones puede
ser más relevante prestar atención a las oportunidades perdidas que a las posibilidades peores. Para
poder extraer una regla general de nuestro ejemplo, debemos explicar primero cómo extraer los
números de arrepentimiento y la tabla de arrepentimiento a partir de una tabla de decisión.
R= MAX-U en donde MAX es la entrada mayor de la columna R, el número MAX puede variar de
columna a columna y, por tanto, R puede variar incluso cuando U permanece fijo. La regla
arrepentimiento minimax nos invita a seleccionar un acto cuyo arrepentimiento máximo sea mínimo.
Así pues, la regla del arrepentimiento minimax no siempre elige el mismo acto cuando se aplica una
transformación ordinal de utilidad a la tabla de decisión, esto significa que la regla de arrepentimiento
minimax opera sobre una cantidad de información mayor que la incluida en una simple escala de
utilidad ordinal.
aMAX + (1 –a) mín, en donde 0 ≤ a ≤ 1 da como resultado el número que buscamos y ofrece también
MAX y min como casos especiales (al sustituir a por 1 y 0, respectivamente). Llamaremos índice de
optimismo al número a. y ¿cómo se obtienen los índices de optimismo? Todo agente debe elegir su
índice de optimismo para cada situación de decisión (o conjunto de situaciones de decisión). Cuanto
más cercano sea el índice de optimismo a 1, más optimista será el agente. En cualquier caso,
aprovechar un simple problema de decisión para encontrar el índice de optimismo que uno tiene, puede
ser una precaución útil de cara a enfrentarse con problemas más complejos. No obstante, este método
saca a la luz una dificultad conceptual bastante seria que comparten tanto los índices de optimismo
como las reglas basadas en ellos. Puesto que es el agente quien determina el índice de optimismo, cabe
esperar que distintos agentes tengan índices diferentes. Peor aún, la aproximación basada en los índices
de optimismo permitiría eludir el problema de decisión, al dejar que tomáramos decisiones sobre la
marcha que “racionalizaríamos” después adjudicando índices de optimismo apropiados.
Las reglas que hemos considerado hasta aquí se centran en los valores máximos y mínimos, pero no
tienen en cuenta ni los valores intermedios ni el número de estados que corresponden a un problema de
decisión. En un problema de decisión bajo ignorancia no hay ninguna razón para considerar que un
estado es más probable que otro. De ahí a argumentar que si realmente somos ignorantes, debemos
entonces tratar todos los estados como si fueran igualmente probables e independientes de nuestras
elecciones.
Imaginemos que quisiéramos rechazar el principio de razón insuficiente argumentando que en una
decisión bajo ignorancia no está justificado tratar cada estado como igualmente probable. Simplemente
no está claro cuál regla es preferible. (Cuek)
Rawls llama a su principio de justicia, principio de la diferencia. Para nuestros propósitos podemos
definirlo como la afirmación de que una sociedad es mejor que la otra si a los miembros menos
favorecidos de la primera les va mejor que a sus equivalentes en la segunda. En opinión de Rawls, la
sociedad estadounidense contemporánea es superior, con todos sus defectos, a la sociedad europea
medieval, puesto que los desposeídos de EEUU se encuentran ahora en mejores condiciones que sus
homólogos europeos medievales.
Harsanyi replica a Rawls que no deberíamos finarnos en los desposeídos para determinar qué sociedad
es más justa, sino que deberíamos comparar las sociedades en términos de la cantidad de utilidad media
que en ellas se logra, su posición es un tipo de utilitarismo. Suponiendo que la utilidad se pudiera medir
en términos puramente económicos idea obviamente polémica podríamos concluir que en la actualidad
algunas sociedades de Oriente Medio ricas en petróleo son más justas que Italia.
Para probar que el principio de justicia social propuesto es el adecuado, Harsanyi y Rawls intentan
contestar el siguiente interrogante: ¿escogerían este principio agentes racionales situados bajo un velo
de la ignorancia si de una lista con distintos principios tuvieran que quedarse con uno sólo?. Los
agentes deberían verse a sí mismos como si en verdad estuvieran eligiendo el principio que regulará la
sociedad a la que pertenecerán cuando se descubra el velo de la ignorancia. Ambos autores creen que
los principios que resulten elegidos en estas circunstancias deben considerarse justos e imparciales.
Ambos pensadores están de acuerdo también en que la decisión en cuestión se toma en un estado de
ignorancia.
Al llegar a este punto, Harsanyi afirma que cualquier individuo racional que esté bajo el velo de la
ignorancia elegirá como regla de decisión el principio de razón insuficiente, el que al ser aplicado el
agente podría incluso inferir que la probabilidad de ser cualquier persona en una sociedad dada es
siempre la misma. A partir e ello, concluiría que la utilidad de pertenecer a una sociedad particular es la
misma que la utilidad de un juego de apuestas o el azar en el cuál la probabilidad de ser cualquiera de
las personas de esa sociedad se mantiene constante.
Rawls no está de acuerdo con esta conclusión, según el principio que apelaría cualquier agente racional
sujeto al velo de la ignorancia es la regla maximín, donde se establecerían comparaciones entre las
distintas sociedades examinando la situación en la que se encuentran los menos favorecidos de
cualquier sociedad, ya que encontrándose en una de estas situaciones es el mínimo resultado que
pueden esperar. Añade que al no tener ninguna razón para elegir una asignación de probabilidades en
vez de otra, no hay ningún motivo para esperar la asignación equiprobable implícitamente supuesta en
el principio de razón insuficiente.
*************
Los actos no afectan las probabilidades de los estados; por tanto, las probabilidades de los estados
condicionadas por los actos se reducen a probabilidades absolutas.
La utilidad y la probabilidad son los ingredientes principales de la teoría de la decisión bajo riesgo.
Hay un gran debate entre filósofos, estadísticos y científicos sobre el significado de las afirmaciones
probabilísticas y sobre cómo pueden justificarse o aplicarse. Por ejemplo, hay algunos que creen que no es
apropiado asignar probabilidades a los acontecimientos singulares y, por tanto, que los juicios de probabilidad
sólo nos informan sobre porcentajes. Otros creen que se pueden asignar probabilidades a los sucesos o
afirmaciones individuales simplemente perfeccionando nuestras conjeturas. Algunos creen que la probabilidad
es una medida de la fuerza o debilidad de nuestras creencias; otros piensan que es una propiedad de la
realidad.
Sin embargo, existe una forma de aproximación común al estudio de la probabilidad: el cálculo de
probabilidades. Se trata de una teoría matemática que nos permite calcular probabilidades adicionales a partir
de las que ya conocemos. El atractivo del cálculo reside en que puede utilizarse con casi todas las
interpretaciones de la probabilidad que han sido propuestas. Además, gran parte de la superestructura de la
teoría de la decisión bajo riesgo depende del cálculo de probabilidades.
La probabilidad absoluta y la condicional están relacionadas mediante varias leyes de la probabilidad. Una de
las leyes más importantes es: P (p&q) = P(p) x P(q/p). Esto significa que la probabilidad de una conjunción es la
probabilidad del primer componente multiplicada por la probabilidad del segundo supuesto el primero. La idea
que hay detrás es que es menos probable que dos cosas resulten verdaderas conjuntamente a que lo sean una
u otra por separado. Pero en general no podemos limitarnos a multiplicar las probabilidades de los dos
miembros de una conjunción, ya que su verdad o falsedad puede estar interrelacionadas.
Otro concepto importante que necesitaremos es el de exclusividad mutua. Si se extrae una sola carta. Entonces
extraer un as y un rey simultáneamente son mutuamente exclusivos. Pero extraer un as y una espada no lo
son; se puede extraer un as de espadas; p y q son mutuamente excluyentes si y solo si es imposible que ambos
sean verdaderos, es decir, si p y q son mutuamente excluyentes, entonces si uno es verdadero el otro debe ser
falso.
Dos afirmaciones equivalentes deben ser o ambas verdaderas o ambas falsas. Así, no hay ninguna posibilidad
de que una de ellas sea verdadera si la otra no lo es.
La ley de la probabilidad inversa y el teorema de Bayes han sido de fundamental importancia en la teoría de la
decisión, en la estadística y en la filosofía de la ciencia.
Suponga un grupo de individuos llega a una situación n la que usan su mejor conjetura para estimar la
probabilidad previa de que cierta afirmación p será verdadera. Supongamos después que usted accede a una
gran cantidad de datos que poyan la verdad de p, que usted utiliza el teorema de Bayes o la ley de probabilidad
inversa para generar probabilidades posteriores de la verdad de p, tomando las probabilidades previas, y que
repite el mismo proceso cada vez que recibe nuevos datos. Entonces, según usted va teniendo acceso a más y
más datos, ss probabilidades estimadas irán acercándose más y más a la probabilidad “objetiva” o con base
estadística. Además, si hay muchos individuos involucrados, sus muchas estimaciones de la probabilidad
convergirán con otras.
Otra aplicación importante del teorema de Bayes y de la ley de probabilidad inversa de la teoría de la decisión
es su uso para determinar el valor de la información adicional. Es un lugar común pensar que tener más hechos
en los que basar una decisión puede marcar una diferencia radical en nuestras elecciones. En las decisiones
bajo riesgo las elecciones que realizamos están en función de los valores que asignamos a los resultados y de
las probabilidades que asignamos a los estados. Según vamos obteniendo más información, a menudo
revisamos nuestra asignación de probabilidades y decisiones si tenemos una información adiciona y cuánto se
elevarán nuestras expectativas. Esta última ley puede usarse para determinar los límites superiores del valor de
la información adicional.
*************
Las interpretaciones objetivas (también llamadas lógicas o empíricas dependiendo de si toman la probabilidad
como una propiedad definida en términos lógicos o estructuras matemáticas o, por el contrario, como una
propiedad definida empíricamente).
Las visiones subjetivas contemplan la probabilidad como una medida de la creencia o de la confianza de un
individuo en una determinada afirmación y permiten que ésta varíe de persona a persona.
Hay dos caminos abiertos a la interpretación clásica. El primero consiste en invocar alguna otra concepción de
la probabilidad para explicar y justificar el supuesto de que cada caso es igualmente probable. De este modo,
uno podría afirmar que la presuposición de que conseguir cruz significa que una serie larga de lanzamientos de
la moneda, la proporción de caras será aproximadamente la misma que la proporción de cruces.
Un problema del punto de vista clásico es que carece de contenido empírico. Debido a que sus probabilidades
son en última instancia proporciones entre posibilidades abstractas, un enunciado probabilística interpretado a
la manera clásica no tiene implicaciones concernientes a los acontecimientos reales y no puede ser ni
confirmado ni refutado por ellos. El punto de vista de la frecuencia relativa es una visión objetiva y empírica
que se ha desarrollado en respuesta a esta necesidad; define la probabilidad en términos de acontecimientos
reales.
Cualquier enfoque frecuentista tiene la ventaja obvia sobre el clásico de no ser circular. El enfoque de la
frecuencia tampoco requiere supuestos dudosos, tales como el principio de la razón insuficiente, y se extiende
al caso indefinido/infinito con mayor facilidad que el enfoque clásico. Por otra parte el enfoque de la frecuencia
relativa tiene una comprensión menos clara de las “verdaderas” probabilidades que el enfoque clásico.
Simplemente no hay garantías de que las frecuencias observadas hasta la fecha estén siquiera cerca de la
frecuencia a largo plazo. La visión clásica no se enfrenta a este problema porque se mantiene al margen de la
observación.
Puesto que el punto de vista frecuentista especifica las probabilidades en términos de proporciones, no tiene
sentido asignar probabilidades a acontecimientos o enunciados singulares.
La interpretación llamada propensión del caso único acepta incluso asignar probabilidad a acontecimientos
singulares.
El enfoque lógico de la probabilidad fracasa cuando carecemos de los recursos analíticos que tal enfoque
presupone. El enfoque frecuentista se tiene abajo con las probabilidades de los casos singulares, mientras que
en el enfoque de la propensión no cubre los casos en los que las propensiones no se conoces o no tienen
sentido.
Las probabilidades subjetivas son valoraciones personales. Puesto que podemos tener, y de hecho tenemos a
menudo, nuestras propias estimaciones de la probabilidad de que algo sea verdadero, incluso cuando ese algo
es un caso aislado o cuando carecemos de una teoría de análisis lógico con respecto a ese algo, el enfoque
subjetivo sortea los impedimentos de las visiones previas.
Ramsey da cuenta de que el grado de creencia (o de confianza) en los enunciados tiene conexión con algunas
de nuestras acciones con las apuestas que realizamos. Si por ejemplo, usted cree que es muy probable que
cierto caballo gane una carrera, estará dispuesto a aceptar una apuesta en la que ganará menos de lo que
tendrá que pagar si pierde. Cuanto más probable considere la victoria del caballo, tanto más dispuesto estará a
aceptar una mayor desventaja en la apuesta.
El razonamiento de DeFinetti trata de un agente en una situación en la que debe hacer una serie de apuestas
sobre un cierto conjunto de enunciados iniciales, asó como sobre todas las negociaciones, conjunciones,
disyunciones y apuestas condicionales que pueden formar usando esos enunciados.
DeFinetti denominó coherentes a los coeficientes de las apuestas de un agente cuando no se podía hacer una
AB contra él. Podemos resumir el teorema de DeFinetti mostrando que si las probabilidades subjetivas de un
agente (coeficiente de las apuestas) son coherentes, entonces responden al cálculo de las probabilidades.
Ahora bien, la coherencia es una condición muy plausible de la racionalidad (idealizada), ya que pocos de
nosotros pensamos que tendría sentido ponernos a nosotros mismos en una posición en la que estuviéramos
condenados a sufrir una pérdida neta en nuestras apuestas. Si aceptamos la coherencia como una condición de
racionalidad, la conclusión de DeFinetti es que las leyes de la probabilidad son condiciones necesarias para la
racionalidad.
Si un agente selecciona sus coeficientes de apuesta de tal modo que satisfaga las leyes de la probabilidad,
entonces no puede hacerse una AB contra él. A esto se le llama el teorema AB converso.
Las personas racionales modifican sus grados de creencia (probabilidades subjetivas) a la luz de los nuevos
datos.
En relación a la irracionalidad de puede decir que (aquí el autor explica a través del siguiente ejemplo)
Puesto que se algo de caballos sé que es (prácticamente) seguro que los caballos de carreras jóvenes y sanos
como este ganan a un caballo viejo y cansado cuando se enfrentan en carreras normales. Dado que eso es así,
yo asignaría una probabilidad de (casi) 1 a que gana el caballo de carreras. Mi asignación de probabilidades en
el caso del ejemplo del caballo no sería coherente con las probabilidades que asigno al resto de enunciados
sobre caballos de carreras.
Pero ¿Qué sucede con los que no saben nada de caballos? ¿Qué deberían hacer en un hipódromo? Los
subjetivistas dicen que en primer lugar, deben apostar coherentemente. Después deben intentar aprender más
sobre caballos de carreras y caballos en general. Según vayan adquiriendo nueva información, deberán
modificar su asignación de probabilidades.
Los teoremas de convergencia muestran que una amplia clase de casos una persona puede empezar con una
asignación de probabilidades totalmente herética, modificarlas mediante la condicionalización, y estar segura
de converger a largo plazo con las probabilidades usadas por los expertos. Los subjetivistas apelan a esto para
argumentar que las probabilidades subjetivas son adecuadas para los científicos y quienes toman decisiones. La
convergencia implica que aquellos que derivan sus probabilidades de las frecuencias observadas tendrán a
largo plazo a estar de acuerdo con aquellos que inicialmente utilizan corazonadas, siempre y cuando, por
supuesto, estos últimos hagan uso de los datos que les proporcionan sus colegas frecuentistas. En
consecuencia, los subjetivistas pueden suministrar probabilidades basadas empíricamente allí donde
cualquiera podría hacerlo. Esto satisfará a los científicos. Pero podría argumentase que los subjetivistas pueden
hacer algo más: pueden asignar probabilidades en los casos en los que, en principio, no se dispone de
frecuencias, propensiones o mediciones basadas en la lógica.
Bajo el enfoque clásico, debemos elegir las posibilidades “equiprobables” a asignar en un enunciado. Esta
elección se basa en el juicio personal y subjetivo de que tenemos en conjunto de posibilidades adecuado y de
que estas posibilidades son equiprobables, puesto que la visión clásica fracasa en suministrar algún método
para asociar un conjunto de posibilidades equiprobables con un enunciado dado.
También debemos decidir si una teoría es suficientemente probable dada la evidencia que hay a su favor antes
de que podamos aceptar las afirmaciones que realiza cobre propensiones.
En resumen, la aplicación de las probabilidades objetivas depende de unas probabilidades subjetivas. De este
modo, las probabilidades subjetivas son al tiempo fundamentales e inevitables.
El autor cree que los subjetivistas tienen razón al afirmar que, cuando aplicamos las teorías objetivas de la
probabilidad, a menudo nos enfrentamos con decisiones que no están claramente definidas.
1º: la confianza que los subjetivistas tienen en la convergencia a largo plazo puede no funcionar en la práctica.
Si las probabilidades iniciales son muy divergentes y los datos son escasos o no concluyentes, la convergencia
puede no alcanzarse hasta mucho después de que haya sido necesario tomar una decisión basada en las
probabilidades en cuestión.
2º: Hay una plétora de enunciados para los que podemos establecer coeficientes de apuesta en valores que no
cumplen el cálculo de probabilidades, sin que ello signifique que nos vayamos a ver atrapados en una AB. Una
apuesta sobre si sucederá alguna vez la muerte térmica del universo por ejemplo. Si ocurre no va a quedar
nadie para cobrar la apuesta, si no, nunca podríamos saber con certeza si se resuelve la apuesta o no.
3º: Una vez que realizamos la apuesta, está claro qué significa ganar hasta que la apuesta se decida. Pero esto
no siempre es así. Con frecuencia nos encontramos en situaciones en las que inicialmente nos preguntamos si
algo es verdad y más tarde nos daos cuenta de que nuestra propia pregunta no tiene sentido en realidad, o que
no tiene una respuesta definitiva.
Por tanto no podemos tener mayor confianza en que el enfoque subjetivo sea universalmente aplicable de las
que teníamos en los enfoques que hemos considerado antes.
La coherencia es la única condición que los subjetivistas imponen a una asignación inicial de probabilidades.
Suponga ahora que yo, que no sé nada de arte abstracto, me hago amigo de unos críticos de arte y empiezo a
visitar museos con ellos. Yo sé lo que me gusta, pero trato de adivinar lo que les gusta a los críticos. Al
principio, utilizo la mejor de mis conjeturas para asignar probabilidades al hecho de que les gusten diversas
pinturas, por supuesto, asegurándome de que mi asignación sea coherente. Más adelante, cuando averiguo lo
que han dicho los críticos, me doy cuenta de que tengo que modificar mis probabilidades. ¿Cómo debería hacer
esto?
Una propuesta obvia es usar la regla de condicionalización. Si me encuentro con la regla que da a lugar a
probabilidades que todavía están lejos de aquellas por las que me inclino en este momento.
El desafío para los subjetivistas es proponer un término medio, esto es, un método racional para la
modificación de probabilidades que no vaya ligado ni a la tenacidad injustificada ni a la frivolidad.
Las soluciones aquí propuestas han estado ligadas al abandono de una asignación previa única de
probabilidades a favor de conjuntos de asignaciones o intervalos entre probabilidades superiores e inferiores.
Esto significa renunciar a la visión subjetivista original, al menos en todos sus detalles.
Capítulo cuatro: “Decisiones bajo riesgo: utilidad” (resnik 141-171)
1.Escalas de intervalo de utilidad: Las utilidades so tan criticas para nuestra explicación de las decisiones bajo
riesgo como las probabilidades, puesto que la regla de la maximización de la utilidad esperada opera sobre
ellas. Pero ¿Qué son las utilidades? Y ¿qué miden las escalas de utilidad?
El primer punto que debemos observar es que las escalas de utilidad ordinal no son suficientes para tomar
decisiones bajo riesgo. Las escalas ordinales sólo representan las posiciones relativas de los resultados; nos
dicen cuál está clasificado en primer lugar y en segundo, por encima y por debajo, pero nada más. En una
decisión bajo riesgo a menudo no es suficiente saber que usted prefiere un resultado a otro; también podrían
necesitar saber si prefiere un resultado suficiente como afrontar los riesgos que conlleva su consecución.
Todo lo que necesitamos para las decisiones bajo riesgo son escalas de intervalo, sólo necesitamos mediar las
distancias relativas de los “intervalos de preferencia” entre ellos. Dos escalas ordinales se consideran
equivalentes si y sólo si cada una puede ser obtenida a partir de la otra mediante transformaciones que
preservan el orden y si cada una puede observarse a partir de la otra mediante transformaciones lineales
positivas.
Otro tipo de escala familiar son las escalas de proporciones, las usamos para medir longitudes o pesos. Todas
las escalas comparten 2 características: 1) todas tienen puntos cero naturales 2) las escalas se usan para
representar la proporción de una cosa medida respecto a alguna unidad de medida estándar. Esto resulta ser la
condición de equivalencia para las escalas de proporciones: 2 escalas de proporciones son equivalentes una a
otra si y sólo si puede obtenerse una a partir de la otra multiplicándolas por constantes positivas.
Ya hemos visto que las decisiones bajo riesgo requieren algo más que escalas ordinales. ¿Bastará con las
escalas de intervalo? ¿O deberemos pasar a las escalas de proporciones? No, no será necesario, porque
cualquier par de escalas en el que cada una sea una transformación lineal positiva de la otra producirá la
misma clasificación de los actos en una tabla de decisión y de este modo dará lugar a las mismas decisiones. Las
escalas de intervalo son suficientes para las decisiones bajo riesgo.
Valore monetarios vs. Utilidades: Un método popular y a menudo convincente para determinar cuan fuerte es
la preferencia de alguien por algo es averiguar cuánto dinero pagaría por ese algo. Como regla general, la gente
paga más por lo que desea más; así se puede esperar que una escala monetaria sea al menos una escala
ordinal. Bajo ese contexto tendría sentido que yo tomara decisiones bajo riesgo sobre la base de los valores
monetarios esperado (VME).
Puede que usted haya reparado en la semejanza entre el enfoque de Von Neuman y Morgenstern y nuestro
enfoque anterior a las probabilidades subjetivas donde medíamos los grados de creencia por la cantidad de un
bien cuantificable y apreciado que el agente está dispuesto a poner en juego. El truco de Ramsey consiste en
usar estas dos intuiciones juntas sin generar un círculo obvio definiendo la probabilidad en términos de utilidad
y la utilidad a su vez en términos de probabilidad.
La aproximación de Von Neuman y Morgenstern a la utilidad hace unas demandas mucho más fuertes sobre las
habilidades del agente para fijar sus preferencias que las que hacían nuestras condiciones de racionalidad
previas. Los agentes no sólo deben ser capaces de ordenar los resultados relevantes a sus problemas de
decisión; también deben sr capaces de ordenar todas las loterías en la que estos resultados estén involucrados.
¿Cómo podríamos aplicar el teorema? Recuerde que nosotros necesitábamos una escala de intervalos de
utilidad para utilizarla en la regla de maximización de la utilidad esperada. Las escalas monetarias mostraron
ser insatisfactorias, porque los valores monetarios en ocasiones se separan de nuestras verdaderas
preferencias y porque los VME o pueden fundar las decisiones que tomamos una sola vez en nuestras vidas. En
contraste las escalas de utilidades si asignan verdaderos valores en el sentido de que las utilidades van a la par
con las preferencias del agente. Aunque los agentes del teorema son seres ideales e hipotéticos, nosotros
podemos usarlos como guías para nuestra propia toma de decisiones.
************
Algunos han objetado a la condición de las mejores probabilidades como requisito de racionalidad. La
respuesta a esta crítica es que la condición de las mejores probabilidades no tiene tales implicaciones.
Recuerde que la teoría de la decisión solo se ocupa de la forma general de las preferencias del agente y no de
sus detalles particulares.
La objeción habitual a la condición de la reducción de loterías compuestas no puede desestimarse con la misma
facilidad. Puesto que la teoría de la utilidad fuerza a un agente a considerar las loterías compuestas como
indiferentes a determinadas loterías simples, hace abstracción (o así lo pretende la objeción) de los placeres y
las ansiedades asociadas con el juego.
Para responder a esta crítica debemos distinguir entre loterías de múltiples etapas que son simplemente
idealizaciones teóricas introducidas para calibrar escalas de utilidad y las loterías en varias etapas de la vida
real que pueden necesitar semanas o meses para completarse.
La objeción a la condición de continuidad es similar a la objeción a la condición de las mejores probabilidades.
Aunque la mayoría de los teóricos de la decisión no toman la objeción al axioma de continuidad en serio,
algunos han desarrollado teorías de la utilidad que no utilizan la condición de continuidad. Se trata de teorías
de la utilidad multidimensionales o multiatributo en las que los resultados se evalúan de acuerdo con distintas
dimensiones (o con respecto a distintos atributos).
Nos enfrenta a dos situaciones. En la situación A ofrecemos a un agente una elección entre recibir 100 millones
de pesetas con seguridad y una lotería que le da una probabilidad de 0,1 de ganar 500 millones, una
probabilidad de 0,89 de ganar 100 millones y una probabilidad de 0,01 de no recibir nada. En la situación B la
elección es entre dos loterías. Una de ellas ofrece una probabilidad de 0,1 de recibir 500 millones y una
probabilidad de 0,9 de no recibir nada, mientras que la otra lotería ofrece una probabilidad de 0,11 de recibir
100 millones y una probabilidad de 0,89 de no recibir nada. La paradoja es la siguiente: Mucha gente
presumiblemente racional y reflexiva encuentra que preferiría a (el pájaro en mano) a b si estuvieran en la
situación A y preferirían c a d en la situación B. Pero sea cual fuere su utilidad para el dinero, la elección de a en
A y de c en B, o de b en A y de d en B, contradice a la teoría de la utilidad. (Lo explica mejor en la página 177
con una figura)
Se han propuesto muchas soluciones a esta paradoja y cada una de ellas ha sido criticada. Dos de ellas merecen
ser examinadas aquí. La primera consiste en argumentar que la representación formal de las situaciones A y B
es incorrecta y que, por consiguiente, nadie que escoja a en A y c en B contraviene la teoría de la utilidad.
Otra solución, propuesta por el estadístico Savage, trata de persuadirnos de que el razonamiento que conduce
a la gente a elegir a en A y c en B es falaz. Savage afirma que aquellos que sucumben a la paradoja de Allais
simplemente han cometido un error en el razonamiento. En cada uno de estos casos todo lo que tenemos que
hacer para corregirles es señalar sus errores con claridad y perspicacia. (Lo explica en las páginas 178 y 179)
La paradoja de Allais deriva su fuerza de nuestra tendencia a preferir asegurarnos un cierto bien seguro a tener
una probabilidad de un bien mayor. La siguiente paradoja, desarrollada por Daniel Ellsberg, apela a nuestra
preferencia por los riesgos conocidos sobre los deconocidos.
Una urna contiene 90 bolas de tamaño uniforme, distribuidas aleatoriamente. 30 son amarillas, las otras 60 son
rojas o azules. No se nos dice cuantas bolas rojas o azules hay en la urna, excepto que su número es cualquiera
entre 0 y 60. Consideremos ahora el sgte. Par de situaciones. En cada situación se extraerá una bola y se nos
ofrecerá una apuesta sobre su color.
Cuando la gente se enfrenta a esta situación con frecuencia razona así: En la situación A yo escogería apostar
por a (amarillo). Pero en la situación B, escogería apostar por c (roja o azul).
Esto significa que nuestras preferencias irán acordes con la utilidad esperada solo si nuestras preferencias por a
y b son el reverso de aquellas por c y d. (Lo explica en las páginas 180 y 181)
2 respuestas: La primera imita la resolución de Savage para la Paradoja de Allais. Plantea que deberíamos elegir
a a b sólo en el caso de que prefiramos d a c. La otra resolución consiste en señalar que no conocemos la
probabilidad utilizada para comparar las utilidades esperadas. Así que se trata de decisiones bajo ignorancia y
no bajo riesgo, de modo que la regla de maximización de la utilidad esperada no tiene aplicación aquí.
Depende del supuesto de que no hay límite superior a la escala de utilidad de un agente. Esto sucede cuando
para cualquier premio básico hay siempre otro mejor. El propósito de la paradoja es mostrar que bajo ese
supuesto habrá algo a lo que el agente asigne una utilidad infinita, incluso si solo asigna utilidades finitas a los
premios básicos. Se basa en el juego de San Petesburgo (Lo explica en la página 183)
El autor se inclina a pensar que la paradoja simplemente nos muestra las consecuencias a las que el agente
debe enfrentarse si no limita sus preferencias. Aunque no ve nada irracional en las preferencias ilimitadas per
se, la paradoja de San Petesburgo habla a favor de evitarlas.
Un ser con poderes de previsión milagros, el Predictor, le ofrece elegir entre dos cajas de zapatos, una roja, la
otra azul. En la caja roja hay 100.000 pesetas y la caja azul esta vacía. El Predictor le dice que usted saldrá y al
volver tendrá que elegir entre llevarse el contenido de la caja azul o el de las dos cajas. También le dice que
mientras usted este fuera, pondrá 100 millones de pesetas en la caja azul si predice que solo va a coger la caja
azul, y que la dejará vacía si predice que cogerá el contenido de las dos cajas. ¿Cuál es su elección?.
Afirma que incluso aunque un estado sea altamente probable dado un acto, el acto mismo no tiene por qué ser
un medio efectivo de producir el estado en cuestión. No aboga en favor de un retorno sin restricciones a las
probabilidades incondicionales.
Para tener una formulación más general de la teoría causal de la decisión, vamos a definir la probabilidad
causal condicional de un estado supuesto un acto como la propensión del acto para producir o prevenir el
estado.
Podemos ver ahora el fundamento de la solución ofrecida por la teoría causal a la decisión de la paradoja de
Newcomb. Al tomar decisiones seleccionamos actos en virtud de su poder para producir los resultados que
deseamos. Sería erróneo, entonces, dotar a nuestro marco teórico de la decisión con indicadores de la eficacia
de nuestros actos que sabemos que son engañosos.
A veces, el que toma una decisión estará bastante seguro de que un acto afectará un estado, pero no estará
seguro sobre los resultados finales debido a la presencia de otros estados que no pueden ser afectados pos sus
elecciones.
Otro tipo de caso es aquel en el que quien toma la decisiófn no esta seguro de la propensión de un acto
determinado para producir un estado determinado.
4-6a. Objeciones y Alternativas
La teoría causal de la decisión es una alternativa razonable y atractiva a la teoría estándar de la maximización
de la utilidad esperada. Pero sería negligente por mi parte no señalar que también ha de hacer frente a sus
propias dificultades filosóficas. La más destacada de estas dificultades es su apelación a necesidades causales
(como opuestas a meras regularidades estadísticas), que han sido filosóficamente sospechosas desde la crítica
de Hume a la causalidad. La tesis de Hume era simple: lo que pasa por ser necesidades causales no son de
hecho sino regularidades estadísticas; porque por mucho que lo intentemos, nunca encontraremos evidencia
de necesidades causales sino solo de regularidades estadísticas.
Si Hume tiene razón, no hay poderes o leyes causales –solo regularidades altamente confirmadas-, y la teoría
causal de la decisión no tiene ningún fundamento.
Hay también un aspecto práctico y epistemológico en el problema de Hume. Porque incluso aquellos que creen
en la causalidad tienen dificultades para especificar métodos que sirvan para distinguir las relaciones causales
genuinas de las meras regularidades estadísticas. Este problema mina a aplicabilidad de la teoría causal de la
decisión, puesto que esta teoría requiere de nosotros que seamos capaces de separar los estados sobre los que
tenemos control causa de aquellos que están conectados con nuestros actos mediante meras regularidades
estadísticas.
Aunque estas dificultades favorecen una aproximación más humeana a la teoría de la decisión, los teóricos de
la causalidad tienen una respuesta aguda. Ellos argumentan que el propósito de la teoría de la decisión es
desarrollar métodos para elegir actos que den lugar a las consecuencias deseadas. Si nuestros actos no tienen
ningún efecto en los resultados, ¿Qué sentido tiene elegir?
Algunos teóricos humeanos o teóricos de la decisión evidencial, aun aceptando este argumento, responden
que el verdadero papel de la teoría de la decisión es ayudarnos a determinar nuestras preferencias respecto a
las noticias. (Lo explica en la página 197)
Recientemente, Ellery Eells ha señalad un modo mediante el cual se puede llegar a las mismas
recomendaciones de la teoría causal sin tener que basar la teoría de la decisión en la distinción entre aquellos
estados que están bajo nuestro control causal y aquellos que no lo están. Sin embargo, a diferencia de los
humeanos empedernidos, Eells supone que tiene sentido halar de causas.
Aunque la solución de Eells a la paradoja de Newcomb evita importar la causalidad directamente al andamiaje
formal de la teoría de la decisión, sigue dependiendo considerablemente del razonamiento causal al analizar la
decisión problemática.
Una última nota: Hay variantes de la teoría causal de la decisión que reducen las necesidades causales a alguna
otra cosa, por ejemplo, a leyes naturales. Pero las objeciones humeanas también se aplican a estas
aproximaciones. También hay que decir que yo solo he expuesto una respuesta a Hume que resulta ser
particularmente adecuada a nuestro interés por la teoría de la decisión. Los filósofos han propuesto muchas
respuestas sutiles y profundas a Hume. Pero el debate sobre la realidad de la causalidad aun es virulento y el
advenimiento de la teoría causal de la decisión añade leña al fuego.
En primer lugar debemos determinar el tipo de evidencia que hay que considerar relevante para la teoría de la
utilidad.
Entonces al enfrentarnos a las paradojas de Ellsberg y Allais, una de las cuestiones principales será si
deberíamos tomar nuestras aversiones a las elecciones recomendadas por la teoría de la utilidad como fallos
por nuestra parte debido a que somos seres que no son absolutamente racionales, o como evidencias de que la
teoría de la utilidad ha dado una caracterización incorrecta de la elección racional bajo riesgo.
Los teóricos de la decisión han realizado ambos tipos de aproximación a las paradojas. Savage, trata de
mostrarnos que la paradoja de Allais es simplemente un truco que puede ser fácilmente desmontad cuando se
lo estudia bajo la luz adecuada. Pero otros han revisado la teoría de la decisión la han dotad de una mayor
complejidad para reducir la utilidad de los actos que involucran sistemas cuyas tendencias son desconocidas y
para aumentar la de aquellos que involucran certezas.
La paradoja de Newcomb y la de San Petesburgo, en contraste, no están destinadas a mostrar que la teoría de
la utilidad entra en conflicto con nuestras visiones preteoricas de la racionalidad sino más bien a mostrar que
es internamente incoherente; que realiza, como en el caso de la pradoja de Newcomb, recomendaciones
conflictivas, o que nos compromete a asignar a algo una utilidad infinita, a menos en tanto no haya un limite
superior para nuestras preferencias. Como en el caso anterior, hay algunos que se ha tomado muy seriamente
estas paradojas y han ofrecido versiones revisadas de la teoría de la utilidad. La teoría causal de la decisión es
un ejemplo. Y, de nuev, hay expertos que creen que esas paradojas se disuelven cuando se las analiza
cuidadosamente. Eells representa un caso de este tipo.
Ha habido, si embargo, una reacción adicional y más interesante a la paradoja de Newcomb. Algunas personas
creen que esta paradoja pone de manifiesto que hay dos tipos de racionalidad. Uno de los tipos es captado por
las teorías de la decisión que aplican la regla de dominancia al problema del Predictor; el otro es captado por
las teorías que siguen la regla de la maximización de la utilidad esperada. De este modo, podríamos tener
ahora teorías alternativas de la decisión.
En resumen, las reacciones ante las paradojas van desde aquellas que las desestiman como ilusiones
intelectuales a las que proponen revisiones de la teoría de la utilidad y que entrañan la posibilidad de
concepciones alternativas de la elección racional. Obviamente, pasará un tiempo antes de que se obtenga un
consenso acerca de estas paradojas.
***********
Conceptos básicos de la teoría de juegos: La teoría de la decisión individual se ocupa de estudiar las decisiones
que toma un agente y las consecuencias de esas decisiones en un contexto determinado. Se aplica cuando
“una” persona tiene que decidir, y en algunos otros caos se mencionan otros individuos pero solo se les
considera como formando parte del entorno del problema. Existen también aquellos casos en los que las
decisiones de otros individuos juegan un papel activo en relación con los resultados, llamaremos a estas
situaciones juegos.
Elementos de un juego: todos los juegos tienen dos o más jugadores; cada juego tiene uno o más movimientos
de manera que cada jugador tiene que realizar una elección por cada movimiento; las reglas del juego son las
que determinan para cada secuencia de movimientos si produce o no un resultado y, en caso afirmativo, cuál
es ese resultado. Cualquier secuencia de movimientos que dé lugar a un resultado recibe el nombre de jugada.
La teoría de juegos dispone de dos maneras para representar formalmente los juegos. El método del árbol de
juego es similar a los arboles de decisión y el de tabla del juego. Cada movimiento queda representado
mediante un nudo del árbol –un círculo con un número dentro- que indica a quien le toca elegir en ese
momento. Las distintas elecciones a disposición del jugador están representadas por las ramas que salen
de cada nudo. Los resultados se asignan al final de cada rama y se representan normalmente mediante uno o
más números que indican la utilidad que cada jugador percibe con el resultado. Se dice que estos nudos
pertenecen al mismo conjunto de información, de manera que el segundo jugador dispone de una información
imperfecta porque es incapaz de diferenciar los distintos nudos de un conjunto de información.
La teoría de juegos supone que cada jugador tiene una función de utilidad en relación con los resultados que
satisface el teorema de utilidad esperada. Así, la utilidad de un resultado cuando es una lotería es la misma que
su utilidad esperada. De ahí que se puedan representar los resultados, tanto si dependen de loterías como si
constituyen certezas, mediante números de utilidad.
La teoría de juegos asume que los jugadores tienen funciones de utilidad que producen escalas de intervalo
para los resultados y loterías que producen resultados. La teoría supone también que, dada una elección de
estrategias por parte del oponente, cada jugador elegirá aquellas estrategias que maximicen su utilidad
esperada. Por otra parte, esta teoría no implica necesariamente que los jugadores prefieran ganar; si un padre
prefiere perder al parchís para motivar a su hija, la función de utilidad del padre asignara una mayor utilidad a
perder. Sin embargo, la teoría de juegos representara esta versión del parchís mediante una tabla o un árbol
diferentes de los que corresponden a la versión normal, ya que en ellos las utilidades altas de los resultados
que equivalen a la victoria se reemplazan por utilidades bajas. A pesar de lo cual, y con independencia de cuál
sea el juego al que juegue el padre, la teoría supone que busca maximizar su utilidad.
La teoría de juegos supone también que todos los jugadores conocen por completo el árbol o la tabla del juego,
así como las utilidades que corresponden a los resultados tanto suyos como del resto de los jugadores. Más
aun, supone que cada jugador sabe que todos los jugadores conocen este tipo de cosas. Esto significa que, a la
hora de reflexionar acerca de un juego determinado, cada jugador debe suponer que está jugando con
oponentes perfectos, que reaccionarán del mejor modo posible a cada movimiento o elección de estrategia
que emprenda. El objeto de la teoría de juego es determinar el resultado o los resultados posibles de cada
juego, dadas estas suposiciones acerca de los jugadores.
La teoría de juegos se divide en distintas ramas. La división más importante es la que distingue entre la teoría
de juegos de dos personas y la teoría de juegos de más de dos personas (esta clasificación no cuenta a zar
como una persona). A esta teoría de la suele llamar teoría de juegos de n-personas y es mucho más complicada
que la versión de dos personas, ya que los jugadores pueden formar coaliciones para vencer a otro jugador. De
ahí que la teoría de juegos de n-personas sea muy útil cuando hemos de analizar situaciones políticas o
económicas (dice que es muy difícil y que no la tocara en este capítulo).
Los juegos se pueden clasificar también dependiendo de si los intereses de los jugadores son completamente
opuestos (juegos estrictamente competitivos) o si coinciden al menos parcialmente. Los juegos no
estrictamente competitivos se distinguen a su vez según se permita o no que los jugadores se comuniquen
entre sí para coordinar estrategias. Si los jugadores pueden comunicarse, el juego se llama juego cooperativo.
En estos casos los jugadores pueden firmar acuerdos vinculantes y repartirse incluso los pagos. Se podría
argumentar que los juegos de salón y los deportes son los únicos estrictamente competitivos que existen en
realidad. Ni siquiera en tiempos de guerra pretenden los países destruir por completo al enemigo. Los
jugadores comparten siempre algunos intereses y las conferencias de paz no sirven solo para que las naciones
se comuniquen entre sí, sino para firmar acuerdos sobre como dividir ciertos pagos. A pesar de estas
consideraciones, cuando queremos estudiar los juegos resulta a menudo útil analizar las guerras como si
fueran juegos estrictamente competitivos, puesto que, en lo que respecta a la elección de estrategias para la
victoria, los aspectos no competitivos son por lo general descartables.
Cuando un juego es estrictamente competitivo la comunicación y los pactos no juegan en el ningún papel,
incluso si las reglas del juego los admiten. En efecto, en estos juegos no hay ninguna razón para confiar en los
oponentes y es de esperar que mientan i engañen siempre que les venga bien. Todos los jugadores son
conscientes de ello y nadie se fía de las palabras, amenazas o gestos de ningún otro jugador. La teoría de
juegos refleja este aspecto borrando la distinción entre juegos con o sin comunicación cuando se trata de
juegos estrictamente competitivos.
Juegos estrictamente competitivos de dos personas: En un juego estrictamente competitivo las preferencias
de los dos jugadores son completamente opuestas. Si pensamos en términos monetarios, las ganancias de uno
están en función de las pérdidas del otro, suelen llamarse juegos de suma cero. Puede ocurrir que los pagos
monetarios o en especie no reflejen los verdaderos valores de los jugadores. Si los jugadores fueran dos
altruistas empedernidos, ganar se convertiría en el resultado más temido. Esto no significa que sus preferencias
sean apuestas. El juego es para ambos estrictamente competitivo –cada uno se esfuerza en perder- y lo único
que sucede es que sus preferencias son radicalmente distintas de las de los jugadores normales. Por ello, al
representar ente juego debemos sustituir los pagos concretos por las utilidades que cada jugador les asigna.
Una segunda razón para recurrir a los números de utilidad es que a menudo los resultados se representan
mejor en forma de loterías. Cuando se introducen loterías, cualquier explicación acerca de por qué maximizar
las utilidades esperadas es la aproximación más racional –incluso cuando se va a jugar una o pocas veces- exige
identificar la utilidad de una apuesta con su utilidad esperada.
Pares de estrategias en equilibrio: En general diremos que un par de en equilibrio o que está en equilibrio
cunado ningún jugador puede mejorar su resultado cambiando unilateralmente su estrategia. Al pago asociado
con un par de estrategias en equilibrio se le llama el valor de equilibrio. Una vez que los jugadores han
encontrado un par de estrategias en equilibrio. Ninguno tiene motivos suficientes para cambiar de estrategia
menos que el otro jugador cambie también la suya. Pero ¿por qué hemos de suponer que encontrarán un par
de estrategias en equilibrio? Al fin y al cabo, la comunicación y la negociación están excluidas en un juego de
suma cero; la única manera en que ambos jugadores podrían escoger un par de estrategias es si cada uno
decidiera por su cuenta que la parte que le corresponde del par es la mejor estrategia a su alcance.
Cada jugador descubre entonces que si jugara su parte del par en equilibrio, podría asegurarse un valor
determinado, es decir, su nivel de seguridad para el juego, mientras que si escogiera cualquier otra estrategia
el resultado podría ser menos favorable. Puesto que cada jugador sabe que está jugando contra un oponente
perfecto, ninguno se arriesgara a adoptar una estrategia que no le garantice su nivel de seguridad para el
juego. De acuerdo a esto, razonando cada jugador por su cuenta, ambos seleccionaran su parte
correspondiente del par en equilibrio. Existe un criterio más simple para describir los pares de estrategias en
equilibrio en el caso de juegos de suma cero, llamaremos a este criterio la prueba de equilibrio minimax para
los juegos de suma cero y dice así: dado un juego de suma cero, una condición necesaria y suficiente para que
un par de estrategias este en equilibrio es que el pago que ellas determinan equivalga al valor mínimo de su fila
y al valor máximo de su columna.
Estrategias mixtas: Si todo juego de suma cero tuviera al menos un par de estrategias en equilibrio, con lo
dicho hasta aquí habríamos estudiado ya toda la teoría de juegos de suma cero. Ante cualquier juego de este
tipo podríamos aplicar la prueba de maximin y resolver el juego de un modo mecánico. Pero no todos los
juegos de suma cero se dejan resolver mediante este método. En tiempos de guerra, cuando un elemento
sorpresa tiene vital importancia, la amenaza de espionaje está siempre presente. Una manera de defenderse es
desarrollar varias estrategias y decidir solo en el último minuto cual se lleva a cabo. Dejar que un mecanismo
de azar tome la decisión añade sofisticación a esta misma idea. Por el momento, parece que hemos mejorado
la posición del jugador, sin embargo, ¿no es de esperar que el oponente responda a su vez con una estrategia
mixta? Por supuesto, pero eso no cambiaría nada en este juego. Su estrategia mixta tiene la utilidad esperada
de 0 frente a cualquier estrategia que ella juegue sea mixta o no.
EL TEOREMA DE MAXIMIN PARA LOS JUEGOS DE SUMA CERO DE DOS PERSONAS: Para cualquier juego de suma
cero de dos personas hay al menos una estratega (mixta o pura) que forman un par en equilibrio. Si hay más de
un par en equilibrio, sus utilidades esperadas son iguales.
La utilidad esperada de un par en equilibrio se llama el valor v del juego. Es el nivel de seguridad que
corresponde a este juego para ambos jugadores. Dicho de otra forma, jugando su mitad en equilibrio X se
asegura de que ganara al menos v, y jugando su parte Y tiene garantizado que las ganancias de X no serán
mayores de v. La estrategia en ganancias de X se llama una estrategia maximin porque maximiza sus resultados
mínimos; la estrategia de ganancia de Y se llama estrategia minimax porque mantiene las ganancias máximas
de X al mínimo.
***********************
La utilización de las estrategias maximín mixtas plantean numerosos interrogantes acerca de la racionalidad de
poner el destino de uno en manos de la suerte.
La utilización de una estrategia mixta implica, en primer lugar, deja que la suerte decida qué uso de la
estrategia pura se va a aplicar. Y en segundo lugar, ejecutar una estrategia pura en realidad se hace como
resultado de utilizar una estrategia maximín.
Recordemos que el teorema del maximín sólo dice que la estrategia maximín garantiza la obtención del valor
del juego –del nivel de seguridad-, pero no dice que sea imposible obtener mayor ventaja si uno juega contra
alguien que no sigue su estrategia de equilibrio. Puede ser racional jugar una estrategia distinta de la estrategia
maximín.
El resultado de cualquier juego real es el mismo que el que se obtiene seleccionando al comienzo de una
estrategia pura de manera que, en la mayoría de los casos, su utilidad esta por encima o por debajo de la
utilidad que corresponde la estrategia maximín. Los valores numéricos que se utilizan en la teoría de juegos no
son medidas directas de, por ejemplo, la cantidad de dinero perdido o ganado. Esos números representan más
bien las utilidades asociadas a esos resultados. Acudir a un mecanismo de azar es, sencillamente, introducir una
apuesta como opción adicional en el juego.
Algunas veces resulta claramente racional escoger una apuesta si nos enfrentamos a una situación fatalmente
segura. Le ofrece una apuesta que contiene alguna posibilidad de producir un resultado mejor, entonces es
obvio se suerte mejora.
Las estrategias mixtas podrían quizá caracterizarse como opciones nuevas, pero en ningún caso conducen a
nuevos resultados.
En última instancia, el mejor argumento a favor de las estrategias mixtas se apoya en la hermeticidad: este tipo
de estrategia impide al oponente adivinar que estrategia pura se va a escoger hasta el mismo momento en que
se utiliza. Cuando al contrario le resulta todo punto imposible adivinar las intenciones del agente, el
argumento de la hermeticidad pierde todo su peso. En esos casos, aun podemos justificar el uso de estrategias
mixtas si el juego no se puede solucionar mediante ninguna expectativa pura. Al fin y al cabo, ninguna
estrategia parece razonable, y ya que hemos de escoger alguna, no es completamente irracional usar un
mecanismo de azar para decidirnos. La elegancia del teorema maximín reside en que tan pronto como el
agente decide emplear estrategias mixtas, el teorema se encarga de dar con una elección racional.
5-4 juego de suma distinta de cero de dos personas: fallos del concepto de equilibrio
En un juego de suma cero las dos partes pueden llegar a una solución racional, estable y, en ciertos sentidos,
optima aun cuando no puedan comunicarse entre sí. Si cada uno persigue simplemente su propio interés de la
forma mas racional posible, los jugadores llegaran al par de estrategias en equilibro para el juego. El resultado
es inmejorable, porque ambos jugadores sacan el mayor provecho posible de la situación si se tienen en cuenta
las oportunidades a su alcance y las tretas del contrario. Aunque parezca extraño es precisamente la naturaleza
estrictamente competitiva de estos juegos lo que permite soluciones teóricamente satisfactorias. En efecto, si
abandonáramos la suposición de la competición estricta al tiempo que conservamos la hipótesis de que los
jugadores no pueden comunicarse entre si ni establecer acuerdos vinculantes, obtendríamos juegos en los que
las nacionales de racionalidad individual interesada en si misma y de pares de estrategias en equilibrio
impedirían encontrar una solución satisfactoria o, pero aun, ofrecerían soluciones completamente
insatisfactorias. Esta cuestión no solo plantea interrogantes, sino que sugiere también interesantes conexiones
entre el ámbito de la racionalidad y el de la moralidad.
La explicación que ofrezco a continuación abordara dos juegos en concreto y tratará de explicar las dificultades
en la que se ve inmerso el enfoque del equilibrio para resolverlos.
Desde la perspectiva de un observador imparcial, siempre se podría sugerir la siguiente solución: lanzar una
moneda. Cuando se realiza esto se introduce una estrategia mixta conjuntamente coordinada, mientras que el
juego únicamente permite que las jugadoras seleccionen por separado estrategias mixtas. De hecho las
estrategias mixtas garantizan a cada jugadora un nivel de seguridad de 1/2. Sin embargo, estas estrategias no
están en equilibrio.
La consecuencia última de estas reflexiones es que las consideraciones de racionalidad individual abordadas
hasta aquí fracasan a la hora de producir una solución óptima o estable para este juego.
Todavía es posible concebir otra solución a este juego. Cada una de las jugadoras sabe que no puede esperar
que su oponente juegue la estrategia que produce valor de equilibrio que ella, la primera jugadora, prefiere.
Asique cada jugadora debería suponer que su compañera no jugara esa estrategia y seleccionar entonces su
mejor estrategia bajo ese supuesto.
Este juego tiene un único punto de equilibrio y estrategias dominantes para cada jugador. De ahí que, al
contrario de lo que sucede en el caso de conflicto de voluntades, se puede predecir perfectamente cual va a
ser el resultado. La paradoja es que, aunque desde la perspectiva de cada jugador las estrategias que él escoge
son las únicas alternativas racionales, el resultado es todo menos óptimo. Lo cual sugiere que quizás haya una
incompatibilidad radical entre la noción de racionalidad individual y la de racionalidad de grupo. A
Acá el auto explica el juego que esta mas que requetecontraarchi conocido por nosotros asique no lo pondré.
Es fácil ver que la acción dominante para los dos jugadores es confesar. Por tanto nuestra teoría sugiere que el
resultado que alcanzaran jugadores racionales será confesar ambos. Las estrategias que lo producen están
apoyadas en uno de los primeros y más fundamentales principios de la racionalidad individual: el principio de la
dominancia. La paradoja en este caso es que, por seguir los dictados de la racionalidad individual, cada jugador
esta en peor situación que si hubiera sido menos “racional”.
Analicemos ahora el dilema del prisionero desde un punto de vista informal. Acá también se da la única
situación posible es jugar a la defensiva, es decir, confesar ambos.
La situación que surge en el dilema del prisionero no queda restringida a juegos de dos personas. Imagínese
que los miembros de la OPEP intentan limitar la venta total de su producto con la esperanza de incrementar los
precios y beneficiarse tanto a nivel individual como grupal. En este contexto se pueden dar múltiples traiciones.
Todos los miembros de una organización saben que deben continuar manteniendo relaciones, de manera que
es necesario establecerlas bases para una futura confianza. Desde este punto de vista, resulta ventajoso no
traicionar a otros miembros. Este argumento impide que el juego sea un verdadero dilema del prisionero.
Tal y como han resaltado muchos estudiosos, existe una conexión entre el dilema del prisionero y la paradoja
del predictor. Imagine que es usted uno de los prisioneros y que tiene motivos para creer que el otro prisionero
piensa de modo parecido al suyo. Puesto que usted cree que el otro prisionero piensa de forma similar,
asignara una probabilidad alta al hecho que escoja la misma elección que usted y una probabilidad baja al caso
contrario. Por lo tanto, usted maximizara su utilidad esperada si no confiesa.
Es así como aparece otra vez el dilema del prisionero. El principio de dominancia le aconseja confesar, pero el
principio de maximización de la utilidad esperada le dice que no confiese. Mas aun, su elección no afecta
causalmente la de su oponente, sino que simplemente muestra cual va a ser la elección del otro. También en
este problema, la decisión que tome dependerá de como solucione el conflicto entre la teoría de la decisión
causal y la evidencial.
La teoría de juegos recomienda que el conflicto de voluntades y el dilema del prisionero son incapaces de
garantizar a cada participante el mejor resultado. Estos dos no son óptimos de pareo, lo que significa que algún
otro resultado ofrece mayores ventajas al menos a uno de los jugadores, mientras que al otro no le va peor. La
teoría de juegos es incapaz de asegurar resultados óptimos según Pareto para los problemas del conflicto de
voluntades y del dilema del prisionero.
Recuérdese que tanto la envidia como la buena voluntad y otras actitudes similares hacia los pagos que reciben
los demás jugadores, están incluidas ya en la utilidad que cada uno asigna a los resultados. Por ello, ningún
jugador tiene razones para preferir un resultado que no es óptimo de Pareto en vez de uno que sí lo es.
El fracaso de la teoría de juegos para arrojar resultados óptimos según Pareto en el caso de juegos como el
dilema del prisionero, ha llevado a algunos filósofos a buscar soluciones óptimas por otros medios. Algunos
estudiosos han llegado incluso a sugerir que en situaciones como la del dilema del prisionero funcionamos con
otra clase de racionalidad, la racional grupal.
Esta propuesta solucionaría el dilema del prisionero, puesto que en ese caso solo hay un resultado óptimo
según Pareto. Al adoptar la perspectiva de la racionalidad a nivel de grupo cada jugador convencería de que la
única acción racional es no confesar y así obtener el resultado óptimo.
Lo mejor que podemos hacer es evitar por principio quedar atrapados en juegos como el conflicto de
voluntades o el dilema del prisionero. Y esto a través de reglas, que representan al fin y al cabo, una forma
limitada de moralidad. Desde esta perspectiva, los fallos de la teoría de juegos permiten ir allanando el terreno
para argumentar que es racional ser moral. Numerosos principios morales regulan comportamientos, de
manera que incluso aquellos agentes preocupados por su propio interés deben conformar su conducta a estas
reglas. Por lo pronto como creyeran que podía salir bien parados actuando de manera inmoral, seria racional
que se aprovecharan del sistema. En resumen, este tipo de respuesta enfatiza que la apelación a la moralidad
solo consigue introducir el contexto para que se de un nuevo dilema del prisionero a gran escala.
Un dilema parecido se plantea en el campo de la filosofía política con el Gorrion (free rider poh tchiquiiiillos).
En estas situación resulta beneficioso para todos acceder a vincularse en algún tipo de acción cooperativa y, al
mismo tiempo, resulta una tentación continua desvincularse y aprovecharse de la cooperación de los demás.
Hobbes argumento, en relación a esto que los agentes racionales interesados en si mismos se dan cuenta en
seguida de que cualquier proyecto cooperativo debe venir acompañado de castigos lo suficientemente severos
como para volver irracional cualquier tipo de estafa. Supuso como hipótesis que los participantes de este
proyecto cooperativo nombrarían a un soberano que detentaría el poder de descubrir y castigar a los que no
obedecerían las reglas. Al igual que la solución al dilema del prisionero basada en el código del silencio, esta
manera de resolver el dilema supone cambiar las funciones de utilidad de los jugadores y, por lo tanto, cambiar
el propio juego.
David Gauthier aborda de nuevo este mismo problema con la esperanza de mostrar que los agentes racionales
interesados en si mismos pueden llegar a concluir que deberían cooperar con sus compañeros, incluso si no
existe un soberano como el que propone Hobbes. La clave de este enfoque de Gauthier radica en que la
situación en la que el agente sabe que probablemente se enfrente en el futuro a un dilema del prisionero y que
elige ahora si cooperará o engañara llegando el caso. Gauthier dice que esta elección varía según la persona
que se quiera llegar ser: cooperante o engañar.
Imaginemos que está tratando de decidir si llega a ser alguien que coopera o que estafa. Según Gauthier, de
todas las opciones realistas a su alcance, lo mejor que puede hacer es unirse a nosotros y permanecer fiel. Es
así como se da cuenta de que, por su propio interés, debe ser la clase de persona que coopera cuando se ve
envuelta en un dilema del prisionero.
Si su oponente puede leer su mente como si no, él sabe que si la persona es racional jugara la estrategia en
equilibrio. Esto no repercute en la teoría de juegos de suma cero. Si repercutiría en juego de suma distinta a
cero donde ninguna comunicación es posible, puesto que no habrá tales juegos a menos que limitemos de
algún modo la capacidad de leer el pensamiento a, por ejemplo, encuentros cara a cara.
Imaginemos que alguien tiene que decidir de nuevo si seguir siendo estafador, o convertirse y cooperar.
Supondremos que hay una posibilidad de descubrir a los estafadores y por tanto, excluirlos de la empresa
común. Así las cosas, si decide seguir siendo estafado, puede que tenga la ocasión de negociar un proyecto
común con otras personas cooperantes. Si lo hace, puede que no se den cuenta y explote a sus compañeros.
Claro que si lo desenmascaran, será expulsado de la organización. Por otro lado, si decide volverse un tipo
cooperativo, también puede que tenga ocasión de tropezarse con algunos compañeros cooperantes. Si así lo
hace y si ustedes se reconocen mutuamente como cooperantes, se beneficiara de la aventura común.
Todavía no sabemos si la utilidad mayor corresponde a permanecer siendo un estafador o volverse cooperante.
Por una parte podría obtener ganancias si engaña y obtener menos ganancias e incluso una perdida potencia si
no engaña. Una persona podría tomar su decisión comparando las ganancias. Si la probabilidad de explotar y la
probabilidad de cooperar es menor que la proporción entre la ganancia que resulta de cooperar y la ganancia
que resulta de explotar. Por lo tanto, si su probabilidad de cooperar es alta su probabilidad de explotar es baja
y la ganancia de cooperar es relativamente cercana a la ganancia de explotar, debería entonces volverse
cooperante, pero si su probabilidad de cooperar, y la ganancia de la primera es también alta en comparación
con la segunda, debería usted seguir siendo un estafador.
Es claro que no podemos probar que sea racional elegir cooperar en cualquier situación del dilema del
prisionero. Sin embargo el análisis de Gauthier muestra que cuando lo beneficios que se obtienen de cooperar
se aproximan a los que se derivan de explotar y la probabilidad de cooperar con éxito excede la de explotar,
entonces puede ser racional cooperar. Este resultado permite que lo ciudadanos consideren que es racional
cooperar, sin que sea necesario introducir el papel del soberano como hacia Hobbes.
En primer lugar, para poner freno a las deserciones de potenciales estafadores, los ciudadanos deberían
conseguir que los pagos que resultaran de la cooperación fueran tan equitativos como sea posible. Para poder
descubrir el punto medio adecuado debemos analizar los juegos de regateo racionales, tema que abordara en
la próxima sección. En segundo lugar, los ciudadanos pueden conseguir desanimar a los estafadores
potenciales desarrollando métodos que permitan identificar los distintos tipos de personas.
Es necesario enfatizar que, aunque el dilema del prisionero hable de estrategias de cooperación, no se trata de
un juego cooperativo. Se dice que los jugadores cooperan cuando coordinan intencionalmente sus estrategias.
En todos los casos que hemos considerado hasta ahora, los jugadores no coordinan, sino que cada uno decide
de manera independiente poner en práctica una estrategia que conduce al llamado resultado cooperativo.
Así pues, para poder basar la moralidad en los juegos de regateo, debemos mostrar que se puede ser racional
mantenerse fie a los regateos, incluso en caso de que fuera posible obtener mayor utilidad desvinculándonos.
Esto pone en relieve la importancia del razonamiento de Gauthier. Si fuera correcto, permitiría establecer que
los agentes racionales que se encuentran en un dilema del prisionero se atienden a veces a un acuerdo de
cooperación. En cambio muestra que es racional elegir vivir siguiendo una norma que nos exija cooperar
fielmente siempre que estemos inmersos en una empresa cooperativa tal que(1) podamos obtener mas
utilidad con ella que viviendo por nuestra cuenta y (2) tengamos una expectativa razonable de que nuestros
socios cumplirán también sus compromisos.
**********
Hasta ahora hemos asumido que la comunicación entre los jugadores era imposible. De manera que, aun si
coincidían parcialmente sus interese, es decir si el juego no era de suma cero, los jugadores no podían
coordinar sus estrategias ni transmitirse información acerca de lo que era imposible que cada uno obtuviera
por su cuenta. Ahora da la oportunidad de hacerlo.
Para entender hasta que punto la situación cambia si se admite la comunicación, podemos acudir al problema
de conflicto de voluntades. Desde el momento en que no podían coordinar sus estrategias, la posibilidad de
apelar a esta solución quedaba descartada. En cambio ahora si se puede emplearla, lo que significa que habrán
adoptado una estrategia coordinada.
Esta estrategia coordinada permitirá que ambos jugadores accedan al mejor de los puntos situado en la línea
que une las posibilidades de elección. Cada uno de esos puntos es un óptimo de Pareto. La tarea de la teoría de
juegos es descubrir que punto o puntos de esta línea es la solución de este juego.
En un juego cooperativo, los jugadores suelen alcanzar resultados haciendo uso de estrategias coordinadas que
no podrían alcanzar actuando por su cuenta. Además al jugar estrategias coordinadas los jugadores pueden
garantizar que evitaran resultados que son peores para ambos.
Algunos expertos en juegos defienden que todas las estrategias que en un juego cooperativo producen
resultados óptimos de Pareto, deberían contar como soluciones al juego. Al contrario de lo que ocurre cuando
en un jugo de suma cero aparecen múltiples pares en equilibrio, donde el problema de coordinación que surge,
no puede resolverse. Así que la situación degenera rápidamente en un juego competitivo, en el cual los
jugadores buscan resultados óptimos de Pareto, que le sean favorables. Una manera de capear este obstáculo
es permitir que los jugadores regateen por resultados óptimos de Pareto.
Una sugerencia lógica para resolver el problema que se plantea cuando en un juego cooperativo existen varios
resultados alcanzables óptimos de Pareto, es la de que los jugadores seleccionen un solo resultado,
regateando entre si. Puesto que es más racional intentar poner término a una disputa mediante una
negociación que dejarla enquistada o resolverla por la fuerza.
Un juego de regateo se especifica en términos del conjunto alcanzable de resultados para un juego
cooperativo. Llamaremos entonces al conjunto de resultados alcanzables la región de regateo que como
mínimo debe tener dos puntos óptimos de Pareto, puesto que de lo contrario no habría nada que discutir. Un
punto que no es óptimo de Pareto, se le llama punto de fracaso del juego.
Este punto marca los pagos de los jugadores si la cooperación fracasa. Además, el punto de negociación del
juego será el punto, dentro de la región de regateo, que sería seleccionado por regateadores racionales. Si los
regateadores fueran racionales se pondrían de acuerdo en un punto óptimo según Pareto.
Por otra parte, es seguro que el punto Nash, es un óptimo de Pareto, ya que solo hay un punto Nash. La
propuesta de Nash tiene otras ventajas, además de su capacidad para seleccionar solo un punto optimo según
Pareto de entre toda la región de regateo. Resulta plausible pensar que cualquier solución a los problemas de
regateo debería cumplir las siguientes cuatro condiciones:
1. Optimación según Pareto: el punto de negociación debe ser un único punto óptimo según Pareto
2. Invariabilidad: a través de las transformaciones de utilidad: si dos juegos de regateo pueden
convertirse uno en el otro mediante una transformación lineal positiva de las escalas de utilidad de los
jugadores, los puntos de negociación de uno de los juegos pueden obtenerse a partir de los puntos de
negociación del otro mediante esas mismas transformaciones.
3. Simetría: si un juego de regateo es simétrico, en el sentido de que el punto de negociación asigna el
mismo valor a cada jugador.
4. Contracción/expansión irrelevante: Si (a) la región de regateo de un juego está incluida en la región de
regateo de otro juego y (b) los dos juegos tienen los mismo puntos de fracaso, entonces si el punto de
negociación que corresponde a la región más amplia está situado dentro de la región más pequeña, los
dos juegos deben tener el mismo punto de negociación.
La propuesta de Nash es la única solución a los problemas de regateo que consigue satisfacer estas cuatro
condiciones.
Hay poco que discutir respecto a las condiciones de optimización de Pareto y de transformación de las
utilidades. Nuestro análisis previo de los juegos cooperativos, señala que es deseable tener un método que
seleccione un único punto óptimo según Pareto, como solución a esos juegos. Además, las soluciones a los
juegos deberían ser invariantes a través de las transformaciones lineales positivas de utilidad. Un método
para solucionar juegos que permitiera que las soluciones variaran cuando se modifican las utilidades
mediante esas transformaciones, respondería a una cantidad de información mayor que la representada en
las escalas de utilidad.
La controversia surge cuando analizamos la condición de expansión/contracción ya que ocurre algo similar
a las decisiones bajo ignorancia. En este caso, cuando la región de regateo se expande, el punto de
negociación debe ser el mismo siempre que ninguno de los nuevos puntos sea el punto de negociación, y el
punto de fracaso permanezca idéntico. A favor de esta condición se podría argumentar que cuando se
expande la situación de regateo, de modo que las únicas posibilidades que se introduzcan, no pueden ser
puntos de negociación, y cuando se mantiene el punto de fracaso, en realidad la situación no cambia. Los
nuevos puntos solo sirven para distraer y cualquier negociador inteligente sabrá pasarlo por alto. Por
desgracia, este argumento se basa en una interpretación equivocada de la condición 4. Esta condición no
dice que las nuevas posibilidades no puedan ser puntos de negociación. Simplemente dice que mientras no
se elija ninguna de las nuevas posibilidades, su presencia no modifica el punto que resultaba elegido entre
las anteriores posibilidades.
La condición puede formularse, también diciendo que si reducida una región de regateo, manteniendo
tanto el punto de fracaso como el de negociación, este último también es el punto de negociación del
nuevo juego. El razonamiento es que si ese punto era aceptable cuando había más puntos entre los que
escoger, seguirá siéndolo cuando existen menos puntos para escoger. No obstante, este argumento a favor
de la condición 4 descuida el papel que otros puntos adiciones juegan a la hora de determinar los niveles
de aspiración de los jugadores.
Llamaremos punto ideal del juego (donde gana todo), a aquel punto que equivale a la utilidad máxima
disponible en cualquier punto de la región de regateo. Normalmente sucederá que el punto ideal no está
en la región de regateo, ni se puede identificar como un resultado posible del juego. La ganancia potencial
de un jugador es la diferencia entre su valor en el punto ideal y su valor en el punto de fracaso.
La ganancia proporcional de un jugador en un punto puede definirse entonces, como la proporción entre la
ganancia real del jugador y su ganancia potencial.
Se define, también la concesión en un punto de un jugador como la diferencia entre su valor en el punto
ideal y su valor en el punto en cuestión. Su concesión proporcional en un punto se define entonces como
la proporción entre su concesión en ese punto y su concesión potencial
Como podría sospecharse existe una relación básica entre las ganancias y las concesiones proporcionales.
Una manera sencilla de aproximarse a las soluciones de regateo utilizando las ganancias (concesiones)
proporcionales, es especificar el punto de negociación como el punto en el cual las ganancias
proporcionales son idénticas para cada jugador y tan grandes como sean posibles. A este punto se le
llamará punto de distribución equitativa.
También podemos especificar la solución en términos de concesiones. Al fin y al cabo, el punto en el cual
las ganancias proporcionales son mayores e iguales es también el punto en el cual las concesiones
proporcionales son menores e iguales. Por tanto, el punto de distribución equitativa es el mismo, tanto si
pensamos la solución en relación con las ganancias como respecto a las concesiones.
Además, en cualquier juego simétrico, el punto de distribución equitativo, y el punto Nash coinciden.
La Condición de monotonicidad se refiere a si una región de regateo contiene otra y ambas comparten el
punto de fracaso y el punto ideal. El punto de negociación de la región más extensa dota a cada jugador al
menos con la misma cantidad que recibe en el punto de negociación de la región más pequeña.
Desgraciadamente, cuando aplicamos la solución basada en los puntos de distribución equitativos a juegos
con tres o más jugadores tenemos resultados insatisfactorios. El punto de distribución equitativa no puede
ser un punto óptimo de Pareto. Peor aun, el único punto de esta región en el cual las ganancias
proporcionales de los jugadores son idénticas es el punto de fracaso. De manera que en este juego la
solución de distribución equitativa declara el punto de fracaso como punto de negociación. David Gauthier
ha sugerido una solución alternativa para lidiar con casos como este. En vez de exigir que las ganancias
proporcionales sean idénticas, nos propone que requiramos la maximización de las ganancias mínimas y
que escojamos el punto que distribuya la máxima utilidad a cada jugador y que sea compatible con esta
condición. Se puede mostrar que la solución de las ganancias proporcionales, maximín sugerida por
Gauthier satisface las condiciones de optimización según Pareto, de invariabilidad a través de las
transformaciones, de utilidad y de simetría.
La propia teoría contiene numerosos cabos sueltos, y sus estudiosos no se ponen de acuerdo sobre la
manera correcta de definir el concepto de solución en el caso de los juegos de n-personas. Para empezar es
necesario resaltar que algunos juegos de dos personas son análogos a los juegos de tres o mas personas,
así también existen versiones de n-personas de los juegos de regateo. En el caso de los juegos de tres
personas, la región de regateo no es un polígono en dos dimensiones sino un sólido en tres dimensiones.
En el caso general, la región se convierte en un hipersólido que ocupa un espacio de n- dimensiones.
Existen versiones de n-personas de los juegos de suma cero. Conocidos como los juegos de suma
constante, llamados así porque la cantidad total de utilidad disponible bajo cada resultado suma siempre el
mismo número.
Por desgracia, el teorema maximín no se aplica a los juegos de suma constante de n-personas de los que
nos acabamos de ocupar. Si permitimos estrategias mixtas, habría puntos de equilibrio para cada juego.
Pero, como en el conflicto de voluntades, puede haber varios puntos de equilibrio, con diferentes valores
para cada jugador.
La teoría de los juegos de n-personas, se centra en las coaliciones formadas por algunos jugadores para
adquirir ventaja sobre los demás o sobre el sistema. Las coaliciones son típicas en la vida cotidiana. Aunque
las coaliciones son imposibles en los juegos de dos personas, algunos juegos múltipersonales pueden ser
transformados en juegos de dos personas entre coaliciones. Durante el juego, a estas coaliciones se les
asignan un Valor de coalición que reflejan las utilidades que resultan de las coaliciones.
En la teoría de juegos las distribuciones de utilidad entre los jugadores reciben el nombre de imputaciones.
La teoría contiene algunos postulados fundamentales acerca de la función característica y de las
imputaciones que debemos mencionar aquí. El primero se llama la condición de la superagregabilidad y se
puede formular como sigue: si una coalición se forma al asociarse los jugadores de dos coaliciones
completamente independientes, el valor de la nueva coalición es al menos tan grande como la suma de los
valores de las dos primeras. El segundo postulado es la condición de la racionalidad individual y se expresa
en términos de imputaciones: ninguna imputación puede dar a un jugador menos de lo que este obtendría
si actuara por su cuenta.
Otra de las condiciones propuestas para limitar las imputaciones, es que estas sean óptimas según Pareto,
en el sentido de que no haya otra distribución bajo la cual a cada jugador le vaya tan bien como en esta, y a
alguno incluso mejor. Von Neumann y Morgenstern definen la solución como cualquier clase de
imputaciones optimas, según Pareto, que cumpla las propiedades: (1) que ningún miembro de la clase
domine a otro miembro de la clase y (2) que toda imputación fuera de la clase sea dominada por algún
miembro de ella. Por su parte, R. J. Aumann y Michael Marschler se centran en las distribuciones de valores
dentro de las coaliciones y cuestionan si los miembros estarán satisfechos o si intentarán mejorar sus
ganancias formando otras coaliciones. Finalmente, al igual que el enfoque de Von Neumann y
Morgenstern, esta aproximación al problema considera legítimos un enorme número de resultados