John Forbes Nash
0 Comments Published by Administrador March 10th, 2008 in Mundo e Historia, SinarquíaGeneralmente, cuando se aplica la Teoría de Juegos, por cuyo desarrollo obtuvo el premio Nóbel en 1994, se supone que cada empresa puede tomar decisiones en un conjunto de decisiones propio, y que dependiendo de cuales toma esa empresa y las demás, esa empresa y las demás obtendrán un determinado resultado. A veces esto se puede representar como que cada empresa tiene una “Curva de Reacción” a las acciones de las demás empresas. Por ejemplo, si el resto de las empresas tomaran una serie de decisiones, y nuestra empresa en cuestión conociera (supuesto bastante fuerte, desde luego) qué decisiones han tomado las demás, para poder obtener ella el máximo beneficio debería de tomar ciertas decisiones a su vez, que dependen de las tomadas por las demás.
Hipotéticamente, si las “curvas de reacción” de todas las empresas se cruzaran en algún sitio, ese conjunto de decisiones para todas las empresas implicadas implicaría el “Equilibrio del Juego”, porque todas las empresas estarían a la vez haciendo lo mejor para sí mismas dado lo que están haciendo el resto de las empresas. Esto es lo que se conoce como Equilibrio de Nash. Nash probó en qué condiciones se puede dar este Equilibrio. Ejemplos de equilibrios en los mercados son el de Cournot, cuando las empresas compiten en cantidades ofertadas, y el de Bertrand, cuando lo hacen en precios.
No obstante, un caso común también es que alguna de las empresas sea Líder y las demás Seguidoras. En este caso, en vez de suponerse que se va alcanzar un equilibrio en el que todas las empresas más o menos llegan simultáneamente a esa situación de equilibrio, la ventaja de la empresa Líder (por ejemplo, por tener alguna ventaja empresarial aplastante sobre las otras empresas) le lleva a tomar primero una decisión ante la cual responden, o sea, la tomán después, las seguidoras. Esto es lo que lleva a la Líder a tener en cuenta, para cada decisión, que las seguidoras van a responder de una determinada manera, por lo que reajusta su forma de decidir teniendo en cuenta cuales serán las decisiones de las demás, como si en cierto modo también las pudiera controlar a ellas y ponerlas al servicio de su propio beneficio.
Otro caso posible es el de la Colusión. Es cuando las empresas se ponen de acuerdo para actuar coordinadamente a la hora de ofertar sus bienes y de poner sus precios, con lo que logran mayor beneficio total para cada una de ellas que cuando actúan por separado, lo que en ocasiones lleva a una situación parecida, desde el punto de vista de los consumidores, a la del Monopolio.
Demostraciones simples
“Los jugadores escogen simultáneamente un número entero entre cero (0) y diez (10). Los dos jugadores ganan el valor menor en dólares, pero además, si los números son distintos, el que ha escogido el mayor le debe pagar $2 al otro.”
Este juego tiene un único equilibrio de Nash: ambos jugadores deben escoger cero (0). Cualquier otra estrategia puede mejorarse si uno de los jugadores escoge un número menor.
Si se modifica el juego de modo que los dos jugadores ganen el número escogido si ambos son iguales, y de otro modo no ganen nada, hay 11 equilibrios de Nash distintos.
El dilema del prisionero clásico
La enunciación clásica del dilema del prisionero es:
La policía arresta a dos sospechosos. No hay pruebas suficientes para condenarlos, y tras haberlos separado, los visita a cada uno y les ofrece el mismo trato. Si uno confiesa y su cómplice no, el cómplice será condenado a la pena total, diez años, y el primero será liberado. Si uno calla y el cómplice confiesa, el primero recibirá esa pena y será el cómplice quien salga libre. Si ambos permanecen callados, todo lo que podrán hacer será encerrarlos durante seis meses por un cargo menor. Si ambos confiesan, ambos serán condenados a seis años.
Lo que puede resumirse como:
Ambos lo niegan:
Ambos son condenados a 6 meses.
Uuno niega y el otro confiesa:
Uno sale libre y el otro es condenado a 10 años.
Ambos confiesan:
Ambos son condenados a 6 años.
Vamos a suponer que ambos prisioneros son completamente egoístas y su única meta es reducir su propia estancia en la cárcel. Como prisioneros tienen dos opciones: cooperar con su cómplice y permanecer callado, o traicionar a su cómplice y confesar. El resultado de cada elección depende de la elección del cómplice. Desafortunadamente, uno no conoce qué ha elegido hacer el otro. Incluso si pudiesen hablar entre sí, no podrían estar seguros de confiar mutuamente.
Si uno espera que el cómplice escoja cooperar con él y permanecer en silencio, la opción óptima para el primero sería confesar, lo que significaría que sería liberado inmediatamente, mientras el cómplice tendrá que cumplir una condena de 10 años. Si espera que su cómplice decida confesar, la mejor opción es confesar también, ya que al menos no recibirá la condena completa de 10 años, y sólo tendrá que esperar 6, al igual que el cómplice. Si, sin embargo, ambos decidiesen cooperar y permanecer en silencio, ambos serían liberados en sólo 6 meses.
Confesar es una estrategia dominante para ambos jugadores. Sea cual sea la elección del otro jugador, pueden reducir siempre su sentencia confesando. Por desgracia para los prisioneros, esto conduce a un resultado regular, en el que ambos confiesan y ambos reciben largas condenas. Aquí se encuentra el punto clave del dilema. El resultado de las interacciones individuales produce un resultado que no es óptimo -en el sentido de eficiencia de Pareto-; existe una situación tal que la utilidad de uno de los detenidos podría mejorar (incluso la de ambos) sin que esto implique un empeoramiento para el resto. En otras palabras, el resultado en el cual ambos detenidos no confiesan domina al resultado en el cual los dos eligen confesar.
Si se razona desde la perspectiva del interés óptimo del grupo (de los dos prisioneros), el resultado correcto sería que ambos cooperasen, ya que esto reduciría el tiempo total de condena del grupo a un total de un año. Cualquier otra decisión sería peor para ambos si se consideran conjuntamente. A pesar de ello, si siguen sus propios intereses egoístas, cada uno de los dos prisioneros recibirá una sentencia dura.
Ejemplos en la vida real
Estos ejemplos en concreto en los que intervienen prisioneros, intercambio de bolsas y cosas parecidas pueden parecer rebuscados, pero existen, de hecho, muchos ejemplos de interacciones humanas y de interacciones naturales en las que se obtiene la misma matriz de pagos. El dilema del prisionero es por ello de interés para ciencias sociales como economía, ciencia política y sociología, además de ciencias biológicas como etología y biología evolutiva.
En ciencia política, por ejemplo, el escenario del dilema del prisionero se usa a menudo para ilustrar el problema de dos estados involucrados en una carrera armamentística. Ambos razonarán que tienen dos opciones: o incrementar el gasto militar, o llegar a un acuerdo para reducir su armamento…
Un ejemplo adicional se puede observar en las intersecciones de dos vías por donde circulan autos y donde ninguna tiene una preferencia sobre la otra: si todos los conductores colaboran y hacen turnos para pasar, la pequeña espera se justifica por el beneficio de no generar una congestión en el medio. Si alguien no colabora y el resto sí, se beneficia el “no colaborador” generando un desorden en la secuencia de turnos que perjudica a los que estaban colaborando. Por último, cuando nadie quiere colaborar y tratan de pasar primero, se genera una gran congestión donde todos pierden mucho tiempo.
Otro.
Cada vecino de una comunidad campesina prefiere alimentar a su ganado en pastos comunales que en otros propios de peor calidad; si el número de vecinos que satisface esta preferencia supera cierto límite, los pastos comunes quedan esquilmados, y es a esto precisamente a lo que conduce la solución del juego. Para que algún vecino se beneficie de los pastos, otros deben pagar el coste de renunciar, o cada uno debe renunciar en parte; pero el equilibrio está en una situación donde cada quién utiliza los pastos sin preocuparse de los demás.
Trasladando la situación al esquema de Hofstadter, cada vecino tiene aquí la tentación T de beneficiarse de los pastos sin pagar el coste; la recompensa R por la cooperación mutua consiste en negociar cuántos -o en cuanto- han de dejar de beneficiarse de los pastos comunes para conservar los pastos en buenas condiciones; el castigo C para todos porque cada uno ceda a la tentación es la ruina de los pastos; la paga del primo P es la de quien al no aprovecharse de los prados comunes, ha permitido que otros lo hagan. Estas posibilidades se combinan como en el dilema del prisionero bipersonal, haciendo que ante el riesgo de recibir la paga del primo todos cedan a la tentación de no cooperar y provoquen la situación de castigo.
La misma estructura se puede aplicar a cualquier dinámica de agotamiento de recursos por sobreexplotación, y parece estar en el origen de la contaminación ambiental –donde una atmósfera no contaminada podría desempeñar el papel de los pastos comunes, y el automóvil privado el papel del ganado-. Se ha interpretado que evitar soluciones subóptimas como éstas pasa por la privatización de los bienes de acceso público, limitando en función de la renta el número de personas que pueden caer en la tentación.
No Comments to “John Forbes Nash”
Please Wait
Leave a Reply