Ads-728

Ads-728

Psicología

Astrofísica

Genética

Neurociencia

» » » Teoría de juegos, la cuestión de la cooperación o la extorsión

Referencia: Quanta Magazine.org .
"Game Theory Calls Cooperation Into Question"
por Emily Singer, 12 febrero 2015
* * * *
Una solución reciente para el dilema del prisionero, un escenario clásico de la teoría de juegos, ha creado nuevos rompecabezas en la biología evolutiva.

El mono verde grita una alarma cuando un depredador se acerca,
pero se pone a sí mismo en peligro.
Cuando el manuscrito pasó por su escritorio, Joshua Plotkin, un biólogo teórico de la Universidad de Pennsylvania, se quedó inmediatamente intrigado. El físico Freeman Dyson y el informático William Press, ambos expertos en sus campos, habían encontrado una nueva solución al famoso y ya antiguo escenario de la teoría juego llamado el dilema del prisionero, en el cual los jugadores deben decidir si hacen trampa o cooperan con un socio. El dilema del prisionero se ha utilizado para intentar explicar cómo la cooperación podría sobrevivir en la naturaleza. Después de todo, la selección natural se rige por la ley del más fuerte, por lo que uno podría esperarse que las estrategias egoístas beneficiarían al individuo con mayor probabilidad de supervivencia. Pero un estudio más cuidadoso del dilema del prisionero revela que los organismos podrían estar actuando enteramente en su propio interés y, aun así, poder crear una comunidad cooperativa.

La nueva solución de Dyson y Press, sin embargo, arrojaba una perspectiva optimizada a la cuestión y sugería que las mejores estrategias son las egoístas que llevan a la extorsión, no a la cooperación.

Plotkin encontró notables las matemáticas de ambos por su elegancia. Pero el resultado le atormentaba. La naturaleza incluye numerosos ejemplos de comportamiento cooperativo. Por ejemplo, los murciélagos vampiro donan parte de su comida de sangre a miembros de la comunidad que no logran encontrar presas. Algunas especies de aves e insectos sociales rutinariamente ayudan a otros en la crianza. Incluso las bacterias pueden cooperar, se adhieren entre sí de modo que algunas puedan sobrevivir al veneno. Si reina la extorsión, ¿qué impulsa entonces estos y otros actos de altruismo?

Joshua Plotkin
El estudio de Press y Dyson miraba un clásico escenario de la teoría de juegos, un par de jugadores que participan en la confrontación repetida. Plotkin quería saber si la generosidad podría resucitar si estas mismas matemáticas se aplicaban a una situación más cercana a la naturaleza. Así que la redistribuyeron su enfoque en una población, permitiendo que los individuos desempeñaran una serie de juegos con todos los demás miembros de su grupo. El resultado de sus experimentos, el más reciente de ellos fue publicado en diciembre en Proceedings of the National Academy of Sciences, sugiere que la generosidad y el egoísmo se mueven al borde de una línea muy precaria. En algunos casos, triunfa la cooperación; pero basta cambiar una sola variable, y la extorsión se vuelve a hacer cargo del asunto una vez más. "Ahora tenemos una explicación muy general para cuándo poder esperar la cooperación, y cuándo no, en la evolución de las poblaciones", dijo Plotkin, quien dirigió la investigación junto con su colega Alexander Stewart.

El trabajo es totalmente teórico hasta este momento. Pero los resultados podrían potencialmente tener implicaciones de gran alcance, explicando una variedad de fenómenos que van desde la cooperación entre los organismos complejos hasta la evolución de pluricelularidad, una forma de cooperación entre las células individuales.

Plotkin y otros, dicen que el trabajo de Press y Dyson proporcionaría un nuevo marco para el estudio de la evolución de la cooperación mediante la teoría de juegos, esto permitiría a los investigadores desentrañar los parámetros que permiten subsistir a la cooperación. "Básicamente, ha renovado este campo", dijo Martin Nowak, biólogo y matemático de la Universidad de Harvard.

Ojo por ojo

Los monos verdes son conocidos por sus llamadas de alarma. Uno de ellos gritará para advertir a sus vecinos cuando un depredador está cerca. Pero al hacerlo, delata su ubicación centrando una atención peligrosa sobre sí mismo. Los científicos que se remontan a Darwin han tenido dificultades para explicar cómo ha evolucionado este tipo de comportamiento altruista. Si un alto porcentaje de monos gritan serían interceptados por los depredadores, se podría esperar que la selección natural silenciara a los gritones en su acervo genético. Sin embargo, no es así, y la especulación del por qué, ha llevado a décadas de un, a veces apasionado, debate.

Los investigadores han propuesto diferentes mecanismos posibles para explicar la cooperación. La selección de parentesco sugiere que ayudar a los miembros de la familia, en última instancia, ayuda al individuo. La selección grupal propone que los grupos cooperativos pueden tener más probabilidades de sobrevivir que los que no cooperan. Y reciprocidad directa postula que los individuos se benefician de ayudar a alguien que les ha ayudado en el pasado.

El dilema del prisionero ayuda a los investigadores a entender las estrategias simples, como son la cooperación generosa con miembros de la comunidad y el engaño de los tramposos, lo que puede crear una sociedad cooperativa bajo condiciones adecuadas. Descrito por primera vez en la década de 1950, el clásico dilema del prisionero implica un par de delincuentes que son capturados y ubicados en habitaciones separadas. A cada uno se le da una elección: confesar o permanecer en silencio. En el mejor resultado, ambos no dicen nada y se van libres. Pero ya que no sabe lo que el otro va a hacer, guardar silencio puede ser arriesgado. Si uno confiesa y el otro guarda silencio, el primero recibe una sentencia más leve mientras que el silencioso es condenado.


Incluso los organismos más simples, como los microbios, se involucran en este tipo de juegos. Algunos microorganismos marinos producen moléculas que les ayudan a obtener hierro, un nutriente vital. En las colonias microbianas suelen haber tanto productores como tramposos, microbios que no producen nada por sí mismos, pero se aprovechan de las moléculas de sus vecinos.

En un simple caso del dilema del prisionero, la mejor estrategia es la que viene por defecto, delata a tu socio y consegurás menos tiempo de condena. Pero si el juego se repite una y otra vez, la estrategia óptima cambia. En un solo encuentro, un mono verde que ve a un depredador está más seguro si se queda en silencio. Pero a lo largo de toda la vida, el mono tiene más probabilidades de sobrevivir si advierte a sus vecinos del peligro inminente y los demás hacen lo mismo. "Cada jugador tiene el incentivo del caso por defecto, pero en general lo funcionará mejor si cooperan", afirmaba Plotkin. "Es el clásico problema de cómo puede surgir la cooperación."

En la década de 1970, el politólogo Robert Axelrod, de la Universidad de Michigan, puso en marcha un torneo de cartas en cadena, enfrentando las diferentes estrategias de unos contra otros. Para sorpresa de muchos contendientes, el enfoque más simple ganó. Simplemente imitando el movimiento anterior del otro jugador, la estrategia llamada ojo por ojo, triunfó sobre los programas mucho más sofisticados.

La estrategia del ojo por ojo se pueden encontrar en todo el mundo biológico. Las parejas de peces espinosos, por ejemplo, ante depredadores cercanos exploradoras ponen en marcha una especie dueto del ojo por ojo. Si un pez hace el movimiento arriesgado echarse adelante, el otro responde con un acto similar de bravura. Si uno se queda atrás, con la esperanza de dejar que su pareja asuma el riesgo, la pareja también se echa hacia atrás.

En los últimos 30 años, los científicos han explorado evolutivamente más versiones realistas de este dilema del prisionero que la simple versión de Axelrod. Los jugadores en un gran torneo de todos contra todos, comienzan con un conjunto variado de estrategias (piensar en esto como en su aptitud determinada genéticamente). Para imitar la supervivencia del más apto, el ganador de cada interacción engendra más descendencia, la cual hereda la misma estrategia que sus padres. De esta manera, las estrategias más exitosas crecen en popularidad con el tiempo.

El enfoque ganador depende de una variedad de factores, incluyendo el tamaño del grupo, cuyas estrategias están presentes desde el inicio, y con qué frecuencia los jugadores cometen errores. De hecho, añadiendo ruido al juego (un cambio aleatorio en la estrategia que actúa como sustituto de una mutación genética) se acaba con el reinado del ojo por ojo. En estas circunstancias, una variante conocida como el ojo por ojo generoso, que implica perdonar ocasionalmente la traición del otro, triunfa.

El aroma general de estas simulaciones es optimista, una contraprestación de amabilidad. "Las estrategias más exitosas a menudo tienden a ser las que no tratan de aprovecharse de otra persona", apuntó Nowak.

Press y Dyson introducen una oscura dosis de desesperanza.

El dilema clásico del prisionero (Wikipedia)
La enunciación clásica del dilema del prisionero:

    La policía arresta a dos sospechosos. No hay pruebas suficientes para condenarlos y, tras haberlos separado, los visita a cada uno y les ofrece el mismo trato. Si uno confiesa y su cómplice no, el cómplice será condenado a la pena total, diez años, y el primero será liberado. Si uno calla y el cómplice confiesa, el primero recibirá esa pena y será el cómplice quien salga libre. Si ambos confiesan, ambos serán condenados a seis años. Si ambos lo niegan, todo lo que podrán hacer será encerrarlos durante un año por un cargo menor.
Resumen:

El triunfo de la cooperación

A pesar de sus currículums impresionantes, tanto Press como Dyson son relativamente nuevos en la teoría de juegos. Eso hizo que su nueva solución al dilema del prisionero de hace 60 años, se publicara en Proceedings of the National Academy of Sciences en 2012, como algo aún más inesperado. "Es notorio que bien podría haber sido escrito hace 30 años", apuntilló Plotkin. "La idea matemática que reside justo en el corazón de su estudio fue pasada por alto, a pesar de que cientos de científicos estudiaron la teoría de juegos y sus aplicaciones."

Ellos esbozaron un enfoque, denominado de extorsión, en el que un jugador siempre podría ganar eligiendo el acuerdo por defecto para un conjunto prescrito de probabilidades. Su estrategia es notable, ya que permite a un jugador controlar el resultado del juego. "La principal innovación consiste en calcular la frecuencia con la que uno puede elegir por defecto sin desmotivar completamente al otro jugador", señaló Christian Hilbe, investigador en el grupo de Nowak en Harvard. Para más inri, el jugador ganador sólo necesita recordar la jugada anterior, aunque la estrategia funciona igual de bien incorporando muchas rondas anteriores de juego.

El segundo jugador se ve obligado a cooperar con el extorsionista porque esa es la opción que ofrece la mejor recompensa. "Siendo uno un extorsionista, de vez en cuando jugaré por defecto, a pesar de que hayamos colaborado, y no importa en la precisa y suficiente proporción que lo haga, voy a tener una ganancia mayor que tú", dilucidaba Plotkin. La situación es una reminiscencia de un proyecto de grupo en una escuela secundaria. Si el miembro de un equipo no es activo, los estudiantes no tendrán más remedio que trabajar más duro para ganar una buena calificación.

El estudio original de Press y Dyson se creó en un contexto de la teoría de juegos clásica, una serie de interacciones entre un simple par de jugadores. Pero Plotkin y Stewart querían saber lo que sucedería si aplicaban el mismo enfoque matemático a un grupo en constante evolución, como los monos verdes o los murciélagos vampiros, quienes se reproducen y sobreviven basándose ​​en su aptitud individual. Exploraron un amplio rango de estrategias exitosas, las llamadas estrategias de cero determinantes, que Press Dyson habían identificado.

Esta clase de estrategias incluyen una moral contraria a la extorsión: la generosidad. En general, un jugador que emplea una estrategia generosa siempre cooperará cuando su oponente lo hace. Si los oponente actúan por defecto, el primer jugador cooperará con cierta probabilidad, en un intento de convencer a su oponente de volver a la generosidad.

Para alivio de Plotkin y Stewart, las estrategias generosas en lugar de las extorsivas tuvieron más éxito cuando se aplicaban a poblaciones en evolución. "Encontramos un panorama mucho más optimista", dijo Plotkin, que publicó sus resultados en 2013 en Proceedings of the National Academy of Sciences. "Las estrategias más sólidas, las que no pueden ser reemplazados por otras estrategias, son generosas."

La intuición básica es simple. "Extorsión fuenciona bien con un oponente", dijo Plotkin. "Pero en una población grande, el extorsionador terminará emparejándose con otro extorsionador." Entonces ambos actuarán por defecto, conseguiendo la recompensa más pobre. "Plotkin mejora nuestro modelo poniéndolo al revés", señala Dyson. "Si quieres que alguien coopere contigo, es mejor sobornar a la persona con poco margen de beneficios que castigarla de inmediato."

Hilbe confirmó estos hallazgos en un escenario del mundo real, enfrentando a jugadores humanos contra computadores usando estrategias tanto generosas como extorsionistas. Tal como se predijo, la gente obtenía más grandes benificios cuando jugaba contra computadores generosos que contra los egoístas. Pero la gente también tendía a castigar a sus oponentes extorsionadores, negándose a cooperar a pesar de que obtendría mejor interés en hacerlo. Esto, a su vez, reduce la recompensa por tanto para el jugador humano como al ordenador. Al final, el computador generoso ganaba un beneficio más grande que el computador extorsionista.

La venganza del extorsionista

Teniendo en cuenta estos resultados, Plotkin esperaba que los extorsionadores se mantendrían a raya. Pero esa esperanza duró poco. Después de su estudio de 2013, Plotkin cambió las recompensas a ganar por cooperar o extorsionar. Los jugadores pasaron tanto su estrategia como sus beneficios estratégicos a su descendencia; y ambas cantidades podían sufrir mutaciones aleatorias.

Con esta reorganización del sistema, lo cual podría corresponder a un cambio en las condiciones ambientales, el resultado volvió a su lado oscuro. La generosidad ya no era la solución preferida. "A medida que las mutaciones aumentaban la tentación por defecto a través del grupo, la población llegaba a un punto de inflexión", explicaba Plotkin. "La tentación por defecto se hacía abrumadora y gobernaba."

Plotkin dijo que el resultado fue inesperado. "Fue sorprendente porque era dentro del mismo marco, la teoría de juegos, que la gente ha estado utilizando para explicar la cooperación. Pensé que si permitía que el juego evolucionara, la cooperación al final prevalecería."

La enseñanza es que los pequeños ajustes a las condiciones pueden tener un efecto importante sobre si triunfa la cooperación o la extorsión. "Es agradable comprobar que esto lleva a resultados cualitativamente distintos", decía Jeff Gore, biofísico del Instituto de Tecnología de Massachusetts, que no participó en el estudio. "En función de las limitaciones, puedes hacer evolucionar de manera cualitativa diferentes tipos de juegos."

Chris Adami, biólogo computacional en la Universidad Estatal de Michigan, sostiene que no existe tal cosa como una estrategia óptima, el ganador depende de las condiciones.

De hecho, es poco probable que el estudio de Plotkin sea el final de esta historia. "Estoy seguro de que la gente habrá observado cómo el resultado depende de los supuestos", subrayó Hilbe. "Tal vez, la cooperación, de alguna manera pueda ser rescatada."

El futuro del prisionero

El dilema del prisionero es, obviamente, una versión muy simplificada de las interacciones reales.

Así que, ¿cuál es un buen modelo para el estudio de la evolución de la cooperación? En essto Dyson no es optimista. Le gustan los estudios de Plotkin y de Hilbe, pero ante todo porque implican unas matemáticas interesantes. "Ciertamente, es muy interesante como descripción de unos mundos posibles, pero no me parece que guste al mundo de la biología", dijo Dyson.

Ethan Akin, un matemático que ha explorado estrategias similares para Press y Dyson, piensa que los resultados son más aplicables a una toma de decisiones sociológica que a la evolución de la cooperación.

Sin embargo, algunos biólogos experimentales no están de acuerdo, aduciendo que tanto el dilema del prisionero como la más amplia teoría de los juegos han tenido un profundo efecto en su campo. "Creo que la contribución de la teoría de juegos a la cooperación microbiana es enorme", apuntaba Will Ratcliff, un biólogo evolutivo en el Instituto de Tecnología de Georgia.

Por ejemplo, los científicos que estudian la resistencia a los antibióticos están utilizando un escenario de la teoría de juegos llamado el juego de la nieve acumulada, en el que un jugador siempre se beneficia al cooperar. (Si estás atrapado en un edificio de apartamentos después de una tormenta de nieve, te beneficiará palear el camino de entrada, pero eso mismo ocurre con todos los demás que viven ahí y no utilizan la pala). Algunas bacterias pueden producir y secretar una enzima capaz de desactivar los antibióticos. La enzima es costosa de producir, y otras bacterias perezosas que no lo hacen se benefician usando las enzimas producidas por sus vecinas más laboriosas. En el escenario estricto del dilema del prisionero, los holgazanes eventualmente matan a los productores, perjudicando a toda la población. Pero en el juego de la acumulación de nieve, los productores tienen un mayor acceso a la enzima, lo que mejora su condición física, y los dos tipos de bacterias pueden coexistir.

Los microbios en el laboratorio pueden imitar los escenarios de la teoría de juegos, pero el caso de que estos ambientes controlados reflejen con exactitud lo que está pasando en la naturaleza, eso es otra historia. "Cuando nos ponemos en la dinámica del juego, asumimos un cierto tipo de la ecología", dijo Ratcliff. Aunque esos parámetros podrían no reflejar el hábitat normal del microbio. "Mostramos que la dinámica de un experimento se ajusta al dilema del prisionero u otros juegos, pero eso no significa, necesariamente, que tales mecanismos sean los que se dan en la naturaleza", insistió Ratcliff.

# # #
- Imagen.1. El mono verde grita una alarma cuando un depredador se acerca, pero se pone a sí mismo en peligro. Matt Jenner
- Imagen.2. Joshua Plotkin, por Candace diCarlo
- Imagen.3. Dilema murciélago, Olena Shmahalo/Quanta Magazine


,

«
Next
Entrada más reciente
»
Previous
Entrada antigua
Editor del blog Pedro Donaire

Filosofía

Educación

Deporte

Tecnología

Materiales