La cooperación se aprende con la práctica, según un modelo matemático

Cuando hay que elegir entre cooperar con los demás o traicionarlos, es más probable que cooperemos si antes han actuado así con nosotros o si nosotros mismos nos hemos comportado de forma altruista. Lo hacemos porque el aprendizaje refuerza lo que nos ha ido bien y no porque imitemos a personas con éxito. Así lo señala un estudio de la Universidad Carlos III de Madrid basado en el dilema del prisionero, un popular problema para el estudio de conflictos.

La cooperación se aprende con la práctica, según un modelo matemático
La probabilidad de que cooperemos aumenta si la gente lo ha hecho antes con nosotros y personalmente también nos hemos comportado de forma altruista. / Ron Sombilon

La protagonista de Deux jours, une nuit, la última película que los hermanos Dardenne han presentado en el Festival Cannes, tiene que convencer a sus compañeros de trabajo de que cedan sus incentivos empresariales para evitar ser despedida. Se trata de un caso particular del dilema del prisionero, una fórmula muy usada en teoría de juegos para analizar la cooperación humana.

El dilema en cuestión plantea que la policía detiene a dos sospechosos por un delito y los aísla. Si los dos se encubren o permanecen en silencio, ambos son condenados a un año de prisión. Si solo uno delata al otro, el traidor sale libre y el delatado pasa tres años en la cárcel. Pero si traicionan los dos, ambos son condenados a dos años cada uno.

El dilema del prisionero muestra que si dos personas cooperan les irá bien a las dos

“Es un planteamiento paradigmático en el que lo mejor que podemos hacer es cooperar, y nos irá bien a ambos”, comenta a Sinc Anxo Sánchez, profesor del Grupo Interdisciplinar de Sistemas Complejos de la Universidad Carlos III de Madrid (UC3M). “Aunque, si tú cooperas y yo te traiciono, me va ir todavía mejor a mí, a costa tuya, claro; por lo que, si tú piensas lo mismo, deberías traicionar; pero así nos irá mal a ambos, y bastante peor que si cooperamos. En estas circunstancias, a las que a menudo nos enfrentamos en nuestra vida, es difícil que emerja la cooperación, y sin embargo sucede”.

A partir de un análisis de la dinámica que siguen los participantes en ese juego, el investigador y otros colegas de Madrid y Zaragoza han comprobado que cuando tenemos que elegir entre cooperar con los demás o traicionarlos, la probabilidad de que cooperemos aumenta si la gente lo ha hecho antes con nosotros, así como en los casos en que, personalmente, también hemos actuado de esta forma altruista en el pasado.

“Dicho de otra manera, cuando traicionas una vez, es bastante difícil que vuelvas a cooperar en el futuro, mientras que si vienes de cooperar te inclinas más a seguir haciéndolo”, aclara Sánchez, quien subraya que la evidencia experimental confirma esta tendencia.

Para explicar este fenómeno, Sánchez y el investigador Giulio Cimini de la Universidad de Roma La Sapienza, han desarrollado ahora un modelo donde se evalúan las distintas formas en las que las personas van adaptando su comportamiento. Los resultados, que publica el Journal of the Royal Society Interface, revelan que solo el denominado ‘aprendizaje por refuerzo’ explica el comportamiento y el nivel de cooperación observados.

El comportamiento propio se ajusta más según nos ha ido que porque copiemos a otros

“El aprendizaje por refuerzo es un proceso por el cual si hemos hecho algo y juzgamos que nos ha ido bien, repetiremos nuestra acción con mayor probabilidad todavía; mientras que si pensamos que nos ha ido mal, lo haremos con menor probabilidad”, señala Sánchez.

Esto puede parecer de sentido común, pero contradice planteamientos establecidos: “Hasta ahora la mayoría de modelos de cómo aparecía el comportamiento eran más sociales, es decir, más referidos a imitar a otros, bien porque los conocemos o porque nos parece bien lo que hacen, pero nuestro trabajo lo excluye definitivamente”, dice Sánchez, que insiste: “Nuestro comportamiento se ajusta más según nos ha ido, no por lo que copiemos socialmente de los demás”.

El trabajo también descarta algunos modelos que usan los economistas: “En principio suponen que vemos lo que han hecho otras personas y calculamos cómo comportarnos para que, si los demás repiten su acción, nos vaya lo mejor posible. Pero esto tampoco se ajusta a las observaciones experimentales, es decir, no somos tan calculadores. Por tanto, muchos resultados económicos relacionados con la cooperación, obtenidos teóricamente con la suposición de que somos perfectamente racionales, pierden su validez”.

Recomendaciones para la vida personal

Según los autores las conclusiones también se pueden aplicar a la vida personal y profesional. Por una parte, recomiendan no caer en un estado de desesperanza en el que ya solo traicionas, porque así no se contribuye a que la cooperación se mantenga o se recupere. Según Sánchez, “hay que ser más proclive a cooperar después de haber traicionado para ver si los demás nos imitan”.

Por otro lado, el estudio muestra que las estrategias de comportamiento más exitosas son aquellas que tienen un nivel de aspiración intermedio. Es decir, hay que aspirar a tener unas ganancias razonables de nuestras interacciones: ni demasiado altas, porque eso nos conduce a traicionar y luego a ser traicionados; pero tampoco demasiado bajas, porque en ese caso nos van a explotar todo el tiempo.

Referencia bibliográfica:

Giulio Cimini y Ángel Sánchez. “Learning dynamics explains human behaviour in Prisoner’s Dilemma on networks”. Journal of the Royal Society Interface, 2014.

Fuente: SINC
Derechos: Creative Commons

Solo para medios:

Si eres periodista y quieres el contacto con los investigadores, regístrate en SINC como periodista.

Artículos relacionados