TEORIA DOS JOGOS BOTA A COOPERAÇÃO EM QUESTÃO

Uma solução recente para o “dilema do prisioneiro”, um cenário de teoria dos jogos clássico, criou novos quebra-cabeças na biologia evolutiva.

Um macaco vervet vai gritar um alarme quando um predador está por perto, colocando-se em perigo. Crédito: Wikipedia

Um macaco vervet gritando e dando alarme quando um predador está por perto,Crédito: Wikipedia

Quando o manuscrito passou por sua mesa, Joshua Plotkin, um biólogo teórico da Universidade da Pensilvânia, ficou imediatamente intrigado. O físico Freeman Dyson e o cientista da computação William Press, ambos altamente realizados em seus campos, haviam encontrado uma nova solução para um cenário famoso, há décadas a teoria dos jogos, também chamada de dilema do prisioneiro, em que os jogadores têm de decidir se quer enganar ou cooperar com a parceiro. O dilema do prisioneiro tem sido muito utilizado para ajudar a explicar como a cooperação pode se suportar na natureza. Afinal de contas, a seleção natural é governada pela sobrevivência do mais apto, então é de se esperar que as estratégias egoístas que beneficiem o indivíduo sejam mais prováveis em persistir. Mas um estudo cuidadoso do dilema do prisioneiro revelou que os organismos poderiam agir inteiramente em seu próprio interesse e ainda criar uma comunidade cooperativa.

A nova solução de Press e Dyson para o problema, no entanto, jogou esse problema em uma nova perspectiva. Ele sugeriu que as melhores estratégias eram egoístas e levaram à extorsão, não a cooperação.

Plotkin encontrou duas notáveis elegâncias matemáticas. Mas o resultado perturbaram. A natureza inclui numerosos exemplos de comportamento cooperativo. Por exemplo, morcegos hematófagos doam um pouco de sua refeição de sangue para os membros da comunidade que não conseguem encontrar presas. Algumas espécies de pássaros e insetos sociais rotineiramente ajudam-se a levantar outras ninhadas. Até mesmo as bactérias podem cooperar, grudadas uma as outras, de modo que alguns podem sobreviver. Se reina a extorsão, o que impulsiona esses e outros atos de altruísmo?

Press e Dyson olharam para um cenário clássico da teoria dos jogos de um par de jogadores envolvidos em confrontos repetidos. Plotkin queria saber se a generosidade poderia ser ressuscitada se o mesmo cálculo fosse aplicado a uma situação que mais se assemelhava a natureza. Assim, ele remodelou a sua abordagem em uma população, permitindo que os indivíduos joguem uma série de jogos com todos os outros membros de seu grupo. O resultado de seus experimentos, o mais recente dos quais foi publicado em dezembro na revista Proceedings of the National Academy of Sciences, sugere que a generosidade e egoísmo andam em uma linha precária. Em alguns casos, os triunfos de cooperação. Mas ao mudar apenas uma variável, a extorsão assume mais uma vez. “Agora temos uma explicação muito geral para quando está prevista a cooperação, ou a não cooperação, a evoluir em populações”, disse Plotkin, que conduziu a pesquisa junto com seu colega Alexander Stewart.

O trabalho é inteiramente teórico nesta altura. Mas os resultados poderiam, potencialmente, ter amplo alcance em suas implicações, explicando fenômenos que vão desde a cooperação entre os organismos complexos para a evolução da multicelularidade a forma de cooperação entre as células individuais.

Plotkin e outros dizem que o trabalho de Press e Dyson poderia fornecer um novo quadro para o estudo da evolução da cooperação usando a teoria dos jogos, permitindo que os pesquisadores destrinchar os parâmetros que permitem a cooperação existir. “Ele tem, basicamente, ressucitado neste campo”, disse Martin Nowak, um biólogo e matemático na Universidade de Harvard.

Olho por olho

Os macacos são conhecidos por suas chamadas de alarme. Um macaco vai gritar para avisar os vizinhos, quando um predador está próximo. Mas ao fazer isso, ele chama a atenção para si mesmo. Cientistas que remontam a época de Darwin têm se esforçado para explicar como este tipo de comportamento altruísta evoluiu. Se a porcentagem de macacos gritando alto o suficiente fica abatida por predadores, a seleção natural seria esperado extinguir os gritadores do pool genético. No entanto, isso não acontece, e as especulações a respeito do porque levou a décadas de debate (às vezes aquecida).

Os pesquisadores têm proposto diversos mecanismos possíveis para explicar a cooperação. A seleção de parentesco sugere que ajudar os membros da família em última análise, ajuda o indivíduo. A seleção de grupo propõe que grupos cooperativos podem ser mais prováveis ​​de sobreviver do que os que não cooperam. E reciprocidade direta postula que os indivíduos beneficiam de ajudar alguém que tem ajudado no passado.

O dilema do prisioneiro ajuda os pesquisadores a compreender as estratégias simples, como colaborar com os membros da comunidade de forma generosas e enganando os trapaceiros, que podem criar uma sociedade cooperativa, sob as condições certas. Descrita pela primeira vez na década de 1950, o dilema do prisioneiro clássico envolve um par de criminosos que são presos e colocados em salas separadas. Cada um é dada uma escolha: confessar ou fique em silêncio. No melhor resultado, ambos dizem nada e saem livres. Mas uma vez que um não sabe o que o outro vai fazer, ficar calado é arriscado. Se um delatar, o outro permanece em silêncio, o rato recebe uma sentença mais leve, enquanto o parceiro tranquila sofre.

Sem títuloMorcego

Mesmo organismos simples, tais como micróbios, envolvem-se neste tipo de jogo. Alguns microrganismos marinhos produzem moléculas que ajudam a recolher ferro, um nutriente vital. Colônias microbianas têm, frequentemente, os produtores e os trapaceiros que não fazem o composto em si, mas exploram as moléculas de seus vizinhos.

Em uma única instância do dilema do prisioneiro, a melhor estratégia é dar uma carona defeituosa em seu parceiro e você vai ter menos tempo. Mas se o jogo se repete mais e mais, a melhor estratégia muda. Em um único encontro, um macaco vervet (Chlorocebus pygerythrus) viu como é mais seguro ficar em silencio diante de um predador. Mas ao longo de uma vida, é mais provável o macaco sobreviver se advertir os seus vizinhos do perigo iminente, e os outros membros fazem o mesmo. “Cada jogador tem o incentivo para desertar, mas no geral eles vão fazer melhor se eles cooperar”, disse Plotkin. “É um problema clássico de como a cooperação pode surgir.”

Na década de 1970, Robert Axelrod, um cientista político da Universidade de Michigan, lançou um torneio colocando estratégias diferentes uns contra os outros. Para a surpresa de muitos candidatos, a abordagem mais simples ganhou. Simplesmente imitando jogada anterior do outro jogador, uma estratégia chamada de “olho por olho”, triunfou sobre programas muito mais sofisticados.

Estratégias olho por olho podem ser encontradas em todo o mundo biológico. Pares de peixes esgana-gato, por exemplo, escutam os predadores nas proximidades em uma espécie de dueto olho por olho. Se um peixe faz uma jogada arriscada de lançando à frente, o outro retribui com um ato semelhante de bravura. Se um volta, na esperança de deixar seu parceiro de assumir o risco, o parceiro também cai para trás.

Ao longo dos últimos 30 anos, os cientistas têm explorado as versões mais evolutivamente realistas de dilema do prisioneiro do que a versão simples de Axelrod. Os jogadores iniciam o torneio com um conjunto variado de estratégias visto como a sua aptidão geneticamente determinada. Para imitar a sobrevivência do mais apto, o vencedor de cada interação gera mais descendentes, que herdam a mesma estratégia como seu pai. As estratégias mais bem sucedidas, assim, crescem em popularidade ao longo do tempo.

A abordagem vencedora depende de uma variedade de fatores, incluindo o tamanho do grupo, que estratégias estão presentes no início, e quantas vezes os jogadores cometem erros. Na verdade, a adição de ruído no jogoa mudança aleatória na estratégia que funciona como um stand-in para genético mutação – termina com o reinado do olho por olho. Nestas circunstâncias, uma variante do olho por olho mais generosa, que envolve ocasionalmente perdoando outra traição, triunfa.

O resultado global destas simulações é otimista – uma bondade paga. “As estratégias mais bem-sucedidas tendem a ser aquelas que não tentam tirar proveito de outra pessoa”, disse Nowak.

Press e Dyson delinearam uma abordagem, na qual chamaram de extorsão, em que um jogador pode ganhar sempre, optando por defeitos de acordo com um conjunto prescrito de probabilidades. A estratégia de Press e Dyson é notável na medida em que permite que um jogador controle o resultado do jogo. “A principal inovação é calcular quantas vezes você pode desertar sem desmotivar completamente o seu co-jogador”, disse Christian Hilbe, pesquisador no grupo de Nowak em Harvard. Além disso, o vencedor só precisa se lembrar de uma jogada anterior, mas a estratégia funciona tão bem como aqueles que incorporam muitas rodadas anteriores do jogo.

O segundo jogador é forçado a cooperar com o chantagista porque essa é a opção que oferece o melhor retorno. “Se eu sou um chantagista, de vez em quando eu vou desertar mesmo quem colaborou, em proporção com precisão suficiente de que não importa o que você faz, eu vou ter um retorno maior do que você”, disse Plotkin. A situação é uma reminiscência de um trabalho em grupo na escola secundária. Se um membro da equipe a relaxa, os alunos conscientes não têm escolha a não ser trabalhar mais para ganhar uma boa nota.

O paper de Press e Dyson foi definido em um clássico da teoria dos jogos no contexto de uma série de interações entre um único par de jogadores. Mas Plotkin e Stewart queriam saber o que aconteceria se eles aplicassem a mesma abordagem matemática para um grupo em evolução, como os macacos ou morcegos hematófagos, que se reproduzem e sobrevivem com base na sua aptidão individual. Eles exploraram a classe mais ampla de estratégias bem sucedidas, chamada estratégia “zero determinante”, que Press e Dyson tinham identificado.

Esta classe de estratégias inclui o oposto moral da extorsão: generosidade. Em geral, um jogador utilizando uma estratégia generosa vai cooperar sempre quanto a seu oponente. Se os defeitos do adversário, o primeiro jogador ainda vai cooperar com uma certa probabilidade, em uma tentativa de persuadir o adversário para trás a generosidade.

Para alívio de Plotkin e Stewart, estratégias generosas, em vez da extorsão foram mais bem sucedidas quando aplicadas à evolução das populações. “Nós encontramos uma imagem muito mais otimista”, disse Plotkin, que publicou os resultados em 2013 na revista Proceedings of the National Academy of Sciences. “As estratégias mais robustas, as que não podem ser substituídas por outras estratégias, são generosos”.

A intuição básica é simples. “Extorsão faz bem como um adversário”, disse Plotkin. “Mas em uma grande população, o trapaceiro acabará por emparelhar-se com outro trapaceiro.” Em seguida, ambos vão desertar, obtendo um retorno mais pobre. “Plotkin melhorou nosso modelo por transformá-lo de cabeça para baixo”, disse Dyson. “Se você quiser alguém para colaborar com você, é melhor subornar a pessoa com benefícios de curto alcance do que puni-lo de imediato”.

Hilbe confirmou esses achados em um cenário do mundo real, colocando jogadores humanos contra computadores utilizando estratégias generosos ou chantagista. Como previsto, as pessoas ganharam prêmios maiores quando jogavam contra computadores generosos do que contra os egoístas. Mas as pessoas também tendem a punir adversários chantagista, recusando-se a cooperar, mesmo que seja de seu interesse fazer o melhor. Que por sua vez reduziu o pagamento de recompensa de ambos jogadores humano e computador. No final, o computador generoso ganhou um pagamento maior do que o computador chantagista.

A vingança do chantagista

Tendo em conta estes resultados, Plotkin esperava que os indivíduos que extorquiam pudessem ser mantidos à distância. Mas esse otimismo foi de curta duração. Depois de seu estudo de 2013, Plotkin mudou os retornos a serem conquistados, cooperando ou desertando. Os jogadores passaram tanto a sua estratégia e as recompensas estratégicas para sua prole; ambas as quantidades podem sofrer mutações aleatórias.

Com este improviso do sistema, poderíamos corresponder a uma alteração das condições ambientais, e o resultado devolvido para o lado escuro. A generosidade não era mais a solução preferida. “As mutações que aumentam a tentação de varrer os defeitos através do grupo, a população chega a um ponto de inflexão”, Plotkin disse. “A tentação dos defeitos é esmagadora, e deserção governa.”

Plotkin disse que o resultado foi inesperado. “É surpreendente, porque é dentro do mesmo quadro da teoria dos jogos de que as pessoas têm usado para explicar a cooperação”, disse ele. “Eu pensei que mesmo se você permitir que o jogo a evolua, a cooperação ainda iria prevalecer.”

A sacada é que pequenos ajustes para as condições podem ter um efeito importante sobre se a cooperação ou a extorsão triunfarão. “É muito legal ver que isso leva a resultados qualitativamente diferentes”, disse Jeff Gore, um biofísico no Massachusetts Institute of Technology, que não esteve envolvido no estudo. “Dependendo das restrições, você pode evoluir qualitativamente diferentes tipos de jogos.”

Chris Adami, um biólogo computacional na Universidade Estadual de Michigan, afirma que não existe tal coisa como uma estratégia – o vencedor ideal depende das condições.

De fato, o estudo de Plotkin é improvável que seja o fim da história. “Estou certo de que haverá pessoas que olham para a forma e como o resultado depende dos pressupostos”, disse Hilbe. “Talvez a cooperação de alguma forma possa ser resgatada.”

O futuro do prisioneiro

O dilema do prisioneiro é, obviamente, uma versão altamente simplificada de interações reais.

Assim como um bom modelo deve ser para estudar a evolução da cooperação? Dyson não é otimista. Ele gosta dos estudos de Plotkin e Hilbe, mas principalmente porque envolvem matemáticas interessantes. “Certamente, como uma descrição de mundos possíveis é muito interessante, mas não vejo para mim como o mundo da biologia”, disse Dyson.

Ethan Akin, um matemático que explorou estratégias semelhantes para Press e Dyson, disse que acha que os resultados são mais aplicáveis ​​a tomada de decisão sociológica do que para a evolução da cooperação.

Mas alguns biólogos experimentais discordam, dizendo que tanto o dilema do prisioneiro quanto teoria dos jogos de forma mais ampla tiveram um efeito profundo em seu campo. “Eu acho que a contribuição da teoria dos jogos à cooperação microbiana é enorme”, disse Will Ratcliff, um biólogo evolucionário do Georgia Institute of Technology.

Por exemplo, os cientistas que estudam a resistência aos antibióticos está usando um cenário da teoria dos jogo chamado o “jogo do monte de neve”, em que um jogador sempre se beneficia ao cooperar. (Se você está preso em seu prédio depois de uma tempestade de neve, você se beneficia com a afastador de neve na entrada de automóveis, mas o mesmo acontece com todo mundo que mora lá e não usa o afastador). Algumas bactérias podem produzir e secretar uma enzima capaz de desativar antibióticos. A enzima é metabolicamente cara para produzir, e as bactérias preguiçosas que não fazem o que podem se beneficiam usando enzimas produzidas por seus vizinhos mais diligentes. No cenário do dilema do prisioneiro estrito, os preguiçosos acabariam por matar os produtores, prejudicando toda a população. Mas no jogo do monte de neve, os produtores têm maior acesso à enzima, melhorando assim a sua aptidão, e os dois tipos de bactérias podem coexistir.

Micróbios no laboratório podem imitar cenários da teoria dos jogos, mas se esses ambientes controlados refletem com precisão o que está acontecendo na natureza é outra história. “Nós estabelecemos a dinâmica do jogo, assumindo um certo tipo de ecologia”, disse Ratcliff. Mas esses parâmetros pode não espelhar o habitat normal do micróbio. “Para mostrar que a dinâmica de um experimento esta em conformidade com dilema do prisioneiro ou outros jogos não significa, necessariamente, que esses mecanismos vão conduzi-los na natureza”, disse Ratcliff.

No dilema do prisioneiro iterado, dois jogadores competem uns contra os outros em uma série de rodadas. Os pesquisadores podem, então, determinar qual estratégia é mais bem sucedido no longo prazo. Abaixo, o leitor na coluna da esquerda emprega uma estratégia generoso, tentando seduzir o seu oponente em ajudar, e por vezes ajudando, mesmo com as falhas do oponente. O jogador egoísta na direita tende a desertar, apenas ajudando muitas vezes ou o suficiente para impedir o seu adversário de deserção permanente. Cada rodada é marcado por meio da matriz como o exemplo do morcego acima:

Sem título

Em uma partida de cabeça-por-cabeça, a estratégia egoísta derrota uma generosa. No entanto, as mesmas estratégias têm resultados diferentes quando aplicadas a um cenário evolutivamente mais realista. No vídeo abaixo, uma população de jogadores se envolve em uma série de cabeça-por-cabeça, e encontra um jogo muito parecido com um torneio de empurrar. O jogador que “ganha” cada encontro gera mais descendentes que empregam estratégias semelhantes. Aqui, um único jogador que emprega uma estratégia generosos tende a espalhar a sua estratégia através da população (Veja aqui o vídeo)

Em última análise, toda a população converte-se de estratégia egoísta para estratégias generosas. Os biólogos usam modelos como este para explicar como o comportamento cooperativo persiste em estado selvagem.

Fonte: Scientific American

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s