O PROGRAMA AUTODIDATA QUE VENCE JOGOS COMPLEXOS.

Ao contrário de outros programas de inteligência artificial, AlphaZero é capaz de atingir um nível campeão não em um, mas na maioria dos jogos de tabuleiro tão complexos como xadrez, shogi and Go. E isso não acontece de uma estratégia de forma aleatória e sem qualquer conhecimento prévio 

Um novo programa de inteligência artificial (IA) é capaz de atingir níveis de campeão em diferentes jogos de tabuleiro, como Go, xadrez e shogi (também conhecido como xadrez japonês), conhecendo apenas as regras do jogo e aprender apenas graças a uma série de sessões de treinamento em que ele joga contra si mesmo.

O programa, chamado AlphaZero, foi desenvolvido pela DeepMind, empresa britânica de ciência da computação adquirida em 2014 pelo Google, que comprovou estar desenvolvendo o AlphaGo, que em 2016 conseguiu vencer o campeão humano europeu de Go. Os recursos são descritos em um artigo para a primeira assinatura de David Silver publicada na “Science.

O que distingue AlphaZero exclusivamente por software similar – incluindo AlphaGo Zero, uma evolução de AlphaGo também capaz de melhorar a sua capacidade de reprodução – é a sua capacidade de lidar não com um jogo específico, mas com mais jogos.

Um dos tradicionais bancos de testes de IA são os jogos de tabuleiro baseados na inteligência dos jogadores, como o xadrez. Um primeiro grande sucesso veio em 1997, quando Deep Blue derrotou o campeão mundial de xadrez humano no comando. Desde então, os programas de jogos estão cada vez mais aperfeiçoados e mais programadores começaram a lidar com jogos onde a árvore de possíveis escolhas estratégicas é ainda mais complexa, como Go e Shogi, ficando mesmo nestes casos melhores resultados.

No entanto, os programas ainda tinham uma limitação para os jogadores humanos: para o aprendizado e para a elaboração de estratégias eles usavam um conjunto de estratégias básicas, específicas para cada jogo, fornecidas pelos desenvolvedores.

Em resumo, embora a técnica de jogo destes algoritmos foi enriquecida cada vez mais, até os níveis humanos mais altos e até mesmo os superar, estava sempre sob a tutela de nossa inteligência.

O AlphaZero ultrapassa esse limite: graças a uma versão ainda mais sofisticada do aprendizado profundo , ele não precisa partir de uma indicação humana, mas é o suficiente para conhecer as regras básicas do jogo.

Porcentagem de jogos ganhos, pontuados ou perdidos pela AlphaZero em torneios contra Stockfish, Elmo e AlphaGo Zero, algoritmos de campeões de xadrez, shogi e Go (Cortesia DeepMind Technologies Ltd)

No entanto, alguns limites AlphaZero ainda exitem. O primeiro é o poder de computação de que ele precisa, correspondente ao de um grande supercomputador.

Mas há outro limite, mais interessante, relatado por Murray Campbell, um dos designers da Deep Blue, em um comentário sobre o artigo.

Como complexos, Go e xadrez shogi fornecem apenas dois jogadores, os jogos são de soma zero (o ganho ou perda de um jogador corresponde exatamente à perda ou ganho da outra), são deterministas, são discretos (um movimento é feito ou não, não há casos intermediários) e todo o “campo de batalha” é perfeitamente observável. Essas características são adequadas para uma análise pelos sistemas de IA existentes.
O próximo desafio da inteligência artificial será, portanto, desenvolver programas que possam lidar com jogos que não atendam a uma ou mais dessas condições.

Fonte: Le Scienze

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s