DeepMind está treinando uma nova IA para jogar futebol
A “Neural Probabilistic Motor Primitives” resolve dois desafios – reutilização de comportamentos aprendidos anteriormente e comportamentos idiossincráticos (quando o agente consegue completar a tarefa, mas utiliza movimentos não-naturais e impraticáveis para aplicações como robótica).
Personagem humanoide aprendendo a percorrer um curso de obstáculos através de tentativa e erro, o que pode levar a soluções idiossincráticas.
A técnica envolve o aprendizado guiado com padrões de movimento derivados de humanos e animais captados através de dados de motion capture (MoCap).
O modelo tem duas partes:
-
Um encoder que pega uma trajetória futura e a comprime em uma intenção motora.
-
Um controlador de baixo nível que produz a próxima ação, dado o estado atual do agente e essa intenção motora.
Os agentes treinados adquiriram habilidades como locomoção ágil, drible e divisão de trabalho, conforme demonstrado por uma série de estatísticas, incluindo métricas usadas em análises esportivas do mundo real.
Os jogadores possuem controle motor ágil de alta frequência e tomada de decisão de longo prazo que envolve antecipação dos comportamentos dos companheiros de equipe.
Um agente aprendendo a jogar futebol competitivamente.