Os pesquisadores estão usando o RPG de mesa Dungeons & Dragons (D&D) como um ambiente de teste surpreendente, porém eficaz, para o desenvolvimento da inteligência artificial (IA). O objetivo? Avaliar até que ponto a IA pode se envolver em estratégias de longo prazo, resolução colaborativa de problemas e interação diferenciada com outros sistemas de IA e jogadores humanos. Não se trata apenas de jogos; é um passo crítico para construir uma IA mais capaz para aplicações do mundo real.
Por que Dungeons & Dragons?
D&D oferece um ambiente único que combina regras estruturadas com criatividade sem limites. Ao contrário de muitos outros campos de testes de IA, D&D exige que os modelos não apenas calculem movimentos ideais, mas também se comuniquem de forma eficaz, lembrem de eventos passados e antecipem ações do oponente. O jogo preenche efetivamente a lacuna entre o processamento de linguagem abstrata e a mecânica de jogo concreta, tornando-o um campo de testes ideal.
O estudo, apresentado recentemente na conferência NeurIPS 2025, destaca como os agentes de IA podem assumir papéis como Dungeon Master (DM) – o contador de histórias e controlador de monstros – ou jogar como heróis ao lado de outros. A estrutura, apelidada de “Agentes de D&D”, permite cenários de jogadores mistos: LLMs jogando contra LLMs, LLMs jogando com humanos ou grupos exclusivamente humanos.
“Dungeons & Dragons é um campo de testes natural para avaliar o planejamento em várias etapas, a adesão às regras e à estratégia da equipe”, diz Raj Ammanabrolu, professor assistente da Universidade da Califórnia, em San Diego. “Como o jogo se desenrola através do diálogo, o D&D também abre um caminho direto para a interação humano-IA.”
Cenários de combate e desempenho do modelo
Os experimentos se concentraram em encontros de combate isolados da popular aventura “Lost Mine of Phandelver”. Os pesquisadores testaram três modelos de IA – DeepSeek-V3, Claude Haiku 3.5 e GPT-4 – medindo seu planejamento de longo horizonte, gerenciamento de recursos e habilidades de coordenação.
As principais descobertas incluem:
- Claude Haiku 3.5 demonstrou eficiência de combate superior, especialmente em cenários desafiadores, ao utilizar agressivamente os recursos disponíveis.
- GPT-4 teve um desempenho logo atrás, enquanto DeepSeek-V3 teve mais dificuldades.
- Todos os modelos mostraram graus variados de consistência no personagem, com Claude Haiku 3.5 se destacando na adaptação do diálogo a papéis específicos (por exemplo, um Paladino piedoso versus um Druida selvagem).
A simulação também revelou peculiaridades inesperadas, como monstros controlados por IA desenvolvendo personalidades distintas, com goblins até gritando gritos de guerra como: “Heh – o homem brilhante vai sangrar!”
Implicações no mundo real
Isto não é apenas curiosidade acadêmica. As habilidades aprimoradas em D&D se traduzem diretamente em aplicações críticas do mundo real, incluindo:
- Otimização da cadeia de suprimentos: a IA pode planejar logística complexa com dependências de longo prazo.
- Linhas de fabricação: a IA pode coordenar vários processos para maior eficiência.
- Modelagem de resposta a desastres: A IA pode simular e traçar estratégias para uma distribuição eficaz da ajuda.
- Operações de busca e resgate: a IA pode coordenar equipes e analisar ambientes dinâmicos.
A capacidade da IA de agir de forma independente e confiável durante longos períodos, mantendo ao mesmo tempo a coerência, é crucial para estes cenários.
O futuro do RPG de IA
Os pesquisadores planejam expandir a simulação para abranger campanhas completas de D&D, incluindo elementos narrativos e de improvisação. Isto ampliará ainda mais os limites criativos da IA, testando a sua capacidade de reagir a contribuições inesperadas de seres humanos e de outros agentes de IA. O trabalho sugere que testar IA em um ambiente complexo e interativo como D&D é uma forma surpreendentemente eficaz de construir sistemas mais robustos e adaptáveis.
