Исследователи используют настольную ролевую игру Dungeons & Dragons (D&D) в качестве неожиданной, но эффективной платформы для разработки искусственного интеллекта (ИИ). Цель? Оценить, насколько хорошо ИИ может участвовать в долгосрочной стратегии, совместном решении проблем и нюансированном взаимодействии как с другими ИИ-системами, так и с игроками-людьми. Речь идет не только об играх; это критически важный шаг к созданию более мощного ИИ для реальных приложений.
Почему Dungeons & Dragons?
D&D предоставляет уникальную среду, которая сочетает структурированные правила с безграничным творчеством. В отличие от многих других полигонов для тестирования ИИ, D&D требует, чтобы модели не только вычисляли оптимальные ходы, но и общались эффективно, запоминали прошлые события и предвидели действия противников. Игра эффективно преодолевает разрыв между абстрактной обработкой языка и конкретной игровой механикой, что делает ее идеальным испытательным полигоном.
Исследование, недавно представленное на конференции NeurIPS 2025, показывает, как ИИ-агенты могут брать на себя роли, такие как Мастер Подземелий (DM) – рассказчик и контролер монстров – или играть в роли героев вместе с другими. Фреймворк, получивший название «D&D Agents», позволяет создавать смешанные сценарии: LLM играют против LLM, LLM играют с людьми или все участники – люди.
«Dungeons & Dragons – это естественная платформа для оценки многоступенчатого планирования, соблюдения правил и командной стратегии», – говорит Радж Амманабролу, доцент Калифорнийского университета в Сан-Диего. «Поскольку игра разворачивается посредством диалога, D&D также открывает прямой путь для взаимодействия человека и ИИ».
Боевые Сценарии и Производительность Моделей
Эксперименты были сосредоточены на изолированных боевых столкновениях из популярного приключения «Затерянная шахта Фанделвера». Исследователи протестировали три ИИ-модели – DeepSeek-V3, Claude Haiku 3.5 и GPT-4 – измеряя их долгосрочное планирование, управление ресурсами и навыки координации.
Ключевые выводы:
- Claude Haiku 3.5 продемонстрировал превосходную боевую эффективность, особенно в сложных сценариях, агрессивно используя доступные ресурсы.
- GPT-4 выступил близко позади, в то время как DeepSeek-V3 испытывал наибольшие трудности.
- Все модели показали различную степень последовательности в ролях, при этом Claude Haiku 3.5 преуспел в адаптации диалогов к конкретным персонажам (например, набожному Паладину по сравнению с диким Друидом).
Симуляция также выявила неожиданные особенности, такие как развитие у монстров под управлением ИИ отдельных личностей, при этом гоблины даже выкрикивали боевые кличи, такие как: «Ха-ха — блестящий человек истечет кровью!»
Реальные Последствия
Это не просто академический интерес. Навыки, отточенные в D&D, напрямую переносятся в критически важные реальные приложения, включая:
- Оптимизация цепочек поставок: ИИ может планировать сложную логистику с долгосрочными зависимостями.
- Производственные линии: ИИ может координировать несколько процессов для повышения эффективности.
- Моделирование реагирования на стихийные бедствия: ИИ может моделировать и разрабатывать стратегии для эффективного развертывания помощи.
- Поисково-спасательные операции: ИИ может координировать команды и анализировать динамичные среды.
Способность ИИ действовать независимо и надежно в течение длительных периодов времени, сохраняя при этом согласованность, имеет решающее значение для этих сценариев.
Будущее ИИ в Ролевых Играх
Исследователи планируют расширить симуляцию, включив в нее полноценные кампании D&D, включая повествовательные и импровизационные элементы. Это еще больше расширит творческие границы ИИ, проверяя его способность реагировать на неожиданные входные данные как от людей, так и от других ИИ-агентов. Работа показывает, что тестирование ИИ в сложной интерактивной среде, такой как D&D, является на удивление эффективным способом создания более надежных и адаптивных систем.


























