AI Masters: Jak Dungeons & Dragons testuje umělou inteligenci

0
6

Výzkumníci používají stolní hru na hrdiny Dungeons & Dragons (D&D) jako neočekávanou, ale efektivní platformu pro vývoj umělé inteligence (AI). Cíl? Posuďte, jak dobře se umělá inteligence dokáže zapojit do dlouhodobé strategie, společného řešení problémů a nuance interakcí s ostatními systémy umělé inteligence a s lidskými hráči. Není to jen o hrách; toto je zásadní krok k vytvoření výkonnější umělé inteligence pro aplikace v reálném světě.

Proč Dungeons & Dragons?

D&D poskytuje jedinečné prostředí, které kombinuje strukturovaná pravidla s neomezenou kreativitou. Na rozdíl od mnoha jiných testovacích zařízení AI vyžaduje D&D modely, aby nejen počítaly optimální pohyby, ale také komunikovaly efektivně, pamatovaly si minulé události a předvídaly akce protivníků. Hra efektivně překlenuje propast mezi abstraktním jazykovým zpracováním a konkrétními herními mechanismy, což z ní dělá ideální testovací základnu.

Výzkum nedávno prezentovaný na NeurIPS 2025 ukazuje, jak mohou agenti umělé inteligence převzít role, jako je Dungeon Master (DM) – vypravěč příběhů a ovladač monster – nebo hrát jako hrdinové po boku ostatních. Rámec nazvaný „D&D Agents“ umožňuje vytvářet smíšené scénáře: LLM hrají proti LLM, LLM hrají proti lidem nebo všichni účastníci jsou lidé.

„Dungeons & Dragons je přirozená platforma pro hodnocení vícefázového plánování, dodržování pravidel a týmové strategie,“ říká Raj Ammanabrolu, odborný asistent na University of California v San Diegu. “Protože se hra odvíjí prostřednictvím dialogu, D&D také otevírá přímou cestu pro interakci člověka a AI.”

Bojové scénáře a výkon modelu

Experimenty se zaměřily na izolovaná bojová střetnutí z oblíbené adventury The Lost Mine of Phandelver. Výzkumníci testovali tři modely umělé inteligence – DeepSeek-V3, Claude Haiku 3.5 a GPT-4 – a měřili jejich schopnosti dlouhodobého plánování, řízení zdrojů a koordinace.

Hlavní poznatky:

  • Claude Haiku 3.5 prokázal vynikající bojovou účinnost, zejména v obtížných scénářích, agresivně využívající dostupné zdroje.
  • GPT-4 byl těsně pozadu, zatímco DeepSeek-V3 měl největší problémy.
  • Všechny modely vykazovaly různé stupně konzistence v rolích, přičemž Claude Haiku 3.5 vynikal v přizpůsobení dialogů konkrétním postavám (např. oddaný Paladin versus divoký Druid).

Simulace také odhalila neočekávané rysy, jako jsou monstra ovládaná umělou inteligencí rozvíjející odlišné osobnosti, přičemž skřeti dokonce křičeli bojové pokřiky jako “Ha ha – geniální muž vykrvácí k smrti!”

Skutečné důsledky

Nejde jen o akademický zájem. Dovednosti vypilované v D&D se přímo promítají do kritických aplikací v reálném světě, včetně:

  • Optimalizace dodavatelského řetězce: Umělá inteligence může plánovat komplexní logistiku s dlouhodobými závislostmi.
  • Výrobní linky: Umělá inteligence může koordinovat více procesů za účelem zvýšení efektivity.
  • Modelování reakce na katastrofy: Umělá inteligence může modelovat a vyvíjet strategie pro efektivní nasazení pomoci.
  • Search and Rescue: Umělá inteligence může koordinovat týmy a analyzovat dynamická prostředí.

Schopnost umělé inteligence jednat nezávisle a spolehlivě po dlouhou dobu při zachování konzistence je pro tyto scénáře zásadní.

Budoucnost umělé inteligence ve hrách na hrdiny

Vědci plánují rozšířit simulaci o plnohodnotné D&D kampaně včetně narativních a improvizačních prvků. To dále posune kreativní hranice umělé inteligence testováním její schopnosti reagovat na neočekávané vstupy od lidí i jiných agentů umělé inteligence. Práce ukazuje, že testování umělé inteligence v komplexním interaktivním prostředí, jako je D&D, je překvapivě efektivní způsob, jak vytvořit robustnější a adaptivnější systémy.