Badacze wykorzystują planszową grę RPG Dungeons & Dragons (D&D) jako nieoczekiwaną, ale skuteczną platformę do rozwoju sztucznej inteligencji (AI). Cel? Oceń, jak dobrze sztuczna inteligencja może angażować się w długoterminową strategię, wspólne rozwiązywanie problemów i zróżnicowane interakcje zarówno z innymi systemami sztucznej inteligencji i graczami ludzkimi. Nie chodzi tylko o gry; jest to krytyczny krok w kierunku stworzenia potężniejszej sztucznej inteligencji do zastosowań w świecie rzeczywistym.
Dlaczego Dungeons & Dragons?
D&D zapewnia wyjątkowe środowisko, które łączy uporządkowane zasady z nieograniczoną kreatywnością. W przeciwieństwie do wielu innych poligonów testowych sztucznej inteligencji, D&D wymaga od modeli nie tylko obliczenia optymalnych ruchów, ale także skutecznej komunikacji, zapamiętania przeszłych wydarzeń i przewidywania działań przeciwników. Gra skutecznie wypełnia lukę pomiędzy przetwarzaniem języka abstrakcyjnego a konkretną mechaniką gry, co czyni ją idealnym poligonem doświadczalnym.
Badania zaprezentowane niedawno na NeurIPS 2025 pokazują, że agenci sztucznej inteligencji mogą wcielać się w role takie jak Dungeon Master (DM) – gawędziarz i kontroler potworów – lub grać jako bohaterowie obok innych. Struktura zwana „Agentami D&D” umożliwia tworzenie mieszanych scenariuszy: LLM grają przeciwko LLM, LLM grają przeciwko ludziom lub wszyscy uczestnicy są ludźmi.
„Dungeons & Dragons to naturalna platforma do oceny wieloetapowego planowania, przestrzegania zasad i strategii zespołowej” – mówi Raj Ammanabrolu, adiunkt na Uniwersytecie Kalifornijskim w San Diego. „Ponieważ gra toczy się poprzez dialog, D&D otwiera także bezpośrednią ścieżkę interakcji człowiek-AI”.
Scenariusze walki i wydajność modelu
Eksperymenty skupiały się na izolowanych starciach bojowych z popularnej przygodówki The Lost Mine of Phandelver. Naukowcy przetestowali trzy modele sztucznej inteligencji – DeepSeek-V3, Claude Haiku 3.5 i GPT-4 – mierząc ich umiejętności długoterminowego planowania, zarządzania zasobami i koordynacji.
Kluczowe wnioski na wynos:
- Claude Haiku 3.5 wykazał się doskonałą skutecznością bojową, szczególnie w trudnych scenariuszach, agresywnie wykorzystując dostępne zasoby.
- GPT-4 znalazł się tuż za nim, podczas gdy DeepSeek-V3 miał największe problemy.
- Wszystkie modele wykazywały różny stopień spójności w rolach, przy czym Claude Haiku 3.5 był doskonały w dostosowywaniu dialogów do konkretnych postaci (np. pobożny Paladyn kontra dziki Druid).
Symulacja ujawniła także nieoczekiwane cechy, takie jak kontrolowane przez sztuczną inteligencję potwory rozwijające odrębne osobowości, a gobliny wykrzykują nawet okrzyki bojowe, takie jak „Ha ha – genialny człowiek wykrwawi się na śmierć!”
Prawdziwe konsekwencje
Nie jest to wyłącznie zainteresowanie akademickie. Umiejętności doskonalone w D&D przekładają się bezpośrednio na zastosowania w świecie rzeczywistym o znaczeniu krytycznym, w tym:
- Optymalizacja łańcucha dostaw: AI może planować złożoną logistykę z długoterminowymi zależnościami.
- Linie produkcyjne: sztuczna inteligencja może koordynować wiele procesów w celu poprawy wydajności.
- Modelowanie reakcji na katastrofy: sztuczna inteligencja może modelować i opracowywać strategie skutecznego udzielania pomocy.
- Poszukiwanie i ratownictwo: sztuczna inteligencja może koordynować zespoły i analizować dynamiczne środowiska.
Zdolność sztucznej inteligencji do niezależnego i niezawodnego działania przez długi czas przy zachowaniu spójności ma kluczowe znaczenie w tych scenariuszach.
Przyszłość sztucznej inteligencji w grach RPG
Badacze planują rozszerzyć symulację, aby uwzględnić pełnoprawne kampanie D&D, w tym elementy narracyjne i improwizacyjne. To jeszcze bardziej przesunie granice kreatywności sztucznej inteligencji, testując jej zdolność do reagowania na nieoczekiwane dane wejściowe zarówno od ludzi, jak i innych agentów sztucznej inteligencji. Praca pokazuje, że testowanie sztucznej inteligencji w złożonym interaktywnym środowisku, takim jak D&D, to zaskakująco skuteczny sposób na tworzenie solidniejszych i adaptacyjnych systemów.

























