AI Masters: Jak Dungeons & Dragons testuje sztuczną inteligencję

0
18

Badacze wykorzystują planszową grę RPG Dungeons & Dragons (D&D) jako nieoczekiwaną, ale skuteczną platformę do rozwoju sztucznej inteligencji (AI). Cel? Oceń, jak dobrze sztuczna inteligencja może angażować się w długoterminową strategię, wspólne rozwiązywanie problemów i zróżnicowane interakcje zarówno z innymi systemami sztucznej inteligencji i graczami ludzkimi. Nie chodzi tylko o gry; jest to krytyczny krok w kierunku stworzenia potężniejszej sztucznej inteligencji do zastosowań w świecie rzeczywistym.

Dlaczego Dungeons & Dragons?

D&D zapewnia wyjątkowe środowisko, które łączy uporządkowane zasady z nieograniczoną kreatywnością. W przeciwieństwie do wielu innych poligonów testowych sztucznej inteligencji, D&D wymaga od modeli nie tylko obliczenia optymalnych ruchów, ale także skutecznej komunikacji, zapamiętania przeszłych wydarzeń i przewidywania działań przeciwników. Gra skutecznie wypełnia lukę pomiędzy przetwarzaniem języka abstrakcyjnego a konkretną mechaniką gry, co czyni ją idealnym poligonem doświadczalnym.

Badania zaprezentowane niedawno na NeurIPS 2025 pokazują, że agenci sztucznej inteligencji mogą wcielać się w role takie jak Dungeon Master (DM) – gawędziarz i kontroler potworów – lub grać jako bohaterowie obok innych. Struktura zwana „Agentami D&D” umożliwia tworzenie mieszanych scenariuszy: LLM grają przeciwko LLM, LLM grają przeciwko ludziom lub wszyscy uczestnicy są ludźmi.

„Dungeons & Dragons to naturalna platforma do oceny wieloetapowego planowania, przestrzegania zasad i strategii zespołowej” – mówi Raj Ammanabrolu, adiunkt na Uniwersytecie Kalifornijskim w San Diego. „Ponieważ gra toczy się poprzez dialog, D&D otwiera także bezpośrednią ścieżkę interakcji człowiek-AI”.

Scenariusze walki i wydajność modelu

Eksperymenty skupiały się na izolowanych starciach bojowych z popularnej przygodówki The Lost Mine of Phandelver. Naukowcy przetestowali trzy modele sztucznej inteligencji – DeepSeek-V3, Claude Haiku 3.5 i GPT-4 – mierząc ich umiejętności długoterminowego planowania, zarządzania zasobami i koordynacji.

Kluczowe wnioski na wynos:

  • Claude Haiku 3.5 wykazał się doskonałą skutecznością bojową, szczególnie w trudnych scenariuszach, agresywnie wykorzystując dostępne zasoby.
  • GPT-4 znalazł się tuż za nim, podczas gdy DeepSeek-V3 miał największe problemy.
  • Wszystkie modele wykazywały różny stopień spójności w rolach, przy czym Claude Haiku 3.5 był doskonały w dostosowywaniu dialogów do konkretnych postaci (np. pobożny Paladyn kontra dziki Druid).

Symulacja ujawniła także nieoczekiwane cechy, takie jak kontrolowane przez sztuczną inteligencję potwory rozwijające odrębne osobowości, a gobliny wykrzykują nawet okrzyki bojowe, takie jak „Ha ha – genialny człowiek wykrwawi się na śmierć!”

Prawdziwe konsekwencje

Nie jest to wyłącznie zainteresowanie akademickie. Umiejętności doskonalone w D&D przekładają się bezpośrednio na zastosowania w świecie rzeczywistym o znaczeniu krytycznym, w tym:

  • Optymalizacja łańcucha dostaw: AI może planować złożoną logistykę z długoterminowymi zależnościami.
  • Linie produkcyjne: sztuczna inteligencja może koordynować wiele procesów w celu poprawy wydajności.
  • Modelowanie reakcji na katastrofy: sztuczna inteligencja może modelować i opracowywać strategie skutecznego udzielania pomocy.
  • Poszukiwanie i ratownictwo: sztuczna inteligencja może koordynować zespoły i analizować dynamiczne środowiska.

Zdolność sztucznej inteligencji do niezależnego i niezawodnego działania przez długi czas przy zachowaniu spójności ma kluczowe znaczenie w tych scenariuszach.

Przyszłość sztucznej inteligencji w grach RPG

Badacze planują rozszerzyć symulację, aby uwzględnić pełnoprawne kampanie D&D, w tym elementy narracyjne i improwizacyjne. To jeszcze bardziej przesunie granice kreatywności sztucznej inteligencji, testując jej zdolność do reagowania na nieoczekiwane dane wejściowe zarówno od ludzi, jak i innych agentów sztucznej inteligencji. Praca pokazuje, że testowanie sztucznej inteligencji w złożonym interaktywnym środowisku, takim jak D&D, to zaskakująco skuteczny sposób na tworzenie solidniejszych i adaptacyjnych systemów.