Anul 2022 marchează cea de-a 50-a aniversare de la debutul lui Pong – unul dintre cele mai vechi jocuri pe computer și primul care a devenit un succes mondial ca joc video pentru acasă. Datorită succesului lui Pong, jocurile video s-au dezvoltat foarte mult, fiind dezvoltate programe pentru a juca împotriva adversarilor umani, în jocuri precum șah sau go. Aici, computerele au câştigat în cele din urmă și i-au învins pe stăpânii lor.
Acum însă, un alt joc tradițional de strategie de război a dat ca şi câştigător computerul, sau, să spunem Inteligenţa Artificială (A.I.) – că tot ea e la modă. Este într-adevăr o ştire îngrijorătoare, deoarece jocul care are o „strategie” încorporată chiar în numele său – Stratego – este un joc considerat a fi mai complex decât Go. Este timpul să recunoaștem victoria computerelor și să transformăm strategia de război către A.I.?
Stratego este unul dintre puținele jocuri de societate pe care A.I. nu le-a stăpânit încă. Este un joc caracterizat de o provocare dublă: necesită gândire strategică pe termen lung, ca în șah, dar necesită și manipularea „informațiilor imperfecte” ca în poker.
Într-o nouă lucrare publicată în revista „Science” („Mastering the game of Stratego with model-free multiagent reinforcement learning”), specialiştii de la filiala de Inteligență Artificială a lui Goggle, DeepMind, au dezvăluit DeepNash, un sistem de A.I. conceput special pentru a juca și a câștiga Stratego, jocul clasic de masă pe care DeepMind îl descrie ca fiind mai complex decât șahul și Go și mai „intuitiv” decât pokerul. „Intuiţia” vine din faptul că, la fel ca pokerul, Stratego este un joc de „informații imperfecte”, în care jucătorii nu pot observa direct identitățile pieselor de joc ale adversarului (sau cărțile de joc, în cazul pokerului).
Stratego este un joc de strategie similar cu şahul, dar în care, spre deosebire de şah, jucătorilor li se prezintă o informaţie incompletă despre armata adversă. Astfel, pe lângă strategia mutărilor, intervine psihologia şi deducţia. Va trebui să îţi ascunzi piesele importante, să blufezi şi să deduci poziţionarea pieselor adversarului.
Stratego se joacă în doi, pe o tablă de 10×10 pătrate. Fiecare jucător are 40 de piese reprezentând gradele individuale într-o armată (de la soldat la ofițer), dar piesele sunt verticale, astfel încât însemnele sunt vizibile doar pentru jucătorul care le mută. Scopul este de a găsi și a captura steagul adversarului sau de a captura, izola și înconjura piesele acestuia, astfel încât să nu facă nicio mișcare. Este posibil ca jocul Stratego original să fi fost bazat pe șahul militar tradițional japonez, dar cea mai veche formă cea mai asemănătoare cu versiunea modernă a fost jocul francez L’attaque, patentat în 1909 și jucat în principal în Franța și Marea Britanie. Versiunea americană a lui Stratego a fost creată de olandezul Jacques Johan Mogendorff și înregistrată ca marcă în 1942 de către compania olandeză Van Perlstein & Roeper Bosch NV, care întâmplător a produs și prima ediție a lui „Monopoly”.
Site-ul DeepMind.com explică provocarea cu care se confruntă dezvoltatorii în crearea unui program pentru a juca Stratego la nivel uman. Jocurile de cacealma sunt în mod inerent dificile pentru computere, care se bazează pe date fiabile pentru a fi analizate. Jucătorii Stratego au „informații imperfecte” în baza lor de date, așa că trebuie să echilibreze toate rezultatele posibile atunci când iau o decizie. Aceasta este o mare provocare în jocul de poker Texas Hold’em, care se termină după doar câteva decizii, dar aproape de netrecut în Stratego, care poate avea sute de mișcări în ore de joc, fără indicii vizibile cu privire la modul în care fiecare mișcare poate afecta rezultatul final. Pentru a computeriza șahul și Go, programele sunt introduse în toate stările posibile ale jocului și relațiile lor – o structură cunoscută sub numele de „arborele jocului”. Complexitatea „arborelui de joc” al Stratego este mult superioară în comparație cu șahul, Go-ul și pokerul. După ani în care au eșuat toate strategiile tradiționale, DeepMind a apelat la o nouă abordare, renunţându-se la „arborele de joc”.
Noua abordare – Regularized Nash Dynamics (R-NaD) – înseamnă că A.I. DeepNash se orientează către „echilibrul Nash” (termen explicat în lucrarea de cercetare). Şi… a funcționat! DeepNash a ajuns pe primele locuri la Stratego, în clasamentul din toate timpurile pe platforma de jocuri Gravon, concurând cu jucători experți umani. Fostul campion mondial de Stratego și co-autor al lucrării, Vincent de Boer, este impresionat. „Nivelul de joc al lui DeepNash m-a surprins. Nu văzusem niciodată o mașină capabilă să joace Stratego ca un jucător uman experimentat. După ce am jucat eu împotriva lui DeepNash, nu am fost surprins că a ajuns în primele trei locuri în clasamentul Gravon”.
DeepNash a învățat o varietate de tactici de cacealma – abilități care duc jocul pe computer la un nivel mult peste orice şi-ar fi imaginat dezvoltatorii lui Pong cu doar 50 de ani în urmă. Și totuși, la nivelul de bază, jocurile sunt aceleași – o luptă între doi jucători. Dacă DeepNash poate învinge un „general” uman la un joc de strategie de război, este gata să înlocuiască generalii umani în situaţiile de război reale? Acest general A.I. poate comanda roboţilor A.I. să aibă succes pe un câmp de luptă militar tradițional împotriva soldaților umani?