https://frosthead.com

AI sta imparando il lavoro di squadra dominando nei videogiochi multiplayer

I computer hanno dominato gli umani in partite individuali come gli scacchi per decenni, ma ottenere l'intelligenza artificiale (AI) per cooperare con i compagni di squadra è un po 'più complicato. Ora, i ricercatori del progetto DeepMind di Google hanno insegnato ai giocatori di intelligenza artificiale a lavorare insieme in team con umani e altri computer per competere nel videogioco del 1999 Quake III Arena .

Edd Gent at Science riferisce che quando l'IA ha un solo avversario, di solito fa abbastanza bene poiché sta solo anticipando le possibili mosse di una singola mente. Ma il lavoro di squadra è una questione completamente diversa perché include azioni in cui i computer non sono tradizionalmente bravi, come prevedere come si comporterà un gruppo di compagni di squadra. Per rendere l'IA davvero utile, deve imparare a cooperare con altre intelligenze.

Il team di DeepMind di Google spiega in un post sul blog:

“Miliardi di persone abitano il pianeta, ognuna con i propri obiettivi e azioni individuali, ma ancora in grado di riunirsi attraverso team, organizzazioni e società in impressionanti dimostrazioni di intelligenza collettiva. Questa è un'impostazione che chiamiamo apprendimento multi-agente: molti singoli agenti devono agire in modo indipendente, ma imparare a interagire e cooperare con altri agenti. Questo è un problema immensamente difficile - perché con gli agenti coadattanti il ​​mondo è in continua evoluzione ”.

I videogiochi multiplayer, in prima persona, in cui squadre di giocatori corrono in mondi virtuali, di solito sparando pistole o lanciatori di granate l'uno all'altro, è il luogo perfetto per l'IA per imparare le complessità del lavoro di squadra. Ogni giocatore deve agire individualmente e fare delle scelte a beneficio della squadra nel suo insieme.

Per lo studio, il team ha addestrato l'IA a giocare a catturare la bandiera sulla piattaforma Quake III Arena . Le regole sono abbastanza semplici: due squadre si affrontano su un campo di battaglia simile a un labirinto. L'obiettivo è quello di catturare il maggior numero di bandiere virtuali di altre squadre, proteggendo al contempo la propria, e qualsiasi squadra cattura il maggior numero di bandiere in cinque minuti vince. In pratica, tuttavia, le cose possono diventare molto complicate rapidamente.

Il team DeepMind ha creato 30 algoritmi di rete neurale e li ha fatti combattere l'un l'altro su una serie di mappe di gioco generate casualmente. I robot hanno segnato punti catturando bandiere e zappando altri giocatori, rimandandoli in un'area di rigenerazione dove il loro personaggio viene riavviato. Inizialmente, le azioni dei robot apparivano casuali. Tuttavia, più suonavano, meglio diventavano. Tutte le reti neurali che sono state costantemente perse sono state eliminate e sono state sostituite da versioni modificate dell'IA vincente Alla fine di 450.000 partite, il team ha incoronato una rete neurale, soprannominata For the Win (FTW), come campione.

Il gruppo DeepMind ha giocato all'algoritmo FTW contro quello che viene chiamato un mirror mirror, a cui mancano le capacità di apprendimento dell'IA, e quindi anche contro i team umani. FTW ha schiacciato tutti gli sfidanti.

Il gruppo ha quindi organizzato un torneo in cui 40 giocatori umani sono stati abbinati casualmente sia come compagni di squadra che come avversari del robot. Secondo il post del blog, i giocatori umani hanno scoperto che i robot erano più collaborativi dei loro compagni di squadra nella vita reale. I giocatori umani accoppiati con agenti FTW sono stati in grado di battere i cyber guerrieri in circa il 5% delle partite.

Come hanno appreso, i robot hanno scoperto alcune strategie a lungo abbracciate dai giocatori umani, come uscire vicino al punto di rinascita di una bandiera per afferrarlo quando ricompare. I team FTW hanno anche scoperto un bug che potevano sfruttare: se avessero sparato al loro compagno di squadra nella parte posteriore, avrebbero dato loro un aumento di velocità, qualcosa che avevano usato a loro vantaggio.

"Ciò che è stato sorprendente durante lo sviluppo di questo progetto è stato vedere l'emergere di alcuni di questi comportamenti di alto livello", ha detto a Gent il ricercatore e autore principale DeepMind Max Jaderberg. "Queste sono cose a cui possiamo relazionarci come giocatori umani".

Una delle ragioni principali per cui i robot erano migliori dei giocatori umani è che erano tiratori veloci e precisi, rendendoli più veloci nel pareggio rispetto ai loro avversari umani. Ma questo non è stato l'unico fattore nel loro successo. Secondo il blog, quando i ricercatori hanno costruito un ritardo di un quarto di tempo nei robo-shooter, i migliori umani potevano ancora batterli solo il 21% delle volte.

Da questo studio iniziale, FTW e i suoi discendenti sono stati scatenati sul campo di battaglia completo di Quake III Arena e hanno dimostrato di poter dominare un mondo ancora più complesso con più opzioni e sfumature. Hanno anche creato un robot che eccelle nel gioco di strategia spaziale ultra-complesso Starcraft II.

Ma la ricerca non riguarda solo la creazione di algoritmi di videogiochi migliori. Imparare a conoscere il lavoro di squadra potrebbe eventualmente aiutare il lavoro di intelligenza artificiale nelle flotte di auto a guida autonoma o forse un giorno diventare assistenti robotici che aiutano ad anticipare le esigenze dei chirurghi, secondo quanto riferito da Science di Gent.

Non tutti, tuttavia, pensano che i robot arcade-star rappresentino un vero lavoro di squadra. Il ricercatore di intelligenza artificiale Mark Riedl di Georgia Tech dice al New York Times che i robot sono così bravi nel gioco perché ognuno comprende le strategie in profondità. Ma questa non è necessariamente cooperazione poiché i team di intelligenza artificiale mancano di un elemento cruciale del lavoro di squadra umano: comunicazione e cooperazione intenzionale.

E, naturalmente, mancano anche dell'altro segno distintivo dell'esperienza cooperativa di videogiochi: la spazzatura che parla dell'altra squadra.

AI sta imparando il lavoro di squadra dominando nei videogiochi multiplayer