https://frosthead.com

La nuova IA di Google è un maestro dei giochi, ma come si confronta con la mente umana?

Per gli umani, gli scacchi possono richiedere una vita da padroneggiare. Ma il nuovo programma di intelligenza artificiale di Google DeepMind, AlphaZero, può insegnarsi a conquistare la scacchiera nel giro di poche ore.

Basandosi sul successo passato con la suite AlphaGo, una serie di programmi per computer progettati per giocare al gioco da tavolo cinese Go, Google si vanta che il suo nuovo AlphaZero raggiunge un livello di "prestazioni sovrumane" non solo in un gioco da tavolo, ma in tre: Go, scacchi e shogi (essenzialmente, scacchi giapponesi). Il team di informatici e ingegneri, guidato da David Silver di Google, ha recentemente riportato i suoi risultati sulla rivista Science .

"Prima di questo, con l'apprendimento automatico, si poteva ottenere una macchina per fare esattamente ciò che si desidera, ma solo quella cosa", afferma Ayanna Howard, esperta di informatica interattiva e intelligenza artificiale presso il Georgia Institute of Technology che non ha partecipato al ricerca. "Ma AlphaZero mostra che puoi avere un algoritmo che non è così [specifico] e che può apprendere con determinati parametri."

L'intelligente programmazione di AlphaZero aumenta sicuramente le aspettative sul gameplay sia per l'uomo che per la macchina, ma Google ha da tempo puntato su qualcosa di più grande: l'intelligenza ingegneristica.

I ricercatori stanno attenti a non affermare che AlphaZero è sul punto di dominare il mondo (altri sono stati un po 'più veloci nel saltare la pistola). Tuttavia, Silver e il resto della squadra DeepMind sperano già che un giorno vedranno un sistema simile applicato al design dei farmaci o alla scienza dei materiali.

Cosa rende AlphaZero così impressionante?

Il gioco è stato a lungo venerato come uno standard di riferimento nella ricerca dell'intelligenza artificiale. I giochi strutturati e interattivi sono semplificazioni di scenari del mondo reale: devono essere prese decisioni difficili; le vittorie e le perdite aumentano la posta in gioco; e la previsione, il pensiero critico e la strategia sono fondamentali.

Codificare questo tipo di abilità è complicato. IAI di gioco precedenti, inclusi i primi prototipi dell'originale AlphaGo, sono stati tradizionalmente riempiti di codici e dati per imitare l'esperienza tipicamente acquisita attraverso anni di gameplay naturale e umano (essenzialmente, una discarica di conoscenza passiva, derivata dal programmatore). Con AlphaGo Zero (la versione più recente di AlphaGo) e ora AlphaZero, i ricercatori hanno dato al programma solo un input: le regole del gioco in questione. Quindi, il sistema si è accovacciato e ha imparato attivamente i trucchi del commercio stesso.

Partire AlphaZero è basato su AlphaGo Zero, parte della suite AlphaGo progettata per giocare al gioco da tavolo cinese Go, nella foto sopra. Le prime iterazioni del programma originale sono state alimentate con dati da giochi umani contro umani; le versioni successive si dedicarono all'autodidatta, in cui il software giocava contro se stesso per apprendere la propria strategia. (Chad Miller / Flickr / CC BY-SA 2.0)

Questa strategia, chiamata apprendimento del rinforzo in modalità self-play, è praticamente esattamente come sembra: per allenarsi per le grandi leghe, AlphaZero si è giocato in iterazione dopo iterazione, perfezionando le sue abilità con prove ed errori. E l'approccio della forza bruta ha dato i suoi frutti. A differenza di AlphaGo Zero, AlphaZero non si limita a giocare a Go: può anche battere i migliori IA del settore negli scacchi e nello shogi. Il processo di apprendimento è anche straordinariamente efficiente, che richiede solo due, quattro o 30 ore di auto-tutoraggio per sovraperformare i programmi specificamente su misura per padroneggiare shogi, scacchi e Go, rispettivamente. In particolare, gli autori dello studio non hanno riportato casi di AlphaZero che si scontrano con un vero essere umano, dice Howard. (I ricercatori potrebbero aver ipotizzato che, dato che questi programmi ostruiscono costantemente le loro controparti umane, un tale confronto sarebbe stato inutile.)

AlphaZero è stato anche in grado di sconfiggere Stoccafisso (il maestro di scacchi dell'IA non ancora seduto) ed Elmo (l'ex esperto di shogi dell'IA) nonostante abbia valutato meno mosse successive possibili in ogni turno durante il gioco. Ma poiché gli algoritmi in questione sono intrinsecamente diversi e possono consumare diverse quantità di energia, è difficile confrontare direttamente AlphaZero con altri programmi più vecchi, sottolinea Joanna Bryson, che studia intelligenza artificiale all'Università di Bath nel Regno Unito e lo ha fatto non contribuire ad AlphaZero.

Google mantiene mamma su buona parte della stampa fine sul suo software e AlphaZero non fa eccezione. Anche se non sappiamo tutto sul consumo di energia del programma, ciò che è chiaro è questo: AlphaZero deve imballare alcune munizioni computazionali serie. In quelle poche ore di allenamento, il programma si è tenuto molto impegnato, impegnandosi in decine o centinaia di migliaia di sessioni di prove per portare a buon fine la sua strategia di gioco da tavolo - molto più di quanto un giocatore umano avrebbe bisogno (o, nella maggior parte dei casi, potrebbe anche realizzare) alla ricerca di competenza.

Questo regime intensivo utilizzava anche 5.000 unità processore di apprendimento automatico di proprietà di Google, o TPU, che secondo alcune stime consumano circa 200 watt per chip. Indipendentemente da come lo tagli, AlphaZero richiede molta più energia di un cervello umano, che funziona a circa 20 watt.

Il consumo energetico assoluto di AlphaZero deve essere preso in considerazione, aggiunge Bin Yu, che lavora all'interfaccia di statistica, apprendimento automatico e intelligenza artificiale presso l'Università della California, Berkeley. AlphaZero è potente, ma potrebbe non essere un buon affare, soprattutto quando si aggiungono le ore-persona che sono andate nella sua creazione ed esecuzione.

Energicamente costoso o no, AlphaZero fa un salto di qualità: la maggior parte degli IA sono iper-specializzati in una singola attività, rendendo questo nuovo programma, con la sua tripla minaccia di gioco, straordinariamente flessibile. "È impressionante che AlphaZero sia stato in grado di utilizzare la stessa architettura per tre giochi diversi", dice Yu.

Quindi sì. La nuova IA di Google imposta un nuovo segno in diversi modi. È veloce. È potente. Ma questo lo rende intelligente?

È qui che le definizioni iniziano a diventare torbide. "AlphaZero è stato in grado di imparare, partendo da zero senza alcuna conoscenza umana, a giocare a ciascuno di questi giochi a un livello sovrumano", ha dichiarato Silver di DeepMind in una nota alla stampa.

Anche se l'esperienza del gioco da tavolo richiede acuità mentale, tutti i proxy per il mondo reale hanno i loro limiti. Nella sua attuale iterazione, AlphaZero raggiunge il massimo vincendo giochi progettati dall'uomo, il che potrebbe non giustificare l'etichetta potenzialmente allarmante di "sovrumano". Inoltre, se sorpreso da una nuova serie di regole durante il gioco, AlphaZero potrebbe essere confuso. Il vero cervello umano, d'altra parte, può conservare molto più di tre giochi da tavolo nel suo repertorio.

Inoltre, confrontare la linea di base di AlphaZero con una tabula rasa ( tabula rasa ) - come fanno i ricercatori - è un tratto, afferma Bryson. I programmatori stanno ancora alimentando un pezzo cruciale della conoscenza umana: le regole del gioco che sta per giocare. "Ha molto meno da fare di quanto non abbia mai fatto prima", aggiunge Bryson, "ma la cosa più fondamentale è, sono ancora date le regole. Quelli sono espliciti. "

E quelle fastidiose regole potrebbero costituire una stampella significativa. "Anche se questi programmi imparano a esibirsi, hanno bisogno delle regole della strada", afferma Howard. "Il mondo è pieno di compiti che non hanno queste regole."

Quando arriva la spinta, AlphaZero è un aggiornamento di un programma già potente: AlphaGo Zero, spiega JoAnn Paul, che studia intelligenza artificiale e sogni computazionali presso il Virginia Polytechnic Institute e la State University e non è stato coinvolto nella nuova ricerca. AlphaZero utilizza molti degli stessi blocchi costitutivi e algoritmi di AlphaGo Zero e costituisce ancora solo un sottoinsieme di veri e propri smart. "Pensavo che questo nuovo sviluppo fosse più evolutivo che rivoluzionario", aggiunge. “Nessuno di questi algoritmi può creare . L'intelligenza riguarda anche la narrazione. Immagina cose che non sono ancora lì. Non stiamo pensando in questi termini nei computer. "

Parte del problema è che non esiste ancora consenso su una vera definizione di "intelligenza", dice Yu, e non solo nel campo della tecnologia. "Non è ancora chiaro come stiamo allenando gli esseri che pensano in modo critico, o come usiamo il cervello inconscio", aggiunge.

A questo punto, molti ricercatori ritengono che ci siano probabilmente diversi tipi di intelligenza. E attingere a uno lontano da garantisce gli ingredienti per un altro. Ad esempio, alcune delle persone più intelligenti là fuori sono terribili a scacchi.

Con queste limitazioni, la visione di Yu del futuro dell'intelligenza artificiale unisce uomini e macchine in una sorta di coevoluzione. Le macchine continueranno sicuramente ad eccellere in determinati compiti, spiega, ma l'input umano e la supervisione potrebbero essere sempre necessari per compensare chi non lo è.

Naturalmente, non si può dire come andranno le cose nell'arena dell'IA. Nel frattempo, abbiamo molto su cui riflettere. "Questi computer sono potenti e possono fare certe cose meglio di una lattina umana", afferma Paul. "Ma questo non è ancora all'altezza del mistero dell'intelligenza."


Questo articolo è stato originariamente pubblicato su NOVA.
La nuova IA di Google è un maestro dei giochi, ma come si confronta con la mente umana?