https://frosthead.com

Il test di Turing misura qualcosa, ma non è "intelligenza"

Alan Turing, uno dei padri dell'era dei computer, era un uomo straordinariamente intelligente. Così intelligente, infatti, che ha capito che il termine "intelligenza artificiale" era praticamente insignificante. Meglio, ragionò, parlare di ciò che una macchina può effettivamente fare: può parlare? Può trattenere una conversazione? Almeno questo è qualcosa che possiamo tentare di studiare. Alla fine Turing ha proposto quello che è diventato noto come il "test di Turing": se un giudice non può dire quale delle due entità nascoste è un essere umano e quale sia un artificiale, la macchina ha "superato" il test - che è esattamente ciò che si dice che sia successo sabato scorso a Londra.

Contenuto relativo

  • La Silicon Valley deve il suo successo a questo genio della tecnologia che non hai mai sentito parlare
  • La previsione di 60 anni di Alan Turing sui modelli in natura è stata dimostrata vera

"Siamo ... orgogliosi di dichiarare che il test di Alan Turing è stato superato per la prima volta", ha dichiarato uno degli organizzatori, Kevin Warwick dell'Università di Reading, quando i risultati sono stati annunciati. Il chatbot vincitore prende il nome di "Eugene Goostman", un programma per computer che emula la personalità di un ragazzo ucraino di 13 anni. "Eugene" è riuscito a convincere il 33 percento dei giudici che era umano all'evento di sabato, tenutosi presso gli uffici della Royal Society a Londra in occasione del 60 ° anniversario della morte di Turing. (Turing, un omosessuale, fu condannato per grave indecenza nel 1952 e gli fu ordinato di sottoporsi a un "trattamento" ormonale come parte di un accordo di appello. Due anni dopo morì per avvelenamento da cianuro in un apparente suicidio.)

Ma una parola di cautela è in ordine. L '"intelligenza" è sempre stata un argomento sfuggente, e il test di Turing in particolare è stato a lungo carico di polemiche. Turing descrisse come avrebbe funzionato in un documento del 1950 intitolato "Macchine e intelligenza informatica". Prese l'idea da un tradizionale gioco di società vittoriana, in cui si cerca di capire se la persona nascosta dietro una tenda è un uomo o una donna, solo ponendo domande. (Le risposte alle domande dovevano essere scritte, perché la voce sarebbe stata un omaggio.) Ecco come funzionerebbe la versione di Turing: Avresti un giudice, seduto di fronte a due tende, senza modo di sapere cosa c'è dietro di loro . Dietro una tenda c'è un essere umano; dietro l'altro c'è un computer. Il giudice può porre domande a una delle due entità nascoste. Sulla base delle risposte, il giudice cerca di capire se l'entità nascosta è un essere umano o una macchina. (Turing ha immaginato che la conversazione fosse mediata dalle macchine del teletipo; oggi possiamo usare qualsiasi tipo di interfaccia elettronica basata su testo, come quella usata nelle chat room su Internet o la messaggistica istantanea.)

Turing ha ipotizzato che entro il 2000 "un interrogatore medio non avrà più del 70% di possibilità di fare la giusta identificazione", vale a dire che i programmi per computer ostacolerebbero i giudici il 30% delle volte, dopo cinque minuti di interrogatorio. I "cinque minuti" sono importanti. Turing non ha parlato di un limite di tempo come parte integrante del test, e si potrebbe sostenere che per una macchina che superi davvero il test, dovrebbe essere in grado di gestire qualsiasi quantità di domande. Presumibilmente i criteri di cinque minuti erano un limite arbitrario ma necessario. L'anno 2000 andava e veniva, con i chatbot che facevano solo fermare i progressi. (In un momento più sobrio, rispondendo a una domanda di un intervistatore della BBC nel 1952, Turing disse che sarebbero passati 100 anni prima che una macchina avesse superato il test.)

Nel 2012, ero un giudice in una "Maratona di test di Turing", la più grande serie di test di Turing mai condotti contemporaneamente; si tenne a Bletchley Park, in Inghilterra, sede del vitale lavoro di rottura del codice di Turing durante gli ultimi anni della seconda guerra mondiale. (È stato organizzato dalla stessa squadra che ha organizzato l'evento di sabato, e una versione precedente di Eugene era quella vincitrice anche quella volta.) L'allestimento dell'evento di sabato era lo stesso del 2012: i giudici hanno scritto le loro domande su un computer, quindi attese che le risposte apparissero sui loro schermi; i chatbot, insieme agli "umani nascosti", erano in un'altra stanza, fuori dalla vista.

La prima cosa di cui sono diventato iperconsapevole è che quando sei un giudice in un test di Turing, cinque minuti passano piuttosto velocemente. E più breve è la conversazione, maggiore è il vantaggio del computer; più lungo è l'interrogatorio, maggiore è la probabilità che il computer si registri. Mi piace chiamarlo effetto manichino: ti sei mai scusato con un manichino di un grande magazzino, supponendo di esserti appena imbattuto in un essere umano vivo? Se l'incontro dura solo una frazione di secondo, con te rivolto dall'altra parte, puoi immaginare di esserti appena sfiorato contro un essere umano. Più lungo è l'incontro, più evidente è il manichino del manichino.

È lo stesso con i chatbot. Uno scambio di hellos non rivela nulla, ma più ci si avvicina, più sorgono i problemi. I chatbot, ho scoperto, sembrano inclini a cambiare argomento senza motivo. Spesso non possono rispondere a domande semplici. A rischio di sembrare vaghi, non sembrano umani . In una delle mie conversazioni del 2012, ho digitato una semplice battuta - e l'entità con cui stavo conversando ha cambiato immediatamente argomento in hamburger. (Lo scienziato informatico Scott Aaronson ha avuto di recente un'esperienza simile quando ha chattato con Eugene tramite il sito web del bot. Aaronson ha chiesto a Eugene quante zampe ha un cammello; ha risposto: "Qualcosa tra 2 e 4. Forse, tre? :-)))" Più tardi, quando Aaronson chiese quante zampe avesse una formica, Eugene tossì la stessa identica risposta, tripla emoticon e tutto il resto.)

Si noti inoltre che Eugene non emula un adulto madrelingua inglese; finge di essere un adolescente ucraino giovane e in qualche modo irriverente, conversando in un inglese abbastanza buono (ma tutt'altro che perfetto). Come Vladimir Veselov, uno degli sviluppatori del programma, ha detto a Mashable.com : "Abbiamo trascorso molto tempo a sviluppare un personaggio con una personalità credibile". Sebbene Eugene coinvolgerà chiunque su qualsiasi argomento, la sua età "lo rende perfettamente ragionevole che non sai tutto. ”Eugene non esce subito e annuncia la sua età e nazionalità; ma lo rivelerà se gli verrà chiesto - e il risultato finale potrebbe essere una certa dose di clemenza da parte dei giudici, specialmente per quanto riguarda la grammatica inglese e l'uso delle parole. (Suppongo che la maggior parte dei giudici sabato fosse di madrelingua inglese, anche se non lo so per certo.) I tavoli sarebbero probabilmente cambiati se Eugene dovesse mai incontrare un madrelingua ucraino come giudice.

La lotta per costruire una macchina parlante evidenzia quanto sia complesso il linguaggio. Non è solo una questione di parlare - devi parlare di qualcosa e ciò che dici deve avere un senso - e deve avere un senso nel contesto di ciò che l' altra persona ha appena detto. Per noi è facile; per i computer, non tanto. E così i chatbot si basano su un assortimento di trucchi: memorizzare megabyte di risposte predefinite o cercare Internet per dialogare che possano approssimare la conversazione in cui si trovano attualmente. In altre parole, ciò che una macchina manca di intelligenza potrebbe essere in grado di compensare la potenza di calcolo grezza. Ecco perché Google o Siri (l'assistente personale di iPhone) possono sembrare così intelligenti per noi: Siri potrebbe non avere una "mente", ma ha accesso a un database così vasto di informazioni, può agire come se lo facesse. Fu lo stesso tipo di approccio a forza bruta che permise a IBM "Watson" di vincere a Jeopardy! nel 2011.

Tutto ciò solleva una domanda cruciale: che cosa sta esattamente misurando il test di Turing? Alcuni critici hanno suggerito che si tratta di inganno premi piuttosto che intelligenza. Lo psicologo della New York University Gary Marcus, che scrive su NewYorker.com, afferma che Eugene riesce "eseguendo una serie di" stratagemmi "progettati per mascherare i limiti del programma." Steven Harnad, psicologo e scienziato informatico all'Università del Quebec a Montreal, è stato ancora di più scettico, dicendo a The Guardian che era "totale assurdità" affermare che Eugene avesse superato il test di Turing. (A suo merito, Turing era ben consapevole di questo problema; ha definito la sua idea "il gioco dell'imitazione" e ha parlato di intelligenza solo con parsimonia.) Ancora più goffamente, il computer, a differenza dell'umano, è costretto a ingannare. "Il Turing Test è davvero un test per essere un bugiardo di successo", mi ha detto Pat Hayes, un informatico presso l'Institute for Human and Machine Cognition di Pensacola, in Florida, a seguito della maratona di test di Turing del 2012. "Se avessi qualcosa che potrebbe davvero passare il gioco di imitazione di Turing, sarebbe un 'imitazione umana' di grande successo".

E "umano" è l'altro punto chiave: non è possibile che ci siano altri tipi di intelligenza nel mondo, oltre a quelli mostrati dalla nostra specie? Una macchina veramente intelligente avrebbe innumerevoli applicazioni pratiche, ma perché concentrarsi sulla creazione di più "persone"? Dopotutto, abbiamo già molte persone. Come ha sottolineato il linguista Noam Chomsky, quando ci sforziamo di costruire una macchina che si muove sott'acqua, non abbiamo bisogno che “nuoti” - e un sottomarino non è meno un risultato per la sua incapacità di fare il dorso.

Sì, Eugene è impressionante, almeno a piccoli scoppi. Eppure, anche i migliori chatbot si imbattono in domande che un bambino di mezza età finta di Eugene potrebbe gestire con disinvoltura. Forse non a caso, la maggior parte dei ricercatori di intelligenza artificiale trascorre poco tempo ossessionandosi dal test di Turing. L'intelligenza artificiale, infatti, sta andando avanti e piuttosto rapidamente. Il software di traduzione vocale, che era abbastanza patetico solo pochi anni fa, sta rapidamente migliorando, così come i programmi di traduzione linguistica. Amazon ha spesso una buona idea di ciò che si desidera acquistare ancor prima di farlo. E l'auto a guida autonoma di Google sarebbe stata una pura fantasia un decennio fa. Ma la conversazione, mentre continuiamo a riscoprire, è davvero difficile e non è probabile che sia la frontiera in cui l'IA brilla più intensamente. Per ora, se stai cercando qualcuno con cui chattare, ti consiglio un vero essere umano.

Dan Falk è un giornalista scientifico con sede a Toronto.

Il test di Turing misura qualcosa, ma non è "intelligenza"