Il software di riconoscimento vocale, molti di noi probabilmente sarebbero d'accordo, è una cosa piuttosto interessante. Ma parlare con le macchine parte - che si tratti di smartphone, schermo TV o cruscotto - beh, non così tanto. Chiedere consiglio a un dispositivo? Reeks di geek. Enunciare ogni parola in modo che tu possa essere capito? Quanto puoi essere davvero forte?
Ma Apple, fedele alla forma, ha assunto questa testa assumendo tre icone di tendenza per recitare nella loro ultima campagna pubblicitaria per Siri, la voce di iPhone 4S. C'è Zooey Deschanel (Adorable Cool) e John Malkovich (Cerebral Cool) e Samuel L. Jackson (Ultimate Cool), e tutti fanno in modo che i giochi di parole a con un telefono sembrino lo sport degli dei.
I critici, tuttavia, sottolineano che nella vita reale, Siri non è né reattiva né onnisciente come è ritratta in spot pubblicitari. Anche tu, ne sono certo, sei scioccato nel sentirlo. Altri vedono tutto maturo per la parodia: vedi Jooey, il fratello di Zooey, fare una versione divertente o morire della giornata piovosa di Zooey e Siri insieme.
Non importa. Siri è diventata una cantante solista nel coro dei robot, la voce "You Got Mail" di una nuova generazione.
È di moda in alcuni ambienti suggerire che Siri non è degno di Steve Jobs, che se fosse ancora vivo, Jobs lo tirerebbe fuori dal mercato o, almeno, non avrebbe mai approvato un annuncio di così alto profilo campagna per un prodotto così imperfetto.
Ma come successore di Jobs, Tim Cook, ha detto all'inizio di questa settimana, i possessori di iPhone 4S come Siri. Secondo un sondaggio pubblicato a marzo, quasi il 90 percento afferma di usarlo almeno una volta al mese. E tieni presente che Siri, uno dei pochissimi prodotti Apple che si dice siano in beta quando è stato rilasciato, non festeggerà il suo primo compleanno fino a ottobre. Sta ancora imparando la lingua e, ancora più importante, sta appena iniziando a sfruttare il potenziale dell'intelligenza artificiale.
Siri sarà probabilmente il fulcro di Apple TV, che dovrebbe fare il suo debutto a dicembre. Ma è probabile che il posto in cui parlare con le macchine diventerà mainstream sia nelle nostre auto.
Guida, disse
Certo, sta già succedendo, ma devi ancora passare al robot parlare se vuoi essere compreso. E anche allora non c'è garanzia. Questo inizierà a cambiare quest'estate quando alcuni nuovi modelli verranno equipaggiati con qualcosa chiamato Dragon Drive!
È l'invenzione di Nuance Communications, una società con sede nel Massachusetts che è diventata una potenza nel settore del riconoscimento vocale. (Si crede che sia il cervello dietro a Siri.) La nuance e il riconoscimento vocale nelle auto hanno fatto un grande salto in avanti la scorsa settimana quando l'azienda ha annunciato che Dragon Drive! sarà in grado di attingere al cloud.
Ciò significa che il sistema aumenterà notevolmente la sua potenza di elaborazione e capacità di memoria. Ciò significa che la voce nella tua dashboard diventerà più simile a Siri e ti consentirà di conversare effettivamente con essa. Niente più grida monosillabiche. Sta arrivando il giorno in cui sarai in grado di menzionare casualmente che ti senti come un po 'di Allman Brothers e pochi secondi dopo "Whipping Post" verrà pompando attraverso gli altoparlanti.
La chiave è quanto siamo in grado di insegnare il contesto e la pragmatica delle macchine, come viene usato il linguaggio nelle situazioni sociali. E questo è un affare complicato. Per cominciare, anche il dispositivo di riconoscimento vocale più sofisticato deve attendere che un umano finisca di parlare, in modo da poter analizzare e interpretare l'intera frase. Poi c'è la "teoria della mente", la capacità di capire che altre persone possono avere credenze e intenzioni diverse dalle nostre. Per quanto ne sappiamo, solo gli umani possono farlo.
Un recente studio di due psicologi di Stanford può darti un'idea di ciò che è coinvolto nell'aiutare l'intelligenza delle macchine. I ricercatori Michael Frank e Noah Goodman hanno avviato un esperimento online in cui ai partecipanti è stato chiesto di esaminare un insieme di oggetti e quindi selezionare quale di questi si riferiva a una determinata parola. Ad esempio, un gruppo di partecipanti ha visto un quadrato blu, un cerchio blu e un quadrato rosso. La domanda per quel gruppo era: Immagina di parlare con qualcuno e di voler fare riferimento all'oggetto centrale. Quale parola useresti, "blu" o "cerchio"?
È stato chiesto all'altro gruppo: immagina che qualcuno ti stia parlando e usi la parola "blu" per riferirsi a uno di questi oggetti. Di quale oggetto stanno parlando?
Le risposte hanno aiutato i ricercatori a ottenere un quadro più chiaro di come un ascoltatore capisce un oratore e come un oratore decide cosa dire. Da ciò, hanno sviluppato il tipo di modello matematico che può espandere e perfezionare il processo di pensiero di un computer.
Frank ha detto: "Ci vorranno anni di lavoro, ma il sogno è di un computer che stia davvero pensando a quello che vuoi e a quello che vuoi dire piuttosto che a quello che hai detto."
Un modo di dire
Ecco alcuni sviluppi più recenti nel riconoscimento vocale:
- Siri tace: IBM tende ad essere molto nervoso per i segreti aziendali, quindi ora proibisce ai suoi dipendenti di utilizzare siti di trasferimento di file pubblici, come Dropbox. Ma ha anche vietato l'uso di Siri in ufficio perché i dirigenti della sicurezza temono che qualcuno, mentre parla al proprio telefono, possa rivelare informazioni sensibili che finiscono sui server Apple.
- Prendi questo, Apple !: Samsung ha lanciato il suo nuovo smartphone Galaxy X III a Londra questa settimana, e mentre il suo grande touchscreen sta suscitando molta attenzione, presenta anche un nuovo software di riconoscimento vocale e del viso.
- Fai quello che dico, non quello che faccio: e Samsung non si ferma qui. Recentemente ha presentato una domanda di brevetto per un robot che capisce il linguaggio umano. Il robot sarebbe in grado di regolare le sue capacità di "ascolto" per tenere conto del rumore ambientale che potrebbe interrompere o interrompere i comandi impartiti. Sarebbe anche in grado di riconoscere chi ci sta parlando, anche se il rumore di fondo è molto forte.
Bonus infografico: pensi che la tua auto sia ora informatizzata. Attendi che sia completamente collegato a Internet. Scopri cosa può fare un'auto connessa.