https://frosthead.com

Come il GPS impara a parlare la tua lingua

Karen Jacobsen, cantante e doppiatrice australiana, ha ottenuto il concerto nel 2000, subito dopo essere arrivato a New York. I produttori - i tipi corporativi - la mandarono in uno studio di registrazione per tre settimane, dove trascorreva quattro ore al giorno a dire cose come "al prossimo incrocio, girare a sinistra" e "ricalcolare". Alla fine, non era la sua voce quello era teso. "Ho detto 'circa' circa 186 volte", ricorda Jacobsen. "Questo genere di cose può farti impazzire."

Contenuto relativo

  • Da Tolomeo al GPS, la breve storia delle mappe

Due anni dopo, ricevette una telefonata da un'amica. "Karen" sbottò il suo amico. “Ho comprato a mio marito una di quelle nuove cose GPS e l'abbiamo messa sulla voce australiana. Sei tu! ”Ecco come Jacobsen ha scoperto che la sua voce dava indicazioni a 400 milioni di persone in tutto il mondo.

Il suo lavoro mette in luce l'ibrido di sangue e tecnologia che si inserisce nelle voci ormai onnipresenti che ci dicono dove rivolgersi: Più di un miliardo di persone si affida a Google Maps ogni mese e l'80% attiva l'opzione vocale.

Agli inizi della sintesi vocale - si pensi ai suoni robotici di un Speak & Spell di fine anni '70 - un algoritmo ha convertito il testo in un flusso monotono. Quindi, man mano che i database crescevano, potevi registrare un doppiatore come Jacobsen che pronunciava un corpus di sillabe e parole, che gli algoritmi avrebbero combinato e alterato secondo le regole di base. Più recentemente, i programmatori di software di aziende come Nuance, che progetta interfacce di navigazione per automobili, hanno sviluppato un terzo approccio: applicare l'apprendimento profondo alla sintesi vocale. Mescola parole registrate e frammenti sintetizzati, basandosi sull'intelligenza artificiale per rendere la pronuncia ancora più umana. "Sembrano incredibilmente naturali", afferma Vlad Sejnoha, Chief Technology Officer di Nuance.

Naturalmente, le stranezze linguistiche rimangono una sfida per i sistemi vocali. "Pensa 'ramo' contro 'comprato', o 'leggi' contro 'leggi'", dice un portavoce di Google. "Ma si spera che l'utente possa sempre indovinare cosa intendevamo". Ora che l'IA insegna ai sistemi di navigazione per auto a parlare in modo più intelligente, poi cercherà nel mondo online e capirà dove vuoi andare anche prima di te.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Abbonati alla rivista Smithsonian ora per soli $ 12

Questo articolo è una selezione del numero di luglio / agosto della rivista Smithsonian

Acquistare
Come il GPS impara a parlare la tua lingua