https://frosthead.com

Come costruire una voce umana

Una delle voci più riconoscibili al mondo appartiene a Stephen Hawking, anche se, ovviamente, non è affatto la voce del famoso scienziato, ma una generata al computer in risposta ai suoi movimenti facciali. Sta usando un sintetizzatore per parlare da quasi 25 anni, la sua voce e la sua capacità di muoversi perse molto tempo fa per la SLA o la malattia di Lou Gehrig. Oggi l'astrofisico britannico viene identificato attraverso il suo monotono robotico, che in realtà ha un accento americano.

Ma la verità è che Hawking condivide quella voce generata dal computer con migliaia di altre persone, alcune ragazze, alcune donne anziane e altre di tutte le età ed etnie in tutto il mondo. Tutti loro, incapaci di parlare in modo naturale, la pensano come propria, anche se non c'è nulla di unico al riguardo.

E questo non sembra giusto a Rupal Patel.

Patel è un logopedista e direttore del nuovo Center for Speech Science and Technology presso la Northeastern University. Per molto tempo ha sentito che una voce aiuta a definire un individuo; modella chiaramente come una persona è conosciuta nel mondo. Anche se le persone non possono parlare, dice, non dovrebbero avere l'opportunità di comunicare attraverso voci che sono più vere per chi sono?

Da diversi anni, lei e il collega logopedista Tim Bunnell hanno sviluppato un modo per costruire voci su misura usando come essenza qualunque suono una persona possa emettere. Si concentrano sul tono e sul volume di quei suoni e anche su come la persona può pronunciare determinate lettere, come "ss" o "ch". L'obiettivo è quello di concentrarsi sull'identità di una voce il più possibile.

Quindi si tratta di costruire una nuova voce, una con molta più chiarezza, raccogliendo suoni da un donatore di genere, età, dimensioni e background geografici simili. Per donare una voce, viene registrata una persona che legge una selezione di frasi brevi che coprono cumulativamente ogni combinazione di suoni in una lingua. Idealmente, registra fino a 3.000 frasi diverse. Questo richiede ore. E mentre la registrazione non deve avvenire in una singola sessione, più suoni può fornire un donatore, migliore sarà la produzione di una voce.

Da quella raccolta di suoni, un software appositamente progettato crea parole con una voce retroingegnerizzata simile a quella che una persona potrebbe sembrare se non avesse un disturbo del linguaggio.

È scalabile?

Non ci vorrà un esercito di donatori non così piccolo che legge un numero enorme di frasi per costruire un database di suoni che possono essere trasformati in voci personalizzate?

Si lo farà, Patel dice in un recente discorso TED, motivo per cui sta spingendo avanti con quella che chiama l'Iniziativa Human Voicebank.

Il sito web del progetto, VocaliD.org, ha sia una pagina di iscrizione per i donatori che un'altra per coloro che sperano di ottenere una voce personale. Questi ultimi devono presentare i loro nomi e altre informazioni rilevanti come la loro capacità di parlare, che può variare da "completamente non vocale" a "può fare suoni ma non parole" a "può usare alcune parole per la comunicazione".

Mentre solo una manciata di voci sono state effettivamente create durante l'infanzia del progetto, oltre 10.000 persone si sono già offerte volontarie per essere donatrici di voci, afferma Patel. "Diverse centinaia" altri, dice, si sono registrati per ottenere nuove voci.

Tuttavia, ci sono diversi ostacoli che la banca vocale deve affrontare, tra cui Patel, facendo in modo che i donatori leggano tutto il materiale necessario per costruire una voce. Tale sfida è ancora maggiore se si considera che, al momento, i volontari devono registrare in uno studio professionale per garantire agli scienziati campioni di alta qualità. Patel afferma che si stanno sviluppando strumenti che consentirebbero ai donatori di registrare le loro sentenze a casa.

La sua visione è quella di raccogliere un milione di diversi campioni vocali entro il 2020. Ma già il suo lavoro sta avendo un impatto. Il sito presenta un file audio, lungo solo due frasi, fornito da una giovane donna descritta come affetta da "grave compromissione della parola". Le sue parole sono chiare come il giorno:

“Questa voce è solo per me. Non vedo l'ora di provarlo con i miei amici. ”

Ecco Rupal Patel che spiega l'Iniziativa Human Voicebank in una conferenza TED:

Sentire voci

Ecco una ricerca più recente sull'effetto delle voci:

  • Ascolta tua madre: solo il suono della voce di una madre può far mangiare meglio i bambini prematuri, secondo uno studio pubblicato su Pediatrics. Con l'uso di ciucci dotati di sensori, i ricercatori dell'ospedale pediatrico Monroe Carell di Nashville hanno premiato i bambini che succhiavano correttamente le registrazioni delle loro mamme che cantavano ninne nanne. I bambini dello studio che hanno usato i succhietti speciali - e hanno sentito la voce della loro mamma - sono stati in grado di uscire dai tubi di alimentazione una settimana prima di quelli che non lo facevano.
  • Benvenuti nella camera dell'eco: ricerche precedenti hanno suggerito che le persone preferiscono le voci che sembrano provenire da donne piccole o uomini di grandi dimensioni, ma un nuovo studio dell'Università della British Columbia sostiene che ciò che ci piace davvero sono voci che suonano come le nostre, in particolare quelli che hanno accenti con cui abbiamo familiarità. I ricercatori hanno anche affermato che le persone sembravano preferire le voci degli uomini che usavano parole più brevi e le donne che suonavano senza fiato.
  • Gli elefanti non dimenticano mai una voce: apparentemente gli elefanti africani sono abbastanza bravi ascoltatori. Secondo uno studio di due anni in Kenya, sono in grado di distinguere le voci umane per genere, età e persino gruppo etnico. I ricercatori hanno registrato uomini, donne e bambini Maasai che urlavano e lo suonavano su un oratore nascosto da branchi di elefanti. Solo quando gli animali hanno sentito la voce di maschi adulti Maasai - il gruppo con cui è molto più probabile che gli elefanti abbiano degli scontri - hanno reagito, stringendosi in modo protettivo attorno ai polpacci. Non hanno risposto alle voci di uomini adulti di un'altra tribù, i Kamba, che, come agricoltori, raramente entrano in conflitto con le mandrie.
  • Sentono il tuo dolore: dopo aver completato una serie di scansioni cerebrali sui canini, gli scienziati scozzesi affermano che i cani sono come umani in quanto hanno un'area del loro cervello dedicata al riconoscimento e all'interpretazione delle voci. E questo, dicono i ricercatori, è il motivo per cui il tuo cane può sembrare così sintonizzato sui tuoi sentimenti.
  • Sapevo che c'era qualcosa di diverso in te: la chirurgia plastica non cambia solo il tuo aspetto; potrebbe anche cambiare il modo in cui una persona suona. Secondo un articolo pubblicato sulla rivista Plastic and Reconstructive Surgery, i ricercatori in Iran hanno scoperto che i pazienti che avevano rinoplastica o lavori al naso, spesso pensavano che le loro voci suonassero più nasali dopo la procedura.
Come costruire una voce umana