Cloud Text-to-Speech: così Google migliora la sintesi vocale rendendola reale

27 Marzo 2018 9

Google ha tutte le intenzioni di migliorare ulteriormente il proprio sintetizzatore vocale basato sull’intelligenza artificiale da utilizzare sui propri dispositivi. Il servizio si chiama Cloud Text-to-Speech ed è stato implementato dalla sussidiaria britannica DeepMind attraverso il software WaveNet. Lo strumento basato sul machine learning sarà messo a disposizione di tutti gli sviluppatori che necessitano della sintesi vocale da integrare all’interno di app, siti e assistenti virtuali.

È la prima volta che Google sfrutta DeepMind per la realizzazione di un prodotto “tangibile”, considerando il fatto che dal 2014 - anno della sua acquisizione - ad oggi erano stati sfruttati i suoi algoritmi per la riduzione dei costi dell’elettricità presso i data center di Google (ottenendo un considerevole -40 per cento) ed erano stati sviluppate soluzioni sperimentali nel campo dell’assistenza sanitaria. Ora finalmente il know-how di DeepMind viene applicato integrando il software WaveNet all’interno dei servizi basati sul cloud, confidando di entrare in diretta competizione con gli analoghi servizi di Amazon e Microsoft.

La tecnologia utilizzata da DeepMind, basata sull’intelligenza artificiale, utilizza il machine learning per generare l’audio “da zero”, differenziandosi dunque da altri sintetizzatori vocali (tra cui Siri) che sfruttano la cosiddetta sintesi concatenativa, dove il programma memorizza singole sillabe mettendole insieme per formare parole e intere frasi. Secondo quanto riportato da Google, il modello è 1000 volte più veloce e produce 20 secondi di audio ad alta qualità in appena 1 secondo: basti pensare che la versione originale di WaveNet impiegava 1 secondo per creare 0,02 secondi di audio.

La nuova generazione si affida ad un database di enormi dimensioni ricreando frasi ad una velocità di 24 mila campioni per secondo, accenti inclusi. Cloud Text-to-Speech offrirà 32 diverse tipologie di voce in 12 lingue.

Di seguito vi facciamo sentire la stessa frase riprodotta da un sintetizzatore vocale di terze parti e da quello sviluppato da DeepMind:


9

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
Gianni

Ma tra le 32 lingue c'è l'italiano? In questo sito di google dove sono presentate diverse lingue non c'è l'italiano nell'elenco (https:// cloud . google . com / text-to-speech/)
Non ho voglia di registrarmi al servzio, anche se gratuito..qualcuno può confermare che ci sia l'italiano e magari postare qualche esempio?

ErCipolla

Intanto però la voce italiana pare ancora l'annunciatore di trenitalia.... spero applichino questa tecnica anche da noi.

pax2011

Ho google home mini da alcune settimane, anche se è arrivato in italiano continuo a tenere l'inglese... Il primo motivo è proprio la voce totalmente finta in italiano, altro motivo è la momentanea mancanza di funzioni.

Anal Natrak

1000 volte più veloce DI COSA? Di se stesso.
L'inglese va capito se si vogliono tradurre articoli.

maxforum

Al momento uso Google assistant solo per puntare la sveglia e per farmi raccontare delle barzellette che sanno di freddure anni 80 tremende.. Speriamo migliorino

delpinsky

C'è il video dell'architetto che prova il Google Home alla sede Google di Milano e la voce computerizzata dell'assistente è da suicidio. Quindi speriamo che si arrivi all'uso di queste voci più realistiche, allora sì che è un piacere interagire con l'assistente vocale.

davidemo89

Il tipo che parla? Nah è fatto abbastanza bene

Massimino_Di_Quarto

"Ok Google, aggiungi pomodori alla lista della spesa"

"Ti sto f0ttendo i dati, attendi prego"

"Minghie che naturalità"

delpinsky

Se finalmente renderanno l'audio in Italiano così naturale, mi compro il Google Home! perché attualmente fa ridere il text-to-speech in italiano, non si può ascoltare.

Copertura 5G, a che punto siamo davvero? La nostra esperienza in città

Spotify, Apple Music e gli altri: chi vincerà sul ring dello streaming musicale?

Xiaomi 11T ufficiale con Pro, 11 Lite NE e Pad 5. PREZZI e disponibilità Italia

Internet down: migliaia di siti offline, tra cui Amazon e Twitch | Cos'è successo