L'AI di Google impara a isolare una voce in un ambiente affollato

13 Aprile 2018 87

Google ha sviluppato un metodo per permettere a un dispositivo elettronico di isolare la voce di una persona in un ambiente rumoroso e/o affollato semplicemente guardandola in faccia. Ci è riuscita con l'intelligenza artificiale, naturalmente.

I ricercatori hanno prima insegnato all'AI a tracciare il volto della persona mentre parla da sola, anche se questo è coperto parzialmente da mani, microfoni e altri oggetti; poi hanno ricreato dei gruppi virtualmente, hanno aggiunto del rumore di sottofondo, e il computer ha imparato, man mano, a separare la voce della persona interessata da tutto il resto. La ricerca è accompagnata da questo video dimostrativo, decisamente impressionante (altri nel link in FONTE):

Ora che la fase di ricerca si è conclusa, Google deve trovare un impiego pratico alla tecnologia nei suoi prodotti e servizi. Ma non è difficile immaginarne a dozzine: Google Home (ma in generale qualsiasi device ad attivazione vocale) che riconosce bene i comandi anche durante un film o una festa, migliori chiamate vocali su Duo e conferenze su Hangouts, possibilità di isolare una voce o uno strumento in un video concerto su YouTube - funzione che può anche essere interpretata in ottica accessibilità.

Certo è che, per contro, le implicazioni per la privacy possono essere un po' preoccupanti - specialmente se si rapporta la tecnologia a un sistema di videosorveglianza, unita a un po' di microfoni di buona qualità, in luoghi pubblici.

Fotocamera al top e video 4K a 60fps con tutta la qualità Apple? Apple iPhone 8 Plus, in offerta oggi da Phone Strike Shop a 670 euro oppure da Amazon a 732 euro.

87

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
Maxim Castelli

Bravissimo, proprio loro.

Walter

Stati uniti d'america.

Maxim Castelli

Con suolo americano s'intende gli USA.

Pip

Io sono più per "Terre oltre le colonne d'Ercole"

Walter

Sarebbe pìù corretto chiamarlo "Nuovo mondo", anziché America.

Alessandro

Faccio la stessa cosa, con tutti i suoi account.

efremis

Viene ripreso continuamente per errori anche di conoscenza della lingua italiana. Ma preferisce fare il difensore della patria...

Maxim Castelli

Ti ho votato perché hai ragione. Grazie davvero.

Fabyo

Ma in italiano ha un significato diverso da modificare.

borkiez

non per contraddirti ma "editare" viene dal latino ed è una parola italiana

TeoCrysis

Io ho l'avvio automatico di siri, ma non si è mai acceso per sbaglio.

Maxim Castelli

"Non esiste"..beh, ti sei già ridicolizzato a sufficienza.

Vermillion

Mamma mia, brividi di sviluppo. Chissà come la useranno questa feature.....

Piedi rosei

Ah sei uno di quelli che rompre la minchi@.
Non esiste la parola in italiano per fake, se la trovi non esprime a pieno il concetto e/o non ha lo stesso effetto.

Maxim Castelli

Oppure non ci si adegua come i pecoroni, ma utilizziamo le nostra lingua. Sei abbastanza orgoglioso da riuscirci?

Word_Life

Non è moda, capretto.
Usare OS al posto di SO è moda?
Lo è usare la parola "Notch invece di "Tacca"? O forse letteralmente tutto il mondo lo chiama notch, e quindi ci si adegua pure qui, invece di fare i grandi cultura del nulla.

Maxim Castelli

Modificare.

Maxim Castelli

Non ti veniva la parola italiana, intendo..?

E K

Hai ragione, me ne ero dimenticato.

Maxim Castelli

Perlomeno non mi vergogno di essere italiano, come invece palesi tu.

Maxim Castelli

Sei un grande!

Maxim Castelli

Pip

INNESCATO

Piedi rosei

In un ambiente affollato e con la musica più alta del brusio il riconoscimento è semplice, così come riconosceresti tu una canzone, quindi che c'è di strano se può farlo un software?

stiga holmen

In un ambiente affollato riconoscere la musica di un brano è sbalorditivo eccome.
Una persona ha la propria cadenza, ritmo, timbro, etcc tutte informazioni che possono essere prese come si fa per un brano.

sassi

magari ora si riesce a trovare una VOCE a sanremo

Pip

INNESCATO

Pip

Maxim, i punti di sospensione...

Pip

Sembra che tu abbia qualcosa contro i punti di sospensione.
Usare due punti al posto di tre è un errore, non inserire uno spazio dopo averli usati è un errore.
Senza contare l'uso improprio che ne fai. La frase: "E poi..forse non tutti sanno che...il nostro cervello è così meraviglioso che non ha... " non ha assolutamente bisogno dei punti di sospensione.

Maxim Castelli

Tra parlare italiano antico e buttare nel mucchio obbligatoriamente per moda parole inglesi c'è una zona gigantesca in mezzo: si chiama intelligenza semantica.

Maxim Castelli

Parli di estero ma..siamo in un sito italiano, scrittori italiani, lettori italiani, in Italia.
E poi..forse non tutti sanno che...il nostro cervello è così meraviglioso che non ha nessuna difficoltà nell'imparare due lingue e usarle senza mescolarle tra di loro, creando obbrobri linguistici, senza essere necessariamente universitari.

turbognu

Certo certo nel tuo mondo fatato si, ma da fuori sei bello invasato :P

Dea1993

kernel panic e BSOD.
anzi.. praticamente con quella lista gli hai fatto un DDoS al cervello, rimarrà offline per un po

Dea1993

ovvio hanno un software con interfaccia grafica, senza form di input, ma loro iniziano a digitare caratteri su caratteri, per poi dare l'OK e magicamente hanno il risultato pronto xD

Piedi rosei

Si perché gli parli da vicino. Lascia attivo il riconoscimento ok google e vedrai quante volte parte da solo in un ambiente affollato o semplicemente guardando la TV

I'm Simone

La "best feature" di Disqus.
https://uploads.disquscdn.c...

Piedi rosei

Lo scrivo poco dopo la parola fake

Piedi rosei

La forma d'onda di una musica è diversa dal parlato. Quindi in quel caso non c'è niente di sbalorditivo

talme94

Guarda che il commento in cui hai commesso l'errore si può editare

Maxim Castelli

Poco male. Perlomeno sono un italiano felice d'esserlo.

ghost

La cosa più bella è che il mouse non lo usano quasi mai e che c'è un'interfaccia grafica che mostra le elaborazioni del computer (cosa che non ha senso e non serve xD)

turbognu

Ma infatti la novità della cosa è proprio separare le voci mischiate anche se sovrapposte in frequenza.

Code_is_Law

Sicuramente

turbognu

Sei proprio sfigato XD

Word_Life

Se abbiamo fortuna leggendo quella lista va in crisi per un paio d'ore.

Dea1993

omg!!! what did you do?? are you crazy??
I've blocked him... so i can write in english without read his comments :D

forse se lo bloccassimo tutti, e lui si ritrovasse a parlare da solo, se la smetterebbe di rompere le scatole

Code_is_Law

Ci sono ben altri i modi in cui qualcuno dimostra di mantenere la cultura e la vena italiana e fra questo non è sicuramente la lingua . Già fun troppo l’Italia è indietro con l’adozione dell’inglese . Infatti i neolaureati universitari che vanno all’estero spesso si ritrovano spesati e non mostrano al massimo le proprie capacità perché durante gli anni di università hanno esercitato poco l’inglese . L’inglese è il veicolo di comunicazione adottato dalla maggior parte delle nazioni e diffondere pensieri secondo i quali bisogna limitare al massimo il suo uso è assolutamente sbagliato . Se usi certi termini in inglese non minacci la cultura italiana . Vorrei proprio vederti nel campo dell’elettronica o informatica a comunicare usando solo termini italiani e poi a farti capire all’estero

yessa772

Individua anche chi e l autore di una scorregia?

Word_Life

Guarda che quello che si scandalizza a tal punto di dover scrivere ogni volta un commento in merito ogni volta che vede una parola inglese sei tu.
Forse non capisci che il tempo passa, delle parole passano in disuso ed altre parole diventano parte del parlato comune.
Per fortuna che in pochi fanno i tuoi contorti ragionamenti, o parleremmo tutti come nel '400.

Adeguarsi non vuol dire mettersi a 90, capiscilo.

Dea1993

csi viene dal futuro.
loro riescono anche a ricavare da uno scatto mosso, sfocato, rovinato, pixelloso, e distante 6km, un'immagine altamente dettagliata, nitida e in alta risoluzione, in 4-5 secondi di elavorazione xD

Quanto è utile una ciabatta SMART? Ecco perchè comprarla | Video | #BESTBUY

Il miglior cavo per ricarica e trasferimento dati | Video | #bestbuy

Effetto Iliad: le migliori tariffe degli altri operatori concorrenti entro 10 euro | Video

Come e perché smaltire rifiuti tecnologici: lunga vita al bidone barrato #report