Emma Watson che recita il Mein Kampf? Un simulatore vocale sta facendo dire frasi razziste alle celebrity
Ma cosa mai potrà succedere se si butta in pasto al pubblico una nuova tecnologia che replica fedelmente le voci di chiunque? Quello che capita ogni volta: la parte più oscura del web genera tutte le brutture possibili. E così Emma Watson recita il Mein Kampf. A gennaio EvenLabs, un’azienda del Regno Unito fondata da ex membri dello staff di Google e Palantir, ha pubblicizzato per la prima volta la sua Prime Voice Ai, un software open beta text-to-voice capace di replicare la voce di chiunque ascoltando pochi secondi di campioni audio.
Gli utenti possono iscriversi rapidamente al servizio e iniziare a generare voci. L'azienda offre anche la "clonazione professionale", in grado riprodurre qualsiasi accento, tono, e cadenza. Sono bastate poche settimane, poi gli utenti hanno cominciato a segnalare un fenomeno in realtà già visto, il deepfake. In poche parole sono state usate le voci di personaggi famosi per trasmettere messaggi razzisti e violenti.
I deepfake vocali
Pochi giorni fa, su 4Chan, un utente ha pubblicato una clip di Emma Watson che legge un passaggio di Mein Kampf. Poi la voce di Ben Shapiro che lancia commenti razzisti su Alexandria Ocasio-Cortez, e Rick Sanchez della serie animata Rick & Morty che dice: “Picchierò mia moglie Morty. Picchierò la mia fottuta moglie Morty. La picchierò a morte, Morty". Justin Roiland, che dà la voce a Sanchez, è comparso di recente in tribunale per un'udienza preliminare con l'accusa di reato di violenza domestica. Le clip spaziano dall'innocuo, al violento, al transfobico, all'omofobo, al razzista, dentro il frullatore fake sono finiti anche personaggi anime e di videogiochi.
Il commento di ElevenLabs
EvenLabs ha twittato ”Weekend folle, grazie a tutti per aver provato la nostra piattaforma beta. Mentre vediamo che la nostra tecnologia viene applicata in modo schiacciante per un uso positivo, vediamo anche un numero crescente di casi di uso improprio della clonazione vocale". ElevenLabs ha aggiunto che sta esplorando ulteriori misure di sicurezza, "queste includono la richiesta di informazioni, di pagamento o identificazione dell'ID completo".
L'azienda ha appena ricevuto 2 milioni di dollari in finanziamenti da Credo Ventures. Per questo stava pensando di investire sulla nuova tecnologia e ampliare il servizio. Per esempio sostituire i narratori degli audio libri con le voci prodotte dall’intelligenza artificiale, oppure automatizzare le voci per leggere gli articoli e creare audio per i videogiochi. Le segnalazioni degli utenti mettono di fronte alle ambizioni di ElevenLabs alcuni ostacoli.
Gli altri programmi che imitano le voci
Non è l’unica, Microsoft sta investendo su VALL-E, capace di imitare perfettamente il timbro, il tono e l’emotività di ogni parlato. E riesce a farlo ascoltando solo 3 secondi di audio. Ma gli sviluppatori hanno pubblicato solo un documento dimostrativo spiegando che, senza adeguate protezioni, VALL-E potrebbe diventare un problema. E ElevenLabs ne è la dimostrazione. Tutto il caos che già ruota intorno alle tecnologie deepfake non può che essere alimentato da audio ultra realistici.
Il problema è già stato preso in considerazione, pochi mesi fa, a ottobre 2022, quando il Garante per la protezione dei dati personali ha aperto un’istruttoria nei confronti della società dell’app Fakeyou, in grado di riprodurre file di testo mediante voci false, ma realistiche, di personaggi noti, anche italiani.