video suggerito
video suggerito
Intelligenza artificiale (IA)

Come far cantare a Gerry Scotti una canzone di Natale usando l’intelligenza artificiale

Per clonare la voce basta utilizzare i modelli text to speach in grado di imitare il timbro di chiunque ascoltando un audio di tre secondi. Per realizzare Gerry Christmas, però, è stato necessario l’intervento umano.
A cura di Elisabetta Rosso
4 CONDIVISIONI
Immagine
Attiva le notifiche per ricevere gli aggiornamenti su

Qualsiasi cover è stata cantata da Gerry Scotti. Da quando sono stati lanciati i modelli machine learning text-to-speech, in grado di imitare la voce di chiunque in modo credibile, il presentatore per qualche strano motivo è diventato il feticcio degli utenti su TikTok. Hanno utilizzato l'intelligenza artificiale (IA) per clonare la sua voce e fargli cantare Billie Jean, The Real Slim Shady, Cenere, Take on me. La lista è lunga. E così Scotti ha deciso di pubblicare per Natale un album creato con l'intelligenza artificiale "Gerry Chirstmas". Tra i grandi classici All I Want For Christmas Is You, Jingle Bells, Last Christmas, Jingle Bells, Santa Claus is coming to town e Feliz Navidad. "Non tutto è stato fatto con l'IA usata solo dove non arrivavo con la voce, per farmi più intonato. Feliz Navidad, per esempio, m'è venuta bene, l'AI è intervenuta poco, mentre un bell'esempio del suo intervento è su All I want for Christmas is You, anche perché ci sono troppe differenze rispetto all'originale" , ha spiegato Scotti.

"Per Feliz Navidad il problema è che non avevano un mio parlato in spagnolo, quindi mi hanno fatto leggere la Gazzetta dello Sport in spagnolo e canticchiare Josè Feliciano. In generale la mia preferita è Driving home for Christmas di Chris Rea, la meno famosa, l'ho messa per ultima e tra l'altro è quella che m'è venuta meglio, è quella in cui l'IA è intervenuta meno ed è quella cui i contenuti mi piacciono di più."

Gerry Christmas: come è stato registrato l'album di Natale

L'album natalizio di Gerry Scotti è stato creato utilizzando sia sue registrazioni in studio, sia l'intelligenza artificiale. "Al milionesimo tentativo di imitazione, invece che accendersi la lampadina mi si è accesa la lampadona. Ho detto: ‘Ma scusate, la faccia è la mia, Gerry Christmas è un augurio con cui io mi firmo e sfrutto l'assonanza da alcune stagioni. Ma perché invece che farmelo fare da qualcun altro non facciamo noi un album di Natale con dentro 10 grandi standard natalizi?". Per farlo è stato aiutato dai Thousand Gerry, "due geni dell'intelligenza artificiale, due ragazzi siciliani che già mi pubblicano quasi ogni giorno su TikTok e su Instagram: hanno l'obiettivo di pubblicare almeno mille versioni diverse di me, siamo arrivati a 300 e penso che ancora per due anni e mezzo andrò avanti".

L'intelligenza artificiale quindi fa solo un piccola parte del lavoro. Il disco infatti è stato prodotto da Lucio Fabbri, che ha curato anche gran parte della realizzazione dei brani, e "tra i nomi di chi ha suonato nel disco ci sono quelli di persone meravigliose che suonano nei festival più importanti e li trovate anche nei dischi di Ramazzotti, della Pausini, di tutti i più grandi italiani. Ho persino ritrovato nei cori il mio amico Chuck Rolando, che negli anni 70 faceva parte dei Milk & Chocolate", ha spiegato Scotti.

Come clonare la voce con l'IA

Il processo per clonare la voce è abbastanza semplice, si sceglie il brano e poi attraverso un software che sfrutta l'intelligenza artificiale generativa si sostituisce la voce originale con quella di qualsiasi altro artista. I modelli di machine learning text-to-speech consentono di ottenere il parlato o il cantato manipolando forme d’onda, sono così in grado di generare in pochissimo tempo la voce di chiunque senza snaturarla.

Non solo, l'IA riesce anche a replicare il tono emotivo del parlato, e imitare l'ambiente acustico dell'audio campione. Quindi, se la voce registrata proviene da una telefonata, l’IA sarà in grado di riprodurre le caratteristiche acustiche, per esempio la voce metallica filtrata dagli altoparlanti di uno smartphone, lo stesso vale per un concerto live o uno studio di registrazione. Tutto questo è possibile facendo ascoltare solo pochi secondi dell'audio che l'IA deve imitare.

4 CONDIVISIONI
483 contenuti su questa storia
autopromo immagine
Più che un giornale
Il media che racconta il tempo in cui viviamo con occhi moderni
api url views