John Lennon tra qualche mese tornerà a cantare con Paul McCartney. È tutto vero ed è possibile grazie all’intelligenza artificiale, che ha campionato la sua voce per poter incidere un brano inedito.
La voce. La tonalità, l’intonazione, il timbro e il ritmo conferiscono all’individuo l’unicità. L’identikit vocale permette di distinguere una persona da un’altra, ma la voce può subire una trasformazione, «diventare rumore se perde il suo tratto distintivo». Giuseppe Corasaniti, professore di intelligenza artificiale, machine learning e diritto all’università Luiss Guido Carli di Roma, è stato il magistrato che si è occupato della causa di plagio che il cantante Albano Carrisi intraprese contro Michael Jackson. «Ho risolto il caso ascoltando il file audio che era identico».
Da allora la tecnologia è cambiata – la sintesi vocale generata dall’IA vede la voce artificiale riprodurre il parlato di chiunque – ma resta una costante: l’uomo con la sua non barattabile intelligenza e sensibilità deve guidare la macchina, preservando e difendendo l’individualità. L’ascolto attentivo che percepisce le variazioni di tono e di struttura e l’analisi comparativa delle registrazioni audio possono rilevare la paternità di un’opera. È l’immersione nella musica che consente di rilevare le differenze tra due composizioni, all’apparenza identiche.
Un ascolto scrupoloso che potrebbe essere evitato, se il contenuto generato con IA fosse segnalato come tale. È il tema dell’AI Act dell’Ue, appena approvato, che ci fa capire come è importante avere un contenuto che sia etichettato. «La voce dell’attore Vittorio Gassman viene riconosciuta, ma ci sono le imitazioni che anche se inoffensive ci permettono di capire come possiamo ottenere due voci molto simili, una sovrapposizione di suoni». Con i dati, l’intelligenza artificiale viene addestrata, l’IA Generativa procura contenuti che sembrano veritieri, come testi, video, immagini e musiche. «C’è il pericolo dei deep-fake» – interviene Nello Cristianini, informatico e professore di intelligenza artificiale all’università di Bath – «la riproduzione delle sembianze di qualcuno, per esempio in immagine, video o in audio».
L’AI VALLE-E di Microsoft può replicare una voce in tre secondi di ascolto. Continua Corasaniti: «La voce campionata può essere oggetto di riproduzione, come è accaduto in Guerre Stellari agli attori che non ci sono più». Cristianini conclude: «Quando si possono replicare le sembianze di qualcuno ci sono tre tipi di rischio di abuso: furto dell’identità, misinformazione, copyright».
«Bisognerebbe estendere il diritto d’autore dal contenuto creato dagli esseri umani anche a quello riprodotto dal sistema IA. Il fischio è una sfumatura della voce. Tutelarlo attraverso il diritto d’autore significherebbe salvaguardare una specifica caratteristica dell’esser umano, non si può parlare di furto di identità. L’identity theft, il furto di identità ha poco potere, perché è relativo al controllo e alla protezione delle informazioni personali, all’identità digitale. Pensiamo al profilo fake che attira gli utenti. Un tema diverso è il diritto di proteggere le opere creative», spiega Corasaniti.
Dalla doppiatrice irlandese Remie Clarke si è ritrovata in un sito di voci sintetizzate al cantautore Paul Mccartney che ha autorizzato un nuovo brano dei Beatles creato con l’intelligenza artificiale, è necessario riflettere sull’uso che si vuole fare del contenuto. «Due sposi che non possono permettersi di viaggiare – termina Corasaniti – possono generare foto con uno scenario surreale. Si trasportano virtualmente in mezzo al deserto, provando emozioni in modo verosimile». Creare o distruggere dipende solo dall’uomo.
Leggi anche: Se l’IA entra nella tua testa e previene il crimine