L’emozione non ha voce (artificiale)

Voice cloning, opt-out e nuove tutele: il doppiaggio italiano davanti alla sfida dell’AI

«Papà, ma è un robot che parla?» A chiederlo è una bambina di nove anni seduta sul sedile posteriore di un’auto, con il cellulare del padre stretto tra le mani. Sullo schermo scorre un video doppiato dall’intelligenza artificiale. Daniele Giuliani, presidente dell’Anad, l’Associazione Nazionale Attori Doppiatori, ricorda questa scena con un sorriso. Sua figlia ha capito subito che quella voce non apparteneva a un essere umano. Una reazione istintiva, che racconta molto sul futuro del doppiaggio: non basterà che una macchina impari a imitare un timbro umano, dovrà riuscire a convincere davvero l’orecchio di chi ascolta.

Oggi a un software bastano pochi minuti di audio pulito per costruire il modello matematico di una voce. Il procedimento tecnico si chiama voice cloning (clonazione vocale): l’algoritmo scompone l’onda sonora, ne analizza frequenze, inflessioni, cadenza, respiri. Poi, è sufficiente digitare un testo perché il sistema lo restituisca in formato audio, replicando l’identità vocale in più lingue e sincronizzandola con il movimento delle labbra sullo schermo. Il passaggio critico è l’addestramento. Per imparare a simulare un pianto, una risata o l’incrinatura emotiva di una battuta, i sistemi devono prima immagazzinare enormi quantità di parlato, spesso estratte da film, serie televisive e contenuti online. Le voci dei doppiatori si trasformano così nella materia prima con cui vengono istruite le macchine. Fino a poco tempo fa, quasi sempre senza consenso né compenso.

Un limite è stato tracciato a metà del 2024. Grazie a un accordo tra l’Anad e le principali case di produzione di Hollywood e dello streaming – da Sony a Netflix, fino a Disney, Universal e Warner Bros – nei contratti di cessione dei diritti è stata inserita una clausola che vieta l’utilizzo non autorizzato delle voci per l’addestramento dei sistemi di intelligenza artificiale. Una tutela che si allinea al diritto di opt-out – la facoltà di opporsi – previsto dall’AI Act, il Regolamento europeo sull’intelligenza artificiale, permettendo agli artisti di negare formalmente lo sfruttamento della propria voce per il machine learning. Dal 2 novembre 2026 diventerà inoltre pienamente applicabile l’obbligo di filigrana digitale previsto dall’articolo 50 del regolamento: chiunque utilizzerà voci sintetiche per doppiare contenuti — dai creator sui social alle aziende — dovrà informare il pubblico con un’apposita etichetta.

Su questo fronte, l’Italia si è mossa con anticipo. La legge 132, entrata in vigore il 10 ottobre 2025, ha introdotto nel Codice penale il reato di diffusione illecita di contenuti generati o alterati dall’intelligenza artificiale. «In Danimarca avevano già scritto una bozza di legge sul tema», racconta Giuliani. «Me la sono fatta mandare, l’ho tradotta e l’ho portata all’attenzione delle istituzioni italiane. Poco dopo qui è arrivata una norma praticamente identica».

Visualizza questo post su Instagram

Un post condiviso da ANAD (@anad.doppiaggio)

Trasformare il furto di voce in un reato, però, non basta. «Esistono programmi che analizzano le onde sonore e verificano se una traccia coincide con l’originale depositata», spiega il presidente dell’Anad. «Ma se il file viene rallentato o abbassato anche solo di un semitono, non c’è alcuna certezza che il sistema riesca a riconoscerlo». Se chi lavora in sala di registrazione da anni individua una voce manipolata in pochi secondi, sul piano giuridico manca ancora un metodo standardizzato. «Si stanno facendo piccoli passi avanti, ma siamo troppo lenti rispetto alla velocità con cui evolvono queste tecnologie», osserva Valeria Vidali, doppiatrice e direttrice del doppiaggio con oltre trent’anni di carriera. «Finiremo sempre per rincorrerle».

Nel breve termine, però, Giuliani non vede un pericolo per i film destinati al cinema e alle piattaforme on demand. «Doppiare un lungometraggio per Netflix può costare tra i 16 mila e i 24 mila euro», precisa. Tempi produttivi complessi, continue modifiche ai dialoghi e necessità interpretative rendono ancora poco conveniente sostituire completamente il lavoro umano con quello algoritmico.

Il vero terreno di conquista dell’intelligenza artificiale è il flusso sterminato dei social network. Su YouTube vengono caricate ogni minuto più di 500 ore di video, circa 720 mila al giorno. Da aprile 2025 la piattaforma ha reso disponibile a tutti i creator un sistema di doppiaggio automatico multilingua, potenziato a febbraio 2026 con un aggiornamento capace di clonare anche l’espressività e il tono originale. Se a questo si sommano i reel di Instagram e i video brevi di TikTok, si arriva a decine di milioni di ore di contenuti pubblicati quotidianamente. È qui che le aziende tecnologiche stanno puntando, offrendo doppiaggi in tempo reale a pochi dollari. «Ecco perché, per il momento, non ci stanno mangiando», riflette Giuliani. «Per loro non siamo ancora abbastanza appetibili rispetto ai social».

Nel frattempo, le tutele hanno iniziato ad assumere anche forme individuali. Luca Ward – attore e doppiatore di Russell Crowe ne Il gladiatore e di Keanu Reeves in Matrix – è stato il primo artista in Italia a depositare il marchio sonoro della propria voce, per proteggerla da utilizzi non autorizzati. Una mossa di forte impatto mediatico che ha spostato il dibattito ben oltre le sale insonorizzate, fino a coinvolgere direttamente il pubblico. Per Giuliani, più che le leggi e i regolamenti, sarà proprio la risposta degli spettatori a determinare il futuro del settore: «Finora le reazioni ai primi esperimenti di doppiaggio artificiale sono state quasi sempre negative. Se costringi le persone a consumare un prodotto di bassa qualità, si ribellano. È il mercato, alla fine, a decidere tutto».

«Il nostro è un lavoro fatto di emotività», conclude Vidali. «La gente si affeziona a noi doppiatori perché ricreiamo sentimenti. Un algoritmo potrà anche replicare un suono che ricorda vagamente un’emozione, ma non potrà mai riprodurne davvero l’anima».

Cinema, doppiaggio, Intelligenza Artificiale

L’emozione non ha voce (artificiale)

In primo piano

«Il suo fumetto era poesia del dolore», è morta Marjane Satrapi

«Il cuoco dei Presidenti»: la storia di Pietro Catzola

Dal 1946 a oggi, il nonno della Repubblica

Esteri

«Con le nostre barche abbiamo sfidato il mondo»

Gli under 30 inglesi scelgono gli estremi

Il futuro di Budapest dopo la caduta di Orbán

L’Europa e il futuro della Sicilia con Leoluca Orlando

«Una città fantasma» nel sud del Libano

Podcast

TG

GR

Iscriviti a
Zeta Data Lab

L’emozione non ha voce (artificiale)

In primo piano

Esteri

Iscriviti alle nostre Newsletter

Podcast

TG

GR

Iscriviti a Zeta Data Lab

Iscriviti a
Zeta Data Lab