La tecnologia Text-to-Speech (TTS) rende ormai possibile il doppiaggio dei tuoi video a costi inferiori e l'intelligenza artificiale sta rivoluzionando il mondo del doppiaggio cinematografico.
Il text-to-speech è anche una valida alternativa al doppiaggio umano. Vedremo come funziona e come le sue pratiche sono utili ai progetti di doppiaggio video. Inoltre, analizzeremo lo tsunami he potrebbe provocare l’intelligenza artificiale nel mondo del cinema.
Come funzionano il doppiaggio umano e il doppiaggio assistito?
Il doppiaggio umano può essere realizzato con o senza sincronizzazione labiale o simil-sync. In entrambi i casi, si tratta di sostituire il dialogo di un contenuto audiovisivo con una nuova registrazione nella lingua di destinazione. Questa registrazione è effettuata da doppiatori professionisti il cui compito è quello di interpretare le traduzioni adattate, riproducendo i movimenti labiali dell’attore originale sullo schermo. I doppiatori eseguono generalmente il loro lavoro in uno studio di registrazione con il regista della produzione. L’obiettivo è quello di trasmettere accuratamente sfumature ed emozioni della traccia audio originale, sincronizzando così con naturalezza l’audio al video.
Il doppiaggio automatico (ovvero la sintesi vocale) si affida all’uso di algoritmi del deep learning per generare la versione doppiata di traduzioni audiovisive. Software come Sub2Dub© (dotati di numerose funzioni come l’inserimento di pause, intonazioni, l’assegnazione di una voce sintetica per riga…) consentono di usare i file di sottotitoli (contenenti quindi la sincronizzazione con i codici temporali) per generare una nuova traccia audio, ottenendo una versione doppiata del contenuto originale.
Quali sono i pregi e i difetti del doppiaggio umano?
Vantaggi del doppiaggio umano
Le registrazioni effettuate in studio assistite da direttore di set e artistico danno un risultato di alta qualità che trasmette accuratamente le emozioni e le sfumature del contenuto audiovisivo originale. I doppiatori sono professionisti dotati di una solida professionalità e di una comprovata esperienza, che consente loro di interpretare ogni ruolo. La qualità del doppiaggio, sia esso in simil-sync o in lip-sync, è autentica, soprattutto se la qualità delle traduzioni degli script è accurata:
- Alta qualità
- Voce naturale e autentica
- Interpretazione che trasmette emozioni e nuances emotive
Svantaggi del doppiaggio umano
Le registrazioni effettuate per il doppiaggio umano richiedono un notevole dispendio di tempo, in quanto comportano più sessioni di registrazione e un processo di post-produzione. L’ingaggio di attori doppiatori è oneroso così come il costo dei traduttori/adattatori che devono lavorare a monte. Il budget si amplifica qualora si tratti di doppiaggio multilingue.
- Workfow laborioso
- Registrazioni costose
- Disponibilità limitata di doppiatori
Rivoluzione in atto del doppiaggio sintetico
La sintesi vocale (doppiaggio con voci sintetiche) consente di realizzare doppiaggi a costi notevolmente inferiori rispetto a quello umano, in tempi molto brevi e con intonazioni modulabili secondo i contesti. Questo tipo di soluzione si credeva adatta solo per prodotti di e-learning o per i corsi di formazione universitaria, per alcuni tipi di documentari, per i video aziendali ed eventualmente per audiolibri. Invece, le cose stanno notevolmente cambiando. Il doppiaggio sintetico garantisce i tre seguenti vantaggi:
- Economicità
- Scalabilità
- Facilità di utilizzo
Le recenti exploit tecniche nell’utilizzo degli algoritmi del deep learning rendono possibile la riproduzione automatica di molte sfumature del dialogo umano, aggiungendo la giusta naturalezza richiesta. Grazie all’avanzare della tecnologia AI si possono utilizzare registrazioni vocali della durata di qualche ora per consentire all’algoritmo di incamerare quei dati che gli consentono di “leggere” un testo con un’intonazione corretta e naturale. È tuttavia ancora impossibile ottenere la naturalezza di un dialogo essenziale per la produzione di una serie televisiva.
Quanto si spingerà l’intelligenza artificiale nel mondo del doppiaggio?
Per le produzioni cinematografiche, l’intelligenza artificiale sta facendo passi da gigante ed è già in grado di doppiare interi film. La start up Deepdub è in grado di doppiare film con voci che sembrano quelle degli attori del film originale, come è già avvenuto in “Every Time I Die” (2019) di Robi Michael per Netflix. L’azienda britannica Flawless AI ha sviluppato il software TrueSync, in grado di modificare il movimento labiale degli attori sincronizzati alla traduzione. In conclusione, il futuro dell’intelligenza artificiale nel mondo del doppiaggio si prospetta come un’evoluzione affascinante, in grado di offrire maggiori possibilità creative, flessibilità e accessibilità. Sarà una sinergia tra l’intelligenza artificiale e l’arte dell’interpretazione umana, che porterà ad esperienze audiovisive sempre più coinvolgenti e di alta qualità per il pubblico di tutto il mondo.