Introduzione

1.1 Quanto è importante la traduzione dei sottotitoli in un video?

La traduzione dei sottotitoli video aumenta l’accessibilità dei contenuti. Consente di incrementare il posizionamento SEO e di promuovere beni e servizi venduti su scale internazionale. I sottotitoli multilingue facilitano la comprensione, in particolare dei contenuti specialistici, oppure quando i protagonisti del video non sono madrelingua. I sottotitoli promuovono l’apprendimento durante i corsi universitari e in eLearning. La traduzione svolge quindi un ruolo essenziale nella gestione di contenuti audiovisivi, indipendentemente dalle competenze linguistiche dei destinatari dei video.

In questo white paper analizzeremo tutti gli aspetti legati alla traduzione di sottotitoli in diverse lingue. Verranno trattate le migliori pratiche e tecniche specifiche del sottotitolaggio, per garantire traduzioni di sottotitoli di alta qualità.

1.2 I vantaggi dell’intelligenza artificiale nella traduzione di sottotitoli video?

L’intelligenza artificiale deve essere usata con oculatezza, valutando i suoi vantaggi ma anche i suoi limiti. I progressi ad essa legati sono molteplici e le tecnologie correlate possono essere fonte di risparmi molto significativi anche nei tempi di implementazione.

L’obiettivo di questo libro bianco è identificare le tecnologie disponibili per le varie fasi della traduzione di sottotitoli: trascrizione, sincronizzazione, traduzione e adattamento, sovrapposizione di sottotitoli e doppiaggio con voci sintetiche da file di sottotitoli.

Come tradurre e sottotitolare un video

2.1 Trascrizione e sincronizzazione

Perché utilizzare un software di riconoscimento vocale per convertire automaticamente i contenuti audiovisivi?

Qualità: l’intelligenza artificiale offre oggi strumenti all’avanguardia che consentono di produrre trascrizioni con un livello di accuratezza superiore al 90% in molte lingue. Questo facilita il lavoro di trascrittori e traduttori.

Velocità: le tecnologie STT (Speech-To-Text) possono elaborare diverse ore di registrazioni in pochi minuti, con un notevole risparmio di tempo. Il trascrittore o il traduttore lavora in media 3 volte più velocemente.

Costi ridotti: la trascrizione automatica STT è generalmente meno costosa della trascrizione umana. Ciò consente alle aziende di ottenere trascrizioni accurate a costi inferiori, con una riduzione dei budget di 3 volte.

Ci sono tre importanti prerequisiti per utilizzare questo tipo di tecnologia:

Perché la sincronizzazione deve essere effettuata al momento della trascrizione?

Sincronizzazione accurata: solo un trascrittore o un traduttore che parla la lingua di partenza sarà in grado di associare un TC specifico (marcatura temporale) a ogni parola per garantire che il montaggio video, i sottotitoli o il doppiaggio siano correttamente sincronizzati.

Facilità di navigazione: i marcatori temporali consentono una navigazione fluida nei file audiovisivi (sottotitoli intralinguistici e interlinguistici). I traduttori, i sottotitolatori e gli editor video possono spostarsi facilmente da un punto all’altro utilizzando i timecode come marcatori temporali, facilitando la traduzione e l’adattamento dei contenuti.

Gestione delle versioni multilingue: la trascrizione con codice temporale dalla lingua di partenza è la base per le varie attività della catena di produzione e post-produzione (traduzione, adattamento, sottotitolazione, doppiaggio e montaggio). In particolare, accelera i tempi di produzione e riduce i costi di budget.

Punti chiave - Trascrizione e sincronizzazione: la scelta degli strumenti software e del trascrittore determinerà la qualità della trascrizione in tempo codificato che è il pilastro delle attività di sottotitolazione, doppiaggio e montaggio video. Se il progetto lo consente, l'uso dell'IA può ridurre di un fattore 3 il budget stanziato.

2.2 Adattamento secondo i vincoli spazio tempo (contestualizzazione e leggibilità)

L’adattamento dei sottotitoli ai vincoli di tempo e spazio è fondamentale per garantire un’esperienza di visione multilingue, una facile leggibilità e la sincronizzazione.

Vincoli temporali: i sottotitoli devono essere visualizzati sullo schermo per un periodo di tempo determinato dai parametri CPL e CPS e dalla sincronizzazione con il contenuto audiovisivo (spotting). Il dialogo deve essere presentato affinché gli spettatori possano leggerlo e capirlo senza difficoltà (tempo di lettura). L’adeguamento dei sottotitoli ai vincoli temporali evita una visualizzazione troppo breve o viceversa che potrebbe disturbare la lettura e la comprensione.

Vincoli spaziali: lo spazio di visualizzazione dei sottotitoli è spesso limitato. È fondamentale ottimizzare il testo rispetto allo spazio a disposizione, evitando sovrapposizioni con i riquadri o con il testo che appare a schermo. A seconda della lingua tradotta, ciò implica la riduzione del numero di parole o caratteri, l’uso di una formulazione più concisa e l’eliminazione delle informazioni non essenziali, pur mantenendo l’integrità del significato del dialogo.

Leggibilità: i sottotitoli tradotti devono essere facili da leggere e da capire. Ciò significa che devono essere visualizzati con una dimensione dei caratteri adeguata, un contrasto sufficiente con lo sfondo e un font chiaro e leggibile (cfr sezione 2.5 del presente libro bianco). L’adattamento dei sottotitoli ai vincoli di spazio ottimizza la loro leggibilità ed evita il sovraccarico visivo.

Localizzazione e traduzione: quando i sottotitoli devono essere tradotti o adattati in lingue diverse, i vincoli tempo e spazio può variare. Le lingue possono avere strutture diverse, che richiedono nuovi aggiustamenti sintattici-grammaticali. L’adattamento dei sottotitoli che tiene conto di questi vincoli, è essenziale per mantenere una traduzione coerente e fluida.

Punti chiave - Adattamento ai vincoli di tempo e spazio: i sottotitoli devono essere adattati alle diverse lingue di traduzione, rispettando i vincoli di tempo e di spazio (individuazione, tempo di lettura, sovrapposizioni, ecc.) per garantire che gli spettatori possano godere appieno del contenuto audiovisivo, indipendentemente dalla loro lingua o capacità uditiva.

2.3 Traduzione nel rispetto di coerenza terminologica, stile, tempi di lettura e leggibilità dei sottotitoli

La traduzione dei sottotitoli richiede una duplice abilità da parte del traduttore: deve essere in grado di garantire la coerenza terminologica e di riprodurre lo stile del contenuto audiovisivo, ma anche di assicurare che i sottotitoli siano leggibili con il giusto tempo di lettura, controllando che siano rispettati il CPL e il CPS.

Coerenza terminologica: la coerenza terminologica corrisponde all’uso coerente di termini ed espressioni nei sottotitoli. È essenziale mantenere una terminologia precisa e coerente per evitare confusione in tutte le lingue di traduzione. Per i contenuti di natura specifica, creiamo un glossario prima dell’inizio del progetto, che viene aggiunto man mano che la traduzione procede. Questo glossario garantisce un controllo totale sulla terminologia utilizzata.

Stile: ogni contenuto audiovisivo possiede un proprio stile: formale, informale, umoristico, tecnico, ecc. Quando si traducono i sottotitoli, è importante rispettare lo stile del contenuto originale e trasporlo nella lingua di traduzione. Il senso critico del traduttore è la chiave di volta per preservare l’atmosfera, l’umorismo e le sfumature del messaggio, fornendo così una traduzione autenticamente fedele. In caso di parti non perfettamente udibili, giochi di parole, battute ironiche, terminologia molto specifica, ecc.) proponiamo al cliente le nostre idee.

Tempo di riproduzione: i sottotitoli vengono visualizzati sullo schermo per un tempo limitato, definito dai parametri CPL e CPS (vedere la sezione 3.4 del presente libro bianco). È essenziale che il traduttore audiovisivo rispetti questi vincoli di tempo di lettura e adatti il suo lavoro di conseguenza. Infatti, i sottotitoli tradotti devono essere letti e compresi facilmente entro il tempo assegnato, senza che il lettore sia in affanno di lettura.

Facilità di lettura: la leggibilità dei sottotitoli non è affatto un fattore trascurabile. L’editor video deve tenere conto della dimensione dei caratteri, del contrasto, del layout e di altri aspetti visivi per garantire che i sottotitoli tradotti siano facilmente letti. Il traduttore presta, dal canto suo, particolare attenzione alle scelte stilistiche che possono influenzare la leggibilità, come la lunghezza delle frasi e l’uso di parole e frasi brevi.

Punti chiave - Coerenza terminologica, stile, tempi di lettura e leggibilità dei sottotitoli tradotti: grazie al rispetto di coerenza terminologica, stile, tempi di lettura e leggibilità, la traduzione consente allo spettatore di vivere un'esperienza visuale completa. L’adattamento linguistico è qualitativamente elevato quando mantiene l’autenticità del contenuto originale.

2.4 Garanzia di qualità di traduzioni e sottotitoli

La valutazione della qualità delle traduzioni di sottotitoli garantisce la conformità agli standard qualitativi richiesti. La nostra procedura “garante della qualità” avviene dalla concezione alla consegna, e comprende i seguenti elementi:

Accuratezza e fedeltà delle traduzioni: l’analisi della qualità consente alla traduzione dei sottotitoli la sua accuratezza e fedeltà rispetto al contenuto originale. È essenziale che le traduzioni trasmettano accuratamente il significato e l’intento del dialogo, senza alterare il messaggio o distorcere le sfumature del testo. Se alcune porzioni dell’audio non sono facilmente comprensibili, facciamo riascoltare il parlato a diversi traduttori madrelingua, per ottenere una trascrizione perfetta anche in caso di difficoltà. Nei casi in cui i giochi di parole o altri effetti stilistici sono presenti nella lingua e non possono essere direttamente tradotti, proponiamo delle alternative confacenti.

Coerenza terminologica: quando un testo audiovisivo viene tradotto in più lingue, è importante mantenerne la coerenza terminologica. La creazione di un glossario multilingue prima e durante il progetto ottimizza la qualità, poiché il glossario uniforma la terminologia dei sottotitoli. Questo contribuisce ad un’esperienza visiva coerente ed evita qualsiasi confusione o ambiguità dello spettatore.

Stile e tono: ogni contenuto audiovisivo possiede uno stile e tono a sé stanti che devono essere rispettati durante la traduzione dei sottotitoli. La nostra procedura qualità ci consente di individuare immediatamente i problemi di trascrizione (parti mal udibili), sincronizzazione (sovrapposizioni tra sottotitoli e testo a schermo), traduzione e adattamento (giochi di parole, termini commerciali specifici…) e di proporre soluzioni che preservino e si adattino al contenuto originale. Ciò assicura la fedeltà dei i sottotitoli nei riguardi dell’atmosfera e all’mood del contenuto originale, facilitando la comprensione dell’esperienza visiva.

Leggibilità e sincronizzazione: la qualità della leggibilità dei sottotitoli e la loro sincronizzazione con il contenuto audiovisivo è un aspetto tecnico di grande valore. I sottotitoli devono essere visualizzati con dei caratteri, un contrasto e una velocità di lettura idonei alla comprensione e la fluidità della lettura. Eseguiamo test preventivi per essere certi che i sottotitoli siano perfettamente sincronizzati con i tempi del video, evitando ritardi o problemi di lettura.

Garanzia di qualità: è un processo che attuiamo in ogni fase del progetto. Se alcune parti del video non sono facilmente udibili vengono decifrate da più traduttori durante trascrizione, i sottotitoli vengono riposizionati in fase di sincronizzazione per evitare sovrapposizioni con il testo sullo schermo, lo spirito critico del traduttore consente traduzioni accurate (giochi di parole, umorismo …) e l’uso della terminologia è sempre coerente e vengono eseguiti test di leggibilità dei sottotitoli.

2.5 Inserzione ed esportazione di sottotitoli tradotti

Per stampare i sottotitoli a video utilizziamo il software Adobe Premiere, che permette di definire con precisione i seguenti punti:

Dimensione e posizione: i sottotitoli devono essere sufficientemente grandi da poter essere letti agevolmente, senza inficiare la visione delle immagini. Questi parametri possono variare a seconda della risoluzione dello schermo e della distanza di visione (cinema, web, riunioni, 3D, cupola, ecc.). La dimensione dei caratteri consigliata è generalmente di circa 30 punti e i tipi di carattere più comunemente utilizzati sono Arial, Times New Roman, Verdana, Helvetica e Roboto. I sottotitoli devono essere posizionati nella parte inferiore dello schermo, generalmente centrati o leggermente sfalsati verso il basso, senza coprire elementi importanti dell’immagine. Per le sovrapposizioni, consultare la sezione 3.3 del presente libro bianco.

Durata della visualizzazione: i sottotitoli tradotti devono essere visualizzati sullo schermo per un tempo di lettura sufficiente. La durata della visualizzazione può variare da 1 a 10 secondi, anche se si consiglia una durata da 1 a 3 secondi per riga di sottotitolo. I parametri CPL e CPS determineranno la durata (si veda la sezione 3.4 del presente libro bianco). L’obiettivo è quello di tenere conto della complessità del dialogo e del ritmo del video e trovare un equilibrio tra leggibilità e rispetto dei vincoli temporali.

Leggibilità: la traduzione dei sottotitoli deve essere letta agevolmente, anche in contesti difficili. Si raccomanda di utilizzare un carattere come quelli citati in precedenza. Il contrasto tra i sottotitoli e lo sfondo deve essere sufficiente a garantire una leggibilità ottimale. È preferibile utilizzare un colore di testo chiaro su uno sfondo scuro o viceversa, evitando combinazioni di colori che potrebbero ostacolare la lettura. È anche possibile giocare con le ombre utilizzando sottotitoli bianchi con un contorno di 2 o 3 pixel. Questo tipo di sottotitoli può essere utilizzato per video con background chiaro o scuro.

Stile e formattazione: le traduzioni dei sottotitoli devono rispettare stile e formattazione del contenuto originale, se questo è sottotitolato nella lingua di partenza. Corsivo, maiuscolo, punteggiatura e altri elementi di formattazione devono essere conservati per mantenere l’intenzione e l’espressione del dialogo.

Punto chiave - Inserimento dei sottotitoli: definire le regole per l'inserimento in modo che le traduzioni dei sottotitoli siano presentate in modo chiaro, leggibile ed esteticamente idonee allo stile del video. Questo include: dimensioni e posizione, gestione delle sovrapposizioni, durata della visualizzazione, leggibilità, stile e formattazione.

Tecniche e formati di sottotitolazione

3.1 Sottotitoli intralinguistici

La sottotitolazione intralinguistica consiste nel fornire sottotitoli nella medesima lingua dell’audio originale. Può essere utilizzata per diversi scopi: aiutare le persone con problemi uditivi a seguire film e filmati, consentire ai motori di ricerca di indicizzare nuovi video, supportare gli attori/relatori nella registrazione delle loro voci oppure fornire agli spettatori informazioni aggiuntive all’audio stesso.

Trascrizione e sottotitolazione intralinguistica: se la qualità audio lo consente e gli speaker sono madrelingua, per la trascrizione è consigliabile impiegare le tecnologie AI e STT (Speech-To-Text) poiché il risultato ottenuto è ottimo (sottotitoli trascritti quasi perfettamente affidabili) ottenuti ad un costo minimo. Il trascrittore/sottotitolatore utilizza queste tecnologie per programmi preregistrati come film, programmi televisivi, documentari e altro. Queste tecnologie consentono anche di gestire rapidamente progetti di grande volume in tempi record.

Sottotitoli in modalità karaoke: questo tipo di sottotitoli viene utilizzato per programmi musicali o videoclip in cui il testo della canzone viene visualizzato sullo schermo in sincronia con la musica. Questo tipo di sottotitoli viene utilizzato anche per il doppiaggio. Alcuni attori/relatori utilizzano questa tecnica per le loro registrazioni.

Sottotitolazione di suoni non verbali, luoghi e altre informazioni: oltre al dialogo, la sottotitolazione intralinguistica può includere anche informazioni su suoni ambientali come rumori, risate, pianti, musica di sottofondo, luoghi, ecc. Queste indicazioni visive aiutano a trasmettere allo spettatore l’atmosfera sonora e gli elementi audio che non sono esplicitamente espressi nel dialogo.

Punto chiave - Sottotitolazione intralinguistica: letecnologie STT di riconoscimento vocale e sincronizzazione automatica facilitano il processo di sottotitolazione intralinguistica, accelerando i tempi di realizzazione e riducendo notevolmente i budget.

3.2 Sottotitoli in più lingue

La sottotitolazione interlinguistica prevede la traduzione e la sottotitolazione video da una lingua di partenza a una o più lingue di arrivo diverse. Questo servizio prevede 4 fasi: sincronizzazione, traduzione, adattamento e verifica finale.

Sincronizzazione temporale: una volta completata la trascrizione, i sottotitoli in lingua originale devono essere sincronizzati con il contenuto audiovisivo. Si tratta di regolare i sottotitoli in modo che appaiano e scompaiano al momento giusto, tenendo conto di dialoghi, pause, cambi di scena, ecc. Il vantaggio di svolgere questo compito prima della traduzione è che i sottotitoli di tutte le lingue tradotte saranno sincronizzati in modo uniforme. Inoltre, questa operazione viene eseguita una sola volta, con conseguente risparmio di tempo e denaro. Se necessario, è possibile apportare modifiche in post-produzione.

Traduzione umana al 100%: se il vostro budget lo consente, raccomandiamo sempre una traduzione completamente umana, poiché la qualità sarà sempre superiore a quella di una traduzione automatica post-editing. Per i contenuti specialistici in cui è richiesto il senso critico del traduttore, per le lingue rare e per i dialoghi in rapida evoluzione, consigliamo vivamente una traduzione 100% umana.

Uso di software di traduzione automatica: l’AI fornisce traduzioni automatiche di qualità semi sfruttabili qualora i contenuti video non siano troppo specialistici, i dialoghi siano semplici, senza sfumature ironiche e in lingue specifiche (prevalentemente in inglese, francese, italiano, spagnolo). In queste configurazioni, il traduttore può effettuare il post-editing al 75% della tariffa base

Adattamento culturale e linguistico: la traduzione dei sottotitoli devono tenere conto delle differenze culturali e linguistiche tra la lingua di partenza e arrivo. Ciò significa adattare riferimenti culturali, giochi di parole, espressioni idiomatiche e altri elementi in modo che siano comprensibili e pertinenti nella lingua target.

Controllo della leggibilità: la traduzione deve consentire agli spettatori un tempo di lettura sufficiente. Ciò comporta una trasposizione linguistica e un adattamento idonei, delle scelte grafiche appropriate (font, gestione delle sovrapposizioni …) e dei tempi di visualizzazione sufficienti (CPL e CPS).

Punto chiave - Sottotitoli in più lingue: si consiglia di produrre i sottotitoli utilizzando traduzioni e adattamenti al 100% umani. L'intelligenza artificiale e la traduzione neurale possono generare risparmi di circa il 25% e sono adatte a contenuti audiovisivi generalisti.

3.3 Traduzione grafiche a schermo preesistenti – gestione delle sovrapposizioni

Nei limiti del possibile è essenziale evitare di sovrapporre i sottotitoli ai riquadri e ai testi che appaiono sullo schermo. Ecco alcune procedure chiave prima di iniziare la sottotitolazione:

Analizzare attentamente il contenuto audiovisivo: prima ancora di iniziare a trascrivere bisogna visionare attentamente il video per identificare i momenti in cui la grafica appare nel film. Questa fase consente di annotare la loro posizione, la loro durata (TC-In e TC-Out) e il loro testo.

Modificare la posizione di visualizzazione dei sottotitoli tradotti: una volta effettuata questa operazione, è possibile modificare la posizione dei sottotitoli affinché non si sovrappongano ai super preesistenti. Ad esempio, i sottotitoli possono essere riposizionati e collocati nella parte superiore dello schermo o appena sopra le scritte originali.  Si deve lasciare abbastanza spazio a schermo cosicché i sottotitoli non interferiscano con il resto delle immagini.

Ridurre il tempo di visualizzazione dei sottotitoli: se il contesto lo consente, se una grafica appare rapidamente, possiamo regolare il tempo di visualizzazione dei sottotitoli evitando così delle spiacevoli sovrapposizioni. In questi casi, sincronizziamo i sottotitoli in modo che scompaiano prima della comparsa della grafica seguente.

Utilizzo di strumenti di sottotitolazione professionali: il software di sottotitolazione professionale che utilizziamo offre funzioni avanzate per la gestione delle sovrapposizioni. Ciò significa che possiamo regolare facilmente la sincronizzazione, definire posizioni di visualizzazione specifiche, modificare la durata di visualizzazione dei sottotitoli, ecc.

Correzione di bozze e test: una volta i sottotitoli tradotti, effettuiamo una approfondita correzione di bozze per verificare eventuali sovrapposizioni con i riquadri o testi sullo schermo.

Punto chiave - Sovrapposizione: facciamo il possibile per evitare la sovrapposizione con le grafiche del video, segnalando dove i sottotitoli tradotti devono essere riposizionati. Queste scelte di riposizionamento vengono fatte a monte del progetto.

3.4 Scelta dei parametri CPL (caratteri per riga) e CPS (caratteri al secondo)

Prima di iniziare un progetto di traduzione dei sottotitoli, è necessario determinare il valore dei parametri CPL (caratteri per riga) e CPS (caratteri per secondo), in quanto si tratta di chiave per garantire la leggibilità e il rispetto dei vincoli temporali. Ecco i nostri consigli per scegliere i giusti parametri CPL e CPS:

Considerare la leggibilità: il parametro CPL determina il numero di caratteri che possono essere visualizzati per riga di sottotitolo. È fondamentale scegliere una lunghezza di riga che consenta una leggibilità ottimale. Le righe troppo lunghe possono essere difficili da leggere rapidamente, mentre quelle troppo corte possono apparire frammentate. In generale, si consigliano sottotitoli di 40-50 caratteri per riga, ma questo può variare a seconda della lingua di traduzione e del carattere utilizzato.

Adattare il CPS alla velocità di lettura: il parametro CPS si riferisce al numero di caratteri che possono essere visualizzati al secondo. È importante scegliere un CPS che corrisponda alla velocità media di lettura del pubblico. Un testo visualizzato troppo velocemente può essere difficile da leggere, mentre poco testo visualizzato troppo lentamente risulta forzato e noioso. Come regola generale consigliamo un CPS compreso tra 15 e 20 caratteri.

Tenere conto dei vincoli temporali: i sottotitoli devono essere sincronizzati con il video, tenendo conto di pause, cambi di scena e dialoghi. È importante garantire che la traduzione dei sottotitoli appaia e scompaia al momento giusto per un’esperienza piacevolmente fluida. Assicuratevi che il CPS scelto vi permetta di rispettare questi vincoli temporali senza compromettere la leggibilità.

Correzione di bozze e test: una volta che i sottotitoli sono stati tradotti e sincronizzati, eseguiamo sempre una correzione di bozze e un test sulle impostazioni CPL e CPS. I contenuti con sottotitoli sono visibili sullo schermo (anche se i sottotitoli non sono ancora stati incorporati) per verificare la leggibilità, la sincronizzazione e l’esperienza complessiva. In questa fase, effettuiamo gli ultimi aggiustamenti che potrebbero essere necessari.

Punto chiave - Scelta dei parametri CPL e CPS: i parametri CPL e CPS sono due elementi molto importanti per garantire un equilibrio tra la leggibilità dei sottotitoli tradotti, la sincronizzazione e i vincoli di tempo. Come regola generale, si consiglia di impostarli a 50 CPL e 20 CPS, tenendo presente che possono essere aumentati o diminuiti a seconda delle caratteristiche specifiche del contenuto e della lingua di traduzione.

L’utilità dell’IA nella traduzione di sottotitoli

4.1 Riconoscimento del parlato con il testo (STT)

La qualità della trascrizione e la sincronizzazione sono due elementi fondamentali per ottenere una traduzione di qualità dei sottotitoli. L’utilizzo del riconoscimento vocale, noto anche come Speech-to-Text (STT), per la prima fase della sottotitolazione dei video, può consentire quanto segue:

Automazione del processo: il riconoscimento vocale STT automatizza parte del processo di traduzione dei sottotitoli, in particolare le fasi di trascrizione e sincronizzazione. Invece di dover inserire manualmente i dialoghi da tradurre, il riconoscimento vocale converte automaticamente il parlato in testo con un tasso di precisione superiore al 90% per le lingue più comuni, accelerando notevolmente il processo di traduzione.

Risparmio di tempo: poiché il riconoscimento vocale è in grado di trascrivere rapidamente grandi quantità di contenuti audio, consente di risparmiare tempo durante la trascrizione e la sincronizzazione. Questo strumento è particolarmente utile per i progetti di sottotitolazione o doppiaggio con scadenze strette e/o grandi quantità di testi da tradurre.

Maggiore precisione: i sistemi di riconoscimento vocale più avanzati si basano sui progressi dell’intelligenza artificiale e dell’apprendimento automatico. I nostri team sono specializzati nell’uso di questi software, e ci permettono di offrire ai nostri clienti trascrizioni codificate, precise al 100% con budget limitati.

Lingue poco diffuse e audio di scarsa qualità: il riconoscimento vocale presenta alcune limitazioni quando le lingue di origine dei video non sono molto diffuse, la qualità dell’audio è scarsa e gi speaker non sono madrelingua o hanno difficoltà di dizione. In una di queste tre situazioni utilizziamo SEMPRE un tool di sottotitolazione tradizionale.

Punto chiave - Riconoscimento vocale: l'uso del riconoscimento vocale STT è consigliato per i video con una buona qualità audio e per le lingue più diffuse. Il risparmio di tempo e denaro può raggiungere l'80% con una trascrizione e una sincronizzazione affidabili oltre al 90%, poiché tutto viene ricontrollato dal trascrittore. Per le lingue rare e i video con dialoghi in rapida evoluzione, accenti regionali, rumore di fondo o scarsa qualità audio, si consiglia di utilizzare un software di sottotitolazione tradizionale.

4.2 Limiti della traduzione neurale nella traduzione di sottotitoli

Dal 2018 sono stati compiuti notevoli progressi nella traduzione neurale basata sull’intelligenza artificiale (AI), che può fornire traduzioni di qualità utilizzabile per alcuni progetti generici. In questi casi, il traduttore fornisce un servizio di post-editing. Nei progetti di sottotitolazione di video, film, serie TV, documentari non è possibile utilizzare l’AI per ovvii limiti linguistici. Ecco alcuni delle principali gravi manchevolezze della traduzione neurale:

Comprensione del contesto e mancanza di pensiero critico: non appena entrano in gioco le metafore o il linguaggio ironico, i modelli di traduzione neurale sono inadatti e portano a traduzioni errate. Possono avere difficoltà a cogliere sfumature, giochi di parole, espressioni idiomatiche e riferimenti culturali, con conseguente smarrimento di significato e gravi errori di traduzione.

Gestione delle lingue meno comuni: l’intelligenza artificiale si affida a modelli di traduzione neurale per generare le sue traduzioni. Questi modelli sono approfonditi per le lingue più diffuse, ma hanno grosse lacune per quelle di cui disponiamo di dati più esigui, come le lingue meno diffuse o l’arabo, (sebbene sia una lingua molto parlata). L’insufficienza dei dati in alcune lingue può influire sulla qualità e accuratezza delle traduzioni AI. Il post-editing, in quei casi, comporta tempi più prolungati e quindi “non vale affatto la candela” utilizzarli.

Terminologia specifica e settori specialistici: i modelli di traduzione neurale non possono essere precisi e coerenti come lo sono gli esperti del settore. Quando si tratta di tradurre termini tecnici, scientifici, legali o medici, che richiedono competenze specialistiche, l’intelligenza artificiale mostra chiaramente i suoi limiti. Per garantire l’esattezza dei sottotitoli tradotti in queste aree distinte, le traduzioni hanno bisogno di controllo e di editing manuale (post-editing). Tutto ciò richiede molto tempo, quindi tanto vale eseguire una traduzione in maniera tradizionale.

Riservatezza dei dati: i modelli di traduzione neurale basati sull’intelligenza artificiale richiedono grandi quantità di dati e quindi recuperano i dati trasmessi, e questo implica possibili problemi di riservatezza, in particolare quando devono essere tradotti testi sensibili o riservati.

Punto chiave - Traduzione neurale: nonostante queste limitazioni, la traduzione neurale basata sull'intelligenza artificiale offre un supporto accettabile durante lo svolgimento dei progetti di sottotitolazione di video non specialistici in un cerchio ristretto di lingue. Il traduttore umano può quindi eseguire la revisione e il post-editing a una tariffa forfettaria. Questo intervento è comunque necessario per garantire la veridicità del servizio di traduzione. Per i progetti specialistici, in cui i limiti dell’AI si palesano immediatamente, la traduzione 100% umana è l’unica possibilità plausibile.

4.3 Doppiaggio vocale sintetico da file di sottotitoli tradotti (tecnologia Text-To-Speech)

A partire dal 2022 abbiamo realizzato numerosi progetti di doppiaggio vocale sintetico utilizzando file di sottotitoli (testi tradotti e loro sincronizzazione), utilizzando il nostro software Sub2Dub© progettato facendo ricorso alla tecnologia Text-to-Speech (TTS). I suoi vantaggi sono i seguenti:

Velocità ed efficienza: il text-to-speech può essere utilizzato per generare rapidamente voci in diverse lingue a partire da testi tradotti e per utilizzare la sincronizzazione dei file di sottotitoli esistenti. Questo riduce notevolmente il tempo necessario per produrre versioni doppiate in diverse lingue, rispetto alla registrazione di voci umane, un processo più lungo e costoso. L’uso di questo servizio è suggerito per alcuni tipi di video, come corsi di formazione o documentari. A tale proposito, vi consigliamo di effettuare un test di 3 minuti con il nostro software Sub2Dub© per valutare la qualità della resa.

Flessibilità linguistica: con la tecnologia TTS è possibile generare voci per le lingue più parlate al mondo, ma è più complicato per quelle meno utilizzate. Questo perché la tecnologia si basa su modelli acustici creati a partire da vasti insiemi di dati audio che registrano la pronuncia di parole, frasi e dialoghi in lingue diverse e con diverse varianti regionali. Per le lingue più comuni, questi modelli sono ricchi e ci permettono di ottenere una qualità della voce sintetizzata molto simile a quella delle voci umane. Per le lingue più rare, l’esperienza dimostra che è più corretto ricorrere al doppiaggio umano.

Controllo di qualità: la sintesi vocale ci permette di controllare con precisione la pronuncia, l’intonazione e il ritmo delle nostre voci. Utilizzando il nostro software Sub2Dub©, i nostri ingegneri del suono possono scegliere i parametri della sintesi (sesso, età, tono di voce, ecc.) e regolarli per adattarli al meglio alle caratteristiche dei personaggi o degli speaker originali. Questo ci permette di produrre doppiaggi di alta qualità che si adattano meglio alle sfumature e alle emozioni del dialogo.

Adattamento a esigenze specifiche: la nostra applicazione Sub2Dub© consente di scegliere una voce per ogni sottotitolo, di inserire pause… e quindi di adattare le voci sintetiche alle esigenze specifiche del contenuto. Ad esempio, è possibile modificare la velocità del parlato, l’accento o il tono di voce per adattarsi meglio alle caratteristiche del personaggio o della situazione.

Riduzione dei costi: rispetto alla registrazione di voci umane, l’uso del text-to-speech può limitare i costi associati al doppiaggio umano fino all’80%. Non ci sono costi per il pagamento di attori doppiatori e non ci sono spese per gli studi di registrazione.

Punto chiave - Doppiaggio con voce sintetica: prima di doppiare il vostro video, vi consigliamo di effettuare un test di 3 minuti per valutare se la resa della voce sintetica soddisfa le vostre aspettative. Questo test può essere effettuato gratuitamente utilizzando la nostra applicazione Sub2Dub©. È importante ricordare che, nonostante i significativi miglioramenti nella sintesi vocale, le voci sintetiche possono ancora mancare di naturalezza e espressività. Pertanto, per alcuni tipi di video, è preferibile registrare voci umane.

Conclusione

6.1. Sintesi dei punti chiave

Come tradurre e sottotitolare un video

Punto chiave – Trascrizione e sincronizzazione: la scelta di software e del trascrittore determinerà la qualità della trascrizione in tempo codificato che rappresenta la base delle attività di sottotitolazione, doppiaggio e montaggio video. Se il progetto lo consente, l’uso dell’AI può ridurre di un fattore 3 il budget stanziato.

Punto chiave – Adattamento ai vincoli di tempo e di spazio: i sottotitoli devono essere adattati alle diverse lingue di traduzione, rispettando i parametri tempo e spazio (individuazione, tempo di lettura, sovrapposizioni, ecc.). Così facendo gli spettatori possano godere del contenuto audiovisivo, indipendentemente dalla loro lingua o capacità uditiva.

Punto chiave – Coerenza terminologica, stile, tempi di lettura e leggibilità dei sottotitoli tradotti: rispettando la coerenza terminologica, lo stile, i tempi di lettura e la leggibilità dei sottotitoli, la traduzione contribuisce a un’esperienza di visione fluida e comprensibile per lo spettatore. Si mantiene l’integrità del contenuto originale e si fornisce un adattamento linguistico di alta qualità, facilitando l’accesso ai contenuti audiovisivi per un pubblico più ampio o specializzato.

Punto chiave – Garanzia di qualità: è un processo che concretizziamo in ogni fase del progetto. Le parti di video non udibilisono identificate al momento della trascrizione. I sottotitoli vengono riposizionati in fase di sincronizzazione per evitare sovrapposizioni con il testo sullo schermo. Il senso critico del traduttore garantisce traduzioni accurate (giochi di parole, umorismo, ecc.). L’uso di una terminologia coerente, ed effettuiamo test per garantire che i sottotitoli siano graficamente leggibili.

Punto chiave – Inserimento dei sottotitoli: definire le regole per l’inserimento in modo che le traduzioni dei sottotitoli siano presentate in modo chiaro, leggibile ed esteticamente coerente con il contenuto audiovisivo. Questo include: dimensioni e posizione, gestione delle sovrapposizioni, durata della visualizzazione, leggibilità, stile e formattazione.

Tecniche e formati di sottotitolazione

Punto chiave – Sottotitolazione intralinguistica: le tecnologie STT di riconoscimento vocale e sincronizzazione automatica facilitano il processo di sottotitolazione intralinguistica, accelerando i tempi di realizzazione e contraendo fortemente i budget.

Punto chiave – Sottotitoli in più lingue: si consiglia di produrre i sottotitoli utilizzando traduzioni e adattamenti al 100% umani. L’intelligenza artificiale e la traduzione neurale possono generare risparmi di circa il 25% e sono adatte a contenuti audiovisivi più generali.

Punto chiave – Sovrapposizione: facciamo il possibile per evitare la sovrapposizione con i cartoni animati e i testi che appaiono sullo schermo, segnalando con precisione i punti in cui i sottotitoli tradotti devono essere riposizionati. Il riposizionamento dei testi viene studiato prima di inziare la fase produttiva della sottotitolazione.

Punto chiave – Scelta dei parametri CPL e CPS: i parametri CPL e CPS sono due elementi fondamentali per garantire un equilibrio tra la leggibilità dei sottotitoli tradotti, la sincronizzazione e i vincoli di tempo. Come regola generale, si consiglia di impostarli a 50 CPL e 20 CPS, tenendo presente che possono essere aumentati o diminuiti a seconda delle caratteristiche specifiche del contenuto e della lingua tradotta.

Utilizzare l’intelligenza artificiale per tradurre i sottotitoli

Punto chiave – Riconoscimento vocale: l’uso del riconoscimento vocale STT è fortemente consigliato per video con audio di buona qualità e per alcune delle lingue più parlate. Il risparmio di tempo e di budget può raggiungere l’80% con trascrizione e sincronizzazione affidabili al 100%, poiché tutto viene rivisto dal trascrittore. Per le lingue rare e i video con dialoghi in rapido movimento, accenti regionali, rumore di fondo o scarsa qualità audio, si consiglia di utilizzare un software di sottotitolazione tradizionale.

Punto chiave – Traduzione neurale: nonostante queste limitazioni, la traduzione neurale basata sull’intelligenza artificiale offre un supporto accettabile per i progetti di sottotitolazione in lingua straniera di uso comune. Il traduttore umano può quindi eseguire un controllo e un editing linguistico a tariffa scontata rispetto la normale trascrizione/traduzione. Questo garantisce la qualità e l’accuratezza dei testi tradotti. Per i progetti specialistici in cui è richiesto maggior spirito critico, consigliamo una traduzione umana al 100%, affinché i sottotitoli siano tradotti e adattati al contesto specifico.

Punto chiave – Doppiaggio con voce sintetica: prima di doppiare un video, vi consigliamo di effettuare un test di 3 minuti per valutare se la voce sintetica soddisfi le vostre aspettative. Questo test può essere effettuato gratuitamente, utilizzando la nostra applicazione Sub2Dub©. È importante ricordare che, nonostante i significativi miglioramenti nella sintesi vocale, le voci sintetiche possono ancora mancare della naturalezza e espressività delle voci umane. Pertanto, per alcuni tipi di video, è preferibile registrare con voci umane.

6.2. Prospettive future della traduzione e della sottotitolazione

Questo white paper è un riferimento per i traduttori di sottotitoli video e per chiunque voglia capire come produrre una traduzione di sottotitoli eccelsa sotto ogni aspetto.

Abbiamo esaminato tutte le regole della buona tecnica che i traduttori devono applicare per i sottotitoli video, oltre a analizzare le procedure di sottotitolazione.

Infine, la sezione sull’AI (riconoscimento vocale, traduzione neurale, sintesi vocale) ci ha consentito di individuare tutti i vantaggi di queste tecnologie altamente avanzate (riduzione dei costi, tempi più rapidi, ecc.). Questa sezione ha anche evidenziato i limiti dell’AI.

È indubbio che la produzione di contenuti audiovisivi aumenterà nei prossimi anni e che l’intelligenza artificiale fornirà strumenti sempre più potenti a supporto del lavoro dei traduttori. Di conseguenza, i traduttori si troveranno sempre più di fronte a una grande sfida. Dovranno le proprie capacità critiche man mano che i contenuti video diventeranno sempre più specializzati e internazionali. Allo stesso tempo dovranno conoscere a fondo le nuove tecnologie AI per garantire traduzioni di qualità umana, a tariffe e tempi ridotti pur avvalendosi dell’AI.