Introduction

1.1 Pourquoi est-il essentiel de traduire les sous-titres de votre vidéo ?

La traduction des sous-titres d’une vidéo est un élément clé qui permet de rendre son contenu plus accessible tout en améliorant son référencement SEO, quel que soit le type de contenu. Que vous souhaitiez promouvoir des biens et services à l’échelle internationale, élargir votre audience avec des sous-titres multilingues, ou faciliter la compréhension de vidéos pointues dans un domaine technique pour des personnes dont la langue maternelle n’est pas celle de la vidéo, la traduction des sous-titres est essentielle. De plus, traduire les sous-titres facilite pour le public l’accès et donc l’apprentissage des cours en ligne, des formations et même des contenus universitaires. La traduction joue ainsi un rôle essentiel dans la diffusion de contenu audiovisuel, quelle que soit la compétence linguistique du public cible.

Dans ce livre blanc, nous détaillerons toutes les étapes et les aspects clés pour réaliser une traduction de qualité des sous-titres de votre contenu dans plusieurs langues. Après une revue détaillée de l’état de l’art et des bonnes pratiques, vous découvrirez des techniques spécifiques au sous-titrage qui garantissent des traductions de haute qualité.

1.2 Quelle est la place de l’intelligence artificielle dans la traduction des sous-titres vidéo et quels sont ses bénéfices ?

L’intelligence artificielle doit être vue comme un outil technique permettant d’optimiser le processus de traduction. Elle offre des avantages tels que des économies budgétaires significatives et une accélération des délais de mise en œuvre. Cependant, elle ne peut en aucun cas se substituer à l’expérience et au savoir-faire d’un traducteur professionnel. Il est donc essentiel de clairement identifier ses avantages et ses limites, ainsi que de se tenir informé des dernières avancées technologiques.

L’objectif de ce livre blanc est d’identifier les technologies disponibles pour faciliter chaque étape liée à la réalisation de la traduction des sous-titres. Cela comprend la transcription, la synchronisation, la traduction et l’adaptation, l’incrustation des sous-titres et le doublage en utilisant des voix synthétiques à partir des fichiers de sous-titres.

Étapes clés de la traduction et sous-titrage de vidéo

2.1 Transcription et synchronisation

Pourquoi utiliser un logiciel de reconnaissance vocale pour convertir automatiquement et intelligemment les contenus audiovisuels en texte ?

Qualité : L’intelligence artificielle est un outil de pointe qui permet d’obtenir des transcriptions avec un taux de précision supérieur à 90% dans de nombreuses langues. Le résultat obtenu facilite considérablement le travail des transcripteurs ou traducteurs.

Rapidité : Les technologies STT (Speech-To-Text) peuvent traiter plusieurs heures d’enregistrements en quelques minutes seulement, ce qui représente un gain de temps considérable. Le transcripteur ou traducteur peut travailler en moyenne 3 fois plus vite.

Coût réduit : La transcription automatique STT est généralement moins coûteuse que la transcription effectuée par des humains. Cela permet aux entreprises d’obtenir des transcriptions précises à moindre coût, en réduisant leur budget par 3.

Il y a trois prérequis importants pour l’utilisation de ce type de technologies :

Pourquoi la synchronisation doit être réalisée au moment de la transcription ?

Précision de la synchronisation : seul le transcripteur ou traducteur parlant la langue source sera en mesure d’associer un timecode spécifique (marque temporelle) à chaque mot pour garantir un montage vidéo, sous-titrage ou doublage bien synchronisé.

Navigation aisée : le repérage des timecodes permet une navigation fluide dans les fichiers audiovisuels (sous-titres intralinguistiques et interlinguistiques). Les traducteurs, sous-titreurs et monteurs vidéo peuvent facilement se déplacer d’un point à un autre en utilisant les timecodes comme repères temporels, ce qui facilite la traduction et l’adaptation du contenu.

Gestion des versions multilingues : la transcription time codée depuis la langue source est la base des différents travaux de la chaîne de production et post-production (traduction, adaptation, sous-titrage, doublage et montage). Elle permet notamment d’accélérer les délais de réalisation et de réduire les coûts budgétaires.

Point clé - Transcription et synchronisation : Le choix des outils techniques et du transcripteur aun impact majeur sur la qualité de la transcription time codée, qui est essentielle pour les activités de sous-titrage, de doublage et de montage vidéo. Selon le type de projet, l'utilisation de l'IA peut réduire le budget alloué jusqu'à 3 fois.

2.2 Adaptation en fonction des contraintes temporelles et spatiales (contextualisation et lisibilité)

L’adaptation des sous-titres en fonction des contraintes de temps et de place est cruciale pour assurer un visionnage multilingue facilité, lisible et synchrone.

Contraintes temporelles : les sous-titres sont à l’écran pendant une durée de temps déterminée par les paramètres CPL et CPS (voir section 3.4 de ce livre blanc) et permettant la synchronisation avec le contenu audiovisuel (spotting). Les dialogues apparaissent de façon à faciliter la lecture et la compréhension pour le spectateur (temps de lecture). L’adaptation des sous-titres en fonction des contraintes temporel permet d’avoir un temps d’affichage optimal des sous-titres.

Contraintes spatiales : l’espace disponible à l’écran pour afficher les sous-titres est souvent limité. Il est donc important d’adapter le texte à cet espace restreint en évitant les chevauchements avec les cartons ou textes apparaissant à l’écran. Selon les langues de traduction, cela peut impliquer la réduction du nombre de mots ou de caractères, l’utilisation de formulations plus concises et la suppression d’informations non essentielles tout en préservant l’intégrité du sens des dialogues.

Lisibilité : les sous-titres traduits doivent être facilement lisibles et compréhensibles. Cela signifie qu’ils doivent être affichés avec une taille de police adéquate, un contraste suffisant avec l’arrière-plan et une police de caractères claire et lisible (voir la section 2.5 de ce livre blanc). L’adaptation des sous-titres en fonction des contraintes d’espace permet d’optimiser leur lisibilité et d’éviter une surcharge visuelle.

Localisation et traduction : lorsque les sous-titres doivent être traduits ou adaptés dans différentes langues, les contraintes liées au temps et à l’espace peuvent varier. Les langues ont souvent des structures grammaticales différentes, ce qui nécessite des ajustements supplémentaires pour assurer un sous-titrage optimal. L’adaptation des sous-titres en fonction de ces contraintes est essentielle pour que l’expérience de visionnage/lecture après traduction reste cohérente et fluide.

Point clé – Adaptation en fonction des contraintes de temps et d'espace : les sous-titres doivent être adaptés en fonction des différentes langues de traduction dans le respect des contraintes de temps et d’espace (spotting, temps de lecture, chevauchements…) afin de garantir au spectateur la meilleure expérience de visionnage/lecture quelle que soit sa langue ou sa capacité auditive.

2.3 Traduction respectant la cohérence terminologique, le style, les temps de lecture et la lisibilité des sous-titres

La traduction des sous-titres exige une double compétence de la part du traducteur : il doit garantir la cohérence terminologique, reproduire le style du contenu audiovisuel, et s’assurer de fournir des sous-titres lisibles avec un bon temps de lecture en respectant les contraintes de caractères par ligne (CPL) et de caractères par seconde (CPS).

Comme mentionné précédemment, le traducteur doit respecter des contraintes spatiales et temporelles lors de la traduction des sous-titres. Ce type de projet demande également de garantir une cohérence terminologique et de reproduire le style du contenu audiovisuel. Le traducteur de sous-titres possède donc une double compétence technique et linguistique.

Cohérence terminologique : La cohérence terminologique fait référence à l’utilisation réfléchie des termes et des expressions tout au long des sous-titres. Il est essentiel de maintenir une terminologie précise et cohérente pour éviter toute confusion, et ce dans toutes les langues cibles. Pour les contenus spécialisés, nous établissons un glossaire en amont du projet, qui est enrichi au fur et à mesure des traductions. Ce glossaire permet d’avoir une maîtrise totale de la terminologie utilisée.

Style : Chaque contenu audiovisuel a son propre style, qu’il soit formel, informel, humoristique, technique, etc. Lors de la traduction des sous-titres, il est important de respecter le style spécifique au contenu d’origine et de le transposer dans la langue cible. Le sens critique du traducteur garantit la préservation de l’atmosphère, de l’humour et des nuances du contenu, offrant ainsi une traduction authentique et fidèle. En cas de difficultés (parties inaudibles, jeux de mots, second degré, terminologie très spécifique, etc.), nous soumettons nos propositions ou alternatives au client pour validation.

Temps de lecture : Comme indiqué précédemment, il est essentiel que le traducteur respecte les contraintes temporelles de lecture et adapte sa traduction en conséquence. Le traducteur veille à ce que les sous-titres traduits puissent être lus et compris facilement dans le temps imparti, sans que le spectateur se sente pressé ou débordé.

Lisibilité : Comme mentionné précédemment, la lisibilité des sous-titres est cruciale pour offrir une expérience de visionnage agréable. Le traducteur accorde une attention particulière aux choix stylistiques qui peuvent influencer la lisibilité, tels que la longueur des phrases et l’utilisation de mots ou d’expressions concises.

Point clé - Cohérence terminologique, style, temps de lecture et lisibilité des sous-titres traduits : Le traducteur professionnel garantit la cohérence terminologique, maintient le style, tout en assurant une lisibilité temporelle et spatiale des sous-titres. Sa traduction offre une expérience de visionnage fluide et claire pour le spectateur. Cela permet de préserver l'intégrité du contenu original tout en offrant une adaptation linguistique de qualité, facilitant ainsi l'accès à des contenus audiovisuels pour un public plus large ou spécialisé.

2.4 Assurance qualité des traductions et des sous-titres

L’évaluation de la qualité des traductions de sous-titres est une étape essentielle pour garantir que les sous-titres traduits répondent aux normes de qualité requises. Notre procédure d’assurance qualité réalise une vérification à toutes les étapes clés de votre projet de sous-titrage, de sa conception à sa livraison, et comprend les éléments suivants :

Précision et fidélité des traductions : Nos tests de qualité veillent à ce que vos sous-titres soient traduits avec précision et fidélité au contenu d’origine. Il est crucial que les traductions transmettent le sens et l’intention des dialogues avec exactitude, sans altérer le message ou déformer les nuances du contenu. En cas de parties audio peu compréhensibles, nous informons le client et proposons des solutions alternatives cohérentes avec les propos précédents et suivants. Si des jeux de mots ou autres effets de style présents dans le dialogue original sont impossibles à traduire littéralement, nous offrons des alternatives cohérentes et réfléchies au client.

Cohérence terminologique : Comme mentionné précédemment, il est important de maintenir une cohérence terminologique entre les différentes traductions. Grâce à l’utilisation d’un glossaire multilingue établi en amont et pendant le projet, l’évaluation de la qualité est facilitée. Le glossaire permet de vérifier si les mêmes termes et expressions sont utilisés de manière cohérente tout au long des sous-titres. Cela contribue à une expérience de visionnage cohérente, évitant toute confusion ou ambiguïté pour le spectateur.

Style et tonalité : Chaque contenu audiovisuel est unique, avec son propre style et sa propre tonalité, qui doivent être respectés lors de la traduction des sous-titres. Notre processus d’assurance qualité permet d’identifier immédiatement les problématiques au niveau de la transcription (parties inaudibles), de la synchronisation (chevauchements des sous-titres avec les textes à l’écran), de la traduction et de l’adaptation (jeux de mots, termes spécifiques métier, etc.). Notre objectif est de proposer des solutions linguistiques adaptées et personnalisées, préservant ainsi l’intention du contenu original dans la traduction. Cela garantit que l’atmosphère et l’intention du contenu original sont communiquées au spectateur à travers la traduction des sous-titres, offrant ainsi une expérience de visionnage cohérente et immersive.

Lisibilité et synchronisation : La qualité de la lisibilité des sous-titres et leur synchronisation avec le contenu audiovisuel sont des aspects techniques fondamentaux. Les sous-titres doivent être affichés avec une taille de police adéquate, un contraste approprié et une vitesse de lecture adaptée pour faciliter la compréhension et la lecture fluide. Nous réalisons des tests pour évaluer la qualité et nous assurer que les sous-titres sont parfaitement synchronisés avec le timing du contenu vidéo, évitant ainsi tout décalage ou problème de lecture.

Point clé - Assurance qualité : C'est un processus que nous mettons en place à toutes les étapes du projet. Les parties de la vidéo inaudibles sont identifiées dès la phase de transcription, les sous-titres sont repositionnés lors de la phase de synchronisation pour éviter les chevauchements avec les textes à l'écran, le sens critique du traducteur garantit des traductions fidèles (jeux de mots, second degré, etc.) et l'emploi d'une terminologie cohérente. Enfin, nous effectuons des tests pour nous assurer de la bonne lisibilité graphique des sous-titres.

2.5 Incrustation des sous-titres traduits et exportation

Pour réaliser l’incrustation des traductions des sous-titres dans votre vidéo, nous utilisons le logiciel Adobe Premiere qui permet une grande liberté dans la définition précise des points suivants.

Taille et position : les sous-titres doivent être suffisamment grands pour être lus facilement à l’écran, tout en ne perturbant pas le contenu vidéo. Ces paramètres peuvent varier selon la résolution de l’écran et la distance de visionnage (cinéma, Web, réunion, 3D, dôme…). La taille de police recommandée est généralement d’environ 30 points et les types de police les plus utilisés sont Arial, Times New Roman, Verdana, Helvetica et Roboto. Les sous-titres doivent être positionnés dans la partie inférieure de l’écran, généralement centrés ou légèrement décalés vers le bas pour éviter de recouvrir les éléments importants de l’image. Pour les chevauchements, se référer à la section 3.3 de ce livre blanc.

Durée d’affichage : les sous-titres traduits doivent être affichés à l’écran pendant une durée suffisante pour permettre aux spectateurs de les lire et de les comprendre sans difficulté. La durée d’affichage peut varier de 1 à 10 secondes sachant que nous recommandons une durée de 1 à 3 secondes par ligne de sous-titre. Ce sont les paramètres CPL et CPS qui vont déterminer la durée (cf section 3.4 de ce livre blanc). L’objectif est de prendre en compte la complexité des dialogues et le rythme du contenu vidéo pour trouver un équilibre entre la lisibilité et temps d’écran du contenu audiovisuel.

Lisibilité : la traduction des sous-titres doit être lisible facilement, même dans des conditions de visionnage difficiles. Il est recommandé d’utiliser une police de caractères claire et sans empattement, telle que celles-ci-dessus mentionnées. Le contraste entre les sous-titres et l’arrière-plan doit être suffisant pour assurer une lisibilité optimale. Il est préférable d’utiliser une couleur de texte claire sur un fond foncé ou vice versa, en évitant les combinaisons de couleurs qui pourraient rendre les sous-titres difficiles à lire. Il est également possible de jouer sur avec l’ombre en mettant par exemple des sous-titres blancs avec un contour de 2 ou 3 points. Ce type de sous-titres passe partout le contenu vidéo soit clair ou foncé.

Style et formatage : la traduction des sous-titres doit respecter le style et le formatage du contenu original s’il est déjà sous-titré dans la langue source. Les italiques, les majuscules, la ponctuation et autres éléments de mise en forme doivent être conservés pour préserver l’intention et l’expression des dialogues.

Point clé – Incrustation des sous-titres : définir les règles d'incrustation afin que les traductions des sous-titres soient présentées de manière claire, lisible et esthétiquement cohérente avec le contenu audiovisuel. Éléments auxquels il faut prêter la plus grande attention : taille et position, traitement des chevauchements, durée d’affichage, lisibilité, style et formatage.

Techniques de sous-titrage et formats de sous-titres

3.1 Sous-titrage intralinguistique

Le sous-titrage intralinguistique consiste à fournir des sous-titres dans la même langue que celle de l’audio d’origine. Il a divers objectifs : aider les personnes sourdes ou malentendantes à comprendre le contenu audiovisuel, permettre aux moteurs de recherche de référencer vos contenus vidéos, supporter les acteurs/speakers lors de l’enregistrement de leurs voix ou encore fournir des informations supplémentaires aux spectateurs.

Transcription et sous-titrage intralinguistique : si la qualité de l’audio le permet et que les locuteurs sont de langue maternelle, nous recommandons d’utiliser l’intelligence artificielle et les technologies STT (Speech-To-Text). Vous obtiendrez exactement le même résultat qu’avec un transcripteur (à savoir des sous-titres transcris et adaptés 100% fiables) à moindre coût. Quelques soient vos programmes préenregistrés tels que les films, les émissions de télévision, les documentaires, etc., ces technologies permettent de traiter rapidement des projets à forte volumétrie.

Sous-titrage en mode karaoké : ce type de sous-titres est utilisée pour les programmes musicaux ou les clips vidéo où les paroles des chansons sont affichées à l’écran en synchronisation avec la musique. Nous utilisons également ce type de sous-titres pour le doublage. En effet certains acteurs/speakers se servent de cette technique pour réaliser leurs enregistrements.

Sous-titrage pour les sons non verbaux, lieux et autres informations : outre les dialogues, le sous-titrage intralinguistique peut également inclure des informations sur les sons importants tels que les bruits, les rires, les pleurs, les musiques d’ambiance, les lieux, etc. Ces indications visuelles aident à faire ressentir au spectateur l’atmosphère sonore et les éléments de l’audio qui ne sont sous-jacents aux dialogues.

Point clé – Sous-titrage intralinguistique : les technologies de reconnaissance vocale STT et de synchronisation automatique permettent de faciliter le processus de sous-titrage intralinguistique en accélérant les délais de réalisation et en réduisant considérablement les budgets.

3.2 Sous-titrage interlinguistique

Le sous-titrage interlinguistique consiste à traduire et à sous-titrer le contenu audiovisuel d’une langue source vers une ou plusieurs langues cibles différentes. Cette prestation s’effectue en 4 étapes : la synchronisation, la traduction, l’adaptation et le contrôle.

Synchronisation temporelle : une fois la transcription effectuée, les sous-titres en langue source doivent être synchronisés avec le contenu audiovisuel. Cette étape implique l’ajustement des sous-titres pour qu’ils apparaissent et disparaissent au bon moment, en tenant compte des dialogues, des pauses, des changements de scène… L’avantage de réaliser cette tâche en amont de la traduction et que les sous-titres de chaque langue traduite seront synchronisés de manière uniforme. En outre, cette tâche n’est réalisée qu’une seule fois, ce qui permet de réaliser des économies budgétaires et de temps. Néanmoins, si nécessaires, des ajustements en post-production peuvent être réalisés.

Traduction 100% humaine : si vos budgets le permettent, nous recommandons toujours une traduction complètement humaine car la qualité sera toujours supérieure à celle d’une traduction automatique post-éditée. Pour les contenus à caractère spécialisé où le sens critique du traducteur est nécessaire, les langues rares et les dialogues rapides, nous recommandons fortement une traduction 100% humaine.

Utilisation de logiciels de traduction automatique : l’intelligence artificielle fournit des traductions automatiques de qualité exploitable si le contenu vidéo ne demande pas de compétences spécifiques. C’est-à-dire, des dialogues simples, pas trop rapides, sans second degré et dans un langue de destination répandue. Dans ces cas de configuration, le traducteur peut réaliser une post-édition réduisant le tarif à 75% de celui de base. 

Adaptation culturelle et linguistique : lors de la traduction des sous-titres, le traducteur doit prendre en compte les différences culturelles et linguistiques entre la langue source et la langue cible. Il peut ainsi adapter les références culturelles, les jeux de mots, les expressions idiomatiques et d’autres éléments pour qu’ils soient compréhensibles et pertinents dans la langue cible.

Contrôle de la lisibilité : les sous-titres doivent être traduits de manière à être lisibles et compréhensibles pour les spectateurs avec un temps de lecture adapté. Cela implique une traduction et adaptation professionnelle, des choix graphiques appropriés (polices de caractères, gestion des chevauchements…) et une durée d’affichage des sous-titres réfléchie (CPL et CPS).

Point clé – Sous-titrage interlinguistique : nous recommandons fortement de produire vos sous-titres avec des traductions et adaptations 100% humaines. Néanmoins le cas échant, l’intelligence artificielle et la traduction neuronale peuvent permettre des économies de l’ordre de 25% et peuvent être indiquées pour des contenus audiovisuels non spécialisés.

3.3 Traduction des cartons et textes apparaissant à l’écran – traitement des chevauchements

Il est fondamental d’éviter tout chevauchement des sous-titres avec les cartons et les textes apparaissant à l’écran. Voici quelques bonnes pratiques à réaliser en amont de votre projet de traduction de sous-titres :

Analyser attentivement le contenu audiovisuel : avant même de commencer la transcription, il convient de visionner attentivement le contenu audiovisuel pour noter quand des cartons ou des textes apparaissent à l’écran. Cette phase de repérage permet de lister leur emplacement et leur durée d’affichage (TC-In et TC-Out) à l’écran mais aussi leur contenu.

Modifier la position d’affichage des sous-titres traduits : un fois ce repérage effectué, il est possible de modifier l’emplacement des sous-titres traduits pour éviter quelconques chevauchements à l’écran entre cartons et textes. Par exemple, les sous-titres être temporairement positionnés en haut de l’écran ou bien juste au-dessus des cartons.  Ne pas oublier qu’il faut également laisser suffisamment de place à l’écran pour que les textes ne perturbent pas le visionnage du contenu audiovisuel.

Moduler la durée d’affichage des sous-titres : Si le contexte le permet, apparition brève à l’écran d’un carton ou d’un texte, nous pouvons moduler la durée d’affichage des sous-titres traduits pour éviter les chevauchements. Dans ce cas de figure, nous synchronisons les sous-titres pour qu’ils disparaissent/apparaissent avant ou après le carton ou le texte.

Utiliser des outils de sous-titrage professionnels : les logiciels de sous-titrage professionnels que nous utilisons offrent des fonctionnalités avancées pour gérer les chevauchements. Nous pouvons ainsi ajuster facilement la synchronisation, définir des positions d’affichage spécifiques, modifier la durée d’affichage des sous-titres, etc.

Effectuer des relectures et des tests : une fois les sous-titres traduits, nous effectuons plusieurs relectures et visionnages afin de de s’assurer de l’absence de chevauchement entre cartons et textes à l’écran.

Point clé – Chevauchement : Éviter les chevauchements à l’écran entre textes sous-titres et cartons est un travail méticuleux et professionnel en plusieurs étapes : repérage précis des emplacements des textes/cartons, choix des repositionnements en amont de projet, et vérifications.

3.4 Choix des paramètres CPL (Caractères Par Ligne) et CPS (Caractères Par Seconde)

En amont de votre projet de traduction de sous-titres, nous déterminons ensemble la valeur des paramètres CPL (Caractères Par Ligne) et CPS (Caractères Par Seconde). Ces paramètres essentiels permettent de garantir la lisibilité et le respect des contraintes temporelles. Voici nos conseils pour choisir les paramètres CPL et CPS appropriés :

Considérer la lisibilité : le paramètre CPL représente le nombre de caractères qui peuvent être affichés par ligne de sous-titre. Il faut alors choisir une longueur de ligne qui permet une lisibilité optimale. Les lignes trop longues peuvent être difficiles à lire rapidement, tandis que les lignes trop courtes peuvent sembler fragmentées et a fortiori pas naturelles. En général, nous recommandons des sous-titres entre 40 et 50 caractères par ligne, mais cela peut varier en fonction de la langue de traduction et de la police utilisée.

Adapter le CPS à la vitesse de lecture : le paramètre CPS représente le nombre de caractères qui peuvent être affichés par seconde. Il est important de choisir un CPS qui correspond à la vitesse de lecture moyenne du public visée. Évidement trop de texte affiché trop rapidement rend la lecture difficile, tandis que trop peu de texte affiché trop lentement ne permet pas au spectateur de suivre le contenu audiovisuel. En règle générale, nous recommandons un CPS compris entre 15 et 20 caractères.

Tenir compte des contraintes temporelles : les sous-titres doivent être synchronisés avec le contenu audiovisuel, en prenant en compte toutes les subtilités telles que les pauses, les changements de scène et les dialogues entre-coupés. Il est important de veiller à ce que la traduction des sous-titres apparaisse et disparaisse de façon fluide pour assurer la meilleure expérience de visionnage possible. Le choix du CPS d’être en accord avec ces contraintes temporelles et une lisibilité agréable.

Effectuer des relectures et des tests : une fois les sous-titres traduits et synchronisés, nous effectuons toujours des relectures et des tests pour nous assurer que les paramètres CPL et CPS choisis sont en accord avec le contenu audiovisuel. Nous vérifions la visibilité à l’écran, la synchronisation et l’expérience globale. Enfin, cette phase nous permet d’apporter des ajustements finaux et nécessaires.

Point clé – Choix des paramètres CPL et CPS : les paramètres CPL et CPS sont deux éléments essentiels qui garantissent l’équilibre entre lisibilité des sous-titres traduits, synchronisation et contraintes temporelles. En règle générale, nous recommandons de les fixer à 50 CPL et 20 CPS sachant qu’ils peuvent être revus à la baisse ou à la hausse selon les caractéristiques spécifiques du contenu et de la langue de traduction.

Utilisation de l’intelligence artificielle dans la traduction de sous-titres

4.1 Reconnaissance vocale STT (Speech-To-Text)

La qualité de la transcription et de la synchronisation sont deux éléments fondamentaux pour obtenir une traduction de qualité de vos sous-titres. L’utilisation de la reconnaissance vocale, également connue sous le nom de Speech-to-Text (STT), pour réaliser cette première étape du sous-titrage de vos vidéos présente plusieurs avantages :

Automatisation du processus : la reconnaissance vocale STT permet d’automatiser une partie du processus de traduction de sous-titres, à savoir les phases de transcription et de synchronisation. Plus besoin de saisir manuellement les dialogues en amont de la traduction, la reconnaissance vocale convertit automatiquement la parole en texte avec un taux de précision supérieur à 90% pour les langues les plus répandues, ce qui peut considérablement accélérer le processus de traduction.

Gain de temps : la reconnaissance vocale automatique est bien plus efficace que celle humaine, elle permet ainsi de gagner du temps lors de la transcription et de la synchronisation. Cet outil permet de gérer rapidement des projets de sous-titrages ou doublage avec des délais serrés et/ou avec une quantité importante de contenu à traduire.

Précision garantie par une relecture humaine : les avancées dans les domaines de Deep et Machine Learning ont permis d’avoir des algorithmes de reconnaissance vocale précis et fiables. Nos équipes sont spécialisées dans l’utilisation de ces logiciels relie chaque transcription, ce qui nous permet d’offrir à nos clients des transcriptions time codées précises à 100% et à des tarifs défiants toute concurrence.

Langues moins courantes et/ou audio de mauvaise qualité : la reconnaissance vocale automatique présente certaines limites lorsque la langue originale est peu répandue, et/ou que la qualité de l’audio est médiocre, et dans certains également quand le locuteur a un accent peu commun (pas de langue maternelle). Si votre contenue correspond à une ou plusieurs de ces descriptions, alors il faut opter pour des logiciels de sous-titrages traditionnels non-automatisés, car les algorithmes que nous utilisions ne sont pas encore assez entrainés à traiter ce genre de projets.

Point clé – Reconnaissance vocale : l’utilisation de la reconnaissance vocale STT permet de faire des économies de temps et de budget lors de la transcription et la synchronisation. Grace à notre expertise et la relecture par notre équipe, les transcriptions et les synchronisations sont 100% fiables. Pour les langues rares, les accents atypiques, et les vidéos avec des dialogues rapides ou des bruits de fond, nous préconisons l’utilisation de techniques plus traditionnelles et non automatisées pour le sous-titrage.

4.2 Limites de la traduction neuronale dans la traduction de sous-titres

Depuis 2018, la traduction neuronale basée sur l’intelligence artificielle (IA) a connu des avancées majeures. Dans le cas de projets simples et génériques, elle fournit des traductions de qualité suffisante. Néanmoins, nous recommandons toujours que la relecture attentive par traducteur qui réalise alors une prestation de post-édition généralement facturée à 75% du tarif de base. Pour des projets de sous-titrage spécialisés, pointus ou dans une langue rare, il devient très compliqué d’utiliser la traduction neuronale. En effet, les algorithmes d’apprentissage profond qui produisent des traductions neuronales, doivent être entrainés sur des grandes bases de données pour gagner en précision.  Les sous-titres traduits sont alors peu naturels et inexploitables. Voici quelques-unes une liste non exhaustive des principales limites de la traduction neuronale :

Compréhension du contexte et absence de sens critique : dès qu’entre en jeu des métaphores ou du second degré, les modèles de traduction neuronale rencontrent des difficultés dans la compréhension des contextes spécifiques, ce qui conduit logiquement à des traductions incorrectes et peu naturelles. Notre expérience nous a montré que la traduction neuronale prend peu en compte les nuances, les jeux de mots, les expressions idiomatiques et les références culturelles. Cela entraîne une perte de sens ou des erreurs de traduction.

Gestion des langues moins courantes : les algorithmes d’apprentissage profond qui produisent des traductions neuronales, doivent être entrainés sur des grandes bases de données pour gagner en précision. Ces modèles sont donc plus performants pour les langues les plus couramment utilisées ; ils présentent cependant des failles importantes pour les langues moins courantes ou dans un cas assez particulier l’arabe car au fonctionnement grammatical différent. La post-édition devient alors très chronophage dans le sens où la traduction directe permet dans ce cas de gagner en temps et qualité.

Spécificités terminologiques et domaines spécialisés : les modèles de traduction neuronale ne peuvent pas être aussi précis ou cohérents que les experts du secteur. Aussi pour la traduction de termes techniques, scientifiques, juridiques ou médicaux, qui nécessitent une expertise spécialisée, l’intelligence artificielle montre clairement ses limites. Les traductions nécessitent une post-édition manuelles plus importante et précise pour garantir l’exactitude des sous-titres traduits.

Confidentialité des données : comme dit précédemment, les modèles de traduction neuronale basés sur l’intelligence artificielle nécessitent de grandes quantités de données pour les entraîner. Ainsi, les données de vos traductions sont récupérées et transmises aux développeurs, ce qui peut soulever des préoccupations en matière de confidentialité, notamment lorsque des données sensibles ou confidentielles doivent être traduites.

Point clé – Traduction neuronale : malgré les limites citées ci-dessus, la traduction neuronale basée sur l’apprentissage profond constitue une base acceptable et exploitable pour la majeur partie des projets simples. Le traducteur humain peut alors effectuer une relecture et une post-édition à coûts réduits. On vous garantit ainsi des traductions de qualité et précises. Lors de projets à caractère spécialisés où l’expertise du traducteur est très sollicitée, nous recommandons une traduction 100% humaine afin d’obtenir des sous-titres traduits et pertinents.

4.3 Doublage voix synthétiques à partir des fichiers de sous-titres traduits (technologie Text-To-Speech)

Réaliser du doublage avec des voix synthétiques n’est plus de la science-fiction, nous avons tester cette technologie avec de nombreux projets de doublage et la qualité est bluffante. Il est possible de générer une voix synthétique à partir des textes sous-titres et leurs synchronisations, en utilisant notre logiciel Sub2Dub© se basant sur la technologie Text-to-Speech (TTS). Voici quelques avantages :

Rapidité et efficacité : la synthèse vocale permet de générer en quelques clics des voix dans différentes langues à partir des textes traduits. Et pas d’inquiétude pour la synchronisation, elle utilise les commandes données par les fichiers sources. Ainsi, la création de versions doublées dans plusieurs langues est bien plus rapide, comparée à l’enregistrement de voix humaines, qui est un processus plus long et coûteux. Logiquement, ce type de prestations est adapté à une certaine catégorie de vidéos comme des formations ou des documentaires factuels. La synthèse vocale sera moins de contenus plus artistiques qui requièrent l’expertise d’un doubleur professionnel comme les films ou les séries TV. Nous réalisons toujours un test sur 3 minutes via notre logiciel Sub2Dub© afin de pouvoir évaluer la qualité et voir si elle correspond à vos standards.

Flexibilité linguistique : tout comme la traduction neuronale, la technologie TTS est basée sur des algorithmes d’apprentissage profond. Elle nécessite l’accès à une grande base de données pour produire un contenu de qualité. Il est donc facile de générer des voix pour les langues et les accents les plus utilisés dans le monde ; cela s’avère en revanche plus compliqué pour les moins courants. Pour les langues plus usitées, ces modèles sont riches et permettent d’obtenir une qualité de voix de synthèse très similaire aux voix humaines. Pour les langues plus rares, l’expérience démontre qu’il est plus simple de recourir au doublage humain.

Adaptation aux besoins spécifiques : la synthèse vocale à travers notre applicatif Sub2Dub© permet une grande flexibilité et s’adapte à tous vos besoins. Nos ingénieurs son contrôlent précisément la prononciation, l’intonation et le rythme des voix notre applicatif mais aussi des paramètres comme l’âge, le sexe et le ton de voix. On ajuste notre prestation pour correspondre au mieux aux caractéristiques des personnages ou des locuteurs originaux. Cela permet de produire des doublages de synthèses de haute qualité et de mieux s’adapter aux nuances et aux émotions des dialogues.

Contrôle de la qualité : Comme pour toutes les procédures automatisées que nous utilisons, nous préconisons une relecture humaine par nos experts ingénieurs son ou traducteurs. Ils vérifient ainsi que l’audio et la vidéo sont cohérents et garantissent une qualité incomparable.

Coût réduit : l’utilisation de la synthèse vocale supprime jusqu’à 80% des coûts associés au doublage humain. En effet, les coûts inhérents à la rémunération des acteurs de doublage et les frais de studio d’enregistrement sont inexistants.

Point clé – Doublage voix synthétiques : avant de réaliser votre le doublage de votre vidéo, nous recommandons vivement de réaliser un test de 3 minutes afin d’évaluer si le rendu audio en voix synthétiques correspond à vos attentes. Ce test peut être réalisé gratuitement via notre applicatif Sub2Dub©. Il faut garder en mémoire que malgré les améliorations significatives de la synthèse vocale, les voix synthétiques peuvent encore manquer de naturel et d’expressivité comparées aux voix humaines. Aussi, pour certains types de vidéos, l'enregistrement humain reste préférable.

Conclusion

6.1. Récapitulation des points clés

Comment traduire et sous-titrer une vidéo

Point clé – Transcription et synchronisation : Le choix des outils techniques et du transcripteur aun impact majeur sur la qualité de la transcription time codée, qui est essentielle pour les activités de sous-titrage, de doublage et de montage vidéo. Selon le type de projet, l’utilisation de l’IA peut réduire le budget alloué jusqu’à 3 fois.

Point clé – Adaptation en fonction des contraintes de temps et d’espace : les sous-titres doivent être adaptés en fonction des différentes langues de traduction dans le respect des contraintes de temps et d’espace (spotting, temps de lecture, chevauchements…) afin de garantir au spectateur la meilleure expérience de visionnage/lecture quelle que soit sa langue ou sa capacité auditive.

Point clé – Cohérence terminologique, style, temps de lecture et lisibilité des sous-titres traduits : Le traducteur professionnel garantit la cohérence terminologique, maintient le style, tout en assurant une lisibilité temporelle et spatiale des sous-titres. Sa traduction offre une expérience de visionnage fluide et claire pour le spectateur. Cela permet de préserver l’intégrité du contenu original tout en offrant une adaptation linguistique de qualité, facilitant ainsi l’accès à des contenus audiovisuels pour un public plus large ou spécialisé.

Point clé – Assurance qualité : C’est un processus que nous mettons en place à toutes les étapes du projet. Les parties de la vidéo inaudibles sont identifiées dès la phase de transcription, les sous-titres sont repositionnés lors de la phase de synchronisation pour éviter les chevauchements avec les textes à l’écran, le sens critique du traducteur garantit des traductions fidèles (jeux de mots, second degré, etc.) et l’emploi d’une terminologie cohérente. Enfin, nous effectuons des tests pour nous assurer de la bonne lisibilité graphique des sous-titres.

Point clé – Incrustation des sous-titres : définir les règles d’incrustation afin que les traductions des sous-titres soient présentées de manière claire, lisible et esthétiquement cohérente avec le contenu audiovisuel. Éléments auxquels il faut prêter la plus grande attention : taille et position, traitement des chevauchements, durée d’affichage, lisibilité, style et formatage.

Techniques de sous-titrage et formats de sous-titres

Point clé – Sous-titrage intralinguistique : les technologies de reconnaissance vocale STT et de synchronisation automatique permettent de faciliter le processus de sous-titrage intralinguistique en accélérant les délais de réalisation et en réduisant considérablement les budgets.

Point clé – Sous-titrage interlinguistique : nous recommandons fortement de produire vos sous-titres avec des traductions et adaptations 100% humaines. Néanmoins le cas échant, l’intelligence artificielle et la traduction neuronale peuvent permettre des économies de l’ordre de 25% et peuvent être indiquées pour des contenus audiovisuels non spécialisés.

Point clé – Chevauchement : Éviter les chevauchements à l’écran entre textes sous-titres et cartons est un travail méticuleux et professionnel en plusieurs étapes : repérage précis des emplacements des textes/cartons, choix des repositionnements en amont de projet, et vérifications.

Point clé – Choix des paramètres CPL et CPS : les paramètres CPL et CPS sont deux éléments essentiels qui garantissent l’équilibre entre lisibilité des sous-titres traduits, synchronisation et contraintes temporelles. En règle générale, nous recommandons de les fixer à 50 CPL et 20 CPS sachant qu’ils peuvent être revus à la baisse ou à la hausse selon les caractéristiques spécifiques du contenu et de la langue de traduction.

Utilisation de l’intelligence artificielle dans la traduction de sous-titres

Point clé – Reconnaissance vocale : l’utilisation de la reconnaissance vocale STT permet de faire des économies de temps et de budget lors de la transcription et la synchronisation. Grace à notre expertise et la relecture par notre équipe, les transcriptions et les synchronisations sont 100% fiables. Pour les langues rares, les accents atypiques, et les vidéos avec des dialogues rapides ou des bruits de fond, nous préconisons l’utilisation de techniques plus traditionnelles et non automatisées pour le sous-titrage.

Point clé – Traduction neuronale : malgré les limites citées ci-dessus, la traduction neuronale basée sur l’apprentissage profond constitue une base acceptable et exploitable pour la majeur partie des projets simples. Le traducteur humain peut alors effectuer une relecture et une post-édition à coûts réduits. On vous garantit ainsi des traductions de qualité et précises. Lors de projets à caractère spécialisés où l’expertise du traducteur est très sollicitée, nous recommandons une traduction 100% humaine afin d’obtenir des sous-titres traduits et pertinents.

Point clé – Doublage voix synthétiques : avant de réaliser votre le doublage de votre vidéo, nous recommandons vivement de réaliser un test de 3 minutes afin d’évaluer si le rendu audio en voix synthétiques correspond à vos attentes. Ce test peut être réalisé gratuitement via notre applicatif Sub2Dub©. Il faut garder en mémoire que malgré les améliorations significatives de la synthèse vocale, les voix synthétiques peuvent encore manquer de naturel et d’expressivité comparées aux voix humaines. Aussi, pour certains types de vidéos, l’enregistrement humain reste préférable.

6.2. Perspectives pour l’avenir de la traduction et des sous-titres

Ce livre blanc vise à servir de référence aux traducteurs de sous-titres vidéo et à tous ceux qui souhaitent en savoir plus sur la traduction de sous-titres de haute qualité. Nous avons détaillé toutes les règles et bonnes pratiques que les traducteurs doivent appliquer lors de la traduction des sous-titres, ainsi que les techniques qui garantissent des sous-titres parfaitement traduits.

En outre, la section consacrée à l’intelligence artificielle (reconnaissance vocale, traduction neuronale et synthèse vocale) nous a permis d’identifier les nombreux avantages que ces technologies de pointe nous offrent, tels que la réduction des coûts et l’accélération des délais. Nous avons également souligné les limites de l’IA dans ces domaines.

Il est indéniable que la production de contenus audiovisuels va continuer à croitre dans les années à venir, et l’intelligence artificielle permet aux traducteurs d’optimiser leur temps à l’aide d’outils de plus en plus performants. Ainsi, le rôle du traducteur et il doit adapter ses compétences en accord avec la demande : affiner son sens critique, car les contenus vidéo seront de plus en plus spécialisés et internationaux, tout en maîtrisant parfaitement les nouvelles technologies de l’IA. Il doit jongler entre les deux majeurs enjeux de la traduction, c’est-à-dire fournir des traductions de qualité 100% humaine, tout en offrant des tarifs et des délais réduits grâce à l’utilisation des technologies de l’IA. Cette évolution rapide nécessite une adaptation continue de la part des traducteurs, qui doivent rester informés des dernières avancées technologiques et les intégrer de manière judicieuse dans leur travail, en veillant toujours à préserver la qualité et l’authenticité des traductions. En combinant l’expertise humaine et les outils de l’intelligence artificielle, nous pourrons relever avec succès les défis futurs de la traduction et du doublage de sous-titres dans un paysage audiovisuel en constante évolution.