Insider

Accélérer le processus de doublage de voix avec les solutions d'IA pilotées par NVIDIA

Objectif

Insider utilise la solution d'IA de Papercup, qui fonctionne sur les GPU NVIDIA A100, pour localiser les vidéos nouvelles et existantes de manière rapide et économique, afin d'atteindre et de fidéliser davantage un public international.

Client

Insider

Partenaire

Papercup

Utilisation

Multimédia et divertissement

Technologie

GPU NVIDIA A100

Insider utilise la solution d'IA de Papercup, qui fonctionne sur les GPU NVIDIA A100, pour localiser les vidéos nouvelles et existantes de manière rapide et économique, afin de pouvoir atteindre et engager davantage le public mondial.

Insider est un service de publication d'actualités en ligne international. Elle fait partie d'Insider Inc., elle-même société de média en ligne américaine. Depuis son rachat par Axel Springer en 2015, Insider a développé une forte présence sur les marchés anglophones du monde entier. La prochaine étape pour l'entreprise était de toucher un public international, et notamment non anglophone dans des pays où le contenu vidéo d'Insider était déjà relativement populaire.

Le doublage vocal consiste à remplacer les dialogues d'une vidéo par une version traduite. Ce processus est fréquemment employé pour traduire du contenu dans d'autres langues, afin de proposer une alternative aux sous-titres. Toutefois, le processus de doublage habituel est souvent couteux et prend du temps, ce qui le rendait jusqu'à présent inaccessible pour la plupart des entreprises.

Papercup est une startup en IA qui souhaite rendre disponible les vidéos du monde entier dans n'importe quelle langue. Pour ce faire, elle automatise une grande partie du processus de doublage et utilise des voix d'IA qui ressemblent à des voix humaines et qui ont été entrainées sur leurs propres algorithmes d'apprentissage automatique. La solution d'IA de Papercup fonctionne sur des GPU NVIDIA A100 et permet aux entreprises multimédia, aux grandes entreprises et aux plateformes d'e-learning de rendre leurs contenus existants accessibles à un public international.

Grâce à Papercup, membre du programme international NVIDIA Inception à destination des Startups, Insider a pu accélérer sa croissance sur les marchés cibles en localisant son catalogue existant de vidéos informatives.

Une vidéo par Insider, doublée à l'aide de la technologie d'IA de Papercup

Insider souhaitait toucher un public international. Le doublage traditionnel consiste à remplacer les dialogues dans les contenus vidéo par des pistes traduites, mais il s'agit d'un processus souvent coûteux et qui prend du temps. Insider s’est donc tourné vers la solution d’IA de Papercup, qui fonctionne sur les GPU NVIDIA A100 :

  • La solution d'IA de Papercup permet de rendre les vidéos disponibles dans n'importe quelle langue, en utilisant des voix d'IA entrainées via leurs propres algorithmes d'apprentissage automatique.
  • Les charges de travail d'apprentissage automatique de Papercup s'exécutent sur des GPU NVIDIA A100, à la fois sur site et dans le Cloud.
  • Grâce à Papercup, Insider a pu accélérer sa croissance sur les marchés ciblés en localisant son catalogue de contenu vidéo informatif.
  • Au cours des 12 premiers mois suivant le lancement de nouvelles chaînes sur YouTube et Facebook à destination des pays d'Amérique Latine et d'Europe, Insider a réussi à atteindre des centaines de millions de nouveaux spectateurs.

La nécessité de solutions de localisation de contenu qui permettent de gagner du temps

Insider souhaitait toucher un public international pour deux raisons majeures :

  • Premièrement, les médias numériques dépendent de la croissance du public pour monétiser son offre (croissance mesurée principalement par la portée et l’engagement).
  • Deuxièmement, offrir au public du contenu dans sa langue maternelle était une étape cruciale pour renforcer l'image de marque existante d’Insider.

Toutefois, la localisation de nouvelles et de contenus factuels repose sur des délais d’exécution rapides, qui correspondent à l’actualité du contenu. Autrement dit, l’équipe ne pouvait pas employer le doublage en studio traditionnel : un processus souvent chronophage et coûteux.

Historiquement, Insider utilisait des sous-titres comme solution rentable et rapide, mais le changement des habitudes des consommateurs signifie un engagement plus élevé avec le contenu doublé. Le partenariat avec Papercup a permis à Insider de doubler ses vidéos de manière beaucoup plus rentable et avec des délais qui garantissent un contenu pertinent.

"...pour le calcul GPU sous-jacent, il est pour nous inimaginable d'envisager d'exécuter nos charges de travail d'entrainement et d’inférence ailleurs. Nous constatons une augmentation de 5 à 10 fois de la vitesse des charges de travail d'entrainement à chaque fois que nous passons sur une nouvelle famille d'architecture NVIDIA."

James Leoni
responsable de l'apprentissage automatique chez Papercup

Vers de nouvelles possibilités avec Papercup, NVIDIA et l'IA

Les voix générées par l’IA de Papercup ont un niveau d’expressivité qui l’emporte sur l’engagement généré par le sous-titrage. La qualité des voix générées par l’IA est vérifiée par des traducteurs humains, ce qui signifie qu'Insider est en mesure de conserver sa qualité de marque reconnaissable. Et comme l’IA fait le gros du travail, le processus de localisation s’intègre au processus de création de contenu existant d’Insider, ce qui permet aux équipes de traduire avec un minimum d’effort tout en offrant un potentiel de rendement élevé.

Les charges de travail de Deep Learning et d'inférence sont accélérées par les GPU NVIDIA A100, tandis que la synthèse vocale en production est traitée par des GPU NVIDIA dans le Cloud, gérés par le serveur d’inférence Triton. Passer leurs modèles en production sur ce serveur est un élément clé de la stratégie visant à améliorer les performances, la flexibilité et l'utilisation des GPU pendant la synthèse vocale.

Aperçu de la plateforme de doublage par l'IA de Papercup pendant le processus de contrôle de la qualité

Le studio de doublage par l'IA de Papercup traduit, segmente et crée automatiquement une voix off d'IA

"Triton nous offre l'avantage d'augmenter notre débit de synthèse et il facilite grandement l'optimisation de nos latences de bout en bout en prenant en charge des frameworks d'inférence tels qu'ONNX et TensorRT", déclare James Leoni, responsable de l'apprentissage automatique chez Papercup. "Et pour le calcul GPU sous-jacent, il est pour nous inimaginable d'envisager d'exécuter nos charges de travail d'entrainement et d’inférence ailleurs. Nous constatons une augmentation de 5 à 10 fois de la vitesse des charges de travail d'entrainement à chaque fois que nous passons sur une nouvelle famille d'architecture NVIDIA." L’équipe de Papercup s’attend à voir une forte augmentation de l’utilisation des GPU dans ses clusters d’inférence pour un coût moindre et une réduction du temps de déploiement d’un nouveau modèle, pour passer de plusieurs heures à quelques minutes.

Atteindre de nouveaux publics et maximiser l'engagement grâce à du contenu doublé

Le public international d'Insider n'est plus limité par les barrières de la langue : grâce à Papercup et aux technologies d'IA de NVIDIA, les spectateurs sont en mesure d'accéder au contenu dans leur langue maternelle. Au cours des 12 premiers mois suivant le lancement de nouvelles chaînes sur YouTube et Facebook à destination des pays d'Amérique Latine et d'Europe, Insider a réussi à atteindre des centaines de millions de nouveaux spectateurs. Certaines des vidéos traduites ont même dépassé leur version originale en anglais. En l'espace de quelques semaines, Insider a récolté 100 millions de vues sur sa chaine YouTube en espagnol. "La localisation de notre contenu existant grâce à Papercup nous a permis d'atteindre un tout nouveau public hispanophone", explique Tony Manfred, directeur des vidéos chez Insider. "En plus d'accroitre considérablement la valeur ajoutée de notre contenu, nous avons beaucoup appris sur la façon dont les gens le consomment, ce qui sera très utile pour notre stratégie future. L'avenir du multimédia dépend de la capacité à toucher et à fidéliser des publics, et la solution de Papercup nous aide à atteindre ces objectifs clés. Améliorer l'accessibilité de notre contenu non seulement en améliore la rentabilité et renforce notre entreprise, mais donne en plus au public accès à plus de contenus fiables."