Microsoft Teams permet de sous-titrer et de transcrire des réunions en direct avec une précision élevée dans 28 langues.
Microsoft Teams
Microsoft Azure
Sous-titrage et transcription multilingues de réunions en temps réel
Microsoft Azure Cognitive Services, GPU NVIDIA sur Azure, serveur d'inférence NVIDIA Triton
Microsoft Teams est une application de collaboration qui compte près de 250 millions d'utilisateurs actifs par mois. Pour mieux s’adapter aux personnes qui n'utilisent pas leur langue maternelle et aux participants aux réunions qui sont sourds ou malentendants, Microsoft s’appuie sur des sous-titres en direct générés par l’IA et sur la transcription en temps réel.
Pour offrir des sous-titrages et des transcriptions optimales en direct dans plusieurs langues, l’application Microsoft Teams utilise Microsoft Azure Cognitive Services et le serveur d'inférence NVIDIA Triton™. Cela leur permet de tirer parti de modèles de langage avancés qui reconnaissent le jargon, les noms et d'autres contextes de réunion, pour fournir des résultats de transcription personnalisés et très précis, en temps réel, avec une latence très faible.
L’utilisation du serveur d'inférence Triton dans Azure Cognitive Services permet d'effectuer des transcriptions et des sous-titrages en direct et de manière transparente grâce à des modèles vocaux de pointe dans 28 langues. Le serveur d'inférence Triton offre une faible latence, une inférence en temps réel des modèles vocale et garantit que les modèles utilisent pleinement le potentiel des GPU. Cela réduit les coûts pour les clients en fournissant un débit plus élevé en utilisant moins de ressources de calcul.
Résultats
Microsoft Teams est une application de collaboration conçue pour le travail hybride qui permet aux équipes de rester informées, organisées et connectées, le tout au même endroit. Les clients utilisent Teams pour communiquer, collaborer et créer collaborativement du contenu au travail, dans leur vie privée et d’apprentissage, tous les jours.
"De tels modèles d'IA sont extrêmement complexes et nécessitent des dizaines de millions de paramètres de réseau neuronal pour fournir des résultats précis dans des dizaines de langues. Mais plus un modèle est grand, plus il est difficile de l'exécuter de manière rentable en temps réel."
Responsable principal des appels et réunions Teams
et des appareils
Microsoft