Telekommunikation

Live-Untertitel und Transkriptionsdienste für Microsoft Teams

Ziel

Microsoft Teams ermöglicht hochpräzise Untertitelungs- und Transkriptionsdienste für Live-Meetings in 28 Sprachen.

Kunde

Microsoft Teams

Partner

Microsoft Azure

Anwendungsfall

Mehrsprachige Echtzeit-Meeting-Untertitelung und -Transkription

Technologie

Microsoft Azure Cognitive Services, NVIDIA-GPUs unter Azure, NVIDIA Triton Inference Server

Live-Untertitelung und -Transkription in Microsoft Teams

Microsoft Teams ist eine Kollaborations-App mit fast 250 Millionen aktiven monatlichen Nutzern. Um Nicht-Muttersprachlern und Besprechungsteilnehmern, die taub oder schwerhörig sind, besser gerecht zu werden, setzt Microsoft auf künstliche Intelligenz, Live-Untertitel und Echtzeit-Transkription.

NVIDIA-Lösungen

Für optimale Live-Untertitel und Transkription in mehreren Sprachen verwendet die Microsoft Teams-App Microsoft Azure Cognitive Services und NVIDIA Triton™ Inference Server. Dies ermöglicht es, fortgeschrittene Sprachmodelle zu nutzen, die Jargon, Namen und anderen Besprechungskontext erkennen, um hochpräzise, personalisierte Sprach-zu-Text-Ergebnisse in Echtzeit mit sehr geringer Latenz zu liefern.

Microsoft Teams Ergebnisse

Die Verwendung von Triton Inference Server in Azure Cognitive Services ermöglicht nahtlose Live-Transkription und Untertitel mit modernsten Sprachmodellen in 28 Sprachen. Triton Inference Server liefert Echtzeit-Inferenzen der Spracherkennungsmodelle mit geringer Latenz und stellt sicher, dass Modelle GPUs ihr volles Potenzial nutzen. Dies reduziert die Kosten für Kunden, indem sie ein höherer Durchsatz mit weniger Rechenressourcen bereitgestellt wird.

Resultate

  • Kosteneffiziente, genaue Echtzeit-Untertitelung und -Transkription in 28 Sprachen.

Über Microsoft Teams

Microsoft Teams ist eine Kollaborations-App, die für hybride Arbeit entwickelt wurde und Teams an einem Ort informiert, organisiert und verbunden bleiben lässt. Kunden nutzen Teams, um Inhalte bei der Arbeit, im Alltag und im Lernprozess zu kommunizieren, zusammenzuarbeiten und gemeinsam zu erstellen.

„KI-Modelle wie diese sind unglaublich komplex und erfordern zig Millionen von Parametern für neuronale Netzwerke, um genaue Ergebnisse in Dutzenden von verschiedenen Sprachen zu liefern. Aber je größer ein Modell ist, desto schwieriger ist es, es kostengünstig in Echtzeit auszuführen.“

Principal PM Manager für Teams Anrufe, Besprechungen
und Geräte
Microsoft