Microsoft Teams permite realizar servicios de transcripción y subtítulos de reuniones en directo muy precisos en 28 idiomas.
Microsoft Teams
Microsoft Azure
Subtítulos y transcripción de reuniones en tiempo real en varios idiomas
Microsoft Azure Cognitive Services, GPU NVIDIA en Azure, Servidor de inferencia NVIDIA Triton
Microsoft Teams es una aplicación de colaboración con casi 250 millones de usuarios activos mensuales. Para acomodar mejor a los hablantes no nativos y a los asistentes a reuniones que son sordos o con problemas de audición, Microsoft confía en los subtítulos en directo que se generan por IA y en transcripciones en tiempo real.
Para obtener subtítulos y transcripciones en directo óptimos en varios idiomas, la aplicación Microsoft Teams utiliza Microsoft Azure Cognitive Services y el servidor de inferencia NVIDIA Triton™. Les permiten aprovechar modelos lingüísticos avanzados que reconocen la jerga, los nombres y otros contextos de la reunión, para entregar resultados de voz a texto altamente precisos y personalizados, en tiempo real, con una latencia muy baja.
El uso del servidor de inferencia Triton en Azure Cognitive Services permite realizar transcripciones y generar subtítulos en directo con modelos de voz de última generación en 28 idiomas. El servidor de inferencia Triton ofrece una baja latencia, inferencia en tiempo real de los modelos de reconocimiento de voz, y garantiza que los modelos usen las GPU en su máximo potencial. Así, se reduce el coste para los clientes al ofrecer mayor rendimiento con menos recursos computacionales.
Resultados
Microsoft Teams es una aplicación de colaboración, creada para el trabajo híbrido, que permite a los equipos mantenerse informados, organizados y conectados, todo en un solo lugar. Los clientes usan Teams para comunicarse, colaborar y elaborar contenido en colaboración con otros autores sobre el trabajo, la vida y el aprendizaje, todos los días.
"Los modelos de IA como estos son increíblemente complejos, ya que requieren decenas de millones de parámetros de red neuronal para generar resultados precisos en docenas de idiomas diferentes. Pero, cuanto más grande es un modelo, más difícil es ejecutarlo de manera rentable en tiempo real".
Gestor de producto principal para llamadas y reuniones en Teams
y dispositivos de
Microsoft