Riva proporciona modelos de reconocimiento de voz automático (ASR), conversión de texto a voz (TTS) y traducción automática neuronal (NMT) basados en deep learning para profesionales y desarrolladores de IA. ASR, TTS y NMT son interfaces de voz en aplicaciones basadas en IA de voz, como asistentes de agentes de centros de llamadas, asistentes digitales, transcripciones de videollamadas y superchats de IA impulsados por modelos lingüísticos de gran tamaño (LLM) y generación aumentada por recuperación (RAG).
El ASR convierte la voz en texto y, por lo general, es el primer paso de una canalización de voz, por lo que la precisión de su transcripción influye en todas las tareas secundarias. El TTS genera voces similares a las humanas a partir del texto. NMT traduce palabras de un idioma a otro.
Riva se utiliza en todos los sectores, desde las telecomunicaciones y las finanzas hasta la sanidad, el comercio minorista y la automoción, dondequiera que las empresas interactúen con los clientes.