NVIDIA Riva proporciona habilidades de reconocimiento automático de voz (ASR) y de texto a voz (TTS) basadas en deep learning para profesionales y desarrolladores de IA. ASR y TTS son interfaces de voz en aplicaciones basadas en IA de habla, como asistencias del agente del centro de llamadas, asistentes digitales y transcripciones de videollamadas.
ASR convierte el habla en texto y generalmente es el primer paso en un proceso de voz, por lo que su precisión de transcripción influye en todas las tareas posteriores. TTS genera voces similares a las humanas a partir del texto.
NVIDIA Riva se usa en todas las industrias, desde las telecomunicaciones y las finanzas hasta la atención de la salud, el comercio minorista y la industria automotriz, ya que cada empresa necesita interactuar con sus clientes.