NVIDIA Riva fournit des compétences de reconnaissance vocale automatique (ASR) et de synthèse vocale (TTS) basées sur le Deep Learning pour les professionnels et les développeurs d’IA. L’ASR et le TTS sont des interfaces vocales dans les applications basées sur l'IA vocale, telles que l'assistance aux agents des centres d'appels, les assistants numériques et la transcription des appels vidéo.
ASR convertit la parole en texte et est généralement la première étape d’une pipeline de reconnaissance vocale, c’est pourquoi sa précision de transcription influence toutes les tâches en aval. TTS génère des voix semblables à des humains à partir de texte.
NVIDIA Riva est utilisée dans toutes les industries, des télécommunications à la finance en passant par la santé, la vente au détail et l’automobile, car chaque entreprise a besoin d’interagir avec ses clients.