NVIDIA Riva bietet Deep-Learning-basierte Funktionen zur automatischen Spracherkennung (ASR) zur Umwandlung von Text in Sprache (Text-to-Speech, TTS) für KI-Anwender und -Entwickler. ASR und TTS sind Sprachschnittstellen in Sprach-KI-basierten Anwendungen, beispielsweise zur Unterstützung von Call-Center-Mitarbeitern und zur Transkription von Videokonferenzen.
ASR wandelt Sprache in Text um und ist in der Regel der erste Schritt einer Sprachpipeline, sodass die Transkriptionsgenauigkeit sich auf alle nachgelagerten Aufgaben auswirkt. TTS generiert aus Text Sprachausgabe mit menschenähnlichen Stimmen.
NVIDIA Riva wird in allen Branchen eingesetzt, von Telekommunikation und Finanzen über das Gesundheitswesen bis hin zum Einzelhandel und der Automobilindustrie, da jedes Unternehmen mit seinen Kunden interagieren muss.