NVIDIA Riva は、ディープラーニングベースの自動音声認識 (ASR) とテキスト読み上げ (TTS) スキルを AI の実務者と開発者に提供します。ASR と TTS は、コール センターの窓口支援、デジタル アシスタント、ビデオ通話の文字起こしなど、スピーチ AI ベースのアプリケーションの音声インターフェイスです。
ASR は音声をテキストに変換します。通常、音声パイプラインの最初のステップとなるため、文字起こしの精度は下流のすべての作業に影響を与えます。TTS はテキストから人間のような声を生成します。
どの企業でも顧客とやりとりが必要なため、NVIDIA Riva は、通信、金融、ヘルスケア、小売、自動車など、あらゆる業界で使用されています。