Riva は、AI 実践者や開発者向けに、ディープラーニングベースの自動音声認識 (ASR)、テキスト読み上げ (TTS)、およびニューラル機械翻訳 (NMT) モデルを提供します。 ASR、TTS、および NMT は、コール センターのエージェント アシスト、デジタル アシスタント、ビデオ通話の文字起こしなど、スピーチ AI ベースのアプリケーションの音声インターフェイスです。
ASR は音声をテキストに変換し、通常は音声パイプラインの最初のステップであるため、その文字起こしの精度はすべての下流タスクに影響します。 TTS はテキストから人間のような音声を生成します。 NMT は単語をある言語から別の言語に翻訳します。
顧客との対話はあらゆる企業で必要があり、Riva は、通信や金融から医療、小売、自動車に至るまで、あらゆる業界で使用されています。