NVIDIA Riva

完全にカスタマイズが可能なスピーチ AI アプリケーションを構築し、展開します。

NVIDIA Riva

完全にカスタマイズが可能なスピーチ AI アプリケーションを構築し、展開します。

あらゆる業界に対応するスピーチ AI スキル。

 自動音声認識 (ASR) とテキスト読み上げ (TTS) からなるスピーチ AI スキルは、あらゆる業界において、企業が顧客とやりとりし、顧客をサポートする仕組みを一変させます。NVIDIA AI プラットフォームの一部である NVIDIA® Riva は、コンタクト センターの窓口支援、仮想アシスタント、デジタル アバター、ブランド ボイス、ビデオ会議の文字起こしなど、各種用途に合わせて完全にカスタマイズできるリアルタイム AI パイプラインを構築し、展開するための、GPU で最適化する最新のワークフローを提供します。Riva を導入すると、用途に合わせてアプリケーションを調整し、それをあらゆるクラウド、データ センター、エッジ、組み込みデバイスに展開できます。

世界最高レベルのスピーチ AI の実際の動作をご覧ください。

  • 文字起こし
  • テキスト読み上げ

NVIDIA Riva 自動音声認識を試す

このデモでは、Riva ASR がリアルタイムで非常に正確に音声を書き起こします。

マイクで音声を入力するか、デバイスから .wav ファイルをアップロードすることができます。

各サンプルの長さは最大 30 秒に制限されています。

何か言ってみてください

NVIDIA Riva テキスト読み上げを試す

インタラクティブな仮想アシスタント、最新のホーム デバイス、視覚障害をお持ちの方、あるいは文字を読むことが困難な方向けの読み上げアシスタントに音声を追加する方法をお探しでしたら、Riva をお試しください。女性または男性の英語音声をすぐにご利用いただけます。

Riva の最先端のニューラル スピーチ合成モデルによって作成された自然かつ表現豊かな音声をお聴きください。

0 / 400

Riva 音声認識と Riva テキスト読み上げのご利用には、NVIDIA の利用規約が適用されます。お客様のデータは NVIDIA の製品やサービスの向上のために使用されます。

NVIDIA Riva とは何か?

スピーチ AI アプリケーションのためのシンプルなエンドツーエンドの ワークフローです。

Riva の機能:

  • 学習済みのスピーチ AI SOTA モデル: データセットに合わせて完全にカスタマイズ可能な ASR モデルと TTS モデル。分野ごとに特化されたモデルの開発を 10 倍加速します。

  • 高性能推論: 推論は NVIDIA TensorRT™ 最適化と NVIDIA Triton™ Inference Server によって強化されており、いずれも NVIDIA AI プラットフォームに含まれています。

  • Riva サービス: 低遅延ストリーミングや高スループットのオフラインでの利用に向けて、gRPC ベースのマイクロサービスとして提供されます。

  • 高い拡張性: Riva は、完全にコンテナー化されており、数百および数千の並列ストリームに容易に拡張できます。
エンドツーエンドのスピーチ AI パイプライン

NVIDIA Riva の利点をご覧ください。

すぐに高い精度を発揮

高い精度。

NVIDIA スーパーコンピューターで数千時間分の音声で訓練された最新の学習済みモデルを提供します。

柔軟なカスタマイズ

完全カスタマイズ可能。

提供されるすぐに使えるモデルと柔軟なパイプラインは、ユース ケース、業界、分野に合わせて微調整できます。

スケーラブルな展開

場所を問わない大規模な実行。

クラウド、データ センター、エッジで数十万人規模まで同時接続ユーザー数を拡張できます。

リアルタイム性能

リアルタイム性能。

NVIDIA TensorRT による強力な NVIDIA AI 最適化により、300 ミリ秒をはるかに下回るリアルタイム性能を実現します。

エンタープライズ サポート

企業サポート。

最短のシステム停止時間と、最大のシステム利用率でスピーチ AI サービスを実行します。

NVIDIA Riva を始める

Riva のサポートは NVIDIA AI Enterprise ソフトウェアから得られます。あるいは、コンテナーや学習済みのモデルを無料でダウンロードできます。

有料の企業サポート

NVIDIA AI Enterprise ソフトウェアを利用すると、Riva の大規模展開のサポートを NVIDIA Enterprise Support で受けられます。

内容:

  • ベアメタル、仮想化、コンテナー化、パブリック クラウドといったさまざまな展開に対応した企業向けの完全サポートを含む、幅広いプラットフォームをサポート
  • エンジニアリングなど、構成や性能に関するガイダンスが必要な場合、NVIDIA AI 専門家に問い合わせることができます。専門家は現地営業時間の午前 8:00 から午後 5:00 まで対応しております。
  • 最新のセキュリティ修正プログラムやメンテナンス リリースの緊急事項通知
  • 講師が指導するワークショップや自分のペースで進められる学習の利用。

無料のコンテナーとモデル

NVIDIA Riva は、NVIDIA NGC から NVIDIA 開発者プログラムのメンバーまで、コンテナーと学習済みモデルのセットとして無料で利用できます。

内容:

  • 開発者フォーラムにアクセスすれば、不明点の質問や成功事例を閲覧できます。
  • チュートリアル、サンプル アプリ、Notebook、ドキュメントなど、ASR と TTS のリソース
  • データ センター (ローカルの Docker または Kubernetes) または組み込みデバイス (ローカル Docker) に Riva の学習済みモデルを展開し、サンプル クライアントを実行し、モデルをカスタマイズするためのガイド

Riva ASR の詳細を見る。

音声認識技術により、インターネット上の音声検索、ハンズフリー コンピューティング、スマート ホーム機器や車載アシスタントへの音声コマンド、医療メモの作成、コンタクト センターの年中無休の仮想アシスタント、パターンや傾向分析のための通話やビデオ会議の文字起こしが可能となります。NVIDIA Riva の自動音声認識 (ASR) は、GPU 最適化モデルに基づいて世界最高レベルで正確に文字を起こし、あらゆる分野や展開プラットフォームに合わせて完全にカスタマイズできます。

Riva ASR の主な特徴:

  • 英語、スペイン語、北京語、ヒンディー語、ロシア語、ドイツ語、フランス語のサポート
  • NVIDIA GPU で数十万時間のさまざまな分野固有データを利用して学習された、すぐに使えるモデル
  • 語彙、辞書、音、言語、句読点、逆テキストの標準化モデルを微調整することで、異なる言語、アクセント、分野、語彙、文脈に対して可能な限り最高の精度を実現します
  • 数十万単位の入力オーディオ ストリームに対して、起こした文字をストリーミングで返す機能。句読点を自動で付ける機能と世界中のタイムスタンプを押す機能があります
  • カスタマイズ可能な言葉のフィルタリング機能。不愉快な話し言葉を効果的に除去します

Riva TTS の詳細を見る。

テキスト読み上げ機能では、電子書籍や文書を読み上げ、スマート アシスタントやデジタル アバターとして人間と会話する音声を生成します。スマートフォン、タブレット、ノート PC など、ほぼすべてのデジタル デバイスに搭載されています。NVIDIA Riva 音声合成 (TTS) は、最先端のスペクトログラム生成およびボコーダー モデルに基づいて人間のような合成音声を提供します。TTS パイプラインはカスタマイズ可能であり、リアルタイムで効率的に実行できるように GPU で最適化されます。

Riva TTS の主な特徴:

  • 人間のような表現豊かな声を生成する SOTA モデル
  • プロフェッショナルによる 2 種類 (女声と男声) の米国英語をすぐに使える
  • 音声やアクセントを簡単に微調整。音程、声量、音長を変更できるために表現が豊かになる
  • 既存のテクノロジに比べて推論パフォーマンスを 12 倍アップ

NVIDIA LaunchPad で Riva を短期間で導入

厳選された無料のラボで NVIDIA Riva をすぐに利用できます。スピーチ AI のステップバイステップのガイド付きラボを利用できます。すぐに使えるソフトウェア、サンプル データ、アプリケーションが付属します。

Riva 組み込みの詳細を見る。

Riva 組み込みでは、配達ロボット、インテリジェントな非接触キオスク、自動販売機、工場/買い物/医療/スマート ホーム デバイス用の仮想アシスタントなどのデバイスで、対話型アプリケーションのために、信頼性と精度に優れ、この最高レベルのリアルタイム文字起こしと、人間のような表現豊かな音声が提供されます。

Riva 組み込みの主な特徴:

  • SOTA、すぐに使えて精度の高い ASR、英語/スペイン語/北京語/ヒンディー語/ロシア語/ドイツ語/フランス語に合わせた完全なオフデバイス カスタマイズ
  • 専門家による表現豊かな英語音声 (女声と男声) をデバイスですぐに使用可能。まったく新しい音声を作ることも可能
  • コンパクトなオンデバイス コンピューティングとメモリで簡単に統合、高い信頼性、リアルタイムのワークステーション パフォーマンス
  • デバイス上の音声データ処理で高いプライバシー
  • NVIDIA Jetson AGX Xavier、Jetson Xavier NX、Jetson AGX Orin、Jetson Orin NX に展開可能

AI とメタバース
時代を牽引する
NVIDIA 主催カンファレンス

今年の 9 月、GTC に参加して、あなたの次のビッグ アイデアを刺激するインスピレーションを得てください。AI がいかにして産業を変革して世界に大きな影響を与えているかを各分野のエキスパートやリーダーたちから学ぶことができる、見逃せない機会です。9 月 19 日から 22 日 まですべてがオンラインで実施されます。

 

最新のイベント情報やニュースを受け取る。

スピーチ AI サミット

NVIDIA 主催の無料デジタル イベント

NVIDIA 初のスピーチ AI サミットが 2022 年 11 月 2 日午前 9:00 から午後 2:00 (PT) で開催されます。  Google、Meta、NVIDIA などの専門家とオンラインで討論できるこの機会にご参加ください。自動音声認識 (ASR) や TTS (テキスト読み上げ) テクノロジのトレンドやテクニックを取り上げる予定です。

NVIDIA スピーチ AI サミット

NVIDIA Riva が完全カスタマイズの可能なスピーチ AI の新しい基準となる

GTC で NVIDIA は、NVIDIA Riva の新しい追加機能を発表しました。これには、ヒンディー語とフランス語という 2 つの新しい言語での世界最高レベルの自動音声認識が含まれています。Riva ではまた、英語、スペイン語、ロシア語、ドイツ語、北京語の精度を上げています。

近日公開

NVIDIA Riva が完全カスタマイズの可能なスピーチ AI の新しい基準となる

パフォーマンス ベンチマークを見る。

NVIDIA Riva パフォーマンス ベンチマーク

導入事例を読む。

NCS のお客様の事例

NCS では NVIDIA Riva TTS を使用し、運転手のお助けアプリである Breeze の何万人もの月間アクティブユーザー (ユーザー数千人がアプリに同時アクセス) 向けに、シンガポール人の声を現地の人の発音、トーン、アクセントでカスタマイズしました。 

導入事例: T-Mobile

T-Mobile ではコール センターに NVIDIA Riva ASR を使用しており、顧客の会話を正確に書き起こし、推奨項目をリアルタイムで提示することで窓口が顧客の問い合わせに迅速に対応できるように支援しています。

 導入事例: Data Monsters

Data Monsters は NVIDIA Riva を使用して同社の Plabook アプリに音声パイプラインを追加しました。生徒の音読、音素レベルでの精度評価を支援し、生徒ひとりひとりに合わせてフィードバックを提供します。

導入事例: RingCentral

RingCentral は NVIDIA Riva を導入することで、ビデオ会議のリアルタイム文字起こしで比類のない精度を達成しました。多様なアクセントと分野固有の専門用語で話す数百万人のユーザーの役に立っています。

AI 導入事例: Tarteel

Tarteel は、NVIDIA Riva と NVIDIA NeMo を使用し、コーラン朗読のリアルタイム フィードバックを大規模に提供し、コーランに取り組むイスラム教徒、講師、コンテンツ クリエイター、研究者を支援しています。

 顧客事例: Floatbot

Floatbot は NVIDIA Riva と NVIDIA TAO を活用し、シンガポール英語の会話型 AI アプリケーションをカスタマイズしています。これにより、世界中の保険会社や金融会社の顧客向けコール センターを自動化しています。

あらゆる業界で市場をリードする採用企業。

  • 顧客
  • パートナー
  • サービス提供パートナー
Artisight
Botify
Botpress
Interactions
Kore.ai
LEXISTEMS
Malamute
Minerva CQ
Moneypenny
Pendulum
Plabook
Read AI
SmartCow
Tarteel
Vector Ventures
Computacenter
Data Monsters
InstaDeep
Quantiphi
Softserve
SVA

スピーチ AI を簡素化する準備はできていますか?

NVIDIA Riva Enterprsise の無料試用版

LaunchPad で Riva を無料でお試しください。

厳選された NVIDIA Riva ラボにアクセスし、音声ベースのソリューションをテストし、試作できます。

NVIDIA Riva SDK をダウンロードする

Riva のコンテナーとモデルを無料でダウンロードできます。

NVIDIA NGC から NVIDIA Riva を展開します。

NVIDIA Riva に関するお問い合わせ

お問い合わせください。

スピーチ AI アプリケーションの構築と展開の成功事例を専門家と交流しながら学んでください。

その他関連情報。

概要を見る。

スピーチ AI サービスの構築に役立つ Riva の主な機能を理解してください。

スターター キットを見る。

チュートリアル、Jupyter Notebook、ドキュメントなど、NVIDIA Riva でスピーチ AI パイプラインを構築するために必要なすべてを入手できます。

ウェビナーを視聴する。

NVIDIA AI がどのように世界最高レベルのスピーチ AI アプリケーションを開発し、数千ものストリームをリアルタイムで実行可能にしているか、その仕組みをご覧ください。

e-book を読む。

高性能推論と最小の労力で Riva ASR と TTS のモデルを運用環境に統合し、展開する方法をご覧ください。

登録してスピーチ AI に関する最新ニュースを NVIDIA から受け取る

LaunchPad の Riva でスピーチ AI プロジェクトを加速する