NVIDIA Jarvis が最先端の対話型 AI サービスの構築を簡略化

新しいアプリケーション フレームワークにより、顧客サポートからリアルタイムの文字起こしまで、カスタマイズされた言語ベースの AI サービスの作成が可能に

2020 年 5 月 14 日、カリフォルニア州サンタクララ - GTC 2020 - NVIDIA は本日、企業が動画と音声のデータを使用して、自社の業界、製品および顧客に合わせてカスタマイズされた最先端の対話型 AI サービスを構築することができる GPU アクセラレーション アプリケーション フレームワーク、NVIDIA Jarvis をリリースすることを発表しました。

在宅勤務、遠隔医療および遠隔学習に移行する流れが強まり、顧客サポートからリアルタイムの文字起こし、ビデオ通話の要約まで、カスタマイズされた言語ベースの AI サービスの需要が急増しており、人々の生産性とつながりを維持しようとしています。

Jarvis による対話型 AI の製品とサービスをいち早く顧客に提供している企業としては、コールセンター サポート向け AI オペレーターの Voca や、金融機関および企業向けに自動音声文字起こしを行う Kensho、アポイント予定向けのバーチャル アシスタント Square が挙げられます。

NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は、次のように述べています。「対話型 AI は、アプリケーションがニュアンスや文脈を意識して理解し、コミュニケーション能力を獲得するため、多くの産業の未来を担う中心的な役割を果たします。NVIDIA Jarvis は、ヘルスケアや金融サービス、教育、小売業といった業界が、負荷の高い顧客サポートを迅速かつ正確に自動化するのに役立ちます」

Jarvis で構築されたアプリケーションは、AI コンピューティング向けの新しい NVIDIA A100 Tensor コア GPU と推論向けの NVIDIA TensorRT™ による最新の最適化のイノベーションを活用することができます。最もパワフルなビジョンと音声モデルを使用したマルチモーダル アプリケーション全体をリアルタイムのインタラクションでの閾値である 300 ミリ秒よりも高速に実行することが初めて可能になります。

Jarvis は、完全な GPU で高速化するソフトウェア スタックおよびツールを提供することで、開発者はそれぞれの企業や顧客に固有の用語を理解できるエンドツーエンドのリアルタイムの対話型 AI アプリケーションを簡単に作成、展開、実行することができます。

IDC の AI ソフトウェア プラットフォーム リサーチディレクターであるデビッド シュメール (David Schubmehl) 氏は、次のように述べています。「IDC は、対話型 AI 市場の急速な成長を継続的に見ています。その主な理由は、あらゆる規模の組織が、十分にトレーニングされたバーチャル アシスタントとチャットボットを使って顧客へのサービスを向上させ、ビジネスを成長させることの価値を理解し始めているからです。IDC では、自動化されたカスタマーサービス オペレーターやデジタル アシスタントといった対話型 AI のユースケースに対する全世界での支出額が、2019 年の 58 億ドルから 2023 年には 138 億ドルにまで成長し、年間平均成長率は 24% になると予想しています」

インタラクティブでパーソナライズされた体験を提供するには、企業は自社の製品内容や顧客の要件にもとづいた固有のデータを使って、言語ベースのアプリケーションをトレーニングする必要があります。しかし、何もない状態からサービスを構築するには、AI についての深い専門知識、モデルのトレーニングのための大量のデータと演算リソース、ならびに新しいデータでモデルを定期的にアップデートするためのソフトウェアが必要です。

Jarvis は、対話型 AI のためのエンドツーエンドのディープラーニング パイプラインを提供することで、このような課題に対応します。Jarvis には、自然言語を理解するための NVIDIA のMegatron BERT といった、最先端のディープラーニング モデルが含まれています。企業は、NVIDIA NeMo を使った自社のデータによるモデルのファインチューニング、TensorRT を使った推論の最適化、ならびに NVIDIA の GPU に最適化されたソフトウェアのカタログである NGC で利用可能な Helm チャートを使った、クラウドおよびエッジでの展開を行うことができます。

早期採用企業 — Voca, Kensho, Square

世界中の企業が NVIDIA の対話型 AI プラットフォームを使って、サービスを向上させようとしています。

NVIDIA のテクノロジを使って、より速く、よりインタラクティブな、人間のように対話ができる、Voca の AI バーチャル オペレーターは、東芝や AT&T を初めてとする、世界の大手企業で使用されています。Voca はAIを使って、顧客の話し言葉や会話の意図を完全に理解することができます。これにより、オペレーターはトーンや声の大きさを手がかりにして、顧客の発言と顧客の意味するところの微妙な違いを自動的に識別できるようになっています。さらに、NVIDIA の AI プラットフォームのスケーラビリティ機能を使って、顧客の待ち時間を大幅に短縮できます。

Voca の CTO 兼共同創業者であるアラン ベッカー (Alan Bekker) 氏は、次のように述べています。「コールセンターではレイテンシが低いことがきわめて重要です。NVIDIA GPU により、当社のオペレーターは、最高レベルの精度で 1 秒以内に、聞き取り、理解し、対応ができます。現在、バーチャル オペレーターは、一般的な顧客サービスの依頼から支払いの処理、技術サポートに至る、あらゆる電話の 70% から 80% に対処できるようになっています」

S&P Global のイノベーション ハブであり、マサチューセッツ州ケンブリッジでスケーラブルな機械学習と分析システムを展開している Kensho は、NVIDIA の対話型 AI を使って、金融とビジネス向けの音声認識ソリューションである Scribe を開発しています。NVIDIA のテクノロジを活用した Scribe は、決算説明会や金融関連の音声において、他の商用ソリューションよりも精度が高く、最大で 20% もの差をつけています。

Kensho の AI リサーチヘッドであるゲオルク ククスコ (Georg Kucsko) 氏は、次のように述べています。「当社は、NVIDIA と緊密に連携してディープラーニングを使ったエンドツーエンドの自動音声認識をさらに展開させる方法を模索しています。NVIDIA のテクノロジで新しいモデルのトレーニングを行うことで、AI を使わない従来のアプローチと比較して、金融の専門用語の文字起こしの精度をはるかに高めることができ、お客様にタイムリーな情報を数日ではなく、数分で提供することができます」

Square は、営業担当者が AI を使って、顧客とのアポイントメントの確認、キャンセルまたは変更を自動的に行い、担当者は戦略的な顧客とのエンゲージメントを行うことができる、AI バーチャル アシスタントを作成しています。

Square の対話型 AI 担当ヘッドのガボール アンジェリ (Gabor Angeli) 氏は、次のように述べています。「Square Assistant は、顧客の質問の 75% を理解し、それに対応することができ、さらに約束通りに現れる人の数が 10% 増えています。GPU の活用により、当社は CPU に比べてモデルのトレーニングを 10 倍速くできるようになり、より正確で人間のようなインタラクションを提供し、お客様のビジネスの成長を支援しています」

提供予定

NVIDIA Jarvis の早期アクセス プログラムは、限られた数の申請者のみに利用可能となっています。このアプリケーション フレームワークの評価に興味をお持ちの開発者は、こちらよりサインアップすることができます。

その他のリソース

NVIDIA について
1999 年における NVIDIA (NASDAQ 表示: NVDA) による GPU の発明は、PC ゲーミング市場の成長に爆発的な拍車をかけ、現代のコンピューター グラフィックスを再定義し、並列コンピューティングに革命的変化を起こしました。最近では、GPU ディープラーニングが最新の AI (次世代コンピューティング) に火をつけ、世界を知覚し理解することができるコンピューター、ロボット、自律走行車の脳として GPU は機能しています。詳細は、こちらのリンクから: www.nvidia.com/ja-jp/