多型態對話式人工智慧

從自動語音辨識、理解自然語言,到輸出文字轉語音,加速整體流程。

語音、視覺和語言領域的人工智慧服務為個人化自然對話開創了全新的道路,但若要實現即時互動性,就必須達到高精確度與低延遲的標準。透過 NVIDIA 的對話式人工智慧平台,開發人員可以在單一整合式架構中快速建立和部署尖端人工智慧服務以強化應用程式,幾乎不需要預先投資就能提供強化極為精確又低延遲的系統。

 
最先進的模型

最先進的模型

利用 NGC™ 上已在 NVIDIA DGX™ 系統訓練超過 10 萬小時的對話式人工智慧模型。

自訂多型態技能

自訂多型態技能

輕鬆將語音、語言和視覺結合為單一流程,打造出類似人類的互動技能。

快速部署

快速部署

只需一個命令,就能在雲端、資料中心和邊緣端部署最佳化模型。

端對端加速

端對端加速

僅在不到 300 毫秒 (ms) 的延遲範圍內,就能加速整個流程並執行模型推論。

真正的端對端加速

全面加速流程

瞬間獲得完整流程推論

在不到 300 毫秒 (ms) 的延遲範圍內,執行完整的對話式人工智慧流程,包括用於轉譯的自動語音辨識 (ASR)、自然語言理解 (NLU) 和文字轉語音 (TTS),進而達成即時互動、釋放空間以提升流程複雜度,而且可同時保持良好使用者體驗。

NVIDIA A100 Tensor 核心 GPU 在 MLPerf 訓練 v 0.7 基準中創下效能記錄,在 WikiText 上每個用於 BERT 的加速器執行時間為 6.53 小時,大規模執行時間為 0.83 分鐘。

適用於對話式人工智慧應用程式的
NVIDIA 解決方案

使用專門打造的系統訓練與部署

大規模訓練

NVIDIA DGX™ A100 搭載八個 NVIDIA A100 Tensor 核心 GPU,是有史以來最先進的資料中心加速器。Tensor Float 32 (TF32) 精度的人工智慧效能為前幾代的 20 倍,且無需變更任何程式碼,還能透過在常見 NLP 模型中運用結構化稀疏性,將效能再提升 2 倍。第三代 NVIDIA® NVLink®、第二代 NVIDIA NVSwitch™ 和 NVIDIA Mellanox® InfiniBand 在所有 GPU 之間建立高頻寬、低延遲的連結。這讓多個 DGX A100 系統能夠大規模訓練龐大的十億參數模型,進而達到最為先進的精確度。而透過開放原始碼工具組 NVIDIA NeMo™,開發人員只需幾行程式碼就能打造、訓練和微調 DGX 加速的對話式人工智慧模型。

大規模訓練
在邊緣端部署

在邊緣端部署

NVIDIA EGX™ A100 藉由在邊緣端處理大量語音和語言資料,成功推動即時對話式人工智慧,並同時避免網路延遲。有了 NVIDIA TensorRT™,開發人員可以最佳化模型以進行推論,並以低延遲度和高輸送量提供對話式人工智慧應用程式。透過 NVIDIA Triton™ 推論伺服器,即可在生產環境中部署模型。TensorRT 與 Triton 的推論伺服器與對話式人工智慧應用程式框架 NVIDIA Jarvis 合作,進而在 EGX 上打造和部署端對端的 GPU 加速多型態流程。在幕後,Jarvis 應用 TensorRT、設定 Triton 推論伺服器,並以標準 API 呈現服務,透過 Kubernetes 叢集上的 Helm Chart 以單一命令進行部署。

人工智慧多型態技能

多喇叭轉譯

傳統的語音轉文字演算法已進化,現在能夠轉譯會議、課程和日常對話,同時辨識說話者並將他們標示為貢獻者。NVIDIA Jarvis 將多感測器音訊和視覺資料整合到單一資訊串流中,以供進階遊戲元件使用,如即時區分多個語音所需的視覺分段標記。

 
 

虛擬助理

虛擬助理能夠以與人類非常相似的方式與客戶交流,支援與聯絡中心、智慧音箱和汽車智慧助理進行互動。人工智慧服務如語音辨識、語言理解、語音合成和人聲編碼,之所以無法單獨支援這類系統,是因為缺少對話追蹤等關鍵元件。Jarvis 透過易於使用且可針對任何應用程式進行擴充的元件補足了這些主要服務。

加速企業和 開發人員函式庫

  • 生態系合作夥伴
  • 開發人員函式庫

GPU 加速頂尖的語音、視覺和語言工作流程,以滿足企業規模的要求。

InstaDeep
Intelligent Voice
Kensho
MeetKai
MTS
NetApp
QuantiPhi
Siminsights
Voca.ai

熱門的對話式人工智慧函式庫打造 GPU 加速的先進深度學習模型

DeepPavlov
ESPNet
Hugging Face
Ludwig
PerceptiLabs
SpaCy
RASA

產業使用案例

聊天應用程式提升病患體驗

聊天應用程式提升病患體驗

Cureai 的平台使用自然語言處理,讓病患能夠與醫生分享他們的狀況、存取自己的醫療記錄,並協助醫療服務提供者從醫療對話中提取資料,以研擬更周全的治療方法。

Square 透過 GPU 改善對話式人工智慧

Square 透過 GPU 改善對話式人工智慧

深入瞭解對話式人工智慧引擎 Square Assistant,如何讓小型企業能更有效率地與客戶溝通。

運用對話式人工智慧推動金融服務轉型

運用對話式人工智慧推動金融服務轉型

探索完成功實作的企業經歷了什麼過程,以及如何透過投資報酬率成就事業。

立即開始加速對話式人工智慧

使用 NVIDIA NeMo 框架訓練人工智慧模型

在 NVIDIA DGX A100 系統上執行訓練

使用 NVIDIA Jarvis 框架簡化部署

在 NVIDIA EGX A100 系統上部署到邊緣端