將使用者參與體驗提升至全新境界

提升深度學習推論工作負載的輸送量,及靈敏度體驗。

人工智慧持續面臨挑戰,在想辦法處理爆炸性增長的資料量同時,還得作出靈敏快速的反應。全世界速度最快、最節能的推論資料中心平台 NVIDIA® Tesla® 能因應各種挑戰。Tesla 能支援所有的深度學習工作負載,並提供最好的推論解決方案:集最高輸送量、最佳節能性與最優靈活性於一身,強化人工智慧體驗。

NVIDIA 資料中心推論平台

TESLA V100
各種資料中心均適用

Tesla V100 具有每秒 125 兆次浮點運算的推論效能。一部搭載八張 Tesla V100 的伺服器能進行一千兆次浮點的運算。

TESLA P4
能使水平擴充伺服器締造極佳節能性

Tesla P4 可加速任何水平擴充的伺服器,節能性比 CPU 高 60 倍。

TESLA P40
能使伺服器產出極高推論輸送量

Tesla P40 具有每秒 47 兆次運算 (TOPS) 的推論效能、INT8 精度與 24 GB 的內建記憶體,給你絕佳的使用者體驗。

特色與優點

輸送量提高 50 倍,能因應不斷成長的工作負載

採用 Volta 架構的 Tesla V100 GPU 大幅提升資料中心的輸送量,使深度學習工作負載能夠從現今的海量資料中找出各類情資。一部配備一張 Tesla V100 的伺服器可處理的深度學習推論工作負載,等於 50 部只裝載 CPU 的伺服器,因此你只要投入比以往更少的採購成本,就能大幅提升輸送量。

低耗能的水平擴充伺服器帶來前所未有的效能

節能性極佳的 Tesla P4 GPU 能夠加速密度最佳化的水平擴充伺服器,具有體積小且只需 50/75 W 功率設計優勢。而且深度學習推論工作負載的效能是 CPU 的 52 倍,因此工作負載量超大的客戶,可以在現有的基礎架構中擴充,並為人工智慧應用程式不斷增長的需求提供服務。

全新人工智慧影片服務專用的解碼引擎

Tesla P4 GPU 可即時分析多達 39 部 HD 影片串流。採用專用硬體加速解碼引擎,能與 NVIDIA CUDA® 核心共同進行推論。深度學習整合至影片製作流程後,客戶可以將智慧與創新影片服務提升至全新境界,提供影片搜尋功能和其他影片相關服務。

NVIDIA TensorRT 與 DeepStream SDK 加快部署速度

NVIDIA TensorRT 是一款高效能的神經網路推論引擎,能夠為深度學習應用程式進行生產部署。而且內含針對生產部署簡化深度學習模型的程式庫,能夠將經過訓練的神經網路 (通常是 32 位元或 16 位元的資料) 最佳化,以在 Tesla P4 執行精準度較低的 INT8 作業,或在 Tesla V100 上提供 FP16 效能。 NVIDIA DeepStream SDK 利用 Tesla GPU 的功能,可同時解碼與分析影片串流。

效能規格

Tesla V100: 資料中心通用 GPU 使水平擴充伺服器締造極佳節能性的 Tesla P4 使伺服器產出極高推論輸送量的 Tesla P40
單精度效能 (FP32) 每秒 14 兆次浮點運算 (PCIe)
每秒 15.7 兆次浮點運算 (SXM2)
每秒 5.5 兆次浮點運算 每秒 12 兆次浮點運算
半精度效能 (FP16) 每秒 112 兆次浮點運算 (PCIe)
每秒 125 兆次浮點運算 (SXM2)
整數運算 (INT8) 22 TOPS (每秒 22 兆次運算)* 47 TOPS (每秒 22 兆次運算)*
GPU 記憶體 16 GB HBM2 8 GB 24 GB
記憶體頻寬 900 GB/秒 192 GB/秒 346 GB/秒
系統介面/尺寸 雙插槽、PCI Express 標準版尺寸 SXM2/NVLink PCI Express 短卡尺寸 雙插槽、PCI Express 標準版尺寸
電流 250 W (PCIe)
300 W (SXM2)
50 W/75 W 250 W
影片硬體加速引擎 1個解碼引擎、2個編碼引擎 1個解碼引擎、2個編碼引擎

* 每秒一兆 (Tera) 的運算 (使用 Boost Clock 時)

最新的推論成功案例

iFLYTEK

iFLYTEK 的 Voice Cloud Platform 運用 NVIDIA Tesla P4 及 P40 GPU 進行訓練及推論,提高語音辨識準確度。

VALOSSA

參與 NVIDIA Inception 計畫的新創公司 Valossa 運用 NVIDIA GPU 加速影片資料中的深度學習效率,並進行觀眾行為分析與預測。

JD.COM

JD 運用 NVIDIA 人工智慧推論平台,將影片偵測效率提升 40 倍。

立即將你的深度學習推論解決方案最佳化。

Tesla V100、P4、P40 現已提供深度學習推論功能。