NVIDIA Ampere
架構

全球效能最強彈性資料中心的核心。

現代資料中心內的人工智慧與高效能運算核心

透過人工智慧和高效能運算解決全球最重要的科學、工業與商業難題。視覺化複雜內容,打造尖端產品、訴說富臨場感的故事,並構思未來城市的樣貌。從大量資料集擷取見解。專為彈性運算時代打造的 NVIDIA Ampere 架構將能解決所有難題,為各種規模需求提供無與倫比的加速效能。

突破性創新

NVIDIA Ampere 架構以 540 億個電晶體打造,是有史以來最大的 7 奈米 (nm) 晶片,包含六項關鍵的突破性創新。

第三代 Tensor 核心

NVIDIA Tensor 核心技術最先運用在 NVIDIA Volta™ 架構上,不只大幅加速人工智慧,也將訓練時間從數週降至數小時,同時顯著提升推論速度。NVIDIA Ampere 架構以這些創新技術為基礎,採用全新精度標準 Tensor Float 32 (TF32) 與 64 位元浮點 (FP64),以加速並簡化人工智慧應用,同時將 Tensor 核心效能拓展至高效能運算。

TF32 與 FP32 運作方式相同,無需更改任何程式碼即可將人工智慧速度提升至最高 20 倍。透過 NVIDIA 自動混合精度,研究人員只要多加幾行程式碼,就可以利用自動混合精度和 FP16 將效能提升 2 倍。而 NVIDIA Ampere 架構 Tensor 核心 GPU 中的 Tensor 核心透過支援 bfloat16、INT8 與 INT4,能為人工智慧訓練和推論創造極致多元的加速器。A100A30 GPU 不只將強大的 Tensor 核心導入高效能運算,也支援完整矩陣運算、通過 IEEE 認證,並使用 FP64 精度。

第三代 Tensor 核心
多執行個體 GPU (MIG)

多執行個體 GPU (MIG)

每個人工智慧與高效能運算應用都能受益於加速,但並非所有應用都需要使用 GPU 的完整效能。多執行個體 GPU (MIG) 是 A100  和 A30 GPU 支援的功能,可讓工作負載共用 GPU。MIG 讓每個 GPU 能分隔成多個 GPU 執行個體,各自在硬體中完全獨立且受保護,且具備個別的高頻寬記憶體、快取和運算核心。現在不論大小,開發人員可為所有應用提供突破性加速,並獲得服務品質保障。IT 管理人員可為最佳利用率提供規模適中的 GPU 加速,並將橫跨實體與虛擬環境的存取權限擴展給每個使用者和應用。

結構化稀疏

結構化稀疏

現代人工智慧網路相當龐大且越來越大,有數百萬、甚至數十億個參數。精準預測與推論不需要用到所有參數,而有些參數可以轉換為零,以確保模型變「稀疏」的同時不會犧牲準確性。Tensor 核心最高可以將稀疏模型的效能提高 2 倍。將模型稀疏化對於人工智慧推論有益,同時也能改善模型訓練效能。

第二代 RT 核心

NVIDIA A40 中的 NVIDIA Ampere 架構第二代 RT 核心可大幅提升電影作品的擬真渲染、建築設計評估,以及產品設計虛擬原型製作等工作負載的速度。RT 核心還能加速光線追蹤於動態模糊的渲染效果,以更快的速度獲得更高的視覺準確度,還能在執行著色或雜訊消除功能的同時,執行光線追蹤。

第二代 RT 核心
更聰明、快速的記憶體

更聰明、快速的記憶體

A100 為資料中心提供大量運算效能。為充分運用運算引擎,A100 具備領先同級產品的每秒 2 TB (TB/秒) 記憶體頻寬,比前一代產品高出 2 倍多。此外,A100 的晶片記憶體也顯著增加,具備 40 MB 的 2 級快取,為上一代產品的 7 倍,可將運算效能最大化。

規模優化

NVIDIA GPU 和 NVIDIA 聚合加速器產品是專為大規模部署而打造,可為雲端、資料中心和邊緣端提供網路、資安和低耗能。

針對任何伺服器最佳化耗能

NVIDIA A2 GPU 針對受空間和散熱需求限制的入門級伺服器 (5G 邊緣和工業環境) 中的推論工作負載和部署進行了最佳化,提供體積最小的產品組合。A2 提供在低耗能環境中執行的小尺寸規格,從 60W 或低至 40W 的散熱設計功耗 (TDP) 皆有,對於任何伺服器都是理想選擇。

針對任何伺服器最佳化耗能
整合式加速運算與網路

整合式加速運算與網路

NVIDIA 聚合加速器整合 NVIDIA Ampere 架構與 NVIDIA BlueField®-2 資料處理器 (DPU),可提供無與倫比的效能,並加強邊緣運算、電信與網路安全等用途的人工智慧工作負載安全性與網路功能。BlueField-2 結合了 NVIDIA ConnectX®-6 Dx 的強大功能,以及可程控的 Arm® 核心與硬體卸載功能,可適用於軟體定義的儲存空間、網路、安全性和管理工作。NVIDIA 聚合加速器將網路密集、GPU 加速工作負載的資料中心效率與安全性提高至全新境界。

密度最佳化的設計

NVIDIA A16 GPU 採用四 GPU 主機板設計,專為使用者密度最佳化,並結合了 NVIDIA 虛擬 PC (vPC) 軟體,讓使用者無論身在何處都可以使用繪圖運算豐富的虛擬 PC。與僅使用 CPU 的 VDI 相比,NVIDIA A16 可提供更高的畫面播放速率和較低的終端使用者延遲,因此應用程式反應能更靈敏,並帶來與原生 PC 無異的使用者體驗。

密度最佳化的設計
安全部署

安全部署

安全部署對企業業務營運來說至關重要。NVIDIA Ampere 架構可透過可靠的身份驗證和強化的回滾保護提來防止惡意軟體攻擊,以確保啟動安全機制,並防止營運損失和加速工作負載。

一窺 NVIDIA Ampere 架構

探索架構的尖端技術及其 GPU 的完整列表。