NVIDIA Ampere
架構

全球效能最強彈性資料中心的核心。

現代資料中心內的人工智慧與高效能運算核心

透過人工智慧和高效能運算解決全球最重要的科學、工業與商業難題。視覺化複雜內容,打造尖端產品、訴說富臨場感的故事,並構思未來城市的樣貌。從大量資料集擷取見解。專為彈性運算時代打造的 NVIDIA Ampere 架構將能解決所有難題,為各種規模需求提供無與倫比的加速效能。

突破性創新

NVIDIA Ampere 架構以 540 億個電晶體打造,是有史以來最大的 7 奈米 (nm) 晶片,包含六項關鍵的突破性創新。

第三代 Tensor 核心

NVIDIA Tensor 核心技術最先運用在 NVIDIA Volta™ 架構上,不只大幅加速人工智慧,也將訓練時間從數週降至數小時,同時顯著提升推論速度。NVIDIA Ampere 架構以這些創新技術為基礎,採用全新精度標準 Tensor Float 32 (TF32) 與 64 位元浮點 (FP64),以加速並簡化人工智慧應用,同時將 Tensor 核心效能拓展至高效能運算。

TF32 與 FP32 運作方式相同,無需更改任何程式碼即可將人工智慧速度提升至最高 20 倍。透過 NVIDIA 自動混合精度,研究人員只要多加幾行程式碼,就可以利用自動混合精度和 FP16 將效能提升 2 倍。而 NVIDIA Ampere 架構 Tensor 核心 GPU 中的 Tensor 核心透過支援 bfloat16、INT8 與 INT4,能為人工智慧訓練和推論創造極致多元的加速器。A100A30 GPU 不只將強大的 Tensor 核心導入高效能運算,也支援完整矩陣運算、通過 IEEE 認證,並使用 FP64 精度。

第三代 Tensor 核心
多執行個體 GPU (MIG)

多執行個體 GPU (MIG)

每個人工智慧與高效能運算應用都能受益於加速,但並非所有應用都需要使用 GPU 的完整效能。多執行個體 GPU (MIG) 是 A100  和 A30 GPU 支援的功能,可讓工作負載共用 GPU。MIG 讓每個 GPU 能分隔成多個 GPU 執行個體,各自在硬體中完全獨立且受保護,且具備個別的高頻寬記憶體、快取和運算核心。現在不論大小,開發人員可為所有應用提供突破性加速,並獲得服務品質保障。IT 管理人員可為最佳利用率提供規模適中的 GPU 加速,並將橫跨實體與虛擬環境的存取權限擴展給每個使用者和應用。

結構化稀疏

結構化稀疏

現代人工智慧網路相當龐大且越來越大,有數百萬、甚至數十億個參數。精準預測與推論不需要用到所有參數,而有些參數可以轉換為零,以確保模型變「稀疏」的同時不會犧牲準確性。Tensor 核心最高可以將稀疏模型的效能提高 2 倍。將模型稀疏化對於人工智慧推論有益,同時也能改善模型訓練效能。

第二代 RT 核心

NVIDIA A40 中的 NVIDIA Ampere 架構第二代 RT 核心可大幅提升電影作品的擬真渲染、建築設計評估,以及產品設計虛擬原型製作等工作負載的速度。RT 核心還能加速光線追蹤於動態模糊的渲染效果,以更快的速度獲得更高的視覺準確度,還能在執行著色或雜訊消除功能的同時,執行光線追蹤。

第二代 RT 核心
更聰明、快速的記憶體

更聰明、快速的記憶體

A100 為資料中心提供大量運算效能。為充分運用運算引擎,A100 具備領先同級產品的每秒 2 TB (TB/秒) 記憶體頻寬,比前一代產品高出 2 倍多。此外,A100 的晶片記憶體也顯著增加,具備 40 MB 的 2 級快取,為上一代產品的 7 倍,可將運算效能最大化。

規模優化

NVIDIA GPU 和 NVIDIA 聚合加速器產品是專為大規模部署而打造,可為雲端、資料中心和邊緣端提供網路、資安和低耗能。

針對任何伺服器最佳化耗能

NVIDIA A2 GPU 針對受空間和散熱需求限制的入門級伺服器 (5G 邊緣和工業環境) 中的推論工作負載和部署進行了最佳化,提供體積最小的產品組合。A2 提供在低耗能環境中執行的小尺寸規格,從 60W 或低至 40W 的散熱設計功耗 (TDP) 皆有,對於任何伺服器都是理想選擇。

針對任何伺服器最佳化耗能
整合式加速運算與網路

整合式加速運算與網路

NVIDIA 聚合加速器整合 NVIDIA Ampere 架構與 NVIDIA BlueField®-2 資料處理器 (DPU),可提供無與倫比的效能,並加強邊緣運算、電信與網路安全等用途的人工智慧工作負載安全性與網路功能。BlueField-2 結合了 NVIDIA ConnectX®-6 Dx 的強大功能,以及可程控的 Arm® 核心與硬體卸載功能,可適用於軟體定義的儲存空間、網路、安全性和管理工作。NVIDIA 聚合加速器將網路密集、GPU 加速工作負載的資料中心效率與安全性提高至全新境界。

密度最佳化的設計

NVIDIA A16 GPU 採用四 GPU 主機板設計,專為使用者密度最佳化,並結合了 NVIDIA 虛擬 PC (vPC) 軟體,讓使用者無論身在何處都可以使用繪圖運算豐富的虛擬 PC。與僅使用 CPU 的 VDI 相比,NVIDIA A16 可提供更高的畫面播放速率和較低的終端使用者延遲,因此應用程式反應能更靈敏,並帶來與原生 PC 無異的使用者體驗。

密度最佳化的設計
安全部署

安全部署

安全部署對企業業務營運至關重要。NVIDIA Ampere 架構透過受信任的程式碼驗證與強化復原保護支援安全開機,可防止惡意軟體攻擊,藉此避免營運損失,同時確保加速工作負載。

一窺 NVIDIA Ampere 架構

探索架構的尖端技術及其 GPU 的完整列表。