生成式 AI 應用運用神經網路辨識現有資料中的模式和結構,讓使用者從影像、聲音、動畫和 3D 模型等各種輸入和輸出內容產生全新的原創內容。NVIDIA AI Enterprise 內含的 NeMo™ 框架是運用 NVIDIA 的生成式人工智慧解決方案,透過此框架和 A800 40GB Active 顯示卡,可輕鬆快速地自訂生成式人工智慧模型開發流程。
TNVIDIA® A800 40GB Active GPU 採用 NVIDIA Ampere 架構,是搭載 NVIDIA AI Enterprise 軟體的終極工作站開發平台,可提供強大效能來加速新一代資料科學、人工智慧、高效能運算和工程模擬/CAE 工作負載。
9.7 TFLOPS¹
1,247 AI TOPS²
1.5 TB/s
1 最高速率以 GPU Boost Clock 為準。2 使用稀疏性的理論 INT8 TOPS。
NVIDIA A800 40GB Active GPU 提供驚人效能,因應工作站平台上效能需求最高的工作流程,包括 AI 訓練和推論,以及複雜的工程模擬、建模和資料分析。A800 40 GB Active 的效能是上一代產品的 2 倍以上,完美支援各種運算密集的工作負載。
ResNet-50 V1.5 訓練。批次大小 = 256;精度 = 混合。
BERT 大型預先訓練第 2 階段。批次大小 = 8;精度 = 混合。
GTC 4.5 版、TAE、精度 = FP32。
LAMMPS patch_8Feb2023,Atomic Fluid Lennard-Jones 2.5(截止點);精度 = FP64。
ResNet-50 V1.5 推論。批次大小 =128;精度 = 混合。
BERT 大型推論。批次大小 = 128;精度 = INT8。
以 A800 40GB Active、Quadro GV100 GPU 和 Intel Xeon Gold 6126 處理器進行效能測試。
採用 NVIDIA RTX™ 技術的 AI 工作站可為桌上型電腦提供超級電腦的強大功能,也能卸載資料中心資源需求。配備最新 NVIDIA RTX GPU 的工作站平台提供強大的 AI 效能,用於打造、訓練和部署新一代 AI 增強的應用程式和模型。
GPU 記憶體 | 40GB HBM2 |
記憶體介面 | 5,120 位 |
記憶體頻寬 | 1,555.2 GB/秒 |
CUDA 核心 | 6,912 |
Tensor 核心 | 432 |
雙精度效能 | 9.7 兆次浮點運算 |
單精度效能 | 19.5 兆次浮點運算 |
峰值 Tensor 效能 | 623.8 兆次浮點運算 |
多執行個體GPU | 最多 7 個 MIG 實例 @ 5GB |
NVIDIA NVLink | 是的 |
NVLink 頻寬 | 400GB/秒 |
繪圖匯流排 | PCIe 4.0×16 |
最大功耗 | 240瓦 |
散熱 | 主動 |
尺寸 | 4.4” 高 x 10.5” 長,雙槽 |
顯示能力* | - |
*A800 40GB Active 未配備顯示埠。需要 NVIDIA RTX 4000 Ada Generation、NVIDIA RTX A4000 或 NVIDIA T1000 GPU 才能支援顯示輸出功能。 |