使用虛擬化 GPU 支援運算最密集的伺服器工作負載
NVIDIA 虛擬化運算伺服器 (vComputeServer) 讓資料中心透過 GPU 加速伺服器虛擬化,使運算密集工作負載得以在虛擬機器 (VM) 中執行,例如人工智慧、深度學習和資料科學。
GPU 共享 (部份) 只有 NVIDIA vGPU 技術才能做到。這項技術讓多個 VM 共用 GPU,徹底發揮需要 GPU 加速的輕量工作負載使用率。
透過 GPU 彙總,VM 可存取多個 GPU,通常這也是運算密集工作負載的需求。vComputeServer 支援多 vGPU 和點對點運算。使用多 vGPU 時,GPU 不會直接互連,而是以點對點的方式透過 NVLink 取得更高的頻寬。
vComputeServer 支援應用程式、訪客和主機層級的監控。此外,主動管理功能可透過 vGPU 管理 SDK 提供即時移轉、暫停和回復技術,並且建立臨界值來找出將影響使用者體驗的消費趨勢。
NVIDIA GPU 雲 (NGC) 是 GPU 最佳化應用軟體中樞,可簡化深度學習、機器學習與 HPC 的工作流程,現在更支援採用 NVIDIA vComputeServer 的虛擬化環境。
NVIDIA® NVLink™ 是一項 GPU 到 GPU 的高速直接互連技術,可為多 GPU 系統設定提供更高頻寬、更多連結及更佳的擴充性,現在更透過 NVIDIA 虛擬化 GPU (vGPU) 技術提供虛擬化支援。
針對容易受到資料損毀影響的運算應用程式,錯誤修正代碼 (error correction code,ECC) 和頁面退役可為其提供更高的可靠性。兩者在大規模叢集運算環境中尤其重要,因為 GPU 需要處理大量資料集和/或長期執行應用程式。
GRID vPC/vApps 和 Quadro vDWS 是專為專業知識從業人員與創意或技術專業人員設計的虛擬繪圖用戶端運算產品。vComputeServer 適用於運算密集的伺服器工作負載,例如人工智慧、深度學習和 HPC。
否,取得 vComputeServer 與 GRID vPC/vApps 和 Quadro vDWS 授權的方式並不相同。GRID vPC/vApps 和 Quadro vDWS 是以同時上線的使用者 (CCU) 為單位授權,可以採用永久授權或年度訂閱的方式。由於 vComputeServer 適用於伺服器運算工作負載,授權是綁定 GPU 而非使用者。因此,vComputeServer 是以 GPU 為單位授權的年度訂閱。如需授權的詳細資料,請參閱 NVIDIA 虛擬化 GPU 包裝、定價和授權指南。
vComputeServer 的建議 NVIDIA GPU 包括適用於深度學習訓練和 HPC 的 NVIDIA V100,以及適用於深度學習推論的 NVIDIA T4。亦支援 Quadro RTX™ 6000 和 RTX 8000,以及採用 Pascal 架構的 GPU,包括 NVIDIA P40、P100 與 P6。
請參閱 vGPU 認證伺服器頁面取得所有 vGPU 產品的認證伺服器完整清單。
可以,容器可以在使用 vComputeServer 的 VM 中執行。NVIDIA NGC 提供一系列完備的 GPU 加速深度學習、機器學習和 HPC 容器。工作負載也可以使用 vComputeServer 直接在 VM 中執行,且不需容器。
檢視產品資訊與支援的第三方應用軟體產品