NVIDIA vComputeServer

Führen Sie die rechenintensivsten Server-Workloads mit virtuellen Grafikprozessoren durch

Rechenleistung für KI, Deep Learning und Datenwissenschaft virtualisieren

Mit dem Virtual Compute Server von NVIDIA (vComputeServer) können Rechenzentren die Servervirtualisierung mit Grafikprozessoren beschleunigen, sodass die rechenintensivsten Workloads, wie z. B. künstliche Intelligenz, Deep Learning und Datenwissenschaft, in einer virtuellen Maschine (VM) ausgeführt werden können.

Merkmale

GPU-Sharing

GPU-Sharing

GPU-Sharing (fraktioniert) ist nur mit der NVIDIA vGPU-Technologie möglich. Sie ermöglicht es mehreren VMs, einen Grafikprozessor gemeinsam zu nutzen und die Auslastung für leichtere Workloads zu maximieren, für die eine Grafikprozessorbeschleunigung erforderlich ist.

GPU-Aggregation

GPU-Aggregation

Bei der GPU-Aggregation kann eine VM auf mehrere Grafikprozessoren zugreifen, was häufig für rechenintensive Workloads erforderlich ist. vComputeServer unterstützt sowohl Multi-vGPU als auch Peer-to-Peer-Computing. Bei Multi-vGPU sind die Grafikprozessoren nicht direkt verbunden. Bei Peer-to-Peer sind sie zum Erzielen einer höheren Bandbreite durch NVLink verbunden.

Verwaltung und Überwachung

Verwaltung und Überwachung

vComputeServer unterstützt die Überwachung auf App-, Gast- und Hostebene. Darüber hinaus bieten proaktive Verwaltungsfunktionen die Möglichkeit, eine Live-Migration durchzuführen, Schwellenwerte zu unterbrechen und wieder aufzunehmen und zu erstellen. Diese Schwellenwerte zeigen die Verbrauchstrends, die sich auf die Nutzererfahrung auswirken. Das alles ist in der vGPU Management SDK möglich.

NGC

NGC

NVIDIA GPU Cloud (NGC) ist ein Hub für grafikprozessoroptimierte Software, die Workflows für Deep Learning, maschinelles Lernen und HPC vereinfacht und jetzt virtualisierte Umgebungen mit NVIDIA vComputeServer unterstützt.

Peer-to-Peer-Computing

Peer-to-Peer-Computing

NVIDIA® NVLink ist eine schnelle, direkte GPU-zu-GPU-Verbindung, die eine höhere Bandbreite, mehr Verbindungen und eine verbesserte Skalierbarkeit für Systemkonfigurationen mit mehreren Grafikprozessoren bietet – jetzt virtuell unterstützt mit NVIDIA-Technologie für virtuelle Grafikprozessoren (vGPU).

ECC und Page Retirement

ECC und Page Retirement

Der Fehlerkorrekturcode (ECC) und Page Retirement bieten eine höhere Zuverlässigkeit für Rechenanwendungen, die für Datenbeschädigungen anfällig sind. Sie sind besonders wichtig in umfangreichen Cluster-Computing-Umgebungen, in denen Grafikprozessoren sehr umfangreiche Datensätze verarbeiten und/oder Anwendungen über einen längeren Zeitraum ausführen.

NVIDIA vComputeServer

Grafikprozessorempfehlungen

  NVIDIA T4 NVIDIA V100 (SXM2)
RT-Recheneinheiten 48
Tensor-Recheneinheiten 320 640
CUDA®-Recheneinheiten 2.560 5.120
Arbeitsspeicher 16 GB GDDR6 32 GB HBM2
FP 16/FP 32 (Mixed-Precision) 64 TFLOPS 125 TFLOPS
FP 32 (Single-Precision) 8,1 TFLOPS 15,7 TFLOPS
FP 64 (Double-Precision) 7,8 TFLOPS
NVLink: Anzahl der Grafikprozessoren pro VM Bis zu 8
ECC und Page Retirement
Mehrere Grafikprozessoren pro VM Bis zu 16 Bis zu 16

Partner bei der Virtualisierung

Häufig gestellte Fragen

Weitere Informationen zur NVIDIA-Software für virtuelle Grafikprozessoren

Produktversionshinweise und unterstützte Softwareprodukte von Drittanbietern anzeigen