NVIDIA Virtual Compute Server

Alimenta i carichi di lavoro server più intensivi con le GPU virtuali

Calcolo virtualizzato per IA, deep learning e scienza dei dati

NVIDIA Virtual Compute Server (vCS) permette ai data center di accelerare la virtualizzazione server con le più recenti GPU NVIDIA, tra cui la GPU NVIDIA A100 Tensor Core¹ in modo che i carichi di lavoro più intensivi, come intelligenza artificiale, deep learning e scienza di dati, possano essere eseguiti su una macchina virtuale (VM).

Caratteristiche

Condivisione della GPU

Condivisione della GPU

La condivisione della GPU (frazionata) è possibile solo con la tecnologia NVIDIA vGPU. Permette a più macchine virtuali di condividere una GPU, massimizzando l'utilizzo per carichi di lavoro più leggeri che richiedono accelerazione con GPU.

Aggregazione di GPU

GPU Aggregation

Con l'aggregazione delle GPU, una macchina virtuale può accedere a più GPU, il che spesso è necessario per carichi di lavoro molto intensivi in termini di calcolo. vCS supporta il computing multi-vGPU e peer-to-peer. Con il multi-vGPU, le GPU non sono connesse direttamente, mentre con il peer-to-peer, esse sono connesse tramite NVLink aumentando la larghezza di banda.

Gestione e monitoraggio

Gestione e monitoraggio

vCS fornisce il supporto per il monitoraggio a livello di applicazioni, guest e host. Inoltre le funzionalità di gestione proattiva permettono di eseguire migrazioni in tempo reale, sospendere e riprendere, creare soglie ed visualizzare le tendenze sul consumo che influiscono sull'esperienza utenti, il tutto tramite l'SDK di gestione della vGPU.

NGC

NGC

NVIDIA GPU Cloud (NGC) è un hub per software ottimizzato da GPU che semplifica i flussi di lavoro per deep learning, machine learning e HPC, e ora supporta ambienti virtualizzati con NVIDIA vCS.

Computing peer-to-peer

Computing peer-to-peer

NVIDIA® NVLink è un'interconnessione diretta GPU-GPU ad alta velocità che offre maggiore larghezza di banda, più link e scalabilità migliorata per configurazioni di sistema multi-GPU. Ora supportato virtualmente con la tecnologia NVIDIA Virtual GPU.

ECC e ritiro delle pagine

ECC e ritiro delle pagine

Il codice di correzione errori (ECC) e il ritiro delle pagine offrono maggiore affidabilità per le applicazioni di elaborazione sensibili al danneggiamento dei dati. Questi strumenti sono importanti soprattutto in ambienti di calcolo cluster su larga scala, dove le GPU elaborano set di dati molto voluminosi e/o eseguono applicazioni per periodi prolungati.

Multi-Instance GPU (MIG)

Multi-Instance GPU (MIG)

Multi-Instance GPU (MIG) è una tecnologia rivoluzionaria in grado di estendere le capacità del data center, consentendo a ciascuna GPU NVIDIA A100 Tensor Core di essere partizionata in un massimo di sette istanze, completamente isolate e protette a livello hardware con la propria memoria a banda elevata, cache e core di calcolo. Con il software vCS, è possibile eseguire una VM su ciascuna istanza MIG in modo che le organizzazioni possano sfruttare i vantaggi gestionali, operativi e di monitoraggio della virtualizzazione dei server basata su hypervisor.

GPUDirect

GPUDirect

GPUDirect® RDMA (accesso diretto alla memoria remota) consente ai dispositivi di rete di accedere direttamente alla memoria della GPU, bypassando la memoria host della CPU, diminuendo la latenza di comunicazione GPU-GPU e riducendo completamente il carico sulla CPU.

Consigli per la GPU

  NVIDIA A100¹ NVIDIA V100S NVIDIA A401 NVIDIA RTX 8000 NVIDIA RTX 6000 NVIDIA T4
Memoria HBM2 40 GB HBM2 32 GB GDDR6 48 GB GDDR6 48 GB GDDR6 24 GB GDDR6 16 GB
Picco FP 32 19,5 TFLOPS 16,4 TFLOPS 38,1 TFLOPS 14,9 TFLOPS 14,9 TFLOPS 8,1 TFLOPS
Picco FP 64 9,7 TFLOPS 8,2 TFLOPS - - - -
NVLink: numero di GPU per macchina virtuale Fino a 8 Fino a 8 2 2 2 -
ECC e ritiro delle pagine
Multi-vGPU per VM1 Fino a 16 Fino a 16 Fino a 16 Fino a 16 Fino a 16 Fino a 16

Partner di virtualizzazione

Domande frequenti

Vedi le note di rilascio dei prodotti e i prodotti software supportati da terzi

Scopri di più sul software NVIDIA Virtual GPU