NVIDIA vComputeServer

Alimenta i carichi di lavoro server più intensivi con le GPU virtuali

Calcolo virtualizzato per IA, deep learning e scienza dei dati

NVIDIA Virtual Compute Server (vComputeServer) permette ai data center di accelerare la virtualizzazione server con le GPU in modo che i carichi di lavoro più intensivi, come intelligenza artificiale, deep learning e scienza di dati, possano essere eseguiti su una macchina virtuale (VM).

Caratteristiche

Condivisione della GPU

Condivisione della GPU

La condivisione della GPU (frazionata) è possibile solo con la tecnologia NVIDIA vGPU. Permette a più macchine virtuali di condividere una GPU, massimizzando l'utilizzo per carichi di lavoro più leggeri che richiedono accelerazione con GPU.

Aggregazione di GPU

GPU Aggregation

Con l'aggregazione delle GPU, una macchina virtuale può accedere a più GPU, il che spesso è necessario per carichi di lavoro molto intensivi in termini di calcolo. vComputeServer supporta il computing multi-vGPU e peer-to-peer. Con il multi-vGPU, le GPU non sono connesse direttamente, mentre con il peer-to-peer, esse sono connesse tramite NVLink aumentando la larghezza di banda.

Gestione e monitoraggio

Gestione e monitoraggio

vComputeServer fornisce il supporto per il monitoraggio a livello di applicazioni, guest e host. Inoltre le funzionalità di gestione proattiva permettono di eseguire migrazioni in tempo reale, sospendere e riprendere, creare soglie ed visualizzare le tendenze sul consumo che influiscono sull'esperienza utenti, il tutto tramite l'SDK di gestione della vGPU.

NGC

NGC

NVIDIA GPU Cloud (NGC) è un hub per software ottimizzato da GPU che semplifica i flussi di lavoro per deep learning, machine learning e HPC, e ora supporta ambienti virtualizzati con NVIDIA vComputeServer.

Computing peer-to-peer

Computing peer-to-peer

NVIDIA® NVLink è un'interconnessione diretta GPU-GPU ad alta velocità che offre maggiore larghezza di banda, più link e scalabilità migliorata per configurazioni di sistema multi-GPU. Ora supportato virtualmente con la tecnologia NVIDIA Virtual GPU.

ECC e ritiro delle pagine

ECC e ritiro delle pagine

Il codice di correzione errori (ECC) e il ritiro delle pagine offrono maggiore affidabilità per le applicazioni di elaborazione sensibili al danneggiamento dei dati. Questi strumenti sono importanti soprattutto in ambienti di calcolo cluster su larga scala, dove le GPU elaborano set di dati molto voluminosi e/o eseguono applicazioni per periodi prolungati.

NVIDIA vComputeServer

Consigli per la GPU

  NVIDIA T4 NVIDIA V100 (SXM2)
RT Core 48 -
Tensor Core 320 640
CUDA® Core 2,560 5,120
Memoria GDDR6 da 16 GB HBM2 32 GB
FP 16/FP 32 (precisione mista) 64 TFLOPS 125 TFLOPS
FP 32 (precisione singola) 8.1 TFLOPS 15.7 TFLOPS
FP 64 (precisione doppia) - 7.8 TFLOPS
NVLink: numero di GPU per macchina virtuale - Fino a 8
ECC e ritiro delle pagine
Multi-GPU per macchina virtuale Fino a 16 Fino a 16

Partner di virtualizzazione

Domande frequenti

Vedi le note di rilascio dei prodotti e i prodotti software supportati da terzi

Scopri di più sul software NVIDIA Virtual GPU