NVIDIA Virtual Compute Server

Impulsa las cargas de trabajo de servidor más intensivas en computación con GPU virtuales

Virtualizar Compute para IA, Aprendizaje en profundidad y Ciencia de Datos

NVIDIA Virtual Compute Server (vCS) habilita los centros de datos para acelerar la virtualización del servidor con las GPU de los centros de datos de NVIDIA más recientes, incluida GPU NVIDIA A100 Tensor Core¹, para que las cargas de trabajo más intensivas en computación, como la inteligencia artificial,el aprendizaje profundo y la ciencia de datos, pueda ejecutarse en una máquina virtual (VM).

Características

Uso compartido de GPU

Uso compartido de GPU

El uso compartido de GPU (fraccionario) solo es posible con la tecnología NVIDIA vGPU. Permite que varias máquinas virtuales compartan una GPU, lo que maximiza la utilización para cargas de trabajo más ligeras que requieren aceleración de GPU.

Agregación de GPU

Agregación de GPU

Con la agregación de GPU, una máquina virtual puede tener acceso a más de una GPU, que a menudo es necesaria para cargas de trabajo de proceso intensivo. vCS admite la computación multi-vGPU y punto a punto. Con multi-vGPU, las GPU no están conectadas directamente; con punto a punto, están conectadas a través de NVLink para un mayor ancho de banda.

Gestión y supervisión

Gestión y supervisión

vCS proporciona compatibilidad con la supervisión a nivel de aplicación, invitado y host. Además, las funciones de administración proactiva proporcionan la capacidad de realizar migración en vivo, suspender y reanudar y crear umbrales que expongan las tendencias de consumo que afectan a las experiencias de usuario, todo a través del SDK de administración de vGPU.

NGC

NGC

NVIDIA GPU Cloud (NGC) es un centro de software optimizado para GPU que simplifica los flujos de trabajo para aprendizaje en profundidad, aprendizaje automático y HPC, y ahora admite entornos virtualizados con NVIDIA vCS.

Computación punto a punto

Computación punto a punto

NVIDIA® NVLink es una interconexión directa de GPU a GPU de alta velocidad que proporciona mayor ancho de banda, más enlaces y escalabilidad mejorada para configuraciones de sistemas multi-GPU, ahora compatible virtualmente con Tecnología GPU virtual NVIDIA (vGPU).

Retirada de ECC y página

Retirada de ECC y página

El código de corrección de errores (ECC) y la retirada de páginas proporcionan una mayor confiabilidad para las aplicaciones de computación que son sensibles a la corrupción de datos. Son especialmente importantes en entornos de computación en clúster a gran escala donde las GPU procesan conjuntos de datos muy grandes o ejecutan aplicaciones durante períodos prolongados.

GPU multiinstancia (MIG)

GPU multiinstancia (MIG)

Multi-Instance GPU (MIG) es una tecnología revolucionaria que puede ampliar las capacidades del centro de datos que permite que cada GPU NVIDIA A100 Tensor Core se particione en hasta siete instancias, totalmente aislada y protegida a nivel de hardware con su propia memoria de gran ancho de banda, caché y núcleos informáticos. Con el software vCS, se puede ejecutar una máquina virtual en cada una de estas instancias MIG para que las organizaciones puedan aprovechar las ventajas de administración, supervisión y operativas de la virtualización de servidores basada en hipervisores.

Recomendaciones para GPU

  NVIDIA A100¹ NVIDIA V100S NVIDIA RTX 8000 NVIDIA RTX 6000 NVIDIA T4
Memoria 40 GB HBM2 32 GB HBM2 48 GB GDDR6 24 GB GDDR6 16 GB GDDR6
Pico FP 32 19,5 TFLOPS 16,4 TFLOPS 14,9 TFLOPS 14,9 TFLOPS 8,1 TFLOPS
Pico FP 64 9,7 TFLOPS 8,2 TFLOPS - - -
NVLink: número de GPU por máquina virtual Hasta 8 Hasta 8 2 2 -
Retirada de ECC y página
Multi-vGPU por máquina virtual1 Hasta 16 Hasta 16 Hasta 16 Hasta 16 Hasta 16

Partners de virtualización

Preguntas frecuentes

Obtener más información acerca del software de GPU virtual NVIDIA

Consulta las notas sobre la versión del producto y los productos de software compatibles de terceros.