NVIDIA vComputeServer

Impulsa las cargas de trabajo de servidor más intensivas en computación con GPU virtuales

Virtualizar Compute para IA, Aprendizaje en profundidad y Ciencia de Datos

NVIDIA Virtual Compute Server (vComputeServer) permite a los centros de datos acelerar la virtualización de servidores con GPU para que las cargas de trabajo más intensivas en computación, como inteligencia artificial, aprendizaje en profundidad y ciencia de datos, se puedan ejecutar en una máquina virtual (VM).

Características

Uso compartido de GPU

Uso compartido de GPU

El uso compartido de GPU (fraccionario) solo es posible con la tecnología NVIDIA vGPU. Permite que varias máquinas virtuales compartan una GPU, lo que maximiza la utilización para cargas de trabajo más ligeras que requieren aceleración de GPU.

Agregación de GPU

Agregación de GPU

Con la agregación de GPU, una máquina virtual puede tener acceso a más de una GPU, que a menudo es necesaria para cargas de trabajo de proceso intensivo. vComputeServer admite la computación multi-vGPU y punto a punto. Con multi-vGPU, las GPU no están conectadas directamente; con punto a punto, están conectadas a través de NVLink para un mayor ancho de banda.

Gestión y supervisión

Gestión y supervisión

vComputeServer proporciona compatibilidad con la supervisión a nivel de aplicación, invitado y host. Además, las funciones de administración proactiva proporcionan la capacidad de realizar migración en vivo, suspender y reanudar y crear umbrales que expongan las tendencias de consumo que afectan a las experiencias de usuario, todo a través del SDK de administración de vGPU.

NGC

NGC

NVIDIA GPU Cloud (NGC) es un centro de software optimizado para GPU que simplifica los flujos de trabajo para aprendizaje en profundidad, aprendizaje automático y HPC, y ahora admite entornos virtualizados con NVIDIA vComputeServer.

Computación punto a punto

Computación punto a punto

NVIDIA® NVLink es una interconexión directa de GPU a GPU de alta velocidad que proporciona mayor ancho de banda, más enlaces y escalabilidad mejorada para configuraciones de sistemas multi-GPU, ahora compatible virtualmente con Tecnología GPU virtual NVIDIA (vGPU).

Retirada de ECC y página

Retirada de ECC y página

El código de corrección de errores (ECC) y la retirada de páginas proporcionan una mayor confiabilidad para las aplicaciones de computación que son sensibles a la corrupción de datos. Son especialmente importantes en entornos de computación en clúster a gran escala donde las GPU procesan conjuntos de datos muy grandes o ejecutan aplicaciones durante períodos prolongados.

NVIDIA vComputeServer

Recomendaciones para GPU

  NVIDIA T4 NVIDIA V100 (SXM2)
Núcleos RT 48 -
Núcleos Tensor 320 640
Núcleos CUDA®s 2,560 5,120
Memoria GDDR6 de 16 GB HBM2 de 32 GB
FP 16/FP 32 (precisión mixta) 64 TFLOPS 125 TFLOPS
FP 32 (precisión única) 8.1 TFLOPS 15.7 TFLOPS
FP 64 (doble precisión) - 7.8 TFLOPS
NVLink: número de GPU por máquina virtual - Hasta 8
Retirada de ECC y página
Multi-GPU por máquina virtual Hasta 16 Hasta 16

Partners de virtualización

Preguntas frecuentes

Obtener más información acerca del software de GPU virtual NVIDIA

Consulta las notas sobre la versión del producto y los productos de software compatibles de terceros.