Ecosistema de almacenamiento de IA para data centers

Plataforma de Almacenamiento de Memoria Contextual NVIDIA CMX

Rediseño del almacenamiento de inferencia para la próxima frontera de la IA.

Descripción General
Productos
Beneficios
Ecosistema
Recursos
Comenzar

Descripción General
Productos
Beneficios
Ecosistema
Recursos
Comenzar

Descripción General

El almacenamiento nativo de la IA acelera la inferencia de contexto largo a escala

El almacenamiento de memoria contextual NVIDIA® CMX™ es una capa contextual nativa de la IA para la inferencia de IA de contexto largo, de múltiples turnos y agéntica. Con la tecnología del procesador de almacenamiento NVIDIA BlueField®‑4, extiende la memoria de GPU con una capa contextual compartida a nivel de pods optimizada para la caché de valor de clave (KV) efímera. La plataforma proporciona una ruta de alto ancho de banda que reduce la latencia, el costo y la sobrecarga de energía para cargas de trabajo de inferencia a gran escala, lo que ayuda a ofrecer un mayor rendimiento y una mejor eficiencia energética en las plataformas NVIDIA Rubin.

NVIDIA BlueField-4 impulsa una nueva clase de almacenamiento nativo de IA para la próxima frontera de la IA

NVIDIA CMX extiende la capacidad de las GPU y permite compartir la caché de KV de alto ancho de banda en sistemas de IA a escala de bastidor. Ofrece un mayor rendimiento y una mejor eficiencia energética para la inferencia de múltiples turnos en contexto largo que el almacenamiento tradicional.

Lea el Comunicado de Prensa

Presentamos la Plataforma de Almacenamiento de Memoria Contextual Impulsada por NVIDIA BlueField-4 para la Próxima Frontera de la IA

NVIDIA CMX usa NVIDIA BlueField‑4, DOCA™ y Spectrum‑X™ Ethernet para agregar una capa de memoria contextual a nivel de pods que ofrece un mayor rendimiento y eficiencia energética para la inferencia de la IA agéntica en contexto largo.

Lea el Blog

Productos

Infraestructura de Almacenamiento Nativa de IA, Integrada de Extremo a Extremo

Desde la memoria contextual acelerada y el movimiento seguro de datos hasta las estructuras Ethernet y los frameworks de inferencia, NVIDIA CMX es el resultado del diseño conjunto extremo en computación, redes, almacenamiento y software.

NVIDIA BlueField-4

La plataforma NVIDIA BlueField acelera NVIDIA CMX al ofrecer un desempeño, una eficiencia y una innovación sin precedentes. BlueField-4 administra unidades de estado sólido (SSD) Non-Volatile Memory Express (NVMe), ejecuta servicios de almacenamiento y descarga la integridad y el cifrado de los datos para la caché KV con alta eficiencia energética. Sus capacidades avanzadas de computación y los aceleradores de hardware definidos por software para redes, almacenamiento y seguridad crean una infraestructura segura y con eficiencia energética para cada carga de trabajo.

Transforme el data center con NVIDIA BlueField

Memos de NVIDIA DOCA

NVIDIA DOCA Memos es un SDK optimizado para BlueField-4 y CMX que administra y comparte la caché de KV entre los nodos de computación de IA y los datos CMX, lo que expone API simples de valor clave y convierte el flash conectado a Ethernet en una capa de caché a nivel de pod. Ofrece acceso seguro y de baja latencia con integridad y cifrado acelerados por hardware, por lo que las aplicaciones se mantienen sin estado mientras CMX maneja el enrutamiento y la reutilización de la caché KV a escala.

Acelere la Inferencia de la IA con Memos de DOCA

Redes Ethernet NVIDIA Spectrum-X

NVIDIA Spectrum-X Ethernet proporciona una estructura de acceso remoto directo a memoria (RDMA) de alto desempeño para el acceso de baja latencia y alto ancho de banda a la caché KV nativa de IA en todo el pod. Spectrum-X Ethernet, diseñada específicamente para la IA, usa control avanzado de congestión, enrutamiento adaptativo y RDMA sobre Ethernet convergente (RoCE) sin pérdidas para minimizar la fluctuación y la latencia de la cola, lo que ofrece un desempeño consistente y repetible en entornos grandes de múltiples inquilinos. Esto permite a CMX escalar con un alto desempeño predecible, lo que maximiza el rendimiento y la capacidad de respuesta para cargas de trabajo de inferencia de agentes de múltiples turnos.

Escale las Redes de IA con Spectrum-X Ethernet

NVIDIA Dynamo

NVIDIA Dynamo es un framework distribuido de servicio de inferencia que hace que CMX y las capas de almacenamiento contextual subyacentes aparezcan sin fisuras en todo el pod, enrutando las solicitudes donde ya reside la caché de KV. Al manejar la colocación y la reutilización conscientes de KV en la capa de servicio, Dynamo aumenta los tokens por segundo, reduce el tiempo hasta el primer token y permite la reutilización contextual de todo el pod para cargas de trabajo de múltiples pasos y múltiples agentes.

Acelere la Inferencia de la IA con NVIDIA Dynamo

Beneficios de los Productos

Memoria Contextual Acelerada para IA de Contexto Largo

NVIDIA CMX presenta una capa de contexto dedicada que mejora el rendimiento sostenido y la eficiencia energética para las cargas de trabajo de contexto largo que requieren mucho caché KV, en comparación con los enfoques de almacenamiento tradicionales.

Recupere potencia para IA a gigaescala

Escale los servicios de IA con una capa de almacenamiento altamente eficiente y optimizada para caché de KV que recupera la energía esencial, lo que libera una mayor parte del presupuesto de energía del data center para las GPU, en lugar del almacenamiento tradicional.

Maximice la utilización, el rendimiento y la capacidad de respuesta de las GPU

Optimice las rutas de datos y reduzca los estancamientos reutilizando la caché de KV precomputada de la capa CMX en lugar de recomputarla. Esto aumenta los tokens por segundo y el rendimiento para la inferencia de agentes de múltiples turnos. CMX reduce el tiempo hasta el primer token y el tiempo hasta el último token, por lo que las respuestas se transmiten antes y terminan más rápido, incluso a medida que crecen los modelos, las ventanas contextuales y la concurrencia.

Habilite el intercambio de caché de KV inteligente y eficiente en todo el pod de IA

Proporcione acceso de alta velocidad y en todo el pod al contexto nativo de la IA para permitir a los agentes de múltiples turnos coordinar, compartir el estado y escalar sin problemas a medida que crecen las cargas de trabajo, reduciendo al mismo tiempo la duplicación de la caché de KV y la capacidad aislada entre los nodos.

Extienda la Capacidad de la GPU para la Inferencia de Contexto Largo

Ofrezca una capacidad masiva de caché de KV para admitir razonamiento de contexto largo, workflows de múltiples agentes, modelos de billones de parámetros y ventanas contextuales más largas para muchos usuarios simultáneos.

NVIDIA STX

NVIDIA STX es una arquitectura de referencia modular para el almacenamiento de IA diseñada conjuntamente con socios de almacenamiento líderes y basada en computación acelerada, redes y software de IA de NVIDIA. NVIDIA STX proporciona la base para desarrollar un motor de datos universal que acelera todo el ciclo de vida de la IA, desde el entrenamiento y el análisis hasta la inferencia agéntica en tiempo real.

Más Información Sobre NVIDIA STX

Ecosistema

Socios de Almacenamiento de Memoria Contextual de NVIDIA CMX

Recursos

Componentes Básicos para la Era del Contexto

La plataforma de almacenamiento NVIDIA BlueField-4 STX se lanza con una amplia adopción de la industria

NVIDIA STX es un diseño de referencia de almacenamiento de IA modular desarrollado conjuntamente con proveedores líderes y basado en computación, redes y software de IA acelerados de NVIDIA. Descubra cómo impulsa la plataforma de almacenamiento NVIDIA BlueField‑4 STX que potencia la IA agéntica y la infraestructura de datos de IA.

Lea el Comunicado de Prensa

Presentamos la Plataforma de Almacenamiento de Memoria Contextual Impulsada por NVIDIA BlueField 4

Una nueva clase de infraestructura de almacenamiento nativa de IA usa BlueField para eliminar estancamientos de las GPU de inferencia, mejorar la eficiencia energética y permitir el intercambio de KV de alta velocidad a fin de que la infraestructura de inferencia pueda escalar.

Lea el Blog

Descripción General de la Solución de la Plataforma de Almacenamiento de Memoria Contextual NVIDIA CMX

NVIDIA CMX proporciona una ruta optimizada y de alto ancho de banda que reduce la latencia, el costo y la sobrecarga de energía en comparación con los enfoques de almacenamiento de propósito general, lo que ayuda a ofrecer un rendimiento hasta 5x mayor y una eficiencia energética hasta 5x mejor.

Lea la Descripción General de la Solución

Comenzar

Colabore con Expertos de NVIDIA

Conéctese con el equipo de ventas empresariales de NVIDIA o con el socio adecuado en el programa de la Red de Socios de NVIDIA (NPN) para comenzar.

Comuníquese con Ventas Encuentre Un Socio

¿Necesita Ayuda para Seleccionar el Socio o el Producto Correcto?

Hable con un especialista de NVIDIA sobre sus necesidades empresariales.

Contáctenos

Manténgase al Día con las Noticias de NVIDIA

Regístrese para recibir las últimas noticias, actualizaciones y más de NVIDIA.

Manténgase al Día