Arquitecturas de referencia empresarial de NVIDIA.

Arquitectura de referencia empresarial

Construir fábricas de IA que se escalen

Convierta su centro de datos en una fábrica de IA de alto rendimiento con las arquitecturas de referencia empresariales de NVIDIA.

Descripción general

Los elementos fundamentales para el éxito de la IA

Las arquitecturas de referencia empresarial de NVIDIA permiten a las organizaciones diseñar, implementar y escalar fábricas de IAde alto rendimiento utilizando una infraestructura validada y repetible. Estos planes combinan la computación certificada, la red este-oeste de alta velocidad y herramientas de observabilidad para garantizar un rendimiento escalable, desde clústeres de cuatro nodos hasta entornos a escala empresarial.

Convertir los centros de datos en fábricas inteligentes

Transforme su centro de datos tradicional en una fábrica de IA utilizando computación certificada por NVIDIA, redes y almacenamiento certificado por partners. Diseñado para una rápida implementación y un rendimiento repetible.

Diseño probado/rendimiento validado

Construidas sobre implementaciones del mundo real y configuraciones sometidas a pruebas, las RA empresariales simplifican la planificación y maximizan el ROI para una infraestructura de IA escalable.

Arquitecturas de referencia empresarial

Su guía para toda familia

Ya está disponible un conjunto completo de instrucciones para configurar clústeres en el centro de datos.

Infraestructura

Las arquitecturas de referencia empresarial de NVIDIA comienzan con configuraciones de hardware validadas, incluidos patrones de nodos de red CPU-GPU, diagramas de cableado y detalles de infraestructura.

* Buscar la certificación "Infraestructura" en los diseños de partners basados en NVIDIA Enterprise RA.

Lógica de red

La Guía de lógica de configuración de redes y arquitectura lógica para RA empresariales proporciona instrucciones para la gestión y el aprovisionamiento de nodos mediante el diseño de VLAN y la simulación de redes en NVIDIA Air.

* Buscar la certificación "Lógica de red" en los diseños de partners basados en NVIDIA Enterprise RA.

Software

Nuestra pila de referencia de software para RA empresariales describe el proceso de gestión, aprovisionamiento y dimensionamiento de las pilas de software para RA empresariales. Las versiones actuales se centran en Vanilla Kubernetes, utilizando BCM para implementar el clúster, NVIDIA AI Enterprisey Vanilla Kubernetes con Run:ai.

* Buscar la certificación "Software" en los diseños de partners basados en NVIDIA Enterprise RA.

Observabilidad

La Guía de observabilidad para RA empresariales utiliza herramientas de código abierto, como Prometheus y Grafana, para supervisar el rendimiento de la tarjeta gráfica y la red en todo el clúster. Los paneles proporcionan métricas en tiempo real sobre el estado del sistema y la eficiencia de la carga de trabajo.

Implementación

La Guía de implementación para RA empresariales es una recopilación de las mejores prácticas de infraestructura que nuestro equipo ha aprendido al crear, implementar, probar y validar los clústeres internos sobre los que hemos construido nuestro programa.

Almacenamiento

El programa Sistemas de almacenamiento certificados por NVIDIA es una iniciativa complementaria de partners seleccionados que han creado guías de almacenamiento diseñadas para integrarse en las RA empresariales.

Para más información sobre este programa único, haga clic aquí.

Casos de uso

Diseñado para cada caso de uso

Acelere las cargas de trabajo de IA agentiva, IA física y simulación de IA y HPC con arquitecturas de referencia empresarial probadas.

Aceleración empresarial universal

Acelere una amplia gama de cargas de trabajo empresariales, incluidas la IA industrial y de percepción, la HPC, el análisis de datos, la computación visual, la IA generativa y agentiva, en una única plataforma flexible. Esto es ideal para organizaciones que buscan modernizar la infraestructura y aumentar el rendimiento en tareas críticas para la empresa.

Para las implementaciones de NVIDIA RTX PRO Server, los puntos de diseño disponibles se centran en configuraciones de 16 y 32 nodos, ideales para cargas de trabajo de IA generativa y visualización a escala media, que equilibran el rendimiento, la escalabilidad y la eficiencia de la implementación. Combinado con la plataforma de red NVIDIA Spectrum-X™, esta configuración ofrece un rendimiento de interconexión optimizado adaptado específicamente para aplicaciones de IA exigentes.

Rendimiento optimizado por IA

Esta RA empresarial de alto rendimiento está diseñada específicamente para el entrenamiento e inferencia de IA de varios nodos a escala, aprovechando los sistemas HGX de 8 tarjetas gráficas certificados por NVIDIA con tarjetas gráficas NVIDIA Hopper o Blackwell. Los sistemas se escalan desde una unidad de 4 nodos (32 tarjetas gráficas) hasta 128 nodos (1024 tarjetas gráficas), con el potencial de crear clústeres aún más grandes dependiendo de las necesidades del cliente.

Los puntos de diseño disponibles se centran en las configuraciones de 32, 64 y 128 nodos, compatibles con la red NVIDIA Spectrum-X y un diseño flexible optimizado para ferrocarriles, que se adapta fácilmente a varios diseños de bastidores.

Rendimiento a exaescala

Entrene e implemente los modelos de base y de lenguaje más grandes con potencia de cálculo a exaescala en un solo bastidor. Diseñado para un rendimiento de modelos masivo, inferencia multiusuario y razonamiento a escala en tiempo real, que permite el futuro de la innovación impulsada por la IA.

Los puntos de diseño disponibles de NVIDIA GB200 NVL72 se centran en configuraciones de 4 y 8 bastidores. Construida en torno a una red flexible optimizada para el ferrocarril, la arquitectura admite diferentes diseños de bastidores y configuraciones de sistemas.

Ventajas

El valor estratégico de las RA empresariales

Desbloquee una infraestructura de IA escalable y de alto rendimiento con configuraciones probadas y listas para partners.

Máximo rendimiento para cargas de trabajo de IA

Construidas para satisfacer las exigentes demandas de entrenamiento, ajuste e inferencia, estas arquitecturas garantizan la plena utilización de la tarjeta gráfica y la consistencia del rendimiento en clústeres de varios nodos.

Escalado flexible, operaciones simplificadas

Amplíe fácilmente su infraestructura con diseños de referencia optimizados para hasta 128 nodos, diseñados específicamente para admitir soluciones de pila completa, como el diseño validado por la fábrica de IA de NVIDIA,que garantiza una implementación escalable y optimizada.

Reduzca la complejidad y el TCO

Simplifique los procesos de implementación y diseños eficientes, reduzca la complejidad y el coste total de propiedad (TCO), al tiempo que reduce el tiempo de tokenización.

Sostenibilidad

Seguir patrones de diseño específicos y estandarizados permite un funcionamiento coherente entre una instalación y otra, reduce la necesidad de asistencia frecuente y agiliza los tiempos de resolución.

Partners

Asociados para el rendimiento

Estamos orgullosos de colaborar con partners líderes en la comercialización de arquitecturas de referencia empresarial y soluciones de fábrica de IA. Los diseños de estos partners han sido aprobados por nuestro Consejo de revisión de diseños (DRB) y ofrecen orientación que cuenta con nuestro respaldo en una o más de las siguientes categorías: Infraestructura, Lógica de redes y Software.

Recursos

Más información sobre las RA empresariales

Implementación de NVIDIA H200 NVL a gran escala con la nueva arquitectura de referencia empresarial

Descubra cómo NVIDIA H200 NVL acelera la implementación de la IA con memoria mejorada, NVLink de alta velocidad y una configuración RA empresarial optimizada.

Simplificar la gestión de la memoria del sistema con la última RA empresarial NVIDIA GH200 NVL2

Descubra cómo la RA empresarial NVIDIA GH200 NVL2 simplifica la gestión de la memoria del sistema y acelera el desarrollo de la IA.

Una nueva era de las fábricas de IA: NVIDIA presenta arquitecturas de referencia empresarial

Las empresas globales ahora pueden aprovechar nuevas arquitecturas de referencia para construir centros de datos de alto rendimiento, escalables y seguros.

El programa certificado por NVIDIA se amplía al almacenamiento empresarial para acelerar la implementación de fábrica de IA

Descubra cómo el almacenamiento certificado por NVIDIA permite implementaciones de fábrica de IA más rápidas y fiables al validar los sistemas de almacenamiento empresarial para el rendimiento y la integración a escala de IA.

Una nueva era de fábricas de IA

Descubra cómo las arquitecturas de referencia empresarial de NVIDIA están dando paso a una nueva era de fábricas de IA.

Novedades de la certificación de NVIDIA

Únase a este seminario web global sobre la certificación de NVIDIA para escuchar a expertos, creadores de exámenes y profesionales certificados sobre cómo las credenciales de NVIDIA pueden acelerar las carreras profesionales y generar un impacto empresarial.

Pasos siguientes

¿Todo listo para empezar?

Más información sobre NVIDIA Enterprise AI Factory.

Documentación técnica de NVIDIA ERA

Descubra cómo las arquitecturas de referencia (RA) de NVIDIA Enterprise proporcionan planos escalables y prescriptivos para implementar una infraestructura de IA de alto rendimiento.

Configuración del servidor 2-8-5-200 Especificaciones

Configuración del servidor 2-8-9-400 Especificaciones

Configuración del servidor 2-4-6-400 Especificaciones