Arquitecturas de Referencia de NVIDIA Enterprise.

Arquitectura de Referencia Empresarial

Desarrolle Fábricas de IA Escalables

Convierta su data center en una fábrica de IA de alto rendimiento con las Arquitecturas de Referencia de NVIDIA Enterprise.

Descripción General

Componentes Básicos para el Éxito de la IA

Las Arquitecturas Empresariales de Referencia de NVIDIA permiten a las organizaciones diseñar, implementar y escalar Fábricas de IA de alto rendimiento mediante infraestructura validada y repetible. Estos planos combinan computación certificada, redes de alta velocidad este-oeste y herramientas de observabilidad para garantizar un desempeño escalable, desde clústeres de cuatro nodos hasta entornos de escala empresarial.

Convierta los Data Centers en Fábricas Inteligentes

Transforme su data center tradicional en una Fábrica de IA mediante computación certificada por NVIDIA, redes y almacenamiento certificado por socios. Diseñado para una implementación rápida y un desempeño repetible.

Diseño Comprobado/ Desempeño Validado

Los RA Empresariales, basados en implementaciones del mundo real y en configuraciones probadas en batalla, simplifican la planificación y maximizan el ROI para una infraestructura de IA escalable

Arquitecturas de Referencia Empresariales

Su Guía para la Familia Completa

Ahora está disponible un conjunto integral de instrucciones para configurar los clústeres en el data center.

Infraestructura

Las Arquitecturas de Referencia de NVIDIA Enterprise comienzan con configuraciones de hardware validadas, como patrones de nodos CPU-GPU, diagramas de cableado y detalles de infraestructura.

*Busque el endoso “Infrastructure” en los diseños de socios basados en las RA de NVIDIA Enterprise

Lógica de Red

La Guía Lógica de Configuración de Redes y Arquitectura Lógica para RA Empresariales proporciona instrucciones para la administración y el aprovisionamiento de nodos a través del diseño de VLAN y de la simulación de red en NVIDIA Air.

*Busque la recomendación “Network Logic” en los diseños de socios basados en las RA de NVIDIA Enterprise

Software

Nuestra Pila de Referencia de Software para RA Empresariales describe el proceso a seguir para administrar, aprovisionar y dimensionar pilas de software para RA empresariales. Las versiones actuales se centran en vanilla Kubernetes, utilizando BCM para implementar el clúster, NVIDIA AI Enterprise y vanilla Kubernetes con Run:ai.

*Busque la recomendación “Software” en los diseños de los socios basados en las RA de NVIDIA Enterprise

Observabilidad

La Guía de Observabilidad para RA Empresariales utiliza herramientas de código abierto como Prometheus y Grafana para monitorear el desempeño de la GPU y las redes en todo el clúster. Los paneles proporcionan métricas en tiempo real sobre el estado del sistema y la eficiencia de la carga de trabajo.

Implementación

La Guía de Implementación para Arquitecturas de Referencia Empresariales es un conjunto de mejores prácticas de infraestructura que nuestro equipo decantó a partir de la creación, implementación, pruebas y validación de los clústeres propios en los que basamos nuestro programa.

Almacenamiento

El Programa Sistemas de Almacenamiento Certificados por NVIDIA es un esfuerzo complementario de socios seleccionados que han creado guías de almacenamiento diseñadas para acoplarse a las RA empresariales.

Para obtener más información sobre este programa único, haga clic aquí.

Casos de Uso

Diseñado para Todos los Casos de Uso

Acelere las cargas de trabajo de la IA basada en agentes, de la IA física y de la simulación de HPC e IA con arquitecturas de referencia empresariales comprobadas.

Las Arquitecturas de Referencia de NVIDIA Enterprise Impulsan las Fábricas de IA

Acelere una amplia gama de cargas de trabajo empresariales (como la IA industrial y de percepción, HPC, análisis de datos, computación visual, IA generativa y basada en agentes) en una sola plataforma flexible. Esto es ideal para organizaciones que buscan modernizar su infraestructura e impulsar su desempeño en tareas críticas para su negocio.

Para las implementaciones de NVIDIA RTX PRO Server, los puntos de diseño disponibles se centran en configuraciones de 16 y 32 nodos, ideales para cargas de trabajo de visualización e IA generativa de escala media, lo que equilibra el desempeño, la escalabilidad y la eficiencia de la implementación. Esta configuración, junto con la plataforma de networking NVIDIA Spectrum-X™, ofrece un desempeño de interconexión optimizado adaptado específicamente para aplicaciones de IA exigentes.

Desempeño Optimizado por IA

Esta RA empresarial de alto rendimiento está diseñada específicamente para el entrenamiento y la inferencia de IA de múltiples nodos a escala, aprovechando los sistemas HGX de 8 GPU certificados por NVIDIA con GPU NVIDIA Hopper o Blackwell. Los sistemas escalan desde una unidad de 4 nodos (32 GPU) hasta 128 nodos (1024 GPU), con potencial para clústeres aún más grandes, dependiendo de las necesidades del cliente.

Los puntos de diseño disponibles se centran en las configuraciones de 32, 64 y 128 nodos, compatibles con la red NVIDIA Spectrum-X y un diseño flexible y optimizado para rieles que se adapta fácilmente a varias disposiciones del rack.

Desempeño de Exaescala

Entrene e implemente los modelos base y de lenguaje más grandes con potencia de computación de exaescala en un solo rack. Diseñado para ofrecer un rendimiento masivo de modelos, inferencia para múltiples usuarios y razonamiento en tiempo real a escala, lo que permite el futuro de la innovación impulsada por IA.

Los puntos de diseño disponibles de NVIDIA GB200 NVL72 se centran en configuraciones de 4 y 8 racks. La arquitectura, basada en una red flexible y optimizada para rieles, admite diferentes disposiciones de rack y configuraciones de sistema.

Beneficios

Valor Estratégico de las RA Empresariales

Obtenga una infraestructura de IA escalable y de alto rendimiento con configuraciones comprobadas y listas para socios.

Desempeño Máximo para Cargas de Trabajo de IA

Estas arquitecturas, diseñadas para satisfacer intensivas demandas de entrenamiento, ajuste fino e inferencia, garantizan una utilización completa de la GPU y un desempeño consistente en todos los clústeres de múltiples nodos.

Escalabilidad Flexible, Operaciones Simplificadas

Expanda fácilmente su infraestructura con diseños de referencia optimizados para hasta 128 nodos, diseñados específicamente para admitir soluciones de pila completa como el diseño validado de NVIDIA Enterprise IA Factory, lo que garantiza una implementación escalable y optimizada.

Reduzca la Complejidad y el TCO

Simplifique los procesos de implementación y los diseños eficientes, reduzca la complejidad y el costo total de propiedad (TCO) a la vez que reduce el time to token.

Capacidad de soporte

Seguir patrones de diseño específicos y estandarizados permite una operación consistente entre instalaciones, reduce la necesidad de asistencia frecuente y permite tiempos de resolución más rápidos.

Socios

Asociados para el Aumentar el Rendimiento

Estamos orgullosos de colaborar con socios líderes que llevan Arquitecturas de Referencia Empresariales y soluciones para fábricas de IA al mercado. Los diseños de estos socios han aprobado nuestra Junta de Revisión de Diseño (DRB), lo que significa que la orientación que ofrecen se ha ganado nuestro respaldo en una o más de las siguientes categorías: Infraestructura, Lógica de Redes y Software.

Recursos

Más Información Sobre RA Empresariales

Implementación de NVIDIA H200 NVL a Escala con la Nueva Arquitectura de Referencia Empresarial

Explore cómo NVIDIA H200 NVL acelera la implementación de la IA con memoria mejorada, NVLink de alta velocidad y configuración de RA empresarial optimizada.

Simplifique la Administración de la Memoria del Sistema con la Última RA Empresarial NVIDIA GH200 NVL2

Descubra cómo la RA Empresarial NVIDIA GH200 NVL2 simplifica la administración de la memoria del sistema y acelera el desarrollo de la IA.

Una Nueva Era de Fábricas de IA: NVIDIA Presenta sus Arquitecturas de Referencia Empresariales

Ahora las empresas globales pueden aprovechar nuevas arquitecturas de referencia para desarrollar data centers de alto rendimiento, escalables y seguros.

El Programa de Certificación de NVIDIA se Expande al Almacenamiento Empresarial Para Una Implementación Más Rápida de Fábricas de IA

Descubra cómo el almacenamiento certificado por NVIDIA está permitiendo implementaciones más rápidas y confiables de fábricas de IA mediante la validación de sistemas de almacenamiento empresarial para obtener un desempeño y una integración a escala de IA.

Una Nueva Era de Fábricas de IA

Explore cómo las Arquitecturas Empresariales de Referencia de NVIDIA están permitiendo una nueva era de fábricas de IA.

Novedades sobre el Programa de Certificación de NVIDIA

Participe en este seminario web global de Certificación de NVIDIA para escuchar a expertos, creadores de exámenes y profesionales certificados hablar sobre cómo las credenciales de NVIDIA pueden acelerar carreras y generar impacto empresarial.

Próximos Pasos

¿Todo Listo para Comenzar?

Aprenda más sobre NVIDIA Enterprise AI Factory.

Documento Técnico de NVIDIA ERA

Explore cómo las Arquitecturas de Referencia Empresariales (RA) de NVIDIA proporcionan planos escalables y prescriptivos para la implementación de infraestructura de IA de alto rendimiento.

Características de Configuración del Servidor 2-8-5-200

Especificaciones de Configuración del Servidor 2-8-9-400

Especificaciones de Configuración del Servidor 2-4-6-400