Convierta su centro de datos en una fábrica de IA de alto rendimiento con las arquitecturas de referencia empresariales de NVIDIA.
Descripción
Las arquitecturas de referencia empresariales (RA empresariales) de NVIDIA permiten a las organizaciones diseñar, implementar y escalar fábricas de IA de alto rendimiento con una infraestructura validada y repetible. Estos diseños combinan computación certificada, redes de alta velocidad este-oeste y norte-sur, herramientas de observabilidad y software para garantizar un rendimiento escalable, desde clústeres de cuatro nodos hasta entornos a escala empresarial.
Arquitecturas de referencia empresarial
Ya está disponible un conjunto completo de instrucciones para configurar clústeres en el centro de datos.
Casos de uso
Acelere las cargas de trabajo de IA de agentes, IA física, computación de alto rendimiento (HPC) y simulación de IA con las arquitecturas de referencia empresariales probadas de NVIDIA y los sistemas certificados por NVIDIA de partners globales. A continuación se describen las principales configuraciones de clústeres de infraestructura para implementar fábricas de IA empresariales.
La configuración de NVIDIA RTX PRO™ AI Factory está diseñada para un amplio espectro de cargas de trabajo empresariales, que incluyen IA generativa y de agentes, análisis de datos, computación visual y simulación de ingeniería. Las implementaciones se optimizan en torno a puntos de diseño de 16 y 32 nodos, lo que proporciona un equilibrio ideal de rendimiento, escalabilidad y eficiencia de implementación. Diseñados para la aceleración de cargas de trabajo universales en IA, simulación y computación visual empresarial, los servidores NVIDIA RTX PRO están optimizados para entornos PCIe, lo que los hace ideales para centros de datos con restricciones de espacio, energía y refrigeración. Diseñados específicamente para cargas de trabajo de IA modernas, ofrecen un rendimiento eficiente para la IA de agentes y la inferencia de modelos lingüísticos de gran tamaño (LLM).
La configuración de alto rendimiento de NVIDIA HGX AI Factory está diseñada específicamente para el entrenamiento y la inferencia de IA de varios nodos a escala, aprovechando los sistemas NVIDIA HGX. Disponible en puntos de diseño de 32, 64 y 128 nodos y compatible con las redes NVIDIA Spectrum-X™, la arquitectura cuenta con un diseño flexible y optimizado para rieles que permite una integración eficiente en diversos diseños de bastidor, al tiempo que proporciona una alta capacidad de procesamiento y un rendimiento de baja latencia. Proporciona un rendimiento sin precedentes para usuarios avanzados de IA que ejecutan las cargas de trabajo más exigentes, permite el entrenamiento y el ajuste de modelos a gran escala, y acelera drásticamente la inferencia. Con la precisión de última generación y las interconexiones ultrarrápidas, la solución logra un rendimiento de tokens hasta 15 veces superior.
La configuración de fábrica de IA de NVIDIA NVL72 está diseñada para entrenar e implementar modelos con billones de parámetros, lo que proporciona potencia de computación a exaescala dentro de un solo bastidor. Diseñado para un rendimiento de modelos masivo, la inferencia multiusuario y la inferencia en tiempo real a escala, permite la próxima generación de innovación impulsada por IA. Los puntos de diseño de implementación se centran en configuraciones de cuatro y ocho bastidores. La arquitectura, basada en una red flexible y optimizada para rieles, se adapta a diversos diseños de bastidores y sistemas, al tiempo que proporciona un rendimiento de gran ancho de banda y baja latencia. La plataforma proporciona un resultado de AI factory excepcional con eficiencia energética líder en el sector y está impulsada por NVIDIA NVLink™ de quinta generación, núcleos Tensor FP4 e innovaciones térmicas avanzadas.
Ventajas
Desbloquee una infraestructura de IA escalable y de alto rendimiento con configuraciones probadas y listas para partners.
Satisfaga las exigencias intensivas de la inferencia, el ajuste preciso y el entrenamiento de IA con arquitecturas que garantizan la utilización y la consistencia del rendimiento totales de la GPU en clústeres de varios nodos.
Amplíe fácilmente su infraestructura y garantice una implementación escalable y optimizada para hasta 128 nodos. Cree la base para soluciones de pila completa con el diseño validado NVIDIA Enterprise AI Factory, que aprovecha nuestro ecosistema de software.
Simplifique los procesos de implementación y los diseños eficientes, reduzca la complejidad y el costo total de propiedad (TCO), al tiempo que reduce el tiempo de generación de valor.
Siga patrones de diseño específicos y estandarizados para lograr un funcionamiento uniforme de una instalación a otra, reducir la necesidad de soporte frecuente y permitir tiempos de resolución más rápidos.
Partners
Nos enorgullece colaborar con partners líderes a medida que llevan al mercado arquitecturas de referencia empresariales y soluciones de fábrica de IA. Los diseños aprobados de estos partners han pasado por nuestro Consejo de Revisión de Diseño y ofrecen una orientación que merece nuestra aprobación en una o más de las siguientes categorías: infraestructura, lógica de red y software.
La arquitectura de referencia de sistemas operativos de IA soberana de Palantir se basa en los RA empresariales de NVIDIA, que han sido probados y calificados para ejecutar el conjunto de software completo de Palantir en la infraestructura de IA de NVIDIA con nuestros partners de sistemas globales. Esta arquitectura de IA soberana es crítica para clientes con flujos de trabajo sensibles a la latencia, requisitos de soberanía de datos y alta distribución geográfica. La arquitectura proporciona a las empresas un control total de sus datos, modelos de IA y aplicaciones.
Recursos
NVIDIA creó una fábrica de IA unificada para escalar los flujos de trabajo de IA generativa y de agentes en toda la empresa, lo que garantiza la seguridad, el rendimiento y la coherencia. La plataforma admite cientos de agentes de IA que aceleran la innovación, agilizan la ingeniería de software y hardware, y optimizan las operaciones de la cadena de suministro, lo que reduce los tiempos de planificación en más de un 95 % y logra en un solo un año el trabajo de ingeniería equivalente a décadas.