Convierta su data center en una fábrica de IA de alto rendimiento con las Arquitecturas de Referencia de NVIDIA Enterprise.
Descripción General
Las Arquitecturas de Referencia Empresarial de NVIDIA (RA Empresarial) permiten a las organizaciones diseñar, implementar y escalar fábricas de IA de alto desempeño mediante una infraestructura validada y repetible. Estos diseños combinan computación certificada, redes de alta velocidad este-oeste y norte-sur, herramientas de observabilidad y software para garantizar un desempeño escalable, desde clústeres de cuatro nodos hasta entornos a escala empresarial.
Arquitecturas de Referencia Empresariales
Ahora está disponible un conjunto integral de instrucciones para configurar los clústeres en el data center.
Casos de Uso
Acelere las cargas de trabajo de IA agéntica, IA física, computación de alto desempeño (HPC) y simulación de IA con Arquitecturas de Referencia Empresarial de NVIDIA comprobadas y Sistemas Certificados por NVIDIA de socios globales. Las principales configuraciones de clústeres de infraestructura para implementar fábricas de IA empresarial se describen a continuación.
La configuración de NVIDIA RTX PRO™ AI Factory está diseñada para un amplio espectro de cargas de trabajo empresariales, como la IA generativa y agéntica, el análisis de datos, la computación visual y la simulación de ingeniería. Las implementaciones se optimizan en torno a puntos de diseño de 16 y 32 nodos, lo que proporciona un equilibrio ideal de desempeño, escalabilidad y eficiencia de implementación. Los servidores NVIDIA RTX PRO, diseñados para la aceleración universal de las cargas de trabajo en la IA, la simulación y la computación visual empresarial, están optimizados para entornos PCIe, lo que los hace ideales para centros de datos con restricciones de espacio, energía y refrigeración. Han sido diseñados específicamente para cargas de trabajo de IA modernas y ofrecen un desempeño eficiente para la IA de agentes y la inferencia de grandes modelos de lenguaje (LLM).
La configuración de alto desempeño de NVIDIA HGX™ AI Factory está diseñada específicamente para el entrenamiento y la inferencia de IA de múltiples nodos a escala, lo que aprovecha los sistemas NVIDIA HGX. La arquitectura, disponible en puntos de diseño de 32, 64 y 128 nodos y compatible con las redes NVIDIA Spectrum-X, cuenta con un diseño flexible y optimizado por carriles que permite una integración eficiente en diversos diseños de bastidor, a la vez que ofrece un desempeño de alto rendimiento y baja latencia. Proporciona un desempeño innovador para los usuarios avanzados de IA que ejecutan las cargas de trabajo más exigentes, permite el entrenamiento y el ajuste fino de modelos a gran escala y acelera drásticamente la inferencia. Con precisión de última generación e interconexiones ultrarrápidas, la solución logra un rendimiento de tokens hasta 15 veces mayor.
La configuración de NVIDIA NVL72 IA Factory está diseñada para entrenar e implementar modelos de billones de parámetros, lo que ofrece potencia de computación a exaescala dentro de un solo bastidor. Con un diseño para rendimiento de modelos masivo, la inferencia de múltiples usuarios y la inferencia en tiempo real a escala, permite la próxima generación de innovación impulsada por IA. Los puntos de diseño de implementación se centran en configuraciones de cuatro y ocho bastidores. La arquitectura, que se basa en una red flexible y optimizada por carriles, se adapta a diversos diseños de bastidores y sistemas, a la vez que ofrece un desempeño de alto ancho de banda y baja latencia. La plataforma ofrece un rendimiento de fábricas de IA excepcional con una eficiencia energética líder en la industria y funciona con NVIDIA NVLink™, núcleos Tensor FP4 e innovaciones de refrigeración avanzadas.
Beneficios
Obtenga una infraestructura de IA escalable y de alto rendimiento con configuraciones comprobadas y listas para socios.
Cumpla con las demandas intensivas de inferencia de IA, ajuste fino y entrenamiento con arquitecturas que garantizan la completa utilización de GPU y la consistencia del desempeño en los clústeres de múltiples nodos.
Expanda fácilmente su infraestructura y garantice una implementación escalable y optimizada para hasta 128 nodos. Desarrolle la base para soluciones de pila completa con el diseño validado NVIDIA Enterprise AI Factory, que aprovecha nuestro ecosistema de software.
Simplifique los procesos de implementación y el diseño eficiente, reduzca la complejidad y el costo total de propiedad (TCO), a la vez que reduce el tiempo de generación de valor.
Siga patrones de diseño específicos y estandarizados para lograr un funcionamiento consistente de una instalación a otra, reduzca la necesidad de asistencia frecuente y permita tiempos de resolución más rápidos.
Socios
Estamos orgullosos de colaborar con socios líderes que llevan Arquitecturas de Referencia Empresariales y soluciones para fábricas de IA al mercado. Los diseños que respaldan estos socios han sido aprobados por nuestra Junta de Revisión de Diseños, que ofrece una orientación que cuenta con nuestra aprobación en una o más de las siguientes categorías: infraestructura, lógica de redes y software.
La Arquitectura de Referencia Palantir Sovereign AI OS se basa en los RA de NVIDIA Enterprise, probados y calificados para ejecutar la suite completa de software de Palantir en la infraestructura de IA de NVIDIA con nuestros socios de sistemas globales. Esta arquitectura de IA soberana es crítica para clientes con flujos de trabajo sensibles a la latencia, requisitos de soberanía de datos y alta distribución geográfica. La arquitectura proporciona a las empresas un control total sobre sus datos, modelos de IA y aplicaciones.
Recursos
NVIDIA desarrolló una fábrica de IA unificada para escalar los flujos de trabajo de IA generativa y de agentes en toda la empresa, lo que garantiza la seguridad, el desempeño y la consistencia. La plataforma admite cientos de agentes de IA que aceleran la innovación, agilizan la ingeniería de software y hardware y optimizan las operaciones de la cadena de suministro, lo que reduce los tiempos de planificación en más de un 95 % y logra en solo un año el trabajo de ingeniería de décadas.