Arquitecturas de Referencia de NVIDIA Enterprise.

Arquitecturas de Referencia Empresariales

Desarrolle Fábricas de IA Escalables

Convierta su data center en una fábrica de IA de alto rendimiento con las Arquitecturas de Referencia de NVIDIA Enterprise.

Descripción General

Componentes Básicos para el Éxito de la IA

Las Arquitecturas de Referencia Empresarial de NVIDIA (RA Empresarial) permiten a las organizaciones diseñar, implementar y escalar fábricas de IA de alto desempeño mediante una infraestructura validada y repetible. Estos diseños combinan computación certificada, redes de alta velocidad este-oeste y norte-sur, herramientas de observabilidad y software para garantizar un desempeño escalable, desde clústeres de cuatro nodos hasta entornos a escala empresarial.

Palantir se Asocia a NVIDIA para Ofrecer una Arquitectura de Referencia de Sistemas Operativos de IA Soberana

La Arquitectura de Referencia Palantir Sovereign AI OS se basa en los RA de NVIDIA Enterprise, probados y calificados para ejecutar la suite completa de software de Palantir en la infraestructura de IA de NVIDIA.

Diseño Comprobado y Desempeño Validado

Descubra cómo los RA empresariales, basados en implementaciones en el mundo real y configuraciones probadas en uso, simplifican la planificación y maximizan el rendimiento de la inversión para una infraestructura de IA escalable.

Arquitecturas de Referencia Empresariales

Su Guía para la Familia Completa

Ahora está disponible un conjunto integral de instrucciones para configurar los clústeres en el data center.

Infraestructura

Las Arquitecturas de Referencia Empresarial de NVIDIA comienzan con configuraciones de hardware validadas, incluidos patrones de nodos de redes de CPU-GPU, diagramas de cableado y detalles de infraestructura.

Lógica de Red

La Guía Lógica de Configuración de Redes y Arquitectura Lógica para RA Empresariales proporciona instrucciones para la administración y el aprovisionamiento de nodos a través del diseño de VLAN y de la simulación de red en NVIDIA Air.

Software

Nuestra pila de referencia de software para RA Empresariales describe el software para administrar, aprovisionar y dimensionar clústeres de infraestructura. Los lanzamientos actuales se centran en Kubernetes de código abierto, con NVIDIA AI Enterprise y el software NVIDIA Run:ai.

Observabilidad

La Guía de Observabilidad para Arquitecturas de Referencia Empresarial de NVIDIA utiliza herramientas de código abierto, como Prometheus y Grafana, para monitorear el desempeño de la GPU y las redes en todo el clúster. Los paneles proporcionan métricas en tiempo real sobre el estado del sistema y la eficiencia de la carga de trabajo.

Implementación

La Guía de Implementación para las Arquitecturas de Referencia Empresarial de NVIDIA es una colección de mejores prácticas de infraestructura que nuestro equipo ha aprendido al aportar, implementar, probar y validar los clústeres internos en los que hemos desarrollado nuestro programa.

Almacenamiento

El Programa de Almacenamiento Certificado por NVIDIA es un esfuerzo complementario de socios seleccionados que han creado guías de almacenamiento diseñadas para integrarse en los RA empresariales. Más información sobre este programa único.

Casos de Uso

Diseñado para Todos los Casos de Uso

Acelere las cargas de trabajo de IA agéntica, IA física, computación de alto desempeño (HPC) y simulación de IA con Arquitecturas de Referencia Empresarial de NVIDIA comprobadas y Sistemas Certificados por NVIDIA de socios globales. Las principales configuraciones de clústeres de infraestructura para implementar fábricas de IA empresarial se describen a continuación.

NVIDIA RTX PRO AI Factory

La configuración de NVIDIA RTX PRO™ AI Factory está diseñada para un amplio espectro de cargas de trabajo empresariales, como la IA generativa y agéntica, el análisis de datos, la computación visual y la simulación de ingeniería. Las implementaciones se optimizan en torno a puntos de diseño de 16 y 32 nodos, lo que proporciona un equilibrio ideal de desempeño, escalabilidad y eficiencia de implementación. Los servidores NVIDIA RTX PRO, diseñados para la aceleración universal de las cargas de trabajo en la IA, la simulación y la computación visual empresarial, están optimizados para entornos PCIe, lo que los hace ideales para centros de datos con restricciones de espacio, energía y refrigeración. Han sido diseñados específicamente para cargas de trabajo de IA modernas y ofrecen un desempeño eficiente para la IA de agentes y la inferencia de grandes modelos de lenguaje (LLM).

NVIDIA HGX AI Factory

La configuración de alto desempeño de NVIDIA HGX™ AI Factory está diseñada específicamente para el entrenamiento y la inferencia de IA de múltiples nodos a escala, lo que aprovecha los sistemas NVIDIA HGX. La arquitectura, disponible en puntos de diseño de 32, 64 y 128 nodos y compatible con las redes NVIDIA Spectrum-X, cuenta con un diseño flexible y optimizado por carriles que permite una integración eficiente en diversos diseños de bastidor, a la vez que ofrece un desempeño de alto rendimiento y baja latencia. Proporciona un desempeño innovador para los usuarios avanzados de IA que ejecutan las cargas de trabajo más exigentes, permite el entrenamiento y el ajuste fino de modelos a gran escala y acelera drásticamente la inferencia. Con precisión de última generación e interconexiones ultrarrápidas, la solución logra un rendimiento de tokens hasta 15 veces mayor.

NVIDIA NVL72 AI Factory

La configuración de NVIDIA NVL72 IA Factory está diseñada para entrenar e implementar modelos de billones de parámetros, lo que ofrece potencia de computación a exaescala dentro de un solo bastidor. Con un diseño para rendimiento de modelos masivo, la inferencia de múltiples usuarios y la inferencia en tiempo real a escala, permite la próxima generación de innovación impulsada por IA. Los puntos de diseño de implementación se centran en configuraciones de cuatro y ocho bastidores. La arquitectura, que se basa en una red flexible y optimizada por carriles, se adapta a diversos diseños de bastidores y sistemas, a la vez que ofrece un desempeño de alto ancho de banda y baja latencia. La plataforma ofrece un rendimiento de fábricas de IA excepcional con una eficiencia energética líder en la industria y funciona con NVIDIA NVLink™, núcleos Tensor FP4 e innovaciones de refrigeración avanzadas.

Beneficios

Valor Estratégico de las RA Empresariales

Obtenga una infraestructura de IA escalable y de alto rendimiento con configuraciones comprobadas y listas para socios.

Desempeño Máximo para Cargas de Trabajo de IA

Cumpla con las demandas intensivas de inferencia de IA, ajuste fino y entrenamiento con arquitecturas que garantizan la completa utilización de GPU y la consistencia del desempeño en los clústeres de múltiples nodos.

Escalabilidad Flexible, Operaciones Simplificadas

Expanda fácilmente su infraestructura y garantice una implementación escalable y optimizada para hasta 128 nodos. Desarrolle la base para soluciones de pila completa con el diseño validado NVIDIA Enterprise AI Factory, que aprovecha nuestro ecosistema de software.

Reduzca la Complejidad y el TCO

Simplifique los procesos de implementación y el diseño eficiente, reduzca la complejidad y el costo total de propiedad (TCO), a la vez que reduce el tiempo de generación de valor.

Capacidad de soporte

Siga patrones de diseño específicos y estandarizados para lograr un funcionamiento consistente de una instalación a otra, reduzca la necesidad de asistencia frecuente y permita tiempos de resolución más rápidos.

Socios

Asociados para el Aumentar el Rendimiento

Estamos orgullosos de colaborar con socios líderes que llevan Arquitecturas de Referencia Empresariales y soluciones para fábricas de IA al mercado. Los diseños que respaldan estos socios han sido aprobados por nuestra Junta de Revisión de Diseños, que ofrece una orientación que cuenta con nuestra aprobación en una o más de las siguientes categorías: infraestructura, lógica de redes y software.

Arquitectura de Referencia Palantir Sovereign AI OS con NVIDIA

La Arquitectura de Referencia Palantir Sovereign AI OS se basa en los RA de NVIDIA Enterprise, probados y calificados para ejecutar la suite completa de software de Palantir en la infraestructura de IA de NVIDIA con nuestros socios de sistemas globales. Esta arquitectura de IA soberana es crítica para clientes con flujos de trabajo sensibles a la latencia, requisitos de soberanía de datos y alta distribución geográfica. La arquitectura proporciona a las empresas un control total sobre sus datos, modelos de IA y aplicaciones.

Recursos

Más Información Sobre RA Empresariales

Arquitectura de Referencia NVIDIA RTX PRO AI Factory

La configuración de NVIDIA RTX PRO AI Factory admite una amplia gama de cargas de trabajo empresariales, como la inferencia de IA agéntica, la IA física e industrial, la computación visual y la computación de alto desempeño para análisis de datos y simulación. Este documento detalla los componentes de hardware que sustentan esta arquitectura escalable y modular.

Arquitectura de Referencia NVIDIA HGX AI Factory

La configuración de NVIDIA HGX AI Factory se centra en la inferencia de IA de alto desempeño, el entrenamiento de modelos y el ajuste fino. Este documento describe los componentes de hardware de una arquitectura escalable y modular, incluida la orientación de clústeres y las topologías de estructura de red usadas para interconectar el clúster.

Habilite un Rendimiento Tokens Masivo con NVIDIA Run:ai

La evaluación comparativa conjunta con Nebius muestra que las implementaciones de GPU fraccionales que usan NVIDIA Run:ai en las Arquitecturas de Referencia Empresarial de NVIDIA mejoran significativamente el rendimiento y la utilización para las cargas de trabajo de LLM de producción.

Descripción General de la Arquitectura de Referencia Empresarial de NVIDIA

Este documento técnico presenta las Arquitecturas de Referencia Empresarial de NVIDIA, que proporcionan una orientación comprobada para diseñar y desarrollar fábricas de IA para implementaciones de clase empresarial que van desde 32 hasta 1,024 GPU. Estas arquitecturas ayudan a simplificar la implementación de la infraestructura de IA, reducir la complejidad operativa y acelerar el tiempo de generación de valor.

Redes Norte-Sur: La Clave para Cargas de Trabajo de IA Empresarial Más Rápidas

Las arquitecturas de referencia empresariales de NVIDIA guían a las organizaciones en la implementación de fábricas de IA que utilizan redes norte-sur y este-oeste, lo que proporciona recetas de diseño para una infraestructura de IA escalable, segura y de alto rendimiento.

Implementación de NVIDIA H200 NVL a Escala con una Nueva Arquitectura de Referencia Empresarial

NVIDIA H200 NVL acelera la implementación de la IA con memoria mejorada, NVLink de alta velocidad y una configuración de RA empresarial optimizada.

La Fábrica de IA de NVIDIA Impulsa la Innovación Empresarial a Escala

NVIDIA desarrolló una fábrica de IA unificada para escalar los flujos de trabajo de IA generativa y de agentes en toda la empresa, lo que garantiza la seguridad, el desempeño y la consistencia. La plataforma admite cientos de agentes de IA que aceleran la innovación, agilizan la ingeniería de software y hardware y optimizan las operaciones de la cadena de suministro, lo que reduce los tiempos de planificación en más de un 95 % y logra en solo un año el trabajo de ingeniería de décadas.

Próximos Pasos

¿Todo Listo para Comenzar?

Aprenda más sobre NVIDIA Enterprise AI Factory.

Profundice en las Arquitecturas de Referencia Empresarial de NVIDIA

Explore cómo las Arquitecturas de Referencia Empresarial de NVIDIA proporcionan modelos escalables y prescriptivos para implementar una infraestructura de IA de alto desempeño.

Especificaciones de Configuración de Clústeres 2-8-5-200

Especificaciones de Configuración del Clústeres 2-8-9-400

Especificaciones de Configuración de Clústeres 2-4-6-400

Cisco es el líder mundial en tecnología que está revolucionando la forma en que las organizaciones se conectan y protegen en la era de la IA. Desde hace más de 40 años, Cisco conecta al mundo de forma segura. Con sus soluciones y servicios impulsados por IA líderes en la industria, Cisco permite a sus clientes, socios y comunidades habilitar la innovación, mejorar la productividad y fortalecer la resiliencia digital. Con un propósito en el centro de su visión, Cisco mantiene su compromiso de crear un futuro más conectado e inclusivo para todos.

Soluciones respaldadas por la Junta de Revisión de Diseño de NVIDIA:

Dell Technologies ayuda a las organizaciones y a las personas a desarrollar su futuro digital y transformar la forma en que trabajan, viven y juegan. La compañía proporciona a los clientes la cartera de tecnología y servicios más amplia e innovadora de la industria para la era de la IA.

Soluciones respaldadas por la Junta de Revisión de Diseño de NVIDIA:

HPE es un líder en tecnología empresarial esencial que reúne el poder de la IA, la nube y las redes para ayudar a las organizaciones a lograr más objetivos. Como pioneros de lo posible, nuestra innovación y experiencia impulsan la forma en que las personas viven y trabajan. Empoderamos a nuestros clientes de todas las industrias para optimizar el desempeño operativo, transformar los datos en capacidad de anticipación y maximizar su impacto. Libere sus ambiciones más audaces con HPE.

Soluciones respaldadas por la Junta de Revisión de Diseño de NVIDIA:

Lenovo es una potencia tecnológica global con ingresos de 69 mil millones de dólares, ocupa el puesto n.º 196 en la lista Fortune Global 500 y opera en 180 mercados, llegando a millones de clientes todos los días. Con un enfoque en una visión audaz para ofrecer una tecnología más inteligente para todos, nuestra asociación actual con NVIDIA combina servidores Lenovo con GPU aceleradas. Lenovo Hybrid AI Advantage™ con NVIDIA impulsa la productividad y la innovación con una implementación de IA más rápida, impulsada por la Lenovo AI Library y una cartera completa de infraestructura, dispositivos, soluciones y servicios de IA de pila completa.

Soluciones respaldadas por la Junta de Revisión de Diseño de NVIDIA:

Supermicro es un líder global en soluciones integrales de TI optimizadas para aplicaciones. Fundada y operativa en San Jose, California, Supermicro está comprometida con ofrecer innovación de primer nivel para infraestructuras de TI empresariales, de nube, de IA y de telecomunicaciones 5G/edge. Somos un proveedor de soluciones totales de TI con servidor, IA, almacenamiento, IoT, sistemas de conmutadores, software y servicios de asistencia. La experiencia de Supermicro en el diseño de placas base, sistemas de alimentación y chasis potencia aún más nuestro desarrollo y producción, y permite impulsar la innovación de próxima generación desde la nube hasta el edge para nuestros clientes globales.

Soluciones respaldadas por la Junta de Revisión de Diseño de NVIDIA: