Arquitecturas de Referencia de NVIDIA Enterprise.

Arquitecturas de Referencia Empresariales

Desarrolle Fábricas de IA Escalables

Convierta su data center en una fábrica de IA de alto rendimiento con las Arquitecturas de Referencia de NVIDIA Enterprise.

Comenzar

Lea el Documento Técnico | Explore Sistemas Certificados por NVIDIA

Comenzar

Descripción General

Componentes Básicos para el Éxito de la IA

Las Arquitecturas de Referencia Empresarial de NVIDIA (RA Empresarial) permiten a las organizaciones diseñar, implementar y escalar fábricas de IA de alto desempeño mediante una infraestructura validada y repetible. Estos diseños combinan computación certificada, redes de alta velocidad este-oeste y norte-sur, herramientas de observabilidad y software para garantizar un desempeño escalable, desde clústeres de cuatro nodos hasta entornos a escala empresarial.

Palantir se Asocia a NVIDIA para Ofrecer una Arquitectura de Referencia de Sistemas Operativos de IA Soberana

Lea el Comunicado de Prensa

Diseño Comprobado y Desempeño Validado

Descubra cómo los RA empresariales, basados en implementaciones en el mundo real y configuraciones probadas en uso, simplifican la planificación y maximizan el rendimiento de la inversión para una infraestructura de IA escalable.

Lea el Documento Técnico

Arquitecturas de Referencia Empresariales

Su Guía para la Familia Completa

Ahora está disponible un conjunto integral de instrucciones para configurar los clústeres en el data center.

Infraestructura

Las Arquitecturas de Referencia Empresarial de NVIDIA comienzan con configuraciones de hardware validadas, incluidos patrones de nodos de redes de CPU-GPU, diagramas de cableado y detalles de infraestructura.

Lógica de Red

La Guía Lógica de Configuración de Redes y Arquitectura Lógica para RA Empresariales proporciona instrucciones para la administración y el aprovisionamiento de nodos a través del diseño de VLAN y de la simulación de red en NVIDIA Air.

Software

Nuestra pila de referencia de software para RA Empresariales describe el software para administrar, aprovisionar y dimensionar clústeres de infraestructura. Los lanzamientos actuales se centran en Kubernetes de código abierto, con NVIDIA AI Enterprise y el software NVIDIA Run:ai.

Observabilidad

La Guía de Observabilidad para Arquitecturas de Referencia Empresarial de NVIDIA utiliza herramientas de código abierto, como Prometheus y Grafana, para monitorear el desempeño de la GPU y las redes en todo el clúster. Los paneles proporcionan métricas en tiempo real sobre el estado del sistema y la eficiencia de la carga de trabajo.

Implementación

La Guía de Implementación para las Arquitecturas de Referencia Empresarial de NVIDIA es una colección de mejores prácticas de infraestructura que nuestro equipo ha aprendido al aportar, implementar, probar y validar los clústeres internos en los que hemos desarrollado nuestro programa.

Almacenamiento

El Programa de Almacenamiento Certificado por NVIDIA es un esfuerzo complementario de socios seleccionados que han creado guías de almacenamiento diseñadas para integrarse en los RA empresariales. Más información sobre este programa único.

Casos de Uso

Diseñado para Todos los Casos de Uso

Acelere las cargas de trabajo de IA agéntica, IA física, computación de alto desempeño (HPC) y simulación de IA con Arquitecturas de Referencia Empresarial de NVIDIA comprobadas y Sistemas Certificados por NVIDIA de socios globales. Las principales configuraciones de clústeres de infraestructura para implementar fábricas de IA empresarial se describen a continuación.

NVIDIA RTX PRO AI Factory
NVIDIA HGX AI Factory
NVIDIA NVL72 AI Factory

NVIDIA RTX PRO AI Factory

La configuración de NVIDIA RTX PRO™ AI Factory está diseñada para un amplio espectro de cargas de trabajo empresariales, como la IA generativa y agéntica, el análisis de datos, la computación visual y la simulación de ingeniería. Las implementaciones se optimizan en torno a puntos de diseño de 16 y 32 nodos, lo que proporciona un equilibrio ideal de desempeño, escalabilidad y eficiencia de implementación. Los servidores NVIDIA RTX PRO, diseñados para la aceleración universal de las cargas de trabajo en la IA, la simulación y la computación visual empresarial, están optimizados para entornos PCIe, lo que los hace ideales para centros de datos con restricciones de espacio, energía y refrigeración. Han sido diseñados específicamente para cargas de trabajo de IA modernas y ofrecen un desempeño eficiente para la IA de agentes y la inferencia de grandes modelos de lenguaje (LLM).

Ver las Especificaciones de Configuración de Clústeres

NVIDIA HGX AI Factory

La configuración de alto desempeño de NVIDIA HGX™ AI Factory está diseñada específicamente para el entrenamiento y la inferencia de IA de múltiples nodos a escala, lo que aprovecha los sistemas NVIDIA HGX. La arquitectura, disponible en puntos de diseño de 32, 64 y 128 nodos y compatible con las redes NVIDIA Spectrum-X, cuenta con un diseño flexible y optimizado por carriles que permite una integración eficiente en diversos diseños de bastidor, a la vez que ofrece un desempeño de alto rendimiento y baja latencia. Proporciona un desempeño innovador para los usuarios avanzados de IA que ejecutan las cargas de trabajo más exigentes, permite el entrenamiento y el ajuste fino de modelos a gran escala y acelera drásticamente la inferencia. Con precisión de última generación e interconexiones ultrarrápidas, la solución logra un rendimiento de tokens hasta 15 veces mayor.

Ver las Especificaciones de Configuración de Clústeres

NVIDIA NVL72 AI Factory

La configuración de NVIDIA NVL72 IA Factory está diseñada para entrenar e implementar modelos de billones de parámetros, lo que ofrece potencia de computación a exaescala dentro de un solo bastidor. Con un diseño para rendimiento de modelos masivo, la inferencia de múltiples usuarios y la inferencia en tiempo real a escala, permite la próxima generación de innovación impulsada por IA. Los puntos de diseño de implementación se centran en configuraciones de cuatro y ocho bastidores. La arquitectura, que se basa en una red flexible y optimizada por carriles, se adapta a diversos diseños de bastidores y sistemas, a la vez que ofrece un desempeño de alto ancho de banda y baja latencia. La plataforma ofrece un rendimiento de fábricas de IA excepcional con una eficiencia energética líder en la industria y funciona con NVIDIA NVLink™, núcleos Tensor FP4 e innovaciones de refrigeración avanzadas.

Ver las Especificaciones de Configuración de Clústeres

Beneficios

Valor Estratégico de las RA Empresariales

Obtenga una infraestructura de IA escalable y de alto rendimiento con configuraciones comprobadas y listas para socios.

Desempeño Máximo para Cargas de Trabajo de IA

Cumpla con las demandas intensivas de inferencia de IA, ajuste fino y entrenamiento con arquitecturas que garantizan la completa utilización de GPU y la consistencia del desempeño en los clústeres de múltiples nodos.

Escalabilidad Flexible, Operaciones Simplificadas

Expanda fácilmente su infraestructura y garantice una implementación escalable y optimizada para hasta 128 nodos. Desarrolle la base para soluciones de pila completa con el diseño validado NVIDIA Enterprise AI Factory, que aprovecha nuestro ecosistema de software.

Reduzca la Complejidad y el TCO

Simplifique los procesos de implementación y el diseño eficiente, reduzca la complejidad y el costo total de propiedad (TCO), a la vez que reduce el tiempo de generación de valor.

Capacidad de soporte

Siga patrones de diseño específicos y estandarizados para lograr un funcionamiento consistente de una instalación a otra, reduzca la necesidad de asistencia frecuente y permita tiempos de resolución más rápidos.

Socios

Asociados para el Aumentar el Rendimiento

Estamos orgullosos de colaborar con socios líderes que llevan Arquitecturas de Referencia Empresariales y soluciones para fábricas de IA al mercado. Los diseños que respaldan estos socios han sido aprobados por nuestra Junta de Revisión de Diseños, que ofrece una orientación que cuenta con nuestra aprobación en una o más de las siguientes categorías: infraestructura, lógica de redes y software.

Comenzar

Arquitectura de Referencia Palantir Sovereign AI OS con NVIDIA

La Arquitectura de Referencia Palantir Sovereign AI OS se basa en los RA de NVIDIA Enterprise, probados y calificados para ejecutar la suite completa de software de Palantir en la infraestructura de IA de NVIDIA con nuestros socios de sistemas globales. Esta arquitectura de IA soberana es crítica para clientes con flujos de trabajo sensibles a la latencia, requisitos de soberanía de datos y alta distribución geográfica. La arquitectura proporciona a las empresas un control total sobre sus datos, modelos de IA y aplicaciones.

Más Información

Recursos

Más Información Sobre RA Empresariales

Arquitectura de Referencia NVIDIA RTX PRO AI Factory

La configuración de NVIDIA RTX PRO AI Factory admite una amplia gama de cargas de trabajo empresariales, como la inferencia de IA agéntica, la IA física e industrial, la computación visual y la computación de alto desempeño para análisis de datos y simulación. Este documento detalla los componentes de hardware que sustentan esta arquitectura escalable y modular.

Leer el Documento Técnico

Arquitectura de Referencia NVIDIA HGX AI Factory

La configuración de NVIDIA HGX AI Factory se centra en la inferencia de IA de alto desempeño, el entrenamiento de modelos y el ajuste fino. Este documento describe los componentes de hardware de una arquitectura escalable y modular, incluida la orientación de clústeres y las topologías de estructura de red usadas para interconectar el clúster.

Leer el Documento Técnico

Habilite un Rendimiento Tokens Masivo con NVIDIA Run:ai

La evaluación comparativa conjunta con Nebius muestra que las implementaciones de GPU fraccionales que usan NVIDIA Run:ai en las Arquitecturas de Referencia Empresarial de NVIDIA mejoran significativamente el rendimiento y la utilización para las cargas de trabajo de LLM de producción.

Lea el Blog

Descripción General de la Arquitectura de Referencia Empresarial de NVIDIA

Este documento técnico presenta las Arquitecturas de Referencia Empresarial de NVIDIA, que proporcionan una orientación comprobada para diseñar y desarrollar fábricas de IA para implementaciones de clase empresarial que van desde 32 hasta 1,024 GPU. Estas arquitecturas ayudan a simplificar la implementación de la infraestructura de IA, reducir la complejidad operativa y acelerar el tiempo de generación de valor.

Leer el Documento Técnico

Redes Norte-Sur: La Clave para Cargas de Trabajo de IA Empresarial Más Rápidas

Las arquitecturas de referencia empresariales de NVIDIA guían a las organizaciones en la implementación de fábricas de IA que utilizan redes norte-sur y este-oeste, lo que proporciona recetas de diseño para una infraestructura de IA escalable, segura y de alto rendimiento.

Lea el Blog

Implementación de NVIDIA H200 NVL a Escala con una Nueva Arquitectura de Referencia Empresarial

NVIDIA H200 NVL acelera la implementación de la IA con memoria mejorada, NVLink de alta velocidad y una configuración de RA empresarial optimizada.

Lea el Blog

La Fábrica de IA de NVIDIA Impulsa la Innovación Empresarial a Escala

NVIDIA desarrolló una fábrica de IA unificada para escalar los flujos de trabajo de IA generativa y de agentes en toda la empresa, lo que garantiza la seguridad, el desempeño y la consistencia. La plataforma admite cientos de agentes de IA que aceleran la innovación, agilizan la ingeniería de software y hardware y optimizan las operaciones de la cadena de suministro, lo que reduce los tiempos de planificación en más de un 95 % y logra en solo un año el trabajo de ingeniería de décadas.

Explore Resultados Clave

Próximos Pasos

¿Todo Listo para Comenzar?

Aprenda más sobre NVIDIA Enterprise AI Factory.

Comenzar

Profundice en las Arquitecturas de Referencia Empresarial de NVIDIA

Explore cómo las Arquitecturas de Referencia Empresarial de NVIDIA proporcionan modelos escalables y prescriptivos para implementar una infraestructura de IA de alto desempeño.

Leer el Documento Técnico

Supermicro es un líder global en soluciones integrales de TI optimizadas para aplicaciones. Fundada y operativa en San Jose, California, Supermicro está comprometida con ofrecer innovación de primer nivel para infraestructuras de TI empresariales, de nube, de IA y de telecomunicaciones 5G/edge. Somos un proveedor de soluciones totales de TI con servidor, IA, almacenamiento, IoT, sistemas de conmutadores, software y servicios de asistencia. La experiencia de Supermicro en el diseño de placas base, sistemas de alimentación y chasis potencia aún más nuestro desarrollo y producción, y permite impulsar la innovación de próxima generación desde la nube hasta el edge para nuestros clientes globales.

Soluciones respaldadas por la Junta de Revisión de Diseño de NVIDIA:

DESCUBRE MÁS

CPUs (Elegibles)	2 64c Intel Xeon 2 64c AMD EPYC
GPU	8 NVIDIA RTX PRO™ 6000 Blackwell Server Edition
Redes (Este-Oeste)	4 NVIDIA® BlueField®-3 B3140H (1 de 400 Gb)
Redes (Norte-Sur)	1 BlueField-3 B3220 (2 200 Gb)
Memoria de Host (min)	DDR5 ECC de 1,024 GB como mínimo (1 DIMM por ranura)
Unidad de Arranque del Host (min)	1 NVMe de 1 TB
Almacenamiento del Host (min)	2 de 4 TB NVMe

CPUs (Elegibles)	2 64c Intel Xeon 2 64c AMD EPYC
GPU	8 GPU NVIDIA Blackwell Ultra
Redes (Este-Oeste)	8 NVIDIA® BlueField®-3 B3140H (1 de 400 Gb)
Redes (Norte-Sur)	1 BlueField-3 B3220 (2 200 Gb)
Memoria de Host (min)	DDR5 ECC de 1,536 GB como mínimo (1 DIMM por ranura)
Unidad de Arranque del Host (min)	1 NVMe de 1 TB
Almacenamiento del Host (min)	2 de 4 TB NVMe

CPU	2 NVIDIA Grace 72c (36 por bastidor)
GPU	4 GPUs NVIDIA Blackwell (72 por rack)
Redes (Este-Oeste)	4 NVIDIA® ConnectX®-7 (1 de 400 Gb)
Redes (Norte-Sur)	2 NVIDIA BlueField®-3 B3240 (4 de 200 Gb)

Arquitecturas de Referencia Empresariales

Desarrolle Fábricas de IA Escalables

Componentes Básicos para el Éxito de la IA

Palantir se Asocia a NVIDIA para Ofrecer una Arquitectura de Referencia de Sistemas Operativos de IA Soberana

Diseño Comprobado y Desempeño Validado

Su Guía para la Familia Completa

Infraestructura

Lógica de Red

Software

Observabilidad

Implementación

Almacenamiento

Diseñado para Todos los Casos de Uso

NVIDIA RTX PRO AI Factory

NVIDIA HGX AI Factory

NVIDIA NVL72 AI Factory

Valor Estratégico de las RA Empresariales

Desempeño Máximo para Cargas de Trabajo de IA

Escalabilidad Flexible, Operaciones Simplificadas

Reduzca la Complejidad y el TCO

Capacidad de soporte

Asociados para el Aumentar el Rendimiento

Arquitectura de Referencia Palantir Sovereign AI OS con NVIDIA

Más Información Sobre RA Empresariales

Arquitectura de Referencia NVIDIA RTX PRO AI Factory

Arquitectura de Referencia NVIDIA HGX AI Factory

Habilite un Rendimiento Tokens Masivo con NVIDIA Run:ai

Descripción General de la Arquitectura de Referencia Empresarial de NVIDIA

Redes Norte-Sur: La Clave para Cargas de Trabajo de IA Empresarial Más Rápidas

Implementación de NVIDIA H200 NVL a Escala con una Nueva Arquitectura de Referencia Empresarial

La Fábrica de IA de NVIDIA Impulsa la Innovación Empresarial a Escala

Próximos Pasos

¿Todo Listo para Comenzar?

Profundice en las Arquitecturas de Referencia Empresarial de NVIDIA

Especificaciones de Configuración de Clústeres 2-8-5-200

Especificaciones de Configuración del Clústeres 2-8-9-400

Especificaciones de Configuración de Clústeres 2-4-6-400