Trasforma il tuo data center in una fabbrica di IA ad alte prestazioni con le architetture di riferimento NVIDIA Enterprise.
Panoramica
Le architetture di riferimento NVIDIA Enterprise consentono alle organizzazioni di progettare, distribuire e scalare fabbriche di IA ad alte prestazioni utilizzando un'infrastruttura convalidata e ripetibile. Questi progetti combinano calcolo certificato, networking completo ad alta velocità e strumenti di osservabilità per garantire prestazioni scalabili, da cluster a quattro nodi ad ambienti su scala aziendale..
Architetture di riferimento Enterprise
È ora disponibile una suite completa di istruzioni per la configurazione di cluster nel data center.
Scenari di utilizzo
Accelera i carichi di lavoro di IA agentica, IA fisica, HPC e simulazione IA con architetture di riferimento Enterprise collaudate.
Accelera una vasta gamma di carichi di lavoro aziendali, tra cui IA industriale e di percezione, HPC, analisi dei dati, visual computing, IA generativa e agentica, su un'unica piattaforma flessibile. Ideale per le organizzazione che intendono modernizzare l'infrastruttura e aumentare le prestazioni delle attività critiche.
Per le distribuzioni di server NVIDIA RTX PRO, i punti di progettazione disponibili si concentrano sulle configurazioni a 16 e 32 nodi, ideali per carichi di lavoro di IA generativa e visualizzazione su scala media, bilanciando prestazioni, scalabilità ed efficienza di distribuzione. Insieme alla piattaforma di networking NVIDIA Spectrum-X™, questa configurazione offre prestazioni di interconnessione ottimizzate su misura per le applicazioni IA più esigenti.
Questa architettura di riferimento Enterprise ad alte prestazioni è stata progettata per il training e l'inferenza con IA multi-nodo su larga scala, sfruttando i sistemi NVIDIA-certified HGX a 8 GPU con GPU NVIDIA Hopper o Blackwell. I sistemi possono essere scalati da un'unità a 4 nodi (32 GPU) fino a 128 nodi (1024 GPU), con il potenziale di cluster ancora più grandi a seconda delle esigenze del cliente.
I punti di progettazione disponibili si concentrano su 32, 64 e 128 configurazioni di nodi, supportate da rete NVIDIA Spectrum-X e da un design flessibile e ottimizzato per binari, che si adatta facilmente a vari layout di rack.
Esegui il training e la distribuzione di grandi modelli di base e linguistici con la potenza di calcolo exascale in un singolo rack. Costruito per un massiccio throughput di modelli, inferenza multi-utente e ragionamento in tempo reale su larga scala, che consente il futuro dell'innovazione basata sull'IA.
I punti di progettazione disponibili NVIDIA GB200 NVL72 si concentrano sulle configurazioni a 4 e 8 rack. Costruita intorno a una rete flessibile e ottimizzata, l'architettura supporta diversi layout di rack e configurazioni di sistema.
Vantaggi
Sblocca infrastrutture IA scalabili e ad alte prestazioni con configurazioni comprovate e pronte per i partner.
Pensate per soddisfare le richieste di training, calibrazione e inferenza, queste architetture garantiscono il pieno utilizzo della GPU e coerenza delle prestazioni su cluster multi-nodo.
Espandi facilmente l'infrastruttura con design di riferimento ottimizzati per un massimo di 128 nodi, progettati appositamente per supportare soluzioni full-stack come design convalidato NVIDIA Enterprise AI Factory, assicura una distribuzione scalabile e snella
Semplifica i processi di distribuzione e rendi i progetti più efficienti, riduci la complessità e il costo totale di proprietà (TCO), riducendo al contempo il tempo di tokenizzazione.
Seguendo modelli di progettazione specifici e standardizzati, è possibile un funzionamento coerente da un'installazione all'altra, riducendo la necessità di supporto frequente, con tempi di risoluzione più rapidi.
Partner
Siamo orgogliosi di collaborare con partner leader che portano le architetture di riferimento Enterprise e le soluzioni per fabbriche di IA sul mercato. I progetti di questi partner sono stati approvati dal nostro Design Review Board (DRB), che offre le indicazioni per ottenere la nostra approvazione in una o più delle seguenti categorie: infrastruttura, logica di rete e software.
Risorse