CPU per l'era degli agenti su scala di fabbrica.
Panoramica
Basato su NVIDIA MGX™, il rack CPU NVIDIA Vera offre un'infrastruttura CPU densa e raffreddata a liquido per le moderne fabbriche di IA. Man mano che i sistemi di apprendimento per rinforzo e IA agenziale si scalano, le CPU eseguono gli ambienti sandbox che eseguono codice, utilizzano strumenti, valutano i risultati e analizzano i dati che guidano i risultati. Il rack CPU NVIDIA Vera presenta fino a 256 CPU Vera interconnesse e fornisce un percorso rapido per implementare capacità CPU ad alta densità insieme ai sistemi NVIDIA Vera Rubin NVL72, completando carichi di lavoro fino al 80% più velocemente rispetto all'infrastruttura CPU tradizionale e aiutando le fabbriche di IA a generare più token per dollaro.
Innovazioni
Ambienti per l'IA per agenti su larga scala
L'apprendimento per rinforzo e l'IA per agenti vengono eseguiti in loop di feedback continui tra modelli e ambienti di esecuzione. I modelli generano token, codice e query, mentre le sandbox basate su CPU eseguono azioni, valutano i risultati e restituiscono i dati per il passaggio successivo. Su larga scala, migliaia o milioni di ambienti vengono eseguiti in parallelo, spesso mappati a core CPU dedicati. Prestazioni per-core più veloci accorciano i cicli di valutazione, riducono i tempi di attesa degli agenti e aiutano le fabbriche IA a generare più token per dollaro.
Il rack CPU NVIDIA Vera è progettato appositamente per scalare questi ambienti nelle fabbriche IA. Un singolo rack raffreddato a liquido integra fino a 256 CPU Vera, supportando più di 22.500 ambienti CPU simultanei. Con l'infrastruttura densa e distribuibile a livello di rack, il rack CPU Vera aiuta le fabbriche IA ad aggiungere capacità CPU insieme ai sistemi NVIDIA Vera Rubin NVL72, mantenendo brevi i loop di valutazione e facendo operare le fabbriche IA al picco del throughput.
Prestazioni
L'IA agentica è bloccata dalle CPU tradizionali. Nel loop di ragionamento di un agente, la CPU comprime il contesto, interroga la memoria SQLite, compila il codice generato, esegue catene di strumenti Python e analizza gli output con regex. NVIDIA Vera accelera tutti e cinque i carichi di lavoro fino a 1,8 volte rispetto alle principali CPU x86, potenziando il loop interno agentico per massimizzare l'output delle fabbriche IA.
Prestazioni relative basate su dati misurati e soggette a modifiche. CPU NVIDIA Vera con prestazioni LPDDR5X confrontate con la CPU x86 di ultima generazione.
Funzionalità
Basato su NVIDIA MGX, NVIDIA Vera CPU Rack porta le prestazioni di IA agentica di Vera su scala data center in un sistema denso e raffreddato a liquido. Con un massimo di 256 CPU Vera, l'enorme larghezza di banda di memoria LPDDR5X, le DPU NVIDIA BlueField 4 e la rete NVIDIA Spectrum-X Ethernet, il rack CPU Vera offre alle fabbriche IA un percorso rapido per distribuire capacità di CPU ad alta densità insieme ai sistemi NVIDIA Vera Rubin NVL72. Il risultato è ambienti più simultanei, cicli di valutazione più brevi e più token per dollaro.
Tecnologie
Specifiche1
| CPU NVIDIA Vera | Rack CPU NVIDIA Vera | |
|---|---|---|
| Configurazione | 1 CPU NVIDIA Vera | 256 CPU NVIDIA Vera |
| Core | Thread | 88 core NVIDIA Olympus personalizzati 176 thread |
22.528 core NVIDIA Olympus personalizzati (88 per CPU) | 45.056 thread (176 per CPU) |
| Cache L2 (per core) | 2 MB | 2 MB |
| Cache L3 unificata | 164 MB | 42 GB (164 MB per CPU) |
| SIMD (per core) | 6x 128bSVE2 FP8 |
6x 128bSVE2 FP8 |
| Capacità di memoria | Fino a 1,5 TB SOCAMM LPDDR5X |
Fino a 400 TB2 SOCAMM LPDDR5X |
| Banda di memoria di picco | Fino a 1,2 TB/s | Fino a 300 TB/s aggregati |
| Larghezza di banda NVIDIA NVLINK™-C2C | 1,8 TB/s | 1,8 TB/s per CPU |
| PCIe CXL | 88 PCIe Gen 6 (solo CPU) 96 PCIe Gen 6 (Vera Rubin) x16, x8, x4, x2 bifurcazione CXL 3.1 |
Fino a 22.528 corsie PCIe Gen 6 in totale; CXL 3.1 |
| NIC | BlueField-4 CX9 Qualsiasi NIC PCIe compatibile |
64 PCIe di generazione Xx con supporto per le DPU NVIDIA BlueField-4 |
| Confidential Computing | Sì | Sì |
| Fattore di forma e raffreddamento | Server 1S e 2S raffreddati ad aria o a liquido da 250 W a 450 W TDP configurabile |
Rack MGX 48U 100% raffreddato a liquido |
1. Informazioni preliminari. Tutti i valori sono indicativi e soggetti a modifiche.
2. Configurazione consigliata da 200 TB.
Partner
Inizia
Iscriviti per ricevere le ultime notizie, gli aggiornamenti e altro da NVIDIA.