NVIDIA Vera CPU Rack

Rack CPU NVIDIA Vera

CPU per l'era degli agenti su scala di fabbrica.

Panoramica

Infrastruttura su scala rack per le fabbriche IA

Basato su NVIDIA MGX™, il rack CPU NVIDIA Vera offre un'infrastruttura CPU densa e raffreddata a liquido per le moderne fabbriche di IA. Man mano che i sistemi di apprendimento per rinforzo e IA agenziale si scalano, le CPU eseguono gli ambienti sandbox che eseguono codice, utilizzano strumenti, valutano i risultati e analizzano i dati che guidano i risultati. Il rack CPU NVIDIA Vera presenta fino a 256 CPU Vera interconnesse e fornisce un percorso rapido per implementare capacità CPU ad alta densità insieme ai sistemi NVIDIA Vera Rubin NVL72, completando carichi di lavoro fino al 80% più velocemente rispetto all'infrastruttura CPU tradizionale e aiutando le fabbriche di IA a generare più token per dollaro.

NVIDIA lancia Vera, la CPU progettata per eseguire gli agenti IA di tutto il mondo

NVIDIA lancia le CPU NVIDIA Vera ad alte prestazioni e ad alta efficienza energetica per guidare diversi carichi di lavoro in tutti i settori, tra cui l'IA agentica, l'apprendimento per rinforzo e l'elaborazione dei dati.

Arriva Vera: la prima CPU di NVIDIA progettata per gli agenti atterra nei migliori laboratori IA

Ian Buck consegna a mano i primi sistemi CPU NVIDIA Vera ad Anthropic, OpenAI, Oracle Cloud Infrastructure e SpaceXAI, segnando il momento in cui le CPU agentiche passano dall'annuncio alla produzione.

Innovazioni

Sandbox per CPU

Ambienti per l'IA per agenti su larga scala

L'apprendimento per rinforzo e l'IA per agenti vengono eseguiti in loop di feedback continui tra modelli e ambienti di esecuzione. I modelli generano token, codice e query, mentre le sandbox basate su CPU eseguono azioni, valutano i risultati e restituiscono i dati per il passaggio successivo. Su larga scala, migliaia o milioni di ambienti vengono eseguiti in parallelo, spesso mappati a core CPU dedicati. Prestazioni per-core più veloci accorciano i cicli di valutazione, riducono i tempi di attesa degli agenti e aiutano le fabbriche IA a generare più token per dollaro.

Il rack CPU NVIDIA Vera è progettato appositamente per scalare questi ambienti nelle fabbriche IA. Un singolo rack raffreddato a liquido integra fino a 256 CPU Vera, supportando più di 22.500 ambienti CPU simultanei. Con l'infrastruttura densa e distribuibile a livello di rack, il rack CPU Vera aiuta le fabbriche IA ad aggiungere capacità CPU insieme ai sistemi NVIDIA Vera Rubin NVL72, mantenendo brevi i loop di valutazione e facendo operare le fabbriche IA al picco del throughput.

Prestazioni

Prestazioni di CPU agentica leader del settore

L'IA agentica è bloccata dalle CPU tradizionali. Nel loop di ragionamento di un agente, la CPU comprime il contesto, interroga la memoria SQLite, compila il codice generato, esegue catene di strumenti Python e analizza gli output con regex. NVIDIA Vera accelera tutti e cinque i carichi di lavoro fino a 1,8 volte rispetto alle principali CPU x86, potenziando il loop interno agentico per massimizzare l'output delle fabbriche IA.

Prestazioni relative basate su dati misurati e soggette a modifiche. CPU NVIDIA Vera con prestazioni LPDDR5X confrontate con la CPU x86 di ultima generazione.

Funzionalità

Scopri le rivoluzioni su scala rack

Basato su NVIDIA MGX, NVIDIA Vera CPU Rack porta le prestazioni di IA agentica di Vera su scala data center in un sistema denso e raffreddato a liquido. Con un massimo di 256 CPU Vera, l'enorme larghezza di banda di memoria LPDDR5X, le DPU NVIDIA BlueField 4 e la rete NVIDIA Spectrum-X Ethernet, il rack CPU Vera offre alle fabbriche IA un percorso rapido per distribuire capacità di CPU ad alta densità insieme ai sistemi NVIDIA Vera Rubin NVL72. Il risultato è ambienti più simultanei, cicli di valutazione più brevi e più token per dollaro.

Capacità di CPU ad alta densità per l'IA agentica

Un singolo rack CPU NVIDIA Vera integra fino a 256 CPU Vera per supportare più di 22.500 ambienti CPU simultanei. Ciò offre alle fabbriche IA la capacità della CPU per eseguire sandbox, l'uso degli strumenti, i carichi di lavoro di codice e le valutazioni RL alla stessa scala della loro infrastruttura GPU.

Distribuzione raffreddata a liquido su scala di fabbrica

Basato su NVIDIA MGX, il rack CPU Vera offre un'infrastruttura CPU ad alta densità in un rack raffreddato a liquido pronto per la distribuzione. Aiuta le fabbriche IA ad aggiungere rapidamente capacità CPU insieme ai sistemi NVIDIA Vera Rubin NVL72, evitando la densità inferiore e la complessità di distribuzione dovuta alla scalabilità solo con server raffreddati ad aria.

Prestazioni prevedibili a pieno carico

I core Olympus veloci di Vera, la memoria LPDDR5X e NVIDIA SCF mantengono migliaia di ambienti reattivi con un utilizzo sostenuto. L'esecuzione più rapida per core accorcia i cicli di valutazione, riduce i tempi di attesa degli agenti e aiuta le GPU a lavorare in modo efficiente.

Rete integrata e offload

Con le DPU NVIDIA BlueField-4 e Spectrum-X Ethernet, il rack CPU Vera supporta i servizi di rete, isolamento e infrastruttura necessari per eseguire ambienti agentici e RL su larga scala nella fabbrica IA.

Tecnologie

All'interno del rack CPU Vera

CPU NVIDIA Vera

NVIDIA Vera alimenta gli ambienti CPU dietro l'IA agentica e l'apprendimento per rinforzo, combinando prestazioni per core veloci con un'enorme larghezza di banda di memoria LPDDR5X per mantenere l'esecuzione sandbox, l'uso degli strumenti, le valutazioni e i flussi di lavoro di dati in movimento su scala di fabbrica IA.

NVIDIA MGX

NVIDIA MGX offre un'infrastruttura IA modulare aperta che riduce i costi di sviluppo e accelera il time-to-market nei data center moderni.

NVIDIA BlueField-4

Le DPU NVIDIA BlueField-4 accelerano l'elaborazione dei dati attraverso lo storage, la rete, la sicurezza informatica e la scalabilità elastica nelle fabbriche IA.

NVIDIA Spectrum-X Ethernet

NVIDIA Spectrum-X Ethernet offre un'elevata larghezza di banda efficace, una bassa latenza e un isolamento delle prestazioni per l'IA. Il rack della CPU Vera supporta Spectrum-X Ethernet su scala rack per una maggiore efficienza energetica e resilienza.

Specifiche1

NVIDIA Vera

  CPU NVIDIA Vera Rack CPU NVIDIA Vera
Configurazione 1 CPU NVIDIA Vera 256 CPU NVIDIA Vera
Core | Thread 88 core NVIDIA Olympus personalizzati
176 thread
22.528 core NVIDIA
Olympus personalizzati (88 per CPU) |
45.056 thread (176 per CPU)
Cache L2 (per core) 2 MB 2 MB
Cache L3 unificata 164 MB 42 GB (164 MB per CPU)
SIMD (per core) 6x 128bSVE2
FP8
6x 128bSVE2
FP8
Capacità di memoria Fino a 1,5 TB
SOCAMM LPDDR5X
Fino a 400 TB2
SOCAMM LPDDR5X
Banda di memoria di picco Fino a 1,2 TB/s Fino a 300 TB/s aggregati
Larghezza di banda NVIDIA NVLINK™-C2C 1,8 TB/s 1,8 TB/s per CPU
PCIe CXL 88 PCIe Gen 6 (solo CPU)
96 PCIe Gen 6 (Vera Rubin)
x16, x8, x4, x2 bifurcazione
CXL 3.1
Fino a 22.528 corsie PCIe Gen 6
in totale; CXL 3.1
NIC BlueField-4
CX9
Qualsiasi NIC PCIe compatibile
64 PCIe di generazione Xx con supporto
per le DPU NVIDIA BlueField-4
Confidential Computing
Fattore di forma e raffreddamento Server 1S e 2S raffreddati ad
aria o a liquido da
250 W a 450 W TDP configurabile
Rack MGX
48U 100% raffreddato a liquido

1. Informazioni preliminari. Tutti i valori sono indicativi e soggetti a modifiche.
2. Configurazione consigliata da 200 TB.

Partner

I nostri partner

Inizia

Aggiornati con le notizie di NVIDIA

Iscriviti per ricevere le ultime notizie, gli aggiornamenti e altro da NVIDIA.