NVIDIA Vera CPU Rack

NVIDIA Vera CPU Rack

CPU für das Zeitalter der Agenten im Fabrikmaßstab.

Überblick

Rack-Scale-Infrastruktur für KI-Fabriken

Das NVIDIA Vera CPU-Rack wurde auf NVIDIA MGX™ entwickelt und liefert eine dichte, flüssigkeitsgekühlte CPU-Infrastruktur für moderne KI-Fabriken. Wenn Verstärkungslernen und agentische KI-Systeme skalieren, führen CPUs die Sandbox-Umgebungen aus, die Code ausführen, Tools verwenden, Ergebnisse auswerten und Daten analysieren, die Ergebnisse erzielen. Das NVIDIA Vera CPU-Rack verfügt über bis zu 256 miteinander verbundene Vera-CPUs und bietet einen schnellen Weg zur Bereitstellung von CPU-Kapazität hoher Dichte neben NVIDIA Vera Rubin NVL72-Systemen, um Workloads bis zu 80 % schneller als die herkömmliche CPU-Infrastruktur abzuschließen und KI-Fabriken zu helfen, mehr Token pro Dollar zu generieren.

NVIDIA stellt Vera vor – die CPU, die für die Ausführung der KI-Agenten der Welt entwickelt wurde

NVIDIA führt leistungsstarke, energieeffiziente NVIDIA Vera-CPUs ein, um verschiedene Workloads in verschiedenen Branchen zu unterstützen, darunter agentische KI, bestärkendes Lernen und Datenverarbeitung.

Vera kommt: Die erste CPU von NVIDIA, die für Agenten entwickelt wurde, landet in führenden KI-Labors

Ian Buck liefert persönlich die ersten NVIDIA Vera CPU-Systeme an Anthropic, OpenAI, Oracle Cloud Infrastructure und SpaceXAI aus – und markiert den Moment, in dem agentische CPUs von der Ankündigung zur Produktion übergehen.

Innovationen

CPU-Sandboxes

Umgebungen für agentische KI in großem Maßstab

Bestärkendes Lernen und agentische KI werden in kontinuierlichen Feedback-Schleifen zwischen Modellen und Ausführungsumgebungen ausgeführt. Modelle generieren Token, Code und Abfragen, während CPU-basierte Sandboxes Aktionen ausführen, die Ergebnisse auswerten und Daten für den nächsten Schritt zurückgeben. In großem Maßstab werden Tausende bis Millionen von Umgebungen parallel ausgeführt, die häufig dedizierten CPU-Kernen zugeordnet sind. Schnellere Leistung pro Kern verkürzt Auswertungszyklen, reduziert die Wartezeit von Agenten und hilft KI-Fabriken, mehr Token pro Dollar zu generieren.

Das NVIDIA Vera CPU Rack wurde speziell für die Skalierung dieser Umgebungen in KI-Fabriken entwickelt. Ein einzelnes flüssigkeitsgekühltes Rack integriert bis zu 256 Vera-CPUs und unterstützt mehr als 22.500 gleichzeitige CPU-Umgebungen. Mit einer dichten, einsatzbereiten Rack-Scale-Infrastruktur hilft das Vera CPU Rack KI-Fabriken dabei, neben NVIDIA Vera Rubin NVL72-Systemen die CPU-Kapazität zu erhöhen, wodurch Auswertungsschleifen kurz gehalten werden und KI-Fabriken mit Spitzendurchsatz arbeiten.

Leistung

Branchenführende agentische CPU-Leistung

Agentische KI wird durch herkömmliche CPUs eingeschränkt. In der gesamten Reasoning-Schleife eines Agenten komprimiert die CPU den Kontext, fragt SQLite-Speicher ab, kompiliert generierten Code, führt Python-Toolketten aus und parst die Ausgaben mit regex. NVIDIA Vera beschleunigt alle fünf Workloads um das bis zu 1,8-Fache gegenüber führenden x86-CPUs und verleiht dem agentischen Inner Loop einen massiven Schub, um den Output der KI-Fabrik zu maximieren.

Relative Leistung basierend auf gemessenen Daten und vorbehaltlich etwaiger Änderungen. NVIDIA Vera CPU mit LPDDR5X-Leistung, basierend auf einer x86-CPU der neuesten Generation als Referenzwert.

Merkmale

Entdecken Sie die Durchbrüche auf Rack-Ebene

NVIDIA Vera CPU Rack basiert auf NVIDIA MGX und bringt die Leistung der agentischen KI von Vera in einem dichten, flüssigkeitsgekühlten System auf den Maßstab von Rechenzentren. Mit bis zu 256 Vera CPUs, einer enormen LPDDR5X-Speicherbandbreite, NVIDIA® BlueField®-4 DPUs und NVIDIA Spectrum-X™ Ethernet-Netzwerken bietet das Vera CPU Rack KI-Fabriken einen schnellen Weg, um CPU-Kapazität mit hoher Dichte neben NVIDIA Vera Rubin NVL72-Systemen bereitzustellen. Das Ergebnis sind mehr gleichzeitig laufende Umgebungen, kürzere Auswertungszyklen und mehr Token pro Dollar.

Dichte CPU-Kapazität für agentische KI

Ein einzelnes NVIDIA Vera CPU Rack integriert bis zu 256 Vera CPUs, um mehr als 22.500 gleichzeitige CPU-Umgebungen zu unterstützen. Dadurch verfügen KI-Fabriken über die CPU-Kapazität, um Sandbox-Ausführungen, Tool-Nutzung, Code-Workloads und RL-Bewertungen im gleichen Umfang wie ihre GPU-Infrastruktur auszuführen.

Flüssigkeitsgekühlte Bereitstellung im Fabrikmaßstab

Vera CPU Rack basiert auf NVIDIA MGX und bietet eine CPU-Infrastruktur mit hoher Dichte in einem einsatzbereiten flüssigkeitsgekühlten Rack. Es hilft KI-Fabriken, neben NVIDIA Vera Rubin NVL72-Systemen schnell CPU-Kapazität hinzuzufügen und so die geringere Dichte und die Komplexität der Bereitstellung, die nur mit luftgekühlten Servern verbunden ist, zu vermeiden.

Vorhersehbare Leistung bei Volllast

Die schnellen Olympus-Kerne von Vera, der LPDDR5X-Speicher und NVIDIA SCF halten Tausende von Umgebungen auch bei dauerhafter Auslastung reaktionsschnell. Die schnellere Ausführung pro Kern verkürzt Auswertungszyklen, reduziert die Wartezeit von Agenten und trägt dazu bei, dass GPUs effizient arbeiten.

Integrierte Vernetzung und Offload

Mit NVIDIA BlueField-4 DPUs und Spectrum-X Ethernet unterstützt Vera CPU Rack die Netzwerk-, Isolations- und Infrastrukturdienste, die für die Ausführung großer agentischer und RL-Umgebungen in der gesamten KI-Fabrik erforderlich sind.

Technologien

Im Vera CPU Rack

NVIDIA Vera CPU

NVIDIA Vera unterstützt die CPU-Umgebungen hinter agentischer KI und bestärkendem Lernen und kombiniert schnelle Leistung pro Kern mit einer enormen LPDDR5X-Speicherbandbreite, um die Sandbox-Ausführung, die Toolnutzung, Bewertungen und Daten-Workflows im Maßstab einer KI-Fabrik in Bewegung zu halten.

NVIDIA MGX

NVIDIA MGX bietet eine offene modulare KI-Infrastruktur, die die Entwicklungskosten senkt und die Zeit bis zur Markteinführung in modernen Rechenzentren verkürzt.

NVIDIA BlueField-4

NVIDIA BlueField-4 DPUs beschleunigen die Datenverarbeitung in den Bereichen Datenspeicher, Netzwerke, Cybersicherheit und elastische Skalierung in KI-Fabriken.

NVIDIA Spectrum-X Ethernet

NVIDIA Spectrum-X Ethernet bietet eine hohe effektive Bandbreite, geringe Latenz und Leistungsisolierung für KI. Das Vera CPU Rack unterstützt Spectrum-X Ethernet im Rack-Scale für höhere Energieeffizienz und Ausfallsicherheit.

Technische Daten1

NVIDIA Vera

  NVIDIA Vera CPU NVIDIA Vera CPU Rack
Konfiguration 1 NVIDIA Vera CPU 256 NVIDIA Vera CPUs
Kerne | Threads 88 benutzerdefinierte NVIDIA Olympus-Kerne
176 Threads
22.528 benutzerdefinierte NVIDIA
Olympus-Kerne (88 pro CPU) |
45.056 Threads (176 pro CPU)
L2-Cache (pro Kern) 2 MB 2 MB
Einheitlicher L3-Cache 164 MB 42 GB (164 MB pro CPU)
SIMD (pro Kern) 6x 128bSVE2
FP8
6x 128bSVE2
FP8
Speicherkapazität Bis zu 1,5 TB
SOCAMM LPDDR5X
Bis zu 400 TB2
SOCAMM LPDDR5X
Speicherbandbreite (Spitzenwert) Bis zu 1,2 TB/s Bis zu 300 TB/s insgesamt
NVIDIA NVLINK™-C2C Bandbreite 1,8 TB/s 1,8 TB/s pro CPU
PCIe CXL 88 PCIe Gen 6 (nur CPU)
96 PCIe Gen 6 (Vera Rubin)
x16, x8, x4, x2 Bifurkation
CXL 3.1
Bis zu 22.528 PCIe Gen 6
Lanes insgesamt; CXL 3.1
NIC BlueField-4
CX9
Jede kompatible PCIe-NIC
64x PCIe Gen Xx mit Unterstützung
für NVIDIA BlueField-4 DPUs
Confidential Computing Ja Ja
Formfaktor und Kühlung 1S und 2S Server
Luft- oder flüssigkeitsgekühlt
250 W bis 450 W konfigurierbare TDP
48U MGX Rack
100 % flüssigkeitsgekühlt

1. Vorläufige Informationen. Alle Werte sind Maximalwerte und können sich ändern.
2. 200 TB empfohlene Konfig.

Partner

Lernen Sie unsere Partner kennen

Jetzt starten

Verpassen Sie keine Neuigkeiten über NVIDIA

Melden Sie sich an, um aktuelle Nachrichten, Updates und mehr von NVIDIA zu erhalten.