CPU für das Zeitalter der Agenten im Fabrikmaßstab.
Überblick
Das NVIDIA Vera CPU-Rack wurde auf NVIDIA MGX™ entwickelt und liefert eine dichte, flüssigkeitsgekühlte CPU-Infrastruktur für moderne KI-Fabriken. Wenn Verstärkungslernen und agentische KI-Systeme skalieren, führen CPUs die Sandbox-Umgebungen aus, die Code ausführen, Tools verwenden, Ergebnisse auswerten und Daten analysieren, die Ergebnisse erzielen. Das NVIDIA Vera CPU-Rack verfügt über bis zu 256 miteinander verbundene Vera-CPUs und bietet einen schnellen Weg zur Bereitstellung von CPU-Kapazität hoher Dichte neben NVIDIA Vera Rubin NVL72-Systemen, um Workloads bis zu 80 % schneller als die herkömmliche CPU-Infrastruktur abzuschließen und KI-Fabriken zu helfen, mehr Token pro Dollar zu generieren.
Innovationen
Umgebungen für agentische KI in großem Maßstab
Bestärkendes Lernen und agentische KI werden in kontinuierlichen Feedback-Schleifen zwischen Modellen und Ausführungsumgebungen ausgeführt. Modelle generieren Token, Code und Abfragen, während CPU-basierte Sandboxes Aktionen ausführen, die Ergebnisse auswerten und Daten für den nächsten Schritt zurückgeben. In großem Maßstab werden Tausende bis Millionen von Umgebungen parallel ausgeführt, die häufig dedizierten CPU-Kernen zugeordnet sind. Schnellere Leistung pro Kern verkürzt Auswertungszyklen, reduziert die Wartezeit von Agenten und hilft KI-Fabriken, mehr Token pro Dollar zu generieren.
Das NVIDIA Vera CPU Rack wurde speziell für die Skalierung dieser Umgebungen in KI-Fabriken entwickelt. Ein einzelnes flüssigkeitsgekühltes Rack integriert bis zu 256 Vera-CPUs und unterstützt mehr als 22.500 gleichzeitige CPU-Umgebungen. Mit einer dichten, einsatzbereiten Rack-Scale-Infrastruktur hilft das Vera CPU Rack KI-Fabriken dabei, neben NVIDIA Vera Rubin NVL72-Systemen die CPU-Kapazität zu erhöhen, wodurch Auswertungsschleifen kurz gehalten werden und KI-Fabriken mit Spitzendurchsatz arbeiten.
Leistung
Agentische KI wird durch herkömmliche CPUs eingeschränkt. In der gesamten Reasoning-Schleife eines Agenten komprimiert die CPU den Kontext, fragt SQLite-Speicher ab, kompiliert generierten Code, führt Python-Toolketten aus und parst die Ausgaben mit regex. NVIDIA Vera beschleunigt alle fünf Workloads um das bis zu 1,8-Fache gegenüber führenden x86-CPUs und verleiht dem agentischen Inner Loop einen massiven Schub, um den Output der KI-Fabrik zu maximieren.
Relative Leistung basierend auf gemessenen Daten und vorbehaltlich etwaiger Änderungen. NVIDIA Vera CPU mit LPDDR5X-Leistung, basierend auf einer x86-CPU der neuesten Generation als Referenzwert.
Merkmale
NVIDIA Vera CPU Rack basiert auf NVIDIA MGX und bringt die Leistung der agentischen KI von Vera in einem dichten, flüssigkeitsgekühlten System auf den Maßstab von Rechenzentren. Mit bis zu 256 Vera CPUs, einer enormen LPDDR5X-Speicherbandbreite, NVIDIA® BlueField®-4 DPUs und NVIDIA Spectrum-X™ Ethernet-Netzwerken bietet das Vera CPU Rack KI-Fabriken einen schnellen Weg, um CPU-Kapazität mit hoher Dichte neben NVIDIA Vera Rubin NVL72-Systemen bereitzustellen. Das Ergebnis sind mehr gleichzeitig laufende Umgebungen, kürzere Auswertungszyklen und mehr Token pro Dollar.
Technologien
Technische Daten1
| NVIDIA Vera CPU | NVIDIA Vera CPU Rack | |
|---|---|---|
| Konfiguration | 1 NVIDIA Vera CPU | 256 NVIDIA Vera CPUs |
| Kerne | Threads | 88 benutzerdefinierte NVIDIA Olympus-Kerne 176 Threads |
22.528 benutzerdefinierte NVIDIA Olympus-Kerne (88 pro CPU) | 45.056 Threads (176 pro CPU) |
| L2-Cache (pro Kern) | 2 MB | 2 MB |
| Einheitlicher L3-Cache | 164 MB | 42 GB (164 MB pro CPU) |
| SIMD (pro Kern) | 6x 128bSVE2 FP8 |
6x 128bSVE2 FP8 |
| Speicherkapazität | Bis zu 1,5 TB SOCAMM LPDDR5X |
Bis zu 400 TB2 SOCAMM LPDDR5X |
| Speicherbandbreite (Spitzenwert) | Bis zu 1,2 TB/s | Bis zu 300 TB/s insgesamt |
| NVIDIA NVLINK™-C2C Bandbreite | 1,8 TB/s | 1,8 TB/s pro CPU |
| PCIe CXL | 88 PCIe Gen 6 (nur CPU) 96 PCIe Gen 6 (Vera Rubin) x16, x8, x4, x2 Bifurkation CXL 3.1 |
Bis zu 22.528 PCIe Gen 6 Lanes insgesamt; CXL 3.1 |
| NIC | BlueField-4 CX9 Jede kompatible PCIe-NIC |
64x PCIe Gen Xx mit Unterstützung für NVIDIA BlueField-4 DPUs |
| Confidential Computing | Ja | Ja |
| Formfaktor und Kühlung | 1S und 2S Server Luft- oder flüssigkeitsgekühlt 250 W bis 450 W konfigurierbare TDP |
48U MGX Rack 100 % flüssigkeitsgekühlt |
1. Vorläufige Informationen. Alle Werte sind Maximalwerte und können sich ändern.
2. 200 TB empfohlene Konfig.
Partner
Jetzt starten
Melden Sie sich an, um aktuelle Nachrichten, Updates und mehr von NVIDIA zu erhalten.