Das Zeitalter des agentischen Denkens gestalten.
Überblick
NVIDIA Rubin wurde für das Zeitalter der agentischen KI- und Denkmodelle entwickelt und bewältigt mehrstufige Problemlösungen und langanhaltende Kontext-Workflows im großen Maßstab. Durch die Eliminierung von Engpässen in der Kommunikation, Koordination und Speicherverschiebung bietet NVIDIA Rubin eine unübertroffene Skalierbarkeit und Effizienz und ermöglicht es autonomen Agenten, im großen Maßstab zu denken, zu handeln und Innovationen zu entwickeln.
Die Transformer-Engine der dritten Generation erweitert die Grenzen der KI-Leistung erheblich und bietet eine doppelt so schnelle Kontext-Phasen-Inferenzleistung für innovative Modellarchitekturen wie Mixture of Experts (MoE). Dies wird mit der Adaptiven Beschleunigungseinheit (AAU) erreicht, die die Ausführung intelligent orchestriert, indem sie optimale Rechenpfade dynamisch auswählt und spezialisierte Anweisungen aktiviert. Diese Optimierungen verbessern die Attention-Operationen und ermöglichen einen höheren Durchsatz, niedrigere Kosten pro Token und skalierbare Effizienz für generative KI-Workloads der nächsten Generation.
Die dritte Generation von NVIDIA Confidential Computing umfasst die NVIDIA Vera CPU und erweitert die Sicherheit auf Rack-Skala mit NVIDIA Vera Rubin NVL72. Diese Plattform schafft eine einheitliche Vertrauensausführungsumgebung über 36 NVIDIA Vera-CPUs, 72 NVIDIA Rubin-GPUs und die 260 Terabyte pro Sekunde (TB/s) NVIDIA NVLink™-Fabric, die sie nahtlos miteinander verbindet. Sie sichert den gesamten KI-Lebenszyklus, vom Pretraining und Nachtraining bis hin zur Inferenz, während proprietäre Modelle, Daten und Eingabeaufforderungen von Cloud-Anbietern und anderen Mandanten isoliert bleiben. Mit Attestierungsdiensten für den kryptografischen Compliance-Nachweis und nahezu unverschlüsseltem Durchsatz, der durch NVLink-C2C ermöglicht wird, kombiniert NVL72 enorme Skalierbarkeit mit kompromisslosem Schutz und verwandelt den Datenschutz in einen Leistungsvorteil.
NVLink der sechsten Generation bietet einen großen Sprung für das High-Speed-GPU-Interconnect-Fabric von NVIDIA, das 72 NVIDIA Rubin-GPUs in einer einzigen Leistungsdomäne vereint. Es bietet eine Bandbreite von 3,6 TB/s pro GPU und 260 TB/s Konnektivität (doppelt so viel wie NVIDIA Blackwell) mit geringer Latenz für eine schnellere Kommunikation. In Kombination mit dem NVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ für eine außergewöhnliche Bandbreiteneffizienz beschleunigt dieses Interconnect der nächsten Generation das Training und die Inferenz für die weltweit größten Modelle im großen Maßstab und ohne Kompromisse.
NVIDIA Vera Rubin NVL72 bietet Ausfallsicherheit im Rack-Maßstab mit fortschrittlichen Zuverlässigkeitsfunktionen. NVIDIA Rubin-GPUs verfügen über eine spezielle RAS-Engine der zweiten Generation für proaktive Wartung und Echtzeit-Integritätsprüfungen ohne Ausfallzeiten, während NVIDIA Vera-CPUs mit SOCAMM LPDDR5X und In-System-Tests für die CPU-Kerne eine verbesserte Wartungsfreundlichkeit bieten. Das modulare, kabellose Design des Racks in Kombination mit intelligentem Failover und softwaredefiniertem NVLink-Routing gewährleistet einen kontinuierlichen Betrieb und reduziert den Wartungsaufwand.
Die NVIDIA Vera-CPU wurde für Datenbewegungen und agentisches Denken über beschleunigte Systeme hinweg entwickelt. Es lässt sich nahtlos mit NVIDIA-GPUs kombinieren oder funktioniert unabhängig für Analyse-, Cloud-, Orchestrierungs-, Datenspeicher- und High-Performance-Computing (HPC)-Workloads. Mit 88 von NVIDIA entwickelten Hochleistungs-Kernen, bis zu 1,2 TB/s LPDDR5X-Speicherbandbreite und der NVIDIA Scalable Coherency Fabric bietet NVIDIA Vera vorhersehbare, energieeffiziente Leistung für daten- und speicherintensive Workloads. Die integrierte NVLink-C2C-Konnektivität ermöglicht einen kohärenten CPU-GPU-Speicherzugriff mit hoher Bandbreite und maximiert so die Systemauslastung, Effizienz und Rentabilität.
NVIDIA Vera Rubin wurde durch ein extremes Codesign entwickelt. Es behandelt das Rechenzentrum, nicht den Chip, als Recheneinheit und schafft so eine neue Grundlage für die effiziente, sichere und vorhersehbare Produktion von Intelligenz im großen Maßstab.