NVLink-Switch-Chip

NVLink und NVLink-Switch

Die Bausteine der High-Speed-Kommunikation mit mehreren Grafikkarten, um große Datensätze schneller in Modelle einzuspeisen und Daten zwischen Grafikkarten schnell auszutauschen.

Bedarf an schnelleren skalierbaren Verbindungen

Um das volle Potenzial von Exascale-Computing und AI-Modellen mit Billionen Parametern auszuschöpfen, ist eine schnelle, nahtlose Kommunikation zwischen allen Grafikkarten innerhalb eines Server-Clusters erforderlich. Die fünfte Generation von NVIDIA® NVLink® ist eine Scale-up-Verbindung, die beschleunigte Leistung für AI-Modelle mit Billionen oder mehreren Billionen Parametern bietet.

NVLink-Leistung

NVLink in NVIDIA H100 erhöht die Bandbreite für die Kommunikation zwischen GPUs um das 1,5-fache im Vergleich zur vorherigen Generation, sodass Forscher größere, anspruchsvollere Anwendungen für die Lösung komplexerer Probleme nutzen können.

Höherer GPU-Durchsatz mit NVLink-Kommunikation

Vollständig verbundene Grafikkarten mit NVIDIA NVLink und NVLink-Switch

NVLink realisiert eine direkte bidirektionale GPU-zu-GPU-Verbindung mit 1,8 TB/s, die den Input/Output (IO) mehrerer Grafikkarten innerhalb eines Servers skaliert. Die NVIDIA NVLink-Switch-Chips verbinden mehrere NVLinks, um eine vollständige Kommunikation zwischen allen Grafikkarten mit voller NVLink-Geschwindigkeit innerhalb eines einzelnen Racks und zwischen Racks zu ermöglichen.

Zur Ermöglichung schneller, kollektiver Operationen verfügt jeder NVLink-Switch über Engines für das NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ für netzinterne Reduktionen und Multicast-Beschleunigung.

Training von bis zu Billionen Parametermodellen mit dem NVLink-Switch-System

Mit dem NVLink-Switch können NVLink-Verbindungen über Knoten hinweg ausgedehnt werden, um einen nahtlosen GPU-Cluster mit hoher Bandbreite zu bilden, der mehrere Knoten umfasst und eine effektive Grafikkarte für Rechenzentren bildet. Der NVIDIA NVLink-Switch ermöglicht eine GPU-Bandbreite von 130 TB/s in einem NVL72 für Parallelität großer Modelle. Multi-Server-Cluster mit NVLink skalieren die GPU-Kommunikation angepasst an die zunehmende Rechenleistung, sodass NVL72 die 9-fache Anzahl von Grafikkarten im Vergleich zu einem einzelnen System mit acht Grafikkarten unterstützen kann.

NVIDIA NVLink-Switch

Der NVIDIA NVLink-Switch bietet 144 NVLink-Ports mit einer nicht blockierenden Switching-Kapazität von 14,4 Terabyte pro Sekunde. Der Rack-Switch ist für eine hohe Bandbreite und niedrige Latenz in NVIDIA GB200 NVL72-Systemen ausgelegt, die externe NVLink-Konnektivität der fünften Generation unterstützen.


Skalierung von Enterprise auf Exascale

Vollständige Verbindung für unübertroffene Leistung

Der NVLink-Switch ist der erste Switch-Chip auf Rack-Ebene, die bis zu 576 vollständig verbundene Grafikkarten in einer nicht blockierenden Compute Fabric unterstützt. Der NVSwitch der vierten Generation verbindet jedes GPU-Paar mit unglaublichen 1.800 GB/s. Er unterstützt eine vollständig allseitige Kommunikation. Die 72 Grafikkarten in GB200 NVL72 können als einzelner Hochleistungsbeschleuniger mit bis zu 1,4 exaFLOPS AI-Rechenleistung eingesetzt werden

Die leistungsstärkste AI- und HPC-Plattform

NVLink und der NVLink-Switch sind wichtige Bausteine der kompletten NVIDIA-Lösung für Rechenzentren, die Hardware, Netzwerke, Software, Bibliotheken und optimierte AI-Modelle und -Anwendungen aus der NVIDIA AI Enterprise-Softwaresuite und dem  NVIDIA NGC™-Katalog umfasst. Die extrem leistungsstarke End-to-End-Plattform für AI und HPC ermöglicht es Forschern, konkrete Ergebnisse zu liefern sowie Lösungen für die Produktion bereitzustellen und bietet bei jeder Größenordnung eine beispiellose Beschleunigung.

Tiefer Einblick in die NVIDIA Blackwell-Architektur