NVLink und NVLink-Switch

Die Bausteine der High-Speed-Kommunikation mit mehreren Grafikkarten, um große Datensätze schneller in Modelle einzuspeisen und Daten zwischen Grafikkarten schnell auszutauschen.

Bedarf an schnelleren skalierbaren Verbindungen

Um das volle Potenzial von Exascale-Computing und AI-Modellen mit Billionen Parametern auszuschöpfen, ist eine schnelle, nahtlose Kommunikation zwischen allen Grafikkarten innerhalb eines Server-Clusters erforderlich. Die fünfte Generation von NVIDIA® NVLink® ist eine Scale-up-Verbindung, die beschleunigte Leistung für AI-Modelle mit Billionen oder mehreren Billionen Parametern bietet.

Maximierung des Systemdurchsatzes mit NVIDIA NVLink

NVLink der fünften Generation verbessert die Skalierbarkeit für größere Systeme mit mehreren Grafikkarten erheblich. Eine einzelne NVIDIA Blackwell Tensor Core-Grafikkarte unterstützt bis zu 18 NVLink-Verbindungen mit 100 Gigabyte pro Sekunde (GB/s) für eine Gesamtbandbreite von 1,8 Terabyte pro Sekunde (TB/s). Das ist eine 2x höhere Bandbreite als bei der vorherigen Generation und über 14x mehr Bandbreite als bei PCIe Gen5. Serverplattformen wie die GB200 NVL72 nutzen diese Technologie, um eine größere Skalierbarkeit für die komplexesten Großmodelle von heute zu bieten.

NVLink-Leistung

NVLink in NVIDIA H100 erhöht die Bandbreite für die Kommunikation zwischen GPUs um das 1,5-fache im Vergleich zur vorherigen Generation, sodass Forscher größere, anspruchsvollere Anwendungen für die Lösung komplexerer Probleme nutzen können.

Höherer GPU-Durchsatz mit NVLink-Kommunikation

Vollständig verbundene Grafikkarten mit NVIDIA NVLink und NVLink-Switch

NVLink realisiert eine direkte bidirektionale GPU-zu-GPU-Verbindung mit 1,8 TB/s, die den Input/Output (IO) mehrerer Grafikkarten innerhalb eines Servers skaliert. Die NVIDIA NVLink-Switch-Chips verbinden mehrere NVLinks, um eine vollständige Kommunikation zwischen allen Grafikkarten mit voller NVLink-Geschwindigkeit innerhalb eines einzelnen Racks und zwischen Racks zu ermöglichen.

Zur Ermöglichung schneller, kollektiver Operationen verfügt jeder NVLink-Switch über Engines für das NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ für netzinterne Reduktionen und Multicast-Beschleunigung.

Weitere Informationen zum NVLink-Switch

Training von bis zu Billionen Parametermodellen mit dem NVLink-Switch-System

Mit dem NVLink-Switch können NVLink-Verbindungen über Knoten hinweg ausgedehnt werden, um einen nahtlosen GPU-Cluster mit hoher Bandbreite zu bilden, der mehrere Knoten umfasst und eine effektive Grafikkarte für Rechenzentren bildet. Der NVIDIA NVLink-Switch ermöglicht eine GPU-Bandbreite von 130 TB/s in einem NVL72 für Parallelität großer Modelle. Multi-Server-Cluster mit NVLink skalieren die GPU-Kommunikation angepasst an die zunehmende Rechenleistung, sodass NVL72 die 9-fache Anzahl von Grafikkarten im Vergleich zu einem einzelnen System mit acht Grafikkarten unterstützen kann.

Erfahren Sie mehr über NVIDIA GB200 NVL72

NVIDIA NVLink-Switch

Der NVIDIA NVLink-Switch bietet 144 NVLink-Ports mit einer nicht blockierenden Switching-Kapazität von 14,4 Terabyte pro Sekunde. Der Rack-Switch ist für eine hohe Bandbreite und niedrige Latenz in NVIDIA GB200 NVL72-Systemen ausgelegt, die externe NVLink-Konnektivität der fünften Generation unterstützen.

Tech-Blog lesen

Skalierung von Enterprise auf Exascale

Vollständige Verbindung für unübertroffene Leistung

Der NVLink-Switch ist der erste Switch-Chip auf Rack-Ebene, die bis zu 576 vollständig verbundene Grafikkarten in einer nicht blockierenden Compute Fabric unterstützt. Der NVSwitch der vierten Generation verbindet jedes GPU-Paar mit unglaublichen 1.800 GB/s. Er unterstützt eine vollständig allseitige Kommunikation. Die 72 Grafikkarten in GB200 NVL72 können als einzelner Hochleistungsbeschleuniger mit bis zu 1,4 exaFLOPS AI-Rechenleistung eingesetzt werden

Die leistungsstärkste AI- und HPC-Plattform

NVLink und der NVLink-Switch sind wichtige Bausteine der kompletten NVIDIA-Lösung für Rechenzentren, die Hardware, Netzwerke, Software, Bibliotheken und optimierte AI-Modelle und -Anwendungen aus der NVIDIA AI Enterprise-Softwaresuite und dem NVIDIA NGC™-Katalog umfasst. Die extrem leistungsstarke End-to-End-Plattform für AI und HPC ermöglicht es Forschern, konkrete Ergebnisse zu liefern sowie Lösungen für die Produktion bereitzustellen und bietet bei jeder Größenordnung eine beispiellose Beschleunigung.

Technische Daten

NVLink
NVLink Switch

	Zweite Generation	Dritte Generation	Vierte Generation	Fünfte Generation
NVLink-Bandbreite pro GPU	300 GB/s	600 GB/s	900 GB/s	1,800 GB/s
Maximale Anzahl an Links pro Grafikkarte	6	12	18	18
Unterstützte NVIDIA-Architekturen	NVIDIA Volta™-Architektur	NVIDIA Ampere-Architektur	NVIDIA™ Hopper-Architektur	NVIDIA Blackwell-Architektur

	Erste Generation	Zweite Generation	Dritte Generation	NVLink-Switch
Anzahl der Grafikkarten mit direkter Verbindung in einer NVLink-Domäne	Bis zu 8	Bis zu 8	Bis zu 8	Bis zu 576
NVSwitch-Bandbreite für Verbindungen zwischen Grafikkarten	300 GB/s	600 GB/s	900 GB/s	1,800 GB/s
Gesamte aggregierte Bandbreite	2.4 TB/s	4.8 TB/s	7.2 TB/s	1 PB/s
Unterstützte NVIDIA-Architekturen	NVIDIA Volta™-Architektur	NVIDIA Ampere-Architektur	NVIDIA™ Hopper-Architektur	NVIDIA Blackwell-Architektur

Vorläufige Spezifikationen, Änderungen möglich

Tiefer Einblick in die NVIDIA Blackwell-Architektur

Mehr erfahren