NVLink und NVSwitch

Die Bausteine der fortschrittlichen Multi-GPU-Kommunikation

Wie NVLink und NVSwitch zusammenarbeiten

NVIDIA NVLink

NVIDIA A100 with NVLink GPU-to-GPU connections

NVIDIA NVSwitch

The NVSwitch topology diagram

Maximierung des Systemdurchsatzes

NVLINK der dritten Generation

Mit der NVLink-Technologie von NVIDIA gehören Verbindungsprobleme der Vergangenheit an: Sie bietet eine höhere Bandbreite, mehr Links und eine bessere Skalierbarkeit für Multi-GPU-Systemkonfigurationen. Ein einzelner NVIDIA A100 Tensor Core-Grafikprozessor unterstützt bis zu zwölf NVLink-Verbindungen der dritten Generation für eine Bandbreite von insgesamt 600 GB/s. Das ist eine 10-mal höhere Bandbreite als bei PCIe der vierten Generation.

NVLink in A100 hat die Anzahl der Links von 6 auf 12 erhöht. Diese direkte Kommunikationsverbindung zwischen zwei Grafikprozessoren verbessert die Genauigkeit und Konvergenz von HPC und KI.

Bei Servern wie dem NVIDIA DGX™ wird diese Technologie genutzt, um eine höhere Skalierbarkeit für extrem schnelles Deep-Learning-Training zu ermöglichen.

NVLink-Leistung

NVLink in NVIDIA A100

Höchste Beschleunigung zwischen Grafikprozessoren

Durch den Einsatz der NVLink-Technologie, die mit der NVIDIA PascalTM-Architektur erstmals eingeführt wurde, wurde die Übertragungsrate des Tesla V100 in beide Richtungen von 20 auf 25 GB/s erhöht. Diese direkte Kommunikationsverbindung zwischen zwei Grafikprozessoren verbessert die Genauigkeit und Konvergenz von High-Performance-Computing (HPC) sowie KI und erreicht höhere Geschwindigkeiten als PCIe.

NVLink Connecting Eight Tesla V100 Accelerators in a Hybrid Cube Mesh Topology as Used in the DGX-1V Server

NVIDIA NVSwitch

NVSwitch – Vollständig verbundener NVLink

Mit der rasanten Ausbreitung von Deep-Learning ist auch der Bedarf an schnellerer und besser skalierbarer Vernetzung gestiegen. Denn häufig erweist sich PCIe-Bandbreite als Engpass bei Multi-GPU-Systemen. Für die Skalierung von Deep-Learning-Workloads ist eine deutlich höhere Bandbreite und geringere Latenz erforderlich.

NVIDIA NVSwitch basiert auf der fortschrittlichen Kommunikationsfähigkeit von NVLink, um dieses Problem zu lösen. Für noch höhere Deep-Learning-Leistung unterstützt ein GPU-Fabric mehr Grafikprozessoren auf einem einzelnen Server, die durch Verbindungen mit vollständiger Bandbreite miteinander vernetzt sind. Jeder Grafikprozessor verfügt über 12 NVLinks zum NVSwitch, um eine allseitige High-Speed-Kommunikation zu ermöglichen.

Eine der leistungsstärksten End-to-End-Plattformen für Rechenzentren zur Unterstützung von KI und HPC

NVLink und NVSwitch sind wichtige Bausteine der kompletten NVIDIA-Lösung für Rechenzentren, die Hardware, Netzwerke, Software, Bibliotheken sowie optimierte KI-Modelle und Anwendungen von NGC™ umfasst. Die extrem leistungsstarke End-to-End-Plattform für KI und HPC ermöglicht es Forschern, konkrete Ergebnisse zu liefern sowie Lösungen für die Produktion in großem Maßstab bereitzustellen und bietet bei jeder Größe eine beispiellose Beschleunigung.

Vollständige Verbindung für unübertroffene Leistung

NVSwitch ist die erste knotenbasierte Switch-Architektur, die 8 bis 16 vollständig verbundene Grafikprozessoren auf einem einzigen Serverknoten unterstützt. Der NVSwitch der zweiten Generation steuert die simultane Kommunikation zwischen allen GPU-Paaren mit unglaublichen 600 GB/s. Er bietet volle Unterstützung für eine allseitige Kommunikation mit direkter Peer-to-Peer-Speicheradressierung für Grafikprozessoren. Diese 16 Grafikprozessoren können zudem zusammen als ein großer Grafikprozessor mit einheitlichem Speicherplatz und 5 PetaFLOPS Rechenleistung für Deep Learning genutzt werden.

Technische Daten

  • NVIDIA NVLink

    NVIDIA NVLink

  • NVIDIA NVSwitch

    NVIDIA NVSwitch

  Zweite Generation Dritte Generation
Gesamte NVLink-Bandbreite 300 GB/s 600 GB/s
Maximale Anzahl an Links pro Grafikprozessor 6 12
Unterstützte NVIDIA-Architekturen NVIDIA Volta NVIDIA Ampere-Architektur
  NVSwitch mit NVLink der 2. Generation NVSwitch mit NVLink der 3. Generation
Anzahl der Grafikprozessoren mit direkter Verbindung Bis zu 16 Bis zu 16
NVSwitch-Bandbreite für Verbindungen zwischen GPUs 300 GB/s 600 GB/s
Gesamte aggregierte Bandbreite 4,8 TB/s 9,6 TB/s
Unterstützte NVIDIA-Architekturen NVIDIA Volta NVIDIA Ampere-Architektur

Jetzt starten

Erleben Sie NVIDIA DGX A100, das universelle System für KI-Infrastruktur und das weltweit erste KI-System, das auf dem NVIDIA A100 Tensor-Core-Grafikprozessor basiert.