Commutateurs et appareils NVIDIA Quantum InfiniBand

Portefeuille complet de commutateurs et d'appliances de gestion des structures pour l'IA et le calcul intensif à grande échelle.

Aperçu

Accélération de la recherche et de l’innovation grâce à une plus grande capacité de données et au calcul en réseau

NVIDIA Quantum InfiniBand est la seule plateforme de calcul en réseau entièrement déchargeable au monde. Elle offre un débit et une densité de données incomparables ainsi qu'un gain de performances suffisant pour atteindre des performances dignes d'un Data Center avec une importante réduction des coûts et de la complexité. NVIDIA Quantum InfiniBand fournit également des capacités d'autoréparation de la mise en réseau, une qualité de service (QoS) accrue, un meilleur contrôle de la congestion et un routage adaptatif pour fournir le débit global d’application le plus élevé.

Le calcul accéléré et la mise en réseau stimulent le calcul intensif à l'ère de l'IA

Découvrez comment les commutateurs de mise en réseau NVIDIA Quantum-X Photonics InfiniBand avec optique co-packagée (CPO) permettent aux usines d'IA de réduire considérablement leur consommation énergétique et leurs coûts d'exploitation.

Mise en œuvre de NVIDIA Quantum-X Photonics, le commutateur co-packagé de NVIDIA

Découvrez à l’œuvre le commutateur NVIDIA Quantum-X800 CPO, qui connecte des racks NVIDIA GB300 pour faire la démonstration de la photonique sur silicium la plus avancée au monde à des fins d'exploitation de l'IA agentique.

Avantages

Avantages-clés du commutateur NVIDIA Quantum InfiniBand

Calcul en réseau

La quatrième version du protocole SHARP™ (Scalable Hierarchical Aggregation and Reduction Protocol) de NVIDIA fournit des performances 9 fois plus élevées

Échelle la plus élevée

Plus de 10 000 nœuds dans une topologie Fat Tree à deux niveaux

Optimisation NCCL

L'accélération SHARP garantit des performances jusqu'à 2,5 fois plus élevées

Structures auto-réparables

Récupération la plus rapide du marché pour une résilience mille fois plus élevée

Produits

Commutateurs et appliances NVIDIA Quantum InfiniBand

Commutateurs NVIDIA Quantum-X800 InfiniBand

Les commutateurs NVIDIA Quantum-X800 InfiniBand offrent un débit de 800 gigabits par seconde (Gbit/s), une latence ultra-faible, des capacités avancées pour le calcul en réseau de NVIDIA et des fonctionnalités qui augmentent les performances globales des applications au sein des Data Centers de calcul haute performance (HPC) et d'IA.

Le commutateur photonique NVIDIA Quantum-X réduit en outre la consommation totale d'énergie et la latence du système en minimisant la distance et le nombre de connexions entre l'optique et l'électronique.

Gamme de commutateurs NVIDIA Quantum-2 InfiniBand

Les commutateurs NVIDIA Quantum-2 InfiniBand offrent un débit de 400 Gbit/s, un calcul en réseau, des moteurs d'accélération intelligents, une grande polyvalence et une architecture robuste permettant d'atteindre des performances inégalées pour le HPC, l'IA et les infrastructures Hyperscale dans le Cloud, à moindre coût et avec moins de complexité.

Passerelle NVIDIA Skyway d’InfiniBand à Ethernet

L'appliance NVIDIA® Skyway™ est une passerelle InfiniBand-to-Ethernet de 1,6 térabit par seconde (Tbit/s) qui prend en charge huit ports de 100 ou 200 Gb sur chaque instance InfiniBand et Ethernet. Le nombre d'appliances Skyway peut être facilement mis à l'échelle au fil du temps pour répondre à la demande des utilisateurs.

Systèmes NVIDIA MetroX-3 XC

NVIDIA MetroX®-3 XC étend la portée d'InfiniBand jusqu'à 40 kilomètres. En permettant la connectivité entre les Data Centers distants, y compris les infrastructures à l'Edge, et entre les Data Centers et les infrastructures de stockage distantes, MetroX-3 XC fournit un chiffrement sur de longues distances et sur les infrastructures DWDM de multiplexage par répartition en longueur d'onde dense.

Innovations

Innovations NVIDIA Quantum InfiniBand

Logiciel de commutation InfiniBand

NVIDIA NVOS est un système d’exploitation de commutateurs InfiniBand pour les Data Centers à hautes performances permettant de configurer des réseaux pouvant inclure jusqu’à des milliers de nœuds de calcul et de stockage, tout en fournissant des capacités avancées de supervision et d'approvisionnement.

Calcul en réseau

Les commutateurs NVIDIA Quantum InfiniBand, qui incluent le protocole SHARP (Scalable Hierarchical Aggregation And Reduction Protocol), déchargent et accélèrent les algorithmes de réduction des données, améliorant ainsi les performances et l’évolutivité des applications d’IA et de HPC.

Logiciels évolutifs pour le HPC

NVIDIA HPC-X® est une suite logicielle complète reposant sur les technologies MPI (Message Passing Interface) et SHMEM (Shared Memory Access) / PGAS (Partitioned Global Address Space) qui tire profit des moteurs d’accélération et de calcul en réseau InfiniBand pour optimiser les projets de recherche et les applications industrielles.

Unified Fabric Manager (UFM)

La plateforme NVIDIA UFM® permet aux administrateurs de Data Centers d’approvisionner, surveiller et gérer efficacement, mais aussi de dépanner de manière proactive, leur infrastructure réseau InfiniBand.

Ressources

Découvrez les commutateurs de NVIDIA basés sur l'optique co-packagée

Les commutateurs NVIDIA CPO fournissent une efficacité énergétique 5 fois plus importante, une résilience 10 fois plus élevée et un déploiement 1,3 fois plus rapide que les émetteurs-récepteurs traditionnels, offrant ainsi l'évolutivité nécessaire pour alimenter les usines d'IA de nouvelle génération.

Mise en œuvre du commutateur photonique NVIDIA Quantum-X InfiniBand

Lorsque le commutateur NVIDIA Quantum-X CPO Q3450 et la carte ConnectX®-8 SuperNIC™ connectent des racks GB300, ils mettent en évidence toute l'évolutivité de la technologie de mise en réseau de photonique sur silicium de NVIDIA, qui constitue la solution la plus avancée au monde pour l'IA agentique.

Calcul en réseau avec NVIDIA SHARP

Les commutateurs NVIDIA Quantum InfiniBand avec technologie SHARP exécutent des réductions de données directement au sein du réseau, ce qui fournit des gains de vitesse significatifs et réduit la charge du CPU par rapport aux méthodes traditionnelles.

Performances accrues pour le Deep Learning distribué avec NVIDIA SHARP

NVIDIA SHARP exploite le calcul en réseau au sein d'un commutateur Quantum pour améliorer considérablement les performances des charges de travail distribuées d'apprentissage automatique.

Fiche technique du commutateur NVIDIA Quantum-X800

Fiche technique du commutateur NVIDIA Quantum-2

Fiche technique du commutateur NVIDIA Quantum

Fiche technique de NVIDIA Skyway

Fiche technique des systèmes NVIDIA MetroX-3 XC

Manuel d'utilisation des systèmes NVIDIA MetroX-2 XC

Sécurité multi-locataires en un clic avec NVIDIA Quantum InfiniBand

Simplification des opérations réseau pour l'IA avec NVIDIA Quantum InfiniBand

Transformez votre Data Center en un méga Data Center avec les systèmes MetroX longue distance

FAQ sur les commutateurs et les appliances NVIDIA Quantum InfiniBand

InfiniBand est une norme d'interconnexion à hautes performances conçue pour assurer une communication à faible latence et à bande passante élevée entre les nœuds de calcul. Pour l'entraînement de l'IA et les charges de travail de HPC qui distribuent les capacités de calcul sur des centaines ou des milliers de GPU, la latence réseau affecte directement le délai d'achèvement des tâches. NVIDIA Quantum InfiniBand est également la seule plateforme d'interconnexion à prendre en charge le calcul en réseau, ce qui permet de décharger les opérations collectives telles que AllReduce sur la structure de commutation en elle-même, ce qui libère des cycles GPU pour le calcul réel.

Les solutions de commutation conventionnelles utilisent des émetteurs-récepteurs optiques enfichables pour connecter l'ASIC du commutateur à la fibre. Chaque émetteur-récepteur constitue un composant discret qui consomme de l'énergie, génère de la chaleur et peut tomber en panne. À l'échelle du cluster, cela englobe des milliers d'émetteurs-récepteurs individuels à gérer et à remplacer tout au long de la durée de vie du déploiement.

Le commutateur photonique NVIDIA Quantum-X InfiniBand intègre les moteurs optiques directement au silicium du commutateur, ce qui élimine le besoin de recourir à des émetteurs-récepteurs branchables. Cela raccourcit le chemin électrique entre la puce et la fibre, ce qui réduit la consommation d'énergie et la latence, tandis que le nombre réduit de composants discrets améliore la fiabilité et simplifie les opérations à long terme.

Le calcul en réseau désigne la capacité des commutateurs NVIDIA Quantum à exécuter des opérations de traitement des données au sein de la structure réseau, sans impliquer les CPU ou GPU hôtes. La principale capacité du calcul en réseau repose sur la technologie NVIDIA SHARP, qui décharge les opérations collectives telles que AllReduce directement sur les commutateurs. Pour l'entraînement distribué de l'IA, cela réduit le temps consacré à la communication inter-nœuds et libère les cycles GPU pour le calcul. SHARP accélère les opérations collectives au cœur de la plupart des codes de simulation parallèles, ce qui réduit la latence et la surcharge CPU. Les applications qui tirent parti de NCCL, OpenMPI, UCX ou d'autres piles logicielles MPI conformes aux normes en vigueur peuvent ainsi faire l'objet de modifications minimes du code, ce qui rend le calcul en réseau pertinent dans tous les domaines, de l'entraînement de l'IA à la dynamique moléculaire en passant par la modélisation climatique.

Pour les nouveaux déploiements de l'IA à grande échelle, nous vous recommandons NVIDIA Quantum-X800 InfiniBand. Ce commutateur fournit une connectivité XDR de 800 Gbit/s et est conçu pour les usines d'IA de nouvelle génération qui nécessitent un maximum de bande passante évolutive, une faible latence, un routage adaptatif, un contrôle de la congestion et un calcul SHARP en réseau pour les opérations collectives d'IA et de HPC. Quantum-2 NDR 400 Gbit/s représente une option particulièrement intéressante pour les déploiements de génération Hopper ou les déploiements optimisés en matière de coûts mais, pour la configuration de nouveaux clusters à l'échelle Blackwell, Quantum-X800 fournit la meilleure option pour garantir des performances optimales sur le long terme. Le commutateur Q3200 constitue une plateforme de commutation 2U à refroidissement par air de génération Quantum-X800. Il convient tout particulièrement aux environnements larges ou mixtes qui nécessitent une densité de ports élevée et un chemin de migration pratique.

NVIDIA Unified Fabric Manager (UFM) est la plateforme de gestion des structures pour les déploiements reposant sur NVIDIA Quantum InfiniBand. UFM (proposée sous forme d'appliance intégrée ou de logiciel autonome) gère l'approvisionnement, la supervision en temps réel, les diagnostics et le dépannage proactif sur l'ensemble de la structure. NVIDIA UFM Cyber-AI est une appliance dédiée à la détection des comportements réseau anormaux susceptibles de révéler des menaces de sécurité ou des problèmes matériels avant qu'ils n'aient un impact sur les tâches.

Il s'agit d'une considération courante pour les entreprises qui souhaitent faire évoluer leurs clusters existants ou qui les développent par phases. En général, NVIDIA Quantum InfiniBand est conçue pour garantir une compatibilité ascendante : les adaptateurs et les commutateurs exploitant différentes générations InfiniBand négocient automatiquement la vitesse commune appropriée. Pour les déploiements nécessitant la connexion des environnements Quantum-X800 (XDR, 800 Gbit/s) et Quantum-2 (NDR, 400 Gbit/s), NVIDIA recommande le Q3200, un commutateur multi-vitesses spécialement conçu pour faire le pont entre ces deux générations. Les considérations de conception spécifiques en matière de topologie, de mappage des ports et de configuration des structures à l'aide du Q3200 sont abordées dans la documentation des commutateurs NVIDIA InfiniBand.

Oui. L'appliance NVIDIA Skyway™, spécifiquement conçue pour ce cas d'utilisation, fournit une passerelle InfiniBand vers Ethernet. Skyway permet aux clusters de calcul InfiniBand de communiquer avec des systèmes de stockage connectés à Ethernet, des réseaux de gestion ou d'autres infrastructures Ethernet sans nécessiter de modification de l'un ou l'autre environnement. Plusieurs appliances Skyway peuvent être déployées puis évoluer de manière incrémentielle à mesure que les besoins en bande passante inter-structures augmentent.

Étapes suivantes

Vous voulez vous lancer ?

Configurez votre cluster

Cet outil en ligne peut vous aider à configurer des clusters basés sur Fat Tree avec deux niveaux de systèmes de commutation et des topologies Dragonfly+.

Suivez des formations sur la mise en réseau

Découvrez des formations techniques approfondies sur la mise en réseau NVIDIA Quantum InfiniBand grâce à la NVIDIA Academy.

Comment acheter les solutions de mise en réseau NVIDIA ?

Visitez la boutique de NVIDIA pour en savoir plus sur la manière d'acheter des solutions de NVIDIA pour la mise en réseau.