NVIDIA NetQ

Intégrez une visibilité holistique en temps réel, un dépannage avancé et une approche DevOps sur votre réseau moderne de Data Center.

Introduction

Opérations réseau d'usine intelligente avec NetQ

NVIDIA NetQ™ est un jeu d'outils d'opérations réseau hautement évolutif qui fournit une visibilité, un dépannage, une corrélation et une validation de vos commutateurs NVIDIA NVLink™ et de vos fabrics NVIDIA® Cumulus® en temps réel. NetQ utilise la télémétrie et fournit des informations exploitables sur la santé de votre réseau de data center, en veillant à ce que votre structure réseau d'IA fonctionne sans problème.

Aperçu

Fonctionnement de NetQ

Collecte, traitement et visualisation de données

NetQ utilise des agents sur les commutateurs et les hôtes pour collecter des données de télémétrie sur l'ensemble du réseau. En tant que point de contrôle central, NetQ stocke et traite l'information afin de fournir des données exploitables et une visibilité complète. Son interface utilisateur graphique (GUI) riche met en évidence rapidement les problèmes et les alertes, ce qui simplifie les opérations et augmente l'efficacité.

Avantages

Pourquoi choisir NetQ pour les opérations de réseau d'usines d'IA ?

NetQ est une plateforme d'observabilité holistique qui prend en charge de manière native la télémétrie en streaming pour la détection et le rapport d'anomalies du plan de données et de problèmes réseau intermittents accélérés par le matériel. Elle garantit la mise en réseau aux plus hautes performances pour l'entraînement et l'inférence de l'IA.

Rationalisez les mises à niveau

L'interface graphique intuitive de NetQ permet de gérer le réseau d'une simple pression de bouton.

Obtenez des renseignements en temps réel

Corrélez la configuration et l'état opérationnel, afin d'identifier et de suivre instantanément les changements d'état sur l'ensemble de votre Data Center.

Réduisez les temps d’arrêt

Optimisez les opérations de l'IA avec des alertes rapides, un dépannage accéléré et une détection proactive.

Résolvez les incidents plus rapidement

Détectez les états réseau défectueux et obtenez des alertes avec des données précises de localisation des défauts.

Minimisez la complexité

Simplifiez les opérations et renforcez l'efficacité des opérateurs en mettant rapidement en évidence les problèmes grâce à des visualisations et à des alertes.

Diagnostiquez les causes profondes

Identifiez les chemins réseau, consultez à tout moment l'historique de l'état du réseau, passez en revue les journaux de modification d'événements dans toute la structure et diagnostiquez les causes profondes de changement d'état.

Caractéristiques

Ce que vous obtenez avec NetQ

Avec des fonctionnalités complètes d'intégration continue et de déploiement continu (CI/CD), NetQ facilite la gestion et l'allocation des éléments réseau au sein de votre technologie d'IA avec une gamme complète de fonctionnalités d'exploitation comme la visibilité, le dépannage, la validation, l'identification et les fonctionnalités comparatives de retour en arrière.

  • Gestion du réseau : accédez à de puissants outils pour gérer vos environnements NVIDIA Cumulus Linux et NVOS en appuyant sur un bouton.
  • Télémétrie avancée : collectez des données en temps réel qui permettent un dépannage approfondi, une visibilité et des workflows automatisés à partir d'une seule interface graphique
  • Capture instantanée et comparaison : comparez facilement les configurations réseau antérieures aux configurations après modifications, pour éliminer les risques de perturbation.
  • Visibilité à l'échelle du réseau : consultez des visualisations en temps réel sur l'état de votre réseau grâce à la riche interface graphique de NetQ.
  • Télémétrie des flux : analysez les données relatives à la latence et à l'occupation de la mémoire tampon à l'échelle du réseau pour tous les chemins d'un flux à 4 ou 5 tuples afin d'identifier les points de congestion.
  • Validation préventive : réduisez les erreurs manuelles avant qu’elles n’affectent la production.
  • Dépannage diagnostique : diagnostiquez la cause profonde des changements d’état avec des outils de diagnostic avancés.
  • Collection gNMI : utilisez la spécification gNMI (Network Management Interface) pour diffuser des données de télémétrie WJH à partir de l'agent NetQ.
  • Support RoCE : surveillez votre environnement d'accès à la mémoire directe à distance (RDMA) sur Converged Ethernet (RoCE) avec NetQ pour obtenir des informations exploitables sur la structure de votre réseau d'IA.

Ressources

Continuez à explorer NetQ

Fiche technique de NVIDIA NetQ

Découvrez les caractéristiques et les avantages de NetQ, un outil d’exploitation moderne qui permet une visibilité globale en temps réel et le dépannage de votre réseau de Data Center.

Guide d'utilisation NVIDIA NetQ

Découvrez la documentation sur le déploiement, la configuration, la surveillance et le dépannage de votre réseau dans votre environnement de Data Center.

Étapes suivantes

Vous souhaitez vous lancer?

Essayez gratuitement le logiciel de mise en réseau NVIDIA

Simulez une topologie de réseau entièrement automatisée à l'aide de NVIDIA Air.

Découvrez la mise en réseau à l'ère de l'IA

Le réseau est éminemment responsable des performances de l'IA, agissant comme l'épine dorsale du Data Center pour exploiter la puissance de l'IA générative.

En savoir plus sur la plateforme Spectrum-X Ethernet

La plateforme Spectrum-X™ Ethernet, dotée du commutateur Ethernet Spectrum-X™, est spécifiquement conçue pour améliorer les performances et l'efficacité des Clouds d'IA basés sur Ethernet.