NVIDIA NetQ

Visibilità olistica e in tempo reale, risoluzione dei problemi e DevOps nella rete del tuo data center moderno.

Introduzione

Operazioni di rete per la fabbrica di IA con NetQ

NVIDIA NetQ™ è un set di strumenti per operazioni di rete altamente scalabile che fornisce visibilità, risoluzione dei problemi, correlazione e convalida dei tuoi switch NVIDIA NVLink™ e dei fabric NVIDIA® Cumulus® in tempo reale. NetQ utilizza la telemetria e offre informazioni utili sullo stato della rete del data center, garantendo il corretto funzionamento del tessuto di rete IA.

Panoramica

Come funziona NetQ

Raccolta di dati, elaborazione e visualizzazione

NetQ utilizza agenti sugli switch e sugli host per raccogliere dati di telemetria in tutta la rete. Come punto di controllo centrale, NetQ archivia ed elabora informazioni per fornire dati fruibili e visibilità completa. La sua ricca interfaccia grafica utente (GUI) evidenzia rapidamente problemi e avvisi, semplificando le operazioni e aumentando l'efficienza.

Vantaggi

Perché scegliere NetQ per le operazioni di rete delle fabbriche di IA?

NetQ è una piattaforma di osservabilità olistica che supporta nativamente la telemetria di streaming per il rilevamento e la reportistica accelerati da hardware di anomalie del piano di dati e problemi di rete intermittenti. Garantisce la rete ad alte prestazioni per l'addestramento e l'inferenza dell'IA.

Aggiornamenti semplificati

Scopri la semplicità dei pulsanti per la gestione della rete con l'intuitiva GUI di NetQ.

Intelligenza in tempo reale

Correla la configurazione e lo stato operativo e identifica e monitora subito le modifiche dello stato per l'intero data center.

Riduzione dei tempi di inattività

Ottimizza le operazioni IA con avvisi rapidi, risoluzione dei problemi più rapida e rilevamento proattivo.

Rimedi più veloci

Rileva stati di guasti della rete e ricevi avvisi con dati precisi sulla posizione dei guasti.

Riduzione della complessità

Semplifica le operazioni e aumenta l'efficienza dell'operatore identificando rapidamente i problemi con viste e avvisi.

Diagnostica delle cause principali

Traccia i percorsi di rete, riproduci lo stato della rete in qualsiasi momento, esamina i registri delle modifiche degli eventi a livello di fabric e diagnostica la causa radice della non conformità.

Caratteristiche principali

Cosa ottieni con NetQ

Con la piena integrazione e la funzionalità di distribuzione continua (CI/CD), NetQ semplifica la gestione e il provisioning degli elementi di rete all'interno del tessuto IA con una suite completa di funzionalità operative, come visibilità, risoluzione dei problemi, convalida, tracciamento e ricerca comparativa.

  • Gestione della rete: accedi a potenti strumenti per gestire gli ambienti NVIDIA Cumulus Linux e NVOS con un semplice pulsante.
  • Telemetria avanzata: raccogli dati in tempo reale per risolvere più efficacemente i problemi, ottenere visibilità e automatizzare i flussi di lavoro da un'unica interfaccia
  • Snapshot e confronto: metti facilmente a confronto le configurazioni di rete prima e dopo le modifiche per eliminare il rischio di interruzioni.
  • Visibilità su tutta la rete: visualizza in tempo reale lo stato di integrità della rete con l'interfaccia utente grafica avanzata di NetQ.
  • Telemetria del flusso: analizza i dati sulla latenza a livello di fabric e sull'occupazione del buffer di tutti i percorsi di un flusso 4-tuple o 5-tuple per identificare i punti di congestione.
  • Convalida preventiva: riduci gli errori manuali prima che siano implementati in produzione.
  • Risoluzione dei problemi diagnostici: diagnostica la causa principale delle deviazioni dello stato con strumenti diagnostici avanzati.
  • Raccolta gNMI: usa la specifica gNMI (Network Management Interface) gRPC per trasmettere i dati di telemetria WJH dall'agente NetQ.
  • Supporto RoCE: monitora l'accesso remoto alla memoria diretta (RDMA) tramite l'ambiente RoCE (Converged Ethernet) con NetQ per ottenere informazioni utili sul tuo fabric di rete IA.

Risorse

Continua a esplorare NetQ

Scheda tecnica NVIDIA NetQ

Scopri le funzionalità e i vantaggi di NetQ, uno strumento operativo moderno che consente la visibilità olistica e in tempo reale e la risoluzione dei problemi della rete del data center.

Guida utente di NVIDIA NetQ

Scopri la documentazione su distribuzione, configurazione, monitoraggio e risoluzione dei problemi della tua rete nel tuo ambiente di data center.

Prossimi passi

Pronti per poter iniziare?

Ottieni una prova gratuita del software di networking NVIDIA

Simula una topologia di rete completamente automatizzata utilizzando NVIDIA Air.

Scopri il networking per l'era dell'IA

La rete è responsabile in ultima analisi delle prestazioni IA e funge da spina dorsale del data center per sfruttare la potenza dell'IA generativa.

Scopri la piattaforma Spectrum-X Ethernet

Dotata dello switch Ethernet NVIDIA Spectrum-X™, la piattaforma Ethernet Spectrum-X è progettata appositamente per migliorare le prestazioni e l'efficienza dell'infrastruttura IA basata su Ethernet.