NVIDIA NetQ

Incorpore visibilidad holística y en tiempo real, solución de problemas y DevOps a su red de data center moderna.

Introducción

Operaciones de Red de Fábricas de IA con NetQ

NVIDIA NetQ™ es un conjunto de herramientas de operaciones de red altamente escalable que proporciona visibilidad, solución de problemas, correlación y validación de sus switches NVIDIA NVLink™ y sus tejidos NVIDIA® Cumulus® en tiempo real. NetQ utiliza telemetría y ofrece información práctica sobre el estado de la red de su data center, para garantizar que su estructura de red de IA funcione a la perfección.

Descripción General

Cómo funciona NetQ

Recopilación de Datos, Procesamiento y Visualización

NetQ usa agentes en los switches y hosts para recopilar datos de telemetría en toda la red. Como punto de control central, NetQ almacena y procesa información para ofrecer perspectivas procesables y una visibilidad completa. Su rica interfaz gráfica de usuario (GUI) destaca rápidamente problemas y alertas, simplificando así las operaciones y aumentando la eficiencia.

Beneficios

¿Por Qué Elegir NetQ para las Operaciones de Redes de Fábricas de IA?

NetQ es una plataforma de observabilidad holística que admite de forma nativa la telemetría de streaming para la detección e informes acelerados por hardware de anomalías en el plano de datos y problemas de red intermitentes. Garantiza redes de mayor rendimiento para el entrenamiento y la inferencia de IA.

Agilice las actualizaciones

Administre redes con solo presionar un botón gracias a la interfaz gráfica de usuario intuitiva de NetQ.

Obtenga información importante en tiempo real

Correlacione la configuración y el estado operativo, e identifique y haga un seguimiento instantáneo de los cambios de estado en todo su data center.

Reduzca el tiempo de inactividad

Optimice las operaciones de IA con alertas rápidas, solución de problemas acelerada y detección proactiva.

Corrija errores más rápido

Detecte estados de red defectuosos y obtenga alertas con datos precisos sobre la ubicación de errores.

Elimine la complejidad

Simplifique las operaciones y aumente la eficiencia del operador al destacar rápidamente los problemas a través de visualizaciones y alertas.

Determine las causas raíz

Trace las rutas de acceso de red, reproduzca el estado de red en cualquier momento en el pasado, revise los registros de cambios de eventos en toda la estructura y diagnostique la causa principal de la desviación de estado.

Funciones Clave

Beneficios de NetQ

Con la funcionalidad de integración continua completa y la implementación continua (CI/CD), NetQ facilita la administración y el aprovisionamiento de elementos de red dentro de su estructura de IA con un conjunto completo de capacidades de operación como visibilidad, solución de problemas, validación, trazado y funcionalidad de retrospectiva comparativa.

  • Administración de redes: acceda a poderosas herramientas para administrar sus entornos NVIDIA Cumulus Linux y NVOS con solo pulsar un botón.
  • Telemetría avanzada: Recopile datos en tiempo real que permiten una solución de problemas profunda, visibilidad y flujos de trabajo automatizados desde una sola interfaz gráfica de usuario (GUI).
  • Tome instantáneas y compare: Compare fácilmente las configuraciones de red anteriores con las obtenidas después de realizar los cambios en la red para eliminar el riesgo de interrupción.
  • Visibilidad completa de red: Consulte visualizaciones en tiempo real sobre el estado de su red con la GUI enriquecida de NetQ.
  • Telemetría de Rlujo: Analiza los datos de latencia y ocupación de búferes en toda la estructura de todas las rutas de un flujo de 4 o 5 tuplas para identificar puntos de congestión.
  • Validación preventiva: Reduzca los errores manuales antes de que entren en producción.
  • Solución de problemas mediante diagnósticos: Diagnostique la causa raíz de las desviaciones de estado con herramientas de diagnóstico avanzadas.
  • Recopilación de gNMI: Utilice la especificación de interfaz de administración de red (gNMI) de gRPC para transmitir datos de telemetría de WJH desde el agente de NetQ.
  • Compatibilidad con RoCE: Supervise su entorno de acceso directo a memoria remota (RDMA) a través del entorno de Ethernet convergente (RoCE) con NetQ para obtener información práctica sobre su estructura de red de IA.

Recursos

Continúe Explorando NetQ

Hoja de datos de NVIDIA NetQ

Conozca las características y beneficios de NetQ, una herramienta de operaciones moderna que permite una visibilidad completa y en tiempo real, y la solución de problemas de la red de su data center.

Guía del Usuario de NVIDIA NetQ

Explore la documentación sobre la implementación, la configuración, el monitoreo y la solución de problemas de su red en el entorno de su data center.

Próximos Pasos

¿Todo Listo para Empezar?

Obtenga una Prueba Gratuita del Software de Redes de NVIDIA

Simule una topología de red totalmente automatizada con NVIDIA Air.

Descubra las Redes para la Era de la IA

La red es la responsable en última instancia del desempeño de la IA y actúa como la columna vertebral del data center para aprovechar el poder de la IA generativa.

Aprenda Sobre la Plataforma Spectrum-X Ethernet

La plataforma Spectrum-X Ethernet, que cuenta con el switch NVIDIA Spectrum-X™ Ethernet, está diseñada específicamente para mejorar el desempeño y la eficiencia de la infraestructura de IA basada en Ethernet.