NVIDIA NetQ

Aporte visibilidad holística y en tiempo real, resolución de problemas y DevOps a su red de centros de datos moderna.

Introducción

Operaciones de red de fábrica de IA con NetQ

NVIDIA NetQ™ es un conjunto de herramientas de operaciones de red altamente escalable que proporciona visibilidad, resolución de problemas, correlación y validación de los conmutadores NVIDIA NVLink™ y los tejidos NVIDIA® Cumulus® en tiempo real. NetQ utiliza telemetría y ofrece información procesable sobre el estado de la red de centro de datos, lo que garantiza que el tejido de la red de IA funcione a la perfección.

Descripción

Cómo funciona NetQ

Recopilación, procesamiento y visualización de datos

NetQ utiliza agentes en los conmutadores y hosts para recopilar datos de telemetría en toda la red. Como punto de control central, NetQ almacena y procesa la información para proporcionar información procesable y una visibilidad completa. Su completa interfaz gráfica de usuario (GUI) destaca rápidamente los problemas y alertas, simplificando las operaciones y aumentando la eficiencia.

Ventajas

¿Por qué elegir NetQ para operaciones de red de fábricas de IA?

NetQ es una plataforma de observación holística que admite de forma nativa la telemetría de transmisión para la detección y la generación de informes acelerados por hardware de anomalías en el plano de datos y problemas de red intermitente. Garantiza las redes de mayor rendimiento para el entrenamiento y la inferencia de IA.

Agiliza las mejoras

Experimenta la sencillez de pulsar un botón para gestionar redes con la GUI intuitiva de NetQ.

Obtén inteligencia en tiempo real

Correlaciona la configuración y el estado operativo e identifica y realiza un seguimiento inmediato de los cambios de estado de todo el centro de datos.

Reduce el tiempo de inactividad

Optimiza las operaciones de IA con alertas rápidas, una resolución de problemas más rápida y una detección proactiva.

Corrige más rápido

Detecta estados de red defectuosos y recibe alertas con datos precisos sobre la ubicación del fallo.

Elimina complejidad

Simplifica las operaciones y aumenta la eficiencia del operador al destacar rápidamente problemas mediante visualizaciones y alertas.

Diagnostica las causas principales

Traza rutas de red, reproduce el estado de la red en cualquier momento pasado, revisa los registros de cambios de eventos de todo el entramado y diagnostica la causa principal de las variaciones de estado.

Características principales

Qué obtienes con NetQ

Con la continua integración completa y la funcionalidad de implementación continua (CI/CD), NetQ facilita la administración y el aprovisionamiento de elementos de red dentro de tu tejido de IA con un conjunto completo de capacidades de operaciones, como la visibilidad, la resolución de problemas, la validación, el trazado y la funcionalidad de revisión comparativa.

  • Gestión de redes: acceda a potentes herramientas para gestionar sus entornos NVIDIA Cumulus Linux y NVOS con solo pulsar un botón.
  • Telemetría avanzada: recopile datos en tiempo real que permitan una solución de problemas profunda, visibilidad y flujos de trabajo automatizados desde una sola GUI
  • Captura y comparación: compare fácilmente las configuraciones de red anteriores con las configuraciones después de la realización de cambios en la red para eliminar el riesgo de interrupción.
  • Visibilidad de toda la red: obtenga visualizaciones en tiempo real sobre el estado de la red con la GUI enriquecida de NetQ.
  • Telemetría del flujo: analice los datos de latencia de toda la estructura y regule los datos de ocupación de todas las rutas de un flujo cuádruple o quíntuple para detectar los puntos de congestión.
  • Validación preventiva: reduce los errores manuales antes de que entren en producción.
  • Solución de problemas de diagnóstico: diagnostica la causa raíz de las desviaciones de estado con herramientas de diagnóstico avanzadas.
  • Recopilación de gNMI: utiliza la especificación de interfaz de administración de red (gNMI) de gRPC para transmitir datos de telemetría WJH desde el agente de NetQ.
  • Soporte de RoCE: supervise su acceso remoto a memoria directa (RDMA) a través de Ethernet convergente (RoCE) con NetQ para obtener información práctica sobre su tejido de red de IA.

Recursos

Continúe explorando NetQ

Hoja de datos de NVIDIA NetQ

Obtén más información sobre las características y las ventajas de NetQ, una moderna herramienta de operaciones que ofrece visibilidad holística en tiempo real y solución de problemas de tu red de centros de datos.

Guía del usuario de NVIDIA NetQ

Explore la documentación sobre la implementación, configuración, supervisión y resolución de problemas de su red en su entorno de centros de datos.

Próximos pasos

¿Todo listo para empezar?

Obtenga una prueba gratuita del software de red de NVIDIA

Simule una topología de red totalmente automatizada mediante NVIDIA Air.

Descubra las redes en la era de la IA

La red es la responsable en última instancia del rendimiento de la IA, ya que actúa como eje vertebrador del centro de datos para sacar el máximo provecho de la capacidad de la IA generativa.

Más información sobre la plataforma Ethernet Spectrum-X

La plataforma Spectrum-X Ethernet, que cuenta con el conmutador VIDIA Spectrum-X™ Ethernet, está diseñada específicamente para mejorar el rendimiento y la eficiencia de la infraestructura de IA basada en Ethernet.