NVIDIA Unified Fabric Manager (UFM)

Explora las plataformas de administración de redes para el análisis y la inteligencia cibernética.

Las plataformas NVIDIA® UFM® revolucionan la administración de redes de data centers mediante la combinación de la telemetría de red mejorada en tiempo real con la inteligencia cibernética y el análisis basados en inteligencia artificial para permitir data centers InfiniBand escalables.

 

Administración de Data Centers Más Sencilla

Las plataformas de UFM permiten a los operadores de data centers industriales y de investigación aprovisionar, monitorear, administrar, resolver problemas y mantener la estructura del data center moderno de manera eficiente y preventiva. Las plataformas UFM abarcan múltiples niveles de soluciones y un conjunto integral de funciones para cumplir con la gama más amplias de requisitos del data center moderno y escalable. Con UFM, puedes aumentar la utilización de los recursos de la estructura y lograr una ventaja competitiva, al mismo tiempo que reduces los gastos operativos.

Las plataformas UFM cuentan con robustas interfaces de usuario gráficas (GUI)

Las plataformas UFM cuentan con robustas interfaces de usuario gráficas (GUI).

Descubra lo fácil que es gestionar, supervisar y mantener su data center InfiniBand con una prueba gratuita de 60 días del software UFM Enterprise.

Aspectos Destacados

Plataformas UFM

Telemetría de UFM: monitoreo en tiempo real

UFM Telemetry
Monitoreo en Tiempo Real

La plataforma UFM Telemetry proporciona herramientas de validación de redes para monitorear las condiciones y el rendimiento de las redes. Para lograrlo, captura y transmite en tiempo real información detallada sobre la telemetría de las redes, el uso de las cargas de trabajo de las aplicaciones y la configuración del sistema a una base de datos en cloud y en las instalaciones para que se analice posteriormente.

 

Plataforma: Contenedores de software o dispositivos dedicados

 

Funciones claves:

  • Telemetría de switches, adaptadores y cables

  • Validación de sistemas

  • Pruebas de rendimiento de redes

  • Transmisión de la información de la telemetría hacia la base de datos en cloud y en las instalaciones

UFM Enterprise: control y visibilidad de la estructura

UFM Enterprise
Visibilidad y Control de la Estructura

La plataforma UFM Enterprise combina los beneficios de UFM Telemetry con la administración y el monitoreo de redes mejorados. Realiza tareas automáticas de descubrimiento de congestiones, monitoreo de tráfico, y aprovisionamiento y descubrimiento de redes. También permite el aprovisionamiento de programación de trabajos y se integra con programadores de trabajos líderes en la industria y administradores de clouds y clústeres, incluidos Slurm y Platform Load Sharing Facility (LSF). 

 

Plataformas: Contenedores de software o dispositivos dedicados

 

Funciones claves:

  • Incluye funciones de UFM Telemetry

  • Validación y descubrimiento automatizados de redes

  • Administración segura de cables

  • Seguimiento de congestiones para identificar cuellos de botella en el tráfico

  • Identificación y resolución de problemas

  • Actualizaciones de software globales

  • Aaprovisionamiento de programadores de trabajos, integrado con Slurm y Plataforma LSF

  • API de informes avanzados y Transferencia de Estado Representacional (REST) integral

  • GUI detallada basada en la web

UFM Cyber-AI: Análisis e Inteligencia Cibernética

UFM Cyber-AI
Análisis e Inteligencia Cibernética

La plataforma UFM Cyber-AI potencia los beneficios de UFM Telemetry y UFM Enterprise, a fin de proporcionar ciberseguridad y mantenimiento preventivo para reducir los costos operativos de la supercomputación.

 

Plataforma: Dispositivo UFM Cyber-AI dedicado en las instalaciones

 

Funciones claves:

  • Incluye las funciones de UFM Telemetry y UFM Enterprise

  • Detecta problemas de rendimiento o cambios en el perfil de uso a lo largo del tiempo

  • Detecta comportamiento de clústeres anormal

  • Usa la IA para realizar correcciones entre fenómenos (que parecen no estar relacionados)  

  • Envía alertas cuando se necesita mantenimiento preventivo

  • Optimiza la predictibilidad con la recolección continua de datos del sistema

Servicios Adicionales

Cuidados de Redes de NVIDIA: Servicios de Monitoreo y de Centro de Operaciones de Red (NOC)

Cuidados de Redes de NVIDIA: Servicios de Monitoreo y de Centro de Operaciones de Red (NOC)

El análisis periódico del rendimiento es fundamental para garantizar que tu solución de redes de NVIDIA esté alineada con tus objetivos comerciales y tecnologías más recientes. Nuestros servicios de monitoreo y de NOC examinan continuamente tu solución para detectar posibles fallas antes de que ocurran, lo que le permite identificar y resolver situaciones antes de que se conviertan en problemas para brindarte tranquilidad. El resultado final es un ROI más alto y costos de mantenimiento del sistema más bajos.

 

Recursos

Descubre la forma de crear la red más eficiente y de alto rendimiento.

Configura un Clúster

Realiza Cursos sobre Redes

¿Estás Listo para Comprar?