NVIDIA Unified Fabric Manager (UFM)

Explore as plataformas de gerenciamento de rede para inteligência e análise cibernéticas.

As plataformas NVIDIA® UFM® revolucionarão o gerenciamento da rede do data center, unindo a telemetria de rede avançada em tempo real à inteligência e à análise cibernéticas com tecnologia fornecida por AI para oferecer suporte a data centers InfiniBand de escalabilidade horizontal.

 

Facilidade no Gerenciamento de Data Centers

As plataformas UFM permitem que os operadores de data centers industriais e de pesquisa provisionem, monitorem, gerenciem, solucionem problemas e façam a manutenção preventiva do fabric do data center InfiniBand. Elas têm vários níveis de soluções e um amplo conjunto de recursos para atender aos diversos requisitos do data center moderno de escalabilidade horizontal. Com a UFM, você pode usar melhor os recursos do fabric e ganhar uma vantagem competitiva, além de reduzir os custos operacionais.

As plataformas UFM contam com interfaces de usuário gráficas (GUIs - Graphic User Interfaces) robustas.

As plataformas UFM contam com interfaces de usuário gráficas (GUIs - Graphic User Interfaces) robustas.

Destaques

Plataformas UFM

Telemetria UFM: monitoramento em tempo real

Telemetria UFM
Monitoramento em Tempo Real

A plataforma de Telemetria UFM oferece ferramentas de validação de rede para monitorar o desempenho e as condições da rede, capturando e fazendo streaming de informações avançadas de telemetria de rede em tempo real, uso de carga de trabalho de aplicações e configuração de sistema para um banco de dados no local ou no cloud para análise mais detalhada.

 

Plataformas: Contêineres de aplicações ou dispositivos dedicados

 

Principais recursos:

  • Telemetria de switches, adaptadores e cabos

  • Validação do sistema

  • Testes de desempenho de rede

  • Streaming de informações de telemetria para bancos de dados no local ou baseados no cloud

UFM Enterprise: visibilidade e controle do fabric

UFM Enterprise
Visibilidade e Controle do Fabric

A plataforma UFM Enterprise reúne os benefícios da Telemtria UFM com monitoramento e gerenciamento aprimorados da rede. Ela realiza a identificação e o provisionamento automatizados da rede, o monitoramento do tráfego e a identificação de congestionamentos. Além disso, ela permite o provisionamento do agendamento de tarefas e se integra aos principais agendadores de tarefas do setor e gerentes de clouds e clusters, como o Slurm e o plataforma Load Sharing Facility (LSF). 

 

Plataformas: Contêineres de software ou dispositivos dedicados

 

Principais recursos:

  • Inclui recursos da Telemetria UFM

  • Descoberta e validação de rede automatizadas

  • Gerenciamento seguro de cabos

  • Rastreamento de congestionamento para identificar gargalos de tráfego

  • Identificação e resolução de problemas

  • Atualizações globais de software

  • Provisionamento de agendador de trabalho, integrado com Slurm e Plataforma LSF

  • Relatórios avançados e APIs abrangentes de transferência de estado representacional (REST - Representational State Transfer)

  • GUI avançada e baseada na web

UFM Cyber-AI: Inteligência e Análise Cibernéticas

UFM Cyber-AI
Inteligência e Análise Cibernéticas

A plataforma UFM Cyber-AI aprimora as vantagens da Telemetria UFM e da UFM Enterprise, fornecendo manutenção preventiva e segurança cibernética para reduzir os custos operacionais de supercomputação.

 

Plataforma: Dispositivo UFM Cyber-AI dedicado no local

 

Principais recursos:

  • Vem com os recursos da Telemetria UFM e da UFM Enterprise

  • Detecta degradações do desempenho ou alterações no perfil de uso ao longo do tempo

  • Detecta comportamento anormal de cluster

  • Usa AI para fazer correlações entre fenômenos (que podem parecer não relacionados) 

  • Alerta quando a manutenção preventiva é necessária

  • Otimiza a previsibilidade com a coleta contínua de dados do sistema

Serviços Adicionais

NVIDIA Networking Care: Serviços de Monitoramento e do Centro de Operações de Rede (NOC)

NVIDIA Networking Care: Serviços de Monitoramento e do Centro de Operações de Rede (NOC - Network Operations Center)

A análise periódica do desempenho é essencial para garantir que sua solução de rede NVIDIA esteja alinhada aos objetivos da empresa e às tecnologias mais atuais. Nossos serviços de monitoramento e do NOC analisam continuamente a solução para identificar possíveis falhas antes que elas ocorram, detectando e solucionando problemas antes que se agravem, o que proporciona a você mais tranquilidade. Com isso, o ROI aumenta e os custos de manutenção do sistema diminuem.

 

Recursos

Veja como criar a rede de alto desempenho mais eficiente.

Configure Seu Cluster

Faça Cursos sobre Redes

Pronto para Comprar?