NVIDIA Unified Fabric Manager (UFM)

Esplora le piattaforme di gestione della rete per l’intelligenza informatica e l’analisi.

Le piattaforme NVIDIA® UFM®  rivoluzionano la gestione di rete nel data center, combinando la telemetria di rete avanzata e in tempo reale con intelligenza informatica basata su IA e analisi per supportare i data center scale-out InfiniBand.

 

Gestione dei data center semplificata

Le piattaforme UFM consentono agli operatori di ricerca e data center industriali di eseguire in modo efficiente, monitorare, gestire, risolvere i problemi e mantenere preventivamente i fabric dei data center InfiniBand. Le piattaforme UFM comprendono più livelli di soluzioni e un set di funzionalità completo per soddisfare la più ampia gamma di requisiti moderni del data center a scalabilità orizzontale. Utilizzando UFM, è possibile sfruttare maggiormente le risorse del fabric e ottenere un vantaggio competitivo, riducendo al contempo i costi operativi.

Le piattaforme UFM sono dotate di robuste interfacce utente grafiche (GUI)

Le piattaforme UFM sono dotate di robuste interfacce utente grafiche (GUI).

In evidenza

Piattaforme UFM

Telemetria UFM: monitoraggio in tempo reale

Telemetria UFM
Monitoraggio in tempo reale

La piattaforma di telemetria UFM fornisce strumenti di convalida della rete per monitorare le prestazioni e le condizioni, acquisire e trasmettere informazioni di telemetria complete in tempo reale, utilizzo del carico di lavoro dell'applicazione e configurazione del sistema in un database locale o basato su cloud per ulteriori analisi.

 

Piattaforme: contenitori software o appliance dedicati

 

Principali caratteristiche:

  • Telemetria di switch, adattatori e cavi

  • Convalida del sistema

  • Test delle prestazioni di rete

  • Flusso di informazioni di telemetria in database locale o basato su cloud

UFM Enterprise: visibilità e controllo del fabric

UFM Enterprise
Visibilità e controllo del fabric

La piattaforma UFM Enterprise combina i vantaggi della telemetria UFM con un monitoraggio e una gestione della rete avanzati. Esegue l'individuazione e il provisioning automatizzati della rete, il monitoraggio del traffico e l'individuazione delle congestioni. Consente inoltre il provisioning della pianificazione del lavoro e si integra con le relative utilità di pianificazione leader del settore e i gestori cloud, inclusi Slurm e Platform Load Sharing Facility (LSF). 

 

Piattaforme: contenitori software o appliance dedicati

 

Principali caratteristiche:

  • Include funzionalità di telemetria UFM

  • Individuazione e convalida automatizzate della rete

  • Gestione sicura dei cavi

  • Monitoraggio della congestione per identificare i colli di bottiglia del traffico

  • Identificazione e risoluzione dei problemi

  • Aggiornamenti software globali

  • Provisioning della pianificazione dei lavori, integrato con Slurm e Platform LSF

  • Report avanzati e API REST (Representational State Transfer) complete

  • GUI ricca basata sul Web

UFM Cyber-AI: intelligenza informatica e analisi

UFM Cyber-AI
Intelligenza informatica e analisi

La piattaforma UFM Cyber-AI migliora i vantaggi della telemetria di UFM e UFM Enterprise, fornendo manutenzione preventiva e sicurezza informatica per ridurre i costi operativi del supercomputing.

 

Piattaforma: appliance UFM Cyber-AI opzionale dedicato in loco

 

Principali caratteristiche:

  • Include le funzionalità di telemetria UFM e UFM Enterprise

  • Rileva le riduzioni delle prestazioni o le modifiche del profilo di utilizzo nel tempo

  • Rileva il comportamento anomalo del cluster

  • Utilizza l'intelligenza artificiale per stabilire correlazioni tra fenomeni (che possono sembrare non correlati) 

  • Avvisa quando è necessaria la manutenzione preventiva

  • Ottimizza la prevedibilità con la raccolta continua dei dati di sistema

Servizi aggiuntivi

NVIDIA Net Working Care - Servizi di monitoraggio e NOC (centro operazioni di rete)

NVIDIA Networking Care - Servizi di monitoraggio e NOC (centro operazioni di rete)

Un'analisi regolare delle prestazioni è essenziale per garantire che la soluzione di rete NVIDIA sia allineata con gli obiettivi aziendali e le tecnologie più recenti. I nostri servizi di monitoraggio e NOC esaminano continuamente la tua soluzione alla ricerca di eventuali guasti prima che si verifichino, dandoti tranquillità identificando e affrontando i problemi prima che sorgano. Il risultato finale è un ROI più elevato e minori costi di manutenzione del sistema.

 

Risorse

Scopri come creare la rete più efficiente e ad alte prestazioni.

Configura il tuo cluster

Segui i corsi di networking

Pronto per acquistare?