NVIDIA Unified Fabric Manager (UFM)

Entdecken Sie die Netzwerkmanagement-Plattformen für Cyber Intelligence und Analysen.

Die NVIDIA® UFM®-Plattformen revolutionieren das Netzwerkmanagement im Rechenzentrum durch die Kombination verbesserter Echtzeit-Netzwerktelemetrie mit KI-gestützter Cyber Intelligence und Analysen zur Unterstützung skalierungsfähiger InfiniBand-Rechenzentren.

 

Rechenzentrumsmanagement leicht gemacht

UFM-Plattformen ermöglichen Betreibern von Rechenzentren in der Forschung und Industrie eine effiziente Bereitstellung, Überwachung, Verwaltung, präventive Fehlersuche und Wartung ihrer InfiniBand-Rechenzentrumsstruktur. UFM-Plattformen bieten mehrere Lösungsebenen und einen umfassenden Funktionsumfang, um eine breite Palette von Anforderungen moderner skalierungsfähiger Rechenzentren zu erfüllen. Mit UFM können Sie eine höhere Nutzung von Fabric-Ressourcen erreichen und einen Wettbewerbsvorteil erzielen, während Sie gleichzeitig die Betriebskosten reduzieren.

UFM-Plattformen bieten robuste grafische Benutzeroberflächen (GUIs)

UFM-Plattformen bieten robuste grafische Benutzeroberflächen (GUIs).

Highlights

UFM-Plattformen

UFM-Telemetrie: Echtzeitüberwachung

UFM-Telemetrie
Echtzeit-Überwachung

Die UFM-Telemetrieplattform bietet Netzwerkvalidierungstools zur Überwachung von Netzwerkleistung und -bedingungen. Sie erfasst und streamt umfangreiche Echtzeit-Netzwerktelemetrieinformationen, Anwendungs-Workloadnutzung und Systemkonfiguration in eine lokale oder cloudbasierte Datenbank zur weiteren Analyse.

 

Plattformen: Softwarecontainer oder dedizierte Appliances

 

Wichtigste Features:

  • Telemetrie für Switches, Adapter und Kabel

  • Systemvalidierung

  • Netzwerkleistungstests

  • Streaming von Telemetrieinformationen in eine lokale oder cloudbasierte Datenbank

UFM Enterprise: Transparenz und Kontrolle von Fabrics

UFM Enterprise
Transparenz und Kontrolle von Fabrics

Die UFM Enterprise-Plattform kombiniert die Vorteile der UFM-Telemetrie mit verbesserter Netzwerküberwachung und -verwaltung. Sie führt eine automatisierte Netzwerkerkennung und -bereitstellung, Datenverkehrsüberwachung und Überlastungserkennung durch. Sie ermöglicht außerdem die Job-Planung und lässt sich in branchenführende Job Scheduler sowie Cloud- und Cluster-Manager integrieren, einschließlich Slurm und Platform Load Sharing Facility (LSF). 

 

Plattformen: Softwarecontainer oder dedizierte Appliances

 

Wichtigste Features:

  • Enthält UFM-Telemetriefunktionen

  • Automatisierte Netzwerkerkennung und -validierung

  • Sicheres Kabelmanagement

  • Überlastungsverfolgung zur Identifizierung von Datenverkehrsengpässen

  • Problemidentifikation und -lösung

  • Globale Software-Updates

  • Job Scheduler-Bereitstellung, Integration von Slurm und Platform LSF

  • Erweiterte Berichterstellung und umfassende REST-APIs (Representational State Transfer)

  • Umfangreiche webbasierte GUI

UFM-Cyber-KI: Cyber Intelligence und Analysen

UFM-Cyber-KI
Cyber Intelligence und Analysen

Die UFM-Cyber-KI-Plattform erweitert die Vorteile von UFM-Telemetrie und UFM Enterprise und ermöglicht präventive Wartung und Cybersicherheit zur Senkung der Supercomputing-Betriebskosten.

 

Plattform: Dedizierte UFM-Cyber-KI-Appliance vor Ort

 

Wichtigste Features:

  • Enthält UFM-Telemetrie- und UFM Enterprise-Funktionen

  • Erkennt Leistungseinbußen oder Änderungen des Nutzungsprofils im Laufe der Zeit

  • Erkennt abnormales Clusterverhalten

  • Verwendet KI zur Herstellung von Korrelationen zwischen Ereignissen (die scheinbar nichts miteinander zu tun haben) 

  • Warnt, wenn präventive Wartung erforderlich ist

  • Optimiert die Vorhersagbarkeit durch kontinuierliche Systemdatenerfassung

Zusätzliche Dienste

NVIDIA Networking Care – Überwachungs- und Network Operations Center (NOC)-Dienste

NVIDIA Networking Care – Überwachungs- und Network Operations Center (NOC)-Dienste

Eine regelmäßige Leistungsanalyse ist unerlässlich, um sicherzustellen, dass Ihre NVIDIA-Netzwerklösung auf Ihre Geschäftsziele und die neuesten Technologien abgestimmt ist. Unsere Überwachungs- und NOC-Dienste untersuchen Ihre Lösung kontinuierlich, um mögliche Fehler zu erkennen, noch bevor sie auftreten. Sie geben Ihnen Sicherheit, indem sie kleine Fehler identifizieren und beheben, bevor sie zu ernsthaften Problemen werden. Das Endergebnis umfasst einen höheren ROI und niedrigere Systemwartungskosten.

 

Ressourcen

Erfahren Sie, wie Sie ein effizientes Hochleistungsnetzwerk aufbauen können.

Ihr Cluster konfigurieren

Netzwerkkurse besuchen

Konnten wir Sie überzeugen?