This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

Cloud-natives Supercomputing

Sicher, mandantenfähig, Bare-Metal

Performance für KI, Datenanalysen,
HPC-Anwendungen.

STARTER-KIT

Bare-Metal-Performance mit Mandantenisolation

Cloud-natives Supercomputing verbindet die Leistung von High Performance Computing mit der Sicherheit und Benutzerfreundlichkeit von Cloud Computing-Diensten. Die Cloud-native Supercomputing-Plattform von NVIDIA nutzt die Architektur der NVIDIA^® BlueField^®-Datenverarbeitungseinheit (DPU) mit leistungsstarken und latenzarmen NVIDIA Quantum InfiniBand-Netzwerken, um Bare-Metal-Leistung, Benutzerverwaltung und -Isolation, Datenschutz und auf Abruf High Performance Computing (HPC) sowie KI-Dienste zu bieten – einfach und sicher.

Technische Übersicht herunterladen

Innovation für das nächste Jahrzehnt und darüber hinaus

Die Cloud-native Supercomputing-Plattform

Um maximale Leistung zu bieten, müssen Supercomputer Sicherheit für mehrere Mandanten bieten – was idealerweise durch Cloud-native Plattformen erreicht wird. Das Schlüsselelement, das diesen Architekturübergang ermöglicht, ist die DPU.

Als vollständig integrierte Rechenzentrum-on–a-Chip-Plattform kann die DPU die Rechenzentrumsinfrastruktur anstelle des Hostprozessors entlasten und verwalten, was Sicherheit und Orchestrierung des Supercomputers ermöglicht.

In Kombination mit NVIDIA Quantum InfiniBand-Switching bietet diese Architektur optimale Bare-Metal-Performance und unterstützt gleichzeitig die Isolation von Mandanten mit mehreren Knoten.

Hin zu einer Zero-Trust-Architektur

Cloud-native Supercomputing-Systeme wurden entwickelt, um maximale Leistung, Sicherheit und Orchestrierung in einer Umgebung mit mehreren Mandanten zu bieten.

Die BlueField-DPU kann nicht vertrauenswürdige Mandanten mit mehreren Knoten hosten und gleichzeitig sicherstellen, dass Supercomputing-Ressourcen sauber und ohne vorherige Residuen für neue Mandanten bereitgestellt werden. Um dies zu erreichen, stellt die BlueField DPU ein sauberes Boot-Image für einen neu geplanten Mandanten bereit, führt eine vollständige Bereinigung und Wiederherstellung des Vertrauens durch, virtualisiert Speicher und gewährt Zugriff auf genehmigte Speicherbereiche.

Beschleunigung der Anwendungsleistung

HPC- und KI-Kommunikationsframeworks und -Bibliotheken sind latenz- und bandbreitenempfindlich und spielen eine entscheidende Rolle für die Anwendungsleistung.

Durch das Auslagern der Bibliotheken von der Host-CPU oder -GPU auf die Bluefield-DPU entsteht der höchste Überlappungsgrad für das parallele Fortschreiten von Kommunikation und Berechnung. So werden auch die negativen Auswirkungen von Schwankungen des Betriebssystems reduziert und die Anwendungsleistung drastisch erhöht. Dies ist der Schlüssel zur nächsten Generation der Supercomputing-Architektur.

Frühe Forschungsergebnisse der Ohio State University zeigen, dass Cloud-native Supercomputer HPC-Aufträge 1,3-mal schneller ausführen können als herkömmliche.

DPU bietet 1,3-mal höhere Leistungsbeschleunigung für P3DFFT

¹ Die Leistungstests wurden von der Ohio State University im Cluster Center des HPC-AI Advisory Council mit der folgenden Systemkonfiguration durchgeführt: 32 Server mit Intel Xeon 16-Core-CPUs E5-2697A V4 mit 2,60 GHz (insgesamt 32 Prozessoren pro Knoten), 256 GB DDR4 2400 MHz RDIMMs-Speicher und 1 TB SATA 2,5"-Festplatten mit 7200 U/min pro Knoten. Die Server wurden mit NVIDIA BlueField-2 InfiniBand HDR100 DPUs und einem NVIDIA Quantum QM7800 40-Port HDR 200 Gb/s InfiniBand Switch verbunden.

NVIDIA Cloud-nativer Supercomputer bietet Bare-Metal-Leistung

Leistungsisolierung

Die NVIDIA Quantum-2 InfiniBand-Plattform bietet innovative proaktive Überwachung und Überlastungsmanagement, um Datenverkehrsisolationen bereitzustellen, Leistungsjitter nahezu zu eliminieren und eine vorhersagegesteuerte Leistung zu gewährleisten, ganz als ob die Anwendung auf einem dedizierten System ausgeführt würde.

Cloud-native Supercomputing-Plattform

NVIDIA Bluefield

Die NVIDIA BlueField-DPU vereint branchenführende NVIDIA ConnectX^®-Netzwerkadapter, eine breite Auswahl an Arm-Kernen mit PCIe-Subsystem und speziell gebaute HPC-Hardwarebeschleunigungs-Engines, um vollständige Programmierbarkeit der Rechenzentrumsinfrastruktur-on-a-Chip zu bieten.

InfiniBand

NVIDIA Quantum InfiniBand-Netzwerke beschleunigen und entlasten Datentransfers, um sicherzustellen, dass die Rechenressourcen nicht aufgrund fehlender Daten oder Bandbreite warten müssen. Das NVIDIA Quantum InfiniBand-Netzwerk kann zwischen verschiedenen Benutzern oder Mandanten partitioniert werden, was Sicherheit und Servicequalität garantiert.

DOCA

Das NVIDIA DOCA-SDK ermöglicht Infrastrukturentwicklern die schnelle Erstellung von Netzwerk-, Speicher-, Sicherheits-, Verwaltungs- und KI- sowie HPC-Anwendungen und -Diensten, zusätzlich zur NVIDIA BlueField-DPU, und nutzt dabei branchenübliche APIs. Mit DOCA können Entwickler die Supercomputing-Infrastruktur von morgen programmieren, indem sie leistungsstarke, softwaredefinierte und Cloud-native DPU-beschleunigte Dienste erstellen.

Magnum IO

Das NVIDIA MAGNUM IO™ Software Development Kit (SDK) ermöglicht es Entwicklern, die Eingabe und Ausgabe (IO) von Anwendungen zu optimieren und so die Ende-zu-Ende-Zeit ihrer Workflows zu reduzieren.

Magnum IO deckt alle Aspekte von IO ab, einschließlich Speicher-, Netzwerk-, Multi-GPU- und Multi-Node-Kommunikation. Es enthält auch Tools zur Profilierung und Optimierung von Anwendungen und zur Beseitigung von IO-Engpässen.

Hauptmerkmale

Mandantenisolation, Datenschutz und Sicherheit
Auslagerung von Infrastrukturdiensten
Spezielle Hardware-Engines zur Beschleunigung von Kommunikationsframeworks
Verbesserte Servicequalität (QoS)

Vorteile

Bietet optimale Bare-Metal-Leistung
Erhöht die CPU-Verfügbarkeit, Anwendungsskalierbarkeit und Systemeffizienz
Höhere Rechen- und Kommunikationsüberlappung
Reduzierte Schwankungen bzw. Systemrauschen
Geringere Infrastrukturkosten

Erfahren Sie mehr über Cloud-natives Supercomputing in der technischen Übersicht.

JETZT HERUNTERLADEN