Verwandeln Sie mit NVIDIA Enterprise-Referenzarchitekturen Ihr Rechenzentrum in eine leistungsstarke KI-Fabrik.
Überblick
NVIDIA Enterprise-Referenzarchitekturen (Enterprise RAs) ermöglichen es Unternehmen, leistungsstarke KI-Fabriken mithilfe einer validierten, reproduzierbaren Infrastruktur zu entwerfen, bereitzustellen und zu skalieren. Diese Designs kombinieren zertifizierte Rechenleistung, Hochgeschwindigkeits-Ost-West- und Nord-Süd-Netzwerke, Beobachtbarkeitstools und Software, um eine skalierbare Leistung von Clustern mit vier Knoten bis hin zu Umgebungen im Unternehmensmaßstab zu gewährleisten.
NVIDIA Enterprise-Referenzarchitekturen
Ab sofort sind umfassende Anleitungen für das Einrichten von Clustern im Rechenzentrum verfügbar.
Anwendungsbeispiele
Beschleunigen Sie agentische KI, physische KI, High-Performance-Computing (HPC) und KI-Simulations-Workloads mit bewährten NVIDIA Enterprise-Referenzarchitekturen und NVIDIA-zertifizierten Systemen von globalen Partnern. Die primären Infrastruktur-Cluster-Konfigurationen für die Bereitstellung von Unternehmens-KI-Fabriken sind nachfolgend beschrieben.
Die NVIDIA RTX PRO™ AI Factory-Konfiguration wurde für ein breites Spektrum von Unternehmens-Workloads entwickelt, darunter generative und agentische KI, Datenanalyse, Visual Computing und technische Simulation. Bereitstellungen sind um 16- und 32-Knoten-Designpunkte herum optimiert und bieten eine ideale Balance aus Leistung, Skalierbarkeit und Bereitstellungseffizienz. NVIDIA RTX PRO-Server wurden für eine universelle Workload-Beschleunigung in den Bereichen Unternehmens-KI, Simulation und Visual Computing entwickelt und sind für PCIe-Umgebungen optimiert, sodass sie ideal für Rechenzentren mit begrenztem Platz-, Energie- und Kühlungsbedarf sind. Sie wurden speziell für moderne KI-Workloads entwickelt und bieten eine effiziente Leistung für agentische KI und Inferenz großer Sprachmodelle (LLM).
Die leistungsstarke NVIDIA HGX™ AI Factory-Konfiguration wurde speziell für KI-Training und Inferenz mit mehreren Knoten in großem Maßstab entwickelt und nutzt NVIDIA HGX-Systeme. Die Architektur ist in Designpunkten mit 32, 64 und 128 Knoten verfügbar und von NVIDIA Spectrum-X-Netzwerken unterstützt. Sie verfügt über ein flexibles, Rail-optimiertes Design, das eine effiziente Integration in verschiedene Rack-Layouts ermöglicht und gleichzeitig einen hohen Durchsatz und eine Leistung mit geringer Latenz bietet. Sie bietet bahnbrechende Leistung für erfahrene KI-Benutzer, die die anspruchsvollsten Workloads ausführen, ermöglicht das Training und die Feinabstimmung großer Modelle und beschleunigt die Inferenz erheblich. Mit Genauigkeit der nächsten Generation und ultraschnellen Verbindungen erzielt die Lösung einen bis zu 15-mal höheren Token-Durchsatz.
Die NVIDIA NVL72 AI Factory-Konfiguration wurde für das Trainieren und Bereitstellen von Modellen mit Billionen Parametern entwickelt und bietet Exascale-Rechenleistung innerhalb eines einzigen Racks. Es wurde für einen hohen Modelldurchsatz, Multi-Benutzer-Inferenz und Echtzeit-Inferenz in großem Maßstab entwickelt und ermöglicht die nächste Generation KI-gestützter Innovationen. Die Schwerpunkte des Bereitstellungsdesigns liegen auf Konfigurationen mit vier und acht Racks. Die Architektur basiert auf einem flexiblen, Rail-optimierten Netzwerk und passt sich verschiedenen Rack-Layouts und Systemdesigns an, während sie gleichzeitig eine Leistung mit hoher Bandbreite und geringer Latenz bietet. Die Plattform bietet eine außergewöhnliche KI-Fabrik-Leistung mit branchenführender Energieeffizienz und wird von NVIDIA NVLink™ der fünften Generation, FP4-Tensor-Recheneinheiten und fortschrittlichen Innovationen in der Kühlung unterstützt.
Vorteile
Erschaffen Sie eine skalierbare, leistungsstarke KI-Infrastruktur mit bewährten, partnerfähigen Konfigurationen.
Erfüllen Sie die intensiven Anforderungen an KI-Inferenz, Feinabstimmung und Training mit Architekturen, die eine vollständige GPU-Auslastung und Leistungskonsistenz über Multi-Knoten-Cluster hinweg gewährleisten.
Erweitern Sie Ihre Infrastruktur ganz einfach und gewährleisten Sie eine skalierbare, optimierte Bereitstellung für bis zu 128 Knoten. Legen Sie die Grundlage für Full-Stack-Lösungen mit dem validierten Design der NVIDIA Unternehmens-KI Factory, das unser Software-Ökosystem nutzt.
Vereinfachen Sie Bereitstellungsprozesse und effiziente Designs, reduzieren Sie Komplexität und Gesamtbetriebskosten (TCO) und verkürzen Sie gleichzeitig die Zeit bis zur Wertschöpfung.
Befolgen Sie bestimmte, standardisierte Designmuster, um einen konsistenten Betrieb von einer Installation zur nächsten zu erreichen, den Bedarf an häufigem Support zu reduzieren und schnellere Lösungszeiten zu ermöglichen.
Partner
Wir sind stolz darauf, mit führenden Partnern zusammenzuarbeiten, die Unternehmens-Referenzarchitekturen und KI-Fabrik-Lösungen auf den Markt bringen. Von NVIDIA validierte Designs dieser Partner haben unser Design Review Board bestanden und bieten Anleitungen, die unsere Unterstützung in einer oder mehreren der folgenden Kategorien erhalten: Infrastruktur, Netzwerklogik und Software.
Die Referenzarchitektur des Palantir Sovereign AI-Betriebssystems basiert auf NVIDIA Enterprise RAs, die getestet und für den Betrieb der gesamten Palantir Software-Suite auf der NVIDIA AI-Infrastruktur mit unseren globalen Systempartnern qualifiziert wurden. Diese souveräne KI-Architektur ist für Kunden mit latenzsensiblen Workflows, Anforderungen an die Datensouveränität und hoher geografischer Verteilung wichtig. Die Architektur bietet Unternehmen die vollständige Kontrolle über ihre Daten, KI-Modelle und Anwendungen.
Ressourcen
NVIDIA hat eine einheitliche KI-Fabrik aufgebaut, um generative KI und agentische Workflows unternehmensweit zu skalieren und dabei Sicherheit, Leistung und Konsistenz zu gewährleisten. Die Plattform unterstützt Hunderte von KI-Agenten, die Innovationen beschleunigen, die Software- und Hardwareentwicklung optimieren und den Lieferkettenbetrieb optimieren. Dadurch werden die Planungszeiten um über 95 Prozent reduziert und in nur einem Jahr Entwicklungsarbeit im Umfang von mehreren Jahrzehnten geleistet werden kann.