Skalieren Sie KI-native Anwendungen, indem Sie Workloads über eine geografisch verteilte KI-Infrastruktur hinweg orchestrieren.
Überblick
Moderne KI-Anwendungen sind in Echtzeit, hyper-personalisiert und datenintensiv und dienen Millionen von Benutzern, Agenten und Maschinen weltweit. Telekommunikationsbetreiber sind in der einzigartigen Position, um dieser Nachfrage gerecht zu werden, indem sie ihre bestehende Infrastruktur in KI-Netzwerke umwandeln und KI dort einsetzen, wo Intelligenz eingesetzt wird.
Ein KI-Raster ist eine verteilte, miteinander verbundene und orchestrierte KI-Infrastrukturplattform, die jeden Workload dort ausführt, wo er die beste Leistung bietet. Es verbindet KI-Fabriken mit regionalen Hubs und Edge-Standorten, sodass Daten, Modelle und Agenten sicher über verteilte Standorte hinweg übertragen werden können, die als einheitliches System betrieben werden.
NVIDIA bietet den beschleunigten Computing-, Netzwerk- und Software-Stack, der KI-Netze unterstützt, und hilft Betreibern, schnell verteilte KI-Kapazität zu erschließen und neue KI-native Erlebnisse zu ermöglichen.
Sorgen Sie dafür, dass KI-native Dienste reaktionsschnell bleiben, indem Sie Inferenz auf der Infrastruktur ausführen, die den Benutzern, Agenten und Maschinen am nächsten ist. Dies hilft Betreibern, strenge Service-Level-Vereinbarungen (SLAs) für Sprach-, Vision- und Steuerungserlebnisse in Echtzeit zu erfüllen.
Führen Sie tokenintensive Workloads auf Knoten mit der kosteneffizientesten Rechen- und Netzwerktechnik aus, wodurch das Datenvolumen über das Netzwerk reduziert und die Egress-Kosten gesenkt werden, ohne die Servicequalität zu beeinträchtigen.
Behandeln Sie viele verteilte Standorte als einen einzigen Pool von KI-Kapazitäten, um die GPU-Auslastung zu erhöhen und ungenutzte Ressourcen zu reduzieren. Wenn ein Standort ausfällt, werden Workloads automatisch über das gesamte Netzwerk hinweg neu ausgeglichen, um die Service-Kontinuität aufrechtzuerhalten.
Führen Sie KI-native Dienste an vielen verteilten Standorten aus, um einen massiven Anstieg der Anzahl gleichzeitiger Benutzer, Anwendungen und Agenten zu bewältigen und gleichzeitig eine konsistente Quality of Experience und Kosten zu gewährleisten.
NVIDIA bietet eine einheitliche Plattform, um verteilte Standorte mit einer Full-Stack-KI-Infrastruktur auszustatten und sie in verbundene, orchestrierte KI-Netze umzuwandeln.
Erfahren Sie, wie NVIDIA-gestützte KI-Gitter eine neue Klasse von KI-nativen Anwendungen ermöglichen, die einen Echtzeit- und kosteneffizienten Zugriff auf Intelligenz in großem Maßstab erfordern.
Physische KI ermöglicht es Robotern, Fahrzeugen, Kameras und IoT-Systemen, die physische Welt wahrzunehmen, zu analysieren und in ihr zu handeln. Mithilfe von KI-Rastern kann NVIDIA Metropolis Vision-KI im städtischen Maßstab für Echtzeitanalysen in der Nähe von Kameras ausführen, während autonome Roboter aufwändige Planung und Schlussfolgerung an nahe gelegene Standorte auslagern, wenn die eingebettete Rechenleistung nicht ausreichend ist.
Interaktive KI-Dienste wie Gesprächs-KI-Assistenten sind auf eine enge End-to-End-Latenz und Jitter-Kontrolle angewiesen, um sich natürlich und reaktionsschnell anzufühlen. KI-Netze führen diese Workloads auf Knoten aus, die physisch in der Nähe der Daten liegen. Dabei bleiben Latenzspielräume erhalten und jede Anforderung wird an die besten verfügbaren Ressourcen weitergeleitet, selbst bei Nachfragespitzen oder teilweisen Ausfällen.
Personalisierte KI-Assistenten, Medien- und Sporterlebnisse sowie Unternehmensanwendungen müssen Antworten in Echtzeit an Tausende oder Millionen gleichzeitiger Sitzungen anpassen. In einem KI-Netzwerk können Betreiber den Benutzer- oder Mandantenkontext auf regionalen Knoten zwischenspeichern und die Personalisierungslogik und -generierung näher an den Benutzern ausführen. Dadurch wird die Tail-Latenz verbessert und gleichzeitig die Wirtschaftlichkeit der stets aktiven Personalisierung nachhaltig gewährleistet.
Netzwerk-Workloads wie RAN, Verkehrssteuerung und Optimierung auf Benutzerebene setzen zunehmend auf KI, um Flüsse zu analysieren und Entscheidungen in Echtzeit zu treffen. KI-Netze führen diese KI-nativen Netzwerkfunktionen auf derselben verteilten Infrastruktur wie Anwendungen aus. Dadurch werden die Auslastung verbessert und ein intelligenteres Routing, die Durchsetzung von Richtlinien und das Nutzererlebnis im gesamten Netzwerk ermöglicht.
Nächste Schritte