KI-Inferenz – die Art und Weise, wie wir KI durch Chatbots, Copilots und kreative Tools erleben – skaliert mit einem doppelt exponentiellen Tempo. Die Akzeptanz durch die Benutzer nimmt immer mehr zu, während die Anzahl der KI-Token, die pro Interaktion generiert werden, aufgrund des Antriebs von agentischen Workflows, langfristigem Schlussfolgern und MoE-Modellen (Mixture-of-Experts) rasant steigt.
Um Inferenz in diesem großen Maßstab zu ermöglichen, bietet NVIDIA eine Architektur im Rechenzentrumsmaßstab mit einem jährlichen Rhythmus. Unser extremes Hardware- und Software-Codesign ermöglicht erhebliche Leistungssprünge, senkt die Kosten pro Token und ermöglicht mehr Umsatz und Gewinn.
NVIDIA Blackwell NVL72 bietet eine mehr als zehnmal bessere Inferenzleistung im Vergleich zu NVIDIA H200 bei einer Vielzahl von MoE-Modellen, einschließlich Kimi K2 Thinking, DeepSeek-R1 und Mistral Large 3.
Die NVIDIA-Inferenzplattform bietet eine Reihe von Vorteilen, die im Think SMART-Framework festgehalten sind – von Skalierbarkeit und Effizienz, multidimensionaler Leistung, Architektur und Software-Codesign bis hin zu ROI-Leistung und einem umfangreichen Technologie-Ökosystem.
NVIDIA Blackwell bietet branchenführende Leistung in verschiedensten Anwendungsfällen und balanciert dabei effektiv mehrere Dimensionen: Durchsatz, Latenz, Intelligenz, Kosten und Energieeffizienz. Für intelligente Mixture-of-Experts-Modelle wie Kimi K2 Thinking, DeepSeek-R1 und Mistral Large 3 können Benutzer auf NVIDIA Blackwell NVL72 im Vergleich zu H200 eine bis zu zehnfach schnellere Leistung erzielen.
NVIDIA Blackwell NVL72 liefert ein Zehntel der Kosten pro Token für MoE-Modelle. Leistung ist der größte Hebel, um die Kosten pro Token zu senken und den KI-Umsatz zu maximieren. Durch die Verarbeitung von zehnmal so vielen Token mit demselben Zeit- und Energieaufwand sinken die Kosten pro Token drastisch, sodass MoEs in alltägliche Produkte integriert werden können.
Mit Full-Stack-Innovationen in den Bereichen Rechenleistung, Netzwerke und Software ermöglicht NVIDIA Ihnen die effiziente Skalierung komplexer KI-Bereitstellungen.
NVIDIA bietet eine bewährte Plattform mit einer Installationsbasis von hunderten Millionen CUDA®-GPUs, 7 Millionen Entwicklern, Beiträgen zu über 1.000 Open-Source-Projekten und tiefen Framework-Integrationen mit Frameworks wie PyTorch, JAX, SGLang, vLLM und mehr
Leistung treibt Rentabilität voran
Je schneller Ihr System Token generieren und gleichzeitig eine nahtlose Benutzererfahrung bieten kann, desto mehr Umsatz können Sie mit gleichem Energieverbrauch und Kostenaufwand erzielen. NVIDIA Blackwell generiert 75 Millionen US-Dollar Umsatz für jede Investition von 5 Millionen US-Dollar – eine 15-fache Investitionsrendite.
Leistungsstarke Hardware ohne intelligente Orchestrierung verschwendet Potenzial; großartige Software ohne schnelle Hardware führt zu einer langsamen Inferenzleistung. Die Full-Stack-Innovation von NVIDIA in den Bereichen Rechenleistung, Netzwerke und Software ermöglicht höchste Leistung bei verschiedenen Workloads. Entdecken Sie einige der wichtigsten Hardware- und Softwareinnovationen von NVIDIA.