NVIDIA Nemotron

Hocheffiziente, multimodale, offene Modelle für KI-Agenten mit langer Laufzeit.

Überblick

Was ist NVIDIA Nemotron?

NVIDIA Nemotron™ ist eine Familie von hocheffizienten, multimodalen, offenen KI-Modellen, die für langlebige, sich selbst weiterentwickelnde Agenten entwickelt wurden. Nemotron-Modelle wurden für die schnelle Erledigung von Aufgaben entwickelt und bieten einen hohen Reasoning-Durchsatz und führende Genauigkeit für komplexe Agenten-Workflows.

Mit transparenten Trainingsdaten und einer breiten Plattformunterstützung, einschließlich NVIDIA RTX PRO™ und NVIDIA DGX Spark™, sind Nemotron-Modelle offen verfügbar und in das gesamte KI-Ökosystem integriert, sodass vertrauenswürdige, leistungsstarke KI-Agenten überall – vom Edge bis zur Cloud – bereitgestellt werden können.

Gestalten Sie die Zukunft der Arbeit mit NVIDIA Enterprise-Software-Plattformen

Erfahren Sie, wie NVIDIA-Software Agenten mit langer Laufzeit für komplexe Workflows in den Bereichen Ingenieurwesen, Gesundheitswesen und Betrieb unterstützt und die Mitarbeiterproduktivität steigert.

Video

Warum NVIDIA Nemotron entwickelt hat

Bryan Catanzaro, VP für Applied Deep Learning Research bei NVIDIA, erläutert die Vision hinter Nemotron und erklärt, warum offene Methoden für die Entwicklung vertrauenswürdiger, unternehmensfähiger KI unerlässlich sind.

Vorteile

Was bietet Nemotron für agentische KI?

Offene Modelle

Die offenen Daten und Optimierungstechniken von NVIDIA gewährleisten leistungsstarke, transparente und anpassungsfähige Modelle für Entwickler und Unternehmen. Modelle und Trainingsdaten werden auf Hugging Face veröffentlicht.

Hohe Recheneffizienz

Die Nemotron-Familie ist optimiert, um agentische Aufgaben mit dem höchsten Durchsatz und der hybriden MoE-Architektur schneller zu erledigen.

Hohe Genauigkeit

Nemotron-Modelle werden von Grund auf mit außergewöhnlichem Wissen entwickelt, mit hochwertigen Trainingsdaten nachtrainiert und auf bestärkendes Lernen abgestimmt. Sie erreichen eine unübertroffene Genauigkeit für agentische Systeme mit langer Laufzeit.

Sichere und einfache Bereitstellung

Die Familie der Nemotron-Modelle, die als optimierte NVIDIA NIM™-Microservices verfügbar ist, bietet herausragende Inferenzleistung und flexible Bereitstellungsoptionen, die überlegene Sicherheit, Datenschutz und Portabilität gewährleisten.

Modelle

Modelle für verschiedene Workloads

Nemotron-Modelle zeichnen sich durch hervorragende Leistungen bei agentischen KI-Aufgaben aus, einschließlich logischen Denkens, multimodaler Vision, Retrieval-Augmented Generation (RAG), Sprache und Sicherheit. Forschungsmodelle zum Experimentieren sind ebenfalls verfügbar.

Logisches Denken

Nemotron-Modelle unterstützen eine Reihe von Schlussfolgerungs-Workloads. Nano bietet überragende Genauigkeit und Effizienz für spezialisierte Unteragenten, Super bietet höchste Genauigkeit, Durchsatz-Reasoning und Tool-Aufrufe für komplexe Aufgaben auf Systemen mit mehreren Agenten und Ultra bietet die beste Schlussfolgerungsfähigkeit für geschäftskritische Anwendungen, die maximale Kapazität über mehrstufige Arbeitsabläufe hinweg erfordern.

Visuelles Verständnis

Multimodale Nemotron-Modelle bieten die höchste Effizienz und unübertroffene Genauigkeit in den Bereichen Video, Audio, Bild und Text für agentische Anwendungsfälle in Unternehmen. Sie sind für spezialisierte Sub-Agenten optimiert und unterstützen Funktionen wie Computer-Agenten, Dokumentenintelligenz sowie Video- und Audioverständnis.

Logisches Denken

Wählen Sie aus einer Reihe von Nemotron-Reasoning-Modellen: Nano bietet überlegene Genauigkeit für PC- und Edge-Geräte, Super bietet die höchste Genauigkeit und den höchsten Durchsatz für den Betrieb auf einer einzigen NVIDIA Tensor Core GPU, und Ultra bietet die beste Genauigkeit für komplexe Systeme, die für Multi-GPU-Rechenzentren optimiert sind.

Retrieval-Augmented Generation

Nemotron-Modelle bieten schnelles und genaues Dokumentenverständnis, indem sie multimodale strukturierte Informationen extrahieren, hochwertige Einbettungen generieren und die relevantesten Dokumente sortieren. Sie bieten skalierbare, schnelle Abruffunktionen, die die Datenqualität für das LLM-Training verbessern, die Leistung von Agenten und Retrievern steigern und Dokumentenworkflows optimieren.

Guardrails (Sicherheits- und Kontrollmechanismen)

NVIDIA Nemotron Safety Guard-Modelle bieten Echtzeit-Schutz vor schädlichen Inhalten, themenwidrigen Abweichungen und Jailbreak-Versuchen. Sie fügen eine Sicherheitsebene für mehrsprachige Inhalte hinzu, was die Moderation verbessert und den kulturellen Abgleich gewährleistet.

Technologie

Bausteine für agentenbasierte KI

Beginnen Sie die Entwicklung und Optimierung von KI-Agenten mit NVIDIA NeMo™ für maßgeschneiderte agentenbasierte KI, NVIDIA NIM für eine schnelle, unternehmensgerechte Bereitstellung und NVIDIA Blueprints zur Beschleunigung der Entwicklung mit anpassbaren Referenz-Workflows.

NVIDIA NeMo

  • Sie können sowohl generative als auch agentenbasierte KI entwickeln, anpassen und bereitstellen.
  • Stellen Sie für Unternehmen geeignete große Sprachmodelle (LLMs) mit präziser Datenkuration, hochmoderner Anpassung, skalierbarer Datenaufnahme, RAG-Qualität und beschleunigter Leistung bereit.
  • Erstellen Sie ohne großen Aufwand Daten-Flywheels und optimieren Sie KI-Agenten kontinuierlich mit den neuesten Daten.

NVIDIA NIM

  • Beschleunigen Sie die Bereitstellung von leistungsoptimierten generativen KI-Modellen.
  • Führen Sie Geschäftsanwendungen mit stabilen und sicheren APIs aus, die von Support auf Unternehmensniveau unterstützt werden.

NVIDIA Blueprints

  • Legen Sie schnell los mit Referenzanwendungen für generative KI-Anwendungsfälle wie Enterprise Deep Research und multimodales RAG.
  • Beschleunigen Sie die Entwicklung mit Blueprints, die Partner-Microservices, einen oder mehrere KI-Agenten, Referenzcode, Dokumentation zur Anpassung und ein Helm-Chart für die Bereitstellung umfassen.

Einstiegsoptionen

Möglichkeiten für den Einstieg in Nemotron

Kostenloses Prototyping starten

Legen Sie los mit benutzerfreundlichen API-Endpunkten.

  • Nutzen Sie eine vollständig beschleunigte KI-Infrastruktur.
  • Stellen Sie sicher, dass Ihre Daten nicht für das Modelltraining verwendet werden.
  • Keine Credits, sondern einfach eine einfache Möglichkeit für das Entwickeln, Testen und Bereitstellen.

Führen Sie Nemotron auf Inferenzdienstanbietern aus.

Stellen Sie Nemotron-Modelle sofort auf vertrauenswürdigen Inferenzplattformen von Drittanbietern bereit – keine Infrastruktureinrichtung erforderlich.

  • Bereitstellen ohne Verwaltung der Infrastruktur.
  • Nahtlose Skalierung vom Prototyp bis zur Produktion.
  • Optimieren der Kosten durch nutzungsabhängige Preise.

Kontaktieren Sie uns

Sprechen Sie mit einem NVIDIA-KI-Experten über die Überführung von Pilotprojekten für generative KI in den Produktivbetrieb – mit der Sicherheit, API-Stabilität und Unterstützung von NVIDIA AI Enterprise.

  • Analysieren Sie Ihre Anwendungsfälle für generative KI.
  • Besprechen Sie Ihre technischen Anforderungen.
  • Stimmen Sie NVIDIA-KI-Lösungen mit Ihren Zielen und Anforderungen ab.

Anwender

Unternehmen, die Nemotron nutzen

Ressourcen

Neuerungen bei Nemotron entdecken

Warum NVIDIA Nemotron entwickelt hat

Erfahren Sie, wie Nemotron Innovationen beschleunigt, Entwickler unterstützt und die Zukunft der KI prägt.

So treibt ServiceNow Document Intelligence voran

Erfahren Sie, wie der Zugriff auf Nemotrons Modellgewichte, Datensätze und Trainingsrezepte eine tiefere Auswertung ermöglicht hat, was ServiceNow über die Genauigkeit visueller F&A herausgefunden hat und warum Offenheit für die kontinuierliche Verbesserung multimodaler KI wichtig ist.

Reasoning EIN/AUS: Erstellung eines Sitzplans für eine Hochzeit mit KI-Reasoning

Sehen Sie sich an, wie ein LLM mit KI-Reasoning-Fähigkeiten kreatives Denken anwendet, um unter Berücksichtigung der Familienverhältnisse und Präferenzen der Gäste eine Lösung für den Sitzplan einer Hochzeit zu finden.

FAQs

NVIDIA Nemotron-Modelle sind nicht nur offen, sondern auch wirklich Open Source. NVIDIA veröffentlicht die Trainingsdatasets, Techniken und Modellgewichte, damit die Open-Source-Community von unseren Erkenntnissen profitieren und diese Ressourcen nutzen kann, um eigene Modelle zu erstellen.

Die NVIDIA Open Model-Lizenz ist eine freizügige Lizenz, die es Nutzern ermöglicht, die Modelle und Derivate ohne Nennung von NVIDIA zu verwenden, zu modifizieren, zu verteilen und kommerziell bereitzustellen, um Innovationen und die Weiterentwicklung generativer KI zu fördern.

Ja, Sie können NVIDIA Nemotron-Modelle kostenlos von Hugging Face herunterladen und in der Produktion ausführen.

NVIDIA bietet Nemotron-Modelle auch als NVIDIA NIM-Mikroservices für eine sichere, skalierbare Bereitstellung an, für die eine NVIDIA AI Enterprise-Lizenz erforderlich ist. Sie können die Nemotron-Modelle ausprobieren und die NIM-Microservices von build.nvidia.com herunterladen.

Ja, NVIDIA hat sich verpflichtet, weitere Nemotron-Modelle, -Datensätze und -Techniken zu veröffentlichen, um Open-Source-Ökosysteme zu ermöglichen.

NVIDIA Nemotron-Modelle basieren auf modernsten offenen Modellen, was eine schnellere Entwicklung besserer Modelle ermöglicht. Darüber hinaus veröffentlicht NVIDIA die Modellgewichte, Trainingsdatensätze und Trainingsmethoden, damit die Entwickler-Community diese Komponenten von Nemotron zum Trainieren ihrer eigenen Modelle verwenden kann.

NVIDIA bietet eine Vielzahl von Tools wie NVIDIA Dynamo, TensorRT-LLM und NIM, um Nemotron-Modelle in großem Umfang in der Produktion auszuführen. Sie können auch beliebte Open-Source-Bibliotheken wie SGLang und vLLM verwenden.

Nächste Schritte

Sind Sie bereit?

Nutzen Sie geeignete Tools und Technologien, um NVIDIA Nemotron-Modelle aus der Entwicklung in den Produktivbetrieb zu überführen.

Kontaktieren Sie uns

Sprechen Sie mit einem NVIDIA-Produktexperten über den Wechsel von der Pilotphase in den Produktivbetrieb mithilfe der Sicherheit, API-Stabilität und Unterstützung von NVIDIA AI Enterprise.

Mit Neuigkeiten zu agentenbasierter KI von NVIDIA auf dem Laufenden bleiben

Lassen Sie sich aktuelle Nachrichten zu agentenbasierter KI, Technologien, bahnbrechenden Neuerungen und mehr direkt in Ihren Posteingang schicken.