NVIDIA Nemotron

Offene und effiziente multimodale Modelle für agentenbasierte KI.

Überblick

Was ist NVIDIA Nemotron?

NVIDIA Nemotron™ ist eine Reihe von hocheffizienten, offenen, multimodalen Modellen, Datensätzen und Technologien, die für langlebige, spezialisierte agentische KI-Systeme entwickelt wurden. Nemotron-Modelle wurden für fortschrittliches Reasoning, Programmierung, visuelles Verständnis, Sicherheit, Sprache und Informationsabruf entwickelt und helfen Agenten, komplexe Aufgaben mit führender Genauigkeit und geringen Kosten schneller zu erledigen.

Mit transparenten Trainingsdaten und einer breiten Plattformunterstützung, einschließlich NVIDIA RTX PRO™ und NVIDIA DGX Spark™, sind Nemotron-Modelle offen verfügbar und in das gesamte KI-Ökosystem integriert, sodass vertrauenswürdige, leistungsstarke KI-Agenten überall – vom Edge bis zur Cloud – bereitgestellt werden können.

NVIDIA stellt Nemotron 3 Nano Omni für multimodale Sub-Agenten vor

Lernen Sie das neue offene multimodale Modell kennen, das Video-, Audio-, Bild- und Textverständnis in einer einzigen Reasoning-Schleife vereint, fragmentierte Modellstacks ersetzt und es Agenten ermöglicht, Aufgaben schneller und mit weniger Rechenleistung zu erledigen.

Nemotron 3 Nano Omni: Ein offenes Omni-Reasoning-Modell für agentische KI

Erfahren Sie, wie Nemotron 3 Nano Omni entwickelt wurde, um führende Effizienz und Genauigkeit bei geringer Rechenleistung zu bieten. Entdecken Sie die Architektur und den Trainingsansatz und greifen Sie auf offene Datensätze, Rezepte, Leitfäden und mehr zu, um mit der Entwicklung agentischer KI-Systeme zu beginnen.

Video

Warum NVIDIA Nemotron entwickelt hat

Bryan Catanzaro, VP für Applied Deep Learning Research bei NVIDIA, erläutert die Vision hinter Nemotron und erklärt, warum offene Methoden für die Entwicklung vertrauenswürdiger, unternehmensfähiger KI unerlässlich sind.

Vorteile

Was bietet Nemotron für agentische KI?

Offene Modelle

Die offenen Daten und Optimierungstechniken von NVIDIA gewährleisten leistungsstarke, transparente und anpassungsfähige Modelle für Entwickler und Unternehmen. Modelle und Trainingsdaten werden auf Hugging Face veröffentlicht.

Hohe Recheneffizienz

Die Nemotron-Familie ist optimiert, um agentische Aufgaben mit dem höchsten Durchsatz und der hybriden MoE-Architektur schneller zu erledigen.

Hohe Genauigkeit

Nemotron-Modelle werden von Grund auf mit außergewöhnlichem Wissen entwickelt, mit hochwertigen Trainingsdaten nachtrainiert und auf bestärkendes Lernen abgestimmt. Sie erreichen eine unübertroffene Genauigkeit für agentische Systeme mit langer Laufzeit.

Sichere und einfache Bereitstellung

Die Familie der Nemotron-Modelle, die als optimierte NVIDIA NIM™-Microservices verfügbar ist, bietet herausragende Inferenzleistung und flexible Bereitstellungsoptionen, die überlegene Sicherheit, Datenschutz und Portabilität gewährleisten.

Modelle

Modelle für verschiedene Workloads

Nemotron-Modelle zeichnen sich durch hervorragende Leistungen bei agentischen KI-Aufgaben aus, einschließlich logisches Denken, multimodale Vision, Retrieval-Augmented Generation (RAG), Sprache, und Sicherheit. Forschungsmodelle zum Experimentieren sind ebenfalls verfügbar.

Logisches Denken

Nemotron-Modelle unterstützen eine Reihe von Schlussfolgerungs-Workloads. Nano bietet überragende Genauigkeit und Effizienz für spezialisierte Unteragenten, Super bietet höchste Genauigkeit, Durchsatz-Reasoning und Tool-Aufrufe für komplexe Aufgaben auf Systemen mit mehreren Agenten und Ultra bietet die beste Schlussfolgerungsfähigkeit für geschäftskritische Anwendungen, die maximale Kapazität über mehrstufige Arbeitsabläufe hinweg erfordern.

Visuelles Verständnis

Multimodale Nemotron-Modelle bieten die höchste Effizienz und unübertroffene Genauigkeit in den Bereichen Video, Audio, Bild und Text für agentische Anwendungsfälle in Unternehmen. Sie sind für spezialisierte Sub-Agenten optimiert und unterstützen Funktionen wie Computer-Agenten, Dokumentenintelligenz sowie Video- und Audioverständnis.

Logisches Denken

Wählen Sie aus einer Reihe von Nemotron-Reasoning-Modellen: Nano bietet überlegene Genauigkeit für PC- und Edge-Geräte, Super bietet die höchste Genauigkeit und den höchsten Durchsatz für den Betrieb auf einer einzigen NVIDIA Tensor Core GPU, und Ultra bietet die beste Genauigkeit für komplexe Systeme, die für Multi-GPU-Rechenzentren optimiert sind.

Retrieval-Augmented Generation

Nemotron-Modelle bieten schnelles und genaues Dokumentenverständnis, indem sie multimodale strukturierte Informationen extrahieren, hochwertige Einbettungen generieren und die relevantesten Dokumente sortieren. Sie bieten skalierbare, schnelle Abruffunktionen, die die Datenqualität für das LLM-Training verbessern, die Leistung von Agenten und Retrievern steigern und Dokumentenworkflows optimieren.

Guardrails (Sicherheits- und Kontrollmechanismen)

NVIDIA Nemotron Safety Guard-Modelle bieten Echtzeit-Schutz vor schädlichen Inhalten, themenwidrigen Abweichungen und Jailbreak-Versuchen. Sie fügen eine Sicherheitsebene für mehrsprachige Inhalte hinzu, was die Moderation verbessert und den kulturellen Abgleich gewährleistet.

Technologie

Bausteine für agentenbasierte KI

Beginnen Sie die Entwicklung und Optimierung von KI-Agenten mit NVIDIA NeMo™ für maßgeschneiderte agentenbasierte KI, NVIDIA NIM für eine schnelle, unternehmensgerechte Bereitstellung und NVIDIA Blueprints zur Beschleunigung der Entwicklung mit anpassbaren Referenz-Workflows.

NVIDIA NeMo

  • Sie können sowohl generative als auch agentenbasierte KI entwickeln, anpassen und bereitstellen.
  • Stellen Sie für Unternehmen geeignete große Sprachmodelle (LLMs) mit präziser Datenkuration, hochmoderner Anpassung, skalierbarer Datenaufnahme, RAG-Qualität und beschleunigter Leistung bereit.
  • Erstellen Sie ohne großen Aufwand Daten-Flywheels und optimieren Sie KI-Agenten kontinuierlich mit den neuesten Daten.

NVIDIA NIM

  • Beschleunigen Sie die Bereitstellung von leistungsoptimierten generativen KI-Modellen.
  • Führen Sie Geschäftsanwendungen mit stabilen und sicheren APIs aus, die von Support auf Unternehmensniveau unterstützt werden.

NVIDIA Blueprints

  • Legen Sie schnell los mit Referenzanwendungen für generative KI-Anwendungsfälle wie Enterprise Deep Research und multimodales RAG.
  • Beschleunigen Sie die Entwicklung mit Blueprints, die Partner-Microservices, einen oder mehrere KI-Agenten, Referenzcode, Dokumentation zur Anpassung und ein Helm-Chart für die Bereitstellung umfassen.

Einstiegsoptionen

Möglichkeiten für den Einstieg in Nemotron

Kostenloses Prototyping starten

Legen Sie los mit benutzerfreundlichen API-Endpunkten.

  • Nutzen Sie eine vollständig beschleunigte KI-Infrastruktur.
  • Stellen Sie sicher, dass Ihre Daten nicht für das Modelltraining verwendet werden.
  • Keine Credits, sondern einfach eine einfache Möglichkeit für das Entwickeln, Testen und Bereitstellen.

Führen Sie Nemotron auf Inferenzdienstanbietern aus.

Stellen Sie Nemotron-Modelle sofort auf vertrauenswürdigen Inferenzplattformen von Drittanbietern bereit – keine Infrastruktureinrichtung erforderlich.

  • Bereitstellen ohne Verwaltung der Infrastruktur.
  • Nahtlose Skalierung vom Prototyp bis zur Produktion.
  • Optimieren der Kosten durch nutzungsabhängige Preise.

Kontaktieren Sie uns

Sprechen Sie mit einem NVIDIA-KI-Experten über die Überführung von Pilotprojekten für generative KI in den Produktivbetrieb – mit der Sicherheit, API-Stabilität und Unterstützung von NVIDIA AI Enterprise.

  • Analysieren Sie Ihre Anwendungsfälle für generative KI.
  • Besprechen Sie Ihre technischen Anforderungen.
  • Stimmen Sie NVIDIA-KI-Lösungen mit Ihren Zielen und Anforderungen ab.

Anwender

Unternehmen, die Nemotron nutzen

Ressourcen

Neuerungen bei Nemotron entdecken

Warum NVIDIA Nemotron entwickelt hat

Erfahren Sie, wie Nemotron Innovationen beschleunigt, Entwickler unterstützt und die Zukunft der KI prägt.

So treibt ServiceNow Document Intelligence voran

Erfahren Sie, wie der Zugriff auf Nemotrons Modellgewichte, Datensätze und Trainingsrezepte eine tiefere Auswertung ermöglicht hat, was das Unternehmen ServiceNow über die Genauigkeit visueller F&A herausgefunden hat und warum Offenheit für die kontinuierliche Verbesserung multimodaler KI wichtig ist.

Reasoning EIN/AUS: Erstellung eines Sitzplans für eine Hochzeit mit KI-Reasoning

Sehen Sie sich an, wie ein LLM mit KI-Reasoning-Fähigkeiten kreatives Denken anwendet, um unter Berücksichtigung der Familienverhältnisse und Präferenzen der Gäste eine Lösung für den Sitzplan einer Hochzeit zu finden.

Nächste Schritte

Sind Sie bereit?

Nutzen Sie geeignete Tools und Technologien, um NVIDIA Nemotron-Modelle aus der Entwicklung in den Produktivbetrieb zu überführen.

Kontaktieren Sie uns

Sprechen Sie mit einem NVIDIA-Produktexperten über den Wechsel von der Pilotphase in den Produktivbetrieb mithilfe der Sicherheit, API-Stabilität und Unterstützung von NVIDIA AI Enterprise.

Mit Neuigkeiten zu agentenbasierter KI von NVIDIA auf dem Laufenden bleiben

Lassen Sie sich aktuelle Nachrichten zu agentenbasierter KI, Technologien, bahnbrechenden Neuerungen und mehr direkt in Ihren Posteingang schicken.