NVIDIA Nemotron

Modelli multimodali aperti ed efficienti per l'IA per agenti.

Panoramica

Cos'è NVIDIA Nemotron?

NVIDIA Nemotron™ è una famiglia di modelli, set di dati e tecnologie multimodali aperti e altamente efficienti, creati per i sistemi di IA agentica specializzati e a lunga esecuzione. Progettati per il ragionamento avanzato, la codifica, la comprensione visiva, la sicurezza, il parlato e il recupero delle informazioni, i modelli Nemotron aiutano gli agenti a completare attività complesse più rapidamente con un'accuratezza leader a costi convenienti. 

Dotati di dati di addestramento trasparenti e di un ampio supporto della piattaforma, tra cui NVIDIA RTX PRO™ e NVIDIA DGX Spark™, i modelli Nemotron sono pubblicamente disponibili e integrati nell'ecosistema IA, consentendo di distribuire agenti IA affidabili e ad alte prestazioni ovunque, dall'edge al cloud.

NVIDIA presenta Nemotron 3 Nano Omni per i sotto-agenti multimodali

Scopri il nuovo modello multimodale aperto che unifica la comprensione di video, audio, immagini e testi in un singolo loop di ragionamento, sostituendo gli stack di modelli frammentati e consentendo agli agenti di completare le attività più rapidamente con meno calcolo.

Nemotron 3 Nano Omni: un modello aperto di ragionamento completo per l'IA per agenti

Scopri come Nemotron 3 Nano Omni è stato progettato per offrire efficienza e precisione leader del settore con una bassa necessità di calcolo. Esplora l'architettura e l'approccio all'addestramento e accedi a set di dati aperti, ricette, cookbook e altro ancora per iniziare a creare sistemi di IA agentica.

Video

Perché NVIDIA ha creato Nemotron

Ascolta Bryan Catanzaro, Vicepresidente della ricerca applicata sul deep learning di NVIDIA, condividere la visione alla base di NVIDIA Nemotron™ e spiegare perché l'IA open source è essenziale per creare un'IA affidabile e pronta per l'impresa.

Vantaggi

Qual è il valore aggiunto di Nemotron nel campo dell'IA per agenti?

Modelli aperti

I dati aperti e le tecniche di ottimizzazione di NVIDIA garantiscono modelli potenti, trasparenti e adattabili per gli sviluppatori e le aziende. I modelli e i dati di addestramento sono pubblicati apertamente su Hugging Face.

Alta efficienza di calcolo

La famiglia Nemotron è ottimizzata per completare le attività agentiche più rapidamente con il massimo throughput e l'architettura MoE ibrida.

Alta precisione

Creati da zero con conoscenze eccezionali, post-addestrati con dati di addestramento di alta qualità e allineati all'apprendimento per rinforzo, i modelli Nemotron offrono accuratezza leader per i sistemi agentici a lunga esecuzione.

Distribuzione sicura e semplice

La famiglia di modelli Nemotron, disponibile come microservizi NVIDIA NIM™ ottimizzati, offre prestazioni di inferenza di picco e opzioni di distribuzione flessibili, garantendo la massima sicurezza, privacy e portabilità.

Modelli

Modelli per una vasta gamma di carichi di lavoro

I modelli Nemotron eccellono in una vasta gamma di attività di IA agentica, tra cui il ragionamento, la visione multimodale, la generazione aumentata di recupero (RAG), il parlatoe la sicurezza. Sono inoltre disponibili modelli di ricerca per la sperimentazione.

Ragionamento

I modelli Nemotron supportano una vasta gamma di carichi di lavoro di ragionamento. Nano fornisce maggiori accuratezza ed efficienza per i sub-agenti specializzati, Super offre il massimo livello di accuratezza, ragionamento di throughput e chiamata di strumenti per eseguire attività complesse su sistemi multi-agente, mentre Ultra offre il miglior ragionamento per le applicazioni mission critical che richiedono la massima capacità nei flussi di lavoro a più passaggi.

Comprensione visiva

I modelli multimodali Nemotron offrono la massima efficienza e accuratezza leader in video, audio, immagini e testi per casi d'uso agentici aziendali. Ottimizzati per i sotto-agenti specializzati, alimentano capacità come gli agenti per l'uso di computer, l'intelligenza documentale e la comprensione video e audio.

Ragionamento

Scegli tra una gamma di modelli di ragionamento Nemotron: Nano offre una precisione superiore per i PC e i dispositivi perimetrali, Super offre la massima precisione e il massimo throughput per l'esecuzione su una singola GPU NVIDIA Tensor Core e Ultra offre la migliore precisione per i sistemi complessi ottimizzati per i data center multi-GPU.

Generazione aumentata di recupero

I modelli Nemotron offrono una comprensione rapida e accurata dei documenti estraendo informazioni strutturate multimodali, generando embedding di alta qualità e ordinando i documenti più rilevanti. Forniscono un recupero scalabile e ad alta velocità che migliora la qualità dei dati per l'addestramento degli LLM, aumenta le prestazioni di agenti e sistemi di recupero e semplifica i flussi di lavoro dei documenti.

Guardrail

I modelli NVIDIA Nemotron Safety Guard forniscono protezione in tempo reale contro i contenuti dannosi, le deviazioni fuori tema e i tentativi di jailbreak. Aggiungono un livello di sicurezza dei contenuti multilingue, migliorando la moderazione e garantendo l'allineamento culturale.

Tecnologia

Elementi costitutivi dell'IA per agenti

Inizia a creare e a ottimizzare agenti IA con NVIDIA NeMo™ per l'IA agentica personalizzata con NVIDIA NIM per una distribuzione veloce e pronta per le aziende e con NVIDIA Blueprints per l'accelerazione della fase di sviluppo con flussi di lavoro di riferimento personalizzabili.

NVIDIA NeMo

  • Crea, personalizza e distribuisci l'IA generativa e l'IA per agenti.
  • Fornisci modelli linguistici di grandi dimensioni (LLM) pronti per le aziende con una selezione accurata dei dati, personalizzazione all'avanguardia, ingestione di dati scalabile, RAG e prestazioni accelerate.
  • Crea facilmente volani di dati e ottimizza continuamente gli agenti IA con le informazioni più recenti.

NVIDIA NIM

  • Accelera la distribuzione di modelli di IA generativa ottimizzati per le prestazioni.
  • Esegui le applicazioni aziendali con API stabili e sicure, con un supporto di livello aziendale.

NVIDIA Blueprints

  • Inizia rapidamente a utilizzare le applicazioni di riferimento per i casi d'uso dell'IA generativa, come la ricerca approfondita aziendale e il recupero assistito generativo (RAG) multimodale.
  • Accelera lo sviluppo con i blueprint, che includono i microservizi dei partner, uno o più agenti IA, il codice di riferimento, la documentazione per la personalizzazione e un grafico Helm per la distribuzione.

Opzioni per iniziare

Come iniziare a utilizzare Nemotron

Inizia a creare prototipi gratuitamente

Inizia con gli endpoint API facili da usare.

  • Accedi all'infrastruttura IA completamente accelerata.
  • Assicurati che i tuoi dati non vengano utilizzati per l'addestramento dei modelli.
  • Nessun credito ma un semplice percorso per creare, testare e distribuire.

Esegui Nemotron sui fornitori di servizi di inferenza

Distribuisci istantaneamente i modelli Nemotron su piattaforme di inferenza di terze parti affidabili, senza alcuna configurazione dell'infrastruttura.

  • Distribuisci senza gestire l'infrastruttura.
  • Scala facilmente dal prototipo alla produzione.
  • ottimizzare i costi con prezzi basati sull'utilizzo.

Contattaci

Parla con uno specialista NVIDIA AI per scoprire come portare in produzione i progetti pilota di IA generativa con la sicurezza, la stabilità delle API e il supporto forniti con NVIDIA AI Enterprise.

  • Scopri i casi d'uso dell'IA generativa.
  • Esaminare i requisiti tecnici.
  • Allineare le soluzioni NVIDIA AI ai tuoi obiettivi e requisiti.

Utenti

Aziende che utilizzano Nemotron

Risorse

Scopri le ultime novità di Nemotron

Perché NVIDIA ha creato Nemotron

Scopri come Nemotron accelera l'innovazione, dà potere agli sviluppatori e forgia il futuro dell'IA.

Come ServiceNow sta spingendo l'intelligenza documentale in avanti

Scopri come l'accesso alle ponderazioni, ai dataset e agli script di training del modello Nemotron hanno consentito una valutazione più approfondita, cosa ha rilevato ServiceNow in merito all'accuratezza del controllo qualità e perché l'apertura è importante per il continuo miglioramento dell'IA multimodale.

Ragionamento attivo e non attivo: gestire una mappa dei posti per un matrimonio con il ragionamento IA

Scopri come un LLM con funzionalità di ragionamento IA pensa fuori dagli schemi per trovare una soluzione per la mappa dei posti del matrimonio mentre gestisce le dinamiche familiari e le preferenze degli ospiti.

Prossimi passi

Vuoi iniziare?

Utilizza gli strumenti e le tecnologie giusti per portare i modelli di ragionamento NVIDIA Nemotron, dallo sviluppo alla produzione.

Contattaci

Parla con uno specialista di prodotto NVIDIA per passare dal progetto pilota alla produzione grazie alla sicurezza, alla stabilità delle API e al supporto forniti con NVIDIA AI Enterprise.

Ricevi gli aggiornamenti sulle novità dell'IA NVIDIA per agenti

Ricevi le ultime notizie e scopri le più recenti tecnologie e innovazioni e molto altro ancora sull'IA per agenti direttamente nella tua casella di posta.