Introduzione a NVIDIA NeMo

NVIDIA NeMo è una suite software modulare e pronta per le aziende per la gestione del ciclo di vita degli agenti IA, ovvero la creazione, la distribuzione e l'ottimizzazione dei sistemi di agenti, dalla selezione dei dati, la personalizzazione e la valutazione dei modelli alla distribuzione, orchestrazione e ottimizzazione continue. Si integra perfettamente con gli ecosistemi e le piattaforme IA esistenti per creare una base per la creazione di agenti IA, accelerando il percorso verso la produzione di sistemi per agenti su qualsiasi ambiente cloud, on-premise o ibrido. Supporta la scalabilità rapida e la creazione semplice di volani di dati che migliorano continuamente gli agenti IA con le informazioni più recenti.

NeMo è disponibile open source e supportato come parte di NVIDIA AI Enterprise. I dettagli su prezzi e licenze sono disponibili qui.

NeMo può essere utilizzato per personalizzare i modelli linguistici di grandi dimensioni (LLM), i modelli linguistici visivi (VLM), il riconoscimento vocale automatico (ASR) e i modelli di sintesi vocale (TTS).

NVIDIA AI Enterprise include il supporto NVIDIA Business-Standard. Per ulteriori servizi e supporto disponibili, come il supporto NVIDIA Business-Critical, un account manager tecnico, formazione e servizi professionali, consulta la Guida al supporto e ai servizi NVIDIA Enterprise.

Il framework NVIDIA NeMo è un framework di IA generativa open source creato per ricercatori e sviluppatori che cercano un controllo granulare e una flessibilità a livello di codice per creare in modo efficiente modelli di IA generativa su scala. Supporta il pre-addestramento, il post-addestramento e l'apprendimento per rinforzo dei modelli di IA generativa multimodale.

I microservizi NVIDIA NeMo sono un'offerta modulare API-first pronta per le aziende che si estende al framework NeMo, progettata appositamente per consentire agli sviluppatori di personalizzare e distribuire agenti IA su scala in modo semplice e rapido. Semplifica la messa a punto dei modelli, la valutazione, la gestione dei limiti e la generazione di dati sintetici. Si integrano perfettamente nelle piattaforme IA esistenti, consentendo alle aziende di accelerare lo sviluppo di agenti IA personalizzati e ottimizzarli continuamente attraverso i flussi di lavoro del volano di dati.

NeMo Data Designer è un microservizio appositamente progettato per gli sviluppatori di IA che fornisce un modo programmatico per generare dati sintetici attraverso schemi configurabili e modelli di generazione basati sull'IA. È progettato per integrarsi perfettamente nel flusso di lavoro di sviluppo dell'IA.

NeMo Curator è una libreria open source che migliora la precisione dei modelli di IA generativa selezionando set di dati multimodali di alta qualità. Consiste in un insieme di moduli Python espressi come API che utilizzano Dask, cuDF, cuGraph e Pytorch per scalare le attività di gestione dei dati, come il download dei dati, l'estrazione del testo, la pulizia, il filtraggio, la deduplicazione esatta/sfocata e la classificazione del testo a migliaia di core di calcolo

NeMo Customizer è un microservizio ad alte prestazioni e scalabile che semplifica la personalizzazione e l'allineamento degli LLM per i casi d'uso specifici di dominio utilizzando tecniche avanzate di messa a punto e apprendimento per rinforzo.

NeMo Auditor esegue il controllo degli LLM eseguendo i processi di audit che sondano il modello con una varietà di prompt per identificare le vulnerabilità. Puoi utilizzare i risultati per valutare la sicurezza dei modelli e dei sistemi.

NeMo Evaluator è un microservizio progettato per la valutazione rapida e affidabile di LLM e RAG personalizzati. Si estende a diversi benchmark con metriche predefinite, tra cui valutazioni umane e tecniche LLM-as-a-judge. È possibile implementare simultaneamente più processi di valutazione su Kubernetes su piattaforme cloud o data center preferiti tramite chiamate API, consentendo risultati aggregati efficienti.

NeMo Guardrails è un microservizio per garantire l'appropriatezza e la sicurezza nelle applicazioni intelligenti con modelli linguistici di grandi dimensioni. Tutela le organizzazioni che supervisionano i sistemi LLM.

NeMo Guardrails consente agli sviluppatori di impostare tre tipi di confini:

I guardrail degli argomenti impediscono alle app di sconfinare in aree indesiderate. Ad esempio, impediscono agli assistenti del servizio clienti di rispondere alle domande sul meteo.
I guardrail di sicurezza garantiscono che le app rispondano con informazioni accurate e appropriate. Possono filtrare il linguaggio indesiderato e fare in modo che i riferimenti derivino solo da fonti credibili.
I guardrail di sicurezza garantiscono che le app si connettano solo ad applicazioni esterne di terze parti note per essere sicure.

NeMo RL è una libreria open source, parte del toolkit del framework NeMo, che offre algoritmi di apprendimento per rinforzo avanzati e post-addestramento scalabile per ottimizzare e allineare gli agenti IA su scala aziendale.

NeMo Retriever è una raccolta di modelli Nemotron RAG leader di settore che offre una precisione superiore del 50%, un'estrazione multimodale di PDF 15 volte più veloce e un'efficienza di storage 35 volte superiore, consentendo alle aziende di creare pipeline RAG che forniscono approfondimenti aziendali in tempo reale. NeMo Retriever garantisce la privacy dei dati e si connette facilmente ai dati proprietari ovunque risiedano, consentendo il recupero sicuro e di livello aziendale.

La generazione aumentata di recupero è una tecnica che consente agli LLM di creare risposte dalle informazioni più recenti collegandole alla base di conoscenza dell'azienda. NeMo opera con vari strumenti di terze parti e della community, tra cui Milvus, Llama Index e LangChain, per estrarre frammenti di informazioni pertinenti dal database vettoriale e fornirli all'LLM per generare risposte in linguaggio naturale. Visita la pagina Chatbot IA che usano flussi di lavoro RAG per iniziare a creare chatbot IA di qualità di produzione in grado di rispondere con precisione alle domande sui dati aziendali.

NVIDIA offre flussi di lavoro IA, esempi di riferimento nativi cloud e pronti all'uso che illustrano come i framework NVIDIA AI possono essere usati per creare soluzioni IA. Con modelli pre-addestrati, pipeline di training e inferenza, Jupyter Notebooks e grafici Helm, i flussi di lavoro IA accelerano il percorso verso la fornitura di soluzioni.

Crea rapidamente le tue soluzioni di IA generativa con questi flussi di lavoro completi:

NVIDIA NIM, parte di NVIDIA AI Enterprise, è un runtime di facile utilizzo progettato per accelerare la distribuzione dell'IA generativa nelle aziende. Questo microservizio versatile supporta un ampio spettro di modelli di intelligenza artificiale, dai modelli di community open source ai modelli NVIDIA AI Foundation, oltre a quelli di IA personalizzati su misura. Creato sulle solide fondamenta dei motori di inferenza, è progettato per facilitare al massimo l'inferenza IA su larga scala, garantendo che le applicazioni IA possano essere distribuite su cloud, data center e workstation.

La generazione aumentata di recupero è una tecnica che consente agli LLM di creare risposte dalle informazioni più recenti collegandole alla base di conoscenza dell'azienda. NeMo opera con vari strumenti di terze parti e della community, tra cui Milvus, Llama Index e LangChain, per estrarre frammenti di informazioni pertinenti dal database vettoriale e fornirli all'LLM per generare risposte in linguaggio naturale. Visita la pagina Chatbot IA che usano flussi di lavoro RAG per iniziare a creare chatbot IA di qualità di produzione in grado di rispondere con precisione alle domande sui dati aziendali.

NVIDIA Blueprints sono flussi di lavoro di riferimento completi creati con le librerie, gli SDK e i microservizi di NVIDIA AI e Omniverse. Ogni blueprint include codice di riferimento, strumenti di distribuzione, guide per la personalizzazione e un'architettura di riferimento, per accelerare la distribuzione di soluzioni di IA come agenti IA e digital twin, dal prototipo alla produzione.

NVIDIA AI Enterprise è una piattaforma software end-to-end cloud-native che accelera le pipeline di scienza dei dati e semplifica lo sviluppo e la distribuzione di applicazioni IA di livello produttivo, tra cui IA generativa, computer vision, IA vocale e altro ancora. Include i migliori strumenti di sviluppo della categoria, framework, modelli pre-addestrati, microservizi per i professionisti dell'IA e funzionalità di gestione affidabili per i professionisti IT per garantire prestazioni, stabilità delle API e sicurezza.

Come iniziare con NVIDIA NeMo

Il percorso dai modelli di IA alle applicazioni di IA per agenti

1

2

3

Strumenti per la gestione del ciclo di vita degli agenti IA

FAQ

Come iniziare con NVIDIA NeMo

Il percorso dai modelli di IA alle applicazioni di IA per agenti

1

2

3

Strumenti per la gestione del ciclo di vita degli agenti IA

FAQ

Che cos'è NVIDIA NeMo?

Quanto costa NeMo?

Quali modelli di IA possono essere personalizzati con NeMo?

Quali servizi aziendali sono disponibili per NeMo?

Qual è la differenza tra il framework NeMo e i microservizi NeMo?

Cos'è NeMo Data Designer?

Che cos'è NeMo Curator?

Che cos'è NeMo Customizer?

Cos'è NeMo Auditor?

Che cos'è NeMo Evaluator?

Che cos'è NeMo Guardrails?

Cos'è NeMo RL?

Che cos'è NeMo Retriever?

NeMo supporta la generazione aumentata di recupero?

Qual è il modo più veloce per iniziare?

Che cos'è NVIDIA NIM?

NeMo supporta la generazione aumentata di recupero?

Cosa sono gli NVIDIA Blueprints?

Che cos'è NVIDIA AI Enterprise?