NVIDIA NeMo

Una suite software completa per creare, monitorare e ottimizzare gli agenti IA durante tutto il loro ciclo di vita su scala aziendale.

Panoramica

Che cos'è NVIDIA NeMo?

NVIDIA NeMo™ è una suite software modulare per la gestione del ciclo di vita degli agenti IA. Fornisce microservizi e toolkit per l'elaborazione dei dati, la messa a punto e la valutazione dei modelli, l'apprendimento per rinforzo, l'applicazione delle politiche e l'osservabilità del sistema. NeMo aiuta le aziende a creare, monitorare e ottimizzare i sistemi di IA per agenti su scala, su qualsiasi infrastruttura accelerata da GPU. Si integra con le piattaforme IA esistenti e supporta la distribuzione cloud, on-premise e ibrida, consentendo alle aziende di gestire rapidamente e creare facilmente volani di dati per l'ottimizzazione continua degli agenti IA.

Nuovo blueprint NVIDIA AI per la creazione di volani di dati

Ora disponibile, questo nuovo blueprint di IA consente agli sviluppatori di creare un volano di dati automatizzato che alimenta continuamente le applicazioni di IA generativa e per agenti con modelli più accurati ed efficienti.

Vantaggi

Scopri i vantaggi di NVIDIA NeMo per l'IA per agenti

Gestione del ciclo di vita degli agenti IA modulare

Gestisci il ciclo di vita degli agenti IA, dalla selezione dei dati, la personalizzazione e la valutazione al guardrailing, all'osservabilità e all'ottimizzazione, con una suite software interoperabile pronta per l'azienda.

Distribuzione e scalabilità ottimizzate

Crea facilmente volani di dati che utilizzano i dati aziendali per migliorare gli agenti IA, alimentando l'intero volano con una semplice distribuzione del grafico Helm o con chiamate API per varie parti del flusso di lavoro.

ROI aumentato

Addestra, personalizza e distribuisci rapidamente modelli linguistici di grandi dimensioni (LLM), modelli di linguaggio visivo (VLM), IA video e IA vocale su larga scala, riducendo i tempi di risoluzione e aumentando il ROI.

Prestazioni accelerate

Massimizza le prestazioni e il throughput degli agenti IA con l'ottimizzazione accelerata da GPU, la scalabilità e la messa a punto multi-nodo per un addestramento, una distribuzione e un miglioramento continuo a costi contenuti.

IA per agenti più sicura

Crea sistemi di IA per agenti più sicuri verificando i modelli ed eseguendo la scansione continua delle vulnerabilità.

Pronto per la produzione

Distribuisci in produzione con una soluzione sicura, ottimizzata e full-stack che offre supporto, sicurezza e stabilità delle API come parte di NVIDIA AI Enterprise

Crea, monitora e ottimizza gli agenti IA ovunque, dal cloud e il data center all'edge.

Funzionalità

Strumenti per la gestione del ciclo di vita degli agenti IA

Il ciclo di vita degli agenti IA è un processo completo per sviluppare e migliorare gli agenti IA nelle applicazioni di produzione. NVIDIA NeMo fornisce strumenti che consentono ogni fase di questo flusso di lavoro, in modo che le aziende possano creare agenti potenti, sicuri e di apprendimento continuo.

Crea
Prepara dati pronti per l'IA.

Elabora i set di dati multimodali esistenti in formati di alta qualità e pronti per l'IA per le pipeline di sviluppo e genera dati sintetici per colmare le lacune critiche nei dati.
Seleziona il modello giusto

, seleziona o crea modelli adatti al caso d'uso, convalida con benchmark accademici, esegui valutazioni personalizzate e ottimizza se necessario.
Crea il tuo agente IA

Trasforma il tuo modello personalizzato in un'applicazione scalabile, collegalo facilmente allo stack e agli strumenti aziendali e definisci i flussi di lavoro con un'orchestrazione flessibile.
Distribuisci
Distribuire il tuo agente con le massime prestazioni

Ottimizza il tuo agente per la produzione con inferenza ad alto throughput e a bassa latenza, garantendo la scalabilità per soddisfare le esigenze aziendali e fornire risposte rapide e affidabili.
  • NVIDIA NIM
    Esegui modelli IA in container ottimizzati, esposti come API compatibili con OpenAI.
Mantenersi informati sui dati e applicare le garanzie

Utilizza la generazione aumentata di recupero (RAG) per ancorare le risposte degli agenti a conoscenze affidabili, applicando al contempo le garanzie di sicurezza, conformità e moderazione dei contenuti.
  • NeMo Retriever
    Crea pipeline RAG accurate e a tutela della privacy.
  • NeMo Guardrails
    Applica la sicurezza, la conformità e il controllo di tutte le interazioni IA.
Ottimizza
Monitora e raccogli i feedback

Monitora le interazioni reali dell'agente con gli utenti e gli altri sistemi. Valuta sistematicamente le sue prestazioni e la sua precisione, trovando opportunità per migliorare continuamente.
  • NeMo Agent Toolkit
    Toolkit agnostico per creare, profilare e ottimizzare gli agenti IA.
  • NeMo Customizer
    Affina e allinea i modelli con i dati di dominio.
  • NeMo Framework
    Toolkit open source per l'addestramento e l'allineamento di LLM e modelli multimodali.
Migliora continuamente con i volani di dati

Utilizza il feedback e i dati raccolti dal monitoraggio per creare un volano basato sui dati, riaddestrando iterativamente l'agente per ottimizzare continuamente e rimanere efficace nel tempo.
  • NeMo RL
    Post-addestra e allinea i modelli su scala con tecniche di apprendimento per rinforzo avanzate.
  • NeMo Evaluator
    Confronta, testa e valuta modelli e agenti.
  • NeMo Customizer
    Affina e allinea i modelli con i dati di dominio.

Casi d'uso

Come viene utilizzato NeMo

Scopri come NVIDIA NeMo supporta i casi d'uso del settore e accelera lo sviluppo dell'IA.

Agenti IA

Gli agenti IA stanno trasformando il servizio clienti in tutti i settori, aiutando le aziende a migliorare le conversazioni con i clienti, raggiungere tassi di risoluzione elevati e aumentare la produttività dei responsabili umani. Gli agenti IA possono gestire compiti predittivi, ragionare e risolvere problemi, essere addestrati a comprendere termini specifici del settore e ricavare informazioni pertinenti dalle knowledge base di un'organizzazione, ovunque tali dati risiedano.

Generazione di dati sintetici per l'IA per agenti

I sistemi specializzati per agenti richiedono set di dati di grandi dimensioni e di alta qualità, lenti e costosi da raccogliere da fonti del mondo reale. I dati sintetici creati attraverso simulazioni o modelli di IA generativa possono eliminare questo collo di bottiglia creando scenari di addestramento illimitati senza restrizioni di privacy o problemi di qualità. Ciò consente uno sviluppo più rapido di LLM orientati al ragionamento, di decisori a più fasi e di assistenti IA multimodali.

Assistente IA

Le aziende stanno distribuendo assistenti IA per rispondere in modo efficiente alle domande di milioni di clienti e dipendenti 24 ore su 24. Grazie ai microservizi NVIDIA NIM personalizzati per LLM, RAG, IA per parlato e traduzione, questi compagni di team IA offrono risposte vocali immediate e accurate, anche in presenza di rumore di fondo, scarsa qualità sonora e diversi dialetti e accenti.

Recupero delle informazioni

Ogni anno vengono generati miliardi di file PDF, ognuno dei quali consiste, in genere, in più pagine con vari tipi di contenuto, tra cui testo, immagini, grafici e tabelle. Questa miniera d’oro di dati può essere utilizzata solo con la stessa rapidità con cui gli esseri umani sono in grado di leggerla e capirla. Tuttavia, con l'IA generativa e la RAG, questi dati non sfruttati possono essere utilizzati per ottenere informazioni aziendali in grado di aiutare i dipendenti a lavorare in modo più efficiente e ridurre i costi.

Generazione di contenuti

L'IA generativa consente di generare contenuti altamente pertinenti, personalizzati e accurati, basati sulle competenze di dominio e sulla proprietà intellettuale proprietaria dell'azienda.

Robot umanoide

I robot umanoidi vengono progettati per adattarsi rapidamente agli ambienti di lavoro urbani e industriali esistenti, svolgendo compiti noiosi, ripetitivi o fisicamente impegnativi. Grazie alla loro versatilità, vengono impiegati in luoghi di natura differente, dalle fabbriche alle strutture sanitarie, dove stanno assistono gli esseri umani e contribuiscono ad alleviare la carenza di manodopera con l'automazione.

Apptronik

Opzioni per iniziare

Come iniziare con NVIDIA NeMo

Gestisci il ciclo di vita degli agenti IA con strumenti e tecnologie per creare, monitorare e ottimizzare gli agenti IA nella produzione.

1

Prova i modelli di base ottimizzati per NVIDIA come NVIDIA Nemotron.

2

Crea, monitora e ottimizza gli agenti IA con NVIDIA NeMo.

3

Inizia a creare le tue soluzioni di IA con NVIDIA Blueprints.

Testimonianze dei clienti

Come i leader del settore stanno guidando l'innovazione con NeMo

Utilizzatori

Principali utilizzatori in tutti i settori

Risorse

Le ultime novità nelle risorse NVIDIA NeMo

Inizia con la personalizzazione degli LLM

In questo corso, non affronterai solo il prompt engineering per LLM, ma apprenderai le tecniche per personalizzare in modo efficiente gli LLM pre-addestrati per i tuoi casi d'uso specifici. Utilizzando i microservizi NVIDIA NIM, NeMo Curator e NeMo Framework, imparerai diversi metodi di ottimizzazione efficienti dal punto di vista dei parametri per personalizzare il comportamento degli LLM per la tua organizzazione.

Potenzia le tue competenze LLM

Approfitta del nostro percorso di apprendimento completo sugli LLM, che affronta argomenti di base e avanzati, con corsi di formazione pratica sviluppati ed erogati dagli esperti NVIDIA. Puoi scegliere la flessibilità dei corsi di autoapprendimento o iscriverti a workshop con docenti per ottenere un certificato di competenza.

Ottieni la certificazione NVIDIA

Mostra le tue competenze nell'IA generativa e fai progredire la tua carriera ottenendo la certificazione NVIDIA. Il nostro nuovo programma di certificazione professionale offre due esami per sviluppatori incentrati sulla competenza nei modelli linguistici di grandi dimensioni (LLM) e sulle capacità nel flusso di lavoro multimodale.

Addestra un LLM in grado di ragionare in un fine settimana

Scopri una ricetta semplice ed efficiente dal punto di vista computazionale per addestrare i modelli di ragionamento con piccole quantità di dati di addestramento selezionati dal set di dati di post-addestramento Llama Nemotron e NVIDIA NeMo.

Ottimizza gli agenti IA utilizzando un volano di dati

Scopri come ottimizzare gli agenti IA in produzione utilizzando NVIDIA Data Flywheel Blueprint, un ciclo continuo di distillazione, messa a punto e valutazione basato sui microservizi NeMo e NIM.

Crea agenti IA con il toolkit open source NeMo Agent

Scopri come creare, integrare e ottimizzare agenti IA personalizzati utilizzando il toolkit Python open source NVIDIA NeMo Agent.

Prossimi passi

Vuoi iniziare?

Utilizza gli strumenti e le tecnologie giusti per portare le tue applicazioni di IA per agenti dallo sviluppo alla produzione.

Per gli sviluppatori

Scopri tutto ciò di cui hai bisogno per iniziare a sviluppare con NVIDIA NeMo, tra cui la documentazione più recente, i tutorial, i blog tecnici e altro ancora.

Contattaci

Parla con uno specialista di prodotto NVIDIA per passare dal progetto pilota alla produzione grazie alla sicurezza, alla stabilità delle API e al supporto forniti con NVIDIA AI Enterprise.

Shell

Shell addestra chatbot IA personalizzati con NVIDIA NeMo per migliorare le operazioni

Shell, leader globale nel settore energetico, ha utilizzato NVIDIA NeMo™ per sviluppare un chatbot AI personalizzato per l'esperienza nel campo della chimica. Questa soluzione innovativa ha il potenziale per migliorare significativamente la produttività dei dipendenti, semplificando i processi di ricerca, migliorando il processo decisionale e sostenendo la ricerca e lo sviluppo in ambienti produttivi.

AI Sweden

Accelera le applicazioni di settore con gli LLM

AI Sweden ha agevolato le applicazioni di modelli linguistici locali fornendo facile accesso a un potente modello da 100 miliardi di parametri. Ha digitalizzato i documenti storici per sviluppare modelli linguistici per uso commerciale.

Amazon

Come Amazon e NVIDIA aiutano i venditori a creare schede prodotto migliori con l'IA

Amazon raddoppia la velocità di inferenza per le nuove funzionalità IA utilizzando NVIDIA TensorRT-LLM e le GPU per aiutare i venditori a ottimizzare gli annunci dei prodotto più velocemente.

Amdocs

NVIDIA e Amdocs portano l'IA generativa personalizzata nel settore globale delle telecomunicazioni

Amdocs prevede di creare LLM personalizzati per il settore globale delle telecomunicazioni il cui volume d'affari si aggira intorno ai 1,7 miliardi di dollari, utilizzando NVIDIA AI Foundry Service su Microsoft Azure.

AT&T

AT&T migliora la precisione, l'efficienza e le prestazioni degli agenti IA del servizio clienti con NVIDIA NeMo

AT&T, una delle più grandi aziende di telecomunicazioni al mondo, sta reinventando il servizio clienti grazie alla potenza dell'IA. Di fronte a sfide come la deriva dei modelli, le crescenti esigenze computazionali e la necessità di accesso ai dati in tempo reale, AT&T si è rivolta ai microservizi NVIDIA NeMo™ per creare una piattaforma IA basata sul feedback in grado di migliorare continuamente le prestazioni, ottimizzando costi, velocità e conformità.

AWS

NVIDIA potenzia l'addestramento per alcuni dei più grandi modelli Amazon Titan Foundation

Amazon ha sfruttato il framework NVIDIA NeMo, le GPU e le AWS EFAs per addestrare il suo LLM di nuova generazione, offrendo ad alcuni dei più grandi clienti di modelli di base Amazon Titan Foundation una soluzione più veloce e accessibile per l'IA generativa.

Accenture

Accelera l'adozione dell'IA generativa per le aziende

ServiceNow, NVIDIA e Accenture hanno annunciato il lancio di AI Lighthouse, un programma unico nel suo genere progettato per accelerare lo sviluppo e l'adozione di funzionalità di IA generativa aziendale.

Azure

Sfruttare la potenza di NVIDIA AI Enterprise su Azure Machine Learning

Accedi a un ecosistema completo di strumenti, librerie, framework e servizi di supporto personalizzati per ambienti aziendali su Microsoft Azure.

Bria

Bria crea IA generativa responsabile per le aziende che utilizzano NVIDIA NeMo, Picasso

Bria, una start-up di Tel Aviv, aiuta le aziende in cerca di metodi responsabili per integrare la tecnologia dell'IA generativa visiva nei prodotti aziendali, con un servizio di IA generativa che enfatizza la trasparenza dei modelli insieme all'equità di attribuzione e alle protezioni del copyright.

Cohesity

La superpotenza per i dati: i microservizi NVIDIA liberano l'IA generativa sicura di livello enterprise per Cohesity

Con NVIDIA NIM e i modelli ottimizzati, i clienti di Cohesity Data Protect possono aggiungere i dati di IA generativa ai backup e agli archivi dei dati. Questo consente a Cohesity e NVIDIA di portare la potenza dell’IA generativa a tutti i clienti di Cohesity DataProtect. Sfruttando l'efficacia dei modelli ottimizzati NIM e NVIDIA, i clienti di Cohesity DataProtect ottengono la potenza delle informazioni basate sui dati dai backup e dagli archivi, raggiungendo nuovi livelli di efficienza, innovazione e crescita.

CrowdStrike

Plasmare il futuro dell'IA nel settore della sicurezza informatica

CrowdStrike e NVIDIA stanno sfruttando il calcolo accelerato e l'IA generativa per fornire ai clienti una gamma innovativa di soluzioni personalizzate basate sull'IA per affrontare in modo efficiente le minacce alla sicurezza.

Dell

Design convalidato da Dell per l'IA generativa con NVIDIA

Dell Technologies e NVIDIA hanno annunciato un'iniziativa per facilitare alle aziende la creazione e l'uso di modelli di IA generativa in locale, in modo rapido e sicuro.

Deloitte

Sblocca il valore dell'IA generativa nelle piattaforme software aziendali

Deloitte utilizzerà la tecnologia e le competenze in IA di NVIDIA per creare soluzioni IA ad alte prestazioni per piattaforme software aziendali e ottenere un significativo valore aziendale.

Domino Data Lab

Domino offre IA generativa pronta per la produzione basata su NVIDIA

Con NVIDIA NeMo, i data scientist possono calibrare gli LLM nella piattaforma Domino per casi d'uso specifici basati su dati e IP proprietari, senza dover ricominciare da zero. 

Dropbox

Dropbox e NVIDIA porteranno l'IA generativa personalizzata a milioni di clienti

Dropbox prevede di utilizzare la fonderia IA di NVIDIA per creare modelli personalizzati e migliorare il lavoro cognitivo basato sull'IA con lo strumento di ricerca universale Dropbox Dash e Dropbox AI.

Google Cloud

I titani dell'IA collaborano per creare la magia dell'IA generativa

Alla sua conferenza Next, Google Cloud ha annunciato la disponibilità delle sue istanze A3 con GPU NVIDIA H100 Tensor Core. I team di progettazione di entrambe le aziende hanno collaborato per portare NVIDIA NeMo nelle istanze A3 per accelerare training e inferenza.

Hugging Face

La principale community di IA per accelerare la pipeline di selezione dei dati

Hugging Face, la principale piattaforma aperta per sviluppatori IA, collabora con NVIDIA per integrare NeMo Curator e accelerare DataTrove, la libreria di deduplica e filtraggio dei dati. “Siamo entusiasti delle capacità di accelerazione con GPU di NeMo Curator e non vediamo l’ora di vederle applicate a DataTrove!”, afferma Jeff Boudier, direttore di prodotto di Hugging Face.

KT

Creare nuove esperienze clienti con gli LLM

Il principale operatore di telefonia mobile in Corea del Sud crea modelli LLM con miliardi di parametri, addestrati sulla piattaforma NVIDIA DGX SuperPOD™ e con framework NeMo per alimentare smart speaker e call center.

Lenovo

Nuova architettura di riferimento per l'IA generativa basata su LLM

Soluzione per accelerare l'innovazione consentendo a partner e clienti globali di sviluppare, addestrare e distribuire l'IA su larga scala in tutti i settori con la massima sicurezza ed efficienza.

Quantiphi

Permettere alle aziende di accelerare i percorsi basati su IA

Quantiphi è specializzata nell'addestramento e nell'ottimizzazione dei modelli di base con il framework NVIDIA NeMo e nell'ottimizzazione delle distribuzioni su larga scala con la piattaforma software NVIDIA AI Enterprise, nel rispetto dei principi dell'IA responsabile.

SAP

SAP e NVIDIA accelerano l'adozione dell'IA generativa in tutte le applicazioni aziendali che alimentano i settori globali

I clienti possono sfruttare i loro dati aziendali nelle soluzioni cloud di SAP utilizzando modelli linguistici di grandi dimensioni personalizzati distribuiti con i servizi di foundry NVIDIA AI e i microservizi NVIDIA NIM.

ServiceNow

Costruire l'IA generativa nell'IT aziendale

ServiceNow sviluppa LLM personalizzati sulla piattaforma ServiceNow per consentire l'automazione intelligente dei flussi di lavoro e aumentare la produttività nei processi IT aziendali.

Perplexity

Migliora le prestazioni dei modelli per i motori di ricerca basati sull'IA

Grazie a NVIDIA NeMo, Perplexity intende personalizzare rapidamente modelli innovativi al fine di migliorare l'accuratezza e la qualità dei risultati di ricerca e ottimizzarli per una latenza inferiore e un throughput elevato per una migliore esperienza utente.

VMware

VMware e NVIDIA offrono l'IA generativa per le imprese

VMware Private AI Foundation con NVIDIA consentirà alle aziende di personalizzare i modelli ed eseguire applicazioni di IA generativa, tra cui chatbot intelligenti, assistenti, ricerca e riepilogo.

Weights & Biases

Debug, ottimizzazione e monitoraggio dei flussi LLM 

Weights & Biases aiuta i team che lavorano su casi d'uso di IA generativa o con LLM a monitorare e visualizzare tutti gli esperimenti di progettazione rapida, per consentire agli utenti di eseguire il debug e ottimizzare i flussi di LLM, nonché fornire funzionalità di monitoraggio e osservabilità per gli LLM. 

Writer

Storia di successo dell'IA generativa per una startup con NVIDIA NeMo

Utilizzando NVIDIA NeMo, Writer sta costruendo LLM che aiutano centinaia di aziende a creare contenuti personalizzati per casi d'uso aziendali in marketing, formazione, supporto e non solo. 

Arize

Arize alimenta i volani di dati IA auto-miglioranti

La piattaforma di ingegneria e osservabilità LLM di Arize integra i microservizi NVIDIA NeMo per alimentare i volani di dati IA, consentendo un perfezionamento continuo dei modelli attraverso un feedback del mondo reale. Con NeMo Customizer, Evaluator e Guardrails, Arize garantisce che i sistemi per agenti siano performanti, sicuri e allineati alle esigenze aziendali in continua evoluzione. Questa collaborazione supporta lo sviluppo dell'IA adattiva che impara ed evolve nel tempo.

DataRobot

Agenti IA pronti per il livello aziendale e affidabili con NeMo su DataRobot

Con NVIDIA NeMo integrato nella DataRobot Enterprise AI Suite, le aziende possono garantire che i sistemi per agenti siano sicuri, conformi e basati su dati specifici dell'azienda. Questa integrazione facilita lo sviluppo di agenti IA che forniscono risposte accurate e contestuali, nel rispetto degli standard organizzativi.

Datastax

DataStax e NVIDIA costruiscono una piattaforma unificata di dati e IA

Nell'ultimo anno, DataStax ha stretto una partnership con NVIDIA per adottare i microservizi NVIDIA NeMo per migliorare l'IA generativa, la generazione aumentata tramite recupero e la ricerca ibrida in tutte le sue offerte di database e IA. I risultati sono stati impressionanti: prestazioni 19 volte migliori nel throughput, una riduzione significativa dei costi e una latenza migliorata.

Galileo

Galileo e NVIDIA NeMo: mitigare i rischi dell'IA per agenti nella produzione

Galileo integra i microservizi NVIDIA NeMo per creare volani di dati IA che rafforzano le prestazioni, l'affidabilità e la fiducia degli agenti. NeMo aggiunge funzionalità complementari alla piattaforma Galileo, consentendo una messa a punto continua per ogni dominio tramite NeMo Customizer, una valutazione avanzata con NeMo Evaluator e salvaguardando le interazioni degli utenti con NeMo Guardrails per consentire ai team IA di creare, valutare e monitorare sistemi di IA per agenti che apprendono e migliorano continuamente negli ambienti del mondo reale.

Creazione e distribuzione di modelli di IA generativa

Le aziende stanno adottando l’IA generativa per rivoluzionare il modo in cui innovano, ottimizzano le operazioni e creano un vantaggio competitivo. NeMo è una piattaforma completa per la cura dei dati, l'addestramento, la personalizzazione e la valutazione di modelli multimodali oltre che per l'esecuzione di inferenze su scala. Supporta la generazione di testo, immagini, video e parlato.

Sbloccare la generazione di dati sintetici con Llama 3.1

Scopri come utilizzare il modello di Meta Llama 3.1 405B per generare dati sintetici su misura per il tuo dominio specifico ed esamina come valutarli utilizzando il modello Nemotron-4 340B Reward e garantire l'allineamento con le preferenze umane grazie a NVIDIA NeMo.

Costruire assistenti virtuali IA di livello mondiale per il servizio clienti con RAG

Scopri come le aziende possono utilizzare l'assistente virtuale IA per il servizio clienti NVIDIA AI Blueprint al fine di migliorare l'efficienza operativa delle soluzioni di contact center esistenti o per creare nuovi sistemi incentrati sul servizio clienti.