Agenti di IA visiva basati sull'IA generativa

Agenti IA per l'analisi video e Analytics

Scopri una raccolta di flussi di lavoro di riferimento che utilizzano modelli linguistici visivi per offrire capacità di percezione visiva ricca e interattiva a una vasta gamma di settori.

Scopri l'IA visiva

Panoramica
Implementazione tecnica
FAQ
Inizia
Resources
Implementa agenti IA
correlate dei clienti

Panoramica
Implementazione tecnica
FAQ
Inizia
Resources
Implementa agenti IA
correlate dei clienti

Scopri l'IA visiva

Carichi di lavoro

Computer vision /Analisi video

Settori

Vendita al dettaglio/ beni di consumo confezionati
Produzione industriale
Città/Spazi intelligenti
Sanità e bioscienze

Obiettivo aziendale

Ritorno sugli investimenti
Innovazione

Prodotti

Panoramica

Alimenta una nuova generazione di applicazioni

Le applicazioni tradizionali di analisi video e i relativi flussi di lavoro di sviluppo sono tipicamente basati su modelli a funzione fissa e limitata, progettati per rilevare e identificare solo un insieme selezionato di oggetti predefiniti. Con l'IA generativa e i modelli di base, ora puoi creare applicazioni utilizzando meno modelli, ma con una percezione incredibilmente complessa e ampia, nonché una ricca comprensione contestuale. Questa nuova generazione di modelli linguistici visivi (VLM), come NVIDIA Cosmos™ Reason, sta dando vita ad agenti IA per l'analisi video intelligenti e potenti

Che cos'è un agente di IA visiva?

Un agente IA per l'analisi video può vedere, ragionare e agire combinando le modalità visive e linguistiche per comprendere una vasta gamma di domande o prompt in linguaggio naturale applicate a uno stream video registrato o dal vivo. Questa comprensione più approfondita dei contenuti video consente interpretazioni più precise e significative, migliorando la funzionalità delle applicazioni di analisi video e l'analisi di scenari del mondo reale. Questi agenti promettono di ottenere informazioni e fornire possibilità di automazione completamente nuove.

Semplificare ogni spazio e operazione

Gli agenti IA per l'analisi video altamente percettiva, accurata e interattiva verranno distribuiti in tutte le fabbriche, i magazzini, i negozi al dettaglio, gli aeroporti, gli incroci stradali e altro ancora. Ciò avrà un impatto enorme sui team operativi che cercano di rendere gli spazi più sicuri e prendere decisioni migliori utilizzando informazioni più ricche generate dalle interazioni naturali. I manager e i team operativi comunicheranno inoltre con questi agenti in linguaggio naturale, tutti basati sull'IA generativa e sui VLM con i microservizi NVIDIA NIM™ al centro.

Creare agenti IA per l'analisi video

Esplora il flusso di lavoro di riferimento, basato su diversi modelli di linguaggio visivo e crea facilmente il tuo agente per l'analisi video.

Scopri AI Blueprint

Collegamenti rapidi

Tre modi per portare l'IA per agenti nelle applicazioni di visione artificiale

NVIDIA, Nokia e T-Mobile creano un'infrastruttura AI-RAN per applicazioni IA complete

Guarda: Creare città intelligenti con i Digital Twins e l'IA per agenti

Leggi: Kaohsiung City utilizza l'IA visiva per ottimizzare le operazioni urbane

Implementazione tecnica

Sviluppare con NVIDIA Cosmos Reason NIM

Il cervello all'interno di ogni agente IA per l'analisi video è un VLM in grado di vedere e ragionare. Due VLM comuni sono Cosmos Embed e Cosmos Reason. Entrambi possono essere utilizzati per aumentare le attuali applicazioni di visione artificiale con metadati avanzati e riepiloghi dei contenuti.

NVIDIA NIM è un set di microservizi di inferenza accelerati ottimizzati per le GPU NVIDIA e include API standard di settore, codice specifico per dominio, motori di inferenza ottimizzati e runtime aziendale. Fornisce una combinazione di VLM, modelli linguistici di grandi dimensioni (LLM) e Retrieval-Augmented Generation (RAG) per creare un agente IA per l'analisi video in grado di elaborare immagini o video dal vivo o archiviati per estrarre informazioni utili utilizzando il linguaggio naturale. Abbiamo creato un flusso di lavoro di riferimento di un agente IA per l'analisi video da provare per accelerare il processo di sviluppo.

Collegamenti rapidi

Scarica NVIDIA Cosmos Reason NIM

Scopri di più su Cosmos Cookbook

Leggi: I pionieri del settore creano agenti più intelligenti con modelli di ragionamento NVIDIA Nemotron e Cosmos

Prova il flusso di lavoro dell'agente IA per l'analisi video di riferimento

Leggi: Creare agenti IA per l'analisi video multimodale basati su NVIDIA NIM

Creare agenti IA con NVIDIA VSS Blueprint

Il Blueprint NVIDIA per la ricerca e il riepilogo video (VSS) semplifica la creazione e la personalizzazione di agenti IA per l'analisi video utilizzando l'IA generativa, VLM, LLM, RAG e NVIDIA NIM. Gli agenti IA di analisi video ricevono attività attraverso il linguaggio naturale e possono analizzare, interpretare ed elaborare grandi quantità di dati video per fornire informazioni critiche che aiutano una vasta gamma di settori a ottimizzare i processi, migliorare la sicurezza e ridurre i costi.

VSS fornisce componenti modularizzati che consentono un'elevata flessibilità, microservizi accelerati che supportano l'intelligenza video in tempo reale, la ricerca agentica su diversi embedding e capacità complete di generazione di report.

VSS consente inoltre l'integrazione fluida dell'IA generativa nelle pipeline di visione artificiale esistenti, migliorando l'ispezione, la ricerca e l'analisi con la comprensione multimodale e il ragionamento zero-shot. VSS è facilmente distribuito dall'edge al cloud su piattaforme tra cui NVIDIA RTX™ 4500, NVIDIA RTX PRO™ 6000, NVIDIA DGX Spark™ e NVIDIA® Jetson Thor™.

Collegamenti rapidi

Prova il Blueprint su cloud con Launchable

Ricerca agentica per attributi, eventi e azioni utilizzando il linguaggio naturale

Come integrare le pipeline di visione artificiale con l'IA generativa e il ragionamento

Ottieni informazioni ricche di contesto sugli avvisi con i VLM

Agenti IA avanzati per l'analisi video utilizzando NVIDIA AI Blueprint per la ricerca e il riepilogo video

Livestream: creare agenti di IA visiva con NVIDIA Cosmos Reason e NVIDIA Metropolis

Implementazione tecnica

Sviluppa con NVIDIA NIM

NVIDIA NIM è un set di microservizi di inferenza che include API standard di settore, codice specifico di dominio, motori di inferenza ottimizzati e runtime aziendale. Offre una combinazione di VLM, LLM e RAG per creare il tuo agente IA per l'analisi video in grado di elaborare immagini o video live o archiviati per estrarre informazioni utili utilizzando il linguaggio naturale. Abbiamo creato un flusso di lavoro di riferimento di un agente IA per l'analisi video da provare per accelerare il processo di sviluppo.

Collegamenti rapidi

Prova il flusso di lavoro dell'agente IA per l'analisi video di riferimento

Leggi il blog sulla creazione di agenti IA per l'analisi video multimodale basati su NVIDIA NIM

Creare agenti più intelligenti con modelli di ragionamento NVIDIA Nemotron e Cosmos per applicazioni di IA aziendale e fisica

Crea agenti IA con NVIDIA AI Blueprint

NVIDIA AI Blueprint per la ricerca e il riepilogo di video (VSS) semplifica la creazione e la personalizzazione di agenti IA di analisi video, il tutto basato sull'IA generativa, su modelli linguistici visivi (VLM), modelli linguistici di grandi dimensioni (LLM) e NVIDIA NIM. Gli agenti IA di analisi video ricevono compiti in linguaggio naturale e sono in grado di elaborare grandi quantità di dati video per fornire informazioni critiche che aiutano diversi settori a ottimizzare i processi, migliorare la sicurezza e ridurre i costi.

VSS consente l'integrazione fluida dell'IA generativa nelle pipeline di visione artificiale esistenti, migliorando l'ispezione, la ricerca e l'analisi con la comprensione multimodale e il ragionamento zero-shot. Puoi facilmente distribuire from the edge al cloud su piattaforme tra cui NVIDIA RTX PRO™ 6000, NVIDIA DGX™ Spark e NVIDIA® Jetson Thor™.

Collegamenti rapidi

Prova il Blueprint su cloud con Launchable

Come integrare le pipeline di visione artificiale con l'IA generativa e il ragionamento

Leggi il blog: Migliora gli agenti IA per l'analisi video utilizzando il NVIDIA AI Blueprint per la ricerca e il riepilogo video

Livestream: costruisci agenti di IA visiva con NVIDIA Cosmos Reason e Metropolis

FAQ

NVIDIA NIM è un set di microservizi di facile utilizzo progettati per l'implementazione sicura e affidabile di inferenze di modelli di IA ad alte prestazioni su cloud, data center e workstation. Supporta un'ampia gamma di modelli IA, tra cui i modelli di community open source e della NVIDIA AI Foundation, per garantire un'inferenza IA semplice e scalabile, on-premise o nel cloud, utilizzando le API standard di settore. Tutti i microservizi NIM e le API di anteprima associate sono disponibili all'indirizzo build.nvidia.com.

Visita build.nvidia.com per creare un account e iniziare a esplorare i microservizi NIM disponibili. Puoi dare un'occhiata a NVIDIA Cosmos Reason VLM NIM.

Prova gratuitamente NVIDIA AI Blueprint per la ricerca e il riepilogo video.

Tutti gli utenti possono iniziare gratuitamente con le API di anteprima su build.nvidia.com. Ogni nuovo account può ricevere fino a 5.000 crediti per provare le API. Per continuare lo sviluppo dopo l'esaurimento dei crediti, è possibile distribuire i microservizi NIM scaricabili a livello locale sull'hardware o su un'istanza cloud. Gli sviluppatori possono inoltre accedere a NIM tramite il programma per sviluppatori NVIDIA. Scopri di più nelle domande frequenti.

NVIDIA NIM è gratuito per gli sviluppatori. Per andare in produzione, i microservizi NIM scaricabili richiedono una licenza NVIDIA AI Enterprise. Per saperne di più, visita questa pagina .

Il forum per sviluppatori NIM è il posto migliore per porre domande e interagire con la nostra community di sviluppatori. Puoi accedere ai forum qui.

Panoramica
Implementazione tecnica
FAQ

Alimenta una nuova generazione di applicazioni

Le applicazioni tradizionali di analisi video e i relativi flussi di lavoro di sviluppo sono tipicamente basati su modelli a funzione fissa e limitata, progettati per rilevare e identificare solo un insieme selezionato di oggetti predefiniti. Con l'IA generativa e i modelli di base, ora puoi creare applicazioni utilizzando meno modelli, ma con una percezione incredibilmente complessa e ampia, nonché una ricca comprensione contestuale. Questa nuova generazione di modelli linguistici visivi (VLM) sta dando vita a potenti e intelligenti agenti di IA visiva.

Che cos'è un agente di IA visiva?

Un agente IA di analisi video può combinare sia le modalità visive che linguistiche per comprendere i prompt in linguaggio naturale e fornire risposte a domande visive. Ad esempio, può rispondere a una vasta gamma di domande in linguaggio naturale applicabili a un flusso video registrato o in diretta. Questa comprensione più approfondita dei contenuti video consente interpretazioni più precise e significative, migliorando la funzionalità delle applicazioni di analisi video e l'analisi di scenari del mondo reale. Questi agenti promettono di ottenere informazioni e fornire possibilità di automazione completamente nuove.

Ottimizza ogni operazione industriale

Agenti di IA visiva altamente percettivi, precisi e interattivi saranno implementati nelle nostre fabbriche, magazzini, negozi al dettaglio, aeroporti, incroci stradali e molto altro. Ciò avrà un impatto enorme sui team operativi che cercano di prendere decisioni migliori utilizzando approfondimenti più ricchi generati da interazioni naturali. I manager e i team operativi potranno dialogare con questi agenti in linguaggio naturale, grazie all'AI generativa e ai grandi modelli linguistici visivi, alimentati dai microservizi NVIDIA NIM™.

Link rapidi

Conferenza GTC: sfruttare l'IA generativa e i modelli linguistici di grandi dimensioni con gli agenti di IA visiva

Leggi il blog: NVIDIA lancia il blueprint per agenti IA in grado di analizzare video

Leggi il blog: L'IA diventa reale: i nuovi microservizi NVIDIA NIM portano l'IA generativa in ambienti digitali

Leggi il caso di studio di Pegatron

Leggi il caso di studio di Linker Vision

Sviluppa con NVIDIA NIM

NVIDIA NIM è un insieme di microservizi di inferenza che include API standard di settore, codice specifico per i vari domini, motori di inferenza ottimizzati e un runtime aziendale. Fornisce diversi modelli linguistici visivi per creare il tuo agente di IA visiva, in grado di elaborare immagini o video in diretta o archiviati per estrarre informazioni utili utilizzando il linguaggio naturale. Abbiamo creato un flusso di lavoro di riferimento per un agente di IA visiva che puoi provare per accelerare il tuo processo di sviluppo.

Link rapidi

Prova il flusso di lavoro di riferimento per l'agente di IA visiva

Crea agenti IA con NVIDIA AI Blueprint

Gli agenti IA creati sulla base del blueprint possono analizzare, interpretare ed elaborare i dati video su vasta scala, producendo sintesi video fino a 200 volte più velocemente rispetto all'analisi manuale dei video. Il blueprint è in grado di accelerare lo sviluppo di agenti IA riunendo vari modelli e servizi di IA generativa, oltre a offrire la massima flessibilità grazie a un'ampia gamma di VLM/LLM di NVIDIA e di terze parti, oltre a opzioni di distribuzione ottimizzate dall'edge al cloud.

Link rapidi

Scarica i microservizi NVIDIA VIA

Blog tecnico: crea agenti di IA visiva con i microservizi NVIDIA VIA e NIM

Crea agenti periferici con Jetson Platform Services

Gli sviluppatori possono creare agenti di IA visiva potenziati dalla piattaforma di IA Edge NVIDIA Jetson™ utilizzando la nuova funzionalità di NVIDIA JetPack™: Jetson Platform Services. L'applicazione di IA generativa funziona interamente su un dispositivo NVIDIA Jetson Orin™, capace di rilevare eventi per generare avvisi e facilitare sessioni interattive di domande e risposte.

Link rapidi

Scarica il flusso di lavoro di riferimento per JetsonTM

Blog tecnico: sviluppa agenti di IA visiva basati sull'IA generativa per i sistemi periferici

NVIDIA NIM è un set di microservizi di facile utilizzo progettati per l'implementazione sicura e affidabile di inferenze di modelli di IA ad alte prestazioni su cloud, data center e workstation. Supporta un'ampia gamma di modelli IA, tra cui i modelli di community open source e NVIDIA AI Foundation, per garantire un'inferenza IA semplice e scalabile, on-premise o nel cloud, utilizzando le API standard di settore. Tutti i microservizi NIM e le API di anteprima associate sono disponibili all'indirizzo build.nvidia.com.

Per iniziare a utilizzare i microservizi NIM e NVIDIA AI Blueprints, visita il sito build.nvidia.com per creare un account e iniziare a scoprire i microservizi NIM disponibili. Puoi verificare i NIM VLM disponibili qui.

Prova gratuitamente NVIDIA AI Blueprint per la ricerca e il riepilogo di video.

NVIDIA NIM è gratuito per gli sviluppatori. Per andare in produzione, i microservizi NIM scaricabili richiedono una licenza NVIDIA AI Enterprise. Per saperne di più, visita questa pagina .

Il forum per sviluppatori NIM è il posto migliore per porre domande e interagire con la nostra community di sviluppatori. Puoi accedere ai forum qui.

Crea agenti di IA visiva

Esplora il flusso di lavoro di riferimento, alimentato da diversi modelli linguistici visivi, per creare facilmente il tuo agente di IA visiva.

Prova i modelli linguistici visivi

Scopri VSS Blueprint

Sviluppatori in azione

Creare un agente per la ricerca e il riepilogo di video

Scopri NVIDIA AI Blueprint per la ricerca e il riepilogo video, integrando VLM, LLM e RAG complessi con microservizi di supporto.

Leggi il blog

Sviluppare agenti AI per l'analisi video per l'edge

Esplora gli agenti IA per l'analisi video basati su VLM nell'edge utilizzando NVIDIA Jetson Platform Services.

Leggi il blog

Crea agenti IA avanzati per l'analisi video

Scopri l'ultima evoluzione di NVIDIA AI Blueprint per la ricerca e il riepilogo video, ora disponibile al vasto pubblico.

Leggi il blog

Crea app XR multimodali in tempo reale

Scopri come utilizzare NVIDIA AI Blueprint per la ricerca e la generazione di riepiloghi video per supportare l'audio in un ambiente XR.

Leggi il blog

Visualizza tutti i blog VLM Tech

Implementa agenti IA dall'edge al cloud

Sfrutta la potenza del blueprint VSS per distribuire agevolmente agenti IA dall'edge al cloud, con prestazioni scalabili su una vasta gamma di GPU.

Accelera i carichi di lavoro di IA fisica con le GPU NVIDIA RTX PRO 6000 serie Blackwell

Le GPU NVIDIA RTX PRO™ 6000 serie Blackwell accelerano l'IA fisica eseguendo ogni tipo di carico di lavoro per lo sviluppo robotico, inclusi l'addestramento, la generazione di dati sintetici, l'apprendimento robotico e la simulazione.

Scopri di più

NVIDIA DGX Spark

DGX™ Spark porta la potenza di NVIDIA Grace Blackwell sui desktop degli sviluppatori. Il Superchip GB10, associato a 128 GB di memoria di sistema unificata, consente ai ricercatori di IA, ai data scientist e agli studenti di lavorare localmente con modelli IA con fino a 200 miliardi di parametri.

Scopri di più

NVIDIA Jetson Thor

Accelera il futuro dell'IA fisica e della robotica con i moduli della serie NVIDIA Jetson Thor che offrono fino a 2070 FP4 TFLOPS di calcolo IA e 128 GB di memoria, il tutto in un fattore di forma compatto.

Scopri di più

Storie correlate dei clienti

Altre storie dei clienti

Agenti IA per l'analisi video e Analytics

Alimenta una nuova generazione di applicazioni

Che cos'è un agente di IA visiva?

Semplificare ogni spazio e operazione

Creare agenti IA per l'analisi video

Sviluppare con NVIDIA Cosmos Reason NIM

Creare agenti IA con NVIDIA VSS Blueprint

Sviluppa con NVIDIA NIM

Crea agenti IA con NVIDIA AI Blueprint

Che cos'è un microservizio NIM?

Come posso iniziare a utilizzare i VLM e NVIDIA AI Blueprint per la ricerca e il riepilogo di video

Come posso ottenere crediti per build.nvidia.com?

Devo pagare per utilizzare un NIM scaricabile?

Come posso ottenere supporto tecnico per la prototipazione con i microservizi NIM

Alimenta una nuova generazione di applicazioni

Che cos'è un agente di IA visiva?

Ottimizza ogni operazione industriale

Sviluppa con NVIDIA NIM

Crea agenti IA con NVIDIA AI Blueprint

Crea agenti periferici con Jetson Platform Services

Che cos'è un microservizio NIM?

Come posso iniziare a utilizzare i VLM e NVIDIA AI Blueprint per la ricerca e il riepilogo di video

Come posso ottenere crediti per build.nvidia.com?

Devo pagare per utilizzare un NIM scaricabile?

Come posso ottenere supporto tecnico per la prototipazione con i microservizi NIM

Crea agenti di IA visiva

Sviluppatori in azione

Creare un agente per la ricerca e il riepilogo di video

Sviluppare agenti AI per l'analisi video per l'edge

Crea agenti IA avanzati per l'analisi video

Crea app XR multimodali in tempo reale

Implementa agenti IA dall'edge al cloud

Accelera i carichi di lavoro di IA fisica con le GPU NVIDIA RTX PRO 6000 serie Blackwell

NVIDIA DGX Spark

NVIDIA Jetson Thor

Storie correlate dei clienti