NVIDIA Visual Insight Agent (VIA) Workflows

打造視覺語言模型支援的人工智慧主體。

什麼是 VIA?

NVIDIA VIA 是一系列工作流程的集合,用於建立能夠使用視覺語言模型 (VLM) 處理大量即時或存檔視訊和影像的 AI 代理人,無論在邊緣還是雲端皆可部署。新一代視覺化人工智慧代理人將幫助每個行業使用自然語言從影片中歸納、搜尋和擷取有用的洞見。

透過生成式人工智慧改造視覺應用程式

使用最新模型

利用 NVIDIA NeMoNVIDIA TAO 透過域適應來提高模型準確性,或使用 NVIDIA NIM 無縫更新到最新的最先進模型。

建立 AI 代理人來總結影片內容並找到精彩片段

處理速度比輸入影片時間快 100 倍以上,並以自然語言提供豐富的影片摘要。

多模態交互作用

體驗由生成式 AI 驅動的多模態交互,並使用標準的 API 輕鬆與業務系統整合。

查看 VIA 實際使用狀況

範例:倉庫管理

無論是影片或圖片,都可以用自然語言擷取出細微的動作和內容。

範例:運動分析

打造富有互動性的代理人。透過詢問詳盡的問題或做出相關的要求,以找尋出像精彩片段或獨特事件特定類型活動的剪輯影片。

入門資源

申請搶先體驗

探索可整理影片摘要和搜尋影片內容的人工智慧主體,瞭解它的強大功能。

觀看視覺人工智慧主體的 NVIDIA GTC 講座

瞭解如何運用視覺人工智慧主體,駕馭生成式人工智慧和大型語言模型