打造視覺語言模型支援的人工智慧主體。
NVIDIA VIA 是一系列工作流程的集合,用於建立能夠使用視覺語言模型 (VLM) 處理大量即時或存檔視訊和影像的 AI 代理人,無論在邊緣還是雲端皆可部署。新一代視覺化人工智慧代理人將幫助每個行業使用自然語言從影片中歸納、搜尋和擷取有用的洞見。
利用 NVIDIA NeMo 和 NVIDIA TAO 透過域適應來提高模型準確性,或使用 NVIDIA NIM 無縫更新到最新的最先進模型。
處理速度比輸入影片時間快 100 倍以上,並以自然語言提供豐富的影片摘要。
體驗由生成式 AI 驅動的多模態交互,並使用標準的 API 輕鬆與業務系統整合。
無論是影片或圖片,都可以用自然語言擷取出細微的動作和內容。
打造富有互動性的代理人。透過詢問詳盡的問題或做出相關的要求,以找尋出像精彩片段或獨特事件特定類型活動的剪輯影片。
探索可整理影片摘要和搜尋影片內容的人工智慧主體,瞭解它的強大功能。
瞭解如何運用視覺人工智慧主體,駕馭生成式人工智慧和大型語言模型