NVIDIA NeMo

這套全方位的軟體套件，可以企業規模打造 AI 代理，並在其生命週期持續監測及最佳化。

開始使用

說明文件

概覽
優勢
特色
使用案例
入門選項
客戶案例
採用者
資源
後續步驟

概覽
優勢
特色
使用案例
入門選項
客戶案例
採用者
資源
後續步驟

開始使用

概覽

NVIDIA NeMo 是什麼？

NVIDIA NeMo™ 是管理 AI 代理生命週期用的模組化軟體套件。它針對資料處理、模型微調與評估、強化學習、政策執行與系統可觀察性，提供微服務和工具套件。NeMo 協助企業在任何 GPU 加速基礎架構大規模打造、監測及最佳化代理型 AI 系統。它與現有 AI 平台整合，支援雲端、內部部署和混合式部署，讓企業能快速管理並輕鬆建立持續將 AI 代理最佳化的資料飛輪。

打造資料飛輪用的全新 NVIDIA AI Blueprint

這款全新的 AI 藍圖現已上市，可讓開發人員建置自動化的資料飛輪，以更精確高效的模型持續驅動生成式與代理 AI 應用。

立即試用

優勢

探索 NVIDIA NeMo 在代理 AI 方面的優勢

模組化 AI 代理生命週期管理

利用可互通的企業級軟體套件管理 AI 代理生命週期，範圍涵蓋資料庋用、自訂、評估，以及防護、可觀察性與最佳化。

無縫部署與擴充

輕鬆打造資料飛輪，運用企業資料改善 AI 代理，透過簡單的 Helm 圖表部署或針對工作流程各環節的 API 呼叫，驅動整個飛輪。

投資報酬率更高

大規模訓練、自訂及部署大型語言模型 (LLM)、視覺語言模型 (VLM)、影片 AI 和語音 AI，縮短解決問題的時間，提高投資報酬率。

效能加速

透過 GPU 加速最佳化、多節點擴充和調整，實現符合成本效益的訓練、部署和持續改善，將 AI 代理效能與傳輸量最大化。

更安全的代理 AI

透過審查模型、設置提示防護機制，以及持續掃描漏洞，打造更安全的代理 AI 系統。

正式環境就緒

NVIDIA AI Enterprise 中安全且最佳化的完整堆疊解決方案，提供支援、安全性及 API 穩定性，是部署至正式環境的利器。

在雲端、資料中心與邊緣端，隨時隨地打造、監測及最佳化 AI 代理。

特色

管理 AI 代理生命週期的工具

AI 代理生命週期是實際應用時開發及改善 AI 代理的端到端流程。NVIDIA NeMo 提供實現這項工作流程每一步的工具，讓企業能打造強大、安全且持續學習的代理。

打造
準備 AI 就緒的資料處理現有的多模態資料集，將其轉化為開發流程用的高品質 AI 就緒格式，並生成合成資料，縮小關鍵的資料差距。	NeMo Curator 清理、篩選及準備多模態資料。 NeMo Data Designer 從頭開始建立特定領域的資料集。
選擇合適的模型挑選或打造適合使用案例的模型、利用學術基準測試驗證、執行自訂評估，並根據需要微調。	NVIDIA Nemotron 尖端的開放式多模態推理模型。 NeMo Retriever RAG 流程的擷取、嵌入與重新排序模型。 NeMo Evaluator 對模型與代理進行基準測試、測試及評估。
打造 AI 代理將自訂模型轉化為可擴充的應用程式，並將它無縫連接至企業堆疊和工具，並以彈性協調方式定義工作流程。	NeMo Agent 工具套件可建置、剖析及最佳化 AI 代理的工具套件，不受框架侷限。
部署
以最高效能部署代理利用高傳輸量低延遲的推論，為正式環境將代理最佳化，確保能隨著企業需求擴充，並提供快速可靠的回應。	NVIDIA NIM 在最佳化容器中執行 AI 模型，透過與 OpenAI 相容的 API 形式開放使用。
奠基於資料並實施防護機制運用檢索增強生成 (RAG) 技術，讓代理回應參考可靠的知識，並採用安全、合規與內容審核的防護機制。	NeMo Retriever 建構準確且保護隱私的 RAG 流程。 NeMo Guardrails 強化 AI 互動的安全性、合規性與控制能力。
最佳化
監測及收集意見回饋追蹤代理與使用者和其他系統的實際互動。以系統化的方式評估效能與準確度，尋找持續改善的機會。	NeMo Agent 工具套件可建置、剖析及最佳化 AI 代理的工具套件，不受框架侷限。 NeMo Customizer 利用領域資料微調並校準模型。 NeMo Framework 用於訓練及校準 LLM 與多模態模型的開源工具套件。
利用資料飛輪持續改善運用從監測過程收集的意見回饋與資料打造資料驅動的飛輪，以迭代方式重新訓練代理，經年累月持續最佳化並維持高效。	NeMo RL 使用先進的強化學習技術，大規模進行後期訓練並校準模型。 NeMo Evaluator 對模型與代理進行基準測試、測試及評估。 NeMo Customizer 利用領域資料微調並校準模型。