NVIDIA Nemotron

高效能、多模態的開放式模型,適用於長期執行的 AI 代理程式。

概覽

NVIDIA Nemotron 是什麼?

NVIDIA Nemotron™ 是一系列高效能、多模態的開放式 AI 模型,專為長期執行、能自我進化的代理程式打造。Nemotron 模型專為快速完成任務所設計,可為複雜代理程式流程提供高推理傳輸量與優異的準確度。

透過透明的訓練資料與廣泛的平台支援,包括 NVIDIA RTX PRO™ 與 NVIDIA DGX Spark™,Nemotron 模型可公開取得並整合至整個 AI 生態系統,讓可靠且高效能的 AI 代理程式能從邊緣到雲端部署於任何地方。

善用 NVIDIA 企業軟體平台,打造理想的未來工作環境

瞭解 NVIDIA 軟體如何支援長期執行的代理程式,支援跨越工程、醫療與營運的複雜流程,從而提升員工生產力。

影片

NVIDIA 為什麼打造 Nemotron

聆聽 NVIDIA 應用深度學習研究副總裁 Bryan Catanzaro 分享 Nemotron 的願景,以及為何開放技術是打造可信賴企業級 AI 的必要條件。

優勢

NVIDIA Nemotron 模型可為代理 AI 帶來哪些優勢?

高精準度

Nemotron 模型從頭開始建構,具備卓越知識、透過優質訓練資料進行後期訓練,並結合強化學習,確保長期執行的代理式系統達到頂尖準確率。

高運算效率

Nemotron 系列經過最佳化,可透過最高傳輸量與混合式 MoE 架構,加速完成代理式任務。

可實現商業化

NVIDIA 的後期訓練資料與最佳化技術,可確保為開發人員及企業提供強大、透明且具優異適應性的模型。這些模型與訓練資料已透過 Hugging Face 平台公開發布。

安全、簡單的部署作業

Nemotron 模型系列以最佳化 NVIDIA NIM™ 微服務的形式提供,提供極致的推論效能和彈性部署選項,確保卓越的安全性、隱私與可移植性。

模型

適用於多元工作負載的模型

Nemotron 模型擅長處理各種代理型 AI 任務,包括推理、多模態視覺檢索增強生成 (RAG)語音安全機制研究模型也可用於實驗。

推理

Nemotron 模型支援多種推理工作負載。Nano 為專用子代理程式提供卓越的準確度與效率,Super 提供最高準確度、傳輸量推理與工具呼叫,以在多代理程式系統上執行複雜任務,而 Ultra 則為多步驟工作流程中需要最高效能的任務關鍵型應用程式提供最佳推理能力。

視覺理解

多模態 Nemotron 模型在影片、音訊、影像與文字方面提供最高效率與領先準確度,適用於企業代理式使用案例。 針對專用子代理程式進行最佳化,支援電腦使用代理程式、文件智慧,以及影像與音訊理解等功能。

語音

NVIDIA Nemotron Speech 模型為代理 AI 應用提供高傳輸量、超低延遲的自動語音辨識 (ASR)、文字轉語音 (TTS) 與神經機器翻譯 (NMT) 功能。

檢索增強生成

Nemotron RAG 模型透過擷取多模態結構化資訊、生成高品質嵌入,以及排列相關性最高的文件,實現快速準確的文件理解。 它們提供可擴充的高速檢索技術,提升 LLM 訓練的資料品質,提高代理與檢索器效能,並簡化文件工作流程。

安全

NVIDIA Nemotron Safety 模型提供即時防護,防範有害內容、主題偏離和破解嘗試。它們為多語言、多模態內容安全層新增推理能力,加強審核並確保文化一致性。

技術

代理型 AI 的建置組件

NVIDIA NeMo™ 可打造客製化的代理型 AI、NVIDIA NIM 可迅速實現企業級部署,而 NVIDIA Blueprints 則提供可客製化的參考工作流程加速開發,是開始建置及最佳化 AI 代理的利器。

NVIDIA NeMo

  • 量身打造及部署生成式 AI 與代理式 AI。
  • 提供企業級大型語言模型 (LLM),並具備精確的資料庋用、先進的客製化功能、可擴充的資料擷取、RAG,以及加速效能。
  • 輕鬆建立資料飛輪,並以最新資訊持續最佳化 AI 代理。

NVIDIA NIM

  • 加速部署效能最佳化的生成式 AI 模型。
  • 以安全穩定 API 執行企業應用程式,並享有企業級支援。

NVIDIA Blueprints

  • 透過針對生成式 AI 使用案例的參考應用程式快速入門,例如企業深度研究和多模態 RAG。
  • 利用各種 Blueprint 加速開發,其中包含合作夥伴微服務、一或多個 AI 代理、參考程式碼、客製化文件,以及部署用的 Helm Chart。

入門選項

如何開始使用 NVIDIA Nemotron 模型

免費開始原型設計

透過易於使用的 API 端點快速上手。

  • 使用完全加速的 AI 基礎架構。
  • 確保您的資料未被用於模型訓練。
  • 無需使用點數,即可直接開始建構、測試及部署。

在推論服務提供商上執行 Nemotron 模型

在受信任的第三方推論平台上即時部署 Nemotron 模型,無需自行建置基礎設施。

  • 無需管理硬體設施即可完成部署。
  • 從原型開發到正式生產均可無縫擴展規模。
  • 透過按量計費模式優化成本。

聯絡我們

歡迎諮詢 NVIDIA AI 專家,討論如何運用 NVIDIA AI Enterprise 的安全性、API 穩定性及支援服務,讓您的生成式 AI 從測試階段推向正式生產。

  • 探索生成式 AI 使用案例。
  • 討論您的技術需求。
  • 配合您的目標與需求來調整 NVIDIA AI 解決方案。

使用案例

使用 NVIDIA Nemotron 模型的企業

資源

探索 Nemotron 模型的最新資訊

NVIDIA 為什麼打造 Nemotron

瞭解 Nemotron 如何加速創新、支援開發人員,並塑造 AI 未來。

ServiceNow 如何推動文件智慧服務

瞭解如何存取 Nemotron 的模型權重、資料集與訓練方法來實現更深入的評估,同時探索 ServiceNow 對視覺問答準確性的發現,以及開放性為何對多模態 AI 的持續改善至關重要。

推理 ON/OFF:運用 AI 推理規劃婚禮座位表

探索擁有 AI 推理能力的 LLM 如何跳脫思考框架,同時掌握家庭動態與賓客偏好,為婚禮座位表排定完美的解決方案。

部落格

常見問題

NVIDIA Nemotron 不僅是開放式模型,更是真正開源。NVIDIA 發布訓練資料集、技術與模型權重,讓開源社群能從我們的學習成果受益,運用這些資源自行打造模型。

NVIDIA 開放模型授權屬於寬容式授權,允許使用者在不需標註 NVIDIA 的情況下,使用、修改、散佈及商業部署這些模型及其衍生產品,以鼓勵生成式 AI 的創新及持續發展。

是的,您可以從 Hugging Face 下載 NVIDIA Nemotron 模型,在正式環境免費執行。

NVIDIA 亦提供 Nemotron 模型作為 NVIDIA NIM 微服務,實現安全可擴充的部署,但使用此服務需具備 NVIDIA AI Enterprise 授權。您可以試用 Nemotron 模型,並從 build.nvidia.com 下載 NIM 微服務。

是的,NVIDIA 致力於發布更多 Nemotron 模型、資料集和技術,實現開源生態系。

NVIDIA Nemotron 模型以最尖端的開放式模型為建置基礎,可更快打造更優異的模型。此外,NVIDIA 還發布模型權重、訓練資料集和訓練技術,讓開發人員社群能利用 Nemotron 的不同部分自行訓練模型。

NVIDIA 提供各種工具,例如 NVIDIA Dynamo、TensorRT-LLM 和 NIM,在正式環境大規模執行 Nemotron 模型。您也可以使用熱門的開源函式庫,例如 SGLang 與 vLLM。

下一步

準備好開始了嗎?

利用正確的工具與技術,將 NVIDIA Nemotron 模型從開發階段推向實際生產。

聯絡我們

歡迎諮詢 NVIDIA 產品專家,討論如何利用 NVIDIA AI Enterprise 的安全性、API 穩定性與支援服務,讓您的產品從測試階段推向正式生產。

掌握 NVIDIA 代理式 AI 的最新消息

直接透過您的電子信箱接收有關代理式 AI 的最新消息、技術資訊與重大進展。