NVIDIA Nemotron 模型

透過在基準測試中表現第一的開放式推理與多模態基礎模型,打造您的企業級代理 AI。

概覽

NVIDIA Nemotron 是什麼?

NVIDIA Nemotron™ 是包含開放式模型、資料集與技術的系列,能讓您打造高效準確的專業化 AI 代理系統。Nemotron 模型是專為進階推理、編碼、視覺理解、代理任務、安全、口語與資訊檢索而設計,以開放方式提供,並整合至整個 AI 生態系統,因此可部署於從邊緣到雲端的任何地方。

Nemotron 透過透明的訓練資料和廣泛的平台支援 (包括 NVIDIA RTX PRO 和 NVIDIA DGX Spark™),讓您更輕鬆地建立及部署值得信賴的高效能 AI 代理。

NVIDIA 擴大開放式模型生態系,驅動 AI 發展

專為代理、機器、醫療照護與自駕車開發打造的全新開放式模型系列。

如何利用全新的 Nemotron 模型,打造語音驅動的 RAG 代理

取得逐步指南,瞭解如何整合 Nemotron 模型,實現口語、RAG、安全性與長上下文推理,打造即時語音驅動的 RAG 代理。

影片

NVIDIA 為什麼打造 Nemotron

聆聽 NVIDIA 應用深度學習研究副總裁 Bryan Catanzaro 分享 Nemotron 的願景,以及為何開放技術是打造可信賴企業級 AI 的必要條件。

優勢

NVIDIA Nemotron 模型可為代理 AI 帶來哪些優勢?

高精準度

Nemotron 模型奠基於各大熱門開放式推理模型,具備卓越的知識表現,並以高品質的訓練資料進行後期訓練,其推理方式更貼近人類思維,在各項重要基準測試中達最高精準度。

高運算效率

Nemotron 模型系列對大型模型進行精簡,在最高運算效率實現最佳化,並利用 NVIDIA TensorRT™-LLM 軟體提供更高的傳輸量,且可選擇要開啟或關閉推理功能。

可實現商業化

NVIDIA 的後期訓練資料與最佳化技術,可確保為開發人員及企業提供強大、透明且具優異適應性的模型。這些模型與訓練資料已透過 Hugging Face 平台公開發布。

安全、簡單的部署作業

Nemotron 模型系列以最佳化 NVIDIA NIM™ 微服務的形式提供,提供極致的推論效能和彈性部署選項,確保卓越的安全性、隱私與可移植性。

模型

適用於多元工作負載的模型

Nemotron 模型擅長處理各種代理型 AI 任務,包括推理、視覺檢索增強生成 (RAG)語音安全性研究模型也可用於實驗。

推理

有各種 Nemotron 推理模型可供選擇,其中 Nano 為 PC 與邊緣設備提供卓越的準確度;Super 針對在單一 NVIDIA Tensor 核心 GPU 執行提供最高的準確度與傳輸量;Ultra 則為針對多 GPU 資料中心最佳化的複雜系統提供最優異的準確度。

視覺理解

Nemotron 模型在多影像推理與影片理解方面實現首屈一指的準確性,並具備強大的文件智慧、視覺問答功能與摘要能力。

使用 NVIDIA Nemotron Parse 擷取文件資料,再透過 NVIDIA  Nemotron 2 Nano VL 將文字內容與圖表、圖示及其他視覺元素建立關聯,實現智慧化查詢。

語音

NVIDIA Nemotron Speech 模型為代理 AI 應用提供高傳輸量、超低延遲的自動語音辨識 (ASR)、文字轉語音 (TTS) 與神經機器翻譯 (NMT) 功能。

檢索增強生成

Nemotron RAG 模型透過擷取多模態結構化資訊、生成高品質嵌入,以及排列相關性最高的文件,實現快速準確的文件理解。 它們提供可擴充的高速檢索技術,提升 LLM 訓練的資料品質,提高代理與檢索器效能,並簡化文件工作流程。

安全

NVIDIA Nemotron Safety 模型提供即時防護,防範有害內容、主題偏離和破解嘗試。它們為多語言、多模態內容安全層新增推理能力,加強審核並確保文化一致性。

技術

代理型 AI 的建置組件

NVIDIA NeMo™ 可打造客製化的代理型 AI、NVIDIA NIM 可迅速實現企業級部署,而 NVIDIA Blueprints 則提供可客製化的參考工作流程加速開發,是開始建置及最佳化 AI 代理的利器。

NVIDIA NeMo

  • 量身打造及部署生成式 AI 與代理型 AI。
  • 提供企業級大型語言模型 (LLM),並具備精確的資料庋用、先進的客製化功能、可擴充的資料擷取、RAG,以及加速效能。
  • 輕鬆建立資料飛輪,並以最新資訊持續最佳化 AI 代理。

NVIDIA NIM

  • 加速部署效能最佳化的生成式 AI 模型。
  • 以安全穩定 API 執行企業應用程式,並享有企業級支援。

NVIDIA Blueprints

  • 透過針對生成式 AI 使用案例的參考應用程式快速入門,例如企業深度研究和多模態 RAG。
  • 利用各種 Blueprint 加速開發,其中包含合作夥伴微服務、一或多個 AI 代理、參考程式碼、客製化文件,以及部署用的 Helm Chart。

入門選項

如何開始使用 NVIDIA Nemotron 模型

免費開始原型設計

透過 NVIDIA DGX™ Cloud 驅動的 NIM,使用簡單易用的 API 端點快速上手

  • 使用完全加速的 AI 基礎架構。
  • 確保您的資料未被用於模型訓練。
  • 無需使用點數,即可直接開始建構、測試及部署。

聯絡我們

歡迎諮詢 NVIDIA AI 專家,討論如何運用 NVIDIA AI Enterprise 的安全性、API 穩定性及支援服務,讓您的生成式 AI 從測試階段推向正式生產。

  • 探索生成式 AI 使用案例。
  • 討論您的技術需求。
  • 配合您的目標與需求來調整 NVIDIA AI 解決方案。

使用案例

使用 NVIDIA Nemotron 模型的企業

資源

探索 Nemotron 模型的最新資訊

NVIDIA 為什麼打造 Nemotron

瞭解 Nemotron 如何加速創新、支援開發人員,並塑造 AI 未來。

ServiceNow 如何推動文件智慧服務

瞭解如何存取 Nemotron 的模型權重、資料集與訓練方法來實現更深入的評估,同時探索 ServiceNow 對視覺問答準確性的發現,以及開放性為何對多模態 AI 的持續改善至關重要。

推理 ON/OFF:運用 AI 推理規劃婚禮座位表

探索擁有 AI 推理能力的 LLM 如何跳脫思考框架,同時掌握家庭動態與賓客偏好,為婚禮座位表排定完美的解決方案。

部落格

常見問題

NVIDIA Nemotron 不僅是開放式模型,更是真正開源。NVIDIA 發布訓練資料集、技術與模型權重,讓開源社群能從我們的學習成果受益,運用這些資源自行打造模型。

NVIDIA 開放模型授權屬於寬容式授權,允許使用者在不需標註 NVIDIA 的情況下,使用、修改、散佈及商業部署這些模型及其衍生產品,以鼓勵生成式 AI 的創新及持續發展。

是的,您可以從 Hugging Face 下載 NVIDIA Nemotron 模型,在正式環境免費執行。

NVIDIA 亦提供 Nemotron 模型作為 NVIDIA NIM 微服務,實現安全可擴充的部署,但使用此服務需具備 NVIDIA AI Enterprise 授權。您可以試用 Nemotron 模型,並從 build.nvidia.com 下載 NIM 微服務。

是的,NVIDIA 致力於發布更多 Nemotron 模型、資料集和技術,實現開源生態系。

NVIDIA Nemotron 模型以最尖端的開放式模型為建置基礎,可更快打造更優異的模型。此外,NVIDIA 還發布模型權重、訓練資料集和訓練技術,讓開發人員社群能利用 Nemotron 的不同部分自行訓練模型。

是。NVIDIA 在 Llama 模型系列上,運用 NVIDIA 開放式資料集和神經架構搜尋 (NAS) 等先進技術打造 Llama Nemotron 模型。Llama Nemotron 模型沿用原始 Llama 模型授權。

NVIDIA 提供各種工具,例如 NVIDIA Dynamo、TensorRT-LLM 和 NIM,在正式環境大規模執行 Nemotron 模型。您也可以使用熱門的開源函式庫,例如 SGLang 與 vLLM。

下一步

準備好開始了嗎?

利用正確的工具與技術,將 NVIDIA Nemotron 模型從開發階段推向實際生產。

聯絡我們

歡迎諮詢 NVIDIA 產品專家,討論如何利用 NVIDIA AI Enterprise 的安全性、API 穩定性與支援服務,讓您的產品從測試階段推向正式生產。

掌握 NVIDIA 代理型 AI 的最新消息

直接透過您的電子信箱接收有關代理型 AI 的最新消息、技術資訊與重大進展。