NVIDIA Nemotron 模型

透過在基準測試中表現第一的開放式推理與多模態基礎模型,打造您的企業級代理 AI。

概覽

NVIDIA Nemotron 是什麼?

NVIDIA Nemotron™ 是一系列的多模態模型,可為研究所等級的科學推理、高等數學、程式編碼、指令遵循、工具調用及視覺推理,提供最先進的代理型推理能力。

這些模型針對不同運算平台進行最佳化:Nano 適用於邊緣部署,並可提供成本效益;Super 可憑藉單一 GPU 實現平衡的精準度與運算效率;而 Ultra 則可為資料中心提供最佳精準度。

Nemotron 模型具備商業可行性,採用開放授權,允許客製化與資料掌控。

NVIDIA 與歐洲的模型建構商攜手合作,加速推動歐洲地區邁向 AI 時代

歐洲的模型建構商正持續利用 NVIDIA Nemotron™ 模型來開發主權 AI 模型。這些模型將以 NVIDIA NIM™ 微服務形式提供給 Perplexity,並託管於 NVIDIA 雲端合作夥伴的 AI 基礎架構中。

在 NVIDIA AI 工廠的助力之下,實現立足本地、放眼全球的主權 AI 代理人

NVIDIA NIM 的最新功能及更為擴展的 NVIDIA AI Blueprint 與方法套件,可為各國政府與企業實現更簡單的完整堆疊 AI 開發作業。

優勢

NVIDIA Nemotron 模型可為代理 AI 帶來哪些優勢?

高精準度

Nemotron 模型奠基於各大熱門開放式推理模型,具備卓越的知識表現,並以高品質的訓練資料進行後期訓練,其推理方式更貼近人類思維,在各項重要基準測試中達最高精準度。

高運算效率

Nemotron 模型系列對大型模型進行精簡,在最高運算效率實現最佳化,並利用 NVIDIA TensorRT™-LLM 軟體提供更高的傳輸量,且可選擇要開啟或關閉推理功能。

可實現商業化

NVIDIA 的後期訓練資料與最佳化技術,可確保為開發人員及企業提供強大、透明且具優異適應性的模型。這些模型與訓練資料已透過 Hugging Face 平台公開發布。

安全、簡單的部署作業

Nemotron 模型系列能以經最佳化的 NIM 微服務形式提供,且能帶給您最佳推論效能與彈性部署方式,確保優異的安全性、隱私性及可移植性。

模型

適用於多種工作負載的模型

Nemotron 模型在企業級光學字元辨識 (OCR) 的視覺技術以及建構代理 AI 的推論能力兩大方面都有非常出色的表現。不僅如此,研究模型還能用於實驗與客製化。

Nano

可為 PC 與邊緣裝置提供卓越的精準度

Super

在其相同大小的類別中可提供最高的精準度與傳輸量,使用單一 NVIDIA H100 Tensor 核心 GPU 即可執行

Ultra

可為複雜的系統提供最高的代理 AI 精準度,並針對多 GPU 資料中心進行最佳化

技術

代理型 AI 的建置組件

現在就利用 NVIDIA NeMo™ 微服務來建構 AI 代理人,打造專屬於您的代理 AI;利用 NVIDIA NIM™ 微服務實現快速的企業級部署;而 NVIDIA Blueprint 客製化參考工作流程可加速您的開發作業。

NVIDIA NIM 微服務

  • 加速部署效能最佳化的生成式 AI 模型。
  • 使用安全、穩定的 API 來執行您的業務應用程式,並享有企業級支援。

NVIDIA Blueprint

  • 立即開始使用生成式 AI 應用的參考應用程式,例如數位人類以及多模態檢索增強生成 (RAG)。
  • 利用 NVIDIA Blueprint 加速您的開發作業,其中包含我們的合作夥伴微服務、單一或多款 AI 代理人、參考程式碼、客製化文件及可用於部署作業的 Helm Chart。

NVIDIA NeMo 微服務

  • 建構、自訂及部署生成式 AI 與代理型 AI。
  • 透過精確的資料管理、先進的自訂功能、可擴展的資料擷取、檢索增強生成 (RAG) 以及加速效能,提供企業級大型語言模型 (LLM)。
  • 輕鬆建立資料飛輪,並利用最新資訊來持續最佳化 AI 代理人。

入門選項

如何開始使用 NVIDIA Nemotron 模型

免費開始原型設計

開始使用 DGX™ Cloud 平台支援的 NIM,只需簡單易用的 API 端點即可輕鬆啟動。

  • 使用完全加速的 AI 基礎架構。
  • 確保您的資料未被用於模型訓練。
  • 無需使用點數,即可直接開始建構、測試及部署。

聯絡我們

歡迎諮詢 NVIDIA AI 專家,討論如何運用 NVIDIA AI Enterprise 的安全性、API 穩定性及支援服務,讓您的生成式 AI 從測試階段推向正式生產。

  • 探索生成式 AI 使用案例。
  • 討論您的技術需求。
  • 配合您的目標與需求來調整 NVIDIA AI 解決方案。

使用案例

使用 NVIDIA Nemotron 模型的企業

資源

探索 Nemotron 模型的最新資訊

NVIDIA 發布一系列可用於建構代理 AI 平台的開放式推理模型

探索這個由 NVIDIA 進行後期訓練、奠基於 Llama 模型,並從 DeepSeek-R1 蒸餾而來的模型系列,瞭解這些模型能如何滿足您的業務需求,幫助您實現可快速部署的 AI 代理人。

利用先進的開放式 NVIDIA Llama Nemotron 推理模型打造企業級 AI 代理人

閱讀本文,瞭解 NVIDIA 如何以 Llama 開放式模型為基礎,開發具推理能力的 Llama Nemotron 模型,並利用 DeepSeek-R1 的推理專業知識進行後期訓練。

建構可自訂的推理模型,實現先進的代理型 AI 自主性

瞭解如何利用各種不同的技術建構或自訂推理模型,包括「知識蒸餾」與「強化學習」

部落格

常見問題

NVIDIA Nemotron 不僅是開放式模型,更是真正開源。NVIDIA 發布訓練資料集、技術與模型權重,讓開源社群能從我們的學習成果受益,運用這些資源自行打造模型。

NVIDIA 開放模型授權屬於寬容式授權,允許使用者在不需標註 NVIDIA 的情況下,使用、修改、散佈及商業部署這些模型及其衍生產品,以鼓勵生成式 AI 的創新及持續發展。

是的,您可以從 Hugging Face 下載 NVIDIA Nemotron 模型,在正式環境免費執行。

NVIDIA 亦提供 Nemotron 模型作為 NVIDIA NIM 微服務,實現安全可擴充的部署,但使用此服務需具備 NVIDIA AI Enterprise 授權。您可以試用 Nemotron 模型,並從 build.nvidia.com 下載 NIM 微服務。

是的,NVIDIA 致力於發布更多 Nemotron 模型、資料集和技術,實現開源生態系。

NVIDIA Nemotron 模型以最尖端的開放式模型為建置基礎,可更快打造更優異的模型。此外,NVIDIA 還發布模型權重、訓練資料集和訓練技術,讓開發人員社群能利用 Nemotron 的不同部分自行訓練模型。

是。NVIDIA 在 Llama 模型系列上,運用 NVIDIA 開放式資料集和神經架構搜尋 (NAS) 等先進技術打造 Llama Nemotron 模型。Llama Nemotron 模型沿用原始 Llama 模型授權。

NVIDIA 提供各種工具,例如 NVIDIA Dynamo、TensorRT-LLM 和 NIM,在正式環境大規模執行 Nemotron 模型。您也可以使用熱門的開源函式庫,例如 SGLang 與 vLLM。

下一步

準備好開始了嗎?

利用正確的工具與技術,將 NVIDIA Nemotron 模型從開發階段推向實際生產。

聯絡我們

歡迎諮詢 NVIDIA 產品專家,討論如何利用 NVIDIA AI Enterprise 的安全性、API 穩定性與支援服務,讓您的產品從測試階段推向正式生產。

掌握 NVIDIA 代理型 AI 的最新消息

直接透過您的電子信箱接收有關代理型 AI 的最新消息、技術資訊與重大進展。