運用大型語言模型
編寫智慧程式語言

大型語言模型 (LLM) 象徵著人工智慧的重大進展,有望透過其學習到的知識,進而改變各領域發展。過去幾年來,大型語言模型皆以每年 10 倍快速成長,而隨著這些模型的複雜度和規模逐漸增加,功能也隨之增長。

然而,大型語言模型的開發和維護卻十分困難,使得大多數企業無法使用。

產生文字

行銷內容及創意發想

概括總結

新聞及電子郵件

產生影像

品牌創建及遊戲角色

聊天機器人

智慧問答與即時客戶服務

編寫程式碼

動態註解及函式創造

翻譯

多國語言及 Wikipedia

探索 NVIDIA NeMo 大型語言模型服務

探索 NVIDIA NeMo 大型語言模型服務

釋放企業人工智慧大型語言模型的強大功能

NVIDIA 人工智慧平台上執行的 NeMo 大型語言模型服務,為企業提供了最快途徑,可以在私有雲端和公用雲端上,或透過 API 服務取得以自訂並部署大型語言模型。

試用全球最強大的語言模型之一

NVIDIA NeMo 大型語言模型服務可以將 NVIDIA Megatron 530B 模型展示為雲端 API。透過 AI Playground 或表現層狀態轉換 (REST) API 試用 530B 模型功能。

NVIDIA NeMo

深入瞭解 NVIDIA NeMo Megatron

NeMo Megatron 是用於訓練和部署大型語言模型的端對端框架,含有數十億或數兆個參數。

容器式框架可在數千個 GPU 上提供高訓練效率,讓企業能夠實際打造和部署大規模模型。此系統可提供協調訓練資料、訓練高達數兆個參數的大型模型、使用快速學習自訂,以及使用 NVIDIA Triton™ 推論伺服器來部署,在多個 GPU 和多個節點上執行大規模模型。

NeMo Megaton 經過最佳化,可在 NVIDIA DGX™ Foundry、NVIDIA DGX SuperPOD™、Amazon Web Services、Microsoft Azure 和 Oracle Cloud Infrastructure 上執行。

使用 NVIDIA Triton 支援大型語言模型推論

NVIDIA Triton™ 推論伺服器 將能讓資料科學家和工程師突破大型語言模型的未知極限,其為開放原始碼的推論服務軟體,可用於部署、執行和擴充大型語言模型。透過 FasterTransformer 後端為大型語言模型支援多 GPU 與多節點推論。Triton 使用 Tensor 和流程平行處理與訊息傳遞介面 (MPI),以及 NVIDIA 集合通訊函式庫 (NCCL) 進行分散式高效能推論,並支援 GPT、T5 和其他大型語言模型。大型語言模型功能目前為公測版。

NVIDIA Triton
NVIDIA BioNeMo

運用 NVIDIA BioNeMo 拓展藥物研發研究

BioNeMo 是一項人工智慧藥物研發雲端服務和框架,以 NVIDIA NeMo Megatron 為基礎打造,可以超級運算規模訓練和部署大型生物分子 Transformer 人工智慧模型。這項服務包括預先訓練的大型語言模型;蛋白質、DNA、RNA 和化學的常見檔案格式原生支援;並為適用於分子結構的 SMILES,還有適用於胺基酸和核苷酸序列的 FASTA 提供資料載入器。BioNeMo 框架也可以下載,以便在您自己的基礎架構上執行。

尋找更多資源

瞭解 NVIDIA Triton 如何簡化大規模人工智慧部署。

社群交流

隨時掌握 NVIDIA Triton 推論伺服器和 NVIDIA® TensorRT™ 的產品更新、內容、最新消息等更多資訊。

探索最新的 NVIDIA Triton 隨選演講。

隨時觀看 GTC 演講重播

查看 NVIDIA GTC 關於大型語言模型的最新隨選演講。

部署人工智慧深度學習模型。

閱讀推論白皮書

瞭解不斷演變的推論使用領域、最佳推論的考慮因素,以及 NVIDIA 人工智慧平台。

隨時掌握大型語言模型最新消息

立即試用 NVIDIA NeMo 大型語言模型服務。