大型語言模型 (LLM) 象徵著人工智慧的重大進展,有望透過其學習到的知識,進而改變各領域發展。過去幾年來,大型語言模型皆以每年 10 倍快速成長,而隨著這些模型的複雜度和規模逐漸增加,功能也隨之增長。
然而,大型語言模型的開發和維護卻十分困難,使得大多數企業無法使用。
行銷內容及創意發想
新聞及電子郵件
品牌創建及遊戲角色
智慧問答與即時客戶服務
動態註解及函式創造
多國語言及 Wikipedia
在 NVIDIA 人工智慧平台上執行的 NeMo 大型語言模型服務,為企業提供了最快途徑,可以在私有雲端和公用雲端上,或透過 API 服務取得以自訂並部署大型語言模型。
NVIDIA NeMo 大型語言模型服務可以將 NVIDIA Megatron 530B 模型展示為雲端 API。透過 AI Playground 或表現層狀態轉換 (REST) API 試用 530B 模型功能。
NeMo Megatron 是用於訓練和部署大型語言模型的端對端框架,含有數十億或數兆個參數。
容器式框架可在數千個 GPU 上提供高訓練效率,讓企業能夠實際打造和部署大規模模型。此系統可提供協調訓練資料、訓練高達數兆個參數的大型模型、使用快速學習自訂,以及使用 NVIDIA Triton™ 推論伺服器來部署,在多個 GPU 和多個節點上執行大規模模型。
NeMo Megaton 經過最佳化,可在 NVIDIA DGX™ Foundry、NVIDIA DGX SuperPOD™、Amazon Web Services、Microsoft Azure 和 Oracle Cloud Infrastructure 上執行。
NVIDIA Triton™ 推論伺服器 將能讓資料科學家和工程師突破大型語言模型的未知極限,其為開放原始碼的推論服務軟體,可用於部署、執行和擴充大型語言模型。透過 FasterTransformer 後端為大型語言模型支援多 GPU 與多節點推論。Triton 使用 Tensor 和流程平行處理與訊息傳遞介面 (MPI),以及 NVIDIA 集合通訊函式庫 (NCCL) 進行分散式高效能推論,並支援 GPT、T5 和其他大型語言模型。大型語言模型功能目前為公測版。
BioNeMo 是一項人工智慧藥物研發雲端服務和框架,以 NVIDIA NeMo Megatron 為基礎打造,可以超級運算規模訓練和部署大型生物分子 Transformer 人工智慧模型。這項服務包括預先訓練的大型語言模型;蛋白質、DNA、RNA 和化學的常見檔案格式原生支援;並為適用於分子結構的 SMILES,還有適用於胺基酸和核苷酸序列的 FASTA 提供資料載入器。BioNeMo 框架也可以下載,以便在您自己的基礎架構上執行。
隨時掌握 NVIDIA Triton 推論伺服器和 NVIDIA® TensorRT™ 的產品更新、內容、最新消息等更多資訊。
查看 NVIDIA GTC 關於大型語言模型的最新隨選演講。
瞭解不斷演變的推論使用領域、最佳推論的考慮因素,以及 NVIDIA 人工智慧平台。
立即試用 NVIDIA NeMo 大型語言模型服務。