NVIDIA Tesla P100

世界第一個人工智慧超級運算資料中心 GPU

現代資料中心的
無限運算能力

現今的資料中心仰賴許多互連設備運算節點,使高效能運算 (HPC) 與超大規模工作負載受到限制。NVIDIA® Tesla® P100 採用 NVIDIA Pascal GPU 架構,提供整合平台來加速高效能運算和人工智慧,大幅提高輸送量並節省成本。

將效能提升至全新境界

 加速超過 700 種高效能運算應用程式 (包含前 15 大高效能運算應用程式) 及所有深度學習框架,搭配 NVIDIA NVLink 的 Tesla P100 可提升高達 50 倍的效能。

Tesla P100 應用程式加速效能圖表

功能與優點

Tesla P100 從硬體到軟體均重新設計,在每個設計環節都加入創新元素。每項突破性技術都展現效能的大躍進,催生出全球最快速運算節點。

NVIDIA Pascal™ 架構

Pascal 架構提供顯著的效能提升

NVIDIA Pascal 架構讓 Tesla P100 得以為高效能運算和超大規模的工作負載提供卓越效能。Pascal 具有 每秒 21 兆次 以上的 16 位元浮點運算 (FP16) 效能,專為激發深度學習應用程式新潛能而最佳化。Pascal 也可為高效能運算工作負載提供每秒超過 5 和 10 兆次的雙精度和單精度浮點運算效能。

Tesla P100:使用 HBM2 的 CoWoS 提供前所未有的效率

使用 HBM2 的 CoWoS 提供前所未有的效率

由於 Tesla P100 新增了 CoWoS 與 HBM2 技術,將同個封裝中的運算和資料緊密整合,記憶體效能因此比  NVIDIA Maxwell 架構高上 3 倍。讓包含大量資料的應用程式解決方案所需時間獲得跨世代的進步。

NVIDIA NVLink™ 高速雙向互連技術

NVIDIA NVLink 釋放大型應用程式效能

效能時常因為互連而受到限制,但革命性的  NVIDIA NVLink 高速雙向互連技術 卻比現今的同級最佳技術快上 5 倍,因此得以運用多個 GPU 擴充應用程式。

頁面移轉引擎

頁面移轉引擎使程式設計更簡便

頁面移轉引擎讓開發人員能更專注於調整運算效能,減少管理資料移動所花費的時間。應用程式現在可擴充到超越 GPU 的實體記憶體大小,幾乎沒有限制。

TESLA P100 產品

巨大規模高效能運算專用的 NVIDIA Tesla P100

巨大規模高效能運算專用的 NVIDIA Tesla P100

Tesla P100 與 NVIDIA NVLink 技術,可利用飆速節點大幅縮短巨大規模應用程式獲得解決方案的所需時間。伺服器節點可透過 NVLink,以 5 倍的 PCIe 頻寬互連高達八個 Tesla P100 GPU。旨在協助解決這項全球最關鍵的挑戰:高效能運算和深度學習近乎無限的運算需求。

大規模高效能運算專用的 NVIDIA Tesla P100

巨大規模高效能運算專用的 NVIDIA Tesla P100

Tesla P100 與 NVIDIA NVLink 技術,可利用飆速節點大幅縮短巨大規模應用程式獲得解決方案的所需時間。伺服器節點可透過 NVLink,以 5 倍的 PCIe 頻寬互連高達八個 Tesla P100 GPU。旨在協助解決這項全球最關鍵的挑戰:高效能運算和深度學習近乎無限的運算需求。

混合型工作負載高效能運算專用的 NVIDIA Tesla P100

混合型工作負載高效能運算專用的 NVIDIA Tesla P100

PCIe 專用的 Tesla P100 讓混合型工作負載高效能運算資料中心得以大幅提高輸送量並節省成本。例如,由 4 個與 PCIe 互連的 Tesla P100 所提供技術支援的單一 GPU 加速節點,可取代高達 32 個設備 CPU 節點,提升多種應用程式的效能。所需數量遠比以前少,但效能強大的節點即可完成所有工作,讓客戶可節省高達 70% 的資料中心整體成本。

混合型工作負載高效能運算專用的 NVIDIA Tesla P100

混合型工作負載高效能運算專用的 NVIDIA Tesla P100

PCIe 專用的 Tesla P100 讓混合型工作負載高效能運算資料中心得以大幅提高輸送量並節省成本。例如,由 4 個與 PCIe 互連的 Tesla P100 所提供技術支援的單一 GPU 加速節點,可取代高達 32 個設備 CPU 節點,提升多種應用程式的效能。所需數量遠比以前少,但效能強大的節點即可完成所有工作,讓客戶可節省高達 70% 的資料中心整體成本。

效能規格

PCIe 伺服器專用的 P100 NVLink 最佳化伺服器專用的 P100
雙精度效能 4.7 兆次浮點運算 5.3 兆次浮點運算
單精度效能 9.3 兆次浮點運算 10.6 兆次浮點運算
半精度效能 18.7 兆次浮點運算 21.2 兆次浮點運算
NVIDIA NVLink 互連頻寬 - 每秒 160 GB
PCIe x16 互連頻寬 每秒 32 GB 每秒 32 GB
CoWoS HBM2 堆疊記憶體容量 16 GB 或 12 GB 16 GB
CoWoS HBM2 堆疊記憶體頻寬 每秒 732 GB 或 549 GB 每秒 732 GB
利用頁面移轉引擎強化可程式性 核取方塊 核取方塊
可提升可靠性的 ECC 保護 核取方塊 核取方塊
針對伺服器最佳化,以進行資料中心部署 核取方塊 核取方塊

產品文件

歡迎免費試用

世界上最快速的高效能運算與
深度學習專用 GPU 加速器。

經銷據點

透過 NVIDIA 合作夥伴網路 (NPN)
尋找 NVIDIA 加速運算合作夥伴。