NVIDIA Tesla P100

世界首款 AI 超级计算数据中心 GPU

超强计算能力
助力现代数据中心

当今的数据中心有赖于大量互连的通用计算节点,这限制了高性能计算 (HPC) 和超大规模工作负载。NVIDIA® Tesla® P100 运用 NVIDIA Pascal GPU 架构提供统一的平台,以加速 HPC 和 AI 发展,大幅提升吞吐量,同时降低成本。

应用程序性能跃上新台阶

借助 550 多种加速的 HPC 应用程序(前 15 名均入列)和所有深度学习框架,搭载 NVIDIA NVLink 技术的 Tesla P100 最高可使性能提升 50 倍。

Tesla P100 应用程序加速性能图表

特性和优势

重新打造的 Tesla P100 在从芯片到软件的各个层面都饱含创新。每项突破性技术均使性能大幅提升,从而帮助打造出极其快速的计算节点。

NVIDIA Pascal™ 架构

Pascal 架构带来巨大的性能飞跃

NVIDIA Pascal 架构使 Tesla P100 能为 HPC 和超大规模工作负载提供卓越性能。凭借每秒超过 21 万亿次的 16 位浮点 (FP16) 运算性能,经过优化的 Pascal 为深度学习应用程序带来了令人兴奋的新可能。Pascal 还可为 HPC 工作负载提供超过 5 万亿次的双精度浮点运算和 10 万亿次的单精度浮点运算能力。

通过采用 HBM2 的 CoWoS 技术使 Tesla P100 实现更高效率

通过采用 HBM2 的 CoWoS 技术实现更高效率

通过加入采用 HBM2 的晶圆基底芯片 (CoWoS) 技术,Tesla P100 将计算性能和数据紧密集成在同一个程序包内,提供的内存性能是 NVIDIA Maxwell 架构的三倍以上。这大幅缩短了为数据密集型应用程序算出解决方案的时间。

NVIDIA NVLink™ 高速双向互联技术

NVIDIA NVLink 让超大规模的应用成为现实

互连技术通常制约着性能。创新的 NVIDIA NVLink 高速双向互连技术能跨越多个 GPU 扩展应用程序,其性能比当今的一流技术高 5 倍。

页面迁移引擎

页面迁移引擎使编程更简单

页面迁移引擎可使开发人员从管理数据移动的工作中腾出时间,将精力更多地放在计算性能的调整上。应用程序现在可以突破 GPU 物理显存的容量限制,达到几乎无限量的显存。

TESLA P100 产品

适用于具备强扩展能力的 HPC 的 NVIDIA Tesla P100

适用于具备强扩展能力的 HPC 的 NVIDIA Tesla P100

利用搭载 NVIDIA NVLink 技术的 Tesla P100,快如闪电的节点可以显著缩短为具备强扩展能力的应用程序提供解决方案的时间。采用 NVLink 技术的服务器节点可以 5 倍的 PCIe 带宽互联多达八个 Tesla P100。这种设计旨在帮助解决在 HPC 和深度学习领域拥有极大计算需求的全球重大挑战。

适用于具备强扩展能力的 HPC 的 NVIDIA Tesla P100

适用于具备强扩展能力的 HPC 的 NVIDIA Tesla P100

利用搭载 NVIDIA NVLink 技术的 Tesla P100,快如闪电的节点可以显著缩短为具备强扩展能力的应用程序提供解决方案的时间。采用 NVLink 技术的服务器节点可以 5 倍的 PCIe 带宽互联多达八个 Tesla P100。这种设计旨在帮助解决在 HPC 和深度学习领域拥有极大计算需求的全球重大挑战。

适用于混合型工作负载 HPC 的 NVIDIA Tesla P100

适用于混合型工作负载 HPC 的 NVIDIA Tesla P100

适用于 PCIe 的 Tesla P100 使混合型工作负载 HPC 数据中心能在节省资金的同时大幅提升吞吐量。例如,一个由四个与 PCIe 互联的 Tesla P100 驱动的 GPU 加速节点,可以替代各种应用程序的多达 32 个通用 CPU 节点。利用数量大幅减少而性能强大的节点完成各种作业,意味着客户可以节省多达 70% 的整体数据中心成本。

适用于混合型工作负载 HPC 的 NVIDIA Tesla P100

适用于混合型工作负载 HPC 的 NVIDIA Tesla P100

适用于 PCIe 的 Tesla P100 使混合型工作负载 HPC 数据中心能在节省资金的同时大幅提升吞吐量。例如,一个由四个与 PCIe 互联的 Tesla P100 驱动的 GPU 加速节点,可以替代各种应用程序的多达 32 个通用 CPU 节点。利用数量大幅减少而性能强大的节点完成各种作业,意味着客户可以节省多达 70% 的整体数据中心成本。

性能规格

适用于基于 PCIe 的服务器的 P100 适用于 NVLink 优化服务器的 P100
双精度浮点运算能力 4.7 teraFLOPS 5.3 teraFLOPS
单精度浮点运算能力 9.3 teraFLOPS 10.6 teraFLOPS
半精度浮点运算能力 18.7 teraFLOPS 21.2 teraFLOPS
NVIDIA NVLink 互联带宽 - 160 GB/s
PCIe x16 互联带宽 32 GB/s 32 GB/s
CoWoS HBM2 堆叠式显存容量 16 GB or 12 GB 16 GB
CoWoS HBM2 堆叠式显存带宽 732 GB/s or 549 GB/s 732 GB/s
提升使用页面迁移引擎编程的能力 checkbox checkbox
ECC 保护助力实现可靠性 checkbox checkbox
针对数据中心部署优化服务器 checkbox checkbox

产品资料

参加免费试用活动

适用于 HPC 和深度学习
的全球超快速 GPU 加速器。

何处购买

通过我们的
NVIDIA 合作伙伴网络 (NPN) 找到 NVIDIA 加速计算合作伙伴。