NVIDIA 加速数据科学

GPU 加速数据分析工作流程

利用数据科学,全球各地的企业可以分析和优化业务流程、供应链、科学研究、产品和数字体验。借助 RAPIDS(新型开源软件库集),GPU 计算正在颠覆数据科学领域,加速机器学习、分析和数据发现,从而以更快的速度获得更精准的结果。

RAPIDS 作为 GPU 加速数据科学平台,是由 Apache Arrow 提供动力支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 携手合作,将加快 Arrow 核心库创新的步伐,并有助于在分析和特征工程工作负载方面带来重大的性能提升。

- Wes McKinney,Ursa Labs 总经理,Apache Arrow 和 Panda 创建者

_在 Databricks,我们对 RAPIDS 加速 Apache Spark 工作负载的潜力充满期待。我们正在进行多个旨在将 Spark 更好地与本机加速器集成的项目,包括 Apache Arrow 支持以及通过 Project Hydrogen 进行 GPU 调度。我们相信 RAPIDS 是一个激动人心的新机会,可扩展我们客户的数据科学和 AI 工作负载。

- Matei Zaharia,Databricks 联合创始人兼首席技术官,Apache Spark 创始人

RAPIDS 作为 GPU 加速数据科学平台,是由 Apache Arrow 提供动力支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 携手合作,将加快 Arrow 核心库创新的步伐,并有助于在分析和特征工程工作负载方面带来重大的性能提升。

- Wes McKinney,Ursa Labs 总经理,Apache Arrow 和 Panda 创建者

_在 Databricks,我们对 RAPIDS 加速 Apache Spark 工作负载的潜力充满期待。我们正在进行多个旨在将 Spark 更好地与本机加速器集成的项目,包括 Apache Arrow 支持以及通过 Project Hydrogen 进行 GPU 调度。我们相信 RAPIDS 是一个激动人心的新机会,可扩展我们客户的数据科学和 AI 工作负载。

- Matei Zaharia,Databricks 联合创始人兼首席技术官,Apache Spark 创始人

RAPIDS 作为 GPU 加速数据科学平台,是由 Apache Arrow 提供动力支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 携手合作,将加快 Arrow 核心库创新的步伐,并有助于在分析和特征工程工作负载方面带来重大的性能提升。

- Wes McKinney,Ursa Labs 总经理,Apache Arrow 和 Panda 创建者

_在 Databricks,我们对 RAPIDS 加速 Apache Spark 工作负载的潜力充满期待。我们正在进行多个旨在将 Spark 更好地与本机加速器集成的项目,包括 Apache Arrow 支持以及通过 Project Hydrogen 进行 GPU 调度。我们相信 RAPIDS 是一个激动人心的新机会,可扩展我们客户的数据科学和 AI 工作负载。

- Matei Zaharia,Databricks 联合创始人兼首席技术官,Apache Spark 创始人

特性和优势

Ease of Use

简单易用

只需集成简单的开源软件并对代码进行极少量更改,便可加速整个 Python 工具链。

Accomplish More

功能更强大

通过更多迭代将机器学习训练速度提升高达 100 倍,提高模型精准度。

Cost-Efficiency

经济高效

数据科学计算基础架构成本降低 90%, 同时数据中心效率提升了 45 倍。

RAPIDS:新型数据科学软件库

RAPIDS 融合了 NVIDIA® CUDA® 超过 15 年的开发和机器学习专业知识。这是一款功能强大的新型软件,用于完全在 GPU 中执行端到端数据科学训练管道,将训练时间从数天减少到数分钟。

NVIDIA RAPIDS Flow
End-to-End Faster Speeds on RAPIDS

立即开始使用 RAPIDS

RAPIDS 库是开源库,使用 Python 编写,基于 Apache Arrow 构建。该软件是与全球的开源社区共同开发的。下载 RAPIDS,体验更快的机器学习和数据科学工作流程。

针对 NVIDIA GPU 加速优化

随时随地运行 RAPIDS,在云中或本地皆可。轻松从工作站扩展至多 GPU 服务器,再到多节点集群。

云中的 GPU 数据科学

利用 RAPIDS 和 NVIDIA GPU,在所有主流云平台上加速云中的机器学习和分析工作负载。

Cloud Platforms

尖端 TESLA 合作伙伴解决方案

利用由 NVIDIA Tesla® V100 Tensor Core GPUNVIDIA NVLink 提供技术支持的领先 OEM 提供的 GPU 服务器,即刻开始将 RAPIDS 用于企业级数据科学。

性能卓越的数据科学超级计算机

利用 RAPIDS 和 NVIDIA DGX-2(™)  为数据科学和机器学习工作流程带来突破性性能。专为加速数据加载、数据处理和算法训练进行优化,利用 NVIDIA DGX-2 的性能和高内存占用量更快地获得见解。

Data Science Supercomputer

合作伙伴生态系统

RAPIDS 面向数据科学和分析领域的高层企业领导者,并逐渐被他们接纳。

大数据、分析、可视化

Anaconda
BlazingDB
DataBricks
FastData
Graphistry
H20.ai
Kinetica
MAPR
Omni Sci
Sqream
Uber

企业数据科学平台

IBM
Oracle
SAP
Sas

存储

DellEMC
HPE
IBM
NetApp
Pure Storage

深度学习

Chainer
PyTorch

探索 RAPIDS 加速硬件解决方案