NVIDIA アクセラレーテッド データ サイエンス

データ サイエンスのために最適化された唯一のハードウェア/ソフトウェア スタック

GPU によりデータ サイエンス ワークフローを高速化

従来、データ サイエンスのワークフローは、データの読み込み、フィルター処理、操作、さらにはモデルのトレーニングと実装において CPU に依存しており、遅くて扱いにくいものでした。GPU は設備費用を大幅に抑え、NVIDIA RAPIDS™ ライブラリを利用し、データ サイエンスのエンドツーエンド ワークフローに優れたパフォーマンスを提供します。デスクトップ、データ センター、エッジ、クラウドなど、さまざまな場所で GPU アクセラレーテッド データ サイエンスを利用できます。

 

特徴と利点

生産性の最大化

生産性の最大化

重要な洞察を得る時間を短縮し、ROI を高速化します。

成果の向上

成果の向上

機械学習のトレーニングを最大 215 倍高速化することにより、より多くの反復の実行や実験を増やし、さらに詳細な調査を実行します。

費用効率

費用効率

データ サイエンスの設備費用を削減し、データ センター効率を向上させます。

RAPIDS による Apache Spark 3.0 の GPU アクセラレーション

Apache Spark 3.0 は、分析と AI のワークロードのために完全統合されたシームレスな GPU アクセラレーションを提供する最初の Spark リリースです。オンプレミスでも、クラウドでも、コードを変更することなく GPU を利用して Spark 3.0 のパワーを活用できます。GPU の画期的な性能は、企業や研究者がより大きなモデルをより頻繁にトレーニングできるようになり、AI のパワーでビッグデータから価値を引き出すことができるようになります。

NVIDIA GPU で XGBOOST トレーニング

GPU 対応 XGBoost は、単一ノードと分散型配置の両方で世界をリードする機械学習アルゴリズムに画期的なパフォーマンスをもたらします。CPU を大幅に上回るトレーニング スピードにより、データ サイエンス チームはより大規模なデータセットに取り組み、より高速に反復処理を行い、モデルを調整して予測精度とビジネス価値を最大化できます。

データ準備

XGBoost

エンドツーエンド

GPU対応 XGBoost を今すぐ使い始める方法をご紹介します。

データ サイエンス向け NVIDIA GPU ソリューション

さまざまな NVIDIA GPU ソリューションで比類のない高速化を体験してください。

PC

機械学習を開始しましょう。

ワークステーション

データ サイエンス向けの新しいワークステーション。

データ センター

企業の生産向け AI システム。

>クラウド

あらゆる用途に高速化された機械学習。

GPU を活用したビジネス事例

機械学習ワークフローのパフォーマンス、生産性、および ROI を最大化します。

RAPIDS: データ サイエンス ライブラリ スイート

NVIDIA CUDA-X AI 上で構築された RAPIDS は、NVIDIA® CUDA® の 15 年以上に及ぶ開発と機械学習のノウハウを活用しています。このパワフルなソフトウェアにより、エンドツーエンドのデータ サイエンス トレーニング パイプラインは GPU 内で完全に処理され、トレーニング時間が日単位から分単位に短縮されます。

NVIDIA RAPIDS Flow
End-to-End Faster Speeds on RAPIDS

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

At Databricks, we are excited about RAPIDS’ potential to accelerate Apache Spark workloads. We have multiple ongoing projects to integrate Spark better with native accelerators, including Apache Arrow support and GPU scheduling with Project Hydrogen. We believe that RAPIDS is an exciting new opportunity to scale our customers' data science and AI workloads.

- Matei Zaharia, co-founder and CTO of Databricks, and the original creator of Apache Spark

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

At Databricks, we are excited about RAPIDS’ potential to accelerate Apache Spark workloads. We have multiple ongoing projects to integrate Spark better with native accelerators, including Apache Arrow support and GPU scheduling with Project Hydrogen. We believe that RAPIDS is an exciting new opportunity to scale our customers' data science and AI workloads.

- Matei Zaharia, co-founder and CTO of Databricks, and the original creator of Apache Spark

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

At Databricks, we are excited about RAPIDS’ potential to accelerate Apache Spark workloads. We have multiple ongoing projects to integrate Spark better with native accelerators, including Apache Arrow support and GPU scheduling with Project Hydrogen. We believe that RAPIDS is an exciting new opportunity to scale our customers' data science and AI workloads.

- Matei Zaharia, co-founder and CTO of Databricks, and founder of Apache Spark

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores

パートナー エコシステム

RAPIDS はあらゆる企業に開放されており、データ サイエンスとデータ分析の分野でグローバルに採用されています。NVIDIA のパートナーは、GPU を活用した分析、機械学習、およびディープラーニングの進歩により、ビッグ データ分析のエコシステムを変革しています。

파트너 에코시스템

RAPIDS는 모두에게 공개되어 있으며 전 세계 데이터 사이언스와 분석 분야에서 채택되고 있습니다. 당사의 파트너들은 개선된 GPU 가속 분석, 머신 러닝 및 딥 러닝 기능으로 기존의 빅 데이터 분석 에코시스템을 혁신하고 있습니다.

合作夥伴生態系統

RAPIDS 開放所有人使用,並且在資料科學與分析領域獲得全球廣泛採用。我們的合作夥伴透過 GPU 加速分析、機器學習和深度學習的進展,共同改變傳統巨量資料分析的生態系統。

パートナー エコシステム

RAPIDS はあらゆる企業に開放されており、データ サイエンスとデータ分析の分野でグローバルに採用されています。NVIDIA のパートナーは、GPU を活用した分析、機械学習、およびディープラーニングの進歩により、ビッグ データ分析のエコシステムを変革しています。

ANACONDA
BlazingDB
Chainer
Datalogue
DataBricks
DellEMC
FastData
Graphistry
H20.ai
HPE
IBM
Kinetica
MAPR
NetApp
Omni Sci
Oracle
Pure Storage
PyTorch
SAP
Sas
Sqream
ZILLIZ
ANACONDA
BlazingDB
Chainer
Datalogue
DataBricks
DellEMC
FastData
Graphistry
H20.ai
HPE
IBM
Kinetica
MAPR
NetApp
Omni Sci
Oracle
Pure Storage
PyTorch