NVIDIA 가속화 데이터 사이언스

데이터 사이언스에 최적화된 유일한 하드웨어-소프트웨어 스택

데이터 사이언스 워크플로우 GPU 가속

기존의 데이터 사이언스 워크플로우는 느리고 까다로웠으며, 데이터를 로드, 필터링, 조작하고, 모델을 학습하고 배포하는 데 CPU에 의존해 왔습니다. GPU는 NVIDIA RAPIDS™ 라이브러리를 사용하여 인프라 비용을 대폭 절감하고 엔드 투 엔드 데이터 사이언스 워크플로우에 탁월한 성능을 제공합니다. GPU 가속화된 데이터 사이언스는 데스크톱, 데이터 센터 내부, 엣지 및 클라우드를 포함한 어디서든 사용할 수 있습니다.

 

특징 및 장점

생산성 극대화

생산성 극대화

최고 가치의 인사이트를 얻고 ROI를 가속화하기 위해 대기 시간을 단축합니다.

더 많은 결과물

더 많은 결과물

머신 러닝 트레이닝을 최대 215배 더 빠르게 가속합니다. 그리고 반복을 더 많이 수행하고, 실험을 늘리며, 더 심층적으로 탐구합니다.

가성비

가성비

데이터 사이언스 인프라 비용을 절감하고 데이터센터 효율성을 높이십시오.

RAPIDS로 GPU 가속화된 Apache Spark 3.0

Apache Spark 3.0은 분석 및 AI 워크로드에 완전히 통합되고 원활한 GPU 가속화를 제공하는 Spark의 첫 번째 릴리스입니다. 코드를 변경하지 않고 온 프레미스 또는 클라우드에서 GPU와 함께하는 Spark 3.0의 성능을 활용해보십시오. GPU의 획기적인 성능은 엔터프라이즈와 연구진에게 더 큰 모델을 더욱 자주 트레이닝하는 역량을 제공하여 궁극적으로 AI 성능을 활용한 빅 데이터의 가치를 확대합니다.

NVIDIA GPU에 대한 XGBOOST 훈련

GPU 가속 XGBoost는 단일 노드 및 분산 배치 모두에서 세계 최고의 머신러닝 알고리즘에 획기적인 성능을 제공합니다. CPU에 비해 훨씬 빠른 훈련 속도를 통해 데이터 사이언스 팀은 더 큰 데이터 세트를 처리하고, 반복 시간을 단축하며, 모델을 튜닝하여 예측 정확성과 비즈니스 가치를 극대화할 수 있습니다.  

Data Prep

XGBoost

End-to-end

GPU 가속 XGBoost로 지금 시작하는 방법 알아보기

데이터 사이언스를 위한 NVIDIA GPU 솔루션

다양한 NVIDIA GPU 솔루션의 뛰어난 가속 기능을 알아보십시오.

PC

머신 러닝을 시작하십시오.

워크스테이션

데이터 사이언스를 위한 새로운 세대의 워크스테이션

데이터센터

엔터프라이즈 제작을 위한 AI 시스템

클라우드

다재 다능한 가속 머신 러닝

GPU 가속 비즈니스 진행

머신 러닝 워크플로우의 성능, 생산성 및 ROI를 극대화하십시오.

RAPIDS: 데이터 사이언스 라이브러리 제품군

NVIDIA CUDA-X AI를 토대로 구축된 RAPIDS는 15년의 NVIDIA® CUDA® 개발 및 머신 러닝 전문 지식을 바탕으로 개발되었습니다. 이는 강력한 소프트웨어로, 엔드 투 엔드 데이터 사이언스 트레이닝 파이프라인을 GPU에서 완전히 처리하므로 며칠 걸릴 트레이닝 시간이 몇 분으로 줄어듭니다.

NVIDIA RAPIDS Flow
End-to-End Faster Speeds on RAPIDS

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

At Databricks, we are excited about RAPIDS’ potential to accelerate Apache Spark workloads. We have multiple ongoing projects to integrate Spark better with native accelerators, including Apache Arrow support and GPU scheduling with Project Hydrogen. We believe that RAPIDS is an exciting new opportunity to scale our customers' data science and AI workloads.

- Matei Zaharia, co-founder and CTO of Databricks, and the original creator of Apache Spark

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

At Databricks, we are excited about RAPIDS’ potential to accelerate Apache Spark workloads. We have multiple ongoing projects to integrate Spark better with native accelerators, including Apache Arrow support and GPU scheduling with Project Hydrogen. We believe that RAPIDS is an exciting new opportunity to scale our customers' data science and AI workloads.

- Matei Zaharia, co-founder and CTO of Databricks, and the original creator of Apache Spark

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

At Databricks, we are excited about RAPIDS’ potential to accelerate Apache Spark workloads. We have multiple ongoing projects to integrate Spark better with native accelerators, including Apache Arrow support and GPU scheduling with Project Hydrogen. We believe that RAPIDS is an exciting new opportunity to scale our customers' data science and AI workloads.

- Matei Zaharia, co-founder and CTO of Databricks, and founder of Apache Spark

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores

파트너 에코시스템

RAPIDS는 모두에게 공개되어 있으며 전 세계 데이터 사이언스와 분석 분야에서 채택되고 있습니다. 당사의 파트너들은 개선된 GPU 가속 분석, 머신 러닝 및 딥 러닝 기능으로 기존의 빅 데이터 분석 에코시스템을 혁신하고 있습니다.

ANACONDA
BlazingDB
Chainer
Datalogue
DataBricks
DellEMC
FastData
Graphistry
H20.ai
HPE
IBM
Kinetica
MAPR
NetApp
Omni Sci
Oracle
Pure Storage
PyTorch
SAP
Sas
Sqream
ZILLIZ
ANACONDA
BlazingDB
Chainer
Datalogue
DataBricks
DellEMC
FastData
Graphistry
H20.ai
HPE
IBM
Kinetica
MAPR
NetApp
Omni Sci
Oracle
Pure Storage
PyTorch
SAP
Sas