가이드북 소개 – Apache Spark 가속화

Apache Spark는 시스템 클러스터 전반에서의 대규모 병렬 데이터 처리를 위한 강력한 실행 엔진으로, 빠른 애플리케이션 개발과 높은 성능을 지원합니다.

이 가이드북에서 Spark 3.0 혁신이 GPU의 방대한 병렬 아키텍처를 사용해 Spark 데이터 처리 속도를 높이는 방법을 알아보세요.

아래의 양식을 작성하여 가이드북을 다운로드하고 다음에 대해 알아보세요.

  • Hadoop에서 GPU와 NVIDIA RAPIDS™ 라이브러리로 이어지는 데이터 처리 진화
  • Spark, Spark에 대한 정보, Spark의 역할, Spark가 중요한 이유
  • Spark에서의 GPU 가속
  • DataFrames 및 Spark SQL
  • 랜덤 포레스트 분류자가 있는 Spark 회귀 예제
  • XGBoost를 통해 GPU 가속화된 엔드 투 엔드 머신 러닝 워크플로우 예시
Apache Spark