無論你是在需要提升客戶保留率的軟體公司、需要降低風險的金融服務公司,或是有興趣預測客戶購買行為的零售公司,貴組織都是要在不浪費任何重要資源的情況下,從大量資料中準備、管理和收集深入分析資訊。傳統的以 CPU 驅動資料科學工作流程可能比較麻煩,但有了 GPU 的能力,你的團隊可以快速瞭解資料,以利做出商業決策。
在此實作坊中,你將學習如何建立和執行端對端 GPU 加速的資料科學工作流程,讓你快速探索、迭代,並為工作提高生產力。使用 RAPIDS™ 加速資料科學函式庫,你將應用多種 GPU 加速的機器學習演算法,包括 XGBoost、cuGRAPH 的單一來源最短路徑,以及 cuML 的 KNN、DBSCAN 和羅吉斯迴歸,以大規模執行資料分析。
學習目標
參加本實作坊可學會:
- 使用 cuDF 和 Apache Arrow 資料架構,實作 GPU 加速的資料準備和特徵擷取
- 運用 XGBoost 和多種 cuML 演算法,應用各種 GPU 加速的機器學習工作
- 使用 cuGraph 執行 GPU 加速的圖表分析,以在短暫的時間內完成大規模分析
- 運用 cuGraph 常式快速完成大規模圖表分析
下載實作坊大綱與簡介 (PDF 298 KB)