NVIDIA 深度學習機構

接受訓練以解決全球最富挑戰的問題

NVIDIA 深度學習機構 (DLI) 提供人工智慧與加速運算的實作訓練課程,幫助學員解決現實生活中的問題。開發人員、資料科學家、研究人員和學生可藉由雲端 GPU 環境獲得實作體驗,以及能力認證,有助於其專業領域發展。我們為個人提供可自行安排進度的線上訓練課程、為團隊提供講師主持的實作坊,並為大學教職員提供可下載的課程材料。

  • <span style=

    個人

  • <span style=

    團隊

  • <span style=

    大學

對於自學者、學生和不到 20 位開發人員的團隊,我們推薦可自行安排進度的線上訓練課程,以瞭解如何在專案中應用深度學習技術,以及如何運用 CUDAOpenACC 來加速應用程式。你將獲得工作所需的實際技能以及相關領域的能力認證,還可參加你所在地區即將舉辦的講師主持實作坊。

DLI 線上訓練課程

隨時隨地進行可自行安排進度的線上訓練課程,並在雲端上存取設定完備的 GPU 加速工作站。選擇 8 小時的課程實作與部署端對端專案,或 2 小時的課程應用特定技術或技能

課程結束後可進行線上測驗,通過後可取得電子認證證書。

深度學習課程

深度學習基礎課程

  • 電腦視覺的深度學習基本原理 

    必備基礎能力: 熟悉基礎程式設計原理,例如函數和變數。

    深度學習框架: Caffe、DIGITS

    時間: 8 小時

    教材語言: 英文、繁中

    測驗類型: 程式編寫

    價格: 90 美元

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    探索深度學習的基礎原理,透過類神經網路實際進行訓練運算,並使用訓練運算結果進行理論探討,進而改善效率與成效。

    在這個課程中,學員將學習深度學習的基礎,學習如何進行類神經網路的訓練和佈署。課程中將學會:

    • 實作常用的深度學習運算流程,例如: 圖像問題的分類和特定物件偵測
    • 透過實際資料處理方法探討、訓練參數調教、網路架構等學習與其他相關知識與策略探討,進行實驗與討論以增進效率與成效
    • 部署課程中的神經網路,並嘗試活用相關知識,解決現實世界的問題 

    完成此課程後,學員將具備基礎能力,使用深度學習相關知識於實際問題處理。

  • 透過 Jetson Nano 開始使用人工智慧

    必備基礎能力: 熟悉 Python (有幫助,但非必須)

    工具、函式庫、框架: PyTorch、Jetson Nano

    時間: 8 小時

    教材語言: 英文

    價格: 免費

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    人工智慧強大的功能掌握在自造者、自學開發者與嵌入式技術愛好者的手中。 偕同 NVIDIA Jetson Nano 開發套件,這款易於使用且強大的電腦,可讓你同時執行多個神經網路,適合應用於影像分類、物件偵測、分割和語音處理。在本課程中,你可以在 Jetson Nano 上使用 Jupyter iPython Notebook 建立一個具備深度學習分類的電腦視覺模型。

    你將學到:

    • 設定你的 Jetson Nano 與相機
    • 蒐集影像資料來建立分類模型
    • 註記影像資料來建立迴歸模型
    • 運用你的資料訓練神經網路並建立專屬模型
    • 運用你建立的模型在 Jetson Nano 執行推論

    課程結束後,你將有能力運用 Jetson Nano 建立專屬的深度學習分類與迴歸模型。完成此課程所需的硬體請檢視(詳細資訊)。

     

  • 應用 DIGITS 進行圖像分類

    必備基礎能力:

    架構: Caffe (使用 DIGITS 介面)

    時間: 2 小時

    語言: 英文、簡中、日文

    價格: 30 美元

    深度學習技術是一個嶄新的技術,透過向資料學習的模組,取代以往的手動編碼指示,藉此實現全新解決方案。透過以下方式訓練深度神經網路辨識手寫數字:

    • 將影像資料載入訓練環境
    • 選擇網路並訓練網路
    • 測試新資料並迭代微調參數以提升效能

    完成後,你便能夠評估應使用哪些資料進行訓練。

  • 應用 DIGITS 進行物體偵測

    必備基礎能力:神經網路基礎概念

    架構: Caffe (使用 DIGITS 介面)

    時間: 2 小時

    語言: 英文、簡中

    價格: 30 美元

    透過以下方式,藉由偵測空拍影像中鯨魚臉部的挑戰,學習如何將深度學習運用在物體偵測上:

    • 將傳統電腦視覺與深度學習結合
    • 利用深度學習框架 Caffe ,在現有的神經網路中執行初階的類神經網路「腦部手術」
    • 藉由辨識並使用特定的網路和端對端標籤資料,掌控深度學習的知識

    完成後,你便能利用深度學習解決自訂問題。

  • 利用 TensorRT 部署與最佳化 TensorFlow 模型

    必備基礎能力: TensorFlow 與 Python 的經驗

    架構: TensorFlow、Python 與 TensorRT (TF-TRT)

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    學習在 TensorFlow 平台利用內建的 TensorRT 函式庫 (TF-TRT) 與 Python 產生高效能深度學習模型之基礎,你將學到:

    • 如何預先分類模型、凍結圖表與權重,以最佳化效能
    • 利用 FP32、FP16 與 INT8 熟悉圖表最佳化與量化之基礎
    • 利用 TF-TRT API 最佳化子圖表與選取最適合模型的最佳化參數
    • 在 Python 中設計與嵌入自定義操作,以解決不支援層之問題並最佳化檢測模型

    完成後,你將瞭解如何利用 TF-TRT 實現部署最佳化模型。

  • 使用 Horovod 進行大規模深度學習

    必備基礎能力: Python 專長能力,以及在 Python 中訓練深度學習模型的專業經驗

    工具和深度學習框架: Horovod、TensorFlow、Keras、Python

    時間: 2 小時

    教材語言: 英文

    價格: 30 美元

    瞭解如何使用 Horovod 將深度學習訓練擴充到多個 GPU。Horovod 是開放原始碼的分散式訓練框架,最初由 Uber 打造並由 LF AI 基金會託管。在本課程中,你將學會:

    • 完成 Fashion-MNIST 分類模型的逐步重構,以使用 Horovod 並在四個 NVIDIA V100 GPU 上執行
    • 瞭解 Horovod 的 MPI,為多個工作、競爭條件和同步處理等開發直覺式平行程式模組
    • 使用學習率預熱等技巧,這些技巧對對經過擴充的深度學習效能具有顯著影響

    完成後,你將能夠使用 Horovod 在全新或現有的程式庫中有效擴展深度學習訓練。

  • 運用 TensorFlow 進行影像分割

    必備基礎能力:類神經網路基礎概念

    架構: TensorFlow

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    影像 (或語意) 分割是一項將影像的每個像素分到特定類別的工作。透過以下方式瞭解如何分割 MRI 影像,以評估心臟的各個部位:

    • 比較影像分割與其他電腦視覺問題
    • 試驗 TensorBoard 與 TensorFlow Python API 等 TensorFlow 工具
    • 學習如何實作有效的衡量標準,以評估模型效能

    完成後,你便能使用深度學習設定大多數的電腦視覺工作流程。

  • 運用 DIGITS 進行訊號處理

    必備基礎能力:神經網路基礎概念

    架構: Caffe、DIGITS

    時間: 2 小時

    語言: 英文、簡中

    價格: 30 美元

     

    深度神經網路比人類更善於分類影像,其感知能力遠超過我們對電腦視覺的期待。瞭解如何將無線電頻率 (radio frequency) 訊號轉換成影像,以偵測受到雜訊影響的微弱訊號。你將接受以下訓練:

    • 將非影像資料當作影像資料處理
    • 在 DIGITS 中實作深度學習工作流程 (載入、訓練、測試、調整)
    • 以程式化方式測試效能,並引導效能提升

    完成後,你便能使用深度學習分類影像和類影像資料。

適用於數位內容創作的深度學習技術

  • 運用 Torch 完成影像風格轉移

    必備基礎能力: CNN 的經驗

    深度學習框架: Torch

    時間: 2 小時

    語言: 英文

    價格: 30 美元

     

    探索如何透過擷取獨特的視覺特徵,將一幅影像的外觀和風格轉移至另一幅影像。瞭解如何運用卷積神經網路 (CNN) 擷取特徵,以及如何將這些特徵輸入產生工具以建立新影像。你將學會:

    • 透過擷取獨特的視覺特徵,將一幅影像的外觀和風格轉移至另一幅影像
    • 用不同的技術,以質性方式判定是否正確移轉樣式
    • 使用架構創新和訓練技術來任意移轉樣式

    完成後,你將能夠使用神經網路,以對影片而言足夠有效的速度,任意移轉樣式。

  • 運用自動編碼器完成渲染影像降噪

    必備基礎能力: CNN 的經驗

    深度學習框架: TensorFlow

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    瞭解如何運用具備自動編碼器的神經網路,大幅加速移除光線追蹤影像中的雜訊。你將學會:

    • 判定渲染影像中是否有雜訊
    • 使用預先訓練的網路為部分範例影像,或自己的影像移除雜訊
    • 透過所提供的資料集訓練自己的降噪器

    完成後,你將能夠使用神經網路內的自動編碼器訓練自己的渲染影像降噪器。

  • 使用自動編碼器製作超高解析度影像

    必備基礎能力: CNN 的經驗

    深度學習框架: Keras

    時間: 2 小時

    語言: 英文、簡中

    價格: 30 美元

    運用強大的神經網路與自動編碼器,透過低畫質來源影像建立高畫質影像。你將學會: 

    • 瞭解和設計自動編碼器
    • 瞭解嚴格評估影像品質的多種方式

    完成後,你將能夠使用神經網路內的自動編碼器來大幅提升影像畫質。

適用於醫療保健的深度學習技術

  • 運用 Keras 建立時間序列的遞歸神經網路資料模型

    必備基礎能力: 深度學習基礎概念

    深度學習框架: Keras

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    遞歸神經網路 (RNN) 能夠讓模型分類或預測時間序列資料,例如自然語言、市場甚至是病人的身體狀況隨時間變化的情形。你將學到:

    • 使用 HDF5 (hierarchical data format 第五版) 中的電子健康記錄,建立訓練和測試資料集
    • 準備遞歸神經網路使用的資料集,以便為極複雜的資料序列建立模型
    • 使用在 Theano 最上層直行的 Keras 資料庫,建立長短期記憶體模型 (LSTM) 與特定的 RNN 架構,以根據基準資料評估模型效能

    完成後,你將能夠使用 RNN 為時間序列資料建立模型。

  • 使用 MedNIST 資料集完成醫療影像分類

    必備基礎能力: Python 的基礎概念

    深度學習框架: PyTorch

    時間: 2 小時

    教材語言: 英文、簡中

    價格: 30 美元

     

    放射醫學和醫療影像運用深度學習的實作介紹。你將學到:

    • 收集醫療影像資料並加以格式化與標準化
    • 在資料集上建構並訓練卷積神經網路 (CNN)
    • 使用訓練模型分類新的醫療影像

    完成後,你就能將 CNN 技術應用於醫療影像資料集中的影像分類工作。

  • 在醫療應用程式上應用深度學習資料科學工作流程

    必備基礎能力: Python 與 CNN 的基礎經驗

    深度學習框架: PyTorch

    時間: 2 小時

    教材語言: 英文

    價格: 30 美元

    醫療資料集為深度學習應用程式帶來特別的挑戰。你將:

    • 學習資料增強與標準化的入門技能
    • 在簡單的醫療影像資料集上針對這些技能進行實驗
    • 運用增強資料集訓練卷積神經網路,來驗證你的技能

    完成後,你就能在醫療影像資料集上應用簡單的資料運用技能。

     

  • 使用 DIGITS 進行醫療影像分割

    先修課程: CNN 與 Python 的基礎學習經驗

    架構: DIGITS、Caffe

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    影像 (或語意) 分割是一項將影像的每個像素分到特定類別的工作。你將透過下列方式分割 MRI 影像,以評估心臟的各部位:

    • 使用自訂的 Python 層級延伸 Caffe
    • 實作轉移學習的流程
    • 從熱門的影像分類網路建立完整的卷積神經網路 (CNN)

    完成後,你便能使用深度學習設定大多數的電腦視覺工作流程。

  • 使用 TensorFlow 完成影像分類: 影像體學 - 1p19q 染色體狀態分類

    先修課程: CNN 與 Python 的基礎學習經驗

    架構: TensorFlow

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    有了梅約診所 (Mayo Clinic) 運用深度學習技術從 MRI 影像偵測影像體學的成果,讓患有腦部腫瘤的病患可以獲得更有效的治療,且後續健康狀態也有所提升。透過下列方式學習偵測 1p19q 共同缺失生物標記:

    • 設計和訓練卷積神經網路 (CNN)
    • 使用影像基因組學 (影像體學) 製作生物標記,在無須進行侵入性活體組織切片的情況下,即可辨別疾病的基因組。
    • 探索梅約診所的影像體學研究成果

    完成後,你將擁有獨特見解,瞭解如何運用深度學習預測影像體學,以獲得先進且具前景的成果。

  • 使用 R 與 MXNet 進行醫療影像分析

    先修課程: CNN 與 Python 的基礎學習經驗

    架構: MXNet

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    卷積神經網路 (CNN) 可應用於醫療影像分析,從肉眼不可見的影像推論病患狀態。瞭解如何訓練 CNN 從時間序列 MRI 資料推論人體心臟左心室的體積。你將學到:

    • 將典型的 2D CNN 延伸至更複雜的資料上使用
    • 透過標準 Python API 與 R 使用 MXNet
    • 處理可能為立體或具有時間元素的高維度影像

    完成後,你將瞭解如何在肉眼不可見的影像上使用 CNN

  • 用於醫學影像的生成網絡的數據增強與分割

    必備基礎能力: CNN 的經驗

    深度學習框架: TensorFlow

    時間: 2 小時

    教材語言: 英文

    課程價格: 30 美元

    生成對抗式網路 (GAN) 是一對深度神經網路架構,包含可以根據提供的訓練資料來建立新範例的生成器網路,以及藉由可以試著分辨真實和模擬資料的鑑別器網路。當兩個網路同時提升時,所建立的範例就會越益真實。這項技術對於醫療照護尤其有幫助,因為可以增強較小型的資料集,進而利用這些資料用以訓練傳統網路。你將學到:

    • 利用 GAN 模型生成合成腦部 MRI
    • 應用 GAN 進行圖像分割
    • 使用 GAN 生成之圖像增強資料的多樣性以提升精準度

    完成後,你就能將 GAN 應用於醫療影像使用案例中。

  • 醫療影像適用的粗糙至精緻情境式記憶

    必備基礎能力: CNN 與長短期記憶 (LSTM) 的經驗

    深度學習框架: TensorFlow

    時間: 2 小時

    教材語言: 英文

    課程價格: 30 美元

     

    粗糙至精緻情境式記憶 (CFCM) 是運用極深度的架構所打造的影像分割技術,並包含許多不同等級功能的卷積長短期記憶 (Conv-LSTM)。你將學到:

    • 深入瞭解醫療影像分割所使用的編碼器至解碼器架構
    • 認識常見的建置組塊 (卷積、池化層、殘差網路等)
    • 研究不同的 Skip-connection 策略

    完成後,你就能將 CFCM 技術應用於醫療影像分割和其他類似的影像工作上。

適用於智慧影片分析的深度學習技術

  • 採用 DeepStream 進行智慧影片分析的人工智慧工作流程

    必備基礎能力: C++ 與 Gstreamer 的經驗

    深度學習框架: DeepStream3

    時間: 2 小時

    教材語言: 英文

    價格: 30 美元

    DeepStream 3.0 框架具備硬體加速的智慧影片分析 (IVA) 應用程式建置組塊。這讓開發人員能專心建置核心深度學習網路。DeepStream SDK 支援多樣的用途,並提供彈性的部署媒體。

    你將學習:

    • 為平行、多重串流影片處理部署 DeepStream 流程,並為應用程式大規模提供最高輸送量
    • 設定處理流程並創造直覺、以圖表為主的應用程式。運用多個深度網路模型處理影片串流,並取得更智慧的分析

    完成後,你將瞭解如何使用 DeepStream 創造人工智慧影片分析應用程式,將影片串流轉化為可用的分析。

加速運算課程

  • CUDA C/C++ 加速運算的基本原理  

    必備基礎能力: 基礎 C/C++ 專長能力並熟悉變數類型、迴圈、條件 陳述式、函數和陣列操作。

    測驗類型: 程式編寫

    語言: 英文、繁中

    時間: 8 小時

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    CUDA 運算平台能夠在全球最快速的大型平行運算 GPU 上,加速僅使用 CPU 的應用程式。透過下列方式體驗 C/C++ 應用程式加速:

    • 在 GPU 上加速 CPU 程式中潛在的平行運算
    • 運用必要的 CUDA 記憶體管理技術將加速應用程式最佳化
    • 找到加速應用程式的並行潛能,並運用 CUDA 串流加以提升並行效能
    • 運用命令列和視覺化效能分析工具來指引和檢查你的工作

    在完成本課程後,你將能夠使用基本的 CUDA 工具和技術, 將現有僅使用 CPU 的 C/C++ 應用程式加速並最佳化。

     

  • CUDA Python 加速運算的基本原理

    必備基礎能力: 基礎 Python 專長能力並熟悉變數類型、迴圈、條件 陳述式、函數和陣列操作。NumPy 專長能力並使用 多維陣列 (ndarray) 和通用函數 (ufunc)。

    測驗類型: 程式編寫

    時間: 8 小時

    語言: 英文、繁中

    價格: 90 美元

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    本課程帶領你探索如何即時運用特殊化類型的 Python 函數編譯器 Numba,以在大型平行 NVIDIA GPU 上加速執行 Python 程式。你將學會:

    • 透過 NumPy 通用函數 (ufuncs) 使用 Numba 編譯 CUDA 核心
    • 使用 Numba 建立並啟動自訂 CUDA 核心
    • 應用關鍵 GPU 記憶體管理技術

    完成本課程後,你將能夠使用 Numba 編譯並啟動 CUDA 核心,以加速 NVIDIA GPU 上的 Python 應用程式。

  • OpenACC 加速運算的基本原理

    必備基礎能力: C/C++ 基礎概念

    時間: 8 小時

    語言: 英文

    價格: 90 美元

    學習 OpenACC 的基本知識,這是在 GPU 上進行程式設計時使用的高階程式語言。本課程適合任何具備 C/C++ 經驗,且對突破僅使用 CPU 進行程式設計的限制、加速應用程式效能有興趣的任何人。在本課程中,你將學會:

    • 透過四個簡單步驟,運用 OpenACC 加速你現有的應用程式
    • 如何分析並最佳化你的 OpenACC 程式碼基底
    • 如何結合 OpenACC 與訊息傳遞介面 (MPI),以在多個 GPU 系統編寫程式

    完成本課程之後,你將可以結合 OpenACC、CUDA-aware MPI 以及 NVIDIA 分析工具,在多個 GPU 叢集打造並最佳化加速各式應用程式。

  • 使用容器執行高效能運算

    必備基礎能力: 熟練 C/C++ 程式設計和處理 HPC 應用程式的專業經驗

    工具和深度學習框架: Docker、Singularity、HPCCM、C/C++

    時間: 2 小時

    教材語言: 英文

    價格: 30 美元

    瞭解如何使用容器化環境執行高效能運算 (HPC) 應用程式開發,從而降低程式碼的複雜性,並提升可攜性和效率。在本課程中,你將學會:

    • 探索建立和執行 Docker 和 Singularity 容器的基礎知識
    • 運用 HPC 容器製造計畫 (HPC Container Maker,HPCCM),為你的應用程式以程式設計方式設定複雜、可攜式的裸機 HPC 環境
    • 應用進階容器建立技術,如分層容器和多階段組建
    • 運用現有 HPC 應用程式的置入式容器化版本,如 MPI Bandwidth和 MILC

    完成後,你將能夠快速建立和運用 Docker、Singularity 和 HPCCM,在 HPC 應用程式中提供可攜式的裸機效能。

  • 運用 CUDA C/C++ 加速應用程式

    必備基礎能力: C/C++ 基礎概念

    時間: 2 小時

    語言: 英文、日文

    價格: 30 美元

    瞭解如何運用 CUDA 操控 NVIDIA GPU 進行大規模平行運算,以加速 C/C++ 應用程式。你將學習如何運用 CUDA 編寫程式完成以下工作:

    • 加速 SAXPY 演算法
    • 加速矩陣乘法演算法
    • 加速熱傳導演算法

    完成後,你便能使用 CUDA 平台加速 C/C++ 應用程式。

  • OpenACC: 只要 4 個步驟即可加速 2 倍

    必備基礎能力: C/C++ 基礎概念

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    瞭解如何運用 OpenACC 掌控 NVIDIA GPU 進行大規模平行運算,以加速 C/C++ 或 Fortran 應用程式。OpenACC 是一種指令運算方式,使用者只要提供編譯器提示加速程式碼,不需自行撰寫加速器程式碼。使用 OpenACC 開始進行加速應用程式的四步驟程序:

    • 定義應用程式
    • 新增運算指令
    • 新增指令以最佳化資料活動
    • 使用核心排程來最佳化應用程式

    完成後,你便能透過 OpenACC 指令,使用分析導向方法,來快速加速 C/C++ 應用程式。

  • CUDA C/C++ 的 GPU 記憶體最佳化

    必備基礎能力: 「運用 CUDA C/C++ 加速應用程式」或類似經驗

    時間: 2 小時

    語言: 英文

    價格: 30 美元

     

    探索在 NVIDIA GPU 上使用 CUDA C/C++ 編寫記憶體最佳化的程式技術,以及如何使用 NVIDIA 視覺分析工具 (NVIDIA Visual Profiler, NVVP) 支援這些最佳化技術。你將學到:

    • 實作原生矩陣轉置演算法
    • 使用 NVVP 執行多個分析演算法的循環,並最佳化其效能

    完成後,你將瞭解如何分析並提升全域和共享記憶體存取模式,以及如何最佳化加速後的 C/C++ 應用程式。

     

  • 透過使用 CUDA C/C++ 的 GPU 函示庫加速應用程式

    必備基礎能力: 「運用 CUDA C/C++ 加速應用程式」或類似經驗

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    瞭解如何運用置入式程式庫操控 NVIDIA GPU 進行大規模平行運算功能,以加速 C/C++ 應用程式。你將完成三項練習,包含:

    • 使用 cuBLAS 加速基礎矩陣乘法
    • 新增一些 cuRAND API 呼叫至先前的 cuBLAS 呼叫,以整合程式庫
    • 使用 nvprof 分析程式碼,並運用一些 CUDA 執行時間 API 呼叫加以最佳化

    完成後,你便能運用一些支援 CUDA 的程式庫,為現有僅用 CPU 的 C/C++ 程式快速地加速應用程式。

  • 運用 Thrust 加速 C++

    必備基礎能力: 「運用 CUDA C/C++ 加速應用程式」或類似經驗

    時間: 2 小時

    語言: 英文

    價格: 30 美元

    Thrust 是大致上採用 C++ 標準樣板程式庫的平行演算法程式庫。Thrust 可以讓開發人員快速採用平行運算的功能,並支援多種系統後端如 OpenMP 與 Intel 的執行緒建置組塊。透過以下項目的相關練習,學習如何使用 Thrust 加速 C++:

    • 基礎迭代工具、容器和功能
    • 內建和自訂函數工具
    • CPU 處理可攜性

    完成後,你將能操控 Thrust 程式庫的功能,以加速 C/C++ 應用程式。

加速資料科學課程

  • 透過 RAPIDS 加速資料科學基礎課程

    必備基礎能力: Python 程式經驗,有 Pandas 與 NumPy 經驗尤佳

    應用技術: RAPIDS、NumPy、XGBoost、DBSCAN、K-Means、SSSP、Python

    時間: 6 小時

    價格: 90 美元

    課程結束後,可進行線上測驗,通過後可取得電子認證證書

    RAPIDS 是資料科學函式庫的集合,可為端對端的資料科學工作流程提供 GPU 加速。在本課程中,你將學會:

    • 利用 cuDF 與 Dask 直接在 GPU 上擷取和處理大量的資料集
    • 應用包括 XGBoost、cuGRAPH 和 cuML 等各種 GPU 加速的機器學習演算法來執行大規模的資料分析
    • 對大量資料集執行多項分析任務,以防止模擬流行疾病在英國爆發

    完成後,你將學會如何超快速載入、處理與分析多數量級的資料,從而實現更多的迭代周期並大大提高生產率。

  • 透過 RAPIDS 加速資料科學工作流程

    必備基礎能力: Pandas、NumPy 與 scikit-learn 的進階能力

    深度學習框架: 無

    時間: 2 小時

    教材語言: 英文

    價格: 30 美元

    開放原始碼的 RAPIDS 專案讓資料科學家能從頭到尾以 GPU 加速他們的資料科學和資料分析應用程式,創造大幅提升效能和技能的可能性,是傳統僅使用 CPU 的工作流程所不能及。

    瞭解如何以 GPU 加速你的資料科學應用程式:

    • 運用主要 RAPIDS 函式庫,例如 cuDF (採用 GPU 的類 Pandas DataFrame 結構) 和 cuML (GPU 加速機器學習演算法)
    • 學習利用 GPU 加速端對端資料科學技能與方法,進而實現創造快速迭代循環。
    • 瞭解 CPU 驅動與 GPU 驅動資料科學之間的主要差異,包括 API 細節和重構的最佳做法。

    完成後,你就能重構現在僅使用 CPU 的資料科學流程,在 GPU 上以更快的速度運作。

合作夥伴線上訓練課程

DLI 與頂尖教育組織合作,將深度學習訓練推廣給世界各地的開發者與資料科學家。

即將舉辦的講師主持實作坊

DLI 在世界各地的會議和大學提供公開的講師主持實作坊。請檢視以下時程表來尋找你附近的實作坊

對於擁有 20 位以上開發人員、資料科學家和研究人員的團隊,我們推薦講師主持的實作坊,以瞭解如何在專案中應用深度學習技術,以及如何運用 CUDAOpenACC 來加速應用程式。你將獲得工作所需的實際技能以及相關領域的能力認證。

由講師主持的訓練

申請於你所在地區舉辦的 DLI 認證講師主持的全天實作坊。你將可進行實作訓練並存取雲端 GPU,從端對端實作與部署專案。

課程結束後可進行線上測驗,通過後可取得電子認證證書。

深度學習實作坊

深度學習基礎課程

  • 電腦視覺的深度學習基本原理  

    必備基礎能力: 熟悉基礎程式設計原理,例如函數和變數。

    深度學習框架: Caffe、DIGITS

    測驗類型: 程式編寫

    教材語言: 英文、繁中、簡中、日文、韓文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    探索深度學習的基本原理,透過訓練神經網路並使用訓練結果改善效能與功能。

    在這門課程中,你將透過訓練和部署神經網路來瞭解深度學習的基本概念。你將學會:

    • 實作常用的深度學習工作流程,如: 圖像分類和物體偵測
    • 透過資料、訓練參數、網路架構等策略進行實驗以改善效能與功能
    • 部署你的神經網路,開始解決現實世界的問題

    完成之後,你便能獨立開始使用深度學習解決問題。

  • 多重資料類型適用的深度學習基本原理 

    必備基礎能力: 「電腦視覺的深度學習基本原理」或類似的學習經驗。熟悉基礎 Python (函數和變數) 並具備訓練神經網路的經驗。

    深度學習框架: TensorFlow

    測驗類型: 選擇題

    教材語言: 英文、繁中、簡中、日文、韓文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    這門課程將帶你探索如何結合卷積和遞歸神經網路,為影像與影片中的內容產生有效的說明。

    瞭解如何使用 TensorFlow 和 Microsoft Common Objects in Context (Microsoft 物體內容辨識) (COCO) 資料集訓練網路,產生影像與影片的標題,方法為:

    • 實作影像分割和文字產生等深度學習工作流程
    • 比較和對照資料類型、工作流程和架構
    • 結合電腦視覺和自然語言處理

    完成本課程後,你將能解決需要輸入多重資料類型的深度學習問題。

  • 運用於自然語言處理的深度學習基本原理 

    必備基礎能力: 神經網路和 Python 程式編寫基礎概念並熟悉語言學。 

    深度學習框架: TensorFlow、Keras

    測驗類型: 程式編寫與選擇題

    教材語言: 英文、繁中、簡中

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    學習最新的深度學習技術,以瞭解如何使用自然語言處理 (NLP) 進行文本結構資料型式的處理。你將學會:

    • 將文字轉換成機器能夠理解的表現形式與其經典做法
    • 實作分散式表示法 (內嵌) 並瞭解其性質與好處
    • 訓練機器翻譯,從一個語言譯為另一個語言

    完成後,你將專精使用 NLP,並能在其他類似用途上應用內嵌技術。

  • 多 GPU 深度學習基本原理 

    必備基礎能力: 隨機梯度下降機制、網路架構與平行運算等經驗

    深度學習框架:TensorFlow

    測驗類型: 程式編寫

    教材語言: 英文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    自動駕駛車等人工智慧應用程式的深度神經網路需要有龐大的運算能力。使用單一 GPU 可能需要花上數週才能完成單一訓練循環,若要訓練像是運用於自駕車研究的較大型資料集,甚至得花上數年才能完成模型訓練。多 GPU 技術可以大幅縮短訓練大量資料所需的時間,讓使用者可以利用深度學習解決複雜問題。

    此課程教你如何運用多 GPU 技術訓練神經網路。你將學到:

    • 多 GPU 訓練方法
    • 大型訓練會碰上的演算法與工程挑戰
    • 利用重要工程技術應對大規模運算的任務,並克服上述挑戰的重要技術

    完成課程後,你便能使用 TensorFlow 有效平行化深度神經網路訓練。

各產業的深度學習實作坊

  • 運用自動編碼器進行數位內容創作的深度學習技術

    必備基礎能力:對深度學習概念例如 CNN 有基礎理解,並具備 Python 程式設計語言經驗。

    深度學習框架: PyTorch、TensorFlow

    測驗類型:選擇題

    教材語言: 英文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    探索設計、訓練和部署神經網路用以數位內容創作的最新技術。你將學會:

    • 利用神經網路架構上的創新技術與訓練技巧來完成對任意的影片風格轉換
    • 訓練自己的降噪器,用於已渲染的影像
    • 使用超解析度人工智慧將影像提升解析度

    完成本課程後,你將能夠開始使用深度學習方法建立數位資產。

  • 運用深度學習進行醫療影像分析

    先修課程: 對深度神經網路有基礎理解,並具備 Python 或是類似語言的基礎編碼經驗。

    架構: R、MXNet、TensorFlow、Caffe、DIGITS

    測驗類型: 程式編寫

    語言: 英文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    本課程帶你探索如何將卷積神經網路 (CNN) 應用至 MRI 掃描,以便執行各種醫療任務及計算。你將學會:

    • 對 MRI 影像執行圖像分割,以確定左心室的位置
    • 透過將 CNN 應用至 MRI 影像以檢測心臟疾病,透過測量舒張壓及收縮壓之間的差異來計算左心室射出率
    • 將 CNN 應用至低惡性度膠質細胞瘤 (low-grade gliomas, LGG) 的 MRI 掃描,判斷 1p/19q 染色體聯合缺失的狀態

    完成本課程後,你就能將 CNN 應用至 MRI 掃描,以執行各種醫療任務。

  • 運用深度學習進行工業檢查

    必備基礎能力: 熟悉深度神經網路,並具備 Python 和深度學習框架 (如 TensorFlow、Keras 或 PyTorch) 經驗

    工具和深度學習框架: TensorFlow、TensorRT、Keras

    測驗類型: 程式編寫

    教材語言: 英文、繁體中文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    探索如何建立深度學習模型,以使用實際的生產資料集自動驗證 NVIDIA 印刷電路板 (PCB) 中的電容。這可以降低驗證成本,並提高各種製造業應用案例的生產輸送量。你將學到:

    •  使用 Pandas DataFrame 和 NumPy 函式庫,從提供的資料集中找出有意義的見解
    •  將轉移學習應用於 InceptionV3 的深度學習分類模型
    • 使用 TensorRT 5 將 V100 GPU 上經過訓練的 InceptionV3 模型最佳化
    • 使用 V100 的 Tensor 核心對 FP16 半精度快速推論進行實驗

    完成後,你將能夠針對硬體加速的工業檢查流程加以設計、訓練、測試和部署。

     

  • 運用於智慧影片分析的深度學習技術

    必備基礎能力: 深度網路應用經驗 (特別是 CNN 變體)、C 和 Python 中階應用經驗

    深度學習框架: DeepStream 3.0、TensorFlow

    測驗類型: 程式編寫

    教材語言: 英文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    由於交通攝影機日益增加、自駕車蓬勃發展和智慧城市的前景可期,對於更快速及更有效率的物件偵測與追蹤模型的需求也逐漸提高。這包含在影片畫面中辨識、追蹤、分割和預測不同類型的物件。

    在本實作坊中,你將學習:

    • 使用硬體加速解碼方法,有效率地處理和準備影片內容
    • 訓練和評估深度學習模型,並運用「轉移學習」技術來提升這些模型的效率和準確性,以減少資料匱乏的問題
    • 探索研發高品質神經網路模型所需的策略與平衡,以追蹤龐大影片資料集中的移動物體
    • 取得 DeepStream SDK 以最佳化和部署影片分析推論引擎

    完成後,你就能利用停車場攝影機所蒐集的內容,設計、訓練、測試和部署硬體加速交通管理系統的建置組塊。

  • 機器人深度學習

    必備基礎能力: 對深度神經網路有基礎理解,並具備 Python 或是類似語言的基礎編碼經驗。

    深度學習框架: ROS、DIGITS、NVIDIA Jetson

    測驗類型: 程式編寫

    教材語言: 英文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    人工智慧顛覆了各種不同產業的機器人技術加速與開發。探索如何運用嵌入式應用程式 – Jetson 創建機器人解決方案。你將學習:

    • 應用電腦視覺模型進行偵測
    • 精簡與最佳化嵌入式應用程式模型
    • 根據視覺輸入訓練機器人,以提供正確的輸出

    完成後,你將瞭解如何部署適用於機器人技術的高效能深度學習應用程式。

加速運算簡介

  • 運用 CUDA C/C++ 加速運算的基本原理

    必備基礎能力: 基礎 C/C++ 專長能力並熟悉變數類型、迴圈、條件 陳述式、函數和陣列操作。

    時間: 8 小時

    測驗類型: 程式編寫

    教材語言: 英文、繁中、簡中、日文、韓文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    CUDA 運算平台能夠在全球最快速的大型平行運算 GPU 上 加速僅使用 CPU 的應用程式。體驗 C/C++ 應用程式 加速方式:

    • 在 GPU 上加速 CPU 程式中潛在的平行運算
    • 運用必要的 CUDA 記憶體管理技術將加速的 應用程式最佳化
    • 找到加速應用程式的並行潛能,並透過 CUDA 串流加以利用
    • 運用命令列和影像分析來指引和檢查你的作品

    在完成本課程後,你將能夠使用最重要的 CUDA 工具和技術, 將現有僅使用 CPU 的 C/C++ 應用程式加速並最佳化。你將瞭解 CUDA 開發的迭代風格如何讓你可以快速推出加速 應用程式。

  • CUDA Python 加速運算的基本原理

    必備基礎能力: 基礎 Python 專長能力並熟悉變數類型、迴圈、條件陳述式、函數和陣列操作。NumPy 專長能力並使用多維陣列 (ndarray) 和通用函數 (ufunc)。

    時間: 8 小時

    測驗類型: 程式編寫

    教材語言: 英文、繁中、簡中、日文、韓文

    認證: 課程結束後,可進行線上測驗,通過後可取得電子認證證書

    本課程帶領你探索如何即時運用特殊化類型的 Python 函數編譯器 Numba,以在大型平行 NVIDIA GPU 上加速執行 Python 程式。你將學會:

    • 透過 NumPy 通用函數 (ufuncs) 使用 Numba 編譯 CUDA 核心
    • 使用 Numba 建立並啟動自訂 CUDA 核心
    • 應用關鍵 GPU 記憶體管理技術

    完成本課程後,你將能夠使用 Numba 編譯並啟動 CUDA 核心,以加速 NVIDIA GPU 上的 Python 應用程式。

企業解決方案

如果你對更全面的企業訓練感興趣,DLI 企業解決方案提供符合 貴組織需求的系列訓練與課程。從線上實作與現場訓練,到執行簡報與企業級報告,DLI 可以協助你的公司轉型為運用人工智慧技術的組織。如欲深入瞭解相關資訊,請聯絡我們。

NVIDIA DLI 為大學教職員提供可下載的課程材料,並透過 DLI 教學套件為學生提供可自行安排進度的免費線上訓練課程。教職員還可透過校園大使計畫 (University Ambassador Program) 取得認證,在校園內提供 DLI 實作坊。

教學套件

符合資格的大學教職員如果對深度學習、加速運算,與機器人技術課程解決方案感興趣,都可以使用 DLI 教學套件。教職員也可以將課程材料、實作課程、GPU 雲資源等內容整合至課程中。

校園大使計畫

DLI 校園大使計畫 (University Ambassador Program) 會為符合資格的講師提供認證,以免費為大學教職員、學生和研究人員主持 DLI 實作坊。我們也鼓勵教職員下載 DLI 教學套件,以符合大使計畫的參與資格。

DLI 的認證校園大使遍布數百間大學,包括:

Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology
NUS - National University of Singapore
University of Oxford
Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology
NUS - National University of Singapore
University of Oxford

合作夥伴

DLI 與業界夥伴合作,在全世界建置 DLI 內容以及提供由 DLI 講師主持的實作坊。以下為我們部分的首席合作夥伴