NVIDIA 深度學習機構

接受訓練以解決全球最富挑戰的問題

NVIDIA 深度學習機構(DLI)提供人工智慧、加速運算和加速資料科學的實作訓練課程。開發人員、資料科學家、研究人員和學生可藉由雲端 GPU 環境獲得實作體驗。 IT 專業人員可以參加設計和管理基礎架構的課程,以便支援跨整個組織的 AI、資料科學和 HPC 工作負載。我們為個人提供可自行安排進度的線上訓練課程、為團隊提供講師主持的實作坊,並為大學教職員提供可下載的課程素材,供不同使用者著手使用 DLI。 可取得 NVIDIA DLI 認證,證明自己具備相關主題的能力,協助自我專業職涯成長。

  • <span style=

    線上課程

  • <span style=

    講師主持的實作坊

  • <span style=

    大學訓練

對於自學者和小型團隊,我們推薦透過 DLI 進行可自行安排進度的線上訓練課程,以及透過我們的合作夥伴進行線上課程。你可以透過 DLI,在雲端上存取全面設定完成的 GPU 加速伺服器,藉此獲得工作所需的實際技能,並有機會取得相關領域的能力認證。

DLI 線上訓練課程

課程結束後可進行線上測驗,通過後可取得電子認證證書。

深度學習課程

深度學習基礎課程

  • 電腦視覺的深度學習基本原理 

    探索深度學習的基礎原理,透過類神經網路實際進行訓練運算,並使用訓練運算結果進行理論探討,進而改善效率與成效。

    必備基礎能力:熟悉基礎程式設計原理,例如函數和變數。

    技術:Caffe、DIGITS

    時間:8 小時

    價錢:90 美元(不含稅)

  • 透過 Jetson Nano 開發人工智慧應用

     

     

    人工智慧強大的功能掌握在自造者、自學開發者與嵌入式技術愛好者的手中。 偕同 NVIDIA Jetson Nano 開發套件,這款易於使用且強大的電腦,可讓你同時執行多個神經網路,適合應用於影像分類、物件偵測、分割和語音處理。在本課程中,你可以在 Jetson Nano 上使用 Jupyter iPython Notebook 建立一個具備深度學習分類的電腦視覺模型。

    必備基礎能力:熟悉 Python (有幫助,但非必須)

    技術:PyTorch、Jetson Nano

    時間:8 小時

    價錢:免費

  • 應用 DIGITS 進行圖像分類

    深度學習技術是一個嶄新的技術,透過向資料學習的模組,取代以往的手動編碼指示,藉此實現全新解決方案。透過以下方式訓練深度神經網路辨識手寫數字:

    必備基礎能力:

    技術:Caffe (使用 DIGITS 介面)

    時間:2 小時

    價錢:30 美元(不含稅)

  • 利用 TensorRT 部署與最佳化 TensorFlow 模型

    學習在 TensorFlow 平台利用內建的 TensorRT 函式庫 (TF-TRT) 與 Python 產生高效能深度學習模型之基礎,

    必備基礎能力:TensorFlow 與 Python 的經驗

    技術:TensorFlow、Python 與 TensorRT (TF-TRT)

    時間:2 小時

    價錢:30 美元(不含稅)

  • 使用 Horovod 進行大規模深度學習

    瞭解如何使用 Horovod 將深度學習訓練擴充到多個 GPU。Horovod 是開放原始碼的分散式訓練框架,最初由 Uber 打造並由 LF AI 基金會託管。在本課程中,

    必備基礎能力:Python 專長能力,以及在 Python 中訓練深度學習模型的專業經驗

    技術:Horovod、TensorFlow、Keras、Python

    時間:2 小時

    價錢:30 美元(不含稅)

  • 運用 TensorFlow 進行影像分割

    影像 (或語意) 分割是一項將影像的每個像素分到特定類別的工作。透過以下方式瞭解如何分割 MRI 影像,以評估心臟的各個部位

    必備基礎能力:類神經網路基礎概念

    技術:TensorFlow

    時間:2 小時

    價錢:30 美元(不含稅)

  • 運用 Keras 建立時間序列的遞歸神經網路資料模型

    遞歸神經網路 (RNN) 能夠讓模型分類或預測時間序列資料,例如自然語言、市場甚至是病人的身體狀況隨時間變化的情形。

    必備基礎能力:深度學習基礎概念

    技術:Keras

    時間:2 小時

    價錢:30 美元(不含稅)

適用於數位內容創作的深度學習技術

  • 運用 Torch 完成影像風格轉移

     

     

    探索如何透過擷取獨特的視覺特徵,將一幅影像的外觀和風格轉移至另一幅影像。瞭解如何運用卷積神經網路 (CNN) 擷取特徵,以及如何將這些特徵輸入產生工具以建立新影像。

    必備基礎能力:CNN 的經驗

    技術:Torch, CNNs

    時間:2 小時

    價錢:30 美元(不含稅)

  • 使用自動編碼器製作超高解析度影像

    運用強大的神經網路與自動編碼器,透過低畫質來源影像建立高畫質影像。

    必備基礎能力:CNN 的經驗

    技術:Keras, CNNs

    時間:2 小時

    價錢:30 美元(不含稅)

適用於醫療保健的深度學習技術

  • 使用 MedNIST 資料集完成醫療影像分類

     

     

    放射醫學和醫療影像運用深度學習的實作介紹。

    必備基礎能力:Python 的基礎概念

    技術:PyTorch, Python

    時間:2 小時

    價錢:30 美元(不含稅)

  • 使用 TensorFlow 完成影像分類: 影像體學 - 1p19q 染色體狀態分類

    有了梅約診所 (Mayo Clinic) 運用深度學習技術從 MRI 影像偵測影像體學的成果,讓患有腦部腫瘤的病患可以獲得更有效的治療,且後續健康狀態也有所提升。透過下列方式學習偵測 1p19q 共同缺失生物標記:

    必備基礎能力:CNN 與 Python 的基礎學習經驗

    技術:TensorFlow, CNNs, Python

    時間:2 小時

    價錢:30 美元(不含稅)

  • 用於醫學影像的生成網絡的數據增強與分割

    生成對抗式網路 (GAN) 是一對深度神經網路架構,包含可以根據提供的訓練資料來建立新範例的生成器網路,以及藉由可以試著分辨真實和模擬資料的鑑別器網路。當兩個網路同時提升時,所建立的範例就會越益真實。這項技術對於醫療照護尤其有幫助,因為可以增強較小型的資料集,進而利用這些資料用以訓練傳統網路。

    必備基礎能力:CNN 的經驗

    技術:TensorFlow, GANs, CNNs

    時間:2 小時

    價錢:30 美元(不含稅)

  • 醫療影像適用的粗糙至精緻情境式記憶

     

     

    粗糙至精緻情境式記憶 (CFCM) 是運用極深度的架構所打造的影像分割技術,並包含許多不同等級功能的卷積長短期記憶 (Conv-LSTM)。

    必備基礎能力:CNN 與長短期記憶 (LSTM) 的經驗

    技術:TensorFlow, CNNs, CFCM

    時間:2 小時

    價錢:30 美元(不含稅)

適用於智慧影片分析的深度學習技術

  • 採用 DeepStream 進行智慧影片分析的人工智慧工作流程

    DeepStream 3.0 框架具備硬體加速的智慧影片分析 (IVA) 應用程式建置組塊。這讓開發人員能專心建置核心深度學習網路。DeepStream SDK 支援多樣的用途,並提供彈性的部署媒體。

    必備基礎能力:C++ 與 Gstreamer 的經驗

    技術:DeepStream3, C++, Gstreamer

    時間:2 小時

    價錢:30 美元(不含稅)

  • 透過 Jetson Nano 與 DeepStream 開發影像分析應用

    學習如何建立 DeepStream 應用以利用物體偵測及分類網路標記串流影片。

    必備基礎能力:C 語言基礎知識

    技術:DeepStream、TensorRT、Jetson Nano

    課程時間:8 時間、線上自學型

    價格:免費

加速運算課程

  • CUDA C/C++ 加速運算的基本原理  

     

     

    瞭解如何使用基本的 CUDA 技術與 Nsight Systems Profiler 加速與優化既有僅使用 CPU 的 C/C++ 應用程式,以使用並發揮 GPU 強大的功能。

    必備基礎能力:基礎 C/C++ 專長能力並熟悉變數類型、迴圈、條件 陳述式、函數和陣列操作。

    技術:C/C++, CUDA

    時間:8 小時

    價錢:90 美元(不含稅)

     

  • CUDA Python 加速運算的基本原理

     

     

    本課程帶領你探索如何即時運用特殊化類型的 Python 函數編譯器 Numba,以在大型平行 NVIDIA GPU 上加速執行 Python 程式。

    必備基礎能力:基礎 Python 專長能力並熟悉變數類型、迴圈、條件 陳述式、函數和陣列操作。NumPy 專長能力並使用 多維陣列 (ndarray) 和通用函數 (ufunc)。

    技術:CUDA, Python, Numba, NumPy

    時間:8 小時

    價錢:90 美元(不含稅)

  • 使用 CUDA C++ 橫跨多個 GPU 擴展工作負載 (新課程!)

    瞭解如何運用單個節點上可用的 GPU 打造強大且高效的 CUDA C++ 應用程式。

    必備基礎能力: CUDA C/C++ 程式編寫能力

    工具、函式庫和框架: C、C++

    課程時長:4 小時

    教材語言:英文

    價格:30 美元(未稅)

  • 透過 Concurrent Streams 加速 CUDA C++ 應用程式 (新課程!)

    瞭解如何透過將 GPU 的記憶體傳輸與 GPU 上的運算重疊來提高 CUDA C/C++ 應用程式的效能。

    必備基礎能力:CUDA C/C++ 程式編寫能力

    工具、函式庫和框架:C、C++

    課程時長:4 小時

    教材語言: 英文

    價格:30 美元(未稅)

  • OpenACC 加速運算的基本原理

    學習 OpenACC 的基本知識,這是在 GPU 上進行程式設計時使用的高階程式語言。本課程適合任何具備 C/C++ 經驗,且對突破僅使用 CPU 進行程式設計的限制、加速應用程式效能有興趣的任何人。

    必備基礎能力:C/C++ 基礎概念

    技術:OpenACC, C/C++

    時間:8 小時

    價錢:90 美元(不含稅)

  • 使用容器執行高效能運算

    瞭解如何使用容器化環境執行高效能運算 (HPC) 應用程式開發,從而降低程式碼的複雜性,並提升可攜性和效率。在本課程中,

    必備基礎能力:熟練 C/C++ 程式設計和處理 HPC 應用程式的專業經驗

    技術:Docker、Singularity、HPCCM、C/C++

    時間:2 小時

    價錢:30 美元(不含稅)

  • OpenACC: 只要 4 個步驟即可加速 2 倍

    瞭解如何運用 OpenACC 掌控 NVIDIA GPU 進行大規模平行運算,以加速 C/C++ 或 Fortran 應用程式。OpenACC 是一種指令運算方式,使用者只要提供編譯器提示加速程式碼,不需自行撰寫加速器程式碼。使用 OpenACC 開始進行加速應用程式的四步驟程序:

    必備基礎能力:C/C++ 基礎概念

    技術:C/C++, OpenACC

    時間:2 小時

    價錢:30 美元(不含稅)

加速資料科學課程

  • 透過 RAPIDS 加速資料科學基礎課程

    RAPIDS 是資料科學函式庫的集合,可為端對端的資料科學工作流程提供 GPU 加速。在本課程中,

    必備基礎能力:Python 程式經驗,有 Pandas 與 NumPy 經驗尤佳

    技術:RAPIDS、NumPy、XGBoost、DBSCAN、K-Means、SSSP、Python

    時間:6 小時

    價錢:90 美元(不含稅)

  • 透過 RAPIDS 加速資料科學工作流程

    開放原始碼的 RAPIDS 專案讓資料科學家能從頭到尾以 GPU 加速他們的資料科學和資料分析應用程式,創造大幅提升效能和技能的可能性,是傳統僅使用 CPU 的工作流程所不能及。

    必備基礎能力:Pandas、NumPy 與 scikit-learn 的進階能力

    技術:RAPIDS, cuDF, cuML, XGBoost

    時間:2 小時

    價錢:30 美元(不含稅)

IT 專業人員的 AI 課程

  • 在資料中心導入人工智慧

    探索有關 AI、GPU 運算、NVIDIA AI 應用軟體架構,以及如何在資料中心中實現和擴展 AI 工作負載。你將了解 AI 如何翻轉這個社會,以及如何將 GPU 運算部署到資料中心以促進這種轉變。

    必備基礎能力:企業網路、儲存以及資料中心營運等基本知識

    技術:人工智慧、機器學習、深度學習、GPU 硬體與軟體架構

    時間:4 小時

    價錢:30 美元(不含稅)

合作夥伴線上訓練課程

DLI 與頂尖教育組織合作,將深度學習訓練推廣給世界各地的開發者與資料科學家。

即將舉辦的 DLI 實作坊

即將舉辦的講師主持實作坊

DLI 在世界各地的會議和大學提供公開的講師主持實作坊。請檢視以下時程表來尋找你附近的實作坊

若有大型團隊或自學者對於訓練感興趣,我們推薦由 DLI 認證講師主持的全天實作坊。你可以為你的團隊申請現場全天實作坊或線上虛擬授課的實作坊。你可以透過 DLI,在雲端上存取全面設定完成的 GPU 加速伺服器,藉此獲得工作所需的實際技能,並有機會取得相關領域的能力認證。

課程結束後可進行線上測驗,通過後可取得電子認證證書。

深度學習實作坊

深度學習基礎課程

  • 深度學習基礎理論與實踐(新課程!)

    世界各地的企業都在運用人工智慧(AI)解決最困難的挑戰。專業醫療照護人員使用 AI 加快診斷病患的速度和準確度。零售企業將其用於為客戶提供個人化的購物體驗。汽車製造商使用 AI 讓私家轎車、共享交通工具和貨運服務更安全、更有效率。深度學習是實作 AI 的強大方式,透過其所使用的多層次人工智慧神經網路,即可在物體偵測、語音辨識和語言翻譯等工作上達到最為先進的精確度。電腦現在可使用深度學習技術,從資料中學習和辨識出對專家編寫的應用軟體而言過於複雜或細微的模式。

    在本實作坊中,你將進行電腦視覺和自然語言處理方面的實作練習,藉此瞭解深度學習的運作方式。你將會從零開始訓練深度學習模型、學習工具和技巧,追求高度準確的成果。也會學習如何運用免費的頂尖預先訓練好的模型,如此可以節省時間,並讓深度學習應用程式即刻運作。

    參加本實作坊可學會:

    • 練習訓練深度學習模型所需的基本技術和工具
    • 熟悉通用的深度學習資料類型和模型架構
    • 透過資料增強來強化資料集以提升模型精準度
    • 運用模型之間的遷移學習,以較少的資料和運算達成高效成果
    • 使用現代的深度學習框架,更具信心地打造自己的專案

    必備基礎能力:瞭解 Python 中的基本程式設計概念,如函數、迴圈、字典和陣列等。

    工具、函式庫和框架:Tensorflow、Keras、Pandas、Numpy

  • 建造智慧推薦系統(新課程!) 

    深度學習技術的推薦系統,正是提供個人化線上體驗的秘方,也是零售、娛樂、醫療照護、金融與其他產業的強大決策支援工具。

    推薦系統會去瞭解許多人的偏好選擇、先前做出的決定及其他特徵,以此方式發揮功用。舉例來說,推薦系統可以協助串流媒體服務瞭解個人喜好的電影類型、實際觀看的影片及使用者懂得的語言。要訓練神經網路歸納這類龐大資料,並迅速針對相似的個人或情況提供特定建議,會需要經過大量運算,而 GPU 可大幅加快運算速度。若公司組織希望能提供更加愉快的使用者體驗、與客戶有更深度的互動、下達更為明智的決策,運用設計妥當且經過訓練的推薦系統,就能大幅提升價值。

    本次實作坊的內容,涵蓋了建立高效推薦系統所需的基本工具和技術,並會說明如何部署 GPU 加速解決方案以即時提供推薦。

    參加本實作坊可學會:

    • 使用開放原始碼 cuDF 函式庫和 Apache Arrow 建立以內容為基礎的推薦系統
    • 使用交替最小平方(alternating least squares,ALS)和 CuPy 建立協作式篩選推薦系統
    • 使用 TensorFlow 2 設計出兼具寬度和深度的神經網路,打造混合式的推薦系統
    • 使用大型的稀疏資料集,達到最佳的訓練和推論效能
    • 將推薦模型部署為高效能網路服務

    必備基礎能力:

    • 具有 Python 中階知識,需對列表推導 (List Comprehension) 有所理解
    • 使用 Python 的資料科學經驗
    • 熟悉 NumPy 和矩陣數學運算

    工具、函式庫和框架:CuDFCuPyTensorFlow 2  以及 NVIDIA Triton™ 推論伺服器

  • 建立基於 Transformer 的自然語言處理應用(新課程!) 

    過去十年來,自然語言處理(NLP)的應用已呈現爆炸性成長。隨著 AI 助理數量激增,公司組織也在業務中融入更多互動式人機體驗,因此勢必得理解 NLP 技術是如何用於處理、分析和產生文字型的資料。運用現代技術,可捕捉到語言的細微差別、語境和複雜精妙之處,如同人類一般。在設計正確的情況下,開發人員可以運用這些技術打造強大的 NLP 應用程式,在聊天機器人、AI 語音助理及更多其他的應用程式上,提供自然且順暢的人機互動效果。


    深度學習模型受到 NLP 廣泛採用,因為其能透過一系列的語境和語言,準確進行歸納。以 Transformer 為基礎的模型,例如基於變換器的雙向編碼器表示技術(Bidirectional Encoder Representations from Transformers,BERT),在 SQuAD 的問答系統、實體識別、意圖識別、情緒分析這類基準上,所提供的準確度與人類標準相差無幾,讓 NLP 的發展發生了革命性的劇變。NVIDIA 提供了應用軟體和硬體,可協助迅速打造出最先進的 NLP 模型。透過混合精度,最多可將訓練過程加快 4.5 倍,且能在多個伺服器節點上輕鬆調整多 GPU 的效能,且不會影響準確性。

    在本實作坊中,會學習如何將以 Transformer 為基礎的自然語言處理模型運用於文字分類工作,例如分類文件。也會學到如何利用以 Transformer 為基礎的模型來處理命名實體識別(NER)工作,以及如何分析各種模型功能、限制和特性,以便依據指標、領域獨特性和可用資源,判斷何種模型最適合特定使用案例。

    參加本實作坊可學會:

    • 瞭解文字內嵌如何在 NLP 工作中迅速進化,例如 Word2Vec、遞歸神經網路 (RNN) 型內嵌及 Transformer
    • 瞭解 Transformer 架構功能(尤其是自我注意力機制)是如何用於建立語言模型,而無需 RNN
    • 使用自我監督技術提升 BERT、Megatron 和其他變體中的 Transformer 架構,以達到優異的 NLP 成果
    • 利用預先訓練的現代 NLP 模型處理多項工作,例如文字分類、NER 和問答系統
    • 管理推論挑戰,並部署即時應用程式的微調模型

    必備基礎能力:

    • 具有 Python 編碼與使用函式庫函數和參數的經驗
    • 瞭解深度學習框架的基本知識,如 TensorFlow、PyTorch 或 Keras
    • 對神經網路有基本理解

    工具、函式庫和框架:PyTorch、pandas、NVIDIA NeMo™ 以及 NVIDIA Triton™ 推論伺服器

  • 多 GPU 深度學習基本原理 

    自動駕駛車等人工智慧應用程式的深度神經網路需要有龐大的運算能力。使用單一 GPU 可能需要花上數週才能完成單一訓練循環,若要訓練像是運用於自駕車研究的較大型資料集,甚至得花上數年才能完成模型訓練。多 GPU 技術可以大幅縮短訓練大量資料所需的時間,讓使用者可以利用深度學習解決複雜問題。

    此課程教你如何運用多 GPU 技術訓練神經網路。你將學到:

    • 多 GPU 訓練方法
    • 大型訓練會碰上的演算法與工程挑戰
    • 利用重要工程技術應對大規模運算的任務,並克服上述挑戰的重要技術

    完成課程後,你便能使用 TensorFlow 有效平行化深度神經網路訓練。

    必備基礎能力:隨機梯度下降機制、網路架構和平行運算學習經驗

    技術:TensorFlow

各產業的深度學習實作坊

  • 運用於自駕車的深度學習技術: 認知

    學習如何使用 NVIDIA DRIVE™ 開發平台設計、訓練和部署自駕車適用的深度神經網路。

    你將學到:

    • 在 NVIDIA DRIVE AGX™ 系統上運用 CUDA® 程式碼、記憶體管理技術和 GPU 加速
    • 訓練語意分割神經網路
    • 使用 NVIDIA® TensorRT™ 最佳化、驗證和部署經過訓練的神經網路

    完成本課程後,你將能夠使用 NVIDIA DRIVE 建立並最佳化自駕車的認知元件。

    必備基礎能力:CNN 與 C++ 的經驗

    技術:TensorFlow、TensorRT、Python、CUDA C++、DIGITS

  • 運用深度學習進行醫療影像分析

    本課程帶你探索如何將卷積神經網路 (CNN) 應用至 MRI 掃描,以便執行各種醫療任務及計算。你將學會:

    • 對 MRI 影像執行圖像分割,以確定左心室的位置
    • 透過將 CNN 應用至 MRI 影像以檢測心臟疾病,透過測量舒張壓及收縮壓之間的差異來計算左心室射出率
    • 將 CNN 應用至低惡性度膠質細胞瘤 (low-grade gliomas, LGG) 的 MRI 掃描,判斷 1p/19q 染色體聯合缺失的狀態

    完成本課程後,你就能將 CNN 應用至 MRI 掃描,以執行各種醫療任務。

    必備基礎能力:對深度神經網路有基礎理解,並具備 Python 或是類似語言的基礎編碼經驗

    技術:R、MXNet、TensorFlow、Caffe、DIGITS

  • 運用深度學習進行工業檢查

    探索如何建立深度學習模型,以使用實際的生產資料集自動驗證 NVIDIA 印刷電路板 (PCB) 中的電容。這可以降低驗證成本,並提高各種製造業應用案例的生產輸送量。你將學到:

    •  使用 Pandas DataFrame 和 NumPy 函式庫,從提供的資料集中找出有意義的見解
    •  將轉移學習應用於 InceptionV3 的深度學習分類模型
    • 使用 TensorRT 5 將 V100 GPU 上經過訓練的 InceptionV3 模型最佳化
    • 使用 V100 的 Tensor 核心對 FP16 半精度快速推論進行實驗

    完成後,你將能夠針對硬體加速的工業檢查流程加以設計、訓練、測試和部署。

    必備基礎能力:熟悉基礎 Python (函數和變數) 並具備訓練神經網路的經驗。

    技術:TensorFlow

  • 運用於智慧影片分析的深度學習技術

    由於交通攝影機日益增加、自駕車蓬勃發展和智慧城市的前景可期,對於更快速及更有效率的物件偵測與追蹤模型的需求也逐漸提高。這包含在影片畫面中辨識、追蹤、分割和預測不同類型的物件。

    在本實作坊中,你將學習:

    • 使用硬體加速解碼方法,有效率地處理和準備影片內容
    • 訓練和評估深度學習模型,並運用「轉移學習」技術來提升這些模型的效率和準確性,以減少資料匱乏的問題
    • 探索研發高品質神經網路模型所需的策略與平衡,以追蹤龐大影片資料集中的移動物體
    • 取得 DeepStream SDK 以最佳化和部署影片分析推論引擎

    完成後,你就能利用停車場攝影機所蒐集的內容,設計、訓練、測試和部署硬體加速交通管理系統的建置組塊。

    必備基礎能力:神經網路和 Python 程式編寫基礎概念並熟悉語言學

    技術:TensorFlow、Keras