CUDA 是 NVIDIA 的平行運算架構,可運用 GPU 的強大處理能力,大幅增加運算效能。為能使學員輕鬆地瞭解 CUDA 的理念,本課程除了由淺入深地講述平行化加速計算概論外,同時將展示案例應用與優化處理方法與技巧,透過逐步引導使學員更能體會 CUDA 之奧妙。
本次實作坊為中階半日課程,主要帶領學員探索圖像中的物體偵測與神經網路(Neural Network)部署,利用 NVIDIA 深度學習介面 DIGITS 搭載 Google TensorFlow 以及 NVIDIA TensorRT 實作課程,了解圖像分割類神經網絡與培訓各項不同 DNN 架構的推論。透過實作的方式體驗深度學習之案例應用與操作方法。
日期 2018 年 1 月 19 日 星期五
地點 國立中興大學 計算機及資訊網路中心 第二電腦教室 台中市南區興大路 145 號 資訊科學大樓 2 樓 214 教室(地圖)
費用 CUDA 實作坊:免費 深度學習實作坊:新台幣 3,100 元 / 單次課程
報名、繳費、發票等相關問題,請於週一至週五 9:00 - 18:00 洽詢 NVIDIA 深度學習教育機構 課務小組 (02) 2701-6880 #213 曾小姐
本課程將概述 3 個在 GPU 平行化平台加速的技巧/方法,包含函式庫、OpenACC 指令、以及直接在 CUDA 語言中編寫代碼。透過本堂 45 分鐘入門課程,您有機會練習幾個不同的案例展示 GPU 的平行加速計算的效能與如何將您之前的語法移植至 GPU 介面。
本課程將展示如何利用 Python 程式語言,透過 NVIDIA CUDA 平行計算架構以及 NVIDIA GPU 使用更精簡的時間完成大規模的平行計算。本課程包含 GPU 的 Hello world,以及基礎的 SAXPY 演算法和 Matrix Multiply 演算法作為案例展示其應用與加速成果。
本課程將探索如何使用 NVIDIA GPU 的 drop-in 函式庫加速 Python 應用程序,利用 GPU 駕馭大規模的平行計算。課程中將實際操作 Python profiler 分析程式的效能與運算時程,加上 cuRAND API 調整 Python 程式以最佳化運算效能,並運用 CUDA Runtime API 檢視數據以達到應用程序效能最佳化。
許多重要的應用程式在圖像中偵測一個以上的對象,這時候就必須將圖像分割成小空間區域並且標明不同種類。圖像分割常被應用在醫學圖像分析或是自主駕駛車等等領域。本課程將帶領學員透過 Tensorflow 架構,實際操作整理好的醫學影像與自主駕駛車資料庫做學習,您將熟悉如何在複雜的醫療影像中分解不同類型的人體組織、血管或異常細胞,進一步由原始影像分割出特定器官,並使用自主駕駛車的案例,讓您學習如何用圖像分割類神經網絡了解道路場景。
透過本課程您將有機會了解深度學習中不同部屬的方式與其優點,我們將展示三種部署方法。第一種方法是直接使用深入學習框架中的推理功能,會以 DIGITS 和 Caffe 示範。第二種方法是通過使用深度學習框架 API ,再次使用 Caffe ,但是這次通過 Python API 來整合自定義應用程序中的推理。最後的方法是使用 NVIDIA TensorRT ,它將從受過訓練的 Caffe 模型和網絡描述文件自動創建優化的推理運行時間。在本實驗中,您將了解批量大小在推論性能中的作用,以及可在推理過程中進行的各種最佳化。您還將探索對其他 NVIDIA 深度學習實驗室相關課程中進行培訓的各種不同 DNN 架構的推論。