在线自主培训

NVIDIA 深度学习学院 (DLI) 为期望使用深度学习和加速计算解决全球最具挑战性问题的开发者、数据科学家和研究人员提供动手实践培训。

您可以随时随地使用云端完全配置的 GPU 加速工作站开始在线自主培训。选择全日式主题课程以实践完整的端到端的项目,或选择两小时的实验课程以学习特定技术或技能。

创建帐户,立即开始学习。

  • 主题课程
  • 深度学习迷你课程
  • 加速计算迷你课程

主题课程

深度学习基础——计算机视觉

预备知识:技术背景

框架:Caffe, DIGITS

通过训练神经网络并使用结果来提高性能和功能,探索深度学习的基础知识。

在本课程中,您将通过训练和部署神经网络来了解深度学习的基础知识。 将学习如何:

• 实施常见的深度学习工作流程,如图像分类和目标检测。

• 练习用数据,训练参数,网络结构和其他策略以提高性能和功能。

•  部署神经网络开始解决现实世界中的问题。

完成后,您将可以通过深入学习自行解决实际问题。

加速计算基础——CUDA C/C++

预备知识:CUDA C/C++ 基础知识

CUDA 计算平台能够加速仅适用于 CPU 的应用程序,以在世界上最快的大规模并行 GPU 上运行。 通过以下方式体验 C/C++应用加速:

• 加速仅适用于 CPU 的应用程序在 GPU 上运行其潜在并行性

• 利用基本的 CUDA 内存管理技术来优化加速应用程序

• 揭示加速应用程序的并发潜力,并利用CUDA流进行开发

• 利用命令行和可视化分析来指导和检查

完成后,您将能够使用最基本的 CUDA 工具和技术,加速和优化仅适用于 CPU 的 C/C++应用程序。您将了解 CUDA 开发的迭代风格,这将允许您快速发布加速应用程序。

加速计算基础——CUDA Python

预备知识:Python 基础知识

本动手实验课程探讨如何使用 Numba(即时,专用类型的Python函数编译器)在 NVIDIA 大规模并行运算的 GPU 上加速 Python 应用程序。 你将学习如何:

• 使用 Numba 从NumPy ufuncs 编译 CUDA 内核

• 使用 Numba 创建和启动自定义 CUDA 内核

• 应用关键的GPU内存管理技术

完成后,您将能够使用Numba编译并启动 CUDA 内核,以加速 NVIDIA GPU上的 Python 应用程序。

加速计算基础——OpenACC

预备知识:CUDA C/C++ 基础知识

学习高级 GPU 编程语言 OpenACC 的基础知识。本课程适合具有部分 C/C++ 经验,且对加速应用程序性能以超越纯 CPU 编程极限感兴趣的任何人士。在本课程中,您将学习:

• 使用 OpenACC 加速现有应用程序的简单四步骤

• 如何配置和优化您的 OpenACC 代码库

• 如何将 OpenACC 与 MPI 相结合,以在多 GPU 系统上编程

完成本课程后,您将能够同时使用 OpenACC、CUDA-aware MPI 和 NVIDIA 配置工具,

构建和优化多 GPU 集群上的加速异构应用程序。

深度学习 —— 医学影像分析

预备知识:“深度学习基础 —— 计算机视觉” 课程或类似经验

框架:Caffe, MXNet, TensorFlow

本动手实验课程将探讨如何在 MRI 扫描中应用卷积神经网络 (CNN) 执行各种医学任务和计算。您将学习如何:

• 在 MRI 影像上执行影像分割以定位左心室。

• 通过使用应用于 MRI 扫描的 CNN 测量心脏舒张和收缩之间的压差来计算射血分数,从而检测心脏病。

• 在 MRI 扫描中应用 CNN 来检测 LGG 以确定 1p/19q 染色体的联合缺失状态。

完成本课程后,您将能够在 MRI 扫描中应用 CNN 执行各种医疗医学任务。

深度学习 —— 医学基因组研究

预备知识:“深度学习基础 —— 计算机视觉” 课程或类似经验

框架:Caffe, TensorFlow, Theano

本动手实验课程将教授您如何应用深度学习检测染色体的联合缺失和在基因组序列中寻找基序。您将学习如何:

• 理解卷积神经网络 (CNN) 的基础知识以及其工作原理

• 在 MRI 扫描中应用 CNN 来检测 LGG 以确定 1p/19q 染色体的联合缺失状态

• 如何使用 DragoNN 工具包评估基因组学数据并寻找基序

完成本课程后,您将理解 CNN 的工作原理,能够使用 CNN 评估 MRI 影像,以及使用真实的调控基因组数据研究新的基序。

深度学习迷你课程

通过DIGITS 实现图像分类

预备知识:无

框架:Caffe, DIGITS

学习如何训练深度神经网络,通过将图像数据加载到训练环境,选择和训练网络,以及使用新数据进行测试并迭代以提高性能来识别手写数字。

通过 DIGITS 实现目标检测

预备知识:无

框架:Caffe, DIGITS

通过识别专用网络和采用端到端标记的数据,学习如何使用计算机视觉和深度学习实现目标检测。

在 Keras 中通过递归神经网络(RNN)为时间序列数据建模

预备知识:“深度学习基础 —— 计算机视觉” 课程或类似经验

框架:Keras

了解如何使用 RNN 对时间序列数据分类和预测,比如对患者的长期健康状况进行建模。

通过 DIGITS 和 TensorRT 部署神经网络

预备知识:无

框架:DIGITS, TensorRT

了解如何将深度学习部署至应用程序,以实时识别图像以及探测行人。

深度学习工作流程与 TensorFlow、MXNet 和 NVIDIA-Docker

预备知识:熟悉 Bash 终端

框架:TensorFlow, MXNet

学习如何使用 NVIDIA Docker 插件通过 GPU 容器化产品级深度学习工作流程。

使用 TensorFlow 进行图像分割

预备知识:“深度学习基础 —— 计算机视觉” 课程或类似经验

框架:TensorFlow

学习将计算机视觉和自然语言处理结合起来,用深度学习来描述场景。

通过 Microsoft Cognitive Toolkit 实现图像分类

预备知识:无

框架:Microsoft Cognitive Toolkit

学习使用 Microsoft Cognitive Toolkit 框架训练神经网络。

通过 TensorFlow 实现线性分类

预备知识:无

框架:TensorFlow

学习如何使用 TensorFlow 的 TFLearn API 根据结构化数据进行预测。

通过 DIGITS 进行信号处理

预备知识:无

框架:Caffe, DIGITS

学习如何将射频 (RF) 信号转换为图像,以检测被噪音破坏的弱信号。

结合 TensorFlow 和 DIGITS 利用 GAN 生成图像

预备知识:“深度学习基础 —— 计算机视觉” 课程或类似经验

框架:TensorFlow, DIGITS

学习如何训练生成式对抗网络 (GAN) 来创建图像内容。

通过 Torch 实现图像风格迁移

预备知识:“深度学习基础 —— 计算机视觉” 课程或类似经验

框架:Torch

学习如何使用卷积神经网络 (CNN) 提取不同视觉特征,将一个图像的外观和风格迁移到另一个图像中。

使用自动编码器实现渲染图像去噪

预备知识:“深度学习基础 —— 计算机视觉” 课程或类似经验

框架:TensorFlow

了解如何使用带有自动编码器的神经网络,显著加快光线追踪图像噪声的去除速度。

加速计算迷你课程

使用 CUDA C/C++ 加速应用程序

预备知识:CUDA C/C++ 基础知识

学习如何使用 CUDA 加速您的 C/C++ 应用程序,从而实现对 NVIDIA GPU 大规模并行能力的利用。

OpenACC - 4个步骤实现2倍增速

预备知识:CUDA C/C++ 基础知识

了解如何使用 OpenACC 加速 C/C++ 或 Fortran 应用程序,以充分利用 NVIDIA GPU 的大规模并行计算能力。

加速计算简介

预备知识:无

学习加速应用程序的各种技术,包括 CUDA 和 OpenACC。

使用 CUDA C/C++ 优化 GPU 显存

预备知识:CUDA C/C++ 基础知识

学习在 NVIDIA GPU 上使用 CUDA C/C++ 进行编程的显存优化技术,以及如何使用 NVIDIA Visual Profiler (NVVP) 来支持这些优化。

使用 CUDA C/C++ 中的 GPU 加速库加速应用程序

预备知识:CUDA C/C++ 基础知识

学习如何使用 CUDA 优化库加速您的 C/C++ 应用程序,从而实现对 NVIDIA GPU 大规模并行能力的利用。

使用 Python 中的 GPU 加速库加速应用程序

预备知识:无

了解如何使用 CUDA 优化库加速您的 Python 应用程序,从而实现对 NVIDIA GPU 大规模并行能力的利用。

使用 Thrust 加速 C++

预备知识:CUDA C/C++ 基础知识

了解如何使用功能强大的 Thrust 库在 C/C++ 中构建 GPU 加速应用程序。

使用 OpenACC 分析和并行化程序

预备知识:"OpenACC - 4个步骤实现2倍增速"

关于 OpenACC 编程周期中的前两步的实践练习。

OpenACC 中的数据通信和循环优化

预备知识:"OpenACC - 4个步骤实现2倍增速"和"使用OpenACC分析和并行化程序"

学习如何添加数据管理和循环指令以优化 OpenACC 加速的代码。

入门级:使用 MPI 和 OpenACC 的多 GPU 编程

预备知识:"OpenACC - 4个步骤实现2倍增速"

在多 GPU 系统或 GPU 集群中,探索如何使用 MPI (Message Passing Interface) 和 OpenACC 进行编程。

进阶级:使用 MPI 和 OpenACC 的多 GPU 编程

预备知识:入门级:使用 MPI 和 OpenACC 的多 GPU 编程

学习如何利用重叠通信的计算和处理非连续晕环的更新来改进多 GPU+MPI + OpenACC 程序。

基于 OpenACC 和 GPU 使用流水线工具

预备知识:"OpenACC - 4个步骤实现2倍增速", "使用 OpenACC 分析和并行化程序" 和 "OpenACC 中的数据通信和循环优化"

学习如何使用称为流水线的简单技术来优化 OpenACC 应用程序中的数据拷贝与 GPU 的重叠计算。

使用 OpenACC 加速地震应用的配置驱动型方法

预备知识:无

学习如何使用 PGPROF(一种主机和 GPU 分析工具)和 OpenACC 来加速 C/C++ 应用程序。

使用 CUDA Fortran 加速应用

预备知识:无

了解如何使用 CUDA 加速您的 Fortran 应用程序,从而实现对 NVIDIA GPU 大规模并行能力的利用。

使用 CUDA Fortran 优化 GPU 显存

预备知识:“使用 CUDA Fortran 加速应用”

了解在 NVIDIA GPU 上使用 CUDA Fortran 进行编程的显存优化技术,以及如何使用 NVIDIA Visual Profiler (NVVP) 来支持这些优化。

使用 Fortran 中的 GPU 加速库加速应用

预备知识:CUDA Fortran 基础知识

了解如何使用 CUDA 加速您的 Fortran 应用程序,从而实现对 NVIDIA GPU 大规模并行能力的利用。

想要了解更多信息?请访问 www.nvidia.cn/DLI  查看即将举办的 DLI 研讨会和深度学习教学资源等内容。

加入 NVIDIA 开发者计划 以获得您使用 NVIDIA 解决方案研发应用程序所需的最新软件、工具和信息。