NVIDIA Deep Learning Institute

世界で最も困難な問題を解決するためのトレーニング

NVIDIA Deep Learning Institute (DLI) では、AI とアクセラレーテッド コンピューティングに関するハンズオン トレーニングを提供することで、実社会で起こる様々な問題の解決に貢献しています。開発者、データ サイエンティスト、研究者、および学生は、クラウドの GPU を活用した実践的な経験を積み、専門的能力の成長をサポートするコンピテンシーの認定を受けることができます。個人向けの自習型オンライン トレーニング、チーム向けのインストラクターによるワークショップ、大学教育関係者がダウンロードできるコース資料をご用意しております。

  • <span style=

    個人

  • <span style=

    チーム

  • <span style=

    大学

開発者が 20 人未満の自主学習者、学生、チームには、ディープラーニングをプロジェクトに適用する方法や CUDA および OpenACCでアプリケーションを高速化する方法を学習できる自習型オンライン トレーニングをお勧めします。業務の実践的なスキルを身につけ、関係分野のコンピテンシーを示す認定を取得できます。お住まいの地域で開催される、インストラクターによるワークショップに参加することもできます。

DLI によるオンライン トレーニング

クラウド上で完全に構成された GPU 対応ワークステーションにアクセスして、場所と時間を選ばない自習型オンライン トレーニングを受講しましょう。エンドツーエンドのプロジェクトを実装および配置する 8 時間コースと、特定のテクノロジまたは技術を集中的に学ぶ 2 時間コースから選んでください。

修了認定あり

ディープラーニング コース

ディープラーニング基礎

  • ディープラーニングの基礎 - 画像認識・物体検出 

    参加条件: 関数や変数など、プログラミングの基本を身につけていること

    フレームワーク: Caffe、DIGITS

    評価の種類: コードベース

    時間: 8 時間

    言語:日本語

    受講料: 90 ドル

    修了認定あり

    ニューラル ネットワークをトレーニングし、結果を利用してパフォーマンスや機能を改善することでディープラーニングの基礎が身につきます。

    このコースでは、ニューラル ネットワークをトレーニングし、配置し、ディープラーニングの基礎を学びます。学習内容:

    • 画像分類や物体検出など、一般的なディープラーニング ワークフローを導入する
    • データ、トレーニング パラメーター、ネットワーク構造、その他の戦略を試し、パフォーマンスや機能を改善する
    • ニューラル ネットワークを導入し、実世界の問題を解決する

    修了すると、ディープラーニングを利用して自分で問題を解決できるようになります。

  • Jetson Nano で AI を始める

    受講条件: Python の知識 (必須ではありませんが役立ちます)

    ツール、ライブラリ、フレームワーク:PyTorch、Jetson Nano

    時間: 8 時間

    言語: 英語

    価格: 無料

    修了認定あり

    NVIDIA Jetson Nano 開発者キットがあれば、メーカー、独学で取り組んでいる個人開発者、組込み開発マニアなどの皆さんが AI のパワーを手に入れることができます。この使いやすくて高性能なコンピューターは、画像の分類、オブジェクトの検出、セグメンテーション、音声処理のようなアプリケーションにおいて複数のニューラル ネットワークを並列で実行することが可能です。本コースでは、Jetson Nano 上で動く Jupyter iPython Notebook を使用して、コンピューター ビジョン モデルを用いたディープラーニング分類プロジェクトを構築します。

    このコースで学べる内容:

    • Jetson Nano とカメラの設定
    • 分類モデル構築のための画像データ収集
    • 収集した画像データのアノテーション
    • 自分で収集してアノテーションしたデータを用いてニューラル ネットワークのトレーニングを行い、独自のモデルを作成
    • 作成したモデルをJetson Nano にデプロイして推論を実行

    本コース修了後は、Jetson Nano で独自のディープラーニングの分類および回帰モデルを作成できるようになります。本コースを受講して進めるためにはハードウェアが必要になります  (詳細を見る).

  • DIGITS による画像分類

    参加条件: なし

    フレームワーク: Caffe (および DIGITS インターフェイス)

    時間: 2 時間

    言語:英語、中国語、日本語

    受講料: 30 ドル

    ディープラーニングはまったく新しいソリューションを可能にします。手動でコード化していた命令がサンプルから学習したモデルに取って代わられます。手書きの数字を認識するようにディープ ニューラル ネットワークをトレーニングします。

    • 画像データをトレーニング環境に読み込む
    • ネットワークを選択し、トレーニングする
    • 新しいデータでテストし、繰り返し、パフォーマンスを改善する

    修了後、トレーニングに使用すべきデータを判断できるようになります。

  • DIGITS による物体検知

    参加条件: ニューラル ネットワークの基本的な経験

    フレームワーク: Caffe (および DIGITS インターフェイス)

    時間: 2 時間

    言語: 英語、中国語

    受講料: 無料

    受講料: 30 ドル

    航空写真から鯨の顔を検出するという難題をとおして、物体検出にディープラーニングを適用する方法を学習します。

    • 従来のコンピュータービジョンとディープラーニングを組み合わせる
    • ディープラーニング フレームワーク Caffe を利用し、既存のニューラル ネットワークにちょっとした「脳外科手術」を行う
    • 特定目的のネットワークとエンドツーエンドでラベルが付けられたデータを特定し、利用することにより、ディープラーニング コミュニティの知識を活用する。

    修了後、ご自身が抱えている問題をディープラーニングで解決できるようになります。

  • TensorRT を用いた TensorFlow モデルの最適化とデプロイ

    参加条件: 参加条件: TensorFlow およびPython の経験

    フレームワーク: TensorFlow、Python、 TensorRT - TF-TRT

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    組み込み TensorRT ライブラリ (TF-TRT) と Python を使用して、TensorFlow プラットフォームで高性能なディープラーニング モデルを生成するための基礎を学びましょう。この選択科目の内容:

    • 最適化を実行するため分類モデルを前処理し、グラフと重みをフリーズする方法
    • FP32、FP16、INT8 を使用したグラフの最適化と量子化の基礎について理解する
    • TF-TRT API を使用してサブグラフを最適化し、モデルに最も適した最適化パラメータの選択
    • サポートされていないレイヤの問題を軽減し、検出モデルを最適化するためにPythonでカスタム操作を設計して埋め込む

    修了すると、TF-TRT を活用してデプロイに最適化されたモデルを実現する方法を理解できるようになります。

  • RAPIDS でデータ サイエンスのワークフローを高速化

    参加条件: Pandas、NumPy、scikit-learn の高度なコンピテンシー

    フレームワーク: なし

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    オープン ソースの RAPIDS プロジェクトにより、データ サイエンティストは、データ サイエンスおよびデータ分析アプリケーションを開始から終了まで GPU で高速化し、大幅なパフォーマンスの向上と、これまでの CPU のみによるワークフローでは不可能な技術の可能性を開くことができます。

    データ サイエンス アプリケーションを GPU で高速化する方法を学びます。

    • cuDF (GPU を有効化した Pandas と類似のデータフレーム) および cuML (GPU で高速化した機械学習アルゴリズム) などの RAPIDS の主要ライブラリを利用
    • GPU アクセラレーションによる高速反復サイクルで実現するエンドツーエンドのデータ サイエンス技術や手法を学習
    • CPU 利用と GPU 利用のデータ サイエンスの主な違いを理解する (API の詳細やリファクタリングのためのベスト プラクティスを含む)修了後、既存の

    修了後、CPU のみの既存のデータ サイエンスのワークロードをリファクタリングして GPU で実行を高速化し、高速化されたデータ サイエンスのワークフローを最初から作成できるようになります。

  • Horovod による分散ディープラーニング

    参加条件: Python および Python によるディープラーニング モデルのトレーニングに関するプロフェッショナル経験

    ツールとフレームワーク: Horovod、TensorFlow、Keras、Python

    時間: 2 時間

    言語: 英語、日本語

    受講料: 30 ドル

    Horovod を使用して、ディープラーニングのトレーニングを複数 GPU に拡張する方法を学習します。Horovod は、もともと Uber が作成し、LF AI Foundation によってホストされていたオープンソースの分散トレーニング フレームワークです。学習内容:

    • Horovod を使用して 4 基の NVIDIA V100 GPU 上で実行できるように、Fashion-MNIST 分類モデルを段階的にリファクタリング
    • Horovod と MPI の関係を理解し、複数のワーカー、競合状態、同期といった並列プログラミングの要素に関する感覚を磨く
    • 分散ディープラーニングのパフォーマンスに大きな影響を与える学習率のウォームアップのような手法を利用

    修了後は、Horovod を使用して、新規または既存のコード ベースでディープラーニングのトレーニングを効果的に拡張できるようになります。

  • TensorFlow による画像分割

    参加条件: ニューラル ネットワークの基本的な経験

    フレームワーク: TensorFlow

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    画像 (またはセマンティック) 分割は、画像の各ピクセルを特定のクラスに配置するという作業です。心臓の各部位を測定するために MRI 画像を分割する方法を学習します。

    • 画像分割と他のコンピュータービジョンの問題を比較する
    • TensorBoard や TensorFlow Python API など、TensorFlow ツールで実験する
    • モデル パフォーマンスを評価するための効果的な指標を実行する方法を学習する

    修了後、ディープラーニングを利用して、ほとんどのコンピュータービジョンのワークフローを設定できるようになります。

  • DIGITS による信号処理

    参加条件: ニューラル ネットワークのトレーニングの基本的な経験

    フレームワーク: Caffe、DIGITS

    時間: 2 時間

    言語: 英語、中国語

    受講料: 30 ドル

    ディープ ニューラル ネットワークは、画像の分類で人間より優れています。そのことは、コンピュータービジョンが私たちの予想を超えることを暗に意味します。無線周波数 (RF) 信号を画像に変換し、雑音で埋もれた弱い信号を検出する方法について学習します。トレーニング内容:

    • 画像以外のデータを画像データとして扱う
    • ディープラーニング ワークフロー (読み込み、トレーニング、テスト、調整) を DIGITS で実装する
    • プログラミングでパフォーマンスをテストし、パフォーマンス改善を導く

    修了後、ディープラーニングを利用して、画像と画像のようなデータの両方を分類できるようになります。

ディープラーニングによるデジタル コンテンツの制作

  • Torch による画像スタイル転送

    参加条件: CNN の経験

    フレームワーク: Torch

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    際立った視覚的特徴を抽出することにより、画像のルック アンド フィールを他の画像に移す方法を学習します。特徴の抽出に畳み込みニューラル ネットワーク (CNN) を使用する仕組みと、抽出した特徴をジェネレータに送り、新しい画像を作成する仕組みを確認します。学習内容:

    • 際立った視覚的特徴を抽出することにより、画像のルック アンド フィールを他の画像に移す
    • さまざまな手法を利用し、スタイルが正しく移されているかどうかを定性的に判断する
    • 革新的なアーキテクチャとトレーニング手法を利用し、任意のスタイルを移す

    修了後、ニューラル ネットワークを利用し、ビデオで効果的となる速さで、任意のスタイルを移せるようになります

  • 自動エンコーダーを使用したレンダリング画像のノイズ除去

    参加条件: CNN の経験

    フレームワーク: TensorFlow

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    自動エンコーダーを使用したニューラル ネットワークによりレイ トレーシング画像のノイズ除去を劇的に高速化する方法を学習します。学習内容:

    • レンダリングした画像にノイズがあるかどうかを判断する
    • 事前トレーニング済みのネットワークを利用し、サンプル画像や自分で用意した画像からノイズを除去する
    • 与えられたデータセットを利用し、自分のデノイザーをトレーニングする

    修了後、ニューラル ネットワーク内で自動エンコーダーを利用し、自分のレンダリング画像デノイザーをトレーニングできるようになります。

  • オートエンコーダーを利用した画像の超解像技術

    前提条件:CNN の経験

    フレームワーク: Keras

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    オートエンコーダーによるニューラル ネットワークのパワーを活用し、低品質のソース画像から高品質の画像を作成します。この選択科目の内容:

    • オートエンコーダーについて理解し、これを設計する
    • 画質を厳密に測定するためのさまざまな手法を学習する

    修了すると、ニューラルネットワーク内でオートエンコーダーを使用し、画質を大幅に上げることができるようになります.

ディープラーニングによるヘルスケア

  • Keras のモデリング タイム シリーズ データとリカレント ニューラル ネットワーク

    参加条件: ディープラーニングの基本的な経験

    フレームワーク: Keras

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    再帰型ニューラル ネットワーク (RNN) を利用すると、自然言語や市場などの時系列データをモデルで分類したり、予測したりできます。一定期間経過後の患者の健康にも応用できます。学習内容:

    • HDF5 (階層データ形式バージョン 5) の電子健康レコードを利用し、トレーニングとテストのデータセットを作成する
    • 再帰型ニューラル ネットワークで使用するデータセットを用意し、非常に複雑なデータ シーケンスのモデル化を可能にする
    • 特殊な RNN アーキテクチャである LSTM (長期・短期記憶) モデルを構築し、Theano を基盤として動作する Keras ライブラリを使用して基準データに対するモデル パフォーマンスを評価する

    修了後、RNN を利用して時系列データをモデル化できるようになります。

  • MedNIST データセットを利用した医用画像分類

    参加条件: Python の基本的な経験

    フレームワーク:  PyTorch

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    放射線医学と医用画像のためのディープラーニングの概要を実地体験方式で学習します。学習内容:

    • 医用画像を収集し、書式設定し、標準化する
    • データセットを対象に畳み込みニューラル ネットワーク (CNN) を構築し、トレーニングする
    • トレーニングしたモデルを利用し、新しい医用画像を分類する

    修了すると、CNN を応用し、医用画像データセットで画像を分類できるようになります。

  • 医学的応用におけるディープラーニング向けデータ サイエンスのワークフロー

    参加条件: Python と CNN の基本的な経験

    フレームワーク: PyTorch

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    医用データセットでは、ディープラーニング導入において特別な配慮が必要です。作業内容:

    • データ拡張と標準化の初歩的な技術を学ぶ
    • 簡単な医用画像データセットでこれらの技術を体験する
    • 拡張データセットで畳み込みニューラル ネットワークをトレーニングし、技術を検証する

    修了後、医用画像データセットで簡単なデータ操作を行うことができるようになります。

  • DIGITS による医用画像セグメンテーション

    参加条件: CNN と Python の基本的な経験

    フレームワーク: DIGITS、Caffe

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    画像 (またはセマンティック) 分割は、画像の各ピクセルを特定のクラスに分類するという作業です。心臓の各部位を測定するために次の方法で MRI 画像を分割します。

    • カスタム Python 層で Caffe を拡張する
    • 転移学習のプロセスを導入する
    • 一般的な画像分類ネットワークから完全な CNN (畳み込みニューラル ネットワーク) を作成する

    修了後、ディープラーニングを利用して、ほとんどのコンピューター ビジョンのワークフローを設定できるようになります。

  • TensorFlow による画像の分類: Radiomics—1p/19q 染色体のステータス分類

    参加条件: CNN と Python の基本的な経験

    フレームワーク: TensorFlow

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    Mayo Clinic で実施された研究のおかげで、ディープラーニング手法を利用して MRI 画像から Radiomics を見い出すことが脳腫瘍患者の効果的な治療と健康状態の改善につながりました。次により 1p19q 共欠損バイオマーカーを検出する方法を学習します。

    • CNN (畳み込みニューラル ネットワーク) の設計とトレーニング
    • イメージング ゲノミクス (Radiomics) を使用して、切開手術なしで、病気のゲノミクスを特定するバイオマーカーを作成する
    • Mayo Clinic で行われている Radiogenomics 研究について知る

    修了すると、Radiomics を見通せるディープラーニングを使用することの異色ながらも有望な成果への独自の見識が得られます

  • R と MXNet による医用画像分析

    参加条件: CNN と Python の基本的な経験

    フレームワーク: MXNet

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    CNN (畳み込みニューラル ネットワーク) を医療画像分析に適用し、不明瞭な画像から患者の状態を推測します。時系列 MRI データから人間の心臓の左心室の容積を推測するように CNN をトレーニングする方法について学習します。学習内容:

    • 標準の 2D CNN を拡張し、さらに複雑なデータを得る
    • 標準の Python API と R を介して MXNet を利用する
    • ときに容量が測定され、一時的な構成要素が含まれる場合の高次元画像を処理する

    修了すると、不明瞭な画像に CNN を利用する方法がわかります。

  • 医用画像のための生成ネットワークによるデータ オーギュメンテーションとセグメンテーション

    参加条件: CNN の経験

    フレームワーク: TensorFlow

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    敵対的生成ネットワーク (GAN) は 1 組のディープ ニューラル ネットワークです。与えられたトレーニング データに基づいて新しい例を作り出すジェネレーター (Generator/生成するもの) と本物と模造データを見分ける試みをするディスクリミネーター (Discriminator/識別するもの) からなります。この 2 つのネットワークが共に向上するとき、作り出される例も現実に一層近づきます。これは医療にとってたいへん有望なテクノロジです。小さなデータセットを拡大して従来のネットワークをトレーニングできるためです。学習内容:

    • 合成脳 MRI を生成する
    • セグメンテーションに GAN を応用する
    • データ オーギュメンテーションに GAN を使用して精度を上げる

    修了すると、医用画像のユース ケースに GAN を応用できるようになります。

  • CFCM (Coarse-to-Fine Contextual Memory) による医用画像処理

    参加条件: CNN の経験

    フレームワーク: TensorFlow

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    CFCM (Coarse-to-Fine Contextual Memory) は画像セグメンテーションのために開発された手法であり、非常に深いアーキテクチャを利用し、さまざまなスケールと畳み込み LSTM (Long Short-Term Memory) の特徴を組み込んでいます。受講内容:

    • 医用画像のセグメンテーションのためのエンコーダー/デコーダー アーキテクチャを知る
    • 一般的なビルディング ブロック (畳み込み、プーリング層、残差ネットワークなど) を知る
    • スキップ接続のさまざまな手段を研究する

    修了すると、医用画像のセグメンテーションや同様の画像処理作業に CFCM 手法を応用できるようになります。

ディープラーニングによるインテリジェント ビデオ分析

  • DeepStream を使用したインテリジェント ビデオ分析の AI ワークフロー

    参加条件: C++ および Gstreamer の経験

    フレームワーク: DeepStream3

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    DeepStream 3.0 フレームワークは、ハードウェアで高速化するインテリジェント ビデオ分析 (IVA) アプリケーションの構築ブロック機能を利用できます。この機能で、開発者は中心となるディープラーニング ネットワーク構築に集中できるようになります。DeepStream SDK は、様々なユースケースで実証済みで、展開メディア上での柔軟性を実現します。

    学習内容:

    • DeepStream パイプラインをマルチストリーム ビデオの並列処理用に展開し、アプリケーションを最大スループットで大規模に利用する
    • 処理用パイプラインを設定し、グラフをベースにした理解しやすいアプリケーションを作成する複数のディープ ネットワーク モデルを活用してビデオ ストリームを処理し、よりインテリジェントなインサイトを実現する

    修了後、AI をベースにしたビデオ分析アプリケーションの作成方法を理解し、DeepStream を使用してビデオ ストリームを元に実用的な見解へと変換することができます。

アクセラレーテッド コンピューティング コース

  • CUDA C/C++ によるアクセラレーテッド コンピューティングの基礎  

    参加条件: 変数の型、ループ、条件付き命令、関数、配列操作など、 C/C++ の基礎知識。

    評価の種類: コードベース

    時間: 8 時間

    言語: 英語

    受講料: 90 ドル

    修了認定あり

    CUDA コンピューティング プラットフォームにより、CPU のみのアプリケーションを世界最速の大規模並列 GPU で実行して高速化します。C/C++ アプリケーションの高速化を 以下の方法で体験します。

    • GPU で潜在的な並列処理を実行する CPU 専用アプリケーションを高速化する
    • 高速化アプリケーションを最適化するための基本的な CUDA メモリ管理手法を 活用する
    • 同時実行処理の高速化アプリケーションの可能性を見い出し、CUDA ストリームで活用する
    • 作業の方向付けと確認にコマンドラインおよび視覚的プロファイリングを活用する

    修了すると、最も基本的な CUDA ツールおよび手法を使用して、既存の CPU 専用 C/C++ アプリケーションの 高速化と最適化ができるようになります。高速化アプリケーションを迅速に出荷できる、 CUDA 開発の反復的な方式を 理解できるようになります。

  • CUDA Python によるアクセラレーテッド コンピューティングの基礎

    参加条件: 変数の型、ループ、条件付き命令、関数、配列操作など、 Python の基礎知識。ndarrays や ufunc の使用など、 NumPy の知識。

    評価の種類: コードベース

    時間: 8 時間

    言語: 英語

    受講料:90 ドル

    修了認定あり

    このコースでは、Numba (JIT、型指定 Python 関数コンパイラ) を使用し、Python プログラムを大規模並列 NVIDIA GPU で実行することで高速化する方法を学習します。学習内容:

    • Numba を使用して NumPy ユニバーサル関数 (ufunc) から CUDA カーネルをコンパイルする
    • Numba を使用してカスタム CUDA カーネルの生成と起動を行う
    • 主要な GPU メモリ管理手法を適用する

    修了すると、Numba を使用して CUDA カーネルのコンパイルと起動ができ、Python アプリケーションを NVIDIA GPU で実行することで高速化できるようになります。

  • OpenACC によるアクセラレーテッドコンピューティングの基礎

    参加条件: C/C++ の基本的な経験

    時間: 8 時間

    言語: 英語

    受講料: 90 ドル

    GPU プログラミングのための高水準プログラミング言語である OpenACC の基礎を学習します。このコースは、C/C++ の経験が多少あり、アプリケーションのパフォーマンスを加速して CPU だけのプログラミングの限界を超えることに興味がある人を対象にしています。本コースの学習目標:

    • OpenACC を使用した 4 つの簡単な手順で、既存のアプリケーションを加速する
    • OpenACC コードベースをプロファイリングし、最適化する
    • OpenACC と MPI (message passing interface)を組み合わせ、マルチ GPU システムでプログラミングする

    修了すると、OpenACC、CUDA 対応 MPI、NVIDIA プロファイリング ツールを組み合わせ、マルチ GPU クラスターで加速する異種アプリケーションをビルドし、最適化できるようになります。

  • コンテナーを使用したハイパフォーマンス コンピューティング

    参加条件: C/C++ の熟練プログラミングと HPC アプリケーションに関するプロフェッショナル経験

    ツールとフレームワーク: Docker、Singularity、HPCCM、C/C++

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    HPC (ハイ パフォーマンス コンピューティング) アプリケーション開発向けのコンテナー環境を使用して、コードの複雑さを軽減し、移植性と効率性を向上させる方法を学習します。学習内容:

    • Docker コンテナーおよび Singularity コンテナーの構築と実行の基礎を習得
    • HPC コンテナー メーカー (HPCCM) を使用して、ユーザーのアプリケーション向けに複雑で移植可能なベアメタル HPC 環境をプログラムによって構成
    • レイヤード コンテナーやマルチステージの構築などの高度なコンテナーの構築手法を適用
    • MPI Bandwidth や MILC などの既存 HPC アプリケーションのコンテナー化されたバージョンを活用

    修了後は、Docker、Singularity、HPCCM を活用し、移植性が高くベアメタルと同等のパフォーマンスを発揮するHPCアプリケーションを構築できるようになります。

  • CUDA C/C++ によるアプリケーションの高速化

    参加条件: Basic experience with C/C++

    言語:言語: 英語、日本語

    時間: 2 時間

    受講料: 30 ドル

    NVIDIA GPU の大規模並列処理の性能を活用する CUDA を使用して、C/C++ アプリケーションを高速化する方法を学習します。以下の目的で、CUDA でプログラミングする方法を学習します。

    • SAXPY アルゴリズムを高速化する
    • 行列乗算アルゴリズムを高速化する
    • 熱伝導アルゴリズムを高速化する

    修了後、CUDA プラットフォームを利用し、C/C++ アプリケーションを高速化できるようになります。

  • OpenACC – 4 ステップで 2 倍

    参加条件: C/C++ の基本的な経験

    言語: 英語

    時間: 2 時間

    受講料: 30 ドル

    NVIDIA GPU の大規模並列処理能力を活用する OpenACC を使用し、C/C++ または Fortran アプリケーションを高速化する方法を学習します。OpenACC はディレクティブを基礎とする計算処理手法です。アクセラレータ コードを自分で記述する代わりに、コンパイラにコードを高速化するヒントを与えます。OpenACC を利用したアプリケーションの高速化は、次の 4 段階プロセスで始められます。

    • アプリケーションの特徴をとらえ、プロファイリングする
    • 計算ディレクティブを追加する
    • データの動きを最適化するディレクティブを追加する
    • カーネル スケジューリングを利用し、アプリケーションを最適化する

    修了後、プロファイルに基づく手法を使用して、OpenACC ディレクティブで C/C++ アプリケーションを短時間で高速化できるようになります

  • CUDA C/C++ による GPU メモリの最適化

    参加条件: : CUDA C/C++ によるアプリケーションの高速化または同様の経験

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    CUDA C/C++ での NVIDIA GPU のプログラミングに役立つメモリ最適化のテクニックと、この最適化をサポートする NVIDIA Visual Profiler (NVVP) の使用方法を試します。学習内容:

    • 単純な行列転置アルゴリズムを実装する
    • NVVP を使用してアルゴリズムをプロファイリングし、そのパフォーマンスを最適化するサイクルを数回行う。

    修了後、グローバル メモリおよび共有メモリのアクセス パターンを解析して改善する方法と、高速化した C/C++ アプリケーションを最適化する方法が理解できます。

  • C/C++ の GPU 対応ライブラリによるアプリケーションの高速化

    参加条件: 「CUDA C/C++ によるアプリケーションの高速化」または同様の経験

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    NVIDIA GPU の大規模並列処理の性能を活用するドロップイン ライブラリを使用して、C/C++ アプリケーションを高速化する方法を学習します。次の 3 つの演習を行います。

    • cuBLAS を利用し、基本的な行列乗算を高速化する
    • cuRAND API 呼び出しをいくつか、前の cuBLAS 呼び出しに追加するという方法でライブラリを結合する
    • nvprof を使用してコードをプロファイリングし、いくつかの CUDA Runtime API 呼び出しで最適化する

    修了後、CUDA 対応ライブラリをいくつか活用し、既存の CPU 専用 C/C++ プログラムのアプリケーションを短時間で高速化できます。

  • Thrust による C++ の高速化

    参加条件: 「CUDA C/C++ によるアプリケーションの高速化」または同様の経験

    時間: 2 時間

    言語: 英語

    受講料: 30 ドル

    Thrust は C++ 標準テンプレート ライブラリをおおよその基盤とする並列アルゴリズム ライブラリです。OpenMP や Intel のスレッディング ビルディング ブロックなど、複数のシステム バックエンドをサポートし、開発者は並列計算処理のパワーをすぐに利用できます。Thrust を利用し、次の演習をとおして C++ を高速化します。

    • 基本反復子、コンテナ、関数
    • 組み込みファンクタとカスタム ファンクタ
    • CPU 処理への移植性

    修了後、Thrust ライブラリのパワーを利用し、C/C++ アプリケーションを高速化できるようになります。

‘パートナーとのオンライン トレーニング’

DLI は教育業界をリードする組織と連携し、ディープラーニング トレーニングを世界中の開発者とデータ サイエンティストにお届けしています。

開催予定のインストラクターによるワークショップ

DLI では、世界中のカンファレンスや大学でインストラクターによる公開ワークショップを開催しています。以下の予定をご覧いただき、お住まいの地域のワークショップをご確認ください。

開発者が 20 人以上の、データ サイエンティスト、研究者のチームには、ディープラーニングをプロジェクトに適用する方法や CUDA および OpenACC でアプリケーションを高速化する方法を学習できるインストラクターによるワークショップをお勧めします。業務の実践的なスキルを身につけ、関係分野のコンピテンシーを示す認定を取得できます。

インストラクターによるトレーニング

DLI 認定インストラクターによる、お住まいの地域での  1 日のワークショップをお申し込みください。ハンズオン トレーニングでクラウド上の GPU にアクセスして、エンドツーエンドのプロジェクトを実装および配置します。

修了認定あり

ディープラーニング ワークショップ

ディープラーニング入門

  • ディープラーニングの基礎 - 画像認識・物体検出 

    参加条件: 関数や変数など、プログラミングの基本を身につけていること

    フレームワーク: Caffe、DIGITS

    評価の種類: コードベース

    言語: 英語、中国語、日本語、韓国語

    修了認定あり

    ニューラル ネットワークをトレーニングし、結果を利用してパフォーマンスや機能を改善することでディープラーニングの基礎が身につきます。

    このコースでは、ニューラル ネットワークをトレーニングし、配置し、ディープラーニングの基礎を学びます。学習内容:

    • 画像分類や物体検出など、一般的なディープラーニング ワークフローを導入する
    • データ、トレーニング パラメーター、ネットワーク構造、その他の戦略を試し、パフォーマンスや機能を改善する
    • ニューラル ネットワークを導入し、実世界の問題を解決する

    修了すると、ディープラーニングを利用して自分で問題を解決できるようになります。

  • ディープラーニングの基礎 - 動画解析・自然言語処理 

    参加条件: 「コンピューター ビジョンのためのディープラーニングの基礎」または同様のコースを修了していること。Python の基礎知識 (関数や変数) とニューラル ネットワークのトレーニング経験が求められます。

    フレームワーク: TensorFlow

    評価の種類: 複数選択

    言語: 英語、中国語、日本語、韓国語

    修了認定あり

    このコースでは、畳み込みニューラル ネットワークと回帰ニューラル ネットワークを組み合わせ、画像やビデオ クリップに含まれるコンテンツの効果的な記述を生成する方法について学習します。

    TensorFlow と COCO (Microsoft Common Objects in Context) データセットを利用してネットワークをトレーニングし、画像や動画からキャプションを生成する方法について学習します。キャプションは以下の方法で生成します。

    • 画像分割やテキスト生成など、ディープラーニング ワークフローを実装します
    • データの種類、ワークフロー、フレームワークを比較します
    • コンピューター ビジョンと自然言語処理を組み合わせます

    修了すると、さまざまな種類のデータ入力を必要とするディープラーニングの問題を解決できるようになります。

  • ディープラーニングの基礎 - 自然言語処理 

    参加条件: ニューラル ネットワークと Python プログラミングの基礎知識。言語学の知識。

    フレームワーク: TensorFlow、Keras

    評価の種類: コードベース、複数選択

    言語: 英語、中国語

    修了認定あり

    最新のディープラーニング手法を学習し、自然言語処理 (NLP) を利用したテキスト入力を理解してください。学習内容:

    • 機械が理解できる表現と古典的な手法にテキストを変換する
    • 分散表現 (埋め込み) を実装し、その特性を理解する
    • ある言語を別の言語に翻訳する機械をトレーニングする

    修了すると、同様の用途で埋め込みを利用する NLP に詳しくなります。

  • ディープラーニングの基礎 - マルチ GPU 

    前提条件: 確率的勾配降下法の経験

    フレームワーク: TensorFlow

    評価の種類: コードベース

    言語: 英語

    修了認定あり

    自動運転車などの AI アプリケーションを実現するためのディープ ニューラル ネットワークでは、膨大な計算能力が要求されます。自動運転車の研究で使われるような膨大なデータセットの場合、1 つの GPU では 1 回のトレーニング周期に数週間かかります。年単位になることさえあります。ディープラーニングにマルチ GPU を使用すると、大量のデータによるトレーニング時間を大幅に短縮し、ディープラーニングによる複雑な問題の解決を可能にします

    このコースでは、マルチ GPU を使用したニューラル ネットワークのトレーニング方法を学ぶことができます。学習内容:

    • マルチ GPU トレーニングへのアプローチ
    • 大規模なトレーニングにおけるアルゴリズムと技術に関する課題
    • 上記の課題解決のための主要テクニック

    修了すると、TensorFlow を使用して、ディープ ニューラル ネットワークのトレーニングを効果的に並列化できるようになります。

業界別ディープラーニングのワークショップ

  • オートエンコーダーを使ったディープラーニングによるデジタル コンテンツの作成

    前提条件: CNN など、ディープラーニング概念の基礎知識。Python プログラミング言語の経験。

    フレームワーク: Torch, TensorFlow

    評価の種類: 複数選択

    言語: 英語

    修了認定あり

    デジタル コンテンツ作成のためのニューラル ネットワークを設計し、トレーニングし、配置する最新手法について、実地トレーニングを受けます。学習内容:

    • ビデオ スタイルの自由な転送に利用されている革新的なアーキテクチャとトレーニング手法を応用する
    • レンダリング画像のノイズを除去する独自のデノイザーをトレーニングする
    • 超解像度 AI で画像をグレードアップする

    修了すると、ディープラーニングの手法を駆使してデジタル アセットを作成できるようになります

  • 医療画像分析のためのディープラーニング

    参加条件: ディープ ニューラル ネットワークの基礎知識。 Python とその類似の言語のコーディング経験。

    フレームワーク: Caffe、DIGITS、R、MXNet、TensorFlow

    評価の種類: コードベース

    言語: 英語、日本語

    修了認定あり

    このコースでは、CNN (convolutional neural network/畳み込みニューラル ネットワーク) を MRI スキャンに適用し、医療に関するさまざまな作業や計算を実行する方法を学習します。学習内容:

    • MRI 画像のセグメンテーション (分離抽出) を行い、左の心室の場所を判断する
    • MRI スキャンに CNN を適用して心臓の拡張と収縮の差を測定し、駆出率を計算することで心臓の病気を見つける
    • LGG (low-grade glioma/低悪性度のグリオーマ) の MRI スキャンに CNN を適用し、1p/19q 染色体の共欠損状態を判断する

    修了すると、MRI スキャンに CNN を適用し、さまざまな医療上の課題を実行できるようになります。

  • ディープラーニングによる産業用検査

    参加条件: ディープ ニューラル ネットワーク、Python とディープラーニング フレームワーク (TensorFlow、Keras、PyTorch など) の経験

    ツールとフレームワーク: TensorFlow、TensorRT、Keras

    評価の種類: コードベース

    言語: 英語、繁体字中国語

    修了認定あり

    NVIDIA のプリント回路基板 (PCB) のコンデンサー検証を自動化するディープラーニング モデルの構築方法について実環境のデータセットを使用して学習します。これにより、検証コストが削減され、さまざまな製造ユース ケースにわたって生産スループットが向上します。学習内容:

    • Pandas と NumPy を使用して、与えられたデータセットから適切な洞察を引き出す
    • InceptionV3 として知られるディープラーニング分類モデルに、転移学習を適用
    • TensorRT 5 を使用して、V100 GPU 上のトレーニング済みの InceptionV3 モデルを最適化
    • V100 の Tensor コアを使用して、半精度 (FP16) の高速推論を実験

    修了後は、ハードウェアで高速化された産業用検査パイプラインの構成要素を設計、トレーニング、テスト、展開できるようになります

  • インテリジェント ビデオ分析のためのディープラーニング

    参加条件: ディープ ネットワーク (特にさまざまな CNN) の経験、C および Python の中級レベルの経験

    フレームワーク: DeepStream 3.0、TensorFlow

    評価の種類: コードベース

    言語: 英語

    修了認定あり

    交通カメラの増加、自動運転車の見込顧客数の増加、スマート シティの展望に対する期待によって、より高速かつ効率的な物体検出およびモデル追跡の需要が高まっています。この需要を満たすには、さまざまなタイプの物体をビデオ フレーム内で識別、追跡、分割、予測する必要があります。

    本ワークショップの学習目標:

    • ハードウェアで高速化されたデコーディング手法を使用して、ビデオ フィードを効率的に処理および準備する
    • ディープラーニング モデルをトレーニングおよび評価し、「転移学習 (Transfer Learning)」技術を活用して、これらのモデルの効率性と精度を高め、データ密度の問題を軽減します。
    • 大量のビデオ データセットから動く物体を追跡するための高品質ニューラル ネットワーク モデル開発に関わる戦略とトレードオフを探る
    • DeepStream SDK を入手して、ビデオ分析推論エンジンを最適化して配置する

    修了後、駐車場のカメラ フィードに基づいて、ハードウェアで高速化された交通管理システムの構成要素を設計、トレーニング、テスト、および配置できるようになります。

  • ロボット工学のためのディープラーニング

    参加条件: ディープ ニューラル ネットワークの基礎知識と Python または類似の言語での基礎コーディング経験

    フレームワーク: DIGITS

    評価の種類: コードベース

    言語: 英語

    修了認定あり

    AI は、幅広い業界でロボット工学の開発と推進に変革を起こしています。Jetson の組み込みアプリケーション向けロボット工学ソリューションの作成方法をご覧ください。学習内容:

    • コンピューター ビジョン モデルを使用し、検知作業を行う
    •  組み込みアプリケーション向けモデルの無駄を省き、最適化を行う
    • 映像入力を元に適切な出力を行うようロボットをトレーニングする

    修了後、ロボット工学向けの高性能ディープラーニング アプリケーションの展開方法がわかるようになります。

アクセラレーテッド コンピューティング ワークショップ

  • CUDA C/C++ によるアクセラレーテッド コンピューティングの基礎  

    参加条件: 変数の型、ループ、条件付き命令、関数、配列操作など、 C/C++ の基礎知識。CUDA プログラミングに関する知識は必要ありません。

    時間: 8 時間

    評価の種類: コードベース

    言語: 英語、中国語、日本語、韓国語

    修了認定あり

    CUDA コンピューティング プラットフォームにより、CPU のみのアプリケーションを 世界最速の大規模並列 GPU で実行して高速化します。C/C++ アプリケーションの高速化を 以下の方法で体験します。

    • GPU で潜在的な並列処理を実行する CPU 専用アプリケーションを高速化する
    • 高速化アプリケーションを最適化するための基本的な CUDA メモリ管理手法を 活用する
    • 同時実行処理の高速化アプリケーションの可能性を見い出し、CUDA ストリームで活用する
    • 作業の方向付けと確認にコマンドラインおよび視覚的プロファイリングを活用する

    修了すると、最も基本的な CUDA ツールおよび手法を使用して、既存の CPU 専用 C/C++ アプリケーションの 高速化と最適化ができるようになります。高速化アプリケーションを迅速に出荷できる、 CUDA 開発の反復的な方式を 理解できるようになります。

  • CUDA Python を使った高速コンピューティングの基礎

    参加条件: 変数、条件文、関数、配列操作等を含む Python の基礎知識。Ndarrays と ufunc の使用を含む NumPy の基礎知識。

    時間: 8 時間

    評価の種類: コードベース

    言語: 英語

    修了認定あり

    このワークショップでは、Numba (just-in-time コンパイラ、特化型 Python コンパイラ) を使用し、Python プログラムを NVIDIA の超並列 GPU 上で実行する方法を説明します。

    • Numba を使った NumPy ユニバーサル関数 (ufunc) から CUDA カーネルをコンパイルする
    • Numba を使ってカスタム CUDA カーネルを作成し、起動する
    • 重要な GPU メモリ管理技術を適用する

    コース修了後、Numba を使用して CUDA カーネルをコンパイルし、NVIDIA GPU 上の Python アプリケーションの高速化をすることが可能となります。

エンタープライズ ソリューション

より総合的な企業向けトレーニングが必要な場合は、組織特有のニーズに合わせたトレーニングと講義をパッケージにした DLI エンタープライズ ソリューションを利用できます。オンラインおよびオンサイトの実践的なトレーニングから、エグゼクティブ ブリーフィング、企業レベルのレポートまで、貴社の AI 化をお手伝いします。詳細につきましては NVIDIA までお問い合わせください。

NVIDIA DLI では、大学教育関係者がダウンロードできるコース資料、および学生を対象に DLI 教材キットによる無料の自習型オンライン トレーニングを提供しています。教育関係者は認定を受けると、University Ambassador Program を利用してキャンパス内で DLI ワークショップを実施することもできます

教材キット

DLI 教材キットは、資格を持つ大学教育関係者が利用でき、ディープラーニング、アクセラレーテッド コンピューティング、ロボット工学における講座のソリューションを提供します。教育関係者は、講義資料、ハンズオン コース、GPU クラウド リソースなどを、各自のカリキュラムで活用することもできます。

ユニバーシティ アンバサダー プログラム

DLI University Ambassador Program では、教育担当者が認定を受けることで、大学の教員陣、学生、研究者を対象に無料でハンズオン DLI ワークショップを実施できるようになります。教育担当者は、 DLI 教材キッ トをダウンロードし、 Ambassador Program 参加資格を取得することをお勧めします

DLI は数百もの大学で University Ambassador を認定しており、以下はその一例です。

Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology
NUS - National University of Singapore
University of Oxford
Arizona State University
Columbia
The Hong Kong University Of Science And Technology
Massachusetts Institute of Technology
NUS - National University of Singapore
University of Oxford

パートナー

DLI は業界パートナーと連携し、DLI コンテンツ構築と DLI インストラクターによるワークショップを世界中で開催しています。主要なパートナーは以下のとおりです。