このワークショップでは、超並列 GPU と CUDA® で実行する C/C++ アプリケーションを高速化するための基礎的なツールと手法について学習します。コードの記述方法、CUDA によるコード並列化の構成方法、CPU と GPU のアクセラレーター間のメモリ移行最適化方法、新しいタスク (完全に機能するが CPU のみの微粒子シミュレーターを高速化し、大幅なパフォーマンス アップが観察できる) で理解されたワークフローの実装方法について学習します。ワークショップの終了時には、GPU 対応のアプリケーションを自分で新しく作成するための追加リソースを利用できます。

学習目標


このワークショップでは、次のことを行います。

  • GPU アクセラレーターで実行するコードを記述する
  • CUDA を使用し、C/C++ アプリケーションでデータと命令レベルの並列性を公開し、表現する
  • CUDA で管理されるメモリを活用し、非同期の事前フェッチを利用してメモリ移行を最適化する
  • コマンドラインとビジュアル プロファイラーを活用して作業を誘導する
  •  命令レベルの並列性のために同時ストリームを活用する
  •  GPU で高速化する CUDA C/C++ アプリケーションを記述するか、プロファイル駆動型手法で既存の CPU 専用アプリケーションをリファクタリングする

ワークショップ データシートをダウンロードする (PDF 294 KB)

ワークショップの概要

序論
(15 分)
  • インストラクターの紹介。
  • courses.nvidia.com/join でアカウントを作成する
CUDA C/C++ によるアプリケーションの高速化
(120 分)

    GPU 対応 C/C++ アプリケーションを CUDA で記述するために必要な構文と概念を学習する:

  • GPU コードを記述、コンパイル、実行する。
  • 並列スレッド階層を制御する
  • GPU にメモリを割り当て、メモリを解放する。
休憩 (60 分)
CUDA C/C++ によるアクセラレーテッド アプリケーション メモリの管理
(120 分)

    コマンドライン プロファイラーと CUDA 管理メモリについて学習する。観察駆動式の応用の改善に焦点を当て、管理型メモリの動作を理解する:

  • コマンドライン プロファイラーで CUDA コードをプロファイルする。
  • 統合メモリについて詳しく学習する。
  • 統合メモリ管理を最適化する。
休憩 (15 分)
CUDA C/C++ によるアクセラレーテッド アプリケーションのための非同期ストリーミングとビジュアル プロファイリング
(120 mins)

    メモリ管理と命令レベルの並列性の改善機会を見つける:

  • NVIDIA Visual Profiler で CUDA コードをプロファイルする。
  • 同時 CUDA ストリームを使用する。
最終確認
(15 分)
  • 主要な学習事項をおさらいし、問いで締めくくる。
  • 評価を完了し、認定証を取得する。
  • ワークショップ アンケートを受ける。
 

ワークショップの詳細

時間: 8 時間

価格: 価格についてはお問い合わせください。

参加条件:

  • 変数の種類、ループ、条件付き命令、関数、配列操作を理解しているなど、C/C++ の基礎能力
  • CUDA プログラミングの知識は問われません

テクノロジ: nvprof、nvpp

証明書: 評価が正常に完了すると、NVIDIA DLI 証明書が参加者に贈られます。これは専門分野の能力を証明するものであり、プロフェッショナルとしてのキャリアアップを支援します。

ハードウェア要件: 最新版の Chrome または Firefox を実行できるデスクトップ コンピューターまたはノート PC。参加者は全員、完全に設定が終わっている状態でクラウドに置かれている GPU 対応サーバーに専用アクセスできます。

言語: 英語、日本語韓国語中国語 (簡体字)中国語 (繁体字)

Upcoming Workshops

お客様の組織が、AI、アクセラレーテッド データ サイエンス、アクセラレーテッド コンピューティングの主要なスキルの向上と開発にご興味をお持ちの場合、NVIDIA Deep Learning Institute (DLI) にインストラクターによるワークショップをリクエストしていただけます。

NVIDIA に問い合わせる