Практикум под руководством инструктора
Основы ускоренных вычислений с CUDA C/C++

На этом семинаре вы узнаете об основных инструментах и методах ускорения приложений на C/C++ для работы на массивно-параллельных GPU с CUDA®. Вы научитесь писать код, настраивать распараллеливание кода с CUDA, оптимизировать миграцию памяти между CPU и графическим ускорителем, а также реализовать изученные вами процессы для ускорения полнофункционального симулятора частиц на CPU и заметного прироста производительности. В конце практикума у вас будет доступ к дополнительным материалам для самостоятельного создания новых приложений с ускорением на GPU.

 

Цели обучения


На этом практикуме вам предстоит:
  • Написать код, который будет выполняться графическим ускорителем
  • Экспонировать данные и параллелизм на уровне инструкций в приложениях на C/C++ с использованием CUDA
  • Использовать управляемую память CUDA и оптимизировать миграцию памяти с помощью асинхронной предварительной выборки
  • Использовать командную строку и визуальные профилировщики для управления работой
  • Использовать одновременные потоки для параллелизма на уровне инструкций
  • Написать приложения CUDA на C/C++ с ускорением на GPU или преобразовать уже существующие приложения для CPU, используя профильный подход

Скачать описание практикума (PDF, 294 KБ)

Краткое описание практикума

Введение
(15 мин)
  • Знакомство с инструктором
  • Создание аккаунта на courses.nvidia.com/join
Ускорение приложений с CUDA C/C++
(120 мин)

    Изучите основной синтаксис и концепции, чтобы иметь возможность писать приложения на C/C++ для GPU при помощи CUDA:

  • Пишите, компилируйте и запускайте код для GPU
  • Управляйте иерархией параллельных потоков
  • Выделите и освободите память для GPU
Перерыв (60 мин)
Управление ускоренной памятью приложений с CUDA C/C++
(120 мин)

    Изучите профилировщик командной строки и управляемую память CUDA, сосредоточьтесь на улучшении приложений и понимании поведения управляемой памяти:

  • Профилируйте код CUDA с помощью профилировщика командной строки
  • Узнайте подробнее об объединенной памяти
  • Оптимизируйте управление объединенной памятью
Перерыв (15 мин)
Асинхронное потоковое и визуальное профилирование для ускоренных приложений с CUDA C/C++
(120 мин)

    Определите возможности для улучшения управления памятью и параллелизма на уровне инструкций:

  • Профилируйте код CUDA с помощью NVIDIA Visual Profiler
  • Используйте одновременные потоки CUDA
Окончательный анализ
(15 мин)
  • Еще раз ознакомьтесь с основными выводами и ответьте на вопросы
  • Завершите тестирование и получите сертификат
  • Пройдите опрос
 

Информация о практикуме

Продолжительность: 8 часов

Цена: для уточнения стоимости свяжитесь с нами.

Необходимые требования:

  • базовые знания C/C++, в том числе типов переменных, циклов, условных операторов, функций и операций с массивами.
  • Знание программирования CUDA необязательно.

Технологии: nvprof, nvpp

Сертификат: После успешного завершения тестирования участники получат сертификат NVIDIA DLI для подтверждения своей квалификации и дальнейшего карьерного роста.

Аппаратные требования: ПК или ноутбук с поддержкой последней версии Chrome или Firefox. Каждому участнику будет предоставлен доступ к полностью настроенному облачному серверу с ускорением на GPU.

Языки:английский, японский корейский, упрощенный китайский, традиционный китайский

У вас возникли вопросы?