Практикум под руководством инструктора
Основы ускоренной обработки и анализа данных с RAPIDS

Независимо от того, работаете ли вы в ИТ-компании, которой необходимо повысить лояльность клиентов, в организации, предоставляющей финансовые услуги, которой нужно снизить риски, или в розничной торговле и заинтересованы в прогнозировании покупательского поведения, перед вами стоит задача подготовки, управления и получения информации из больших объемов данных без больших потерь. Традиционные процессы обработки данных на CPU могут отнимать много времени, но благодаря мощности GPU ваши сотрудники смогут быстро работать с данными для принятия более взвешенных решений.

На этом семинаре вы узнаете, как выполнять анализ данных с ускорением на GPU, что позволит быстрее исследовать, проводить итерации и запускать свою работу в производство. Работая с библиотеками для анализа данных с ускорением на GPU RAPIDS, вы используете множество алгоритмов машинного обучения, включая XGBoost, cuGRAPH, решающий задачу SSSP, а также cuML KNN, DBSCAN и логистическую регрессию. 

 

Цели обучения


На этом практикуме вам предстоит:
  • Подготовить данные с ускорением на GPU и извлечь признаки с помощью фреймов данных cuDF и Apache Arrow
  • Примените широкий спектр задач машинного обучения с ускорением на GPU при помощи XGBoost и различных алгоритмов cuML
  • Выполните графический анализ с ускорением на GPU с помощью cuGraph за небольшой промежуток времени
  • Проведите быстрый масштабный графический анализ данных с использованием задач cuGraph

Скачать описание практикума (PDF, 298 KБ)

Краткое описание практикума

Введение
(15 мин)
  • Знакомство с инструктором
  • Создание аккаунта на courses.nvidia.com/join
Управление данными с ускорением на GPU
(120 мин)

    Обработайте и подготовьте несколько наборов данных (некоторые из них larger-than-memory) для дальнейшего использования в упражнениях по машинному обучению во время практикума:

  • Считывайте данные непосредственно на один и несколько GPU с помощью cuDF и Dask cuDF
  • Подготовьте информацию о населении, дорожной системе и медицинские данные для задач машинного обучения на GPU с cuDF
Перерыв (60 мин)
Машинное обучение с ускорением на GPU
(120 мин)

    Примените несколько основных методов машинного обучения к данным, которые были подготовлены вами в первой части практикума:

  • Используйте контролируемые и неконтролируемые алгоритмы с ускорением на GPU с cuML
  • Обучайте модели XGBoost с Dask на нескольких GPU
  • Создавайте и анализируйте данные графов на GPU с помощью cuGraph
Перерыв (15 мин)
Проект: анализ данных для спасения Великобритании
(120 мин)

    Применяйте новые навыки управления и анализа данных с ускорением на GPU, чтобы предотвратить смоделированную эпидемию, поразившую все население Великобритании:

  • Используйте RAPIDS для интеграции нескольких больших наборов данных и выполнения анализа в реальных условиях
  • Меняйте и итерируйте данные по мере того, как во время смоделированной эпидемии каждый день появляется новая информация
Оценка и вопросы и ответы (15 мин)
 

Информация о практикуме

Продолжительность: 8 часов

Цена: для уточнения стоимости свяжитесь с нами.

Необходимые требования: Опыт работы с Python, в идеале включая pandas и NumPy

Предлагаемые материалы для подготовки к участию в тренинге: Обучающие материалы Kaggle pandas, Введение Kaggle в машинное обучение, Ускорение обработки и анализа данных с RAPIDS

Технологии: RAPIDS, cuDF, XGBoost, cuML, cuGraph, Dask, cuPy, pandas, NumPy, Bokeh

Сертификат: После успешного завершения тестирования участники получат сертификат NVIDIA DLI для подтверждения своей квалификации и дальнейшего карьерного роста.

Аппаратные требования: ПК или ноутбук с поддержкой последней версии Chrome или Firefox. Каждому участнику будет предоставлен доступ к полностью настроенному облачному серверу с ускорением на GPU.

Языки: английский, традиционный китайский

У вас возникли вопросы?