Познакомьтесь с командой грандмастеров Kaggle из NVIDIA (KGMoN) и узнайте, как они используют ускоренный NVIDIA анализ данных для создания эффективных рекомендательных систем, прогнозирования скорости деградации молекул РНК, выявления меланомы с помощью медицинской визуализации и других современных задач.
Бо Лю (Bo Liu)
Старший специалист по data science в NVIDIA
Крис Деотт (Chris Deotte)
Кристоф Хенкель (Christof Henkel)
Специалист по data science в NVIDIA
Дэвид Остин (David Austin)
Главный системный инженер-программист в NVIDIA
Жилберто Титерич (Gilberto Titericz)
Жан-Франсуа Пюже (Jean-Francois Puget)
Выдающийся инженер NVIDIA
Цзивэй Лю (Jiwei Liu)
Кадзуки Онодера (Kazuki Onodera)
Тео Виль (Théo Viel)
Старший специалист по data science в области глубокого обучения, NVIDIA
Март и май 2022 г.
В двух разных соревнованиях команда использовала обработку естественного языка для анализа элементов аргументативных эссе студентов и определяла ключевые фразы в картах пациентов с экзаменов на получение медицинской лицензии.
(58:24 мин.)
Июнь 2021 г.
Команда NVIDIA Merlin и KGMON заняла 1-е место в конкурсе RecSys Challenge 2021, эффективно предсказав вероятность cтепени вовлеченности пользователей в динамической среде и построив адекватные рекомендательные системы на основе огромного количества данных из гетерогенных источников.
(1:10:47)
Март 2021 г.
Целью этого соревнования было использовать набор данных, основанный на миллионах реальных анонимных бронирований жилья, и разработать стратегию для отображения наиболее точных рекомендаций по следующему месту размещения путешественника в реальном времени.
(49:11)
Посмотрите видео, чтобы получить краткий экскурс в историю и ознакомиться с текущим положением дел в сфере обработки естественного языка. Также вы узнаете оптимальные методы использования моделей Transformers от Hugging Face в четырех разных конкурсах.
(1:06:02)
Октябрь 2020 г.
В этом конкурсе командам было необходимо разработать модели машинного обучения и вывести правила деградации РНК. Модели, необходимые для прогнозирования скоростей деградации на каждом основании молекулы РНК, обучены на подмножестве набора данных Eterna, включающем в себя более 3000 молекул РНК (которые охватывают множество последовательностей и структур) и информацию о скоростях их деградации в каждом положении.
(56:56)
Сентябрь 2020 г.
В этом конкурсе команде было необходимо построить модели, которые распознают и извлекают правильный ориентир (если таковой имеется) в наборе данных сложных тестовых изображений. Звучит просто, но на самом деле это достаточно трудно осуществимая задача, так как для распознавания ориентира необходимо огромное количество классов. Например, в этом случае было задействовано более 81 тысячи классов.
Август 2020 г.
В этом конкурсе команде было необходимо создать модели машинного обучения для идентификации кожных поражений по изображениям пациентов и выявления изображений, на которых с наибольшей долей вероятности есть меланома. Победившая модель машинного обучения смогла идентифицировать меланому раньше и точнее, чем cреднестатистический врач-дерматолог.
Grandmaster Series — это серия обучающих материалов для специалистов по data science. Новое видео выходит раз в месяц. В каждом выпуске ведущие мировые эксперты в области data science делятся своим опытом, рекомендациями и знаниями, полученными в ходе конкурса. Присоединяйтесь и узнайте из первых уст о том, как использовать накопленный опыт экспертов для решения собственных задач в области data science.
Благодарим за проявленный интерес. Наш представитель скоро свяжется с вами и предоставит более подробную информацию.