NVIDIA Clara™ Discovery — это набор оптимизированных фреймворков, инструментов, приложений и предварительно обученных моделей с ускорением на базе графического процессора, предназначенных для разработки лекарств вычислительными методами. Система Clara Discovery, созданная для поддержки междисциплинарных рабочих процессов, помогает ученым и исследователям быстрее выводить лекарства на рынок и открывает новые возможности для исследования механизмов болезней.
Алгоритмы глубокого обучения и модели трансформеров, работающие на базе графических процессоров, позволяют ускорить все этапы разработки лекарств. От обучения больших языковых моделей (LLM), которые понимают химическое пространство, до моделирования молекулярной динамики, предсказания структуры белка и генеративного проектирования лекарств, новые методы глубокого обучения меняют способы, к которым прибегают ученые для исследования постоянно расширяющейся химической вселенной.
Credit: Mahendra awale, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0 , via Wikimedia Commons
Объявленная на GTC система BioNemo представляет собой фреймворк приложений и облачный сервис, построенный на базе NVIDIA NeMo Megatron для обучения и развертывания больших моделей искусственного интеллекта для биомолекулярных моделей ИИ-трансформеров в масштабе суперкомпьютеров. В BioNeMo имеются предварительно обученные большие языковые модели, а сама система адаптирована к работе с языком белков, ДНК и системой упрощенного представления молекул в строке ввода (SMILES).
Платформа обучения для больших моделей химического языка, MegaMoIBART обеспечивает генерацию молекул в масштабе супервычислений на базе ИИ с высокой достоверностью и уникальностью.
При разработке лекарств используется множество рабочих процессов: от изучения химической вселенной и предсказания белковых структур до сканирования лекарств-кандидатов и моделирования молекул. Делайте открытия в этих областях с помощью мощных инструментов Clara Discovery, доступных в каталоге NVIDIA NGC™.
Большие языковые модели на основе трансформеров открывают новые возможности для исследования химической вселенной в реальном времени BioNeMo — это предметно-ориентированный фреймворк для обучения и развертывания биомолекулярных LLM в масштабе суперкомпьютеров, построенный на базе NeMo Megatron. Он содержит модели трансформеров MegaMolBART, ESM-1b и ProtT5.
MegaMolBART представляет собой генеративную химическую модель, обученную на 1,4 миллиарда молекул (строк SMILES), которую можно использоваться для различных химико-информационных приложений при разработке лекарств, например для предсказания реакций, молекулярной оптимизации и генерации молекул de novo для малых молекул.
ProtT5 и ESM-1b продемонстрировали, что неконтролируемое предварительное обучение можно использовать для создания изученных вложений, содержащих свойства для предсказания структуры белка, его функции, расположения в клетке, растворимости в воде, мембраносвязанности, консервативных и вариабельных областей и т. д.
Такие основанные на глубоком обучении подходы, как RELION, обеспечивают высокопроизводительную автоматизацию криогенной электронной микроскопии (cryo-EM) для определения структуры белка. RELION реализует эмпирический байесовский подход к анализу cryo-EM для уточнения отдельных или множественных 3D-реконструкций, а также средних значений 2D-классов.
Чтобы понять структуры белков с атомистической детализацией с помощью таких инструментов, какMELD, структуры можно выводить из разреженных, неоднозначных или зашумленных данных. MELD качественно определяет структуру белка, используя данные из основанной на физике байесовской структуры.
Изображение предоставлено Ромми Амаро и Калифорнийским университетом в Сан-Диего
С помощью искусственного интеллекта и ускоренных вычислений миллионы лекарств-кандидатов можно проверить на соответствие жесткому белку-мишени. AutoDock представляет собой растущий набор методов вычислительной стыковки и виртуального скрининга, предназначенных для структурной разработки лекарств и исследования основных механизмов биомолекулярной структуры.
Фреймворки молекулярной динамики на базе графического процессора могут моделировать основополагающие механизмы клеток и рассчитывать, насколько сильно лекарство-кандидат будет связываться с предполагаемым белком-мишенью. Потенциалы, полученные посредством машинного обучения, которые показывают возможную точность, энергии и силы на уровне квантовой механики, коренным образом меняют молекулярное моделирование.
В Clara Discovery имеется множество инструментов и платформ для молекулярного моделирования, в том числе GROMACS, NAMD, Tinker-HP, VMD, TorchANI и DeePMD-Kit.
Система Clara Discovery оптимизирована для работы на NVIDIA DGX™ A100, самой продвинутой в мире системе ИИ с производительностью 5 петафлопс. DGX A100 специально разработана для всех задач ускоренных вычислений и позволяет исследователям получать результаты максимально быстро, а также предоставляет ИТ-специалистам простую в развертывании единую инфраструктуру для обеспечения разработки лекарств нового поколения.
Узнать о производительности приложений для HPC
Получить технический документ Pharma POD
Узнать о передовой вычислительной платформе Schrodinger
Сравнение CPU и GPU: NVIDIA Clara Parabricks, Relion, Autodock-GPU, NVIDIA RAPIDS, Amber, NAMD, VMD, Gromacs, NVIDIA Clara Imaging, BERT Training