Сервис NVIDIA BioNeMo

Комплексные конвейеры для поиска новых лекарств на базе ИИ.

Что такое BioNeMo?

BioNemo — это облачный сервис для поиска новых лекарств с помощью ИИ, созданный на базе NVIDIA NeMo Megatron для обучения и развертывания больших биомолекулярных моделей ИИ-трансформеров в масштабе суперкомпьютеров. Сервис включает предварительно обученные большие языковые модели (LLM) и встроенную поддержку распространенных форматов файлов для белков, ДНК, РНК и химии, предоставляя загрузчики данных SMILES для молекулярных структур и FASTA для последовательностей аминокислот и нуклеотидов. Фреймворк BioNeMo также можно будет загрузить для запуска в вашей собственной инфраструктуре.

Ознакомьтесь с сопутствующими продуктами.
Ознакомьтесь с сопутствующими продуктами.

Возможности и преимущества.

LLMs for Chemistry and Biology

Получите доступ к предварительно обученным LLM для химии и биологии.

BioNeMo поставляется с тремя предварительно обученными LLM. MegaMolBART  представляет собой генеративную химическую модель, обученную на 1,4 миллиардах молекул (строки SMILES), и может использоваться для различных приложений химической информатики.

ProtT5 и ESM1-85M представляют собой языковые модели для белков на основе трансформеров, которые можно использовать для генерации изученных вложений для таких задач, как прогнозирование структуры и свойств белка.

Supercoming for Inference

Оптимизация инференса в масштабе суперкомпьютерных вычислений.

BioNeMo позволяет разработчикам развертывать LLM с миллиардами и триллионами параметров. Современные языковые модели для белков содержат миллиарды параметров и требуют супервычислительной инфраструктуры для инференса в огромном химическом пространстве. Динамическое масштабирование ресурсов в облаке позволяет конвейерам инференса моделей LLM автоматически масштабироваться в соответствии с требованиями к вычислительным ресурсам.

Accelerates Drug Discovery Pipelines

Используйте готовое решение для конвейеров поиска новых лекарств с использованием ИИ.

BioNeMo позволяет легко начать работу, предлагая предварительно обученные модели, автоматические загрузчики и препроцессоры для баз данных UniRef50 и ZINC. Различные модели, вложения и выходные данные можно объединить для сбора смешанных данных благодаря неконтролируемым структурированным средствам обучения. Неконтролируемое предварительное обучение также устраняет необходимость в маркированных данных, быстро запуская генерацию изученных вложений для прогнозирования структуры белка, функции, расположения в клетке, растворимости в воде, мембраносвязанности, консервативных и вариабельных участков и многого другого.

Подпишитесь для получения раннего доступа к сервису BioNeMo