Amgen a développé un workflow de biologie générative en utilisant l'IA et l'apprentissage automatique qui commence par un ensemble de spécifications qu'un candidat doit satisfaire. Ensuite, les modèles d'IA générative suggèrent de nouvelles conceptions, et les modèles prédictifs évaluent et classent ces conceptions. Cela se fait de manière itérative jusqu'à ce que des molécules répondent aux spécifications et comprend des critères relatifs à l'efficacité, à la sécurité et à la fabricabilité. L'évaluation in silico d'autant de conceptions que possible à l'aide de ces modèles génératifs réduit la charge sur les laboratoires humides.
"Pour développer des modèles pouvant nous aider à générer de bons produits biologiques, nous avions besoin d'une plateforme permattant un pré-entraînement rapide et une mise au point précise dans le cadre d'une série d'expériences", précise Langmead. "Nous avions besoin de la flexibilité nécessaire pour expérimenter avec différentes données et à différentes échelles. En utilisant NVIDIA BioNeMo sur DGX Cloud, nous avons pu facilement entraîner de manière distribuée des modèles complexes dans un environnement multi-GPU. Les capacités et les performances de NVIDIA BioNeMo et de DGX Cloud correspondaient exactement à ce dont nous avions besoin et étaient disponibles au moment opportun."
"Le processus d'intégration remarquablement rapide était l'un des principaux avantages de DGX Cloud. Nous avons pu passer de notre connexion initiale au pré-entraînement de grands modèles en quelques jours seulement. BioNeMo sur DGX Cloud étant une solution clé en main, nos utilisateurs n'ont en effet plus qu'à fournir des données et à spécifier le modèle en ajustant quelques fichiers de configuration, et BioNeMo gère tous les autres aspects du processus."
Amgen a entraîné le LLM ESM-1nv de protéine dans BioNeMo sur DGX Cloud avec les anticorps exclusifs d'Amgen. Cinq LLM spécifiques aux anticorps ont ainsi été entraînés. BioNeMo dispose de grands modèles de langage biomoléculaires et de modèles de diffusion de premier ordre pour l'entraînement et l'inférence dans les workflows de découverte de médicaments à un stade précoce. Ces modèles permettent de générer des protéines et des petites molécules, de comprendre les propriétés des protéines et des petites molécules, de prévoir les structures de liaison des petites molécules aux protéines et de prévoir la structure 3D des protéines.