Amgen desarrolló un flujo de trabajo de biología generativa mediante IA y aprendizaje automático que comienza con un conjunto de especificaciones que un candidato debe satisfacer. A continuación, los modelos de IA generativa sugieren nuevos diseños, y los modelos predictivos evalúan y clasifican estos diseños. Esto se hace de forma iterativa hasta que se encuentren moléculas que cumplen las especificaciones, que incluyen criterios relevantes para la eficacia, la seguridad y la capacidad de fabricación. Evaluar tantos diseños in silico con estos modelos generativos reduce la carga en los laboratorios de prácticas.
"Para desarrollar modelos que nos ayuden a generar buenos productos biológicos, necesitábamos una plataforma que permitiera un preentrenamiento rápido y un ajuste fino en toda una serie de experimentos", dice Langmead. "Necesitábamos flexibilidad para experimentar con diferentes datos y escalas. Gracias A NVIDIA BioNeMo en DGX Cloud, pudimos realizar fácilmente el entrenamiento distribuido de modelos complejos en un entorno multiGPU. Las capacidades y el rendimiento de NVIDIA BioNeMo y DGX Cloud eran precisamente lo que necesitábamos y estaban a nuestra disposición cuando las necesitábamos".
"Una de las ventajas clave de DGX Cloud fue el proceso de incorporación notablemente rápido. Pudimos avanzar desde nuestro inicio de sesión inicial hasta el preentrenamiento de modelos de gran tamaño en solo unos días. BioNeMo en DGX Cloud es una solución integral: nuestros usuarios solo necesitan suministrar datos y especificar el modelo ajustando unos pocos archivos de configuración, y BioNeMo se encarga de todos los demás aspectos del proceso".
Amgen entrenó el LLM de la proteína ESM-1nv en BioNeMo en DGX Cloud con anticuerpos patentados de Amgen. Esto dio lugar a cinco LLM entrenados específicos para anticuerpos. BioNeMo tiene modelos lingüísticos biomoleculares de gran tamaño y de difusión de vanguardia para el entrenamiento e inferencia en flujos de trabajo de descubrimiento de fármacos en etapa temprana. Esto incluye modelos para generar proteínas y moléculas pequeñas, comprender las propiedades de proteínas y moléculas pequeñas, predecir estructuras de unión de pequeñas moléculas unidas a proteínas y predecir la estructura 3D de proteínas.