Acelere las pruebas iterativas, libere los procesos estancados y habilite nuevas capacidades generativas y predictivas con la exploración inicial de modelos.
Cargas de trabajo
Biología estructural
Diseño molecular
Simulación molecular
Imágenes biomédicas
Sectores
Atención sanitaria y ciencias de la vida
Academia/Educación superior
HPC/computación científica
Agricultura
Objetivo comercial
Innovación
Retorno de la inversión
Productos
NIMs
BioNeMo
NVIDIA AI Enterprise
MONAI
Los modelos de base son transformadores para la investigación y el descubrimiento en las ciencias de la vida porque pueden aprender la estructura, las reglas y las relaciones subyacentes de la biología y la química directamente a partir de datos de varias secuencias, estructuras, funciones y modalidades.
A diferencia de los modelos estadísticos tradicionales creados para tareas específicas, estos modelos se generalizan en múltiples tareas biomoleculares, por ejemplo, el plegamiento de proteínas, la edición de ADN, el acoplamiento molecular e incluso los fenotipos celulares. Al codificar la complejidad biológica en representaciones ricas y aprendidas, pueden predecir interacciones, generar moléculas novedosas y guiar experimentos, incluso en ámbitos con escasez de datos o dominios previamente intratables. Esto libera nuevas capacidades en el diseño terapéutico, la genómica funcional y la ingeniería biomolecular, cambiando la ciencia de los flujos de trabajo lentos y de fuerza bruta a bucles de diseño rápidos basados en retroalimentación. En resumen: la IA ahora puede aprender biología y química, y ayudar a diseñar que vendrá.
Enlaces rápidos
Los modelos de base de proteínas hacen para las proteínas lo que GPT-4 hizo para el lenguaje: aprender las reglas de plegamiento, función y evolución en una red neuronal única y reutilizable.
Los modelos de base de proteínas, transformadores de miles de millones de parámetros como AlphaFold 3, ESM-3, Proteína y Pallatom, colapsan las canalizaciones separadas de predicción de pliegues, escaneo de mutaciones, acoplamiento y diseño de novo en un motor que admite indicaciones. Impulsados por la escala (datos/parámetros masivos), la multimodalidad (incrustaciones conjuntas de secuencia, estructura y ligandos) y la controlabilidad (indicaciones o ajustes rápidos), tienen el potencial de convertir semanas de trabajo de laboratorio o código en minutos de inferencia, remodelando la I+D de proteínas en un flujo de trabajo de software.
Los modelos de base de próxima generación (AlphaFold 3, ESM-3, Proteína, Pallatom) unifican la predicción de pliegues, la puntuación de variantes, el acoplamiento molecular y el diseño de proteínas bajo demanda en un solo proceso de IA.
Pronto, estos modelos irán más allá del plegado hacia la fabricación a gran escala, diseñando complejos de varias cadenas, rutas metabólicas e incluso biomateriales adaptativos bajo demanda. Se espera que tres corrientes impulsen ese futuro: el escalado continuo hacia conjuntos de entrenamiento de billones de tokens que capturan pliegues raros; la fusión cruzada más profunda que une mapas de crio-EM, lecturas de células individuales y la cinética de reacción; y los adaptadores plug-and-play (capas de acción) que traducen las coordenadas de un modelo directamente en construcciones genéticas de ADN o recetas de expresión sin células. La realización de esta visión requerirá conjuntos de datos estructurales y funcionales compartidos de alta calidad, conjuntos de pruebas de referencia abiertos para la precisión y la seguridad generativas, y métodos eficientes de computación para que los laboratorios y las empresas emergentes, no solo los hiperescaladores, puedan iterar a la velocidad de los modelos de base.
Los modelos de base genómicos como Evo 2, Nucleotide Transformer, Enformer y Geneformer progresan desde las publicaciones científicas hasta los productos de etapas iniciales.
Estos modelos ya superan las pruebas de referencia para la predicción de efectos de variantes y la anotación de células individuales, pero todavía cubren solo una parte de la biología del genoma en la actualidad. Su receta de progreso hasta la fecha es simple pero potente: escala masiva (miles de millones de tokens de ADN + parámetros de transformadores), transferencia autosupervisada (entrenamiento previo con datos ómicos y ajuste fino ligero) y, para algunos modelos, multimodalidad (fusión de secuencia, cromatina y lecturas de células individuales en un modelo). A medida que crecen los conjuntos de datos abiertos y mejora el entrenamiento eficiente de las GPU, cabe esperar que estos «modelos de base genómicos» se conviertan en una capa estándar en todas las pilas de tecnología de ciencias de la vida.
Los modelos de base genómicos (Evo 2, Nucleotide Transformer, Enformer v2, scGPT) convierten miles de millones de tokens de ADN en predicción de efectos de variantes en tiempo real, anotación de células individuales y diseño listo para CRISPR, allanando el camino para los copilotos de IA a escala del genoma y el descubrimiento terapéutico de próxima generación.
A continuación llega la era de los copilotos de IA a escala del genoma: estudios como Geneformer y Evo 2 muestran pruebas de que los modelos de transformadores no solo pueden predecir, sino también diseñar ediciones de CRISPR útiles, promotores de-novo y circuitos reguladores completamente in silico. Las arquitecturas emergentes como HyenaDNA, GenSLM y Longformer-DNA pueden ampliar las ventanas de contexto más allá de 1 Mbp, capturando bucles de cromatina 3D y regulación génica de largo alcance. Finalmente, los datos multiómicos pueden incorporar metilación, ATAC-seq y ARN espacial en incrustaciones de secuencias para una información biológica más rica. Estos avances impulsarán la clasificación de variantes clínicas en tiempo real, el descubrimiento de mejoradores de alto rendimiento y los nuevos enfoques de diseño terapéutico de un día, como la terapia celular programable, todo a partir de una única API de «modelo de base genómico». La entrega de ese futuro exige conjuntos de datos de genoma abiertos que respetan la privacidad, pruebas de referencia estandarizadas de cero disparos e infraestructura de computación y software de próxima generación que hacen que el preentrenamiento de billones de tokens sea asequible fuera de los laboratorios de hiperescala.
Los modelos de base químicos han pasado de las demostraciones de investigación a las herramientas del mundo real para el descubrimiento de medicamentos.
Modelos como MoLFormer-XL, Uni-Mol 2, MolMIM y GenMol analizan cientos de millones de cadenas de pequeñas moléculas (SMILES), estructuras 3D y datos de química cuántica para sugerir nuevos candidatos a medicamentos, predecir propiedades bioquímicas clave en segundos y esbozar posibles rutas de síntesis. Tres fuerzas impulsan este progreso: transformadores conscientes del 3D y modelos de difusión que entienden la forma molecular; preentrenamiento de varias tareas que permite a un modelo gestionar la predicción de propiedades, la puntuación de unión y la planificación de síntesis; y aprendizaje aumentado de simulación que integra la física de las simulaciones cuánticas y de dinámica molecular.
Los modelos de base de pequeñas moléculas, como MoLFormer-XL, Uni-Mol 2, MolMIM y GenMol utilizan cadenas SMILES, estructuras 3D y datos de química cuántica para generar candidatos a medicamentos, predecir propiedades de ADMET y planificar rutas de síntesis a través de transformadores conscientes del 3D, multitarea y aumentados con simulación.
Los transformadores de gráficos de gran tamaño entrenados en reacciones químicas, simulaciones moleculares y estructuras 3D pueden proponer síntesis, marcar la toxicidad y recomendar catalizadores verdes a partir de una integración compartida. Su desarrollo posterior se basa en tres fuerzas: escalas de datos/parámetros cada vez mayores, el preentrenamiento multimodal que fusiona espectros y estructuras de cristal con las condiciones de reacción, y adaptadores modulares que redirigen un modelo a estructuras específicas en minutos. La implementación amplia todavía necesita conjuntos abiertos y de alta calidad de reacciones/propiedades, pruebas de referencia rigurosas y un rendimiento de GPU más eficiente para ejecuciones de miles de millones de tokens; una vez implementados, los modelos de base de química reducirán el tiempo de optimización de compuestos prometedores, reducirán los residuos de laboratorio y convertirán la síntesis predictiva en la rutina en los flujos de trabajo de química médica.
Pruebe los microservicios NVIDIA NIM para una implementación rápida y fácil de modelos de IA potentes.