Educación Superior / Investigación

La Escuela de Medicina de Harvard Estudia las Interacciones con Proteínas a un Ritmo Sin Precedentes Gracias a NVIDIA DGX Cloud

Objetivo

Con el apoyo del programa piloto del National Artificial Intelligence Research Resource (NAIRR) de la National Science Foundation y el acceso a NVIDIA DGX™ Cloud, The Walter Lab de la Escuela de Medicina de Harvard completó casi 1.7 millones de predicciones de interacciones entre proteínas en solo tres meses, un proceso que anteriormente habría llevado toda una vidacompletar.

Cliente

Universidad de Harvard

TOPIC

Simulación / Modelado / Diseño

Puntos Clave

  • Con la Infraestructura de computación acelerada de NVIDIA y DGX Cloud, los investigadores de The Walter Lab pudieron ejecutar 1.7 millones de predicciones de interacción proteína-proteína (PPI) en el lapso de tres meses.
  • Los investigadores seleccionaron 40.000 interacciones proteína-proteína de alta confianza entre 300 proteínas de mantenimiento del genoma humano, lo que proporciona nuevas hipótesis estructurales para vías relevantes para enfermedades.
  • Los investigadores del proyecto desarrollaron el sitio web Predictomes como un recurso interactómico accesible y seleccionado por clasificadores, lo que les permite a los investigadores globales explorar interacciones proteína-proteína (PPI) y puntuar sus propios modelos con las Predicciones de Estructura y el Clasificador Informado por Ómicos.

Dificultades en las Predicciones de Proteínas

El ADN humano se ve constantemente afectado por factores como la exposición a la luz UV y los productos químicos externos en el medio ambiente. Para prevenir condiciones potencialmente mortales, como el cáncer, las células deben reparar el daño al ADN. Johannes Walter y su equipo de investigación están aprovechando el poder de la inteligencia artificial para comprender los mecanismos moleculares que las células usan para copiar y reparar su ADN.   

“Hemos tenido tanto éxito con AlphaFold en nuestra área de la biología que hemos buscado ampliarlo más allá del interés de nuestro laboratorio al problema en el que casi todos los biólogos piensan: cómo las proteínas deben interactuar entre sí en todo el cuerpo humano”, dijo Ernst Schmid, estudiante de posgrado de The Walter Lab. “Estamos pasando de unos pocos cientos de proteínas que interactúan de unos pocos cientos de maneras a la escala de todo el proteoma: 20.000 proteínas que interactúan quizás de un millón de maneras”.  

El primer paso en este proceso fue desarrollar una caracterización estructural, o mapa, de las interacciones proteína-proteína (PPI) dentro de una sola célula. Otras herramientas de IA están entrenadas para predecir estructuras 3D de proteínas, pero a menudo no separan de forma confiable las interacciones proteína-proteína (PPI) relevantes de las predicciones de falsos positivos.  

Además, determinar manualmente la estructura de una proteína era un proceso increíblemente lento, que solía requerir años de investigación.

El Plano de Soluciones con NVIDIA DGX Cloud

The Walter Lab conquistó estas limitaciones al desarrollar un pipeline de varios pasos:

  1. Los investigadores crearon una herramienta de machine learning llamada KIRC, que identifica pares de proteínas que vale la pena analizar en profundidad por parte de AlphaFold.
  2. Luego, el equipo diseñó una segunda herramienta de machine learning conocida como Predicciones Estructurales y Clasificador Informado por Ómicos (SPOC), que es capaz de separar las predicciones verdaderas y falsas de los PPI.

Inicialmente, los investigadores aplicaron SPOC a una matriz de alrededor de 300 proteínas de mantenimiento del genoma humano. Este clasificador pudo generar 40.000 predicciones de interacción entre proteínas, lo que proporciona la base para el interactoma estructural humano.

Para escalar drásticamente este proyecto, el equipo adoptó la Infraestructura de computación acelerada de NVIDIA y la pila completa NVIDIA DGX Cloud, que consiste en clústeres DGX de 32 nodos con 256 GPU A100. Esta solución de NVIDIA les permitió a los investigadores ejecutar 1.7 millones de predicciones PPI en ColabFold en el transcurso de tres meses.

La asignación de NVIDIA DGX Cloud fue posible gracias a la asociación de NVIDIA con el programa piloto NAIRR de la National Science Foundation. A través de esta iniciativa, investigadores de todo Estados Unidos pueden utilizar DGX Cloud para impulsar proyectos en áreas como la prevención de pandemias, la investigación de ARN y células humanas, la agricultura inteligente y la ciencia de materiales.

“No es exagerado decir que este proyecto no habría sido posible sin DGX Cloud”, dijo Schmid. “Contar con un recurso en la nube dedicado que pudiéramos configurar completamente según nuestras necesidades nos permitió alcanzar la velocidad y la escala que necesitábamos para procesar nuestro conjunto de datos y, francamente, sin ese nivel de control, habría tomado literalmente años, si no más, completar esto”.

Impulsando el Futuro del Descubrimiento de Interacciones Proteína-Proteína

Las interacciones proteína-proteína (PPI) de alta confianza descubiertas mediante este método multicapa pueden facilitar la generación de hipótesis en todas las áreas de la fisiología celular. Estos resultados proporcionan un framework para interpretar con precisión estudios computacionales a gran escala de interacciones proteína-proteína y ayudan a sentar las bases para interactomas más rápidos y complejos. 

The Walter Lab y los científicos de todo el mundo emprenderán nuevos experimentos y enfoques computacionales para comprender estas complejidades biológicas, lo que los acercará a comprender mejor los mecanismos celulares y a prevenir enfermedades de alta prevalencia, como el cáncer.

 Descubra más sobre cómo el piloto NAIRR, en asociación con NVIDIA, proporciona las herramientas necesarias para impulsar la investigación y el descubrimiento científicos innovadores a escala global.

Historias de Clientes Relacionadas