Ensino Superior e Pesquisa

Harvard Medical School Estuda Interações Entre Proteínas em um Ritmo Sem Precedentes Usando o NVIDIA DGX Cloud

Objetivo

Com o suporte do programa-piloto do National Artificial Intelligence Research Resource (NAIRR) da National Science Foundation e o acesso ao NVIDIA DGX™ Cloud, o Walter Lab da Harvard Medical School concluiu quase 1,7 milhão de previsões de interação entre proteínas em apenas três meses — um processo que anteriormente levaria uma vida inteira para ser concluído pelos pesquisadores.

Cliente

Universidade Harvard

Tópico

Simulação / Modelagem / Design

Pontos Principais

  • Com a infraestrutura de Computação Acelerada da NVIDIA e o DGX Cloud, os pesquisadores do Walter Lab foram capazes de executar 1,7 milhão de previsões de interação proteína-proteína (PPI) em apenas três meses.
  • Os pesquisadores realizaram a curadoria de 40 mil interações proteína-proteína de alta confiança entre 300 proteínas envolvidas na manutenção do genoma humano, fornecendo novas hipóteses estruturais para vias relevantes a doenças.
  • Os investigadores do projeto desenvolveram o site Predictomes como um recurso de interactoma acessível e curado por classificadores, permitindo que pesquisadores de todo o mundo explorem PPIs e avaliem seus próprios modelos com o Structure Predictions and Omics-Informed Classifier.

Armadilhas em Previsões de Proteínas

O DNA humano é constantemente impactado por fatores como exposição à luz UV e produtos químicos externos presentes no ambiente. Para prevenir condições que ameaçam a vida, como câncer, as células devem reparar os danos ao DNA. Johannes Walter e sua equipe de pesquisa estão trabalhando para entender os mecanismos moleculares usados pelas células para copiar e reparar o DNA, aproveitando o poder da inteligência artificial.   

“Tivemos tanto sucesso com o AlphaFold em nossa área de biologia que decidimos expandi-lo além da área do nosso laboratório para o problema no qual quase todos os biólogos pensam: como as proteínas precisam interagir umas com as outras em todo o corpo humano”, disse Ernst Schmid, estudante de pós-graduação do Walter Lab. “Estamos migrando de algumas centenas de proteínas interagindo de algumas centenas de maneiras para a escala de todo o proteoma: 20 mil proteínas interagindo de, talvez, um milhão de maneiras.”  

O primeiro passo nesse processo foi desenvolver uma caracterização estrutural, ou mapa, das interações proteína-proteína (PPIs) em uma única célula. Outras ferramentas de IA são treinadas para prever estruturas tridimensionais de proteínas, mas geralmente não separam de forma confiável as PPIs relevantes das previsões falso-positivas.  

Além disso, determinar manualmente a estrutura de uma proteína era um processo extremamente lento, que costumava exigir anos de pesquisa.

O Blueprint da Solução Com o NVIDIA DGX Cloud

O Walter Lab superou essas limitações desenvolvendo um pipeline de várias etapas:

  1. Os pesquisadores criaram uma ferramenta de machine learning chamada KIRC, que identifica pares de proteínas que merecem análise detalhada pelo AlphaFold.
  2. A equipe projetou uma segunda ferramenta de machine learning conhecida como Structure Predictions and Omics-Informed Classifier (SPOC), capaz de separar previsões verdadeiras e falsas das PPIs.

Inicialmente, os pesquisadores aplicaram o SPOC a uma matriz de cerca de 300 proteínas de manutenção do genoma humano. Esse classificador foi capaz de gerar 40 mil previsões de interação entre proteínas, fornecendo a base para o interactoma estrutural humano.

Para escalar significativamente esse projeto, a equipe adotou a infraestrutura de Computação Acelerada da NVIDIA e o stack completo do NVIDIA DGX Cloud, composto por clusters DGX de 32 nós com 256 GPUs A100. Essa solução da NVIDIA permitiu que os pesquisadores executassem 1,7 milhão de previsões de PPI no ColabFold no período de três meses.

A alocação do NVIDIA DGX Cloud foi possível por meio da parceria da NVIDIA com o programa-piloto NAIRR da National Science Foundation. Por meio dessa iniciativa, pesquisadores em todos os Estados Unidos podem usar o DGX Cloud para avançar projetos em áreas como prevenção de pandemias, pesquisa de RNA e células humanas, agricultura inteligente e ciência de materiais.

“Não é exagero dizer que esse projeto não teria sido possível sem o DGX Cloud”, afirmou Schmid. “Ter um recurso de nuvem dedicado que pudéssemos configurar completamente para nossos próprios casos de uso nos permitiu alcançar a velocidade e a escala necessárias para analisar nosso conjunto de dados e, francamente, se não tivéssemos esse tipo de controle, levaria literalmente anos, ou mais, para concluir isso tudo.”

Desbravando o Futuro da Descoberta de Interação entre Proteínas

As PPIs de alta confiança descobertas usando esse método multicamadas podem permitir a geração de hipóteses em todas as áreas da fisiologia celular. Esses resultados fornecem um framework para interpretar com precisão telas de interação computacional de proteínas em larga escala e ajudam a estabelecer a base para interactomas mais rápidos e complexos. 

O Walter Lab e cientistas em todo o mundo realizarão novos experimentos e abordagens computacionais para entender essas complexidades biológicas. Isso os aproximará da compreensão dos mecanismos das células humanas para prevenir doenças prevalentes, como o câncer.

 Explore mais como o piloto do NAIRR, em parceria com a NVIDIA, está fornecendo as ferramentas para pesquisa científica e descoberta inovadoras em escala global.

Histórias Relacionadas