Ensino Superior e Pesquisa
Com o suporte do programa-piloto do National Artificial Intelligence Research Resource (NAIRR) da National Science Foundation e o acesso ao NVIDIA DGX™ Cloud, o Walter Lab da Harvard Medical School concluiu quase 1,7 milhão de previsões de interação entre proteínas em apenas três meses — um processo que anteriormente levaria uma vida inteira para ser concluído pelos pesquisadores.
O DNA humano é constantemente impactado por fatores como exposição à luz UV e produtos químicos externos presentes no ambiente. Para prevenir condições que ameaçam a vida, como câncer, as células devem reparar os danos ao DNA. Johannes Walter e sua equipe de pesquisa estão trabalhando para entender os mecanismos moleculares usados pelas células para copiar e reparar o DNA, aproveitando o poder da inteligência artificial.
“Tivemos tanto sucesso com o AlphaFold em nossa área de biologia que decidimos expandi-lo além da área do nosso laboratório para o problema no qual quase todos os biólogos pensam: como as proteínas precisam interagir umas com as outras em todo o corpo humano”, disse Ernst Schmid, estudante de pós-graduação do Walter Lab. “Estamos migrando de algumas centenas de proteínas interagindo de algumas centenas de maneiras para a escala de todo o proteoma: 20 mil proteínas interagindo de, talvez, um milhão de maneiras.”
O primeiro passo nesse processo foi desenvolver uma caracterização estrutural, ou mapa, das interações proteína-proteína (PPIs) em uma única célula. Outras ferramentas de IA são treinadas para prever estruturas tridimensionais de proteínas, mas geralmente não separam de forma confiável as PPIs relevantes das previsões falso-positivas.
Além disso, determinar manualmente a estrutura de uma proteína era um processo extremamente lento, que costumava exigir anos de pesquisa.
O Walter Lab superou essas limitações desenvolvendo um pipeline de várias etapas:
Inicialmente, os pesquisadores aplicaram o SPOC a uma matriz de cerca de 300 proteínas de manutenção do genoma humano. Esse classificador foi capaz de gerar 40 mil previsões de interação entre proteínas, fornecendo a base para o interactoma estrutural humano.
Para escalar significativamente esse projeto, a equipe adotou a infraestrutura de Computação Acelerada da NVIDIA e o stack completo do NVIDIA DGX Cloud, composto por clusters DGX de 32 nós com 256 GPUs A100. Essa solução da NVIDIA permitiu que os pesquisadores executassem 1,7 milhão de previsões de PPI no ColabFold no período de três meses.
A alocação do NVIDIA DGX Cloud foi possível por meio da parceria da NVIDIA com o programa-piloto NAIRR da National Science Foundation. Por meio dessa iniciativa, pesquisadores em todos os Estados Unidos podem usar o DGX Cloud para avançar projetos em áreas como prevenção de pandemias, pesquisa de RNA e células humanas, agricultura inteligente e ciência de materiais.
“Não é exagero dizer que esse projeto não teria sido possível sem o DGX Cloud”, afirmou Schmid. “Ter um recurso de nuvem dedicado que pudéssemos configurar completamente para nossos próprios casos de uso nos permitiu alcançar a velocidade e a escala necessárias para analisar nosso conjunto de dados e, francamente, se não tivéssemos esse tipo de controle, levaria literalmente anos, ou mais, para concluir isso tudo.”
As PPIs de alta confiança descobertas usando esse método multicamadas podem permitir a geração de hipóteses em todas as áreas da fisiologia celular. Esses resultados fornecem um framework para interpretar com precisão telas de interação computacional de proteínas em larga escala e ajudam a estabelecer a base para interactomas mais rápidos e complexos.
O Walter Lab e cientistas em todo o mundo realizarão novos experimentos e abordagens computacionais para entender essas complexidades biológicas. Isso os aproximará da compreensão dos mecanismos das células humanas para prevenir doenças prevalentes, como o câncer.
Explore mais como o piloto do NAIRR, em parceria com a NVIDIA, está fornecendo as ferramentas para pesquisa científica e descoberta inovadoras em escala global.