Sanidad y biociencias

Cómo resolver los misterios de las firmas mutantes de cáncer con las soluciones aceleradas por NVIDIA

Objetivo

El Sanger Institute utiliza el servidor NVIDIA DGX para potenciar sus procesos de análisis de firmas mutacionales del cáncer y mejora el rendimiento 30 veces.

Cliente

Instituto Sanger

Caso de uso

Mejora del rendimiento

Tecnología

Servidor NVIDIA DGX-1™, NVIDIA® NVLink®

La necesidad de comprender mejor las firmas mutacionales del cáncer

El cáncer lo provoca el daño al ADN de las células conocido como mutaciones somáticas. Este daño puede ser el resultado de comportamientos como fumar y beber alcohol, así como de factores ambientales como la luz ultravioleta y la exposición a la radiación.
El daño al ADN se produce en patrones específicos conocidos como "firmas mutacionales", exclusivos del factor que provoca el daño. Por ejemplo, aunque el tabaco y la radiación ultravioleta causan cáncer al producir mutaciones, la firma que provoca el fumar tabaco se encuentra en el cáncer de pulmón, mientras que la firma de la exposición a la luz ultravioleta se encuentra en el cáncer de piel.

Se han identificado muchas firmas mutacionales asociadas al cáncer, pero solo la mitad de ellas tienen causas conocidas. En los últimos años, el análisis del ADN de los cánceres ha llevado a descubrir más de noventa firmas mutacionales diferentes. Sin embargo, aún se desconocen las causas ambientales, de estilo de vida, genéticas u otras causas potenciales de muchas de estas firmas mutacionales.

Como parte del equipo de Cancer Grand Challenges Mutographs, financiado por Cancer Research UK (CRUK), el Wellcome Sanger Institute, uno de los centros pioneros en el conocimiento y descubrimientos genómicos del mundo, utiliza modelos de aprendizaje automático acelerados por GPU NVIDIA, para ayudar a entender cómo ocurren los cambios en el ADN que determinan el cáncer.

El objetivo del componente computacional del proyecto es dilucidar las causas de las principales diferencias geográficas y temporales en la incidencia del cáncer, mediante el estudio de las firmas mutacionales. La identificación de un conjunto más amplio de firmas mutacionales contribuirá en gran medida a que podamos entender la correlación entre las firmas y sus causas, lo que, en última instancia nos permitirá obtener tratamientos más precisos frente al cáncer

pulmones

Investigador del Instituto Wellcome Sanger realiza secuenciación de ADN. Imagen cortesía del Instituto Wellcome Sanger.

Mapa OSCC

Los casos de carcinoma de células escamosas esofágicas varían mucho en todo el mundo. Imagen cortesía del proyecto Mutographs. Fuente de datos: GLOBOCAN 2012.

Resolver el puzle con la informática acelerada por GPU

Este trabajo requiere la solución de un problema de aprendizaje automático computacional intensivo conocido como factorización de matriz no negativa (NMF). Ludmil Alexandrov desarrolló el método para detectar firmas de mutación y el software (SigProfiler) mientras estaba en el Instituto Sanger, y continúa desarrollando este trabajo con su equipo en la Universidad de California, en San Diego (UCSD). Juntos, NVIDIA y los equipos de Mutographs en UCSD y el Instituto Sanger se unieron para usar GPU para acelerar esta investigación.

"Los proyectos de investigación como el Mutographs Grand Challenge son solo eso; grandes desafíos que rebasan los límites de lo posible", cuenta Pete Clapham, líder del Grupo de Soporte de Informática en el Instituto Wellcome Sanger. "Los sistemas NVIDIA DGX proporcionan una aceleración considerable que permite al equipo de Mutographs no solo cumplir con las demandas computacionales del proyecto, sino llevarlo aún más lejos, brindandoresultados de manera eficiente.

Las GPU NVIDIA aceleran la aplicación científica al encargarse de las partes del código que más tiempo consumían. Al tiempo que el Instituto Sanger ahorra costos y mejora el rendimiento al ejecutar el trabajo intensivo computacional en las GPU, el resto de la aplicación sigue ejecutándose en la CPU. Desde la perspectiva del investigador, la aplicación global se ejecuta más rápido porque utiliza la potencia del procesos de la GPU para mejorar el rendimiento.

En el proyecto actual, los investigadores estudian el ADN de los tumores de 500 pacientes con cinco tipos de cáncer: páncreas, riñón, colorrectal y dos tipos de cáncer de esófago. Cinco matrices de datos sintéticos que simulan un tipo de perfiles mutacionales reales se usaron para estimar el rendimiento del cálculo. Un sistema NVIDIA DGX-1 ejecuta el algoritmo NMF frente a las cinco matrices, a la vez que los trabajos de la CPU replicados correspondientes se ejecutan en contenedores de docker en máquinas virtuales (VM) en OpenStack, en concreto 60 cores en procesadores Intel Xeon Skylake con 2,6 GHz y 697,3 GB de memoria de acceso (RAM).

El NVIDIA DGX-1 es un sistema integrado para la IA que cuenta con ocho GPU NVIDIA V100 con núcleo Tensor, que se conectan mediante NVIDIA NVLink, la interconexión de GPU de alto rendimiento de NVIDIA, en una red de malla cubo híbrida. El DGX-1, junto con las CPU Intel Xeon de doble zócalo y cuatro tarjetas de interfaz de red de 100 Gb NVIDIA Mellanox® InfiniBand, ofrece un petaFLOPS de potencia de IA y un rendimiento de entrenamiento sin precedentes. El sistema de software DGX-1, librerías potentes y la red NVLink están preparados para escalar el deep learning en las ocho GPU V100 con núcleo Tensor para ofrecer un rendimiento máximo y flexible para el desarrollo y la implementación de las aplicaciones de IA tanto en escenarios de producción como de investigación.

"Los proyectos de investigación como el Mutographs Grand Challenge son solo eso: grandes desafíos que rebasan los límites de lo posible. Los sistemas NVIDIA DGX proporcionan una aceleración considerable que permite al equipo de Mutographs, no solo satisfacer las demandas computacionales del proyecto, sino llevarlo aún más lejos, entregando resultados de manera eficiente que antes eran imposibles".

Pete Clapham, líder del Grupo de Apoyo Informático, Instituto Wellcome Sanger

Los resultados más rápidos y los experimentos más complejos ayudan a mejorar la salud humana

Se observó una aceleración media de 30 veces cuando los trabajos del proceso se ejecutaron en la plataforma DGX-1 en comparación con los del hardware de CPU. El DGX-1 ofreció resultados precisos en dieciséis horas para un trabajo de CPU equivalente que generalmente llevaba veinte días en un análisis real.

La aceleración y la potencia de cálculo de las GPU están permitiendo a los investigadores obtener resultados científicos más rápido, ejecutar un mayor número de experimentos más complejos de lo que era posible anteriormente, allanando el camino para descubrimientos científicos que podrían transformar el futuro de los tratamientos contra el cáncer.