Использование данных секвенирования ДНК для диагностики и поиска лекарств обещает стать революционным изменением в современной медицине. Однако сейчас анализ занимает слишком длительное время. В среднем весь геном человека генерирует 100 ГБ сжатых данных секвенирования. Их обработка требует почти тысячу часов работы CPU, чтобы получить выводы биологического значения для генетиков, биоинформатиков и врачей.
Ускорение обработки данных приведет к ускорению открытий, снижению затрат и позволит геномному анализу стать стандартным методом здравоохранения. В статье Parabricks исследован геномный анализ, требующий большого объема вычислений, описан ускоренный процесс выравнивания, предварительной обработки и определения варианта. В работе демонстрируется возможность GPU ускорять параллелизуемые задачи секвенирования при обработке генома на разных этапах. Это сокращает общее время аналитики, что решает проблему длительного анализа.