Платформа NVIDIA для дата-центров обеспечивает постоянный прирост производительности сверх закона Мура. А новые прорывные возможности ИИ в H100 еще больше усиливают мощь сочетания высокопроизводительных вычислений и ИИ, ускоряя работу ученых и исследователей по решению важнейших мировых задач.
H100 утраивает число операций с плавающей точкой в секунду (FLOPS) для тензорных ядер с операциями с двойной точностью, обеспечивая 60 терафлопс вычислений FP64 для задач HPC. Приложения для высокопроизводительных вычислений с ИИ могут использовать точность TF32 процессора H100, чтобы обеспечить пропускную способность один петафлопс в операциях умножения матриц с одинарной точностью без изменений кода.
H100 также содержит инструкции DPX, которые обеспечивают в 7 раз более высокую производительность по сравнению с GPU NVIDIA A100 с тензорными ядрами и 40-кратное ускорение по сравнению с традиционными двухпроцессорными серверами, работающими только на базе CPU, при использовании алгоритмов динамического программирования, таких как алгоритм Смита-Уотермана для выравнивания последовательностей ДНК.