HGX H100 將雙精度 Tensor 核心的每秒浮點運算次數 (FLOPS) 提高為 3 倍,在 8 GPU 配置時,能為 FP64 的高效能運算提供 535 teraFLOPS;4 GPU 配置時則為 268 teraFLOPS。融合人工智慧的高效能運算應用程式,也能利用 H100 的 TF32 精確度,達到近 8,000 teraFLOPS 的單精確度矩陣乘法運算輸送量,且無須變更程式碼。
H100 也配備全新 DPX 指令可加速動態可編程演算法,如用於 DNA 序列比對的 Smith-Waterman 和用於蛋白質結構預測的蛋白質比對,可比以 Ampere 架構為基礎的 GPU 加快 7 倍。H100 可提高基因定序等診斷功能的輸送量,讓每間診所都能提供準確、即時的疾病診斷和精準醫藥處方。