El rápido crecimiento de las cargas de trabajo de deep learning ha generado la necesidad de una interconexión más rápida y escalable, pues el ancho de banda PCIe es cada vez más un cuello de botella en el nivel de sistemas de varias GPU.
NVLink supone un gran avance para habilitar ocho GPU en un único servidor y acelerar el rendimiento más allá del PCIe. Pero, para llevar el rendimiento de deep learning al siguiente nivel, se necesita un tejido de GPU que permita usar más GPU en un único servidor, así como conectividad de ancho de banda total entre ellas.
NVIDIA NVSwitch es la primera arquitectura de conmutadores en nodo en admitir 16 GPU totalmente conectadas en un único nodo de servidor y permitir la comunicación simultánea entre ocho pares de GPU a la increíble velocidad de 300 GB/s cada uno. Estas 16 GPU se pueden usar como acelerador único a gran escala con 0,5 terabytes de espacio de memoria unificada y 2 petaflops de poder de computación de deep learning.