ARQUITECTURA NVIDIA AMPERE

El corazón de los centros de datos más escalables y de mayor rendimiento del mundo 

EL NÚCLEO DE LA IA Y LA HPC EN EL CENTRO DE DATOS MODERNO

Científicos, investigadores e ingenieros están trabajando para resolver los desafíos científicos, industriales y de big data más importantes del mundo con la IA y la computación de alto rendimiento (HPC). Entretanto, las empresas buscan aprovechar la potencia de la IA para extraer nuevas conclusiones de conjuntos de datos masivos, tanto en instalaciones como en la nube. La arquitectura NVIDIA Ampere, diseñada para la era de la computación elástica, ofrece el próximo salto de gigante al proporcionar una aceleración sin igual a todas las escalas.

INNOVACIONES PIONERAS

Fabricado con 54 mil millones de transistores, la  arquitectura NVIDIA Ampere es el chip de 7 nanómetros (nm) más grande jamás construido y cuenta con cinco innovaciones clave.

Tensor Cores de tercera generación

Introducido por primera vez en la arquitectura NVIDIA Volta™, la tecnología NVIDIA Tensor Core ha traído velocidades espectaculares a la IA, reduciendo los tiempos de entrenamiento de semanas a horas y proporcionando una aceleración masiva a la inferencia. La arquitectura NVIDIA Ampere se basa en estas innovaciones al aportar nuevas precisiones (Tensor Float (TF32) y coma flotante 64 (FP64)) para acelerar y simplificar la adopción de IA y ampliar la potencia de Tensor Cores a HPC.

TF32 funciona igual que FP32 mientras entrega velocidades hasta 20 veces superiores para la IA sin necesidad de ningún cambio de código. Con NVIDIA Automatic Mixed Precision, los investigadores pueden obtener el doble de rendimiento adicional con precisión mezclada automática y FP16 añadiendo solo un par de líneas de código. Y con soporte para bfloat16, INT8 e INT4, Tensor Cores en las GPU Tensor Coreo de la arquitectura NVIDIA Ampere crean un acelerador increíblemente versátil tanto para la inferencia como para el entrenamiento de la IA. Al traer la potencia de Tensor Cores a HPC, las GPU A100 y A30 también permiten operaciones de matriz con una precisión FP64 completa y certificada por IEEE. 

Tensor Cores de tercera generación
GPU multiinstancia (MIG)

GPU multiinstancia (MIG)

Cada aplicación de IA y HPC puede beneficiarse de la aceleración, pero no todas las aplicaciones necesitan el rendimiento de una GPU completa. La GPU multi-instancia (MIG) es una característica compatible con las GPU A100 y A30 que permite que las cargas de trabajo compartan la GPU. Con MIG, cada GPU se puede dividir en varias instancias de GPU, totalmente aisladas y protegidas a nivel de hardware con sus propios núcleos de computación, caché y memoria de gran ancho de banda. Ahora, los desarrolladores pueden acceder a una aceleración innovadora para todas sus aplicaciones, grandes y pequeñas, y obtener una calidad de servicio garantizada. Además, los administradores de TI pueden ofrecer una aceleración de GPU del tamaño adecuado para una utilización óptima y ampliar el acceso a todos los usuarios y aplicaciones en entornos virtualizados y completos

Escasez estructural

Escasez estructural

Las redes de IA modernas son grandes y cada vez más grandes, con millones y, en algunos casos, miles de millones de parámetros. No todos estos parámetros son necesarios para predicciones e inferencias precisas, y algunos se pueden convertir a ceros para hacer que los modelos sean "escasos" sin comprometer la precisión. Tensor Cores pueden proporcionar un rendimiento hasta 2 veces mayor para los modelos escasos. Mientras que la característica de la escasez beneficia la inferencia de IA, también se puede utilizar para mejorar el rendimiento del entrenamiento del modelo. 

Núcleos RT de segunda generación

Los núcleos RT de segunda generación de la arquitectura NVIDIA Ampere en la GPU NVIDIA A40 ofrecen aumentos de velocidad masivos para cargas de trabajo como la representación fotorrealista del contenido de películas, evaluaciones de diseño de arquitectura y prototipo virtual de diseños de productos. Los núcleos RT también aceleran el renderizado de desenfoque de movimiento de trazado de rayos para obtener resultados más rápidos con mayor precisión visual y pueden ejecutar simultáneamente trazado de rayos con las funciones de sombreado y de eliminación de ruido.

Núcleos RT de segunda generación
Memoria más inteligente y rápida

Memoria más inteligente y rápida

A100 trae enormes cantidades de computación a los centros de datos. Para mantener esos motores de computación totalmente utilizados, tiene un ancho de banda de memoria de 2 terabytes por segundo (TB/s) líder en su clase, más del doble con respecto a la generación anterior. Además, el A100 tiene una memoria en chip significativamente mayor, incluida una memoria caché de nivel 2 de 40 megabytes (MB) (7 veces mayor que la generación anterior) para maximizar el rendimiento computacional.

Aceleración convergente en la periferia

La combinación de la arquitectura NVIDIA Ampere y la unidad de procesamiento de datos (DPU) NVIDIA BlueField®-2 en Aceleradores convergidos de NVIDIA ofrece una aceleración de computación y red sin precedentes para procesar las enormes cantidades de datos que se generan en el centro de datos y en el perímetro. BlueField-2 combina la potencia de NVIDIA ConnectX®-6 Dx con núcleos de ARM programables y descargas de hardware para las cargas de trabajo de almacenamiento, redes, seguridad y gestión definidas por software. Con los aceleradores convergidos de NVIDIA, los clientes pueden ejecutar cargas de trabajo de centro de datos y perimetrales con muchos datos con la máxima seguridad y rendimiento.

Aceleración convergente en la periferia
Diseño optimizado de densidad

Diseño optimizado de densidad

NVIDIA A16 GPU viene en un diseño de placa de cuatro GPU optimizado para la densidad de usuarios y, en combinación con el software NVIDIA Virtual PC (vPC), permite acceder a ordenadores virtuales con gran riqueza gráfica desde cualquier lugar. Ofrece una frecuencia de fotogramas mayor y una latencia del usuario final más baja en comparación con la VDI solo para CPU con NVIDIA A16, lo que resulta en aplicaciones más sensibles y una experiencia de usuario que no se puede distinguir desde un PC nativo.

El interior de la arquitectura NVIDIA Ampere

Explora las tecnologías de vanguardia de la arquitectura y su gama completa de GPU.