NVIDIA T4

DISEÑO FLEXIBLE Y RENDIMIENTO EXCEPCIONAL

La aceleración de inferencias sube de nivel

Nos dirigimos a toda velocidad hacia un futuro en el que cada interacción con el cliente, cada producto y cada oferta de servicio estarán perfeccionados mediante IA. Para hacer realidad ese futuro, se necesita una plataforma de computación capaz de acelerar el amplio campo de la IA moderna, que permita a las empresas crear nuevas experiencias de cliente, reinventar la manera de satisfacer o —incluso superar— sus demandas, y aumentar la cantidad de productos y servicios basados en IA de forma rentable.

La GPU NVIDIA® T4 acelera distintas cargas de trabajo en la nube, como la computación de alto rendimiento, el entrenamiento y la inferencia de deep learning, el aprendizaje automático, el análisis de datos y los gráficos. Partiendo de la nueva arquitectura NVIDIA Turing y fabricada con un factor de forma PCIe de pequeño tamaño y consumo eficiente con sus 70 vatios, la T4 está optimizada para entornos de computación general e incluye núcleos Tensor de Turing de multiprecisión y nuevos núcleos RT. En combinación con pilas de software aceleradas en contenedores de NGC, la T4 ofrece un rendimiento revolucionario a escala.

Las GPU T4 aceleran las cargas de trabajo de los servidores empresariales más importantes del mundo.

RENDIMIENTO EXTRAORDINARIO

La T4 presenta la revolucionario tecnología de núcleos Tensor de Turing con computación de multiprecisión para manejar una variedad de cargas de trabajo. Con la potencia del rendimiento excepcional de FP32 a FP16 e INT8, así como precisiones INT4, la T4 proporciona un rendimiento hasta 40 veces mayor que las CPU.

Rendimiento de inferencia avanzado

INFERENCIA DE VANGUARDIA EN TIEMPO REAL

La velocidad de respuesta es clave para la participación del usuario en servicios tales como la IA conversacional, sistemas de recomendación y búsqueda visual. A medida que se incrementa la precisión y complejidad de los modelos, la capacidad de cálculo para dar una respuesta correcta al instante aumenta exponencialmente. Tesla T4 ofrece un rendimiento de baja latencia hasta 40 veces superior, que permite atender más solicitudes en tiempo real.

RENDIMIENTO DE INFERENCIA DE LA T4

Resnet50

DeepSpeech2

GNMT

Rendimiento de la transcodificación de vídeo

A medida que el volumen de vídeos en línea crece de forma exponencial, la demanda de soluciones para buscar y obtener información a partir de vídeo de manera eficiente también aumenta. Tesla T4 ofrece un rendimiento avanzado para la aplicación de IA en vídeo, con motores de transcodificación de hardware dedicados que duplican la capacidad de descodificación de las GPU de generaciones anteriores. La T4 ofrece un rendimiento hasta 40 veces mejor, por lo que se puede atender a más solicitudes en tiempo real.

Especificaciones de NVIDIA Tesla T4

 

Rendimiento

Núcleos Turing Tensor
320

Núcleos NVIDIA CUDA®
2560

Rendimiento de precisión simple (FP32)
8,1 TFLOPS

Precisión combinada (FP16/FP32)
65TFLOPS de FP16

Precisión INT8
130 TOPS de INT8

Precisión INT4
260 TOPS de INT4

 
 

Interconexión

16 PCIe
de 3.ª gen.

 
 

Memoria

Capacidad
GDDR6 de 16 GB

Ancho de banda
Más de 320 GB/s

 
 

Potencia

70 vatios

 

Plataforma de inferencia de IA de NVIDIA

Explora la plataforma de inferencia más avanzada del mundo.