NVIDIA T4

Diseño flexible y rendimiento avanzado

Ha llegado la aceleración del siguiente nivel

Nos dirigimos a toda velocidad hacia un futuro en el que cada interacción con el cliente, cada producto y cada oferta de servicio estarán tocados y perfeccionados mediante IA. Para hacer realidad ese futuro, se necesita una plataforma de computación capaz de acelerar el amplio campo de la IA moderna, que permita a las empresas crear nuevas experiencias de cliente, reinventar la manera de satisfacer o, incluso superar— sus demandas y aumentar la cantidad de productos y servicios basados en IA de forma rentable.

La GPU NVIDIA® T4 acelera distintas cargas de trabajo en la nube, como la computación de alto rendimiento, el entrenamiento y la inferencia de deep learning, el aprendizaje automático, el análisis de datos y los gráficos. Basada en la nueva arquitectura NVIDIA Turing y fabricada con un factor de forma PCIe de pequeño tamaño y consumo eficiente con sus 70 vatios, la T4 está optimizada para entornos de computación general e incluye núcleos Tensor Core de Turing de multiprecisión y nuevos núcleos RT. En combinación con pilas de software aceleradas en contenedores de NGC, la T4 ofrece un rendimiento revolucionario a escala.

Cargas de trabajo de servidor con un uso intensivo de computación virtual

Cargas de trabajo de servidor con un uso intensivo de computación virtual

NVIDIA Virtual Compute Server (vCS) ofrece la capacidad de virtualizar las GPU y acelerar las cargas de trabajo de servidor con uso intensivo de computación, incluidas la IA, el deep learning y la ciencia de datos. Con esto, los fabricantes de automóviles pueden utilizar lo último en tecnologías de simulación y computación para crear los diseños más elegantes y eficientes en combustible y los investigadores pueden analizar la función de los genes para desarrollar tratamientos médicos más rápidamente.

Una nueva asociación está avanzando en la nube híbrida para impulsar cargas de trabajo empresariales modernas.

Rendimiento avanzado

T4 presenta la revolucionaria tecnología de Tensor Core de Turing con computación de multiprecisión para manejar una variedad de cargas de trabajo. Impulsando un rendimiento innovador de FP32 a FP16 a INT8, así como precisiones INT4, T4 ofrece un rendimiento hasta 40 veces mayor que las CPU.

Rendimiento de inferencia avanzado

Descubrir cómo acelerar los modelos de IA con la precisión combinada de los núcleos Tensor Core

Inferencia de última generación en tiempo real

La capacidad de respuesta es clave para la participación del usuario en servicios como la IA conversacional, los sistemas de recomendación y la búsqueda visual. A medida que los modelos aumentan en precisión y complejidad, ofrecer la respuesta correcta en este momento requiere una capacidad de computación exponencialmente mayor. La T4 ofrece un rendimiento hasta 40 veces mejor, por lo que se puede atender a más solicitudes en tiempo real.

Rendimiento de inferencia de T4

Resnet50

DeepSpeech2

GNMT

Rendimiento de la transcodificación de vídeo

A medida que el volumen de vídeos en línea crece de forma exponencial, la demanda de soluciones para buscar y obtener información a partir de vídeo de manera eficiente también aumenta. Tesla T4 ofrece un rendimiento avanzado para la aplicación de IA en vídeo, con motores de transcodificación de hardware dedicados que duplican la capacidad de descodificación de las GPU de generaciones anteriores. La T4 ofrece un rendimiento hasta 40 veces mejor, por lo que se puede atender a más solicitudes en tiempo real.

Especificaciones de NVIDIA T4

 

Rendimiento

Núcleos Tensor Core de Turing
320

Núcleos NVIDIA CUDA®
2560

Rendimiento de precisión simple (FP32)
8,1 TFLOPS

Precisión combinada (FP16/FP32)
65 FP16 TFLOPS

Precisión INT8
130 INT8 TOPS

Precisión INT4
260 INT4 TOPS

 
 

Interconexión

Gen3
x16 PCIe

 
 

Memoria

Capacidad
GDDR6 de 16 GB

Ancho de banda
más de 320 GB/s

 
 

Potencia

70 vatios

 

Plataforma de inferencia de IA de NVIDIA

Explora la plataforma de inferencia más avanzada del mundo.