Diseño Flexible Y Rendimiento Revolucionario
Nos acercamos hacia un futuro en donde cada interacción con los clientes, cada producto y cada oferta de servicio se verán afectados y mejorados por la IA. El futuro requiere una plataforma de procesamiento que pueda acelerar la toda diversidad de la IA moderna, para permitir que las empresas creen nuevas experiencias de clientes, reimaginen cómo satisfacen y superan las demandas de los clientes y escalen de manera rentable sus productos y servicios basados en IA.
Las GPU NVIDIA® T4 acelera las diferentes cargas de trabajo en el cloud, lo que incluye el procesamiento de alto rendimiento, la capacitación y la inferencia del deep learning, el machine learning, el análisis de datos y los gráficos. La GPU T4 está optimizada para los entornos de procesamiento convencionales y presenta Tensor Cores de la architectura Turing de precisión múltiple y los nuevos núcleos RT, ya que está basada en el cloud y se ofrece en un tamaño PCIe pequeño de 70V con eficiencia energética. La T4 ofrece un rendimiento revolucionario a escala, ya que se combina con un conjunto de software en contenedores acelerados de NGC.
NVIDIA Virtual Compute Server (vCS) proporciona la capacidad de virtualizar las GPU y acelerar las cargas de trabajo de los servidores que requieren mucho procesamiento, como las de inteligencia artificial, deep learning y ciencia de datos. Con esto, los fabricantes de automóviles pueden usar lo último en simulación y tecnologías de procesamiento para crear los diseños más elegantes y con mejor consumo de combustible, y los investigadores pueden analizar la función de los genes para desarrollar tratamientos médicos más rápidamente.
Una nueva asociación está avanzando en el cloud híbrido para impulsar las cargas de trabajo empresariales modernas.
T4 presenta la revolucionaria tecnología Tensor Cores de architectura Turing con procesamiento de precisión múltiple para manejar diversas cargas de trabajo. T4 ofrece hasta un rendimiento hasta 40veces superior que las CPU, ya que cuenta con el rendimiento innovador de FP32 a FP16 a INT8, así como las precisiones INT4.
La capacidad de respuesta es clave para la participación del usuario en servicios como la IA conversacional, los sistemas de recomendación y la búsqueda visual. A medida que los modelos aumentan en precisión y complejidad, entregar la respuesta correcta en este momento requiere una capacidad de procesamiento exponencialmente mayor. T4 ofrece un rendimiento hasta 40 veces mejor, por lo que se pueden atender más solicitudes en tiempo real.
Resnet50
DeepSpeech2
GNMT
Aceleraciones de GPU a CPU de chip a chip | 1 GPU NVIDIA T4 vs 1 CPU Xeon Gold 6140
A medida que el volumen de videos en línea continúa creciendo exponencialmente, la demanda de soluciones para buscar y obtener información de los videos de manera eficiente también sigue creciendo. T4 ofrece un rendimiento innovador para aplicaciones de video con IA, con motores de transcodificación de hardware dedicados que brindan el doble de rendimiento de decodificación que las GPU de generaciones anteriores. T4 puede decodificar hasta 38 transmisiones de video full-HD, lo que facilita la integración de deep learning escalable en procesos de video para ofrecer servicios de video innovadores e inteligentes.
Turing Tensor Cores 320
NVIDIA CUDA® cores 2,560
Rendimiento De Precisión ÚNica (FP32) 8.1 TFLOPS
Precisión Mixta (FP16/FP32) 65 FP16 TFLOPS
Precisión INT8 130 INT8 TOPS
Precisión INT4 260 INT4 TOPS
Gen3 x16 PCIe
Capacidad 16 GB GDDR6
Ancho De Banda 320+ GB/s
70 watts
Explora la Plataforma de Inferencia Más Avanzada del Mundo.