NVIDIA T4

DESIGN FLEXÍVEL, DESEMPENHO SEM IGUAL

O NOVO NÍVEL EM ACELERAÇÃO CHEGOU

Estamos correndo em direção ao futuro onde toda interação com o cliente, todo produto e todo serviço oferecido irá de encontro à AI e será melhorado por ela. Perceber que este futuro necessita de uma plataforma de processamento que pode acelerar toda a diversidade da AI moderna, permitindo que negócios possam criar experiências para os consumidores, reimaginem como eles atendem – e superam – as demandas de seus clientes e garantem economia em seus produtos e serviços baseados em AI.

A GPU NVIDIA® T4 acelera diversas cargas de trabalho em cloud, incluindo a HPC, treinamentos e inferências em deep learning, machine learning, análise de dados e gráficos. Baseada na nova arquitetura NVIDIA Turing™ e embalada em uma pequena arquitetura PCIe, com eficiência de consumo de energia em 70 watts, a T4 é otimizada para ambientes de processamento convencionais e possui os Turing Tensor Cores e o novo RT Cores de multi-precisão. Combinado com os pacotes de software acelerados em containers do NGC, a T4 oferece um desempenho revolucionário.

Cargas de Trabalho para Servidores Virtuais com Processamento Intensivo

Cargas de Trabalho para Servidores Virtuais com Processamento Intensivo

O NVIDIA Virtual Compute Server (vCS) fornece a capacidade de virtualizar GPUs e cargas de trabalho para servidores virtuais com processamento intensivo, incluindo AI, Deep Learning e Ciência de Dados. Com isso, fabricantes de automóveis podem usar as mais recentes tecnologias em simulação e tecnologia de processamento para criar designs mais econômicos e estilosos e pesquisadores podem analisar a função dos genes para desenvolverem tratamentos médicos mais rapidamente.

Uma nova parceria está avançando na cloud híbrida para impulsionar as cargas de trabalho corporativas modernas.

DESEMPENHO INOVADOR

A T4 representa a tecnologia revolucionária Turing Tensor Core com processamento de precisão múltipla para lidar com diversas cargas de trabalho. Potencializando o desempenho inovador do FP32, passando pelo FP16 até o INT8, bem como as precisões do NT4, a T4 oferece desempenho até 40x maior que as CPUs.

Breakthrough Inference Performance

VEJA COMO VOCÊ PODE ACELERAR SEUS MODELOS DE AI COM PRECISÃO MISTA EM TENSOR CORES

INFERÊNCIA DE PONTA EM TEMPO REAL

A capacidade de resposta é essencial para o envolvimento do usuário para serviços como AI de conversação, sistemas de recomendação e pesquisa visual. À medida que os modelos aumentam em precisão e complexidade, fornecer a resposta certa na hora certa exige uma capacidade de processamento exponencialmente maior. A T4 oferece um rendimento até 40X melhor, para que mais solicitações possam ser atendidas em tempo real.

DESEMPENHO DE INFERÊNCIA DA T4

Resnet50

DeepSpeech2

GNMT

DESEMPENHO DE TRANSCODIFICAÇÃO DE VÍDEO

Como o volume de vídeos online continuam a crescer exponencialmente, a demanda por soluções para pesquisar com eficiência e obter insights do vídeo também crescem. A T4 oferece desempenho inovador para aplicações de vídeo em AI, com mecanismos de transcodificação de hardware dedicado que oferecem o dobro do desempenho de decodificação das GPUs da geração anterior. A T4 pode decodificar até 38 streams de vídeo em full-HD, facilitando a integração de deep learning escalonável em pipelines de vídeo para entregar serviços de vídeo inovadores e inteligentes.

ESPECIFICAÇÕES TÉCNICAS DA NVIDIA T4

 

Desempenho

Turing Tensor Cores
320

NVIDIA CUDA® cores
2,560

DESEMPENHO DE PRECISÃO ÚNICA (FP32)
8.1 TFLOPS

PRECISÃO MISTA (FP16/FP32)
65 FP16 TFLOPS

PRECISÃO INT8
130 INT8 TOPS

PRECISÃO INT4
260 INT4 TOPS

 
 

Interconexão

Gen3
x16 PCIe

 
 

Memória

CAPACIDADE
16 GB GDDR6

LARGURA DE BANDA
320+ GB/s

 
 

Consumo

70 watts

 

PLATAFORMA DE INFERÊNCIA NVIDIA AI

Conheça a Plataforma de Inferência Mais Avançada do Mundo.