Гибкая Архитектура, Революционная производительность
Мы на пути к будущему, когда каждое взаимодействие с клиентом, каждый продукт и предлагаемая услуга будут изменены и улучшены с помощью искусственного интеллекта. Для осуществления этих перспектив необходима вычислительная платформа, которая может ускорять полный спектр задач современного искусственного интеллекта, позволяя компаниям переосмыслить работу с новыми клиентами. У компаний появится возможность определить, как соответствовать потребностям клиента и превосходить их, а также экономично масштабировать продукты и услуги на базе искусственного интеллекта.
GPU NVIDIA® T4 ускоряет различные задачи в облаке, в том числе высокопроизводительные вычисления, тренировку и инференс алгоритмов глубокого обучения, машинное обучение, анализ данных и работу с графикой. T4 создан на базе новой архитектуры NVIDIA Turing™ и заключен в компактный форм-фактор PCIe с уровнем энергопотребления 70 Вт. Графический ускоритель оптимизирован для основных вычислительных сред и оснащен тензорными ядрами Turing и новыми ядрами RT. T4 обеспечивает революционную масштабируемую производительность, так как объединен с ускоренным контейнеризованным ПО из NGC.
Новое партнерство нацелено на развитие гибридных облачных платформ для обеспечения современных рабочих нагрузок.
T4 представляет революционную технологию Turing с тензорными ядрами для операций с разной точностью, что позволяет выполнять различные задачи. T4 до 40 раз мощнее CPU и обеспечивает невероятную производительность любых операций от FP32 до FP16 и INT8, а также операций INT4 с точностью.
Отзывчивость - основной критерий привлекательности для пользователя таких услуг, как коммуникативные сервисы с искусственным интеллектом, рекомендательные системы и визуальный поиск. Так как модели глубокого обучения становятся все более сложными, быстрый и правильный ответ требует существенно более высокой вычислительной мощности. Tesla T4 обеспечивает повышение производительности до 40 раз с минимальными задержками, позволяя обрабатывать больше запросов в реальном времени.
Система распознавания изображений Resnet50
Система распознавания речи DeepSpeech2
Система машинного перевода GNMT
Сравнение ускорений GPU и CPU «от чипа до чипа» | Графический ускоритель NVIDIA T4 и процессор Xeon Gold 6140
Так как объем онлайн-видео увеличивается в геометрической прогрессии, продолжает расти потребность в решениях для эффективного поиска и извлечения знаний из видеоматериалов. Tesla T4 обеспечивает революционную производительность для видеоприложений на базе искусственного интеллекта благодаря специализированным аппаратным движкам для транскодирования, которые заключают в себе двухкратную производительность декодирования GPU предыдущего поколения. T4 обеспечивает повышение производительности до 40 раз, позволяя обрабатывать больше запросов в реальном времени.
Тензорные ядра Turing 320
Ядра NVIDIA CUDA® 2560
Производительность операций с одинарной точноcтью (FP32) 8,1 Терафлопс
Операции со смешанной точностью (FP16/FP32) 65 Терафлопс
Операции INT8 130 тера-операций в секунду (TOPS)
Операции INT4 260 тера-операций в секунду (TOPS)
Gen3 x16 PCIe
16 ГБ GDDR6
Пропускная способность памяти 320+ Гбит/с или выше
70 Вт
Узнайте больше о самой инновационной в мире платформе для инференса.