Архитектура NVIDIA Ampere

Сердце самых производительных и масштабируемых дата-центров

Основа для ИИ и HPC в современном дата-центре

Решение важнейших задач в науке, промышленности и бизнесе с помощью ИИ и высокопроизводительных вычислений (HPC). Визуализация сложных объектов для продуктовой разработки, создания иммерсивных проектов или работы над городами будущего. Извлечение результатов аналитики из массивных наборов данных. Разработанная для эластичных вычислений архитектура NVIDIA Ampere обеспечивает непревзойденное масштабируемое ускорение в повседневных рабочих задачах.

Революционные инновации

Оснащенная 54 миллиардами транзисторов архитектура NVIDIA Ampere представляет собой самый большой в мире 7-нанометровый чип и имеет шесть ключевых инновационных особенностей.

Тензорные ядра третьего поколения

Впервые реализованная в архитектуре NVIDIA Volta™ технология тензорных ядер NVIDIA значительно ускоряет инференс и позволяет обучить алгоритмы ИИ за несколько часов, а не недель. Опираясь на эти инновации, архитектура NVIDIA Ampere предоставляет поддержку операций Tensor Float 32 (TF32) и с плавающей точкой (FP64), ускоряя и упрощая внедрение ИИ и обеспечивая возможности тензорных ядер для HPC.

TF32 работает аналогично FP32 и до 20 раз ускоряет инференс ИИ, не требуя изменений в коде. А при использовании автоматической функции работы с различной точностью NVIDIA исследователи могут получить производительность в 2 раза больше в операциях FP16, что требует добавления всего одной строки кода. Благодаря поддержке операций bfloat16, INT8 и INT4 тензорные ядра в GPU с тензорными ядрами на базе архитектуры NVIDIA Ampere создают универсальный ускоритель как для тренировки ИИ, так и для инференса. Обеспечивая возможности тензорных ядер для HPC, GPU A100 и A30 позволяют выполнять матричные операции с точностью FP64 в соответствии со стандартом IEEE. 

Тензорные ядра третьего поколения
Multi-Instance GPU (MIG)

Multi-Instance GPU (MIG)

Каждое приложение для ИИ и HPC работает быстрее с графическим ускорением, но не всем приложениям нужна полная мощность графического процессора. Технология Multi-Instance GPU (MIG) — это функция, поддерживаемая на GPU A100 и A30 и позволяющая совместно использовать ресурсы одного GPU. С MIG каждый GPU можно разделить на несколько полностью изолированных и защищенных на аппаратном уровне инстансов, оснащенных памятью с высокой пропускной способностью, кэшем и вычислительными ядрами. Это позволяет использовать ускорение для приложений с разной ресурсоемкостью, а также получить гарантированное качество обслуживания. Администраторы могут предложить оптимальные ресурсы GPU для любой задачи, повысить утилизацию и предоставить доступ большему числу пользователей как на физических серверах, так и в виртуализированной среде.

Структурная разреженность

Структурная разреженность

Современные сети ИИ становятся все больше и состоят из миллионов, а иногда и миллиардов, параметров. Не все эти параметры необходимы для точного прогнозирования и инференса, и некоторые из них можно преобразовать в нули, чтобы создать «разреженные» модели без ущерба для точности вычислений. Тензорные ядра обеспечивают производительность до двух раз выше для разреженных моделей. Хотя функция разреженности в основном предназначена для инференса ИИ, с ее помощью можно также повысить скорость тренировки модели. 

Второе поколение ядер RT

Ядра RT второго поколения архитектуры NVIDIA Ampere в GPU NVIDIA A40 позволяют значительно ускорить такие процессы, как фотореалистичный рендеринг киноматериалов, оценка архитектурных проектов и виртуальное прототипирование продуктов. Ядра RT также ускоряют рендеринг сцен движения, позволяя быстрее создавать более точное изображение, и одновременно обеспечивают трассировку лучей с шейдингом или шумоподавлением.

Второе поколение ядер RT
Улучшенная быстрая память

Улучшенная быстрая память

A100 обеспечивает значительный объем памяти для вычислений в дата-центре. Для максимальной утилизации вычислительных движков платформа оснащена пропускной способностью памяти 2 Тб/с, что в 2 раза быстрее технологии предыдущего поколения. Кроме того, для максимальной вычислительной мощности A100 имеет значительно больший объем памяти, включая кэш второго уровня 40 Мб, что в 7 раз больше, чем у систем предыдущего поколения.

Для масштабных развертываний

Графические процессоры и конвергентные ускорители NVIDIA предназначены для масштабных развертываний. Широкие сетевые возможности, высокая безопасность и малое энергопотребление в облаке, дата-центрах и на периферийных устройствах.

Необходимая мощность для любого сервера

Низкопрофильный графический процессор NVIDIA A2 оптимизирован для задач инференса и развертывания на серверах начального уровня в средах с ограниченным пространством и повышенными требованиями к охлаждению, например для периферийных вычислений 5G и промышленных задач. Компактный и энергоэффективный корпус A2 с показателями по теплоотводу от 40 до 60 Вт подходит для установки в любые системы.

GPU NVIDIA A2 с тензорными ядрами
Конвергентный ускоритель NVIDIA

Ускорение вычислений и передачи данных по сети

Конвергентные ускорители NVIDIA объединяют в себе архитектуру NVIDIA Ampere и блок обработки данных (DPU) NVIDIA BlueField®-2, что позволяет добиться непревзойденного уровня производительности, повышенной безопасности и высокоскоростной передачи данных при выполнении задач ИИ в области периферийных вычислений, телекоммуникаций и сетевой безопасности. BlueField-2 сочетает возможности NVIDIA ConnectX®-6 Dx, программируемых ядер Arm® и аппаратной разгрузки для программно-определяемых хранилищ, сетей, безопасности и управления данными. Конвергентные ускорители NVIDIA обеспечивают новый уровень эффективности и безопасности дата-центра для задач с ускорением на GPU.

Оптимизация плотности

GPU NVIDIA A16 поставляется с четырехпроцессорной платой, оптимизированной для высокой плотности пользователей. В сочетании с ПО NVIDIA Virtual PC (vPC) он позволяет обеспечить доступ к графически насыщенным виртуальным ПК из любой точки. Он гарантирует более высокую частоту смены кадров и более низкую задержку для конечных пользователей по сравнению традиционной VDI на базе CPU с NVIDIA A16, что позволяет обеспечить более высокую отзывчивость приложений и пользовательский интерфейс, неотличимый от своего ПК.

Оптимизация плотности
Аппаратный корень доверия

Безопасные развертывания

Безопасные развертывания критически важны для компаний. Архитектура NVIDIA Ampere обеспечивает безопасную доверенную загрузку с усиленной аутентификацией и анти-откатом для защиты от вредоносных атак, предотвращения операционных потерь и ускорения задач.

Инновации в архитектуре NVIDIA Ampere

Изучите передовые технологии архитектуры и полную линейку GPU