Abaqus с ускорением на GPU

Ознакомьтесь с Руководством по быстрому запуску и начните работу.

Abaqus Standard

Abaqus/Standard использует стратегию решения, идеально подходящую для статических и низко-скоростных динамических ситуаций, в которых критически важное значение имеет высокоточный анализ механических напряжений и нагрузок В качестве примеров можно привести задачи о расчете прокладок в соединениях, стационарная прокатка шины, или образование трещин в композитном фюзеляже самолета За один цикл моделирования можно проанализировать модель как во временной, так и в частотной области.

Abaqus / Standard работает до 3,7 раз быстрее на NVIDIA GPU по сравнению с CPU-системами, что позволяет пользователям выполнять моделирование конечных элементов за один рабочий день и повышать свою продуктивность.

Читайте статью на тему ускорения симуляций в Abaqus при помощи графических процессоров NVIDIA.   Читайте , как графические процессоры NVIDIA ускоряют работу решателя FEA в программных пакетах Dassault Systèmes SIMULIA Abaqus/Standardhere.

Abaqus работает до 3,7 раз быстрее на GPU

Установка

Инструкции по загрузке и установке

Abaqus standard (версия R2017x) можно скачать на вебсайте 3ds SIMULIA. Краткие инструкции по установке программного пакета читайте ниже:

1. Загрузите файлы "tar". Содержимое этих архивов должно быть извлечено в одном каталоге. Это должно создать единый подкаталог с именем "AM_SIM_Abaqus_Extend.AllOS", содержащий необходимое программное обеспечение для установки.

2. Запустите сценарий оболочки и по желанию установите документацию, лицензию и оставшиеся приложения в надлежащем порядке, как описано в Руководстве по установке .

Токены лицензирования Abaqus — возможности для снижения затрат

Лицензирование Abaqus основано на токенах и является достаточно гибким для пользователей. Число токенов рассчитывается исходя из числа ядер CPU, использованных для прогона симуляции. Abaqus использует следующую формулу, чтобы определить количество токенов. По этой формуле, N - число ядер CPU.

На приведенном ниже графике показано, как количество токенов лицензирования Abaqus увеличивается с увеличением количества ядер.

Число токенов лицензирования Abaqus увеличивается с увеличением числа ядер.

Синяя кривая отображает моделирование только на CPU, зеленая - на CPU+GPU. На графике видно, как увеличивается число требуемых токенов по мере увеличения числа ядер CPU. При включении GPU в симуляцию он рассматривается как одно ядро CPU для расчета необходимого числа токенов. Подобный способ подсчета GPU продемонстрирован зеленой кривой с указанием соотвествующего числа CPU и GPU на горизонтальной оси.

Экономическое преимущество использования GPU для моделирования иллюстрируется двумя наборами вычислительных конфигураций, обозначенных пунктирными линиями
на Рисунке:

  • Первая пунктирная линия на отметке, обозначающей 8 ядер, на оси Х, указывает, что для 8 ядер процессора требуется 12 токенов. Если в прогон симуляции включен GPU, число ядер CPU равно 9, но количество токенов остается равным 12, как показано одиночной красной точкой.
  • Вторая пунктирная линия, показанная на отметке, обозначающей 16 ядер, на оси Х, указывает, что для 16 ядер процессора требуется 16 токенов. Добавление 1 или 2 GPU к 16 ядрам CPU увеличивает количество ядер до 17 или 18 соответственно, но количество токенов остается равным 16, как показано парой красных точек.

Кривая на графике доказывает, что использование большего числа ядер экономически более эффективно. И эта выгода растет при использовании GPU вместо ядер CPU.

Запуск задач

Для запуска симуляций Abaqus на GPU в командную строку необходимо включить флаг -gpus. Начиная с версии 6.14, функция разделения DMP (DMP и SMP) может сочетаться с ускорением на GPU при добавлении флага -threads или -mp_host_split с флагом -gpus.

$Abaqus_2017 -interactive -j $job_name -inp $input_file_name -cpus $no_of_cpu_cores -gpus
$no_of_gpus_per_dmp -mp_host_split $no_of_dmp_per_node >& $output_file

Флаги и функции

1. –cpus: указывает число ядер CPU на задачу.

2. –gpus указывает число GPU на один процесс DMP.

3. –mp_host_split: указывает число dmp-процессов на узел.

4. –thread: этот флаг может быть использован вместо -mp_host_split. Он указывает число потоков на один dmp-процесс.

Начиная с версии Abaqus 2016 года, больше нет необходимости переводить GPU в эксклюзивный режим. Тем не менее мы рекомендуем всегда проверять, не превышена ли нагрузка на GPU при выполнении нескольких задач Abaqus. Если это произошло, переведите GPU в эксклюзивный режим, чтобы процессы DMP переводились на отдельные GPU. GPU переводятся в эксклюзивный режим при помощи следующей команды nvidia-smi:

$nvidia-smi -c 3

На машине, оснащенной двумя CPU создайте два процесса DMP и используйте два GPU - по одному GPU для каждого процесса DMP.

Кроме того, поместите локальный файл abaqus_v6.env со следующим содержимым в каталог project / run, чтобы переопределить и указать дополнительные команды для повышения производительности.

# Overwrite files without questions
ask_delete=OFF
# Modify the Host List based on the number of Compute Nodes Used and
specify the CPU cores per node accordingly
# Set mpi CPU affinity mode at socket granularity
mp_mpirun_options = “-prot -aff:automatic:bandwidth:socket”
import os
os.environ['ABA_SRM_BALANCED']='ON'

Тесты производительности

Каждая графическая карта Tesla P100 имеет один GPU с архитектурой Pascal, каждая графическая карта Tesla K80 имеет два GPU с архитектурой Kepler. Прогоны выполнялись с использованием разных командных строк/env для разных версий Abaqus. Подробнее о ноастройках env и других конфгурациях читайте в статье о вычислениях Abaqus на NVIDIA GPU.

Производительность Abaqus/Standard 2017 на системах, оснащенных CPU и NVIDIA GPU

Рекомендованные системные конфигурации

Конфигурация аппаратного обеспечения

Workstation

Parameter
Specs

CPU Architecture

x86

System Memory

48 GB or more

Disk

Minimum 500 GB

CPUs

2 CPU sockets (8+ cores, 2+ GHz)

GPU Model

Quadro GP100 for double precision compute

GPUs

1

Servers

Parameter
Specs

CPU Architecture

x86

System Memory

96-192GB

CPUs/Nodes

2 (8+ cores, 2+ GHz)

Total # of Nodes

1-10+

GPU Model

Tesla P100

GPUs/Node

1

Interconnect

Infiniband

Соберите свою идеальную систему прямо сегодня.