Инференс — это выводы обученной нейронной сети для конкретных примеров. Так как новые данные поступают в модель в виде изображений, речи, поисковых запросов по изображениям и видео, именно инференс позволяет находить ответы и давать рекомендации, что лежит в основе большинства сервисов ИИ. Сервер, оснащенный одним графическим ускорителем NVIDIA, обеспечивает в 27 раз более высокую производительность в задачах инференса, чем сервер на основе CPU, что приводит к значительному снижению затрат на инфраструктуру дата-центра.