Calcul intensif et natif dans le Cloud

Performances d’IA et de HPC incomparables avec
une isolation multi-nœuds et une sécurité accrue.

Performances Bare-Metal et isolation multi-utilisateurs

Le calcul intensif et natif dans le Cloud allie la puissance du calcul haute performance à la sécurité et à la facilité d’utilisation des services de Cloud Computing. La plateforme de calcul intensif et natif dans le Cloud de NVIDIA tire parti de l’architecture NVIDIA® BlueField ® de processeur de traitement des données (DPU), dotée de la technologie NVIDIA® Mellanox® de mise en réseau InfiniBand à haute vitesse et faible latence, pour fournir de manière simple et sécurisée des services d’IA et de HPC incluant des performances Bare-Metal, la gestion et l’isolation des utilisateurs, ainsi que la protection des données.

Innovation pour la prochaine décennie et au-delà

Plateforme de calcul intensif et natif dans le Cloud

Pour offrir des performances maximales, les supercalculateurs doivent inclure une sécurité multi-utilisateurs, idéalement via des plateformes natives dans le Cloud. L’élément clé permettant cette transition d’architecture est le DPU. 

En tant que plateforme de Data Center sur une puce entièrement intégrée, le DPU peut prendre en charge et gérer l’infrastructure du Data Center en lieu et place du processeur hôte, optimisant ainsi la sécurité et l’orchestration du supercalculateur. 

Combinée à la commutation reposant sur NVIDIA Mellanox® InfiniBand, cette architecture garantit des performances Bare-Metal optimales, tout en prenant en charge l’isolation multi-nœuds des utilisateurs en natif.

Cloud-Native Supercomputing Platform
Toward a Zero-Trust Architecture

Vers une architecture Zero-Trust

Les systèmes de calcul intensif et natif dans le Cloud sont conçus pour proposer des performances, une sécurité et une orchestration maximales dans un environnement multi-utilisateurs.

Le DPU BlueField peut héberger des utilisateurs multi-nœuds non certifiés tout en garantissant que les ressources de calcul intensif sont traitées de manière segmentée, indépendamment des nouveaux utilisateurs ou des utilisations antérieures. Pour ce faire, le DPU BlueField garantit un système de redémarrage intégral à tout nouvel utilisateur, effectue un nettoyage complet et une opération de rétablissement de confiance, virtualise l’espace de stockage et fournit un accès aux zones de stockage approuvées.

Accélération des performances d’applications

Les frameworks et les bibliothèques de communication HPC et IA sont sensibles à la latence et à la bande passante, et ils jouent un rôle essentiel dans la mise en œuvre de performances d’applications optimales.

La prise en charge des bibliothèques du CPU ou du GPU hôte par le DPU Bluefield crée le plus haut degré de superposition pour une progression parallèle de la communication et du calcul. Elle réduit également les effets néfastes de saccade du système d’exploitation et augmente considérablement la performance des applications. Cette fluidité accélère l’avènement d’une architecture de calcul intensif de nouvelle génération. 

Les premiers résultats des recherches menées par l’Université d’État de l’Ohio démontrent que les supercalculateurs natifs dans le Cloud peuvent effectuer des  opérations de HPC 1,4 fois plus rapidement que les supercalculateurs traditionnels.

DPU Provides 1.4X Higher Performance Acceleration for P3DFFT

HPC and AI communication frameworks

Plateforme de calcul intensif et natif dans le Cloud

NVIDIA BlueField

Le DPU NIVIDIA BluField combine les adaptateurs réseau ConnectX® à la pointe de l’industrie,  une série de cœurs ARM avec un sous-système PCIe et des moteurs d’accélération matérielle spécialement optimisés pour fournir une infrastructure de Data Center sur une puce hautement programmable.

InfiniBand

Les solutions de mise en réseau NVIDIA InfiniBand accélèrent et optimisent les transferts de données pour garantir que les ressources de calcul ne deviennent pas trop lourdes en raison d’un problème d’accès aux données ou d’une bande passante réduite. Le réseau InfiniBand peut être divisé entre différents utilisateurs ou entités, ce qui garantit une sécurité et une qualité de service (QoS) élevées.

DOCA

Le kit de développement NVIDIA DOCA, qui tire parti des API standard de l’industrie, permet aux développeurs d’infrastructure de créer rapidement des applications et des services pour le réseau, le stockage, la sécurité et la gestion, mais aussi pour l’IA et le HPC reposant sur les performances exceptionnelles du DPU NVIDIA BlueField. Avec DOCA, les développeurs peuvent programmer l’infrastructure de calcul intensif de demain en créant des services accélérés par DPU à hautes performances, définis par logiciel et natifs dans le Cloud.

Magnum IO

Le kit de développement logiciel NVIDIA MAGNUM IO™ permet aux développeurs d’optimiser le système d’E/S dans les applications, réduisant ainsi le délai d’exécution de bout en bout de leurs workflows.

Magnum IO couvre tous les aspects de l’E/S, y compris le stockage, la mise en réseau, les systèmes multi-GPU et les communications multi-nœuds. Ce kit de développement comprend également des outils dédiés pour profiler et régler les applications, mais aussi pour éliminer les problèmes d’E/S.

Principales caractéristiques

  • Isolation multi-utilisateurs, protection des données et sécurité
  • Déchargement des services d’infrastructure
  • Moteurs matériels dédiés à l’accélération des frameworks de communication
  • Amélioration de la qualité de service (QoS)

Avantages

  • Offre des performances Bare-Metal optimales
  • Augmente la disponibilité du CPU, l’évolutivité des applications et l’efficacité du système
  • Haut degré de superposition pour le calcul et la communication
  • Réduction des saccades et du bruit du système
  • Réduction des coûts d’infrastructure

Consultez notre dossier technique pour en apprendre davantage sur le calcul intensif et natif dans le Cloud.