Calcul intensif et natif dans le Cloud

Performances Bare-Metal mutualisées et sécurisées pour l’IA, l’analyse de données et les applications HPC

Performances Bare-Metal et isolation multi-utilisateurs

Le calcul intensif dans le Cloud allie la puissance du calcul haute performance à la sécurité et à la facilité d’utilisation des services de Cloud Computing. La plateforme de calcul intensif et natif dans le Cloud de NVIDIA tire parti de l’architecture NVIDIA® BlueField® de processeur de traitement des données (DPU), dotée de la technologie NVIDIA Quantum InfiniBand de mise en réseau à haute vitesse et faible latence, pour fournir de manière simple et sécurisée des services d’IA et de HPC incluant des performances Bare-Metal, la gestion et l’isolation des utilisateurs, ainsi que la protection des données.  

Innovation pour la prochaine décennie et au-delà

Plateforme de calcul intensif et natif dans le Cloud

Pour offrir des performances maximales, les supercalculateurs doivent inclure une sécurité multi-utilisateurs, idéalement via des plateformes natives dans le Cloud. L’élément clé permettant cette transition d’architecture est le DPU. 

En tant que plateforme de Data Center sur une puce entièrement intégrée, le DPU peut prendre en charge et gérer l’infrastructure du Data Center en lieu et place du processeur hôte, optimisant ainsi la sécurité et l’orchestration du supercalculateur. 

Combinée à la commutation reposant sur NVIDIA Quantum InfiniBand, cette architecture garantit des performances Bare-Metal optimales, tout en prenant en charge l’isolation multi-nœuds des utilisateurs en natif.  

Plateforme de calcul intensif et natif dans le Cloud
Vers une architecture Zero-Trust

Vers une architecture Zero-Trust

Les systèmes de calcul intensif et natif dans le Cloud sont conçus pour proposer des performances, une sécurité et une orchestration maximales dans un environnement multi-utilisateurs.

Le DPU BlueField peut héberger des utilisateurs multi-nœuds non certifiés tout en garantissant que les ressources de calcul intensif sont traitées de manière segmentée, indépendamment des nouveaux utilisateurs ou des utilisations antérieures. Pour ce faire, le DPU BlueField garantit un système de redémarrage intégral à tout nouvel utilisateur, effectue un nettoyage complet et une opération de rétablissement de confiance, virtualise l’espace de stockage et fournit un accès aux zones de stockage approuvées.

Accélération des performances d’applications

Les frameworks et les bibliothèques de communication HPC et IA sont sensibles à la latence et à la bande passante, et ils jouent un rôle essentiel dans la mise en œuvre de performances d’applications optimales.

La prise en charge des bibliothèques du CPU ou du GPU hôte par le DPU Bluefield crée le plus haut degré de superposition pour une progression parallèle de la communication et du calcul. Elle réduit également les effets néfastes de saccade du système d’exploitation et augmente considérablement la performance des applications. Cette fluidité accélère l’avènement d’une architecture de calcul intensif de nouvelle génération. 

Les premiers résultats des recherches menées par l’Université d’État de l’Ohio démontrent que les supercalculateurs natifs dans le Cloud peuvent effectuer des  opérations de HPC 1,3 fois plus rapidement que les supercalculateurs traditionnels.

Les DPU offrent une accélération des performances 1,3 fois plus élevée pour P3DFFT

Frameworks de communication pour le HPC et l’IA
Les supercalculateurs natifs dans le Cloud de NVIDIA offrent des performances Bare-Metal

Isolation des performances

La plateforme NVIDIA Quantum-2 InfiniBand fournit des capacités de surveillance proactive et de gestion de la congestion pour l’isolation du trafic réseau, ce qui contribue à minimiser les chutes de performance et à garantir des performances prédictives comme si l’application était exécutée sur un système dédié.

Plateforme de calcul intensif et natif dans le Cloud

NVIDIA BlueField

Le DPU NIVIDIA BluField combine les adaptateurs réseau ConnectX® à la pointe de l’industrie,  une série de cœurs ARM avec un sous-système PCIe et des moteurs d’accélération matérielle spécialement optimisés pour fournir une infrastructure de Data Center sur une puce hautement programmable.

InfiniBand

Les solutions de mise en réseau NVIDIA Quantum InfiniBand accélèrent et optimisent les transferts de données pour garantir que les ressources de calcul ne deviennent pas trop lourdes en raison d’un problème d’accès aux données ou d’une bande passante réduite. Le réseau NVIDIA Quantum InfiniBand peut être divisé entre différents utilisateurs ou entités, ce qui garantit une sécurité et une qualité de service (QoS) élevées.

DOCA

Le kit de développement NVIDIA DOCA, qui tire parti des API standard de l’industrie, permet aux développeurs d’infrastructure de créer rapidement des applications et des services pour le réseau, le stockage, la sécurité et la gestion, mais aussi pour l’IA et le HPC reposant sur les performances exceptionnelles du DPU NVIDIA BlueField. Avec DOCA, les développeurs peuvent programmer l’infrastructure de calcul intensif de demain en créant des services accélérés par DPU à hautes performances, définis par logiciel et natifs dans le Cloud.

Magnum IO

Le kit de développement logiciel NVIDIA MAGNUM IO™ permet aux développeurs d’optimiser le système d’E/S dans les applications, réduisant ainsi le délai d’exécution de bout en bout de leurs workflows.

Magnum IO couvre tous les aspects de l’E/S, y compris le stockage, la mise en réseau, les systèmes multi-GPU et les communications multi-nœuds. Ce kit de développement comprend également des outils dédiés pour profiler et régler les applications, mais aussi pour éliminer les problèmes d’E/S.

Fonctionnalités-clés

  • Isolation multi-utilisateurs, protection des données et sécurité
  • Déchargement des services d’infrastructure
  • Moteurs matériels dédiés à l’accélération des frameworks de communication
  • Amélioration de la qualité de service (QoS)

Avantages

  • Offre des performances Bare-Metal optimales
  • Augmente la disponibilité du CPU, l’évolutivité des applications et l’efficacité du système
  • Haut degré de superposition pour le calcul et la communication
  • Réduction des saccades et du bruit du système
  • Réduction des coûts d’infrastructure

Consultez notre dossier technique pour en apprendre davantage sur le calcul intensif et natif dans le Cloud.