Architectures de référence d'entreprise de NVIDIA

Architectures de référence d'entreprise

Concevez des usines d’IA évolutives

Transformez votre Data Center en usine d’IA à hautes performances avec les architectures de référence d'entreprise de NVIDIA.

Aperçu

Les éléments-clés pour faire fructifier votre initiative d'IA

Les architectures de référence d'entreprise de NVIDIA permettent aux entreprises de concevoir, déployer et faire évoluer desusines d'IA à hautes performances en utilisant une infrastructure validée et réplicable. Ces modèles combinent des outils de calcul certifiés, d'observabilité et de mise en réseau est-ouest à haute vitesse afin d'assurer des performances évolutives, pour les petits clusters à quatre nœuds comme pour les environnements d'entreprise à grande échelle.

Transformez les Data Centers en usines intelligentes

Transformez votre Data Center traditionnel en usine d’IA grâce aux technologies de calcul et de mise en réseau certifiées par NVIDIA, mais aussi aux solutions de stockage certifiées par nos partenaires. Cette plateforme est conçue pour un déploiement rapide et des performances réplicables.

Conception éprouvée / Performance validée

Conçues à partir de déploiements réels et de configurations éprouvées, les architectures de référence d'entreprise simplifient la planification et maximisent le retour sur investissement pour une infrastructure d'IA évolutive.

Architectures de référence d'entreprise

Votre guide pour la gamme complète

Découvrez une suite exhaustive d'instructions pour la configuration de clusters au sein de votre Data center.

Infrastructure

Les architectures de référence d’entreprise de NVIDIA s'appuient sur des configurations matérielles validées, notamment des modèles de nœuds de mise en réseau CPU-GPU, des diagrammes de câblage et des détails sur l’infrastructure.

* Recherchez l’approbation "Infrastructure" sur les modèles de nos partenaires basés sur les architectures de référence d'entreprise de NVIDIA.

Logique de réseau

Le Guide de configuration réseau et d'architecture logique pour les architectures de référence d'entreprise détaille des instructions pour la gestion et le provisionnement des nœuds via la conception de VLAN et la simulation de réseau sur NVIDIA Air.

* Recherchez l’approbation "Logique de réseau" sur les modèles de nos partenaires basés sur les architectures de référence d'entreprise de NVIDIA.

Logiciels

Notre pile de référence logicielle pour les architectures de référence d'entreprise détaille le processus de gestion, de provisionnement et de dimensionnement des piles logicielles pour les architectures de référence d'entreprise. Les versions actuelles se concentrent sur la version Kubernetes Vanilla en utilisant BCM pour déployer le cluster, NVIDIA AI Enterpriseet Kubernetes Vanilla avec Run:ai.

* Recherchez l’approbation "Logiciels" sur les modèles de nos partenaires basés sur les architectures de référence d'entreprise de NVIDIA.

Observabilité

Le Guide d'observabilité pour les architectures de référence d'entreprise utilise des outils open-source, tels que Prometheus et Grafana, pour superviser les performances des GPU et du réseau sur l'ensemble du cluster. Les tableaux de bord fournissent des indicateurs en temps réel sur l'état du système et l'efficacité de la charge de travail.

Déploiement

Le Guide de déploiement pour les architectures de référence d'entreprise est un recueil des bonnes pratiques en matière d'infrastructure que notre équipe a apprises en mettant en place, en déployant, en testant et en validant les clusters internes sur lesquels nous avons bâti notre programme.

Stockage

Le programme de systèmes de stockage NVIDIA certifiés fait appel à un travail commun de partenaires sélectionnés qui ont créé des guides de stockage conçus pour s'intégrer aux architectures de référence pour les entreprises.

Pour en savoir plus sur ce programme unique, cliquez ici.

Cas d'utilisation

Des architectures pour chaque cas d'utilisation

Accélérez les charges de travail d'IA agentique, d'IA physique, de HPC et de simulation d'IA avec des architectures de référence d'entreprise éprouvées.

Accélération universelle pour les entreprises

Accélérez une large gamme de charges de travail d'entreprise, notamment l'IA industrielle et de perception, le calcul haute performance, l'analyse de données, l'informatique visuelle, l'IA générative et l'IA agentique, sur une plateforme polyvalente et unique. C'est l'idéal pour les entreprises désireuses de moderniser leur infrastructure et d'améliorer leurs performances pour des tâches primordiales.

Pour les déploiements de serveurs NVIDIA RTX PRO, les points de conception disponibles sont centrés sur des configurations à 16 et 32 nœuds idéales pour les charges de travail d’IA générative et de visualisation à moyenne échelle, qui permettent de trouver le juste équilibre entre performances, évolutivité et efficacité du déploiement. Associée à la plateforme NVIDIA Spectrum-X™ pour la mise en réseau, cette configuration offre des performances d'interconnexion optimisées spécifiquement adaptées aux applications d'IA exigeantes.

Performances optimisées par l'IA

Cette architecture de référence d'entreprise à hautes performances est spécialement conçue pour l'entraînement et l'inférence d'IA multi-nœuds à grande échelle puisqu'elle tire parti des systèmes NVIDIA HGX à 8 GPU certifiés avec des GPU NVIDIA Hopper ou Blackwell. Les systèmes peuvent évoluer d'une unité à 4 nœuds (32 GPU) à 128 nœuds (1 024 GPU), avec un potentiel de clusters encore plus importants en fonction des besoins des clients.

Les points de conception disponibles sont centrés sur des configurations de 32, 64 et 128 nœuds, prises en charge par la mise en réseau NVIDIA Spectrum-X et une conception flexible et optimisée pour les rails, qui s'adapte facilement à diverses dispositions de rack.

Performances Exascale

Entraînez et déployez les plus grands modèles de fondation et de langage avec une puissance de calcul Exascale au sein d'un seul rack. Cette technologie est conçue pour un débit maximal de modèles, une inférence multi-utilisateurs et un raisonnement en temps réel à grande échelle, permettant l'avenir de l'innovation axée sur l'IA.

Les points de conception disponibles de NVIDIA GB200 NVL72 se concentrent sur des configurations de 4 et 8 racks. Conçue autour d'un réseau flexible et optimisé pour les rails, l'architecture prend en charge différentes dispositions de rack et configurations de système.

Avantages

La valeur stratégique des architectures de référence d'entreprise

Mettez en œuvre une infrastructure d'IA évolutive et performante avec des configurations éprouvées disponibles via notre réseau de partenaires.

Performances de pointe pour les charges de travail d'IA

Conçues pour répondre aux exigences intensives d'entraînement, de réglage fin et d’inférence, ces architectures garantissent une utilisation exhaustive du GPU et une véritable constance des performances sur les clusters multi-nœuds.

Évolutivité flexible, opérations simplifiées

Développez facilement votre infrastructure grâce à des conceptions de référence optimisées pour un maximum de 128 nœuds, conçues pour prendre en charge des solutions Full-Stack telles que la conception validée par NVIDIA pour les usines d'IAen vue d'assurer un déploiement évolutif et rationalisé.

Réduisez la complexité et les coûts

Simplifiez les processus de déploiement et rationalisez vos modèles tout en réduisant la complexité et le coût total de possession (TCO), mais aussi les délais de tokenisation.

Maintenance

Suivez des modèles de conception normalisés spécifiques pour assurer un fonctionnement cohérent d'une installation à l'autre, réduire les besoins d'assistance fréquents et raccourcir les délais de résolution des problèmes.

Partenaires

Partenaires pour la performance

Nous sommes fiers de collaborer avec des partenaires de premier plan qui proposent des architectures de référence d'entreprise et des solutions d'usine d'IA sur le marché. Les conceptions de ces partenaires ont été approuvées par notre commission d'examen des conceptions (DRB) car elles offrent des conseils qui méritent notre approbation dans une ou plusieurs des catégories suivantes : Infrastructure, Logique de réseau et Logiciels.

Ressources

Plus d'informations sur les architectures de référence d'entreprise

Déploiement à grande échelle de NVIDIA H200 NVL avec la nouvelle architecture de référence d'entreprise

Découvrez comment l'architecture NVIDIA H200 NVL accélère le déploiement de l’IA grâce à une mémoire améliorée, à NVLink haute vitesse et à une configuration d'architecture de référence d’entreprise optimisée.

Simplifiez la gestion de la mémoire système avec la nouvelle architecture de référence NVIDIA GH200 NVL2 Enterprise

Découvrez comment l'architecture de référence NVIDIA GH200 NVL2 Enterprise simplifie la gestion de la mémoire système et accélère le développement de l'IA.

Une nouvelle ère d’usines d’IA : NVIDIA dévoile des architectures de référence d'entreprise

Les entreprises mondiales peuvent désormais tirer parti de nouvelles architectures de référence pour construire des Data Centers à la fois performants, évolutifs et sécurisés.

Le programme NVIDIA certifié s’étend au stockage d’entreprise pour un déploiement d’usines d'IA plus rapide

Découvrez comment le stockage NVIDIA certifié permet des déploiements d'usines d’IA plus rapides et plus fiables en validant les systèmes de stockage d’entreprise pour des performances et une intégration évolutive de l’IA.

Une nouvelle ère d’usines d’IA

Découvrez comment les architectures de référence d'entreprise de NVIDIA favorisent une nouvelle ère d’usines d’IA.

Les nouveautés de la certification NVIDIA

Participez à ce webinaire mondial sur la certification NVIDIA pour entendre des experts, des créateurs d’examens et des professionnels certifiés expliquer comment la certification de compétences NVIDIA peut accélérer les carrières et avoir un impact sur les entreprises.

Étapes suivantes

Vous voulez vous lancer ?

Obtenez plus d’informations sur l'usine d'IA d'entreprise de NVIDIA.

Livre blanc sur NVIDIA ERA

Découvrez comment les architectures de référence d'entreprise de NVIDIA fournissent des modèles évolutifs et prescriptifs pour le déploiement d’une infrastructure d’IA à hautes performances.

Spécifications de la configuration du serveur 2-8-5-200

Spécifications de la configuration du serveur 2-8-9-400

Spécifications de la configuration du serveur 2-4-6-400