NVIDIA CUDA-X

Les bibliothèques accélérées par GPU NVIDIA alimentent les plateformes d'IA et de calcul accéléré les plus avancées au monde.

Aperçu
Bibliothèques
Études de cas

Aperçu
Bibliothèques
Études de cas

De l'IA générative et de l'analyse des données à la chimie quantique et à la modélisation climatique, les applications révolutionnaires nécessitent une immense puissance de calcul. Bien que la programmation parallèle puisse être extrêmement complexe, les bibliothèques NVIDIA CUDA-X™ éliminent les obstacles à l'optimisation au niveau matériel.

Basées sur la plateforme CUDA® éprouvée en production et sur ses deux décennies de leadership en matière de calcul, les bibliothèques hautement optimisées de CUDA-X fournissent les algorithmes de base et les routines de calcul essentielles dont les développeurs ont besoin pour créer, déployer et faire évoluer facilement leurs charges de travail.

En transférant la complexité de la programmation GPU de bas niveau vers des bibliothèques "drop-in", CUDA-X fournit un moteur évolutif qui permet de générer des gains de performances continus dans tous les principaux secteurs.

BIBLIOTHÈQUES

Passez à la vitesse supérieure avec CUDA-X

Qu'il s'agisse de créer de nouveaux pipelines ou d'accélérer ceux qui existent déjà, les équipes peuvent tirer parti des centaines de bibliothèques de CUDA-X pour optimiser, déployer et faire évoluer facilement les charges de travail dans les domaines du traitement des données, de l'IA, du Deep Learning, de l'informatique quantique, du calcul haute performance (HPC), des sciences physiques et bien plus encore, afin d'optimiser instantanément l'efficacité du matériel et de mettre à jour en continu les performances du système.

Bibliothèques mathématiques CUDA

La base du HPC et de l'IA : permet de gérer les tâches de calcul lourdes telles que l'imagerie médicale et les simulations de fluides.
Accélération directe : fournit des vitesses GPU instantanées, sans avoir à réécrire le code de l'application de base.
Évolutivité et polyvalence : combine les bibliothèques mathématiques de base, notamment l'algèbre linéaire et les solveurs accélérés, avec des API Python hautes performances qui évoluent d'une station de travail à un supercalculateur.

Bibliothèques de calcul scientifique

Découverte accélérée : elle soutient les recherches révolutionnaires dans les domaines des structures moléculaires, de la chimie quantique et des matériaux avancés.
Production de nouvelle génération : optimise la conception de semi-conducteurs et la lithographie computationnelle accélérée par GPU.
IA spécifique à un domaine : inclut des outils tels que les bibliothèques Python et les microservices NVIDIA NIM™ pour les réseaux de neurones basés sur la physique.

Bibliothèques pour la physique

Simulations plus rapides : fournit une accélération GPU à haute vitesse dans les domaines du calcul, du quantique et de la multiphysique.
IA basée sur la physique : intègre des frameworks tels que NVIDIA PhysicsNeMo™ et Warp pour créer, entraîner et faire évoluer des modèles de simulation d'IA.
Modélisation météorologique mondiale : permet d'accéder à des modèles météorologiques de niveau professionnel et à une IA climatique grâce à NVIDIA Earth-2.

Bibliothèques d'informatique quantique

Simulations plus rapides : fournit des routines hautement optimisées pour accélérer les simulations d'informatique quantique et l'intégration HPC.
Workflows sécurisés : intègre cuPQC pour accélérer et optimiser la cryptographie post-quantique de nouvelle génération.
Optimisation hybride et correction des erreurs : fournit des solveurs avancés accélérés par GPU et des bibliothèques de réduction des erreurs pour les algorithmes hybrides quantique-classiques.

Bibliothèques de base du Deep Learning

Réseaux de neurones centraux : alimentent les applications de Deep Learning avec des modules de construction optimisés via cuDNN™.
Optimisation de l'inférence : offre des performances maximales en matière de déploiement de production à l'aide de NVIDIA TensorRT™ et de TensorRT-LLM.
Création de noyaux personnalisés : fournit des modèles modulaires tels que CUTLASS et FlashInfer pour maximiser l'efficacité des cœurs Tensor.

Bibliothèques d'algorithmes parallèles

Code GPU de haut niveau : fournit de puissants algorithmes parallèles basés sur la bibliothèque de modèles standard (STL) C++ via Thrust pour simplifier l'accélération GPU.
Efficacité du matériel bas niveau : fournit des primitives collectives via CUB pour un contrôle précis de l'exécution au niveau des warps, des blocs et de l'appareil.
Python et optimisation de l'architecture : intègre des interfaces Python natives et des primitives distribuées standardisées pour optimiser les modèles de tri, d'analyse et de réduction.

Bibliothèques de traitement des données

Accélération Zero-Code : permet d'accélérer les workflows de données tabulaires et d'apprentissage automatique existants dans pandas, Polars, scikit-learn et Apache Spark sans modification du code.
Mise à l'échelle et analyse de graphes : analyse des graphes à grande échelle, recherche vectorielle et optimisation des décisions complexes à l'aide de moteurs tels que cuGraph, cuVS et cuOpt™.
Efficacité du pipeline et du stockage : maximise le débit de données pour la cybersécurité, la curation de l'IA générative et les transferts de stockage via NVIDIA Morpheus, NeMo™ Curator et GPUDirect® Storage.

Bibliothèques d'images et de vidéos

Codecs à haut débit : accélère l'encodage et le décodage des vidéos ainsi que le suivi des mouvements des pixels via des SDK matériels dédiés.
Traitement du pipeline d'IA : accélère le chargement des données ainsi que le pré-traitement et le post-traitement des charges de travail d'IA de vision à l'aide de NVIDIA® DALI® et de CV-CUDA™.
Manipulation avancée des images : optimise le traitement des signaux 2D et les jeux de données multidimensionnels massifs pour les applications biomédicales et géospatiales.

Bibliothèques de communication

Primitives d'architecture à grande échelle : maximise la bande passante et maintient une faible latence pour une communication multi-GPU et multi-nœuds rapide via la bibliothèque de communications collectives NVIDIA (NCCL).
Espaces mémoire globaux : fournit un espace d'adressage global partitionné sur les mémoires GPU en clusters à l'aide du modèle NVSHMEM.
Transfert d'inférence à faible latence : permet de déplacer efficacement le cache KV et les tenseurs entre les GPU, les niveaux de stockage et de mémoire via la bibliothèque de transfert d'inférence NVIDIA (NIXL).

Études de cas

Impact concret

Découvrez comment les principales entreprises utilisent les bibliothèques NVIDIA CUDA-X pour résoudre les défis les plus complexes au monde en matière de calcul, d'ingénierie et d'IA.

Consulter d'autres études de cas

FAQ sur NVIDIA CUDA-X

Adresse

Matériel (minimum et recommandé)
Coûts / TCO / Tokenomique
Pourquoi la pile ou un produit ou une solution NVIDIA
Comment l'utiliser ou en savoir plus
Définir les termes et les acronymes
par rapport aux requêtes