Calcul accéléré en temps réel pour tous les processeurs quantiques.
Aperçu
L'architecture de la plateforme ouverte NVIDIA NVQLink intègre étroitement le matériel quantique à un calcul accéléré de pointe pour alimenter le développement d'unités de traitement quantique (QPU) à grande échelle. Grâce aux API en temps réel de la plateforme logicielle NVIDIA CUDA-Q, les chercheurs peuvent facilement exploiter NVQLink pour les connexions à faible latence et à haut débit dont ils ont besoin pour effectuer des tâches de contrôle telles que l'étalonnage et la correction d'erreurs quantiques (QEC). Les QPU équipés de NVQLink permettent aux opérateurs de QPU d'unifier les ressources de calcul quantique et accélérées pour développer des applications quantiques hybrides.
L'API en temps réel de CUDA-Q permet aux développeurs de tirer parti de la connexion à faible latence et à haut débit de NVQLink au matériel quantique. Un simple appel d'API de fonction distante dans le modèle de programmation basé sur le noyau de CUDA-Q permet d'accélérer facilement des applications hybrides et de développer des workflows QEC évolutifs.
Rigetti Computing
Points-clés
1 Avec parcimonie.
Charges de travail
Accélérer le workflow quantique, de l'étalonnage à la tolérance aux pannes.
Avantages
NVQLink et CUDA-Q proposent une plateforme pour des applications quantiques avec correction d'erreurs.
Développez et déployez des applications avec correction d'erreurs sur votre QPU à l'aide des bibliothèques extensibles CUDA-Q pour QEC et bien plus encore.
Travaillez avec tous les principaux contrôleurs quantiques et modalités de processeurs quantiques.
Transférez des centaines de gigaoctets de données par seconde (Go/s) entre le contrôleur quantique et l'hôte de calcul grâce au réseau le plus évolutif et à la plus faible latence de l'industrie.
Rejoignez un écosystème logiciel en croissance rapide pour un supercalcul quantique accéléré.
Fournisseurs
Ressources
NVQLink est une architecture de plateforme qui permet d'associer étroitement un serveur accéléré par GPU à une unité de traitement quantique (QPU).
NVQLink répond à deux besoins :
Les éléments suivants définissent l'architecture NVQLink :
La validation d'un système NVQLink est effectuée par une fonction de bibliothèque cudaq-realtime qui mesure la latence aller-retour d'un rappel QSC-Host. L'implémentation reconnue de ce benchmark est fournie dans le dépôt open source CUDA-Q et exerce les fonctionnalités de base de cudaq-realtime. Étant donné que cudaq-realtime est la méthode prise en charge pour créer des applications en temps réel sur NVQLink, son API est une condition préalable à la compatibilité NVQLink.
Les utilisateurs de NVQLink sont libres de choisir parmi de nombreuses options pour l'hôte en temps réel, le contrôleur de système Quantum et le réseau en temps réel. NVIDIA fournit une implémentation de référence pour le réseau en temps réel, et les architectures réseau tierces sont compatibles si elles prennent en charge la bibliothèque cudaq-realtime.
L'architecture de référence pour le réseau NVQLink est basée sur une forme d'Ethernet à ultra-hautes performances et largement répandue appelée RoCE et comprend les éléments suivants :
Commutateur Spectrum-X (en option) : si nécessaire, un commutateur Ethernet pour étendre le radix du réseau et agréger les données vers l'hôte en temps réel à partir de nombreux points du QSC.
Il existe de nombreux types de QPU, ainsi que diverses fonctions que les constructeurs et les utilisateurs de QPU peuvent souhaiter décharger vers l'hôte en temps réel, avec des exigences très différentes en matière de temps de réponse. Pour cette raison, nous ne prescrivons pas de valeur de latence spécifique.
NVQLink définit une référence commune en open source pour garantir que tous les systèmes compatibles offrent une latence réseau transparente et reproductible, permettant aux utilisateurs de sélectionner la solution la mieux adaptée à leurs besoins.
Dans le contexte de NVQLink, l'hôte en temps réel est destiné à effectuer des calculs pour lesquels la latence est cruciale afin de prendre en charge la correction des erreurs quantiques (QEC) et l'auto-étalonnage en ligne du QPU. Ces charges de travail requièrent une latence comprise entre quelques millisecondes et quelques microsecondes sur différents types de QPU, quel que soit le type de QPU utilisé. Elles sont essentielles pour optimiser les performances et la disponibilité des QPU.
Les hôtes NVQLink en temps réel sont disponibles auprès de nos partenaires, qui peuvent chacun proposer leurs propres offres différenciées. Demandez à votre fournisseur quelle latence en temps réel CUDA-Q il prend en charge.
La création d'un hôte en temps réel nécessite également la prise en charge du QSC connecté. Veuillez vous assurer que votre fournisseur QSC prend en charge cette mise à niveau.
Un serveur existant compatible CUDA peut être converti en un hôte en temps réel NVQLink en veillant à ce que les composants réseau en temps réel suivants soient installés : une NIC NVIDIA ConnectX ou BlueField et cudaq-realtime (disponible après mars 2026 dans le dépôt cuda-quantum).
Un hôte en temps réel connecté à un QSC compatible est validé à l'aide du benchmark de latence de rappel en temps réel CUDA-Q.
Démarrer
Contactez les experts de NVIDIA Quantum pour en savoir plus sur NVQLink.