NVIDIA Nemotron

Modèles ouverts multimodaux à haute efficacité pour les agents d'IA pérennes.

Aperçu

Qu'est-ce que NVIDIA Nemotron ?

NVIDIA Nemotron™ est une famille de modèles d'IA ouverts, multimodaux et hautement efficaces dédiés à l'exploitation d'agents à long terme et à évolution automatique. Conçus pour accomplir rapidement les tâches qui leur sont assignées, les modèles Nemotron fournissent un débit de raisonnement élevé et une précision de pointe pour les workflows d'agents complexes.

Grâce à des données d'entraînement transparentes et à une large prise en charge des plateformes, notamment NVIDIA RTX PRO™ et NVIDIA DGX Spark™, les modèles Nemotron sont librement accessibles et intégrés à l'ensemble de l'écosystème de l'IA, ce qui permet de déployer des agents IA fiables et hautement performants partout, de l'Edge au Cloud.

Bâtissez l'avenir du travail avec les plateformes logicielles d'entreprise de NVIDIA

Découvrez comment les logiciels de NVIDIA alimentent des agents à long terme pour l'exécution de workflows complexes dans les domaines de l'ingénierie, de la santé et des opérations, tout en stimulant la productivité des employés.

Vidéo

Présentation de NVIDIA Nemotron

Écoutez Bryan Catanzaro, vice-président de la recherche appliquée en Deep Learning pour NVIDIA, qui présente la vision sur laquelle repose Nemotron et explique pourquoi les technologies ouvertes sont essentielles pour créer une IA de confiance prête pour les entreprises.

Avantages

Qu'est-ce que Nemotron apporte à l'IA agentique ?

Modèles ouverts

Les techniques d'optimisation et de données ouvertes de NVIDIA garantissent des modèles puissants, transparents et adaptables aux développeurs et aux entreprises. Les modèles et les données d'entraînement sont publiés ouvertement sur Hugging Face.

Efficacité de calcul élevée

La gamme Nemotron a été optimisée pour accomplir plus rapidement des tâches agentiques grâce à un débit plus élevé et à son architecture MoE hybride.

Précision élevée

Basés sur un corpus exceptionnel riche en connaissances, post-entraînés avec des données d'entraînement de haute qualité et alignés dans une optique d'apprentissage par renforcement, les modèles Nemotron permettent d'atteindre une précision de pointe pour l'exploitation de systèmes agentiques à long terme.

Déploiement simple et sécurisé

La gamme de modèles Nemotron, disponible sous forme de microservices NVIDIA NIM™ optimisés, offre des performances d'inférence optimales et des options de déploiement flexibles, garantissant ainsi une sécurité, une confidentialité et une portabilité supérieures.

Modèles

Des modèles pour différentes charges de travail

Les modèles Nemotron excellent dans une grande variété de tâches d'IA agentique, notamment le raisonnement, la vision multimodale, la génération augmentée par récupération (RAG), le traitement de la parole et la sécurité. Des modèles de recherche sont également disponibles à des fins d'expérimentation.

Raisonnement

Les modèles Nemotron gèrent diverses charges de travail de raisonnement. Nano offre une précision et une efficacité supérieures pour les sous-agents spécialisés, Super fournit la précision la plus élevée du marché, un raisonnement à haut débit et une capacité d'appel d'outils pour exécuter des tâches complexes sur des systèmes multi-agents, tandis qu'Ultra assure le meilleur raisonnement pour les applications critiques qui exigent une capacité maximale avec des workflows multi-étapes.

Compréhension visuelle

Les modèles multimodaux Nemotron fournissent l'efficacité la plus élevée et une précision de pointe en matière de vidéo, d'audio, d'image et de texte pour les cas d'utilisation de l'IA agentique en entreprise. Optimisés pour les sous-agents spécialisés, ils facilitent la mise en œuvre de capacités telles que les agents informatiques, l'intelligence documentaire et la compréhension vidéo et audio.

Raisonnement

Choisissez parmi une gamme de modèles de raisonnement Nemotron : Nano fournit une précision supérieure pour les PC et les appareils de périphérie, Super offre la précision et le rendement les plus élevés pour exécuter sur un seul GPU NVIDIA Tensor Core et Ultra offre la meilleure précision pour des systèmes complexes optimisés pour les Data Centers multi-GPU.

Génération augmentée par récupération

Les modèles Nemotron fournissent une compréhension rapide et précise des documents en extrayant des informations structurées multimodales, en générant des intégrations haute qualité et en hiérarchisant les documents les plus pertinents. Ils fournissent une fonction de récupération évolutive et à haute vitesse qui améliore la qualité des données pour l'entraînement de LLM, augmente les performances des agents et des récupérateurs, et simplifie les workflows de documents.

Barrières de sécurité

Les modèles NVIDIA Nemotron Safety Guard fournissent une protection en temps réel contre le contenu préjudiciable, la dérive hors sujet et les tentatives de jailbreak. Elles ajoutent une couche de sécurité au contenu multilingue, améliorant la modération et garantissant l'alignement culturel.

Technologie

Composants-clés de l'IA agentique

Commencez à développer et à optimiser des agents d'IA avec NVIDIA NeMo™ pour l'IA agentique personnalisée, avec NVIDIA NIM pour un déploiement rapide et adapté aux entreprises, et avec les modèles NVIDIA pour accélérer le développement grâce à des workflows de référence personnalisables.

NVIDIA NeMo

  • Développez, personnalisez et déployez l'IA générative et l'IA agentique.
  • Fournissez des grands modèles de langage (LLM) adaptés aux entreprises avec une curation précise des données, une personnalisation de pointe, une ingestion de données évolutive, un RAG et des performances accélérées.
  • Développez facilement des volants de données et optimisez en permanence les agents d'IA à l'aide des informations les plus récentes.

NVIDIA NIM

  • Accélérez le déploiement de modèles d'IA générative optimisés pour les performances.
  • Exécutez vos applications professionnelles à l'aide d'API stables et sécurisées, soutenues par une assistance professionnelle.

Modèles NVIDIA

  • Lancez-vous rapidement avec des applications de référence pour des cas d'utilisation de l'IA générative, tels que la recherche approfondie d'entreprise et la génération de réponses multimodales (RAG).
  • Accélérez le développement grâce à des modèles qui incluent des microservices partenaires, un ou plusieurs agents d'IA, un code de référence, une documentation pour la personnalisation et un graphique Helm pour le déploiement.

Options de démarrage

Comment démarrer avec Nemotron ?

Commencez le prototypage gratuitement

Démarrez avec des points de terminaison d'API faciles à utiliser.

  • Accédez à une infrastructure d'IA entièrement accélérée.
  • Assurez-vous que vos données ne sont pas utilisées pour l'entraînement de modèles.
  • Pas de crédits, juste un chemin simple pour développer, tester et déployer.

Exécutez Nemotron sur les fournisseurs de services d'inférence

Déployez instantanément les modèles Nemotron sur des plateformes d'inférence tierces de confiance, aucune configuration d'infrastructure n'est requise.

  • Déployez sans gérer l'infrastructure.
  • Passez en toute simplicité du prototype à la production.
  • Optimisez les coûts grâce à une tarification basée sur l'utilisation.

Contactez-nous

Contactez un spécialiste de l'IA chez NVIDIA pour discuter de la façon de faire passer vos projets en IA générative de la phase de pilote à la phase de production tout en bénéficiant de la sécurité, de la stabilité d'API et de l'assistance de NVIDIA AI Enterprise.

  • Découvrez vos cas d'utilisation de l'IA générative.
  • Discutez de vos besoins techniques.
  • Alignez les solutions d'IA de NVIDIA sur vos objectifs et vos besoins.

Adoptants

Entreprises qui utilisent Nemotron

Ressources

Découvrez toute l'actualité de Nemotron

Présentation de NVIDIA Nemotron

Découvrez comment Nemotron accélère l'innovation, aide les développeurs et façonne l'avenir de l'IA.

ServiceNow fait progresser l'intelligence documentaire

Découvrez comment l'accès aux poids de modèle, aux jeux de données et aux recettes d'entraînement de Nemotron a permis une évaluation plus approfondie, mais aussi ce que ServiceNow a découvert sur la précision visuelle des Q&A et pourquoi l'ouverture est importante pour une amélioration continue de l'IA multimodale.

Raisonnement On/Off : navigation dans un plan de table de mariage avec le raisonnement de l'IA

Découvrez comment un LLM doté de capacités de raisonnement d'IA réfléchit de manière innovante pour trouver une solution à un plan de table de mariage en étudiant la dynamique familiale et les préférences des invités.

FAQ

Les modèles NVIDIA Nemotron ne sont pas seulement ouverts, ils sont totalement open source. NVIDIA publie les jeux de données d’entraînement, les techniques associées et les pondérations de modèles afin que la communauté open-source puisse bénéficier de nos connaissances et utiliser ces ressources pour créer ses propres modèles.

La licence NVIDIA Open Model est une licence permissive qui permet aux opérateurs d’utiliser, de modifier, de distribuer et de déployer commercialement les modèles et leurs dérivés sans créditer NVIDIA, afin d’encourager l’innovation et le développement de l’IA générative.

Oui, vous pouvez télécharger et exécuter gratuitement les modèles NVIDIA Nemotron depuis Hugging Face en production.

NVIDIA propose également des modèles Nemotron en tant que microservices NVIDIA NIM pour un déploiement sécurisé et évolutif, ce qui nécessite une licence NVIDIA AI Enterprise. Vous pouvez essayer les modèles Nemotron et télécharger les microservices NIM à partir de build.nvidia.com.

Oui, NVIDIA s’engage à publier davantage de modèles, de jeux de données et de techniques Nemotron pour soutenir le développement actif de l’écosystème open-source.

Les modèles NVIDIA Nemotron s'appuient sur les modèles ouverts de pointe, ce qui permet de créer plus rapidement des modèles plus performants. De plus, NVIDIA publie les pondérations de modèles, les jeux de données d’entraînement et les techniques associées afin que la communauté de développeurs puisse utiliser ces différentes parties de Nemotron pour entraîner leurs propres modèles.

NVIDIA propose toute une gamme d'outils, tels que NVIDIA Dynamo, TensorRT-LLM et NIM, permettant d'exécuter les modèles Nemotron à grande échelle en production. Vous pouvez également utiliser des bibliothèques open-source populaires, telles que SGLang et vLLM.

Prochaines étapes

Prêt à vous lancer ?

Utilisez les outils et technologies adaptés pour faire passer les modèles NVIDIA Nemotron du développement à la production.

Contactez-nous

Contactez un spécialiste produit chez NVIDIA pour discuter de la façon de faire passer vos projets de la phase de pilote à la phase de production tout en bénéficiant de la sécurité, de la stabilité d'API et de l'assistance de NVIDIA AI Enterprise.

Suivez l'actualité de l'IA agentique avec NVIDIA

Recevez des informations sur l'actualité, les technologies et les tendances de l'IA agentique, et bien plus encore, directement dans votre boîte de réception.