Démarrer avec NVIDIA NeMo

NVIDIA NeMo est une suite logicielle modulaire et adaptée aux entreprises pour gérer le cycle de vie des agents d'IA, c'est-à-dire développer, déployer et optimiser les systèmes agentiques, de la curation des données en passant par la personnalisation et l'évaluation des modèles, jusqu'au déploiement, l'orchestration et l'optimisation continue. Elle s'intègre sans effort aux écosystèmes et aux plateformes d'IA existants pour créer une base pour le développement d'agents d'IA et accélérer le développement vers la production de systèmes agentiques sur n'importe quel environnement cloud, sur site ou hybride. Elle prend en charge une évolutivité rapide et la création sans effort de volants de données améliorant en permanence les agents d'IA à l'aide des informations les plus récentes.

NeMo est disponible open source et pris en charge dans le cadre de NVIDIA AI Enterprise. Vous trouverez des informations détaillées sur les prix et les licences ici.

NeMo peut être utilisé pour personnaliser les grands modèles de langage (LLM), les modèles de langage de vision (VLM), la reconnaissance vocale automatique (ASR) et les modèles de synthèse vocale (TTS).

NVIDIA AI Enterprise inclut une assistance standard pour les entreprises de NVIDIA. Pour des services et une assistance disponibles supplémentaires, tels que l'assistance commerciale de NVIDIA, un gestionnaire de compte technique, des formations ou des services professionnels, consultez le guide de service et d'assistance pour les entreprises de NVIDIA.

Le framework NVIDIA NeMo est un framework d'IA générative open source conçu pour les chercheurs et les développeurs cherchant un contrôle du code plus fin et souple pour développer efficacement des modèles d'IA générative à grande échelle. Elle prend en charge le pré-entraînement, le post-entraînement et l'apprentissage par renforcement des modèles d'IA générative multimodaux.

Les microservices NVIDIA NeMo sont une offre modulaire adaptée aux entreprises et axée sur les API, s'étendant sur le framework NeMo et spécialement conçue pour permettre aux développeurs de personnaliser et de déployer facilement et rapidement des agents d'IA à grande échelle. Elle simplifie le réglage fin, l'évaluation, l'encadrement et la génération de données synthétiques des modèles. Elles s'intègrent sans effort aux plateformes d'IA existantes, permettant aux entreprises d'accélérer le développement d'agents d'IA personnalisés et de les optimiser en permanence via des workflows de volant de données.

NeMo Data Designer est un microservice spécialement conçu pour les développeurs d'IA qui fournit un moyen programmatique de générer des données synthétiques via des schémas configurables et des modèles de génération basés sur l'IA. Il est conçu pour s'intégrer sans effort à votre workflow de développement d'IA.

NeMo Curator est une bibliothèque open source qui améliore la précision des modèles d'IA générative en organisant des jeux de données multimodaux haute qualité. Elle se compose d'un ensemble de modules Python exprimés sous forme d'API qui utilisent Dask, cuDF, cuGraph et Pytorch pour répartir les tâches d'organisation des données, telles que le téléchargement de données, l'extraction de texte, le nettoyage, le filtrage, la déduplication exacte/floue et la classification de texte sur des milliers de cœurs de calcul.

NeMo Customizer est un microservice hautes performances et évolutif qui simplifie la personnalisation et l'alignement des LLM pour des cas d'utilisation spécifiques à un domaine grâce à des techniques avancées de réglage fin et d'apprentissage par renforcement.

NeMo Auditor audite les LLM en exécutant des tâches d'audit testant le modèle à l'aide d'une variété de prompts pour en identifier les vulnérabilités. Les résultats vous aideront à évaluer la sécurité des modèles et des systèmes.

NeMo Evaluator est un microservice conçu pour une évaluation rapide et fiable de LLM et de pipelines RAG personnalisés. Il couvre diverses références avec des mesures prédéfinies, y compris les évaluations humaines et les techniques LLM-en-tant-que-juge. Plusieurs tâches d'évaluation peuvent être déployées simultanément sur Kubernetes sur des plateformes Cloud ou des centres de données préférés via des appels API, permettant des résultats agrégés efficaces.

NeMo Guardrails est un microservice qui garantit la pertinence et la sécurité des applications intelligentes avec de grands modèles de langage. Elle protège les organisations supervisant les systèmes LLM.

NeMo Guardrails permet aux développeurs de configurer trois types de limites :

Les barrières de sécurité thématiques empêchent les applications de dévier sur des zones indésirables. Elles empêchent par exemple les assistants du service client de répondre à des questions sur la météo.
Les barrières de sécurité garantissent que les applications répondent en fournissant des informations précises et appropriées. Elles peuvent filtrer le langage indésirable et faire respecter le fait que les références soient faites uniquement à des sources crédibles.
Les barrières de sécurité garantissent que les applications se connectent uniquement à des applications tierces connues pour maintenir la sécurité des applications.

NeMo RL est une bibliothèque open source qui fait partie du kit d'outils du framework NeMo, offrant des algorithmes d'apprentissage par renforcement avancés et un post-entraînement évolutif pour optimiser et aligner les agents d'IA à l'échelle de l'entreprise.

NeMo Retriever est une collection de modèles Nemotron RAG de pointe offrant une précision 50 % supérieure, une extraction PDF multimodale 15 fois plus rapide et une efficacité de stockage 35 fois supérieure, permettant aux entreprises de développer des pipelines RAG qui fournissent des informations commerciales en temps réel. NeMo Retriever garantit la confidentialité des données et se connecte sans effort aux données propriétaires où qu'elles résident, permettant une récupération sécurisée pour les entreprises.

La génération augmentée par récupération est une technique qui permet aux LLM de créer des réponses à partir des informations les plus récentes en les connectant à la base de connaissances de l'entreprise. NeMo fonctionne avec divers outils tiers et communautaires tels que Milvus, Llama Index et LangChain pour extraire des bribes d’informations pertinentes à partir de la base de données vectorielle avant de les transmettre au LLM afin de générer des réponses en langage naturel. Explorez la page AI Chatbot Using RAG Workflow pour commencer à créer des chatbots IA pour la production capables de répondre avec précision aux questions sur les données de votre entreprise.

NVIDIA met à votre disposition des workflows d’IA constituant des services de référence empaquetés et natifs dans le Cloud qui illustrent la façon dont les frameworks d’IA de NVIDIA peuvent être mis à profit pour concevoir des solutions d’IA. Grâce à des modèles pré-entraînés, des pipelines d’entraînement et d’inférence, des notebooks Jupyter et des graphiques Helm, les workflows d’IA contribuent à accélérer le déploiement de nouvelles solutions d'IA.

Développez rapidement vos solutions d’IA générative avec ces workflows de bout en bout :

NVIDIA NIM, qui fait partie de NVIDIA AI Enterprise, est un environnement d'exécution facile à utiliser et conçu pour accélérer le déploiement de l'IA générative dans les entreprises. Ce microservice polyvalent prend en charge un large éventail de modèles d'IA, des modèles de communauté open source aux modèles NVIDIA AI Foundation, en passant par les modèles d'IA personnalisés sur mesure. Construit sur les bases solides des moteurs d'inférence, il est conçu pour faciliter l'inférence d'IA transparente à grande échelle. De quoi garantir que les applications d'IA peuvent être déployées dans le Cloud, le centre de données et le poste de travail.

La génération augmentée par récupération est une technique qui permet aux LLM de créer des réponses à partir des informations les plus récentes en les connectant à la base de connaissances de l'entreprise. NeMo fonctionne avec divers outils tiers et communautaires tels que Milvus, Llama Index et LangChain pour extraire des bribes d’informations pertinentes à partir de la base de données vectorielle avant de les transmettre au LLM afin de générer des réponses en langage naturel. Explorez la page AI Chatbot Using RAG Workflow pour commencer à créer des chatbots IA pour la production capables de répondre avec précision aux questions sur les données de votre entreprise.

Les modèles NVIDIA sont des workflows de référence complets créés avec des bibliothèques, des SDK et des microservices NVIDIA AI et Omniverse. Chaque modèle inclut un code de référence, des outils de déploiement, des guides de personnalisation et une architecture de référence, accélérant le déploiement de solutions d'IA telles que les agents d'IA et les jumeaux numériques, du prototype à la production.

NVIDIA AI Enterprise est une plateforme logicielle de bout en bout conçue pour Cloud, qui accélère les pipelines de data science et rationalise le développement et le déploiement d'applications d'IA pour la production, y compris l'IA générative, la vision par ordinateur, l'IA vocale, et bien plus encore. Elle comprend les meilleurs outils de développement disponibles, des frameworks, des modèles pré-entraînés, des microservices pour les praticiens de l'IA et des capacités de gestion fiables pour les professionnels de l'informatique afin d'assurer performances, stabilité des API et sécurité.

Comment démarrer avec NVIDIA NeMo

Le parcours depuis les modèles d'IA aux applications d'IA agentique

1

2

3

Outils pour gérer le cycle de vie des agents d'IA

FAQ

Comment démarrer avec NVIDIA NeMo

Le parcours depuis les modèles d'IA aux applications d'IA agentique

1

2

3

Outils pour gérer le cycle de vie des agents d'IA

FAQ

Qu'est-ce que NVIDIA NeMo ?

Combien coûte NeMo ?

Quels modèles d’IA peuvent être personnalisés avec NeMo ?

Quels services d’entreprise sont disponibles avec NeMo ?

Quelle est la différence entre le framework NeMo et les microservices NeMo ?

Qu'est-ce que NeMo Data Designer ?

Qu’est-ce que NeMo Curator ?

Qu'est-ce que NeMo Customizer ?

Qu'est-ce que NeMo Auditor ?

Qu’est-ce que NeMo Evaluator ?

Qu'est-ce que NeMo Guardrails ?

Qu'est-ce que NeMo RL ?

Qu'est-ce que NeMo Retriever ?

NeMo prend-il en charge la génération augmentée par récupération ?

Quelle est la méthode la plus rapide pour commencer ?

Qu'est-ce que NVIDIA NIM ?

NeMo prend-il en charge la génération augmentée par récupération ?

En quoi consistent les modèles NVIDIA ?

Qu'est-ce que NVIDIA AI Enterprise ?