Utilisez les bons outils et technologies pour faire passer les modèles d’IA générative du développement à la production.
Découvrez la plate-forme complète et prête pour l'entreprise pour l'IA générative.
Commencez à prototyper avec les principaux modèles d'IA générative open source et conçus par NVIDIA, pensés pour offrir des performances et une efficacité élevées. Les modèles d'IA du catalogue d'API NVIDIA peuvent être déployés à l'aide des microservices NVIDIA NIM™ et personnalisés avec NeMo.
Les modèles NVIDIA sont des workflows de référence complets créés avec des bibliothèques, des SDK et des microservices d'Omniverse™ et de NVIDIA pour l'IA. Chaque modèle inclut un code de référence, des outils de déploiement, des guides de personnalisation et une architecture de référence, accélérant le déploiement de solutions d'IA telles que les agents d'IA et les jumeaux numériques, du prototype à la production.
NVIDIA AI Enterprise est la plate-forme logicielle de bout en bout qui met l'IA générative à disposition de chaque entreprise, en offrant le temps d'exécution le plus rapide et le plus efficace pour les modèles d'IA générative de base. Elle comprend NeMo et NVIDIA NIM pour rationaliser l'adoption tout en garantissant sécurité, stabilité, facilité de gestion et assistance.
Demandez une licence gratuite de 90 jours pour accéder dès aujourd'hui aux solutions d'IA générative et à l'assistance aux entreprises.
NVIDIA NeMo est un framework de bout en bout pensé pour le Cloud ainsi qu'un ensemble de microservices pour la création, la personnalisation et le déploiement de modèles d'IA générative partout. Il comprend l'organisation des données à grande échelle, un entraînement accéléré avec des techniques de personnalisation avancées, le guardrailing et une inférence optimisée : de quoi offrir aux entreprises un moyen simple, rentable et rapide d’adopter l’IA générative.
NeMo est disponible avec NVIDIA AI Enterprise. Vous trouverez des détails complets sur la tarification et les licences ici.
NeMo peut être utilisé pour personnaliser les grands modèles de langage (LLM), les modèles de langage de vision (VLM), la reconnaissance vocale automatique (ASR) et les modèles de synthèse vocale (TTS).
Les clients peuvent bénéficier de l'assistance commerciale standard de NVIDIA via un abonnement NVIDIA AI Enterprise incluant NeMo. L'assistance commerciale standard de NVIDIA propose des accords de niveau de service, un accès aux experts NVIDIA, ainsi qu'un programme de support à long terme pour les déploiements sur site ou dans le Cloud.
NVIDIA AI Enterprise inclut une assistance standard pour les entreprises de NVIDIA. Pour des services et une assistance disponibles supplémentaires, tels que l'assistance commerciale de NVIDIA, un gestionnaire de compte technique, des formations ou des services professionnels, consultez le guide de service et d'assistance pour les entreprises de NVIDIA.
NeMo Curator est un microservice d'organisation de données évolutif qui permet aux développeurs de trier des ensembles de données de billions de jetons multilingues pour le pré-entraînement des LLM. Il se compose d'un ensemble de modules Python exprimés sous forme d'API qui utilisent Dask, cuDF, cuGraph et Pytorch pour répartir les tâches d'organisation des données, telles que le téléchargement de données, l'extraction de texte, le nettoyage, le filtrage, la déduplication exacte/floue et la classification de texte sur des milliers de cœurs de calcul.
NeMo Guardrails est un microservice qui garantit la pertinence et la sécurité des applications intelligentes avec de grands modèles de langage. Elle protège les organisations supervisant les systèmes LLM.
NeMo Guardrails permet aux développeurs de configurer trois types de limites :
Avec NeMo Retriever, une collection de microservices d’IA générative conçue avec NVIDIA NIM, les entreprises peuvent connecter des modèles personnalisés à diverses données métier afin de proposer des réponses très précises. NeMo Retriever fournit une récupération d'informations de classe mondiale avec la latence la plus faible possible, le débit le plus élevé et une confidentialité maximale des données. De quoi permettre aux organisations de mieux utiliser leurs données et de générer des éclairages commerciaux en temps réel. NeMo Retriever améliore les applications d'IA grâce à des capacités de génération augmentée par récupération pour les entreprises, les connectant à des données métier, où qu'elles se trouvent.
NVIDIA NIM, qui fait partie de NVIDIA AI Enterprise, est un environnement d'exécution facile à utiliser et conçu pour accélérer le déploiement de l'IA générative dans les entreprises. Ce microservice polyvalent prend en charge un large éventail de modèles d'IA, des modèles de communauté open source aux modèles NVIDIA AI Foundation, en passant par les modèles d'IA personnalisés sur mesure. Construit sur les bases solides des moteurs d'inférence, il est conçu pour faciliter l'inférence d'IA transparente à grande échelle. De quoi garantir que les applications d'IA peuvent être déployées dans le Cloud, le centre de données et le poste de travail.
NeMo Evaluator est un microservice conçu pour une évaluation rapide et fiable des LLM et RAG personnalisés. Il couvre diverses références avec des mesures prédéfinies, y compris les évaluations humaines et les techniques LLM-en-tant-que-juge. Plusieurs tâches d'évaluation peuvent être déployées simultanément sur Kubernetes sur des plateformes Cloud ou des centres de données préférés via des appels API, permettant des résultats agrégés efficaces.
NeMo Customizer constitue un microservice évolutif à hautes performances qui simplifie le réglage fin et l'alignement des LLM pour les cas d'utilisation spécifiques à un domaine.
La génération augmentée par récupération est une technique qui permet aux LLM de créer des réponses à partir des informations les plus récentes en les connectant à la base de connaissances de l'entreprise. NeMo fonctionne avec divers outils tiers et communautaires tels que Milvus, Llama Index et LangChain pour extraire des bribes d’informations pertinentes à partir de la base de données vectorielle avant de les transmettre au LLM afin de générer des réponses en langage naturel. Explorez la page AI Chatbot Using RAG Workflow pour commencer à créer des chatbots IA pour la production capables de répondre avec précision aux questions sur les données de votre entreprise.
NVIDIA met à votre disposition des workflows d’IA constituant des services de référence empaquetés et natifs dans le Cloud qui illustrent la façon dont les frameworks d’IA de NVIDIA peuvent être mis à profit pour concevoir des solutions d’IA. Grâce à des modèles pré-entraînés, des pipelines d’entraînement et d’inférence, des notebooks Jupyter et des graphiques Helm, les workflows d’IA contribuent à accélérer le déploiement de nouvelles solutions d'IA.
Développez rapidement vos solutions d’IA générative avec ces workflows de bout en bout :
Les modèles NVIDIA sont des workflows de référence complets créés avec des bibliothèques, des SDK et des microservices NVIDIA AI et Omniverse. Chaque modèle inclut un code de référence, des outils de déploiement, des guides de personnalisation et une architecture de référence, accélérant le déploiement de solutions d'IA telles que les agents d'IA et les jumeaux numériques, du prototype à la production.
NVIDIA AI Enterprise est une plateforme logicielle de bout en bout conçue pour Cloud, qui accélère les pipelines de data science et rationalise le développement et le déploiement d'applications d'IA pour la production, y compris l'IA générative, la vision par ordinateur, l'IA vocale, et bien plus encore. Il comprend les meilleurs outils de développement disponibles, des frameworks, des modèles pré-entraînés, des microservices pour les praticiens de l'IA et des capacités de gestion fiables pour les professionnels de l'informatique afin d'assurer performances, stabilité des API et sécurité.
Le catalogue d'API NVIDIA fournit des modèles d’IA générative prêts pour la production et des environnements d’exécution d’inférence continuellement optimisés, présentés sous forme de microservices comme NVIDIA NIM pouvant être facilement déployés avec des outils standardisés sur n’importe quel système accéléré par GPU.
Suivez toute l'actualité de l'IA générative avec NVIDIA.