Utilice las herramientas y tecnologías adecuadas para llevar los modelos de IA generativa del desarrollo a la producción.
Experimente la plataforma integral y empresarial para la IA generativa.
Comience a crear prototipos con los principales modelos de IA generativa de código abierto y creados por NVIDIA que han sido ajustados para un alto rendimiento y eficiencia. Los modelos de IA del catálogo de API de NVIDIA se pueden implementar utilizando microservicios NVIDIA NIM™ y personalizar con NeMo.
Los NVIDIA Blueprints son flujos de trabajo de referencia integrales desarrollados con las bibliotecas, los kits de desarrollo (SDK) y los microservicios de NVIDIA AI y de Omniverse™. Cada plano técnico ('blueprint') incluye código de referencia, herramientas de implementación, guías de personalización y una arquitectura de referencia, lo cual acelera la implementación de soluciones de IA, como los agentes de IA y los gemelos digitales, desde el prototipo hasta la producción.
NVIDIA AI Enterprise es la plataforma de software de extremo a extremo que lleva la IA generativa a todas las empresas, proporcionando el tiempo de ejecución más rápido y eficiente para los modelos de base de IA generativa. Incluye NeMo y NVIDIA NIM para optimizar la adopción con seguridad, estabilidad, capacidad de administración y soporte.
Solicite una licencia gratuita de 90 días para acceder a soluciones de IA generativa y soporte empresarial hoy mismo.
NVIDIA NeMo es un marco nativo de nube de extremo a extremo, así como un conjunto de microservicios destinados a crear, personalizar e implementar modelos de IA generativa en cualquier lugar. Incluye la selección de datos a escala, entrenamiento acelerado con técnicas avanzadas de personalización, sistema de barreras de protección e inferencia optimizada, que ofrece a las empresas una forma fácil, rentable y rápida de adoptar la IA generativa.
NeMo está disponible como parte de NVIDIA AI Enterprise. Los detalles completos de precios y licencias se pueden encontrar aquí.
NeMo se puede utilizar para personalizar modelos lingüísticos de gran tamaño (LLM), modelos de lenguaje de visión (VLM), reconocimiento de voz automático (ASR) y modelos de texto a voz (TTS).
Los clientes pueden obtener soporte empresarial estándar de NVIDIA a través de una suscripción NVIDIA AI Enterprise, que incluye NeMo. El soporte empresarial estándar de NVIDIA ofrece acuerdos de nivel de servicio, acceso a expertos de NVIDIA y soporte a largo plazo en implementaciones locales y en la nube.
NVIDIA AI Enterprise incluye soporte empresarial estándar de NVIDIA. Para obtener más soporte y servicios disponibles, como soporte crítico para las empresas de NVIDIA, un administrador técnico de cuentas, capacitación y servicios profesionales, consulte la Guía de soporte y servicios empresariales de NVIDIA.
NeMo Curator es un microservicio de selección de datos escalable que permite a los desarrolladores clasificar conjuntos de datos multilingües de billones de tókenes para el preentrenamiento de modelos de lenguaje de gran tamaño (LLM). Consta de un conjunto de módulos de Python expresados como interfaces API que utilizan Dask, cuDF, cuGraph y Pytorch para escalar tareas de selección de datos, como descarga de datos, extracción de texto, limpieza, filtrado, deduplicación exacta/difusa y clasificación de texto a miles de núcleos de procesamiento.
NeMo Guardrails es un microservicio destinado a garantizar la idoneidad y la seguridad en aplicaciones inteligentes con modelos lingüísticos de gran tamaño. Protege a las organizaciones que supervisan los sistemas de LLM.
NeMo Guardrails permite a los desarrolladores configurar tres tipos de límites:
Con NeMo Retriever, una colección de microservicios de IA generativa desarrollados con NVIDIA NIM, las empresas pueden conectar sin problemas modelos personalizados a diversos tipos de datos empresariales para ofrecer respuestas de alta precisión. NeMo Retriever proporciona recuperación de información de categoría internacional con la menor latencia, el mayor rendimiento y la máxima privacidad de datos, permitiendo a las organizaciones hacer un mejor uso de sus datos y generar conocimiento empresarial en tiempo real. NeMo Retriever mejora las aplicaciones de IA con capacidades de generación aumentada por recuperación de nivel empresarial, que las conectan con los datos empresariales dondequiera que estén hospedados.
NVIDIA NIM, parte de NVIDIA AI Enterprise, es un tiempo de ejecución fácil de usar, diseñado para acelerar la implementación de la IA generativa en las empresas. Este versátil microservicio admite un amplio espectro de modelos de IA, desde modelos de comunidad de código abierto hasta modelos de NVIDIA AI Foundation, así como modelos de IA personalizados a medida. Construido sobre los sólidos cimientos de los motores de inferencia, está diseñado para facilitar la inferencia de IA a escala, garantizando que las aplicaciones de IA se puedan implementar en la nube, el centro de datos y en la estación de trabajo.
NeMo Evaluator es un microservicio diseñado para la evaluación rápida y fiable de modelos LLM y procesos RAG personalizados. Abarca diversas pruebas de referencia con métricas predefinidas, incluidas evaluaciones humanas y técnicas de "LLM como juez". Se pueden implementar simultáneamente múltiples trabajos de evaluación en Kubernetes, en plataformas de nube o centros de datos preferidos a través de llamadas API, lo cual permite resultados agregados eficientes.
NeMo Customizer es un microservicio escalable de alto rendimiento que simplifica el ajuste preciso y la alineación de los modelos LLM para casos de uso específicos de un ámbito.
La generación aumentada por recuperación es una técnica que permite a los modelos LLM crear respuestas a partir de la información más reciente, conectándolos a la base de conocimientos de la empresa. NeMo trabaja con varias herramientas de terceros y de la comunidad, incluidas Milvus, Llama Index y LangChain, para extraer fragmentos relevantes de información de la base de datos vectoriales y alimentarlos al LLM para generar respuestas en lenguaje natural. Explore la página de Chatbot de IA usando el flujo de trabajo de RAG para comenzar a crear chatbots de IA de calidad de producción que pueden responder con precisión a preguntas sobre los datos de su empresa.
NVIDIA ofrece flujos de trabajo de IA: ejemplos de referencia empaquetados nativos de la nube que ilustran cómo se pueden aprovechar los marcos de IA de NVIDIA para crear soluciones de IA. Con modelos previamente entrenados, canalizaciones de entrenamiento e inferencia, Jupyter Notebooks y gráficos de Helm, los flujos de trabajo de IA aceleran el proceso de entrega de soluciones de IA.
Cree rápidamente sus soluciones de IA generativa con estos flujos de trabajo de extremo a extremo:
Los NVIDIA Blueprints son flujos de trabajo de referencia integrales desarrollados con las bibliotecas, los kits de desarrollo y los microservicios de NVIDIA AI y de Omniverse. Cada plano técnico ('blueprint') incluye código de referencia, herramientas de implementación, guías de personalización y una arquitectura de referencia, lo cual permite acelerar la implementación de soluciones de IA, como los agentes de IA y los gemelos digitales, desde el prototipo hasta la producción.
NVIDIA AI Enterprise es una plataforma de software de extremo a extremo nativa de la nube que acelera las canalizaciones de ciencia de datos y agiliza el desarrollo y la implementación de aplicaciones de IA de nivel de producción, entre las que se incluyen la IA generativa, la visión por ordenador, la IA de voz y muchas más. Incluye las mejores herramientas de desarrollo, marcos, modelos preentrenados, microservicios para profesionales de IA y capacidades de gestión fiables para profesionales de TI destinadas a garantizar el rendimiento, la estabilidad de API y la seguridad.
El catálogo de API de NVIDIA proporciona modelos de IA generativa listos para la producción y tiempo de ejecución de inferencia optimizado continuamente, empaquetados como microservicios NVIDIA NIM que pueden implementarse fácilmente con herramientas estandarizadas en cualquier sistema acelerado por GPU.
Manténgase al día de las últimas noticias sobre IA generativa de NVIDIA.