NVIDIA Nemotron

Modelos abiertos, multimodales y de alta eficiencia para agentes de IA de ejecución prolongada.

Descripción

¿Qué es NVIDIA Nemotron?

NVIDIA Nemotron™ es una familia de modelos de IA abiertos, multimodales y altamente eficientes diseñados para agentes de ejecución prolongada y con evolución automática. Los modelos de Nemotron, diseñados para completar tareas rápidamente, proporcionan un alto rendimiento de razonamiento y una precisión avanzada para flujos de trabajo de agentes complejos.

Gracias a unos datos de entrenamiento transparentes y una amplia compatibilidad con plataformas, incluidas NVIDIA RTX PRO™ y NVIDIA DGX Spark™, los modelos de Nemotron están disponibles de forma abierta y se integran en todo el ecosistema de IA, lo cual permite implementar agentes de IA fiables y de alto rendimiento en cualquier entorno, desde el perímetro hasta la nube.

Construya el futuro del trabajo con las plataformas de software empresarial de NVIDIA

Descubra cómo el software de NVIDIA impulsa los agentes de ejecución prolongada para flujos de trabajo complejos en las áreas de ingeniería, atención sanitaria y operaciones, lo que aumenta la productividad de los empleados.

Vídeo

Por qué NVIDIA ha creado Nemotron

Bryan Catanzaro, vicepresidente de investigación aplicada en deep learning de NVIDIA, nos presenta la visión de Nemotron y explica por qué las tecnologías abiertas son fundamentales para crear una IA fiable y apta para su uso en empresas.

Ventajas

¿Qué aporta Nemotron a la IA de agentes?

Modelos abiertos

Los datos abiertos y las técnicas de optimización de NVIDIA aseguran modelos potentes, transparentes y adaptables para desarrolladores y empresas. Los modelos y los datos de entrenamiento se publican de forma abierta en Hugging Face.

Computación de alta eficiencia

La familia Nemotron está optimizada para realizar tareas de agentes con mayor rapidez, gracias al máximo rendimiento y a la arquitectura híbrida de mezcla de expertos (MoE).

Alta precisión

Los modelos de Nemotron, diseñados desde cero con conocimientos excepcionales y entrenados posteriormente con datos de entrenamiento de alta calidad y adaptados al aprendizaje de refuerzo, alcanzan una precisión líder para sistemas de agentes de ejecución prolongada.

Implementación segura y sencilla

La familia de modelos Nemotron, disponible como microservicios NVIDIA NIM optimizados, proporciona un rendimiento de inferencia máximo y opciones de implementación flexibles, lo cual garantiza una seguridad, privacidad y portabilidad superiores.

Modelos

Modelos para diversas cargas de trabajo

Los modelos de Nemotron destacan en una gama de tareas de IA de agentes, como el razonamiento, la visión multimodal, la generación aumentada por recuperación (RAG), la voz y la seguridad. de Los modelos de investigación también están disponibles para usarlos en experimentación.

Razonamiento

Los modelos de Nemotron admiten una gama de cargas de trabajo de razonamiento. Nano brinda una precisión y eficiencia superiores para subagentes especializados. Super proporciona la mayor precisión, razonamiento de capacidad de proceso y llamada de herramientas para ejecutar tareas complejas en sistemas multiagente. Por otro lado, Ultra ofrece el mejor razonamiento para aplicaciones de misión crítica que exigen la máxima capacidad en flujos de trabajo de varios pasos.

Comprensión visual

Los modelos multimodales de Nemotron proporcionan la máxima eficiencia y una precisión puntera en vídeo, audio, imagen y texto para casos de uso de agentes empresariales. Al estar optimizados para subagentes especializados, potencian capacidades como agentes de uso informático, inteligencia de documentos y comprensión de vídeo y de audio.

Razonamiento

Seleccione entre una gama de modelos de razonamiento de Nemotron: Nano proporciona una precisión superior para ordenadores y dispositivos perimetrales; Super ofrece la máxima precisión y rendimiento cuando se ejecuta en una sola GPU NVIDIA Tensor Core y Ultra proporciona la mejor precisión para sistemas complejos optimizados para centros de datos de varias GPU.

Generación aumentada por recuperación

Los modelos de Nemotron ofrecen una comprensión rápida y precisa de los documentos al extraer información estructurada multimodal, generar representaciones distribuidas (incrustaciones) de alta calidad y clasificar por orden de prioridad los documentos más relevantes. Proporcionan recuperación escalable y de alta velocidad que mejora la calidad de los datos para el entrenamiento de modelos de lenguaje de gran escala (LLM), aumenta el rendimiento de agentes y recuperadores, y agiliza los flujos de trabajo de documentos.

Barreras de protección

Los modelos de NVIDIA Nemotron Safety Guard proporcionan protección en tiempo real contra contenido dañino, desviación del tema e intentos de liberación ('jailbreak'). Aportan una capa de seguridad para el contenido multilingüe, mejorando la moderación y asegurando la adecuación cultural.

Tecnología

Elementos fundamentales para la construcción de la IA de agentes

Empiece a crear y optimizar agentes de IA con NVIDIA NeMo™ para la IA de agentes personalizada, NVIDIA NIM para la implementación rápida y apta para empresas, y blueprints de NVIDIA para acelerar el desarrollo con flujos de trabajo de referencia personalizables.

NVIDIA NeMo

  • Cree, personalice e implemente IA generativa e IA de agentes.
  • Ofrezca modelos lingüísticos de gran tamaño (LLM) aptos para empresas, con una selección de datos precisa, personalización avanzada, ingesta de datos escalable, generación aumentada por recuperación (RAG) y rendimiento acelerado.
  • Desarrolle fácilmente volantes de inercia de datos y optimice continuamente los agentes de IA con la información más reciente.

NVIDIA NIM

  • Acelere la implementación de modelos de IA generativa optimizados para aumentar el rendimiento.
  • Ejecute sus aplicaciones empresariales con interfaces API estables y seguras, respaldadas por asistencia de nivel empresarial.

NVIDIA Blueprints

  • Dé sus primeros pasos rápidamente con aplicaciones de referencia para casos de uso de IA generativa, como investigación profunda empresarial y RAG multimodal.
  • Acelere el desarrollo con blueprints, que incluyen microservicios de partners, uno o más agentes de IA, código de referencia, documentación de personalización y un diagrama de Helm para la implementación.

Cómo empezar

Formas de empezar con Nemotron

Empiece a crear prototipos de forma gratuita

Empiece a hacerlo con puntos de conexión de API fáciles de usar.

  • Acceda a una infraestructura de IA totalmente acelerada.
  • Asegúrese de que sus datos no se utilizan para el entrenamiento de modelos.
  • Sin créditos, simplemente una ruta sencilla para desarrollar, probar e implementar.

Ejecute Nemotron en proveedores de servicios de inferencia

Implemente modelos de Nemotron al instante en plataformas de inferencia de confianza de terceros, sin necesidad de configurar la infraestructura.

  • Implementar sin gestionar la infraestructura.
  • Escalar sin problemas desde el prototipo hasta la producción.
  • Optimizar los costes con precios basados en el uso.

Contáctenos

Hable con un especialista en IA de NVIDIA sobre cómo implantar pilotos de IA generativa en la fase de producción con la seguridad, la estabilidad de API y la asistencia técnica que ofrece NVIDIA AI Enterprise.

  • Explore sus casos de uso de IA generativa.
  • Hable sobre sus requisitos técnicos.
  • Ajuste las soluciones de IA de NVIDIA a sus objetivos y requisitos.

Usuarios

Empresas que utilizan Nemotron

Recursos

Descubra las últimas novedades de Nemotron

Por qué NVIDIA ha creado Nemotron

Descubra cómo Nemotron acelera la innovación, empodera a los desarrolladores y da forma al futuro de la IA.

Cómo ServiceNow está haciendo avanzar la inteligencia documental

Descubra cómo el acceso a los pesos de los modelos, los conjuntos de datos y las recetas de entrenamiento de Nemotron permitió una evaluación más exhaustiva, qué descubrió ServiceNow sobre la precisión de las preguntas y respuestas visuales y por qué la apertura es importante para la mejora continua en la IA multimodal.

Razonamiento activado/desactivado: Organizar un gráfico de distribución de asientos de una boda con razonamiento de IA

Vea cómo un LLM con capacidades de razonamiento de IA piensa de forma creativa para encontrar una solución a un gráfico de distribución de asientos de una boda mientras tiene en cuenta factores como las dinámicas familiares y las preferencias de los invitados.

Preguntas frecuentes

Los modelos NVIDIA Nemotron no solo son abiertos, sino que también son totalmente de código abierto. NVIDIA publica los conjuntos de datos de entrenamiento, las técnicas y los pesos de los modelos para que la comunidad de código abierto pueda beneficiarse de nuestro aprendizaje y utilizar estos recursos para crear sus propios modelos.

La licencia de modelo abierto de NVIDIA es una licencia permisiva que permite a los usuarios usar, modificar, distribuir e implementar comercialmente los modelos y derivados sin acreditar a NVIDIA, para fomentar la innovación y el desarrollo posterior de la IA generativa.

Sí, puede descargar y ejecutar modelos NVIDIA Nemotron desde Hugging Face de forma gratuita en producción.

NVIDIA también ofrece modelos Nemotron como microservicios NVIDIA NIM para una implementación segura y escalable, que requiere una licencia de NVIDIA AI Enterprise. Puede probar los modelos de Nemotron y descargar los microservicios de NIM desde build.nvidia.com.

Sí, NVIDIA se ha comprometido a publicar más modelos, conjuntos de datos y técnicas de Nemotron para habilitar ecosistemas de código abierto.

Los modelos NVIDIA Nemotron se basan en modelos abiertos de frontera, lo que permite crear mejores modelos más rápidamente. Además, NVIDIA publica los pesos del modelo, así como los conjuntos de datos y las técnicas de entrenamiento para que la comunidad de desarrolladores pueda utilizar estas diferentes partes de Nemotron para entrenar sus propios modelos.

NVIDIA proporciona una variedad de herramientas, como NVIDIA Dynamo, TensorRT-LLM y NIM, para ejecutar modelos Nemotron a escala en producción. También puede utilizar bibliotecas de código abierto populares, como SGLang y vLLM.

Próximos pasos

¿Tiene todo listo para empezar?

Utilice las herramientas y tecnologías adecuadas para trasladar los modelos de NVIDIA Nemotron desde el desarrollo hasta la producción.

Contáctenos

Hable con un especialista en productos de NVIDIA sobre cómo pasar de la fase piloto a la de producción con la garantía de seguridad, estabilidad de API y asistencia técnica que ofrece NVIDIA AI Enterprise.

Manténgase al día de las noticias sobre la IA de agentes de NVIDIA

Reciba las últimas noticias, tecnologías, avances y mucho más sobre IA de agentes directamente en su bandeja de entrada.