Microservicios de NVIDIA NIM

Diseñados para la implementación rápida y confiable de inferencia de IA generativa acelerada en cualquier lugar.

Empiece Ahora

Video | Resumen de la Solución | Documentación | Para Desarrolladores

Descripción General
Beneficios
Demostración
Tecnología
Análisis de Referencia
Modelos
Funciones
Casos de Uso
Opciones de Inicio
Recursos
Próximos Pasos

Descripción General
Beneficios
Demostración
Tecnología
Análisis de Referencia
Modelos
Funciones
Casos de Uso
Opciones de Inicio
Recursos
Próximos Pasos

Empiece Ahora

Descripción General

¿Qué Es NVIDIA NIM?

NVIDIA NIM™ proporciona microservicios de inferencia predesarrollados y optimizados para implementar rápidamente los modelos de IA más recientes en cualquier infraestructura acelerada por NVIDIA: la nube, el data center, las workstations y el edge.

Los Agentes de IA Soberanos Piensan Localmente y Actúan de Forma Global con las Fábricas de IA de NVIDIA

El diseño validado para fábricas de IA combina la infraestructura acelerada con el software, incluidas las nuevas capacidades de NVIDIA NIM™ y un conjunto ampliado de NVIDIA Blueprints.

Lea el Blog

Acceso Gratuito a NIM para Desarrollo

Obtenga acceso sin límite a la creación de prototipos con las API alojadas para NIM, aceleradas por DGX Cloud, o descargue y aloje usted mismo microservicios NIM para investigación y desarrollo como parte del Programa para Desarrolladores de NVIDIA.

Pruebe las API

Acelere la Implementación de IA con NVIDIA NIM

NVIDIA NIM combina la facilidad de uso y la simplicidad operativa de las API administradas con la flexibilidad y la seguridad de los modelos de autoalojamiento en su infraestructura preferida. Los microservicios NIM vienen con todo lo que los equipos de IA necesitan: los últimos modelos base de IA, motores de inferencia optimizados, API estándar de la industria y dependencias de tiempo de ejecución; preempaquetados en contenedores de software de nivel empresarial y listos para implementarlos y escalarlos en cualquier lugar.

Beneficios

IA Generativa Empresarial que Hace Más con Menos

Los microservicios sencillos y listos para la producción están desarrollados para la IA de alto desempeño y diseñados para trabajar sin problemas y escalar de manera asequible. Comience a desarrollar agentes de IA y otras aplicaciones de IA generativa empresarial más rápido con los últimos modelos de IA para razonamiento, simulación, habla y más.

Facilidad de Uso

Acelere la innovación y el tiempo de comercialización con microservicios predesarrollados y optimizados para los modelos de IA más recientes. Con las API estándar, los modelos se pueden implementar en cinco minutos y se los puede integrar fácilmente en las aplicaciones.

Mire: Implemente NIM en 5 Minutos

Nivel Empresarial

Implemente microservicios de nivel empresarial que NVIDIA administra continuamente a través de procesos rigurosos de validación y ramificaciones de funciones dedicadas, todo con el respaldo de la asistencia empresarial de NVIDIA, que también ofrece acceso directo a los expertos en IA de NVIDIA.

Desempeño y Escala

Mejore el costo total de propiedad con una inferencia de IA de baja latencia y alto desempeño que escala con la nube, y logre la mejor exactitud gracias a la compatibilidad con modelos de ajuste fino listos para usarse.

Mire: Desempeño de NIM y Ventaja en el Costo Total de Propiedad

Portabilidad

Implemente en cualquier lugar con microservicios predesarrollados y nativos de la nube, listos para ejecutarse en cualquier infraestructura acelerada por NVIDIA (nube, data centers y workstations) y escale sin problemas en Kubernetes y en los entornos de proveedores de servicios en la nube.

Demostración

Desarrolle Agentes de IA con NIM

Aprenda a configurar dos agentes de IA, uno para la generación de contenido y otro para diseño gráfico digital, y vea lo fácil que es comenzar a usar los microservicios NIM.

Vea Ahora

Tecnología

Componentes de la IA Basada en Agentes

Obtenga los Modelos de IA Más Recientes

Obtenga acceso a los modelos de IA más recientes para razonamiento, lenguaje, recuperación, habla, visión y más, listos para su implementación en cinco minutos en cualquier infraestructura acelerada por NVIDIA.

Pruébelo Ahora

Inicie Rápidamente el Desarrollo con NVIDIA Blueprints

Desarrolle aplicaciones de IA basada en agentes con impacto, con workflows de referencia completos que ofrecen bibliotecas de aceleración de NVIDIA, SDK y microservicios NIM.

Más Información Pruébelo Ahora

Simplifique el Desarrollo con el Kit de Herramientas NVIDIA AgentIQ

Integre los microservicios NIM en aplicaciones de IA basada en agentes con la biblioteca NVIDIA AgentIQ, un kit de herramientas para desarrolladores para crear agentes de IA e integrarlos en workflows personalizados.

Más Información Pruébelo Ahora

Análisis de Referencia

Impulse el Rendimiento con NIM

NVIDIA NIM proporciona una latencia y un rendimiento optimizados de inmediato para maximizar la generación de tókenes, admitir usuarios simultáneos en las horas pico y mejorar la capacidad de respuesta. Los microservicios NIM se actualizan continuamente con los motores de inferencia optimizados más recientes, lo que aumenta el desempeño de la misma infraestructura con el tiempo.

Configuración: Llama 3.1 8B instruct, 1 H100 SXM; solicitudes simultáneas: 200. NIM ACTIVADO: FP8, rendimiento de 1201 tókenes/s, ITL 32 ms. NIM DESACTIVADO: FP8, rendimiento de 613 tókenes/segundo, ITL 37 ms.

Modelos

Habilite Inferencia Empresarial para Miles de Modelos Abiertos

Implemente grandes modelos de lenguaje (LLM) compatibles con NVIDIA® TensorRT™-LLM, vLLM o SGLang para una inferencia de baja latencia y alto rendimiento en una infraestructura acelerada por NVIDIA.

Explore los Modelos

Funciones

El Botón Fácil para el Desarrollo y la Implementación de IA

Los microservicios NIM, diseñados para ejecutarse en cualquier lugar, exponen las API estándar de la industria para una fácil integración con sistemas y aplicaciones empresariales, y escalan a la perfección en Kubernetes para ofrecer una inferencia de alto rendimiento y baja latencia a escala de nube.

Implemente NIM

Implemente NIM en su modelo con un solo comando. También puede ejecutar fácilmente NIM con gramdes modelos de lenguaje (LLM) compatibles con NVIDIA TensorRT-LLM, vLLM o SGLang, incluidos los modelos perfeccionados.

Ejecute Inferencia

Comience a usar NIM con el motor de tiempo de ejecución óptimo basado en su infraestructura acelerada por NVIDIA.

Desarrolle

Integre terminales NIM autoalojados con tan solo unas pocas líneas de código.

Deploy

Run

Build

docker run nvcr.io/nim/publisher_name/model_name

 
 curl -X 'POST' \ 
  'http://0.0.0.0:8000/v1/completions' \ 
  -H 'accept: application/json' \ 
  -H 'Content-Type: application/json' \ 
  -d '{ 
  "model" : "model_name", 
  "prompt" : "Once upon a time", 
  "max_tokens" : 64 
 }' 

 
 import openai 
 client = openai.OpenAI( 
  base_url = "YOUR_LOCAL_ENDPOINT_URL", 
  api_key="YOUR_LOCAL_API_KEY" 
 ) 
 chat_completion = client.chat.completions.create( 
  model="model_name", 
  messages=[{"role" : "user" , "content" : "Write me a love song" }], 
  temperature=0.7 
 ) 

Casos de Uso

Cómo se Está Usando NIM

Vea cómo la NVIDIA NIM respalda casos de uso de la industria y comience rápidamente su desarrollo de IA con ejemplos seleccionados.

Asistentes Virtuales de IA
Inteligencia en Documentos
Compras Hiperpersonalizadas
Configuradores de Productos 3D

Asistentes Virtuales de IA

Mejore la experiencia del cliente y los procesos empresariales con la IA generativa.

Más Información Sobre la IA para la Asistencia al Cliente

Desarrolle Ahora

Procesamiento Inteligente de Documentos

Use la IA generativa para acelerar y automatizar el procesamiento de documentos.

Obtenga Información Sobre el Procesamiento Inteligente de Documentos

Desarrolle Ahora

IA para Compras Hiperpersonalizadas

Ofrezca experiencias personalizadas que mejoren la satisfacción del cliente con el poder de la IA.

Más Información Sobre las Compras Hiperpersonalizadas

Desarrolle Ahora

Configuradores de Productos 3D

Use OpenUSD y la IA generativa para desarrollar e implementar herramientas y experiencias del configurador de productos 3D en casi cualquier dispositivo.

Más Información Sobre los Configuradores de Productos 3D

Opciones de Inicio

Maneras de empezar a usar NVIDIA NIM

Comience a Crear Prototipos Gratis

Comience con terminales de API fáciles de usar para NIM, que funcionan con DGX Cloud.

Acceda a una infraestructura de IA totalmente acelerada.
Asegúrese de que sus datos no se usen para el entrenamiento de modelos.
Acceso para desarrollo y pruebas como parte del Programa para Desarrolladores de NVIDIA.

Desarrolle Ahora

Descargue e Implemente

Ejecute NVIDIA NIM para escalar modelos de IA optimizados en la nube o el data center que elija.

Asegúrese de que los datos nunca abandonen su enclave seguro.
Haga la transición sin problemas de los terminales en la nube a las API autoalojadas sin cambios de código.
Comience con acceso gratuito para desarrollo y pruebas y luego cambie a una licencia de NVIDIA AI Enterprise para la producción.

Implemente Ahora

Contáctenos

Hable con un especialista en IA de NVIDIA sobre la transición de los proyectos de IA generativa en fase de pruebas a la producción con la seguridad, la estabilidad de API y la asistencia que trae NVIDIA AI Enterprise.

Explore sus casos de uso de IA generativa.
Analice sus requisitos técnicos.
Alinee las soluciones de IA de NVIDIA con sus objetivos y requisitos.

Comuníquese con Ventas

Desarrolle Ahora

Recursos

Los Recursos de NVIDIA NIM Más Recientes

Blogs
Sesiones
Cursos
Videos

NVIDIA NIM en las Noticias

Vea Todos los Blogs de Tecnología Vea Noticias de Todos los Temas

Vea Todas las Sesiones

Introducción a los Microservicios NVIDIA NIM

Descubra cómo NIM posibilita el desarrollo, la implementación y el escalado de aplicaciones de IA.

Vea el Curso

Dimensionamiento de Sistemas de Inferencia de LLM

Aprenda a optimizar e implementar grandes modelos de lenguaje con los microservicios NIM para aplicaciones del mundo real.

Vea el Curso

Desarrollo de un Generador de Fondos de IA con NIM

Revise el proceso de creación de una aplicación basada en el Kit NVIDIA Omniverse™ habilitado por IA. Aprenderá a usar las extensiones de Omniverse, los microservicios NIM y código Python para agregar una extensión capaz de generar fondos a partir de una entrada de texto.

Vea el Curso

Vea Todos los Cursos

Cómo Desarrollar un Agente de IA Simple en 5 Minutos con NVIDIA NIM

Vea cómo configurar dos agentes de IA: uno para la generación de contenido y otro para diseño gráfico digital.

Vea Ahora (04:09)

Microservicios NVIDIA NIM para PC con IA RTX

Aproveche los modelos de IA generativa más recientes de forma local en su PC con IA NVIDIA RTX™ equipada con NVIDIA NIM y NVIDIA Blueprints.

Vea Ahora (01:10)

Inferencia de IA Generativa Impulsada por NVIDIA NIM

Visualice el impacto de la inferencia de IA generativa de alto desempeño con los microservicios NVIDIA NIM.

Vea Ahora (02:33)

Vea Todos los Videos

Próximos Pasos

¿Todo Listo para Empezar?

Obtenga acceso ilimitado a los terminales de la API NIM para la creación de prototipos, con la aceleración de DGX Cloud. Cuando todo esté listo para comenzar la producción, descargue y autoaloje NIM en su infraestructura preferida: workstation, data center, edge o nube, o acceda a los terminales de NIM alojados por socios de NVIDIA.

Empiece Ahora

Contáctenos

Hable con un especialista de productos de NVIDIA sobre el paso de la fase de pruebas a la de producción con la seguridad, la estabilidad de API y la asistencia incluidas con NVIDIA AI Enterprise.

Contáctenos

Manténgase al Día Sobre las Noticias de NVIDIA NIM

Reciba las últimas noticias, tecnologías, avances y más directamente en su bandeja de entrada.

Manténgase al Día