Microservicios NVIDIA NIM

Diseñados para posibilitar una implementación rápida y fiable de la inferencia de IA generativa acelerada en cualquier lugar.

Empezar

Vídeo | Resumen de la solución | Documentación | Para desarrolladores

Descripción
Ventajas
Demostración
Tecnología
Pruebas de rendimiento
Modelos
Características
Casos de uso
Cómo empezar
Recursos
Próximos pasos

Descripción
Ventajas
Demostración
Tecnología
Pruebas de rendimiento
Modelos
Características
Casos de uso
Cómo empezar
Recursos
Próximos pasos

Empezar

Descripción

¿Qué es NVIDIA NIM?

NVIDIA NIM™ ofrece microservicios de inferencia optimizados y prediseñados para implementar rápidamente los últimos modelos de IA en cualquier infraestructura acelerada por NVIDIA: la nube, el centro de datos, la estación de trabajo y el perímetro.

Los agentes de IA soberana piensan localmente y actúan globalmente con las fábricas de IA de NVIDIA

El diseño validado para fábricas de IA combina la infraestructura acelerada con el software, incluidas las nuevas capacidades de NVIDIA NIM™ y un conjunto ampliado de blueprints de NVIDIA.

Leer el blog

Acceso de desarrollo gratuito a NIM

Obtenga acceso a creación de prototipos ilimitada con API alojadas para NIM aceleradas por DGX Cloud, o descargue y autoaloje microservicios NIM para investigación y desarrollo como parte del programa de desarrolladores de NVIDIA.

Pruebe las API

Acelere la implementación de IA con NVIDIA NIM

NVIDIA NIM combina la facilidad de uso y la simplicidad operativa de las API gestionadas con la flexibilidad y la seguridad de los modelos autohospedados en su infraestructura preferida. Los microservicios NIM incluyen todo lo que los equipos de IA requieren —los últimos modelos básicos de IA, motores de inferencia optimizados, interfaces API estándar del sector y dependencias en tiempo de ejecución— preempaquetados en contenedores de software de nivel empresarial listos para que puedan implementarse y escalarse en cualquier lugar.

Ventajas

IA generativa empresarial que hace más por menos

Microservicios sencillos de nivel empresarial construidos para la IA de alto rendimiento, diseñados para funcionar a la perfección y escalar de forma asequible. Experimente el tiempo de obtención de valor más rápido para agentes de IA y otras aplicaciones de IA generativa empresarial, impulsadas por los últimos modelos de IA para razonamiento, simulación, voz y mucho más.

Facilidad de uso

Acelere la innovación y el tiempo de comercialización con microservicios optimizados y prediseñados para los últimos modelos de IA. Con las API estándar, los modelos se pueden implementar en cinco minutos e integrarse fácilmente en las aplicaciones.

Ver: Implemente NIM en 5 minutos

Nivel empresarial

Implemente microservicios de nivel empresarial que NVIDIA gestiona continuamente a través de procesos de validación rigurosos y ramificaciones de características dedicadas, todo ello respaldado por el soporte empresarial de NVIDIA, que ofrece además acceso directo a los expertos de NVIDIA AI.

Rendimiento y escala

Mejore el coste total de la propiedad (TCO) mediante la inferencia de IA de alta capacidad de procesamiento y baja latencia que escala con la nube y logre la mejor precisión con compatibilidad para modelos ajustados con precisión listos para usar.

Ver: Ventaja de rendimiento y coste total de la propiedad de NIM

Portabilidad

Implemente donde quiera con microservicios prediseñados, nativos de la nube, listos para ejecutarse en cualquier infraestructura acelerada por NVIDIA (nube, centro de datos o estación de trabajo) y escale sin complicaciones en entornos de Kubernetes y de proveedor de servicios en la nube.

Demostración

Cree agentes de IA con NIM

Aprenda a configurar dos agentes de IA, uno para la generación de contenido y otro para el diseño gráfico digital, y compruebe lo fácil que resulta ponerse en marcha con los microservicios NIM.

Verlo ahora

Tecnología

Bloques de construcción para la IA de agentes

Obtenga los modelos de IA más recientes

Acceda a los últimos modelos de IA para razonamiento, lenguaje, recuperación, habla, visión y mucho más, preparados para su implementación en cinco minutos en cualquier infraestructura acelerada por NVIDIA.

Probar ahora

Impulse el desarrollo con NVIDIA Blueprints

Cree impactantes aplicaciones de IA de agentes, con flujos de trabajo de referencia integrales que incorporan bibliotecas de aceleración de NVIDIA, kits de desarrollo y microservicios NIM.

Más información Pruébelo ahora

Simplifique el desarrollo con el kit de herramientas NVIDIA AgentIQ

Integre microservicios NIM en aplicaciones de IA de agentes con la biblioteca NVIDIA AgentIQ, un kit de herramientas de desarrollo para crear agentes de IA e integrarlos en flujos de trabajo personalizados.

Más información Pruébelo ahora

Pruebas de rendimiento

Potencie la capacidad de procesamiento con NIM

NVIDIA NIM ofrece capacidad de procesamiento y latencia optimizados preparados para maximizar la generación de tokens, admitir usuarios simultáneos en momentos pico y mejorar la capacidad de respuesta. Los microservicios NIM se actualizan continuamente con los últimos motores de inferencia optimizados y aumentan el rendimiento en la misma infraestructura con el tiempo.

Configuración: instrucción Llama 3.1 8B, 1 H100 SXM; solicitudes simultáneas: 200. NIM ACTIVADO: FP8, rendimiento 1201 tokens/s, ITL 32 ms. NIM DESACTIVADO: FP8, rendimiento de 613 tokens/seg, ITL 37 ms.

Modelos

Libere la inferencia lista para empresas para miles de modelos abiertos

Implemente modelos lingüísticos de gran tamaño (LLM) compatibles con NVIDIA® TensorRT™-LLM, vLLM o SGLang para una inferencia de baja latencia y alto rendimiento en una infraestructura acelerada por NVIDIA.

Explorar modelos

Características

El botón fácil para el desarrollo y la implementación de IA

Al estar diseñados para ejecutarse en cualquier lugar, los microservicios de inferencia NIM ponen a su disposición las API estándar del sector para simplificar la integración con los sistemas y aplicaciones empresariales y escalan de forma impecable en Kubernetes para brindar una inferencia de alta capacidad de procesamiento y baja latencia a escala de nube.

Implemente NIM

Implemente NIM para su modelo con un solo comando. También puede ejecutar NIM fácilmente con LLM compatibles con NVIDIA TensorRT-LLM, vLLM o SGLang, incluidos modelos ajustados.

Ejecute inferencia

Ponga en marcha NIM con el motor de tiempo de ejecución óptimo basado en su infraestructura acelerada por NVIDIA.

Desarrolle

Los desarrolladores pueden integrar puntos finales NIM autohospedados con tan solo unas pocas líneas de código.

Deploy

Run

Build

docker run nvcr.io/nim/publisher_name/model_name

 
 curl -X 'POST' \ 
  'http://0.0.0.0:8000/v1/completions' \ 
  -H 'accept: application/json' \ 
  -H 'Content-Type: application/json' \ 
  -d '{ 
  "model" : "model_name", 
  "prompt" : "Once upon a time", 
  "max_tokens" : 64 
 }' 

 
 import openai 
 client = openai.OpenAI( 
  base_url = "YOUR_LOCAL_ENDPOINT_URL", 
  api_key="YOUR_LOCAL_API_KEY" 
 ) 
 chat_completion = client.chat.completions.create( 
  model="model_name", 
  messages=[{"role" : "user" , "content" : "Write me a love song" }], 
  temperature=0.7 
 ) 

Casos de uso

Cómo se está usando NIM

Compruebe cómo NVIDIA NIM resulta útil en casos de uso del sector e inicie su desarrollo de IA con ejemplos seleccionados.

Asistentes virtuales de IA
Inteligencia de documentos
Compras hiperpersonalizadas
Configuradores de producto 3D

Asistentes virtuales de IA

Mejore las experiencias de los clientes y los procesos empresariales en las telecomunicaciones con la IA generativa.

Más información sobre la IA para atención al cliente

Crear ahora

Procesamiento inteligente de documentos

Use la IA generativa para acelerar y automatizar el procesamiento de documentos.

Más información sobre el procesamiento inteligente de documentos

Crear ahora

IA para las compras hiperpersonalizadas

Ofrezca experiencias personalizadas que incrementen la satisfacción del cliente con la tecnología de la IA.

Más información sobre las compras hiperpersonalizadas

Crear ahora

Configuradores de producto 3D

Utilice OpenUSD y la IA generativa para desarrollar e implementar herramientas y experiencias de configurador de productos 3D en prácticamente cualquier dispositivo.

Más información sobre configuradores de productos 3D

Cómo empezar

Maneras de empezar a usar NVIDIA NIM

Empiece a crear prototipos gratis

Empiece con puntos finales de API fáciles de usar para NIM, con tecnología de DGX Cloud.

Acceda a una infraestructura de IA totalmente acelerada.
Asegúrese de que sus datos no se utilizan para el entrenamiento de modelos.
Acceda para desarrollo y pruebas como parte del programa de desarrolladores de NVIDIA.

Crear ahora

Descargar e implementar

Ejecute NVIDIA NIM para escalar modelos de IA optimizados en la nube o en el centro de datos que prefiera.

Asegúrese de que los datos nunca salgan de su enclave seguro.
Transición perfecta de puntos finales de la nube a API autoalojadas sin cambios de código.
Empiece con acceso gratuito para desarrollo y pruebas y pase a una licencia de NVIDIA AI Enterprise para producción.

Implemente ahora

Contáctenos

Hable con un especialista en IA de NVIDIA sobre cómo implantar pilotos de IA generativa en la fase de producción con la seguridad, la estabilidad de API y la asistencia técnica que ofrece NVIDIA AI Enterprise.

Explore sus casos de uso de IA generativa.
Hable sobre sus requisitos técnicos.
Ajuste las soluciones de IA de NVIDIA a sus objetivos y requisitos.

Contactar con un comercial

Crear ahora

Recursos

Los últimos recursos de NVIDIA NIM

Blogs
Sesiones
Cursos
Vídeos

NVIDIA NIM en las noticias

Ver todos los blogs técnicos Ver todas las novedades sobre el tema

Ver todas las sesiones

Introducción a los microservicios NVIDIA NIM

Descubra cómo NIM posibilita la creación, implementación y escalado de aplicaciones de IA.

Ver el curso

Dimensionamiento de sistemas de inferencia de LLM

Descubra cómo optimizar e implementar modelos lingüísticos de gran tamaño con microservicios NIM para aplicaciones del mundo real.

Ver el curso

Desarrollar un generador de fondos de IA con NIM

Analice el proceso de creación de una aplicación habilitada por IA y basada en el Kit NVIDIA Omniverse™. Aprenderá a utilizar extensiones de Omniverse, los microservicios NIM y código Python para agregar una extensión con capacidad de generar fondos a partir de entrada de texto.

Ver el curso

Ver todos los cursos

Cómo crear un agente de IA sencillo en 5 minutos con NVIDIA NIM

Descubra cómo configurar dos agentes de IA: uno para la generación de contenido y otro para el diseño gráfico digital.

Ver vídeo ahora (04:09)

Microservicios NVIDIA NIM para ordenadores con IA RTX

Saque el máximo partido de los últimos modelos de IA generativa de forma local en su ordenador con IA NVIDIA RTX™ equipados con NVIDIA NIM y NVIDIA Blueprints.

Ver vídeo ahora (01:10)

Inferencia de IA generativa con la tecnología de NVIDIA NIM

Observe las repercusiones de la inferencia de IA generativa de alto rendimiento con los microservicios NVIDIA NIM.

Ver vídeo ahora (02:33)

Ver todos los vídeos

Próximos pasos

¿Listo para empezar?

Obtenga acceso ilimitado a puntos finales de la API NIM para creación de prototipos, acelerada por DGX Cloud. Cuando esté listo para producción, descargue y autoaloje NIM en su infraestructura preferida (estación de trabajo, centro de datos, perímetro o nube), o acceda a puntos finales NIM alojados por partners de NVIDIA.

Empezar

Contáctenos

Hable con un especialista en productos de NVIDIA sobre cómo pasar de la fase piloto a la de producción con la seguridad, estabilidad de API y asistencia técnica que ofrece NVIDIA AI Enterprise.

Contactar

Manténgase al día sobre las noticias de NVIDIA NIM

Reciba las últimas noticias, tecnologías, avances y mucho más, directamente en su bandeja de entrada.

Manténgase informado