Implementa al Instante la IA Generativa con NVIDIA NIM

Explora los últimos modelos de IA creados por la comunidad con una API optimizada y acelerada por NVIDIA, e implementa en cualquier lugar con los microservicios de inferencia NVIDIA NAM™.

Experimente Modelos Abiertos Líderes Ahora


Integraciones

La IA Acelerada Está a Solo Una API de Distancia

Póngase en marcha rápidamente con API conocidas.

Compatibilidad Perfecta con Bibliotecas Populares

Aproveche las API de NVIDIA de sus SDK existentes con tan solo tres líneas de código.

import openai
client = openai.OpenAI(
base_url = "https://integrate.api.nvidia.com/v1",
api_key="YOUR_NVIDIA_API_KEY"
)
chat_completion = client.chat.completions.create(
model="mistralai/mixtral-8x7b-instruct-v0.1",
messages=[{"role" : "user" , "content" : "Write me a love song" }],
temperature=0.7
)

Construya con las Herramientas Que Ama

Trabaje con sus frameworks de programación LLM favoritos, incluidos LangChain y LlamaIndex, e implemente fácilmente sus aplicaciones.


Corre en Cualquier Lugar

Acelere Su Implementación de IA con NVIDIA NIM

Como parte de NVIDIA AI Enterprise, NVIDIA NIM es un conjunto de microservicios fáciles de usar para acelerar la implementación de modelos básicos en cualquier nube o data center y ayuda a mantener sus datos seguros.

Accelerate Your AI Deployment With NVIDIA NIM

Implementa NIM

Implemente NIM para su modelo con un solo comando. También puede ejecutar NIM fácilmente con modelos optimizados.

Ejecuta Inferencia

Ponga en funcionamiento NIM con el motor de ejecución óptimo basado en su infraestructura acelerada por NVIDIA.

Construya

Los desarrolladores pueden integrar puntos finales NIM autoalojados con solo unas pocas líneas de código.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Lanzamiento Local o Escalado con Kubernetes

Implementa sin problemas microservicios de IA en contenedores en cualquier infraestructura acelerada de NVIDIA, desde un solo dispositivo hasta la escala del data center.

Implemente de Forma Segura y con Confianza

Confíe en los tiempos de ejecución de nivel de producción, incluidas las actualizaciones de seguridad continuas, y ejecute sus aplicaciones empresariales con API estables respaldadas por soporte de nivel empresarial.

Reducción de Costes y de Huella de Carbono

Reduzca el costo operativo de ejecutar modelos en producción con tiempos de ejecución de IA que se optimizan continuamente para lograr baja latencia y alto rendimiento en la infraestructura acelerada por NVIDIA.

Rendimiento

NVIDIA NIM proporciona un rendimiento y una latencia optimizados desde el primer momento para maximizar la generación de tokens, admitir usuarios simultáneos en las horas pico y mejorar la capacidad de respuesta.


Configuración: Llama 3-70b-instruct, longitud del token de entrada: 7000, longitud del token de salida: 1000. Solicitudes de cliente simultáneas: 100, en 4 NVLink SXM H100. NIM DESACTIVADO: FP16, TTFT: ~120 s, ITL: ~180 ms; NIM ACTIVADO: FP8, TTFT: ~4,5 s, ITL: ~70 ms.

Vea los NIM de NVIDIA en Acción

Empeza Ahora

Comience a Crear Prototipos de Forma Gratuita

Comience con las API sin servidor administradas por NVIDIA y fáciles de usar.

  • Acceda a una infraestructura de IA totalmente acelerada.
  • Asegúrese de que sus datos no se utilicen para el entrenamiento de modelos.
  • Comience de forma gratuita con 1000 créditos de inferencia.

Descarga e Implementa

Ejecute NVIDIA NIM para escalar modelos de IA optimizados en la nube o en el data center de su elección.

  • Asegúrese de que los datos nunca abandonen su enclave seguro.
  • Realice una transición sin inconvenientes desde puntos de conexión en la nube a API alojadas internamente sin cambios en el código.
  • Use una licencia NVIDIA AI Enterprise para producción o comience de forma gratuita con el Programa para Desarrolladores de NVIDIA.

Casos de Uso

Enciende Tu Innovación

Vea cómo las API de NVIDIA respaldan los casos de uso de la industria e impulse su desarrollo de IA con ejemplos seleccionados.

Humanos Digitales

Da vida a los personajes del game o crea avatares virtuales interactivos para mejorar el servicio al cliente, permitiendo que tu aplicación se conecte más profundamente con los usuarios.

Generación de Contenido

Genere contenido altamente relevante, personalizado y preciso, basado en la experiencia del dominio y la propiedad intelectual de su empresa.

Generación Biomolecular

Los modelos generativos biomoleculares y el poder computacional de las GPU exploran de manera eficiente el espacio químico, generando rápidamente diversos conjuntos de moléculas pequeñas adaptadas a objetivos o propiedades farmacológicas específicas.

Ecosistema

Lleve Su IA Empresarial Más Lejos y Más Rápido

Desarrolle sus aplicaciones de IA con modelos, kits de herramientas, bases de datos
vectoriales, frameworks e infraestructura con nuestros socios líderes.

Recursos

Desbloquear, Mejorar Habilidades y Mejorar

NVIDIA LaunchPad

Desbloquea la IA con un Laboratorio Práctico

Experimente soluciones de IA de extremo a extremo a través de laboratorios prácticos guiados para frameworks de desarrollo, chatbots basados en generación aumentada de recuperación (RAG), optimizaciones de rutas y más.

Programa para Desarrolladores de NVIDIA

Acelere Sus Aplicaciones de IA

Obtén acceso gratuito a NIM para el desarrollo de aplicaciones, la investigación y las pruebas, además de recursos de aprendizaje técnico a través del Programa para Desarrolladores de NVIDIA.

AI Workbench

Empieza Pequeño. Escala Grande

NVIDIA AI Workbench ofrece a los desarrolladores la flexibilidad de ejecutar modelos habilitados para API en contenedores locales o remotos con GPU, lo que permite workflows de proyectos interactivos, desde la experimentación hasta la creación de prototipos y la prueba de concepto.

Noticias

Explora NVIDIA NIM en las Noticias

Consulta los últimos comunicados de prensa de NVIDIA para ver cómo NIM y la IA generativa están afectando a las industrias, los socios, los clientes y más.

Documentación

Explora la documentación técnica para comenzar a crear prototipos y crear aplicaciones de IA empresariales con las API de NVIDIA, o escala en tu propia infraestructura con NVIDIA NIM.