Microsserviços NVIDIA NIM

Projetados para implantação rápida e confiável de inferência de IA generativa acelerada em qualquer lugar.

Comece Agora

Vídeo | Resumo da Solução | Documentação | Para Desenvolvedores

Visão Geral
Benefícios
Demonstração
Tecnologia
Benchmarks
Modelos
Recursos
Casos de Uso
Opções de Inicialização
Recursos
Próximos Passos

Visão Geral
Benefícios
Demonstração
Tecnologia
Benchmarks
Modelos
Recursos
Casos de Uso
Opções de Inicialização
Recursos
Próximos Passos

Comece Agora

Visão Geral

O Que É o NVIDIA NIM?

O NVIDIA NIM™ fornece microsserviços de inferência pré-construídos e otimizados para a implantação rápida dos modelos de IA mais recentes em qualquer infraestrutura acelerada pela NVIDIA: nuvem, data center, workstation e edge.

Agentes de IA Soberana Processam Localmente e Agem Globalmente com as Fábricas de IA da NVIDIA

O design validado para fábricas de IA combina a infraestrutura acelerada com software, incluindo os novos recursos do NVIDIA NIM™ e um pacote expandido de blueprints da NVIDIA.

Leia o Blog

Acesso Gratuito de Desenvolvimento ao NIM

Tenha acesso à prototipagem ilimitada com APIs hospedadas para o NIM aceleradas pelo DGX Cloud ou faça o download e hospede você mesmo os microsserviços NIM para pesquisa e desenvolvimento como parte do Programa de Desenvolvedores NVIDIA.

Experimente as APIs

Acelere a Implantação de IA com o NVIDIA NIM

O NVIDIA NIM combina a facilidade de uso e a simplicidade operacional das APIs gerenciadas com a flexibilidade e segurança dos modelos de auto-hospedagem na sua infraestrutura preferida. Os microsserviços NIM acompanham tudo o que as equipes de IA precisam: modelos fundacionais de IA mais recentes, mecanismos de inferência otimizados, APIs padrão do setor e dependências de tempo de execução, pré-empacotados em contêineres de software de nível empresarial prontos para implantação e dimensionamento em qualquer lugar.

Benefícios

IA Generativa Empresarial Que Faz Mais por Menos

Os microsserviços fáceis e prontos para produção são criados para IA de alto desempenho e projetados para trabalhar perfeitamente e escalar de forma acessível. Comece a criar agentes de IA e outras aplicações de IA Generativa empresarial mais rapidamente com os modelos de IA mais recentes para inferência, simulação, fala e muito mais.

Facilidade de Uso

Acelere a inovação e o tempo de chegada ao mercado com microsserviços pré-construídos e otimizados para os modelos de IA mais recentes. Com APIs padrão, os modelos podem ser implantados em cinco minutos e facilmente integrados às aplicações.

Assista: Implante o NIM em 5 Minutos

Nível Empresarial

Implante microsserviços de nível empresarial que são continuamente gerenciados pela NVIDIA por meio de processos de validação rigorosos e ramais de recursos dedicados, todos com suporte empresarial da NVIDIA, que também oferece acesso direto aos seus especialistas em IA.

Desempenho e Escala

Melhore o TCO com a inferência de IA de baixa latência e alto rendimento que escala com a nuvem, e alcance a melhor precisão com suporte para modelos minuciosamente ajustados e prontos para uso.

Assista: Vantagens de Desempenho e TCO do NIM

Portabilidade

Implante em qualquer lugar com microsserviços pré-construídos e nativos de nuvem prontos para execução em qualquer infraestrutura acelerada pela NVIDIA (nuvem, data center e workstation) e escale com perfeição em ambientes Kubernetes e de provedores de serviços de nuvem.

Demonstração

Crie Agentes de IA Com o NIM

Saiba como configurar dois agentes de IA, um para geração de conteúdo e outro para design gráfico digital, e veja como é fácil começar a usar os microsserviços NIM.

Assista Agora

Tecnologia

Bases para a IA Baseada em Agentes

Obtenha os Modelos de IA Mais Recentes

Acesse os modelos de IA mais recentes para lógica, linguagem, recuperação, fala, visão e muito mais, prontos para implantação em cinco minutos em qualquer infraestrutura acelerada pela NVIDIA.

Experimente Agora

Dê Início ao Desenvolvimento com os NVIDIA Blueprints

Crie aplicações de IA baseada em agentes impactantes com workflows de referência abrangentes que incluem bibliotecas de aceleração da NVIDIA, SDKs e microsserviços NIM.

Saiba Mais Experimente Agora

Simplifique o Desenvolvimento com o Kit de Ferramentas NVIDIA AgentIQ

Transforme microsserviços NIM em aplicações de IA baseadas em agentes com a biblioteca NVIDIA AgentIQ, um kit de ferramentas para desenvolvedores projetado para a criação de agentes de IA e sua integração em workflows personalizados.

Saiba Mais Experimente Agora

Benchmarks

Aumente o Rendimento com o NIM

O NVIDIA NIM fornece rendimento e latência otimizados desde o início para maximizar a geração de tokens, além de oferecer suporte a usuários simultâneos em horários de pico e melhorar a capacidade de resposta. Os microsserviços NIM são continuamente atualizados com os mecanismos de inferência otimizados mais recentes, aumentando o desempenho na mesma infraestrutura ao longo do tempo.

Configuração: instrução Llama 3.1 8B, 1 unidade de H100 SXM; solicitações simultâneas: 200. NIM ATIVO: FP8, rendimento de 1201 tokens/s, ITL de 32 ms. NIM INATIVO: FP8, rendimento de 613 tokens/s, ITL de 37 ms.

Modelos

Aproveite a Inferência de Nível Empresarial para Milhares de Modelos Abertos

Implante grandes modelos de linguagem (LLMs) com o suporte do NVIDIA® TensorRT™-LLM, vLLM ou SGLang para inferência de baixa latência e alto rendimento na infraestrutura com aceleração NVIDIA

Conheça os Modelos

Recursos

O Modo Fácil para o Desenvolvimento e a Implantação de IA

Designed to run anywhere, NIM microservices expose industry-standard APIs for easy integration with enterprise systems and applications and scale seamlessly on Kubernetes to deliver high-throughput, low-latency inference at cloud scale.

Implante o NIM

Implante o NIM para o seu modelo com um único comando. Também é possível executar facilmente o NIM com LLMs suportados pelo NVIDIA TensorRT-LLM, vLLM ou SGLang, incluindo modelos com ajuste fino.

Inferência de Execução

Coloque o NIM em funcionamento com o mecanismo de tempo de execução ideal baseado em sua infraestrutura acelerada pela NVIDIA.

Criação

Integre os terminais auto-hospedados do NIM com apenas algumas linhas de código.

Deploy

Run

Build

docker run nvcr.io/nim/publisher_name/model_name

 
 curl -X 'POST' \ 
  'http://0.0.0.0:8000/v1/completions' \ 
  -H 'accept: application/json' \ 
  -H 'Content-Type: application/json' \ 
  -d '{ 
  "model" : "model_name", 
  "prompt" : "Once upon a time", 
  "max_tokens" : 64 
 }' 

 
 import openai 
 client = openai.OpenAI( 
  base_url = "YOUR_LOCAL_ENDPOINT_URL", 
  api_key="YOUR_LOCAL_API_KEY" 
 ) 
 chat_completion = client.chat.completions.create( 
  model="model_name", 
  messages=[{"role" : "user" , "content" : "Write me a love song" }], 
  temperature=0.7 
 ) 

Casos de Uso

Como o NIM Está Sendo Usado

Veja como o NVIDIA NIM é compatível com casos de uso do setor e comece seu desenvolvimento de IA com exemplos selecionados.

Assistentes Virtuais de IA
Inteligência de Documentos
Compras Hiperpersonalizadas
Configuradores de Produtos 3D

Assistentes Virtuais de IA

Aprimore as experiências dos clientes e melhore os processos empresariais com a IA generativa.

Saiba Mais Sobre a IA no Atendimento ao Cliente

Crie Agora

Processamento Inteligente de Documentos

Use a IA generativa para acelerar e automatizar o processamento de documentos.

Saiba Mais Sobre o Processamento Inteligente de Documentos

Crie Agora

IA para Compras Hiperpersonalizadas

Ofereça experiências customizadas que melhoram a satisfação do cliente com o poder da IA.

Saiba Mais Sobre Compras Hiperpersonalizadas

Crie Agora

Configuradores de Produtos 3D

Use o OpenUSD e a IA generativa para desenvolver e implantar ferramentas e experiências de configuradores de produtos 3D em praticamente qualquer dispositivo.

Saiba Mais Sobre os Configuradores de Produtos 3D

Opções de Inicialização

Maneiras de Começar a Usar o NVIDIA NIM

Comece a Prototipar Gratuitamente

Comece agora com os terminais de API fáceis de usar para o NIM, com tecnologia DGX Cloud.

Acesse a infraestrutura de IA totalmente acelerada.
Garanta que seus dados não sejam usados para o treinamento de modelos.
Acesso para desenvolvimento e testes como parte do Programa de Desenvolvedores NVIDIA.

Crie Agora

Faça o Download e Comece a Implantar

Execute o NVIDIA NIM para escalar modelos de IA otimizados na nuvem ou no data center de sua escolha.

Garanta que os dados nunca saiam do seu perímetro seguro.
Transite de forma fluida dos terminais na nuvem para APIs auto-hospedadas sem alterações de código.
Comece com acesso gratuito para o desenvolvimento e testes e mude para uma licença NVIDIA AI Enterprise para a produção.

Implante Agora

Entre em Contato

Converse com um especialista em IA da NVIDIA sobre como migrar a fases de testes da IA generativa para a produção com a segurança, a estabilidade da API e o suporte que acompanham o NVIDIA AI Enterprise.

Explore seus casos de uso de IA generativa.
Discuta seus requisitos técnicos.
Alinhe as soluções de IA da NVIDIA com seus objetivos e exigências.

Contate a Equipe Comercial

Crie Agora

Recursos

Os Recursos Mais Recentes do NVIDIA NIM

Blogs
Sessões
Cursos
Vídeos

NVIDIA NIM nas Notícias

Veja Todos os Blogs de Tecnologia Veja Todas as Notícias do Assunto

Veja Todas as Sessões

Introdução aos Microsserviços NVIDIA NIM

Saiba como o NIM permite a criação, a implantação e o escalamento de aplicações de IA.

Veja o Curso

Dimensionamento de Sistemas de Inferência para LLM

Saiba como otimizar e implantar grandes modelos de linguagem usando os microsserviços NIM para aplicações reais.

Veja o Curso

Desenvolvendo um Gerador de Fundo com IA com o NIM

Analise o processo de criação de uma aplicação baseada no kit NVIDIA Omniverse™ habilitada para IA. Você aprenderá como usar as extensões do Omniverse, os microsserviços NIM e o código Python para adicionar uma extensão capaz de gerar fundos a partir de entradas de texto.

Veja o Curso

Veja Todos os Cursos

Como Criar um Agente de IA Simples em 5 Minutos com o NVIDIA NIM

Veja como configurar dois agentes de IA: um para geração de conteúdo e outro para design gráfico digital.

Assista Agora (04:09)

Microsserviços NVIDIA NIM para PCs RTX com IA

Aproveite os modelos de IA generativa mais recentes localmente no seu PC NVIDIA RTX™ com IA através do NVIDIA NIM e dos NVIDIA Blueprints.

Assista Agora (01:10)

Inferência de IA Generativa com Tecnologia NVIDIA NIM

Visualize o impacto da inferência de IA generativa de alto desempenho com os microsserviços NVIDIA NIM.

Assista Agora (02:33)

Veja Todos os Vídeos

Próximos Passos

Pronto para Começar?

Tenha acesso ilimitado aos terminais da API do NIM para prototipagem, acelerada pelo DGX Cloud. Quando tudo estiver pronto para a produção, faça o download e hospede você mesmo o NIM na sua infraestrutura preferida (workstation, data center, edge ou nuvem) ou acesse os terminais do NIM hospedados por parceiros da NVIDIA.

Comece Agora

Entre em Contato

Converse com um especialista em produtos da NVIDIA sobre como migrar da fase de testes para a produção com a segurança, a estabilidade da API e o suporte que acompanham o NVIDIA AI Enterprise.

Fale Conosco

Atualize-se Com as Notícias Sobre IA da NVIDIA

Receba as últimas notícias, tecnologias, avanços e muito mais diretamente na sua caixa de entrada.

Fique por Dentro