NVIDIA Nemotron

Modelos multimodais abertos e eficientes para IA baseada em agentes.

Visão Geral

O que é o NVIDIA Nemotron?

O NVIDIA Nemotron™ é uma família de modelos abertos, conjuntos de dados e tecnologias que capacitam você a criar sistemas de IA eficientes, precisos e especializados baseados em agentes. Projetados para processamento lógico avançado, codificação, compreensão visual, tarefas baseadas em agentes, segurança e recuperação de informações, os modelos do Nemotron estão disponíveis abertamente e integrados em todo o ecossistema de IA para poderem ser implantados em qualquer lugar, da borda à nuvem.

Com dados de treinamento transparentes e amplo suporte à plataforma, o Nemotron facilita a criação e a implantação de agentes de IA confiáveis e de alto desempenho.

Construindo o futuro juntos: conheça a coalizão Nemotron

Mistral AI, Black Forest Labs, Thinking Machines Lab, Reflection AI, Cursor, LangChain, Sarvam e Perplexity unem forças para criar os próximos modelos de fronteira aberta.

NVIDIA Expande modelos abertos para IA física e baseada em agentes.

Novos modelos abertos impulsionam IA de agentes, IA física para robótica, e pesquisas na Área da Saúde.

Vídeo

Por Que a NVIDIA Criou o Nemotron

Ouça Bryan Catanzaro, vice-presidente de pesquisa de deep learning aplicada da NVIDIA, falar sobre a visão por trás do Nemotron e por que as tecnologias abertas são essenciais para criar IA confiável e pronta para empresas.

Vantagens

Como o Nemotron funciona para Agentes Autônomos de IA?

Modelos Abertos

As técnicas de otimização e dados abertos da NVIDIA garantem modelos potentes, transparentes e adaptáveis para desenvolvedores e empresas. Os modelos e dados de treinamento são publicados abertamente no Hugging Face.

Alta Eficiência de Computação

Por meio da poda de modelos maiores, a família Nemotron é otimizada para a máxima eficiência de computação, usando o NVIDIA TensorRT™-LLM para oferecer maior taxa de transferência e capacidades de raciocínio que podem ser ligadas ou desligadas.

Alta Precisão

Criados com base em modelos de raciocínio aberto populares por seu conhecimento excepcional, pós-treinados com dados de treinamento de alta qualidade e alinhados para raciocinar como humanos, os modelos do Nemotron alcançam a mais alta precisão nos principais benchmarks.

Implantação Segura e Simplificada

A família de modelos Nemotron, disponível na forma de microsserviços otimizados NVIDIA NIM™, oferece desempenho de inferência de ponta e opções de implantação flexíveis, oferecendo segurança, privacidade e portabilidade superiores.

Modelos

Modelos para Diversas Cargas de Trabalho

Os modelos Nemotron se destacam em uma variedade de tarefas de IA baseada em agentes, incluindo processamento lógico, visão, geração aumentada por recuperação (RAG), fala e segurança. Os modelos de pesquisa também estão disponíveis para experimentação.

Processamento Lógico

Os modelos Nemotron são compatíveis com uma variedade de cargas de trabalho de processamento lógico. O Nano fornece precisão e eficiência superiores para tarefas altamente dirigidas. O Super oferece a mais alta precisão e taxa de transferência para executar tarefas complexas em sistemas de vários agentes e o Ultra oferece o melhor raciocínio para aplicações de missão crítica que exigem capacidade máxima em workflows de várias etapas.

Compreensão visual

Os modelos Nemotron oferecem precisão líder em raciocínio de várias imagens e compreensão de vídeo, com forte inteligência de documentos, recursos visuais de perguntas e respostas e recursos de resumo. 

Use o NVIDIA Nemotron Parse para extrair dados de documentos e o NVIDIA Nemotron 2 Nano VL para correlacionar o conteúdo textual com gráficos, diagramas e outros elementos visuais para consulta inteligente

Fala

Os modelos NVIDIA Nemotron Speech fornecem reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e tradução automática neural (NMT) de alto rendimento e latência ultrabaixa para aplicações de IA baseada em agentes.

Geração Aumentada por Recuperação

Os modelos Nemotron RAG oferecem compreensão rápida e precisa de documentos, extraindo informações estruturadas multimodais, gerando incorporações de alta qualidade e ordenando os documentos mais relevantes. Eles fornecem recuperação escalável e de alta velocidade que aprimora a qualidade dos dados para treinamento de LLM, aumenta o desempenho de agentes e recuperadores e simplifica os workflows de documentos.

Segurança

Os modelos NVIDIA Nemotron Safety fornecem proteção em tempo real contra conteúdo prejudicial, alucinações fora do assunto principal e tentativas de jailbreak. Eles adicionam uma camada de segurança de conteúdo multilíngue, multimodal e com recursos de raciocínio, aprimorando a moderação e garantindo o alinhamento cultural.

Tecnologia

Fundamentos para a IA baseada em agentes

Comece a criar e otimizar agentes de IA com o NVIDIA NeMo para IA de agente personalizada, o NVIDIA NIM para implantação rápida e pronta para ambientes corporativos e os NVIDIA Blueprints para acelerar o desenvolvimento com fluxos de trabalho de referência personalizáveis.

NVIDIA NeMo

  • Crie, personalize e implante IA generativa e IA baseada em agentes.
  • Ofereça grandes modelos de linguagem (LLMs) prontos para empresas com curadoria de dados precisa, personalização de ponta, processamento de dados escalável, RAG e desempenho acelerado.
  • Crie facilmente ciclos de retroalimentação de dados e otimize continuamente agentes de IA com as informações mais recentes.

NVIDIA NIM

  • Acelere a implantação de modelos de IA generativa otimizados para desempenho.
  • Execute suas aplicações empresariais com APIs estáveis e seguras, com o apoio de um suporte de nível empresarial.

NVIDIA Blueprints

  • Comece rapidamente a usar aplicações de referência para casos de uso de IA generativa, como pesquisa profunda empresarial e RAG multimodal.
  • Acelere o desenvolvimento com blueprints, que incluem microsserviços de parceiros, um ou mais agentes de IA, código de referência, documentação de personalização e um diagrama Helm para implantação.

Opções de Inicialização

Formas de começar a usar o Nemotron

Comece a criar protótipos gratuitamente

Comece agora com os endpoints de API fáceis de usar para o NIM, com tecnologia DGX™ Cloud.

  • Acesse a infraestrutura de IA totalmente acelerada.
  • Garanta que seus dados não sejam usados para o treinamento de modelos.
  • Sem créditos, apenas um caminho simples para criar, testar e implantar.

Fale Conosco

Converse com um especialista em IA da NVIDIA sobre a migração de pilotos de IA generativa para a produção com segurança, estabilidade de API e suporte que vêm com o NVIDIA AI Enterprise.

  • Explore seus casos de uso de IA generativa.
  • Discuta seus requisitos técnicos.
  • Alinhe as soluções de IA da NVIDIA com seus objetivos e exigências.

Usuários

Empresas que utilizam o Nemotron

Recursos

Explore os últimos avanços do Nemotron

NVIDIA lança família de modelos de raciocínio aberto para a criação de plataformas de Agentes de IA

Explore a família, pós-treinada pela NVIDIA, criada com base em Llama e destilada a partir do DeepSeek-R1, e saiba como os modelos atendem às necessidades empresariais de agentes de IA prontos para implantação.

Crie Agentes de IA empresarial com modelos abertos avançados de raciocínio Nemotron Llama da NVIDIA

Leia como a NVIDIA desenvolveu a família Llama Nemotron com modelo de lógica, criada com base nos modelos abertos do Llama e pós-treinada com a experiência em lógica do DeepSeek-R1.

Crie modelos de lógica personalizados para alcançar autonomia avançada de IA baseada em agentes

Saiba como criar ou personalizar modelos de lógica usando várias técnicas, incluindo aprendizagem por destilação e reforço

Blogs

Perguntas Frequentes

Os modelos do NVIDIA Nemotron não são apenas abertos, mas verdadeiramente de código aberto. NVIDIA publica os conjuntos de dados de treinamento, técnicas e pesos de modelos para que a comunidade de código aberto possa se beneficiar de nossas aprendizagens e usar esses recursos para criar seus próprios modelos.

A licença de modelo aberto da NVIDIA é uma licença permissiva, com a qual os usuários podem utilizar, modificar, distribuir e implantar comercialmente os modelos e derivativos sem creditar a NVIDIA, para incentivar a inovação e o desenvolvimento adicional de IA generativa.

Sim, você pode fazer o download e executar modelos do NVIDIA Nemotron da Hugging Face gratuitamente na produção.

A NVIDIA também oferece modelos Nemotron como microsserviços NVIDIA NIM para implantação segura e escalável, o que requer uma licença IA da NVIDIA Enterprise. Você pode experimentar os modelos Nemotron e fazer download dos microsserviços NIM em build.nvidia.com.

Sim, a NVIDIA está comprometida em lançar mais modelos, conjuntos de dados e técnicas do Nemotron para permitir ecossistemas de código aberto.

Os modelos do NVIDIA Nemotron são criados com base em modelos abertos de fronteira, possibilitando a criação de modelos melhores mais rapidamente. Além disso, a NVIDIA publica os pesos de modelos, conjuntos de dados de treinamento e técnicas de treinamento para que a comunidade de desenvolvedores possa usar essas diferentes partes do Nemotron para treinar seus próprios modelos.

Sim. A NVIDIA criou os modelos Llama Nemotron com base na família de modelos Llama usando os conjuntos de dados abertos da NVIDIA e técnicas avançadas, como o Neural Architecture Search (NAS). Os modelos Llama Nemotron herdam a licença de modelo pai, Llama.

A NVIDIA fornece uma variedade de ferramentas, como NVIDIA Dynamo, TensorRT-LLM e NIM, para executar modelos do Nemotron em escala na produção. Você também pode usar bibliotecas populares de código aberto, como SGLang e vLLM.

Próximos Passos

Pronto para começar?

Use as ferramentas e tecnologias certas para levar os modelos do NVIDIA Nemotron do desenvolvimento à produção.

Fale Conosco

Converse com um especialista em produtos da NVIDIA sobre a migração de pilotos para a produção com a segurança, a estabilidade de API e o suporte que vêm com o NVIDIA AI Enterprise.

Fique por dentro das notícias sobre IA baseada em agentes da NVIDIA

Receba as últimas notícias, tecnologias, avanços e muito mais sobre IA baseada em agentes diretamente em sua caixa de entrada.