Use as ferramentas e tecnologias certas para levar modelos de IA generativa do desenvolvimento à produção.
Experimente a plataforma de IA generativa completa e pronta para uso empresarial.
Comece a prototipar com os principais modelos de IA generativa desenvolvidos pela NVIDIA e de código aberto que foram ajustados para alto desempenho e eficiência. Os modelos de IA do catálogo de APIs da NVIDIA podem ser implantados usando os microsserviços do NVIDIA NIM™ e personalizados com o NeMo.
Os NVIDIA Blueprints são cargas de trabalho de referência abrangentes, criados com bibliotecas de IA da NVIDIA e Omniverse™, SDKs e microsserviços. Cada blueprint inclui código de referência, ferramentas de implantação, guias de personalização e uma arquitetura de referência, acelerando a implantação de soluções de IA, como agentes de IA e gêmeos digitais, desde o protótipo até a produção.
NVIDIA IA Enterprise é a plataforma de software completa que leva a IA generativa para todas as empresas, fornecendo o tempo de execução mais rápido e eficiente para os modelos fundacionais de IA generativa. Ele inclui o NeMo e o NVIDIA NIM para simplificar a adoção com segurança, estabilidade, gerenciabilidade e suporte.
Solicite uma licença gratuita de 90 dias para acessar soluções de IA generativa e suporte empresarial hoje mesmo.
O NVIDIA NeMo é um framework completo e nativo em nuvem, além de ser um conjunto de microsserviços para criação, personalização e implantação de modelos de IA generativa em qualquer lugar. Inclui curadoria de dados em escala, treinamento acelerado com técnicas avançadas de personalização, provisão de guardrail e inferência otimizada, oferecendo às empresas uma maneira fácil, econômica e rápida de adotar a IA generativa.
O NeMo está disponível como parte do NVIDIA AI Enterprise. Os detalhes completos sobre preços e licenciamento podem ser encontrados aqui.
O NeMo pode ser usado para personalizar grandes modelos de linguagem (LLMs), modelos de linguagem de visão (VLMs), reconhecimento automático de fala (ASR) e modelos de conversão de texto em fala (TTS).
Os clientes podem adquirir o Suporte Padrão Empresarial da NVIDIA por meio de uma assinatura do NVIDIA AI Enterprise, que inclui o NeMo. O Suporte Padrão Empresarial da NVIDIA oferece acordos de nível de serviço, acesso a especialistas da NVIDIA e suporte de longo prazo em implantações locais e em nuvem.
O NVIDIA AI Enterprise inclui o Suporte Padrão Empresarial da NVIDIA. Para obter suporte e serviços adicionais disponíveis, como o Suporte Essencial aos Negócios da NVIDIA, um gerente de conta técnica, treinamento e serviços profissionais, consulte o Guia de Suporte e Serviços Empresariais da NVIDIA.
O NeMo Curator é um microsserviço escalonável de curadoria de dados que permite que os desenvolvedores classifiquem conjuntos de dados multilíngues de trilhões de tokens para pré-treinamento de LLMs. Consiste em um conjunto de módulos Python expressos como APIs que usam o Dask, o cuDF, o cuGraph e o Pytorch para escalonar tarefas de curadoria de dados, como download de dados, extração de texto, limpeza, filtragem, deduplicação exata/imprecisa e classificação de texto para milhares de núcleos de computação.
Os NeMo Guardrails são um microsserviço que visa garantir a adequação e a segurança em aplicações inteligentes com grandes modelos de linguagem. Eles protegem as empresas que supervisionam os sistemas de LLM.
Os NeMo Guardrails permitem que os desenvolvedores configurem três tipos de limites:
Com o NeMo Retriever, uma coleção de microsserviços de IA generativa criada com o NVIDIA NIM, as empresas podem conectar com eficácia modelos personalizados a diversos dados de negócios para oferecer respostas altamente precisas. O NeMo Retriever proporciona recuperação de informações de classe mundial com a menor latência, o mais alto rendimento e a máxima privacidade de dados, permitindo que as empresas façam melhor uso de seus dados e gerem insights de negócios em tempo real. O NeMo Retriever aprimora as aplicações de IA com recursos de geração aumentada por recuperação de nível empresarial, conectando-os aos dados empresariais onde quer que eles residam.
O NVIDIA NIM, parte do NVIDIA AI Enterprise, é um tempo de execução fácil de usar projetado para acelerar a implantação de IA generativa em empresas. Esse microsserviço versátil suporta um amplo espectro de modelos de IA, desde modelos de código aberto da comunidade até modelos da NVIDIA AI Foundation, além de modelos de IA personalizados. Construído sobre as bases robustas dos mecanismos de inferência, ele é projetado para facilitar a inferência de IA eficaz em escala, garantindo que as aplicações de IA possam ser implantadas em nuvem, em data centers e em workstations.
O NeMo Evaluator é um microsserviço projetado para avaliação rápida e confiável de LLMs e RAGs personalizados. Inclui diversos benchmarks com métricas predefinidas, até mesmo avaliações humanas e técnicas em que LLMs atuam como juízes. Vários trabalhos de avaliação podem ser implantados simultaneamente no Kubernetes em plataformas de nuvem preferidas ou data centers por meio de chamadas de API, permitindo resultados agregados eficientes.
O NeMo Customizer é um microsserviço escalonável e de alto desempenho que simplifica o ajuste fino e o alinhamento de LLMs para casos de uso específicos de domínio.
A geração aumentada por recuperação é uma técnica que permite que os LLMs gerem respostas a partir das informações mais recentes, conectando-as à base de conhecimento da empresa. O NeMo trabalha com várias ferramentas de terceiros e da comunidade, incluindo Milvus, Llama Index e LangChain, para extrair trechos relevantes de informações do banco de dados vetorial e inseri-los no LLM para gerar respostas em linguagem natural. Explore a página Chatbot de IA Usando o Workflow de RAG para começar a criar chatbots de IA com qualidade de produção, que podem responder com precisão a perguntas sobre os dados da sua empresa.
A NVIDIA oferece workflows de IA (pacotes de exemplos de referência nativos em nuvem), que ilustram como os frameworks de IA da NVIDIA podem ser aproveitados para criar soluções de IA. Com modelos pré-treinados, pipelines de treinamento e inferência, notebooks Jupyter e gráficos de Helm, os workflows de IA aceleram o caminho para a entrega de soluções de IA.
Crie rapidamente soluções de IA generativa com estes workflows completos:
Os NVIDIA Blueprints são workflows de referência abrangentes criados com bibliotecas de IA da NVIDIA e Omniverse™, SDKs e microsserviços. Cada blueprint inclui código de referência, ferramentas de implantação, guias de personalização e uma arquitetura de referência, acelerando a implantação de soluções de IA, como agentes de IA e gêmeos digitais, desde o protótipo até a produção.
O NVIDIA AI Enterprise é uma plataforma de software completa, nativa em nuvem, que acelera os pipelines de ciência de dados e simplifica o desenvolvimento e a implantação de aplicações de IA de nível de produção, incluindo IA generativa, visão computacional, IA para fala e muito mais. Ele inclui as melhores ferramentas de desenvolvimento do setor, frameworks, modelos pré-treinados, microsserviços para profissionais de IA e recursos de gerenciamento confiáveis para profissionais de TI, a fim de garantir desempenho, estabilidade da API e segurança.
O catálogo de APIs da NVIDIA fornece modelos de IA generativa prontos para produção e tempo de execução de inferência continuamente otimizado, disponibilizados como microsserviços NVIDIA NIM, que podem ser facilmente implantados com ferramentas padronizadas em qualquer sistema acelerado por GPU.
Acompanhe as últimas notícias sobre IA generativa da NVIDIA.