Arquiteturas de Referência Empresarial

Crie Fábricas de IA Escaláveis

Transforme seu data center em uma fábrica de IA de alto desempenho com as Arquiteturas de Referência Empresarial da NVIDIA.

Comece Agora

Leia o Whitepaper | Conheça os sistemas certificados pela NVIDIA

Comece Agora

Visão Geral

As Bases para o Sucesso da IA

As arquiteturas de referência empresarial da NVIDIA (RAs empresariais) permitem que as empresas projetem, implantem e escalem fábricas de IA de alto desempenho usando infraestrutura validada e repetível. Esses designs combinam computação certificada, rede de alta velocidade leste-oeste e norte-sul, ferramentas de observabilidade e software para garantir desempenho escalável, desde clusters de quatro nós até ambientes em escala empresarial.

A Palantir se une à NVIDIA para oferecer arquitetura de referência de sistema operacional de IA soberana

A arquitetura de referência de SO de IA soberana da Palantir é baseada nos RAs NVIDIA Enterprise, testados e qualificados para executar o pacote completo de software da Palantir na infraestrutura de IA da NVIDIA.

Leia o Comunicado à Imprensa

Design comprovado e desempenho validado

Saiba como os RAs empresariais, criados em implantações reais e configurações testadas em batalha, simplificam o planejamento e maximizam o ROI para infraestrutura de IA escalável.

Leia o Documento Técnico

Arquiteturas de Referência Empresarial

Seu Guia para a Família Completa

Um pacote abrangente de instruções para configurar clusters no data center agora está disponível.

Infraestrutura

As arquiteturas de referência empresarial da NVIDIA começam com configurações de hardware validadas, incluindo padrões de nós de rede de CPU e GPU, diagramas de cabeamento e detalhes de infraestrutura.

Lógica de Rede

O Guia Lógico de Configuração de Redes e Arquitetura Lógica para RAs Empresariais fornece instruções para o gerenciamento e o provisionamento de nós por meio do design de VLAN e da simulação de rede no NVIDIA Air.

Software

Nosso stack de referência de software para RAs empresariais descreve o software para gerenciar, provisionar e dimensionar clusters de infraestrutura. Os lançamentos atuais se concentram no Kubernetes de código aberto, com o software IA da NVIDIA Enterprise e o NVIDIA Run:ai.

Observabilidade

O Guia de Observabilidade para Arquiteturas de Referência Empresarial da NVIDIA utiliza ferramentas de código aberto, como Prometheus e Grafana, para monitorar o desempenho de GPU e rede em todo o cluster. Os painéis fornecem métricas em tempo real para a integridade do sistema e a eficiência da carga de trabalho.

Implantação

O Guia de Implantação para Arquiteturas de Referência Empresarial da NVIDIA é uma coleção de melhores práticas de infraestrutura que nossa equipe aprendeu ao criar, implantar, testar e validar os clusters internos nos quais criamos nosso programa.

Armazenamento

O Programa de Armazenamento Certificado pela NVIDIA é um esforço complementar de parceiros selecionados que criaram guias de armazenamento projetados para se integrar a RAs empresariais. Saiba mais sobre esse programa exclusivo.

Casos de Uso

Projetado para Todos os Casos de Uso

Acelere cargas de trabalho de IA baseada em agentes, IA física, computação de alto desempenho (HPC) e simulação de IA com as arquiteturas de referência empresarial comprovadas da NVIDIA e os sistemas certificados pela NVIDIA de parceiros globais. As principais configurações de clusters de infraestrutura para implantar fábricas de IA empresarial são descritas abaixo.

NVIDIA RTX PRO IA Factory
NVIDIA HGX IA Factory
NVIDIA NVL72 IA Factory

NVIDIA RTX PRO IA Factory

A configuração do NVIDIA RTX PRO™ IA Factory foi projetada para um amplo espectro de workloads empresariais, incluindo IA generativa e baseada em agentes, análise de dados, computação visual e simulação de engenharia. As implantações são otimizadas em torno de pontos de design de 16 e 32 nós, fornecendo um equilíbrio ideal de desempenho, escalabilidade e eficiência de implantação. Projetados para aceleração universal de workloads em IA empresarial, simulação e computação visual, os servidores NVIDIA RTX PRO são otimizados para ambientes PCIe, tornando-os ideais para data centers com restrições de espaço, energia e resfriamento. Criados especificamente para cargas de trabalho de IA modernas, oferecem desempenho eficiente para IA baseada em agentes e inferência de grandes modelos de linguagem (LLM).

Veja as especificações de configuração do cluster

NVIDIA HGX IA Factory

A configuração de alto desempenho do NVIDIA HGX AI Factory foi criada especificamente para treinamento e inferência de IA de vários nós em escala, aproveitando os sistemas NVIDIA HGX. Disponível em pontos de design de 32, 64 e 128 nós e compatível com a rede NVIDIA Spectrum-X, a arquitetura apresenta um design flexível e otimizado para trilhos que permite a integração eficiente em diversos layouts de rack, oferecendo desempenho de alta taxa de transferência e baixa latência. Fornece desempenho inovador para usuários avançados de IA executando as workloads mais exigentes, permite o treinamento e o ajuste de modelos em larga escala e acelera significativamente a inferência. Com precisão de última geração e interconexões ultrarrápidas, a solução alcança uma taxa de transferência de tokens até 15 vezes maior.

Veja as especificações de configuração do cluster

NVIDIA NVL72 IA Factory

A configuração do NVIDIA NVL72 IA Factory foi projetada para treinar e implantar modelos de trilhões de parâmetros, oferecendo poder de computação em exaescala em um único rack. Criado para alta taxa de transferência de modelos, inferência de vários usuários e inferência em tempo real em escala, ele permite a próxima geração de inovação orientada por IA. Os pontos de design de implantação se concentram em configurações de quatro e oito racks. Criada em uma rede flexível e otimizada para trilhos, a arquitetura se adapta a diversos layouts de rack e designs de sistemas, oferecendo desempenho de alta largura de banda e baixa latência. A plataforma oferece saída excepcional de fábricas de IA com eficiência energética líder do setor e é impulsionada pelo NVIDIA NVLink™ de quinta geração, núcleos tensores FP4 e inovações térmicas avançadas.

Veja as especificações de configuração do cluster

Benefícios

O Valor Estratégico dos Recursos Empresariais.

Desbloqueie a infraestrutura de IA escalável e de alto desempenho com configurações comprovadas e prontas para parceiros.

Desempenho de Pico para Cargas de Trabalho de IA

Atenda às demandas intensivas de inferência de IA, ajuste fino e treinamento com arquiteturas que garantem a utilização total da GPU e a consistência de desempenho em clusters de vários nós.

Escalabilidade Flexível, Operações Simplificadas

Expanda sua infraestrutura com facilidade e garanta a implantação escalável e simplificada para até 128 nós. Crie a base para soluções completas com o design validado do NVIDIA Enterprise AI Factory, que aproveita nosso ecossistema de software.

Reduza a Complexidade e o TCO

Simplifique os processos de implantação e os designs eficientes, reduza a complexidade e o custo total de propriedade (TCO), enquanto reduz o tempo de geração de valor.

Suportabilidade

Siga padrões de design específicos e padronizados para alcançar uma operação consistente de uma instalação para outra, reduza a necessidade de suporte frequente e permita tempos de resolução mais rápidos.

Parceiros

Parceria para Alta Performance

Estamos orgulhosos de colaborar com os principais parceiros à medida que eles trazem Arquiteturas de Referência Empresarial e soluções de fábricas de IA ao mercado. Os designs endossados desses parceiros foram aprovados em nosso Design Review Board, oferecendo orientação que ganha nosso endosso em uma ou mais das seguintes categorias: infraestrutura, lógica de rede e software.

Comece Agora

Arquitetura de referência de sistema operacional de IA Sovereign da Palantir com NVIDIA

A arquitetura de referência de sistema operacional de IA Sovereignda da Palantir é baseada nos RAs NVIDIA Enterprise, testados e qualificados para executar o pacote completo de software da Palantir na infraestrutura de IA da NVIDIA com nossos parceiros de sistema globais. Essa arquitetura de IA soberana é crítica para clientes com workflows sensíveis à latência, requisitos de soberania de dados e alta distribuição geográfica. A arquitetura fornece às empresas controle total sobre seus dados, modelos de IA e aplicações.

Saiba Mais

Recursos

Saiba Mais Sobre os RAs Empresariais

Arquitetura de referência de fábricas de IA NVIDIA RTX PRO

A configuração do NVIDIA RTX PRO AI Factory oferece suporte a uma ampla variedade de cargas de trabalho empresariais, incluindo inferência de IA baseada em agentes, IA física e industrial, computação visual e computação de alto desempenho para análise de dados e simulação. Este documento detalha os componentes de hardware que sustentam essa arquitetura escalável e modular.

Leia o Relatório Técnico

Arquitetura de referência de fábricas de IA NVIDIA HGX

A configuração do NVIDIA HGX AI Factory está focada em inferência de IA de alto desempenho, treinamento de modelos e ajuste fino. Este documento descreve os componentes de hardware de uma arquitetura escalável e modular, incluindo orientação de clusters e topologias de malha de rede usadas para interconectar o cluster.

Leia o Relatório Técnico

Desbloqueie uma taxa de transferência de tokens massiva com o NVIDIA Run:ai

O benchmarking conjunto com a Nebius mostra que as implantações de GPU fracionárias usando o NVIDIA Run:ai em arquiteturas de referência empresarial da NVIDIA melhoram significativamente a taxa de transferência e a utilização para cargas de trabalho de LLM de produção.

Leia o Blog

Visão geral da arquitetura de referência empresarial da NVIDIA

Este whitepaper apresenta as arquiteturas de referência empresarial da NVIDIA, que fornecem orientação comprovada para projetar e criar fábricas de IA para implantações de nível empresarial, variando de 32 a 1.024 GPUs. Essas arquiteturas ajudam a simplificar a implantação de infraestrutura de IA, reduzir a complexidade operacional e acelerar o tempo de geração de valor.

Leia o Relatório Técnico

Redes Norte-Sul: A Chave para Cargas de Trabalho de IA Empresarial Mais Rápidas

As Arquiteturas de Referência Empresarial da NVIDIA orientam as empresas na implantação de fábricas de IA que utilizam redes norte-sul e leste-oeste, fornecendo receitas de design para infraestrutura de IA escalável, segura e de alto desempenho.

Leia o Blog

Implantando o NVIDIA H200 NVL em escala com uma nova arquitetura de referência empresarial

O NVIDIA H200 NVL acelera a implantação de IA com memória aprimorada, NVLink de alta velocidade e uma configuração de RA empresarial otimizada.

Leia o Blog

Fábrica de IA da NVIDIA impulsiona a inovação empresarial em escala

A NVIDIA criou uma fábrica de IA unificada para escalar workflows de IA Generativa e baseados em agentes em toda a empresa, garantindo segurança, desempenho e consistência. A plataforma é compatível com centenas de agentes de IA que aceleram a inovação, simplificam a engenharia de software e hardware e otimizam as operações da cadeia de suprimentos, reduzindo os tempos de planejamento em mais de 95% e alcançando décadas de trabalho de engenharia em apenas um ano.

Explore os Principais Resultados

Próximos Passos

Que Tal Começar Agora?

Saiba Mais sobre o NVIDIA Enterprise AI Factory.

Comece Agora

Conheça mais sobre as arquiteturas de referência empresarial da NVIDIA

Explore como as arquiteturas de referência empresarial da NVIDIA fornecem blueprints escaláveis e prescritivos para implantar infraestrutura de IA de alto desempenho.

Leia o Relatório Técnico

A Supermicro é líder global em soluções totais de TI otimizadas para aplicações. Fundada e operando em San Jose, Califórnia, a Supermicro está comprometida em oferecer inovação pioneira no mercado para infraestrutura de TI empresarial, nuvem, IA e 5G de telecomunicações/edge. Somos um provedor de soluções totais de TI com servidor, IA, armazenamento, IoT, sistemas de comutadores, software e serviços de suporte. A experiência da Supermicro em placas-mãe, energia e design de chassi permite ainda mais nosso desenvolvimento e produção, permitindo inovação de última geração de nuvem ao edge para nossos clientes globais.

Soluções endossadas pelo Conselho de Revisão de Design da NVIDIA:

SAIBA MAIS

CPUs (Elegíveis)	2X 64c Intel Xeon 2x 64c AMD EPYC
GPUs	8x NVIDIA RTX PRO™ 6000 Blackwell Server Edition
Rede (Leste-Oeste)	4x NVIDIA® BlueField®-3 B3140H (1x 400 Gb)
Rede (Norte-Sul)	1 x BlueField-3 B3220 (2x 200 Gb)
Memória do Host (mín.)	Mínimo 1.024 GB DDR5 ECC (1x DIMM por slot)
Unidade de Inicialização do Host (mín.)	1x 1 TB NVMe
Armazenamento no Host (mín.)	2x 4 TB NVMe

CPUs (Elegíveis)	2X 64c Intel Xeon 2x 64c AMD EPYC
GPUs	8x GPU NVIDIA Blackwell Ultra
Rede (Leste-Oeste)	8x NVIDIA® BlueField®-3 B3140H (1x 400 Gb)
Rede (Norte-Sul)	1 x BlueField-3 B3220 (2x 200 Gb)
Memória do Host (mín.)	Mínimo 1.536 GB DDR5 ECC (1x DIMM por slot)
Unidade de Inicialização do Host (mín.)	1x 1 TB NVMe
Armazenamento no Host (mín.)	2x 4 TB NVMe

CPUs	2x 72c NVIDIA Grace™ (36 por rack)
GPUs	4x GPUs NVIDIA Blackwell (72 por rack)
Rede (Leste-Oeste)	4x NVIDIA® ConnectX®-7 (1x 400 Gb)
Rede (Norte-Sul)	2x NVIDIA BlueField®-3 B3240 (4x 200 Gb)

Arquiteturas de Referência Empresarial

Crie Fábricas de IA Escaláveis

As Bases para o Sucesso da IA

A Palantir se une à NVIDIA para oferecer arquitetura de referência de sistema operacional de IA soberana

Design comprovado e desempenho validado

Seu Guia para a Família Completa

Infraestrutura

Lógica de Rede

Software

Observabilidade

Implantação

Armazenamento

Projetado para Todos os Casos de Uso

NVIDIA RTX PRO IA Factory

NVIDIA HGX IA Factory

NVIDIA NVL72 IA Factory

O Valor Estratégico dos Recursos Empresariais.

Desempenho de Pico para Cargas de Trabalho de IA

Escalabilidade Flexível, Operações Simplificadas

Reduza a Complexidade e o TCO

Suportabilidade

Parceria para Alta Performance

Arquitetura de referência de sistema operacional de IA Sovereign da Palantir com NVIDIA

Saiba Mais Sobre os RAs Empresariais

Arquitetura de referência de fábricas de IA NVIDIA RTX PRO

Arquitetura de referência de fábricas de IA NVIDIA HGX

Desbloqueie uma taxa de transferência de tokens massiva com o NVIDIA Run:ai

Visão geral da arquitetura de referência empresarial da NVIDIA

Redes Norte-Sul: A Chave para Cargas de Trabalho de IA Empresarial Mais Rápidas

Implantando o NVIDIA H200 NVL em escala com uma nova arquitetura de referência empresarial

Fábrica de IA da NVIDIA impulsiona a inovação empresarial em escala

Próximos Passos

Que Tal Começar Agora?

Conheça mais sobre as arquiteturas de referência empresarial da NVIDIA

Especificações da configuração do cluster 2-8-5-200

Especificações da configuração do cluster 2-8-9-400

Especificações da configuração do cluster 2-4-6-400