Transforme seu data center em uma fábrica de IA de alto desempenho com as Arquiteturas de Referência Empresarial da NVIDIA.
Visão Geral
As Arquiteturas de Referência Empresarial da NVIDIA permitem que as empresas projetem, implantem e escalem fábricas de IA de alto desempenho usando infraestrutura validada e repetível. Esses blueprints combinam computação certificada, redes de alta velocidade leste-oeste e ferramentas de observabilidade para garantir um desempenho escalável, desde clusters de quatro nós até ambientes em escala empresarial.
Arquiteturas de Referência Empresarial
Um pacote abrangente de instruções para configurar clusters no data center agora está disponível.
Casos de Uso
Acelere cargas de trabalho de IA baseada em agentes, IA física e HPC e simulação de IA com arquiteturas de referência empresariais comprovadas.
Acelere uma ampla variedade de cargas de trabalho empresariais, como IA industrial e de percepção, HPC, análise de dados, computação visual, IA generativa e baseada em agentes, em uma única plataforma flexível. Isso é ideal para empresas que buscam modernizar a infraestrutura e aumentar o desempenho em tarefas críticas para os negócios.
Para as implantações do NVIDIA RTX PRO Server, os pontos de design disponíveis são centrados nas configurações de 16 e 32 nós, ideais para cargas de trabalho de IA generativa e visualização de média escala, equilibrando o desempenho, a escalabilidade e a eficiência da implantação. Juntamente com a plataforma de rede NVIDIA Spectrum-X™, essa configuração oferece um desempenho de interconexão otimizado, adaptado especificamente para aplicações de IA exigentes.
Esse AR empresarial de alto desempenho foi criado especificamente para treinamento e inferência de IA em vários nós em escala, aproveitando os sistemas certificados HGX de 8 GPU pela NVIDIA com GPUs NVIDIA Hopper ou Blackwell. Os sistemas escalam de uma unidade de 4 nós (32 GPUs) até 128 nós (1024 GPUs), com potencial para clusters ainda maiores, dependendo das necessidades do cliente.
Os pontos de design disponíveis são centrados em configurações de 32, 64 e 128 nós, compatíveis com a rede NVIDIA Spectrum-X e um design flexível e otimizado para trilhos, que se adapta facilmente a vários layouts de racks.
Treine e implante os maiores modelos de base e linguagem com poder de computação em exaescala em um único rack. Criado para um grande rendimento de modelos, inferência para vários usuários e raciocínio em tempo real em escala, permitindo o futuro da inovação impulsionada por IA.
Os pontos de design disponíveis do NVIDIA GB200 NVL72 se concentram nas configurações de 4 e 8 racks. Criada em torno de uma rede flexível e otimizada para sistemas ferroviários, a arquitetura é compatível com diferentes layouts de racks e configurações de sistema.
Benefícios
Desbloqueie a infraestrutura de IA escalável e de alto desempenho com configurações comprovadas e prontas para parceiros.
Criadas para atender às demandas intensivas de treinamento, ajuste fino e inferência, essas arquiteturas garantem a utilização total da GPU e a consistência do desempenho em clusters de vários nós.
Expanda facilmente sua infraestrutura com designs de referência otimizados para até 128 nós, criados especificamente para oferecer suporte a soluções de stack completo, como o design validado do NVIDIA Enterprise IA Factory, garantindo uma implantação escalável e simplificada
Simplifique os processos de implantação e projetos eficientes, reduza a complexidade e o custo total de propriedade (TCO), enquanto reduz o tempo para token.
Seguir padrões de design específicos e padronizados permite uma operação consistente de uma instalação para outra, reduz a necessidade de suporte frequente e permite tempos de resolução mais rápidos.
Parceiros
Estamos orgulhosos de colaborar com os principais parceiros à medida que eles trazem Arquiteturas de Referência Empresarial e soluções de fábricas de IA ao mercado. Os designs desses parceiros foram aprovados em nosso Conselho de Revisão de Design (DRB), oferecendo orientação que merece nosso endosso em uma ou mais das seguintes categorias: Infraestrutura, Lógica de Rede e Software.
Recursos