Infraestrutura de IA para a era dos agentes.
Visão Geral
A plataforma NVIDIA Vera Rubin foi criada para a era da IA e do raciocínio baseados em agentes, projetada para dominar a resolução de problemas em várias etapas e workflows de longo contexto em escala. Vera Rubin é um sistema em escala de POD com vários racks que reúne cinco sistemas em escala de rack desenvolvidos especificamente para essa finalidade em um único e gigantesco supercomputador de IA coeso. Ao eliminar gargalos críticos na comunicação e no movimento de memória, a plataforma potencializa a inferência, oferecendo mais tokens por watt e menor custo por token em comparação com a arquitetura NVIDIA Blackwell.
O NVIDIA Vera Rubin NVL72 unifica tecnologias de ponta da NVIDIA: 72 GPUs Rubin, 36 CPUs Vera, ConnectX™-9 SuperNIC™s e DPUs BlueField™-4. Ele escala a inteligência em uma plataforma em escala de rack de terceira geração com o switch NVIDIA NVLink™ 6 e se expande sua escala com o NVIDIA Quantum-X800 InfiniBand e o Spectrum-X™ Ethernet para impulsionar a revolução industrial de IA em escala.
O Vera Rubin NVL72 apresenta uma nova Engine Transformer com compressão adaptativa para aumentar o desempenho de inferência NVFP4, Computação Confidencial da NVIDIA de terceira geração que estende a segurança a toda a plataforma em escala de rack e um mecanismo RAS de segunda geração que oferece resiliência em escala de rack.
O rack de CPU NVIDIA Vera oferece infraestrutura de CPU densa e com resfriamento líquido, criada especificamente para aprendizagem por reforço e IA baseada em agentes em escala. Construído com base na arquitetura de referência modular NVIDIA MGX™, cada rack integra 256 CPUs NVIDIA Vera e oferece suporte a mais de 22.500 ambientes de sandbox simultâneos, oferecendo às fábricas de IA capacidade de CPU escalável e com eficiência energética para chamadas de ferramentas, avaliação, processamento de dados e orquestração.
O NVIDIA Groq 3 LPX é o acelerador de inferência para o NVIDIA Vera Rubin, projetado para atender às demandas de baixa latência e grande contexto de sistemas baseados em agentes. Ao combinar GPUs Rubin para memória de alta largura de banda (HBM) e LPUs para memória estática de acesso aleatório (SRAM), o NVIDIA Vera Rubin com LPX oferece uma nova classe de desempenho de inferência para modelos de trilhões de parâmetros e contextos de milhões de tokens.
O NVIDIA Vera BlueField-4 STX é uma base modular para soluções de armazenamento nativas de IA em escala de rack. Ao integrar o NVIDIA Vera Rubin, o processador de armazenamento BlueField-4 STX, a rede Spectrum-X e o software de IA da NVIDIA, ele otimiza todo o ciclo de vida de dados, desde a análise de dados até o treinamento de modelos e workflows completos de IA baseada em agentes em escala.
O Spectrum-6 SPX Ethernet foi projetado para acelerar as redes em fábricas de IA. Configurável com switches NVIDIA Spectrum-X™ Ethernet ou NVIDIA Quantum-X800 InfiniBand, ele oferece conectividade de rack a rack de baixa latência e alta largura de banda em escala.
Criada com um alto nível de codesign, o NVIDIA Vera Rubin trata o data center, não o chip, como a unidade de computação, estabelecendo uma nova base para produzir inteligência de forma eficiente, segura e previsível em larga escala.