Plataforma NVIDIA Vera Rubin

Plataforma NVIDIA Vera Rubin

Infraestrutura de IA para a era dos agentes.

Visão Geral

Liderança na era da IA baseada em agentes

A plataforma NVIDIA Vera Rubin foi criada para a era da IA e do raciocínio baseados em agentes, projetada para dominar a resolução de problemas em várias etapas e workflows de longo contexto em escala. Vera Rubin é um sistema em escala de POD com vários racks que reúne cinco sistemas em escala de rack desenvolvidos especificamente para essa finalidade em um único e gigantesco supercomputador de IA coeso. Ao eliminar gargalos críticos na comunicação e no movimento de memória, a plataforma potencializa a inferência, oferecendo mais tokens por watt e menor custo por token em comparação com a arquitetura NVIDIA Blackwell.

NVIDIA Vera Rubin Entra em Plena Produção para Impulsionar Fábricas de IA Baseada em Agentes em Todo o Mundo

O NVIDIA Vera Rubin está entrando em plena produção, com os principais fabricantes de servidores de Taiwan e líderes globais da cadeia de suprimentos produzindo em escala e enviando sistemas baseados no Vera Rubin — impulsionando laboratórios de IA, provedores de nuvem e hiperescaladores na criação da inteligência de amanhã.

O NVIDIA Vera Rubin Abre a Fronteira da IA Baseada em Agentes

A plataforma NVIDIA Vera Rubin inclui sete novos chips em produção total para escalar as maiores fábricas de IA do mundo.

Por Dentro da Plataforma Vera Rubin

NVIDIA Vera Rubin NVL72

O NVIDIA Vera Rubin NVL72 unifica tecnologias de ponta da NVIDIA: 72 GPUs Rubin, 36 CPUs Vera, ConnectX™-9 SuperNIC™s e DPUs BlueField™-4. Ele escala a inteligência em uma plataforma em escala de rack de terceira geração com o switch NVIDIA NVLink™ 6 e se expande sua escala com o NVIDIA Quantum-X800 InfiniBand e o Spectrum-X™ Ethernet para impulsionar a revolução industrial de IA em escala.

O Vera Rubin NVL72 apresenta uma nova Engine Transformer com compressão adaptativa para aumentar o desempenho de inferência NVFP4, Computação Confidencial da NVIDIA de terceira geração que estende a segurança a toda a plataforma em escala de rack e um mecanismo RAS de segunda geração que oferece resiliência em escala de rack.

CPU NVIDIA Vera

O rack de CPU NVIDIA Vera oferece infraestrutura de CPU densa e com resfriamento líquido, criada especificamente para aprendizagem por reforço e IA baseada em agentes em escala. Construído com base na arquitetura de referência modular NVIDIA MGX™, cada rack integra 256 CPUs NVIDIA Vera e oferece suporte a mais de 22.500 ambientes de sandbox simultâneos, oferecendo às fábricas de IA capacidade de CPU escalável e com eficiência energética para chamadas de ferramentas, avaliação, processamento de dados e orquestração.

NVIDIA Groq 3 LPX

O NVIDIA Groq 3 LPX é o acelerador de inferência para o NVIDIA Vera Rubin, projetado para atender às demandas de baixa latência e grande contexto de sistemas baseados em agentes. Ao combinar GPUs Rubin para memória de alta largura de banda (HBM) e LPUs para memória estática de acesso aleatório (SRAM), o NVIDIA Vera Rubin com LPX oferece uma nova classe de desempenho de inferência para modelos de trilhões de parâmetros e contextos de milhões de tokens.

NVIDIA Vera BlueField-4 STX

O NVIDIA Vera BlueField-4 STX é uma base modular para soluções de armazenamento nativas de IA em escala de rack. Ao integrar o NVIDIA Vera Rubin, o processador de armazenamento BlueField-4 STX, a rede Spectrum-X e o software de IA da NVIDIA, ele otimiza todo o ciclo de vida de dados, desde a análise de dados até o treinamento de modelos e workflows completos de IA baseada em agentes em escala.

NVIDIA Spectrum-6 SPX Ethernet

O Spectrum-6 SPX Ethernet foi projetado para acelerar as redes em fábricas de IA. Configurável com switches NVIDIA Spectrum-X™ Ethernet ou NVIDIA Quantum-X800 InfiniBand, ele oferece conectividade de rack a rack de baixa latência e alta largura de banda em escala.

Explore os Produtos NVIDIA Vera Rubin

NVIDIA DGX Vera Rubin NVL72

O NVIDIA DGX™ Vera Rubin NVL72 fornece às empresas uma solução de infraestrutura de IA pronta para uso e criada com base na plataforma NVIDIA Vera Rubin. Foi criado especificamente para implantação em escala e acelerar os modelos de IA mais complexos.

NVIDIA DGX Rubin NVL8

O NVIDIA DGX Rubin NVL8 é um sistema de IA com resfriamento a líquido com tecnologia de oito GPUs NVIDIA Rubin e do NVLink de sexta geração. Ele foi criado especificamente para acelerar o treinamento, a inferência e o pós-treinamento para todos os workloads de IA.

NVIDIA HGX Rubin NVL8

O NVIDIA HGX™ Rubin NVL8 integra oito GPUs NVIDIA Rubin com interconexões NVLink de sexta geração de alta velocidade para impulsionar o Data Center para uma nova era de computação acelerada e IA generativa. O NVIDIA HGX Rubin NVL8 pode ser combinado com as CPUs NVIDIA Vera ou placas de base de CPU baseadas em x86.

NVIDIA Vera Rubin NVL4

O NVIDIA Vera Rubin NVL4 desbloqueia a descoberta científica automatizada e a IA baseada em agentes por meio de uma ponte que conecta quatro GPUs NVIDIA Rubin a duas CPUs NVIDIA Vera via NVLink-C2C. Compatível com servidores NVIDIA MGX com resfriamento líquido, ele oferece até 4 vezes mais desempenho para simulações científicas, 6 vezes mais para treinamento de IA para ciência e 8 vezes mais para inferência em comparação com a arquitetura Hopper.

Conheça a plataforma NVIDIA Vera Rubin

Criada com um alto nível de codesign, o NVIDIA Vera Rubin trata o data center, não o chip, como a unidade de computação, estabelecendo uma nova base para produzir inteligência de forma eficiente, segura e previsível em larga escala.