Plataforma NVIDIA Vera Rubin

Infraestrutura de IA para a era dos agentes.

Visão Geral
Inovações tecnológicas
Produtos
Por Dentro da Arquitetura Vera Rubin

Visão Geral
Inovações tecnológicas
Produtos
Por Dentro da Arquitetura Vera Rubin

Visão Geral

Liderança na era da IA baseada em agentes

A plataforma NVIDIA Vera Rubin foi criada para a era da IA e do raciocínio baseados em agentes, projetada para dominar a resolução de problemas em várias etapas e workflows de longo contexto em escala. Vera Rubin é um sistema em escala de POD com vários racks que reúne cinco sistemas em escala de rack desenvolvidos especificamente para essa finalidade em um único e gigantesco supercomputador de IA coeso. Ao eliminar gargalos críticos na comunicação e no movimento de memória, a plataforma potencializa a inferência, oferecendo mais tokens por watt e menor custo por token em comparação com a arquitetura NVIDIA Blackwell.

NVIDIA Vera Rubin Entra em Plena Produção para Impulsionar Fábricas de IA Baseada em Agentes em Todo o Mundo

O NVIDIA Vera Rubin está entrando em plena produção, com os principais fabricantes de servidores de Taiwan e líderes globais da cadeia de suprimentos produzindo em escala e enviando sistemas baseados no Vera Rubin — impulsionando laboratórios de IA, provedores de nuvem e hiperescaladores na criação da inteligência de amanhã.

Leia o comunicado à imprensa

O NVIDIA Vera Rubin Abre a Fronteira da IA Baseada em Agentes

A plataforma NVIDIA Vera Rubin inclui sete novos chips em produção total para escalar as maiores fábricas de IA do mundo.

Leia o Comunicado à Imprensa

Por Dentro da Plataforma Vera Rubin

NVIDIA Vera Rubin NVL72

O NVIDIA Vera Rubin NVL72 unifica tecnologias de ponta da NVIDIA: 72 GPUs Rubin, 36 CPUs Vera, ConnectX™-9 SuperNIC™s e DPUs BlueField™-4. Ele escala a inteligência em uma plataforma em escala de rack de terceira geração com o switch NVIDIA NVLink™ 6 e se expande sua escala com o NVIDIA Quantum-X800 InfiniBand e o Spectrum-X™ Ethernet para impulsionar a revolução industrial de IA em escala.

O Vera Rubin NVL72 apresenta uma nova Engine Transformer com compressão adaptativa para aumentar o desempenho de inferência NVFP4, Computação Confidencial da NVIDIA de terceira geração que estende a segurança a toda a plataforma em escala de rack e um mecanismo RAS de segunda geração que oferece resiliência em escala de rack.

Saiba Mais Sobre o NVIDIA Vera Rubin NVL72

CPU NVIDIA Vera

O rack de CPU NVIDIA Vera oferece infraestrutura de CPU densa e com resfriamento líquido, criada especificamente para aprendizagem por reforço e IA baseada em agentes em escala. Construído com base na arquitetura de referência modular NVIDIA MGX™, cada rack integra 256 CPUs NVIDIA Vera e oferece suporte a mais de 22.500 ambientes de sandbox simultâneos, oferecendo às fábricas de IA capacidade de CPU escalável e com eficiência energética para chamadas de ferramentas, avaliação, processamento de dados e orquestração.

Saiba Mais sobre a CPU NVIDIA Vera

NVIDIA Groq 3 LPX

O NVIDIA Groq 3 LPX é o acelerador de inferência para o NVIDIA Vera Rubin, projetado para atender às demandas de baixa latência e grande contexto de sistemas baseados em agentes. Ao combinar GPUs Rubin para memória de alta largura de banda (HBM) e LPUs para memória estática de acesso aleatório (SRAM), o NVIDIA Vera Rubin com LPX oferece uma nova classe de desempenho de inferência para modelos de trilhões de parâmetros e contextos de milhões de tokens.

Saiba Mais sobre o NVIDIA Groq 3 LPX

NVIDIA Vera BlueField-4 STX

O NVIDIA Vera BlueField-4 STX é uma base modular para soluções de armazenamento nativas de IA em escala de rack. Ao integrar o NVIDIA Vera Rubin, o processador de armazenamento BlueField-4 STX, a rede Spectrum-X e o software de IA da NVIDIA, ele otimiza todo o ciclo de vida de dados, desde a análise de dados até o treinamento de modelos e workflows completos de IA baseada em agentes em escala.

Saiba Mais sobre o NVIDIA Vera BlueField-4 STX

NVIDIA Spectrum-6 SPX Ethernet

O Spectrum-6 SPX Ethernet foi projetado para acelerar as redes em fábricas de IA. Configurável com switches NVIDIA Spectrum-X™ Ethernet ou NVIDIA Quantum-X800 InfiniBand, ele oferece conectividade de rack a rack de baixa latência e alta largura de banda em escala.

Saiba Mais sobre a Fotônica do NVIDIA Spectrum-X Ethernet

Explore os Produtos NVIDIA Vera Rubin

NVIDIA DGX Vera Rubin NVL72

O NVIDIA DGX™ Vera Rubin NVL72 fornece às empresas uma solução de infraestrutura de IA pronta para uso e criada com base na plataforma NVIDIA Vera Rubin. Foi criado especificamente para implantação em escala e acelerar os modelos de IA mais complexos.

Saiba mais

NVIDIA DGX Rubin NVL8

O NVIDIA DGX Rubin NVL8 é um sistema de IA com resfriamento a líquido com tecnologia de oito GPUs NVIDIA Rubin e do NVLink de sexta geração. Ele foi criado especificamente para acelerar o treinamento, a inferência e o pós-treinamento para todos os workloads de IA.

Saiba mais

NVIDIA HGX Rubin NVL8

O NVIDIA HGX™ Rubin NVL8 integra oito GPUs NVIDIA Rubin com interconexões NVLink de sexta geração de alta velocidade para impulsionar o Data Center para uma nova era de computação acelerada e IA generativa. O NVIDIA HGX Rubin NVL8 pode ser combinado com as CPUs NVIDIA Vera ou placas de base de CPU baseadas em x86.

Saiba mais

NVIDIA Vera Rubin NVL4

O NVIDIA Vera Rubin NVL4 desbloqueia a descoberta científica automatizada e a IA baseada em agentes por meio de uma ponte que conecta quatro GPUs NVIDIA Rubin a duas CPUs NVIDIA Vera via NVLink-C2C. Compatível com servidores NVIDIA MGX com resfriamento líquido, ele oferece até 4 vezes mais desempenho para simulações científicas, 6 vezes mais para treinamento de IA para ciência e 8 vezes mais para inferência em comparação com a arquitetura Hopper.

Saiba mais

Conheça a plataforma NVIDIA Vera Rubin

Criada com um alto nível de codesign, o NVIDIA Vera Rubin trata o data center, não o chip, como a unidade de computação, estabelecendo uma nova base para produzir inteligência de forma eficiente, segura e previsível em larga escala.

Leia o Blog Técnico