Plataforma NVIDIA Vera Rubin

Plataforma NVIDIA Vera Rubin

Moldando a era do processamento lógico baseado em agentes.

Visão Geral

Liderança na era da IA baseada em agentes

A plataforma NVIDIA Vera Rubin foi criada para a era da IA e do raciocínio baseados em agentes, projetada para dominar a resolução de problemas em várias etapas e workflows de longo contexto em escala. Ao eliminar gargalos críticos na comunicação e no movimento de memória, a plataforma acelera a inferência para oferecer mais tokens por watt e custo por token mais baixo em comparação com a geração de arquitetura NVIDIA Blackwell.

A NVIDIA Lança a Próxima Geração de IA com Rubin

Apresentando a plataforma NVIDIA Vera Rubin. Sete novos chips, um supercomputador de IA incrível.

O NVIDIA Vera Rubin Abre a Fronteira da IA Baseada em Agentes

A plataforma NVIDIA Vera Rubin inclui sete novos chips em produção total para escalar as maiores fábricas de IA do mundo.

Conheça os Detalhes dos Avanços Tecnológicos

Transformer Engine de Terceira Geração

A GPU Rubin apresenta um novo Transformer Engine (TE) com compressão adaptativa acelerada por hardware para aumentar o desempenho do NVFP4, preservando a precisão. Isso permite até 50 petaFLOPS de inferência NVFP4. Totalmente compatível com o NVIDIA Blackwell, o Transformer Engine garante atualizações perfeitas, para que os códigos anteriormente otimizados façam a transição sem esforço para a plataforma Vera Rubin.

Computação Confidencial de Terceira Geração

A terceira geração da computação confidencial da NVIDIA expande a segurança para escala de rack completa com o NVIDIA Vera Rubin NVL72. Essa plataforma cria um ambiente de execução unificado e confiável em todas as 36 CPUs NVIDIA Vera, 72 GPUs NVIDIA Rubin e a malha NVIDIA NVLink™ que as conecta perfeitamente. A plataforma mantém a segurança dos dados em domínios de CPU, GPU e NVLink. Com serviços de atestação para prova criptográfica de conformidade, ela combina escala massiva com proteção sem concessões, tudo para proteger os maiores modelos proprietários do mundo, dados de treinamento e workloads de inferência.

NVLink e Switch NVLink de Sexta Geração

O NVLink de sexta geração oferece um grande salto para a malha de interconexão de GPUs de alta velocidade da NVIDIA que combina 72 GPUs NVIDIA Rubin em um único domínio de desempenho. Dobrando o desempenho da NVIDIA Blackwell, a GPU Rubin oferece 3,6 terabytes por segundo (TB/s) de largura de banda por GPU e 260 TB/s de conectividade com baixa latência para facilitar a comunicação mais rápida. Combinada com o NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP), que reduz o congestionamento da rede em até 50% para operações coletivas, essa interconexão de última geração acelera o treinamento e a inferência para os maiores modelos do mundo, em escala e sem concessões.

Mecanismo de Confiabilidade, Disponibilidade e Capacidade de Manutenção (RAS – Reliability, Availability, and Serviceability) de Segunda Geração

A plataforma NVIDIA Vera Rubin oferece resiliência em escala de rack com recursos avançados de confiabilidade. As GPUs NVIDIA Rubin apresentam um mecanismo RAS dedicado de segunda geração para manutenção proativa e verificações de integridade em tempo real sem tempo de inatividade. As CPUs NVIDIA Vera adicionam manutenção aprimorada com módulos de memória de pequeno formato anexados por compressão (SOCAMM) LPDDR5X e testes integrados no sistema para os núcleos de CPU. O rack apresenta designs de bandejas modulares e sem cabos para montagem e manutenção 18 vezes mais rápidas em comparação com o NVIDIA Blackwell, combinados com resiliência inteligente e roteamento NVLink definido por software, que garante a operação contínua e reduz a sobrecarga de manutenção.

CPU NVIDIA Vera

A CPU NVIDIA Vera foi projetada para movimentação de dados e processamento baseado em agentes em sistemas acelerados, com suporte total à computação confidencial. Ele emparelha perfeitamente com as GPUs NVIDIA ou opera de forma independente para cargas de trabalho de análise, nuvem, orquestração, armazenamento e computação de alto desempenho (HPC). O Vera combina 88 núcleos projetados pela NVIDIA, até 1,2 TB/s de largura de banda de memória LPDDR5X e o NVIDIA Scalable Coherency Fabric para oferecer desempenho previsível e eficiente em termos energéticos para cargas de trabalho com uso intensivo de dados e memória, com compatibilidade total com o Arm®. A conectividade integrada do NVIDIA NVLink-C2C permite acesso coerente de alta largura de banda à memória de CPU e GPU para maximizar a utilização e a eficiência do sistema.

Explore os produtos NVIDIA Vera Rubin.

NVIDIA Vera Rubin NVL72

O NVIDIA Vera Rubin NVL72 unifica 72 GPUs NVIDIA Rubin, 36 CPUs NVIDIA Vera, placas NVIDIA ConnectX®-9 SuperNIC™ e DPUs NVIDIA BlueField®-4 e fica ao lado de racks NVIDIA LPX em um data center para inferência rápida e de baixa latência. Ele aumenta a inteligência em uma plataforma em escala de rack com o NVLink e o NVLink Switch de sexta geração e escala com o NVIDIA Quantum-X800 InfiniBand e o NVIDIA Spectrum-X™ Ethernet para impulsionar a revolução industrial de IA em escala.

NVIDIA Groq 3 LPX

O NVIDIA Groq 3 LPX é o acelerador de inferência para a NVIDIA Vera Rubin, projetado para atender às demandas de baixa latência e grande contexto de sistemas baseados em agentes. A Vera Rubin e a LPX combinam o desempenho extremo das GPUs NVIDIA Rubin e LPUs por meio de uma arquitetura projetada em colaboração. O LPX apresenta 256 LPUs com 128 GB SRAM, largura de banda de memória de 40 PB/s e largura de banda de escalabilidade de 640 TB/s por rack.

NVIDIA DGX Vera Rubin NVL72

O NVIDIA DGX Vera Rubin NVL72 fornece às empresas uma solução de infraestrutura de IA pronta para uso e criada com base na plataforma NVIDIA Vera Rubin. Foi criado especificamente para ser implantado em escala para acelerar os modelos de IA mais complexos.

NVIDIA HGX Rubin NVL8

O NVIDIA HGX™ Rubin NVL8 integra oito GPUs NVIDIA Rubin com interconexões NVLink de sexta geração de alta velocidade para impulsionar o Data Center para uma nova era de computação acelerada e IA Generativa.

NVIDIA DGX Rubin NVL8

O NVIDIA DGX Rubin NVL8 é um sistema de IA com resfriamento a líquido com tecnologia de oito GPUs NVIDIA Rubin e do NVLink de sexta geração. Ele foi criado especificamente para acelerar o treinamento, a inferência e o pós-treinamento para todos os workloads de IA.

Conheça a plataforma NVIDIA Vera Rubin

Criada com um alto nível de codesign, o NVIDIA Vera Rubin trata o data center, não o chip, como a unidade de computação, estabelecendo uma nova base para produzir inteligência de forma eficiente, segura e previsível em larga escala.