NVIDIA GB300 NVL72

NVIDIA GB300 NVL72

Criado para a era da lógica de IA.

Disponível em Breve

Inscreva-se para receber uma notificação quando a NVIDIA GB300 NVL72 estiver disponível.

Visão Geral

Projetada para Desempenho de Lógica de IA

A NVIDIA GB300 NVL72 apresenta uma arquitetura em escala de rack totalmente resfriada por líquido que integra 72 GPUs NVIDIA Blackwell Ultra e 36 CPUs NVIDIA Grace™ baseadas em Arm® em uma única plataforma. O sistema oferece FLOPS Tensor Core FP4 1,5 vezes mais denso e o dobro de desempenho de atenção em comparação com as GPUs NVIDIA Blackwell. Foi criado especificamente para tarefas de inferência de escalabilidade e raciocínio de IA durante o tempo de teste. As fábricas de IA aceleradas pela GB300 NVL72, aproveitando a Ethernet NVIDIA Quantum-X800 InfiniBand ou Spectrum-X™, os SuperNIC™ ConnectX-8 e o gerenciamento do NVIDIA Mission Control, oferecem um aumento geral de até 50 vezes no desempenho de saída de fábricas de IA em comparação com as plataformas baseadas no NVIDIA Hopper.

Desempenho

Ampliando Fábricas de IA para Níveis Sem Precedentes

DeepSeek R1 ISL = 32K, OSL = 8K, GB300 NVL72 com desagregação FP4 Dynamo. H100 com agrupamento em tempo real FP8. Desempenho projetado sujeito a alterações.

Experimente o desempenho de raciocínio de IA de última geração com a plataforma NVIDIA GB300 NVL72. Em comparação com a Hopper, a GB300 NVL72 oferece um aumento impressionante de 10 vezes na responsividade do usuário (TPS por usuário) e uma melhoria de 5 vezes no rendimento (TPS por megawatt (MW)). Juntos, esses avanços se traduzem em um salto notável de 50 vezes na produção geral da fábrica de IA.

Recursos

Avanços Tecnológicos

Inferência de Lógica de IA

A escalabilidade no tempo de teste e a lógica de IA aumentam a computação necessária para alcançar a qualidade do serviço e o máximo rendimento. Os núcleos Tensor da NVIDIA Blackwell Ultra são turbinados com 2 vezes a aceleração na camada de atenção e 1,5 vez mais operações de ponto flutuante de computação de IA por segundo (FLOPS) em comparação com as GPUs NVIDIA Blackwell.

288GB de HBM3e

A maior capacidade de memória permite um tamanho de lote maior e o desempenho de rendimento máximo. As GPUs NVIDIA Blackwell Ultra oferecem memória HBM3e 1,5 vez maior em combinação com computação de IA adicional, aumentando o rendimento de lógica de IA para os maiores comprimentos de contexto.

Arquitetura NVIDIA Blackwell

A arquitetura NVIDIA Blackwell oferece avanços revolucionários em computação acelerada, impulsionando uma nova era de desempenho, eficiência e escala inigualáveis.

NVIDIA ConnectX-8 SuperNIC

O módulo de entrada/saída (IO) do NVIDIA ConnectX-8 SuperNIC hospeda dois dispositivos ConnectX-8, fornecendo 800 gigabits por segundo (Gb/s) de conectividade de rede para cada GPU na NVIDIA GB300 NVL72. Isso oferece os melhores recursos de acesso remoto direto de memória (RDMA) com plataformas de rede Ethernet NVIDIA Quantum-X800 InfiniBand ou Spectrum-X, permitindo a eficiência máxima de cargas de trabalho de IA.

CPU NVIDIA Grace

A CPU NVIDIA Grace é um processador revolucionário projetado para cargas de trabalho de data center modernas. Ela fornece desempenho excepcional e largura de banda de memória com 2 vezes a eficiência energética dos principais processadores de servidor da atualidade.

NVIDIA NVLink da Quinta Geração

Desbloquear todo o potencial da computação acelerada requer comunicação perfeita entre todas as GPUs. A quinta geração do NVIDIA NVLink™ é uma interconexão em escala crescente que liberta o desempenho acelerado para modelos de lógica de IA.

NVIDIA DGX Station

Desenvolva e execute IA de ponta localmente com a NVIDIA DGX Station™, com a tecnologia do Superchip para Desktop NVIDIA GB300 Grace Blackwell Ultra. Acelere cargas de trabalho de treinamento e inferência em larga escala e escale-as facilmente da mesa ao data center.

Especificações

NVIDIA GB300 NVL72¹

Configuração 72 GPUs NVIDIA Blackwell Ultra, 36 CPUs NVIDIA Grace
Largura de Banda do NVLink 130TB/s
Memória Rápida Até 40TB
Memória da GPU | Largura de Banda Até 21TB | Até 576TB/s
Memória da CPU | Largura de Banda Até 18TB SOCAMM com LPDDR5X | Até 14,3TB/s
Contagem de Núcleos da CPU 2.592 núcleos Arm Neoverse V2
Núcleo Tensor FP4 1.400 | 1.100² PFLOPS
Núcleo Tensor FP8/FP6 720 PFLOPS
Núcleo Tensor INT8 23 PFLOPS
Núcleo Tensor FP16/BF16 360 PFLOPS
Núcleo Tensor TF32 180 PFLOPS
FP32 6 PFLOPS
Núcleo Tensor FP64 / FP64 100 TFLOPS

Recursos

Saiba Mais Sobre a Grace Blackwell

Comece Agora

Fique por Dentro

Inscreva-se para receber uma notificação quando o NVIDIA GB300 NVL72 estiver disponível.

Mantenha-se Atualizado com as Notícias da NVIDIA

Inscreva-se para receber as últimas notícias, atualizações e novidades da NVIDIA.