Switches e Dispositivos NVIDIA Quantum InfiniBand

Portfólio completo de switches e dispositivos de gerenciamento de malha para IA e supercomputação em escala.

Visão Geral

Acelere a Pesquisa e a Inovação com uma Capacidade Maior de Dados e a Computação em Rede

O NVIDIA Quantum InfiniBand é a única plataforma de computação em rede da NVIDIA totalmente descarregável do mundo. Com taxa de processamento e densidade de dados inigualáveis, ele fornece o salto dramático no desempenho necessário para alcançar um desempenho inigualável de data center com menor custo e complexidade. A NVIDIA Quantum InfiniBand também disponibiliza recursos de recuperação automática de rede, Qualidade de Serviço (QoS) aprimorada, controle de congestionamento e roteamento adaptável para oferecer o maior rendimento geral das aplicações.

Computação acelerada e redes impulsionam a supercomputação na era da IA

Saiba como os switches de rede de óptica coempacotada (CPO) NVIDIA Quantum-X Photonics InfiniBand estão permitindo que as fábricas de IA reduzam drasticamente o consumo de energia e os custos operacionais.

Ligando o NVIDIA Quantum‑X Photonics, o switch coempacotado da NVIDIA.

Veja o switch NVIDIA Quantum-X800 CPO em ação, conectando racks NVIDIA GB300 para demonstrar a fotônica de silício mais avançada do mundo para IA baseada em agentes.

Benefícios

Destaques do Switch NVIDIA Quantum InfiniBand.

Computação em Rede

NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ v4 para desempenho 9 vezes maior

Escala mais alta

Mais de 10 mil nós em uma fat-tree de dois níveis

Otimizado para NCCL

Acelerado por SHARP, para desempenho até 2,5 vezes maior

Malhas autorreparáveis

Recuperação mais rápida para resiliência mil vezes maior

Produtos

Switches e Dispositivos NVIDIA Quantum InfiniBand

Switches NVIDIA InfiniBand Quantum-X800

Os switches NVIDIA Quantum-X800 InfiniBand oferecem 800 gigabits por segundo (Gb/s) de taxa de transferência, latência ultrabaixa, computação avançada em rede da NVIDIA e recursos que elevam o desempenho geral das aplicações em data centers de computação de alto desempenho (HPC) e IA.

O switch NVIDIA Quantum-X Photonics reduz ainda mais o consumo total de energia e a latência, minimizando a distância e o número de conexões entre óptica e eletrônica.

Família de Switches NVIDIA Quantum-2 InfiniBand

Os switches NVIDIA Quantum-2 InfiniBand oferecem uma taxa de processamento de 400 Gb/s, computação em rede, mecanismos de aceleração inteligentes, flexibilidade e uma arquitetura robusta para alcançar um desempenho inigualável em infraestruturas de HPC, IA e nuvem em hiperescala, com menor custo e complexidade.

Gateway InfiniBand para Ethernet NVIDIA Skyway

O dispositivo NVIDIA® Skyway™ é um gateway InfiniBand para Ethernet de 1,6 terabit por segundo (Tb/s) compatível com oito portas de 100 ou 200 Gb em cada lado InfiniBand e Ethernet. O número de aparelhos Skyway pode ser facilmente escalado ao longo do tempo para atender à demanda dos usuários.

Sistemas NVIDIA MetroX-3 XC

O NVIDIA MetroX®-3 XC estende o alcance da InfiniBand para até 40 quilômetros. Permitindo a conectividade entre data centers remotos, incluindo infraestruturas de edge, e entre data centers e infraestruturas de armazenamento remoto, o MetroX-3 XC fornece criptografia em longas distâncias e infraestruturas de multiplexação densa por divisão de comprimento de onda (DWDM).

Inovações

Inovações da NVIDIA Quantum InfiniBand

Software de Switches InfiniBand

O NVIDIA NVOS, um sistema operacional de switches InfiniBand para data centers de alto desempenho, permite a criação de redes que podem ser escaladas para milhares de nós de computação e armazenamento, ao mesmo tempo em que fornece recursos de monitoramento e provisionamento.

Computação em Rede

Os switches NVIDIA Quantum InfiniBand, incluindo o Scalable Hierarchical Aggregation and Reduction Protocol (SHARP), descarregam e aceleram os algoritmos de redução de dados, aumentando o desempenho e a escalabilidade de aplicações de HPC e IA.

Softwares Dimensionáveis de HPC

O NVIDIA HPC-X® é um pacote de software abrangente de Interface de Passagem de Mensagens (MPI) e Acesso à Memória Compartilhada (SHMEM)/Espaço de Endereço Global Particionado (PGAS) que aproveita os mecanismos de computação em rede e aceleração do InfiniBand para otimizar aplicações de pesquisa e do setor.

Unified Fabric Manager (UFM)

A plataforma NVIDIA UFM® oferece aos administradores de data centers o poder de solucionar proativamente problemas na infraestrutura de rede InfiniBand, além de provisioná-la, monitorá-la e gerenciá-la com eficiência.

Recursos

Conheça os Comutadores Baseados em Óptica Coempacotados (CPO) da NVIDIA

Os switches NVIDIA CPO oferecem eficiência energética cinco vezes melhor, resiliência dez vezes maior e implantação 1,3 vez mais rápida do que os transceptores tradicionais, fornecendo a escala necessária para impulsionar fábricas de IA de última geração.

Ligando o Switch Fotônico NVIDIA Quantum-X InfiniBand

Quando o switch NVIDIA Quantum‑X CPO Q3450 e o ConnectX‑8 SuperNIC™ conectam os racks GB300, eles demonstram a rede de expansão horizontal da fotônica em silício da NVIDIA — a solução mais avançada do mundo para IA baseada em agentes.

Computação em Rede com o NVIDIA SHARP

Os switches NVIDIA Quantum InfiniBand com tecnologia SHARP realizam reduções de dados diretamente na rede, oferecendo velocidades significativamente mais rápidas e menor sobrecarga de CPU do que os métodos tradicionais.

Maximizando o Desempenho para deep learning Distribuído com o NVIDIA SHARP

A NVIDIA SHARP aproveita a computação em rede dentro do switch Quantum para melhorar significativamente o desempenho de workloads de Machine Learning distribuídas.

Ficha Técnica do Switch NVIDIA Quantum-X800

Ficha Técnica do Switch NVIDIA Quantum-2

Ficha Técnica do Switch NVIDIA Quantum

Ficha Técnica do NVIDIA Skyway

Ficha Técnica dos Sistemas NVIDIA MetroX-3 XC

Manual do Usuário do NVIDIA MetroX-2 XC Systems

Segurança Multilocatária com um Clique com NVIDIA Quantum InfiniBand

Simplificação das operações de rede para IA com o NVIDIA Quantum InfiniBand

Transforme seu data center em um Mega data center com os Sistemas de Longa Distância MetroX

Perguntas Frequentes sobre Switches e Dispositivos NVIDIA Quantum InfiniBand

O InfiniBand é um padrão de interconexão de alto desempenho criado para comunicação de baixa latência e alta largura de banda entre nós de computação. Para workloads de treinamento de IA e HPC que distribuem a computação em centenas ou milhares de GPUs, a latência de rede afeta diretamente o tempo de conclusão de trabalhos. O NVIDIA Quantum InfiniBand também é a única plataforma de interconexão com suporte à computação na rede, que transfere operações coletivas, como o AllReduce, para a própria malha do switch, liberando ciclos de GPU para a computação real.

Os designs de switches convencionais usam transceptores ópticos plugáveis para conectar o ASIC do switch à fibra. Cada transceptor é um componente discreto que consome energia, gera calor e pode falhar. Em escala de clusters, isso significa gerenciar e substituir milhares de transceptores individuais ao longo da vida útil da implantação.

O switch NVIDIA Quantum-X InfiniBand Photonics integra mecanismos ópticos diretamente ao silício do switch, eliminando os transceptores plugáveis. Isso encurta o caminho elétrico entre o chip e a fibra, reduzindo o consumo de energia e a latência, enquanto um número menor de componentes discretos melhora a confiabilidade e simplifica as operações de longo prazo.

Computação em rede é a capacidade dos switches NVIDIA Quantum de executar operações de processamento de dados dentro da malha de rede, sem envolver CPUs ou GPUs host. O principal recurso é o NVIDIA SHARP, que transfere operações coletivas, como o AllReduce, diretamente para os switches. Para treinamento de IA distribuída, isso reduz o tempo gasto em comunicação entre nós e libera ciclos de GPU para computação. A SHARP acelera as operações coletivas no núcleo da maioria dos códigos de simulação paralela, reduzindo a latência e a sobrecarga de CPU. As aplicações que aproveitam NCCL, OpenMPI, UCX ou outros stacks de MPI compatíveis com padrões se beneficiam com alterações mínimas de código, tornando a Computação em Rede relevante em todos os domínios, desde o treinamento de IA até a dinâmica molecular e a modelagem climática.

Para novas implantações de IA em larga escala, a melhor escolha é o NVIDIA Quantum-X800 InfiniBand. Ele oferece conectividade XDR de 800 Gb/s e foi projetado para fábricas de IA de próxima geração que exigem máxima largura de banda para expansão horizontal, baixa latência, roteamento adaptativo, controle de congestionamento e computação in‑network SHARP para coletivos de IA e HPC. O Quantum-2 NDR 400 Gb/s continua sendo uma opção sólida para implantações de geração Hopper ou com custo otimizado, mas para novos clusters em escala Blackwell, o Quantum-X800 fornece a melhor trajetória de desempenho a longo prazo. O Q3200 é a plataforma de switches Quantum-X800 2U com resfriamento a ar, sendo adequado para ambientes grandes ou de geração mista que exigem alta densidade de portas e um caminho prático de migração.

O NVIDIA Unified Fabric Manager (UFM) é a plataforma de gerenciamento de malha para implantações do NVIDIA Quantum InfiniBand. A UFM (oferecida como um dispositivo integrado e como software autônomo) lida com provisionamento, monitoramento em tempo real, diagnóstico e solução proativa de problemas em toda a malha. O NVIDIA UFM Cyber-AI é um dispositivo dedicado para detectar comportamentos anômalos de rede que podem indicar ameaças de segurança ou problemas de hardware antes que eles impactem as tarefas.

Essa é uma consideração comum para organizações que expandem clusters existentes ou fazem sua implementação em fases. Em geral, o NVIDIA Quantum InfiniBand foi projetado para oferecer compatibilidade futura: adaptadores e switches operando em diferentes gerações de InfiniBand negociarão automaticamente para a velocidade comum apropriada. Para implantações que precisam conectar ambientes Quantum-X800 (XDR, 800 Gb/s) e Quantum-2 (NDR, 400 Gb/s), a NVIDIA recomenda o Q3200, um switch de várias velocidades criado especificamente para conectar essas duas gerações. As considerações específicas de design relacionadas à topologia, mapeamento de portas e configuração de malha usando o Q3200 são abordadas na documentação do switch NVIDIA InfiniBand.

Sim. O dispositivo NVIDIA Skyway™ foi projetado especificamente para esse caso de uso, fornecendo um gateway InfiniBand para Ethernet. A Skyway permite que os clusters de computação InfiniBand se comuniquem com sistemas de armazenamento anexados à Ethernet, redes de gerenciamento ou outra infraestrutura Ethernet sem exigir alterações em nenhum dos ambientes. Vários dispositivos Skyway podem ser implantados e escalados de forma incremental à medida que as demandas de largura de banda em diferentes redes crescem.

Próximos passos

Que tal começar agora?

Configure Seu Cluster

Esta ferramenta on-line pode ajudar você a configurar clusters baseados em fat-tree com dois níveis de sistemas de comutadores e topologias Dragonfly+.

Faça Cursos Sobre Redes

Explore tópicos de treinamento técnico aprofundados em redes NVIDIA Quantum InfiniBand por meio da NVIDIA Academy.

Como Comprar Soluções de Rede da NVIDIA?

Acesse o NVIDIA marketplace para obter mais informações sobre como comprar soluções de rede da NVIDIA.