Supercomputação Nativa no Cloud

Desempenho perfeito de HPC e AI, isolamento de
locatários de vários nós e segurança.

Desempenho Bare-Metal com Isolamento Multilocatário

A supercomputação nativa do cloud combina a potência da computação de alto desempenho com a segurança e a facilidade de uso dos serviços de computação no cloud. A plataforma de Supercomputação Nativa do Cloud da NVIDIA aproveita a arquitetura de unidade de processamento de dados (DPU – Data Processing Unit) NVIDIA® BlueField®  com a rede NVIDIA InfiniBand de alta velocidade e baixa latência para oferecer desempenho bare-metal, gerenciamento e isolamento de usuários, proteção de dados e computação de alto desempenho (HPC - High-Performance Computing) e serviços de AI sob demanda, de forma simples e segura.

Inovação para a Próxima Década e Além

A Plataforma de Supercomputação Nativa do Cloud

Para fornecer o máximo de desempenho, os supercomputadores precisam oferecer segurança multilocatário, o que é idealmente obtido por plataformas nativas do cloud. O elemento-chave que permite essa transição de arquitetura é a DPU.

Como uma plataforma de data center em um chip totalmente integrada, a DPU pode descarregar e gerenciar a infraestrutura de data center em vez do processador host, possibilitando a segurança e a orquestração do supercomputador.

Combinada com a comutação NVIDIA InfiniBand, essa arquitetura oferece o desempenho bare-metal ideal ao mesmo tempo que oferece suporte nativo ao isolamento de locatários de vários nós.

A Plataforma de Supercomputação Nativa do Cloud
Rumo a uma Arquitetura de Confiança Zero

Rumo a uma Arquitetura de Confiança Zero

Os sistemas de supercomputação nativa do cloud são projetados para oferecer o máximo desempenho, segurança e orquestração em um ambiente multilocatário.

A DPU BlueField pode hospedar locatários de vários nós não confiáveis ao mesmo tempo que garante que os recursos de supercomputação sejam entregues a novos locatários sem residuais anteriores. Para isso, a DPU BlueField fornece uma imagem de inicialização limpa para um novo locatário agendado, realiza uma limpeza completa e o restabelecimento da confiança, virtualiza o armazenamento e concede acesso a áreas de armazenamento aprovadas.

Aceleração do Desempenho de Aplicações

As bibliotecas e os frameworks de comunicação de AI e HPC são sensíveis à latência e à largura de banda, e elas desempenham um papel fundamental na determinação do desempenho das aplicações.

Descarregar as bibliotecas da CPU ou da GPU do host para a DPU BlueField cria o mais alto grau de sobreposição para progressão paralela de comunicação e computação. Também reduz os efeitos negativos da tremulação do sistema operacional e aumenta significativamente o desempenho das aplicações. Isso é fundamental para possibilitar a próxima geração de arquitetura de supercomputação.

Os resultados iniciais da pesquisa da Universidade Ohio State demonstram que supercomputadores nativos do cloud podem executar trabalhos de HPC 1,4 vezes mais rápido do que os tradicionais.

A DPU Oferece Aceleração de Desempenho 1,4 Vezes Maior para P3DFFT

Aceleração do Desempenho de Aplicações

Plataforma de Supercomputação Nativa do Cloud

NVIDIA Bluefield

A DPU NVIDIA BlueField combina o adaptador de rede líder do setor NVIDIA Mellanox ConnectX®, uma matriz de núcleos Arm com um subsistema PCIe e engines de aceleração de hardware HPC desenvolvidos especificamente para oferecer programabilidade completa de infraestrutura de data center em chip.

InfiniBand

A Rede NVIDIA Mellanox InfiniBand acelera e descarrega transferências de dados para garantir que os recursos de computação nunca "passem fome" devido à falta de dados ou largura de banda. A rede InfiniBand pode ser particionada entre diferentes usuários ou locatários, fornecendo garantias de Qualidade de Serviço (QoS) e segurança.

DOCA

O SDK NVIDIA DOCA  permite que os desenvolvedores de infraestrutura criem rapidamente aplicações e serviços de rede, armazenamento, segurança, gerenciamento, AI e HPC na DPU NVIDIA BlueField, aproveitando APIs padrão do setor. Com o DOCA, os desenvolvedores podem programar a infraestrutura de supercomputação do futuro criando serviços acelerados por DPU de alto desempenho, definidos por software e nativos do cloud.

Magnum IO

O kit de desenvolvimento de software NVIDIA MAGNUM IO™ permite que os desenvolvedores otimizem a entrada/saída (IO) em aplicações, reduzindo o tempo de ponta a ponta de seus workflows.

O Magnum IO abrange todos os aspectos de E/S, incluindo armazenamento, networking, várias GPUs e comunicações de vários nós. Ele também inclui ferramentas para analisar e ajustar aplicações e eliminar gargalos de E/S.

Principais Recursos

  • Isolamento multilocatário, proteção de dados e segurança
  • Descarregamentos de serviço de infraestrutura
  • Engines de hardware dedicados para acelerar frameworks de comunicação
  • Qualidade de Serviço (QoS) aprimorada

Vantagens

  • Oferece o desempenho bare-metal ideal
  • Aumenta a disponibilidade da CPU, a escalabilidade de aplicações e a eficiência do sistema
  • Sobreposição mais alta de computação e comunicação
  • Tremulação/ruído do sistema reduzidos
  • Custos de infraestrutura reduzidos

Saiba mais sobre a supercomputação nativa do cloud na visão geral técnica.