A CPU para agentes.
Visão geral
A NVIDIA Vera foi desenvolvida para as cargas de trabalho de CPU que dão suporte à IA baseada em agentes e à aprendizagem por reforço (RL), incluindo execução de código, uso de ferramentas, isolamento em sandbox, análises, pipelines de dados e orquestração além do modelo. Atuando tanto como CPU host para sistemas acelerados quanto CPU independente para cargas de trabalho de fábricas de IA, a Vera mantém as GPUs abastecidas com dados, os agentes responsivos e os loops de treinamento em execução. Com núcleos NVIDIA Olympus rápidos e energeticamente eficientes, além de memória LPDDR5X de alta largura de banda, a Vera oferece desempenho de ambiente de sandbox até 80% mais rápido do que a infraestrutura de CPU tradicional, ajudando as fábricas de IA a gerar mais tokens por dólar.
O Rack de CPU NVIDIA Vera impulsiona a aprendizagem por reforço e a IA baseada em agentes em escala de fábricas de IA. Criado com base no NVIDIA MGX™, integra até 256 CPUs Vera para executar mais de 22,5 mil ambientes simultâneos.
Destaques
A IA baseada em agentes é congestionada por CPUs tradicionais. Ao longo do loop de raciocínio de um agente, a CPU compila o código gerado, executa cadeias de ferramentas Python e analisa o código do software. A NVIDIA Vera acelera todas as três cargas de trabalho em até 1,8x em relação às principais CPUs x86, acelerando o loop interno baseado em agentes para maximizar a produção da fábrica de IA.
Desempenho relativo com base em dados medidos e sujeito a alterações. CPU NVIDIA Vera com desempenho LPDDR5X comparado à CPU x86 de última geração como linha de base.
Desempenho relativo com base em dados medidos e sujeito a alterações. CPU NVIDIA Vera com desempenho LPDDR5X comparado à CPU x86 com DDR5 de última geração como linha de base em métricas relevantes de desempenho de memória de CPU.
O DDR5 tradicional força uma compensação entre largura de banda, eficiência e capacidade de manutenção. A NVIDIA Vera combina a memória LPDDR5X com SOCAMM, módulos destacáveis e substituíveis em campo que oferecem eficiência de baixo consumo de energia (LP) com flexibilidade de nível de servidor e capacidade atualizável. O resultado é o dobro da largura de banda e três vezes mais largura de banda por núcleo em comparação com as principais CPUs x86 com DDR5, possibilitando maior produção das fábricas de IA em hiperescala e escala empresarial.
Casos de Uso
Recursos
Desenvolvida para atender às exigências de aprendizagem por reforço e IA baseada em agentes, a NVIDIA Vera combina núcleos Olympus projetados sob medida, memória LPDDR5X de alta largura de banda e NVIDIA Scalable Coherency Fabric (SCF) de baixa latência. Com conectividade NVIDIA NVLink™-C2C, computação confidencial e compatibilidade total com Arm®, a Vera se estende por sistemas acelerados e ambientes de data center modernos. Sua arquitetura de computação monolítica mantém os ambientes de software responsivos e os dados fluindo de forma eficiente, ajudando a maximizar a taxa de processamento, a eficiência energética e a utilização de GPU em cargas de trabalho de IA, análise de dados e HPC.
O NVIDIA Vera Rubin NVL72 unifica tecnologias de ponta da NVIDIA: 72 GPUs Rubin, 36 CPUs Vera, SuperNICs ConnectX®-9 e DPUs BlueField-4. Ele aumenta a inteligência em uma plataforma em escala de rack com o switch NVLink 6 e se expande com o NVIDIA Quantum-X800 InfiniBand e o Spectrum-X™ Ethernet para impulsionar a revolução industrial de IA.
Comece Agora
Inscreva-se para receber as últimas notícias, atualizações e novidades da NVIDIA.