에이전틱 AI를 위해 특별히 설계된 CPU입니다.
개요
NVIDIA Vera는 코드 실행, 도구 사용, 샌드박싱, 분석, 데이터 파이프라인 및 모델을 넘어선 오케스트레이션 등 에이전틱 AI 및 강화 학습(RL)의 CPU 작업에 최적화되어 있습니다. 가속 시스템을 위한 호스트 CPU이자 AI 팩토리 워크로드를 위한 독립형 CPU인 Vera는 GPU에 데이터를 지속적으로 공급하고, 에이전트의 응답성을 유지하며, 학습 루프를 원활하게 진행합니다. 빠르고 에너지 효율적인 NVIDIA Olympus 코어와 고대역폭 LPDDR5X 메모리를 통해 Vera는 기존 CPU 인프라보다 최대 70% 더 빠른 샌드박스 환경 성능을 제공하여 AI 팩토리가 비용 대비 더 많은 토큰을 생성할 수 있도록 지원합니다.
NVIDIA Vera CPU Rack은 AI 팩토리 규모의 강화 학습 및 에이전틱 AI를 지원합니다. NVIDIA MGX™를 기반으로 구축된 이 시스템은 최대 256개의 Vera CPU를 통합하여 22,500개 이상의 동시 환경을 실행할 수 있습니다.
주요 내용
기존 CPU는 에이전틱 AI의 병목 현상을 초래합니다. 에이전트의 추론 루프 전반에서 CPU는 SQLite 메모리에 쿼리를 보내고, 생성된 코드를 컴파일하고, Python 툴체인을 실행하고, 정규 표현식을 사용하여 출력을 파싱합니다. NVIDIA Vera는 이 5가지 워크로드 모두를 선도적인 x86 CPU 대비 최대 1.8배까지 가속화함으로써 에이전트 내부 루프를 터보차징하고 AI 팩토리의 생산성을 극대화합니다.
측정된 데이터를 기반으로 한 상대적 성능이며, 변경될 수 있습니다. NVIDIA Vera CPU 성능은 코드 컴파일, 인터프리터, 스크립팅, 런타임 엔진, 추출, 변환 및 로드(ETL), 데이터 분석 및 그래프를 포함한 다양한 워크로드에서 베이스라인으로 설정된 x86 CPU(AMD EPYC Turin) 대비 측정된 성능입니다.
측정된 데이터를 기반으로 한 상대적 성능이며, 변경될 수 있습니다. LPDDR5X를 탑재한 NVIDIA Vera CPU의 성능은 주요 CPU 메모리 성능 지표 전반에서 베이스라인으로 설정된 DDR5 탑재 x86 CPU(AMD EPYC Turin) 대비 측정된 성능입니다.
기존 DDR5는 대역폭, 효율성, 서비스 용이성 간의 절충을 강요합니다. NVIDIA Vera는 LPDDR5X 메모리와 SOCAMM을 결합합니다. 탈착식 모듈로 현장 교체가 가능한 SOCAMM은 서버급 유연성과 확장 가능한 용량을 갖추고 있으며 저전력(LP) 효율성을 제공합니다. 그 결과, DDR5 탑재 주요 x86 CPU 대비 대역폭은 2배, 코어당 대역폭은 3배, 에너지 효율은 4배 향상되어 하이퍼스케일 및 엔터프라이즈 규모에서 AI 팩토리 생산성을 극대화할 수 있습니다.
사용 사례
주요 기능
강화 학습 및 에이전틱 AI의 요구 사항을 충족하도록 설계된 NVIDIA Vera는 맞춤 설계된 Olympus 코어, 고대역폭 LPDDR5X 메모리 및 저지연 NVIDIA Scalable Coherency Fabric(SCF)을 결합합니다. NVIDIA NVLink™-C2C 연결성, 컨피덴셜 컴퓨팅 및 완벽한 Arm® 호환성을 통해 Vera는 가속 시스템과 현대적인 데이터 센터 환경 전반으로 확장됩니다. Vera의 모놀리식 컴퓨팅 아키텍처는 소프트웨어 환경의 응답성을 유지하고 데이터 이동을 효율적으로 관리하여 AI, 분석 및 HPC 워크로드 전반에 걸쳐 처리량, 에너지 효율 및 GPU 활용도를 극대화할 수 있도록 지원합니다.
NVIDIA Vera Rubin NVL72는 NVIDIA의 최첨단 기술인 72개의 Rubin GPU, 36개의 Vera CPU, ConnectX®-9 SuperNICs 및 BlueField-4 DPU를 통합합니다. NVLink 6 스위치를 통해 랙 규모 플랫폼에서 인텔리전스를 확장하고, NVIDIA Quantum-X800 InfiniBand 및 Spectrum-X™ 이더넷을 통해 수평 확장을 실현하여 AI 산업 혁명을 주도합니다.
시작하기
등록하여 NVIDIA 최신 뉴스와 다양한 업데이트를 받으세요.