NVIDIA Vera

에이전틱 AI를 위해 특별히 설계된 CPU입니다.

개요
주요 내용
사용 사례
주요 기능
Vera 아키텍처
시작하기

개요
주요 내용
사용 사례
주요 기능
Vera 아키텍처
시작하기

개요

전 세계 AI 팩토리를 위해 최적화된 설계

NVIDIA Vera는 코드 실행, 도구 사용, 샌드박싱, 분석, 데이터 파이프라인 및 모델을 넘어선 오케스트레이션 등 에이전틱 AI 및 강화 학습(RL)의 CPU 작업에 최적화되어 있습니다. 가속 시스템을 위한 호스트 CPU이자 AI 팩토리 워크로드를 위한 독립형 CPU인 Vera는 GPU에 데이터를 지속적으로 공급하고, 에이전트의 응답성을 유지하며, 학습 루프를 원활하게 진행합니다. 빠르고 에너지 효율적인 NVIDIA Olympus 코어와 고대역폭 LPDDR5X 메모리를 통해 Vera는 기존 CPU 인프라보다 최대 70% 더 빠른 샌드박스 환경 성능을 제공하여 AI 팩토리가 비용 대비 더 많은 토큰을 생성할 수 있도록 지원합니다.

세계 AI 에이전트 실행을 위해 설계된 CPU, Vera 소개

NVIDIA는 에이전틱 AI, 강화 학습 및 데이터 처리 등 산업 전반에 걸쳐 다양한 워크로드를 구동할 수 있는 고성능, 에너지 효율적인 NVIDIA Vera CPU를 출시했습니다.

보도 자료 읽기

Vera 출시: NVIDIA 최초의 에이전트용으로 설계된 CPU, 주요 AI 연구소에 도입

이안 벅(Ian Buck) NVIDIA 하이퍼스케일 및 고성능 컴퓨팅(HPC) 부문 부사장이 Anthropic, OpenAI, Oracle Cloud Infrastructure, SpaceXAI에 최초의 NVIDIA Vera CPU 시스템을 직접 전달하며, 에이전틱 CPU가 발표 단계를 넘어 프로덕션 환경으로 진입했음을 알렸습니다.

블로그 읽기

NVIDIA Vera CPU Rack

NVIDIA Vera CPU Rack은 AI 팩토리 규모의 강화 학습 및 에이전틱 AI를 지원합니다. NVIDIA MGX™를 기반으로 구축된 이 시스템은 최대 256개의 Vera CPU를 통합하여 22,500개 이상의 동시 환경을 실행할 수 있습니다.

자세히 알아보기

주요 내용

업계 최고의 에이전틱 CPU 성능

1.8배 더 빠른 에이전틱 샌드박스 성능

기존 CPU는 에이전틱 AI의 병목 현상을 초래합니다. 에이전트의 추론 루프 전반에서 CPU는 SQLite 메모리에 쿼리를 보내고, 생성된 코드를 컴파일하고, Python 툴체인을 실행하고, 정규 표현식을 사용하여 출력을 파싱합니다. NVIDIA Vera는 이 5가지 워크로드 모두를 선도적인 x86 CPU 대비 최대 1.8배까지 가속화함으로써 에이전트 내부 루프를 터보차징하고 AI 팩토리의 생산성을 극대화합니다.

측정된 데이터를 기반으로 한 상대적 성능이며, 변경될 수 있습니다. NVIDIA Vera CPU 성능은 코드 컴파일, 인터프리터, 스크립팅, 런타임 엔진, 추출, 변환 및 로드(ETL), 데이터 분석 및 그래프를 포함한 다양한 워크로드에서 베이스라인으로 설정된 x86 CPU(AMD EPYC Turin) 대비 측정된 성능입니다.

측정된 데이터를 기반으로 한 상대적 성능이며, 변경될 수 있습니다. LPDDR5X를 탑재한 NVIDIA Vera CPU의 성능은 주요 CPU 메모리 성능 지표 전반에서 베이스라인으로 설정된 DDR5 탑재 x86 CPU(AMD EPYC Turin) 대비 측정된 성능입니다.

고대역폭, 에너지 효율적인 메모리

기존 DDR5는 대역폭, 효율성, 서비스 용이성 간의 절충을 강요합니다. NVIDIA Vera는 LPDDR5X 메모리와 SOCAMM을 결합합니다. 탈착식 모듈로 현장 교체가 가능한 SOCAMM은 서버급 유연성과 확장 가능한 용량을 갖추고 있으며 저전력(LP) 효율성을 제공합니다. 그 결과, DDR5 탑재 주요 x86 CPU 대비 대역폭은 2배, 코어당 대역폭은 3배, 에너지 효율은 4배 향상되어 하이퍼스케일 및 엔터프라이즈 규모에서 AI 팩토리 생산성을 극대화할 수 있습니다.

사용 사례

AI 팩토리를 위한 설계

호스트 CPU

NVIDIA Vera는 NVIDIA Vera Rubin NVL72 및 HGX™ Vera Rubin NVL8 플랫폼을 포함한 AI 팩토리의 호스트 CPU로서 시스템 수준의 효율성을 제공합니다. Vera는 대규모 AI 처리를 위해 GPU에 데이터를 공급하는 동시에 ETL, 키-값(KV) 캐시 관리 및 오케스트레이션을 비롯한 AI 팩토리 운영에 필요한 CPU 작업을 수행합니다. 높은 단일 스레드 성능, 대규모 메모리 대역폭, 그리고 칩렛 간 지연 시간을 방지하는 단일 컴퓨팅 다이 설계를 통해 Vera는 가속 AI 및 HPC 시스템 전반에서 GPU를 최대한 활용하는 동시에 예측 가능한 성능을 제공합니다.

독립형 CPU

에이전틱 AI, 강화 학습, 데이터 처리 및 분석을 위해 NVIDIA Vera는 탁월한 코어당 성능과 방대한 메모리 대역폭을 제공하여 수천 개의 병렬 샌드박스 환경, 도구 호출, 코드 실행, 평가 루프 및 데이터 워크플로우를 실행합니다. CPU 실행 속도가 빨라지면 에이전트의 대기 시간이 줄어들고, 강화 학습(RL) 시스템이 학습 단계당 더 많은 피드백을 생성하며, AI 팩토리가 비용 대비 더 많은 토큰을 생성할 수 있습니다. 또한 독립형 CPU 플랫폼인 Vera는 하이퍼스케일 클라우드, 엔터프라이즈 및 HPC 워크로드를 지원하며, NVIDIA Vera BlueField®-4 STX를 통해 스토리지 인프라까지 확장할 수 있습니다. 고밀도 수랭식 NVIDIA Vera CPU 랙 또는 표준 듀얼 및 싱글 소켓 구성으로 제공되는 Vera는 모든 데이터 센터 환경에 적합합니다.

주요 기능

기술 혁신 살펴보기

강화 학습 및 에이전틱 AI의 요구 사항을 충족하도록 설계된 NVIDIA Vera는 맞춤 설계된 Olympus 코어, 고대역폭 LPDDR5X 메모리 및 저지연 NVIDIA Scalable Coherency Fabric(SCF)을 결합합니다. NVIDIA NVLink™-C2C 연결성, 컨피덴셜 컴퓨팅 및 완벽한 Arm® 호환성을 통해 Vera는 가속 시스템과 현대적인 데이터 센터 환경 전반으로 확장됩니다. Vera의 모놀리식 컴퓨팅 아키텍처는 소프트웨어 환경의 응답성을 유지하고 데이터 이동을 효율적으로 관리하여 AI, 분석 및 HPC 워크로드 전반에 걸쳐 처리량, 에너지 효율 및 GPU 활용도를 극대화할 수 있도록 지원합니다.

NVIDIA 맞춤형 Olympus 코어

NVIDIA Vera는 에이전틱 AI 및 강화 학습의 제어 집약적이고 지연 시간에 민감한 작업을 위해 설계된 88개의 맞춤형 Olympus 코어를 갖추고 있습니다. 높은 단일 스레드 성능은 소프트웨어 환경, 도구 호출 및 평가 루프를 더 빠르게 완료할 수 있도록 지원하며, NVIDIA Spatial Multithreading은 분할된 코어 리소스를 갖춘 176개의 스레드를 생성하여 대규모 환경에서도 예측 가능한 처리량을 제공합니다.

LPDDR5X 메모리 서브시스템

NVIDIA Vera는 최대 초당 1.2테라바이트(TB/s)의 LPDDR5X 메모리 대역폭을 제공하여 기존 CPU 메모리 대비 2배의 대역폭을 절반의 전력 소비로 제공합니다. 이를 통해 수천 개의 병렬 소프트웨어 환경의 응답성을 원활하게 유지하면서, 더 빠른 강화 학습(RL) 반복, 효율적인 KV 캐시 관리 및 데이터 집약적인 에이전트 워크플로우를 지원합니다. 최대 1.5TB의 메모리를 갖춘 Vera는 AI 팩토리, 분석 및 HPC 워크로드에 필요한 용량과 효율성을 제공합니다.

2세대 NVIDIA SCF

NVIDIA Vera는 2세대 NVIDIA SCF를 사용하여 88개의 코어, 캐시, 메모리, 입출력(IO), NVLink-C2C를 모두 단일 컴퓨팅 다이에서 연결합니다. 3.4TB/s의 양분 대역폭과 통합 캐시 아키텍처를 갖춘 SCF는 CPU 사용률이 최대치에 달하는 경우에도 코어가 데이터에 빠르고 일관되게 접근할 수 있도록 지원합니다. 칩렛 간 통신을 피함으로써 Vera는 에이전틱 워크로드, 분석 및 대규모 AI 팩토리 인프라에 대해 예측 가능한 지연 시간과 처리량을 유지합니다.

NVIDIA NVLink-C2C

NVIDIA NVLink-C2C는 Vera CPU와 NVIDIA GPU 간에 최대 1.8TB/s의 코히어런트 대역폭을 제공합니다. NVIDIA Rubin GPU와 함께 사용하면 Vera는 CPU와 GPU가 복잡한 AI 및 HPC 워크로드, 대규모 데이터세트, KV-캐시 오프로드에서 협업할 수 있도록 지원하는 통합 메모리 아키텍처를 구축합니다. NVLink-C2C는 데이터 전송 병목 현상을 줄이고, 최적화를 간소화하며, 민감한 데이터와 코드를 안전하게 격리하고, 듀얼 소켓 Vera CPU 시스템에서 고속 연결을 가능하게 합니다.

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72는 NVIDIA의 최첨단 기술인 72개의 Rubin GPU, 36개의 Vera CPU, ConnectX®-9 SuperNICs 및 BlueField-4 DPU를 통합합니다. NVLink 6 스위치를 통해 랙 규모 플랫폼에서 인텔리전스를 확장하고, NVIDIA Quantum-X800 InfiniBand 및 Spectrum-X™ 이더넷을 통해 수평 확장을 실현하여 AI 산업 혁명을 주도합니다.

자세히 알아보기

시작하기

NVIDIA 최신 뉴스 받기

등록하여 NVIDIA 최신 뉴스와 다양한 업데이트를 받으세요.

최신 정보 받기

새로운 정보 제공 시 이메일로 알림 받기

Section

Section

이름

성

회사 이메일 주소

조직 / 대학교 이름

업계

직함

지역

선호 언어

시/도

enterpriseOptIns hidden field

NVIDIA 뉴스레터에 구독하고 최신 엔터프라이즈 소식과 신제품 및 기술, 그리고 다양한 교육 안내 등을 받아보겠습니다. 언제든지 구독을 취소할 수 있습니다.

nvid hidden field

ncid hidden field

NVIDIA 개인정보보호정책

연구 및 이벤트 조직을 목적으로 NVIDIA <span class="corporation-txt hidden">Corporation </span>가 위의 정보를 수집하고 처리하는 것에 동의하며, <a href="https://www.nvidia.com/ko-kr/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">NVIDIA 개인정보 보호정책</a>을 읽고 이에 동의합니다.

본인은 위의 정보가 미국의 NVIDIA Corporation으로 전송되며, 연구, 이벤트 조직 및 해당 NVIDIA 내부 관리 및 시스템 운영 필요에 따라 <a href="https://www.nvidia.com/ko-kr/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">NVIDIA 개인정보 보호정책</a>에 일치하는 방식으로 저장되는 것에 동의합니다. 관련 문제를 해결하기 위해 <a href="mailto:privacy@nvidia.com">privacy@nvidia.com</a>으로 이메일을 보내 연락할 수 있습니다.