エージェント型 AI 向けに設計された CPU。
概要
NVIDIA Vera は、エージェント型 AI と強化学習 (RL) を支える CPU 処理のために設計されています。これにはコード実行、ツール使用、サンドボックス、分析、データ パイプライン、そしてモデルの枠を超えたオーケストレーションが含まれます。Vera は、アクセラレーテッド システム向けのホスト CPU と AI ファクトリーワークロード向けのスタンドアロン CPU の両方として、GPU を絶えず稼働させ、エージェントの応答性を保ち、トレーニング ループを止めません。高速でエネルギー効率に優れた NVIDIA Olympus コアと高帯域幅 LPDDR5X メモリを搭載した Vera は、従来の CPU インフラストラクチャと比較して最大 70% 高速なサンドボックス環境パフォーマンスを実現し、AI ファクトリーが 1 ドルあたりより多くのトークンを生成できるよう支援します。
NVIDIA Vera CPU ラックは、AI ファクトリー規模で強化学習とエージェント型 AI を支えます。NVIDIA MGX™ を基盤に構築され、最大 256 基の Vera CPU を統合し、22.5K 以上の同時環境を実行します。
ハイライト
エージェント型 AI は従来の CPU によってボトルネックが発生します。エージェントの推論ループ全体で、CPU が SQLite メモリにクエリを行い、生成されたコードをコンパイルし、Python ツールチェーンを実行し、正規表現を使用して出力をパースします。NVIDIA Vera は、5 つのワークロードすべてを、主要 x86 CPU と比較して最大 1.8 倍高速化し、エージェント型内ループをターボチャージして、AI ファクトリーの出力を最大化します。
相対的なパフォーマンスは測定データに基づいており、変更される可能性があります。NVIDIA Vera CPU パフォーマンスは、コードのコンパイル、インタープリター、スクリプト、ランタイム エンジン、抽出、トランスフォーム、ロード (ETL)、データ分析、グラフなど、さまざまなワークロードにわたって x86 CPU (AMD EPYC Turin) を基準に測定されています。
相対的なパフォーマンスは測定データに基づいており、変更される可能性があります。主要な CPU メモリ パフォーマンス指標全体にわたって、DDR5 を搭載した x86 CPU (AMD EPYC Turin) を基準とした、LPDDR5X を搭載した NVIDIA Vera CPU の相対パフォーマンス。
従来の DDR5 では、帯域幅、効率性、保守性との間でトレードオフを余儀なくされます。NVIDIA Vera は、LPDDR5X メモリと、サーバークラスの柔軟性と容量のアップグレードを可能にしながら低電力 (LP) 効率を実現する、着脱可能で現場交換可能なモジュールである SOCAMM を組み合わせています。その結果、DDR5 を搭載した主要な x86 CPU と比較して、帯域幅が 2 倍、コアあたり 3 倍、エネルギー効率が 4 倍に達し、ハイパースケールおよびエンタープライズ規模でより優れた AI ファクトリー出力を実現します。
ユース ケース
特徴
強化学習とエージェント型 AI の要求に応えるべく構築された NVIDIA Vera は、カスタム設計の Olympus コア、高帯域幅の LPDDR5X メモリ、そして低遅延の NVIDIA Scalable Coherency Fabric (SCF) を組み合わせています。NVIDIA NVLink™-C2C 接続、コンフィデンシャル コンピューティング、そして Arm® への完全な対応を備えた Vera は、アクセラレーテッド システムと最新のデータセンター環境にわたって展開されます。そのモノリシック コンピュート アーキテクチャは、ソフトウェア環境の応答性とデータの効率的な流れを維持し、AI、分析、HPC のワークロード全体で、スループット、エネルギー効率、GPU 利用率の最大化を支えます。
NVIDIA Vera Rubin NVL72 は、72 基の Rubin GPU、36 基の Vera CPU、ConnectX®-9 SuperNIC、BlueField-4 DPU など、NVIDIA の最先端テクノロジを統合しています。NVLink 6 スイッチを搭載したラックスケール プラットフォームでインテリジェンスをスケールアップし、NVIDIA Quantum-X800 InfiniBand と Spectrum-X™ イーサネットを活用してスケールアウトし、AI 産業革命を支えます。
今すぐ始める
NVIDIA から最新情報、お知らせなどをお届けします。