次世代の AI を創り上げる。
概要
NVIDIA Vera Rubin プラットフォームは、エージェント型 AI と推論の時代に向けて構築され、マルチステップの問題解決と大規模な長文脈ワークフローを習得するように設計されています。 Vera Rubin は、5 つの専用ラックスケール システムを 1 つの巨大かつ一貫性を持った AI スーパーコンピューターに統合したマルチラック POD スケール システムです。このプラットフォームは、通信とメモリ移動における重大なボトルネックを解消することで、推論性能を向上させ、NVIDIA Blackwell アーキテクチャと比較して、ワットあたりのトークン数を増加させ、トークンあたりのコストを削減します。
NVIDIA Vera Rubin NVL72 は、72 基の Rubin GPU、36 基の Vera CPU、ConnectX™-9 SuperNIC™、および BlueField™-4 DPU など、NVIDIA の最先端テクノロジーを統合しています。これは、NVIDIA NVLink™ 6 スイッチを搭載した第 3 世代のラックスケール プラットフォームでインテリジェンスをスケールアップし、NVIDIA Quantum-X800 InfiniBand と Spectrum-X™ イーサネットによるスケールアウトを実現することで、大規模な AI 産業革命を推進します。
Vera Rubin NVL72 は、NVFP4 推論パフォーマンスを向上させる適応型圧縮機能を備えた新しい Transformer Engine、フルラックスケール プラットフォーム全体でセキュリティを拡張する第 3 世代 NVIDIA コンフィデンシャル コンピューティング、およびラックスケールの耐障害性を実現する第 2 世代 RAS エンジンを搭載しています。
NVIDIA Vera CPU ラックは、強化学習と大規模なエージェント型 AI 向けに構築された高密度な液冷 CPU インフラストラクチャを提供します。 NVIDIA MGX™ モジュール式リファレンス アーキテクチャを基盤に構築され、各ラックに 256 基の NVIDIA Vera CPU を統合し、22,500 以上の同時サンドボックス環境をサポートすることで、AI ファクトリーにツール呼び出し、評価、データ処理、オーケストレーションを実現するスケーラブルでエネルギー効率に優れた CPU 容量を提供します。
NVIDIA Groq 3 LPX は、エージェント型システムに求められる低遅延と大規模コンテキストの要件を満たすように設計された、NVIDIA Vera Rubin 向け推論アクセラレーターです。 高帯域幅メモリ (HBM) 向けの Rubin GPU と静的ランダムアクセス メモリ (SRAM) 向けの LPU を組み合わせることで、LPX 搭載の NVIDIA Vera Rubin は、兆単位パラメータ規模のモデルと100万トークン規模のコンテキスト向けに、新たなクラスの推論パフォーマンスを実現します。
NVIDIA Vera BlueField-4 STX は、ラックスケール AI ネイティブ ストレージ ソリューション向けのモジュール型基盤です。 NVIDIA Vera Rubin、BlueField-4 STX ストレージ プロセッサ、Spectrum-X ネットワーク、NVIDIA AI ソフトウェアを統合することで、データ分析からモデル トレーニング、そして大規模なフルエージェント型 AI ワークフローまで、データ ライフサイクル全体を最適化します。
Spectrum-6 SPX イーサネットは、AI ファクトリー全体でネットワークを高速化するように設計されています。NVIDIA Spectrum-X™ イーサネットまたは NVIDIA Quantum-X800 InfiniBand スイッチのいずれでも構成可能で、低遅延で高スループットなラックツーラック接続を大規模に実現します。
この詳細な技術的解説を読んで、NVIDIA Vera Rubin がチップではなくデータ センターをコンピューティングの単位として扱い、大規模な環境において効率的、安全、予測可能な形でインテリジェンスを生成する新たな基盤を確立する仕組みをご覧ください。