NVIDIA Vera Rubin プラットフォーム

NVIDIA Vera Rubin プラットフォーム

次世代の AI を創り上げる。

概要

エージェント型 AI 時代を推進

NVIDIA Vera Rubin プラットフォームは、エージェント型 AI と推論の時代に向けて構築され、マルチステップの問題解決と大規模な長文脈ワークフローを習得するように設計されています。 Vera Rubin は、5 つの専用ラックスケール システムを 1 つの巨大かつ一貫性を持った AI スーパーコンピューターに統合したマルチラック POD スケール システムです。このプラットフォームは、通信とメモリ移動における重大なボトルネックを解消することで、推論性能を向上させ、NVIDIA Blackwell アーキテクチャと比較して、ワットあたりのトークン数を増加させ、トークンあたりのコストを削減します。

NVIDIA Vera Rubin が本格生産を開始し、世界中のエージェント型 AI ファクトリーを強化

NVIDIA Vera Rubin は本格的な量産体制に入っています。台湾の大手サーバー メーカーやグローバル サプライチェーン リーダーが Vera Rubin ベースのシステムを大規模に製造および出荷し、AI ラボ、クラウド プロバイダー、ハイパースケーラーが明日のインテリジェンスを構築できるよう支援します。

NVIDIA Vera Rubin が次なる AI フロンティアを切り開く

NVIDIA Vera Rubin プラットフォームは、 AI の次のフロンティアを切り開きます。世界最大級の AI ファクトリーを拡張するべく、7 つの新しいチップが現在フル生産体制に入っています。

Vera Rubin プラットフォームの内部を見る

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 は、72 基の Rubin GPU、36 基の Vera CPU、ConnectX™-9 SuperNIC™、および BlueField™-4 DPU など、NVIDIA の最先端テクノロジーを統合しています。これは、NVIDIA NVLink™ 6 スイッチを搭載した第 3 世代のラックスケール プラットフォームでインテリジェンスをスケールアップし、NVIDIA Quantum-X800 InfiniBand と Spectrum-X™ イーサネットによるスケールアウトを実現することで、大規模な AI 産業革命を推進します。

Vera Rubin NVL72 は、NVFP4 推論パフォーマンスを向上させる適応型圧縮機能を備えた新しい Transformer Engine、フルラックスケール プラットフォーム全体でセキュリティを拡張する第 3 世代 NVIDIA コンフィデンシャル コンピューティング、およびラックスケールの耐障害性を実現する第 2 世代 RAS エンジンを搭載しています。

NVIDIA Vera CPU

NVIDIA Vera CPU ラックは、強化学習と大規模なエージェント型 AI 向けに構築された高密度な液冷 CPU インフラストラクチャを提供します。 NVIDIA MGX™ モジュール式リファレンス アーキテクチャを基盤に構築され、各ラックに 256 基の NVIDIA Vera CPU を統合し、22,500 以上の同時サンドボックス環境をサポートすることで、AI ファクトリーにツール呼び出し、評価、データ処理、オーケストレーションを実現するスケーラブルでエネルギー効率に優れた CPU 容量を提供します。

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX は、エージェント型システムに求められる低遅延と大規模コンテキストの要件を満たすように設計された、NVIDIA Vera Rubin 向け推論アクセラレーターです。 高帯域幅メモリ (HBM) 向けの Rubin GPU と静的ランダムアクセス メモリ (SRAM) 向けの LPU を組み合わせることで、LPX 搭載の NVIDIA Vera Rubin は、兆単位パラメータ規模のモデルと100万トークン規模のコンテキスト向けに、新たなクラスの推論パフォーマンスを実現します。

NVIDIA Vera BlueField-4 STX

NVIDIA Vera BlueField-4 STX は、ラックスケール AI ネイティブ ストレージ ソリューション向けのモジュール型基盤です。 NVIDIA Vera Rubin、BlueField-4 STX ストレージ プロセッサ、Spectrum-X ネットワーク、NVIDIA AI ソフトウェアを統合することで、データ分析からモデル トレーニング、そして大規模なフルエージェント型 AI ワークフローまで、データ ライフサイクル全体を最適化します。

NVIDIA Spectrum-6 SPX イーサネット

Spectrum-6 SPX イーサネットは、AI ファクトリー全体でネットワークを高速化するように設計されています。NVIDIA Spectrum-X™ イーサネットまたは NVIDIA Quantum-X800 InfiniBand スイッチのいずれでも構成可能で、低遅延で高スループットなラックツーラック接続を大規模に実現します。

NVIDIA Vera Rubin 製品を詳しく見る

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX™ Vera Rubin NVL72 は、NVIDIA Vera Rubin プラットフォームを基盤とするすぐに導入可能な AI インフラ ソリューションを企業に提供します。 これは、最も複雑な AI モデルを高速化するための大規模なデプロイ向けに専用設計されています。

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 は、8 基の NVIDIA Rubin GPU と第 6 世代 NVLink を搭載した液冷 AI システムです。 これは、あらゆる AI ワークロードのトレーニング、推論、事後学習を高速化するために構築されています。

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8 は、8 基の NVIDIA Rubin GPU と第 6 世代の高速 NVLink 相互接続を統合し、データ センターをアクセラレーテッド コンピューティングと生成 AI の新時代へと導きます。NVIDIA HGX Rubin NVL8 は、NVIDIA Vera CPU または x86 ベースの CPU ベースボードのいずれとも組み合わせることができます。

NVIDIA Vera Rubin NVL4

NVIDIA Vera Rubin NVL4 は、NVLink-C2C 上で、4 基の NVIDIA Rubin GPU と 2 基の NVIDIA Vera CPU を接続するブリッジを介して、自動化された科学発見やエージェント型 AI を実現します。 液冷 NVIDIA MGX サーバーと互換性があり、Hopper と比較して、科学シミュレーションで最大 4 倍、AI-for-Science トレーニングで 6 倍、推論で 8 倍のパフォーマンスを実現します。

NVIDIA Vera Rubin プラットフォームの内部

この詳細な技術的解説を読んで、NVIDIA Vera Rubin がチップではなくデータ センターをコンピューティングの単位として扱い、大規模な環境において効率的、安全、予測可能な形でインテリジェンスを生成する新たな基盤を確立する仕組みをご覧ください。