NVIDIA Rubin プラットフォーム

NVIDIA Rubin プラットフォーム

次世代の AI を創り上げる。

概要

エージェント型 AI 時代を推進

NVIDIA Rubin プラットフォームは、エージェント型 AI と推論の時代に向けて構築され、マルチステップの問題解決と大規模な長文脈ワークフローを習得するように設計されています。通信とメモリ移動における重大なボトルネックを解消することで、Rubin プラットフォームは推論性能を飛躍的に向上させ、NVIDIA Blackwell 世代と比較してワットあたりのトークン数を増加させ、トークンあたりのコストを削減します。

NVIDIA、Rubin で次世代 AI を始動 — 6 つの新チップと驚異的な AI スーパーコンピューター

この最先端のプラットフォームは、メインストリームでの導入を拡張し、推論およびエージェント型 AI モデルに適した 5 つの画期的な技術革新によりトークンあたりのコストを大幅に削減します。

技術的なブレイクスルーの詳細を見る

Transformer Engine

Rubin プラットフォームは、ハードウェア アクセラレーション対応の適応圧縮を備えた新しい Transformer Engine を搭載し、精度を維持しながら NVFP4 のパフォーマンスを向上させ、最大 50 petaFLOPS の NVFP4 推論を可能にします。Transformer Engine は、NVIDIA Blackwell と完全な互換性を持つため、シームレスなアップグレードを可能にします。そのため、以前に最適化されたコードは、Rubin プラットフォームに簡単に移行できます。

第 3 世代のコンフィデンシャル コンピューティング

第 3 世代の NVIDIA コンフィデンシャル コンピューティングは、NVIDIA Vera Rubin NVL72 によりセキュリティをフルラック スケールに拡張します。 このプラットフォームは、36 基の NVIDIA Vera CPU、72 基の NVIDIA Rubin GPU、そしてこれらをシームレスに接続する NVIDIA NVLink™ ファブリック全体にわたる統合された信頼できる実行環境を構築します。 このプラットフォームは、CPU、GPU、NVLink ドメイン全体のデータ セキュリティを維持します。 暗号化コンプライアンス証明のための認証サービスにより、大規模と完全な保護を両立させ、世界最大級の独自モデル、トレーニング データ、推論ワークロードを保護します。

第 6 世代 NVLink と NVLink スイッチ

第 6 世代 NVLink は、72 基の NVIDIA Rubin GPU を単一のパフォーマンス ドメインに統合する、NVIDIA の高速 GPU 相互接続ファブリックに大きな飛躍をもたらします。 NVIDIA Blackwell のパフォーマンスを倍増させた Rubin は、GPU あたり 3.6 テラバイト/秒 (TB/秒) の帯域幅と、低遅延で 260 TB/秒の接続を提供し、通信を高速化します。 NVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ と組み合わせることで、集合演算のネットワークの輻輳を最大 50% 削減するこの次世代の相互接続は、世界最大級のモデルのトレーニングと推論を大規模に性能を犠牲にすることなく高速化します。

第 2 世代の信頼性、可用性、保守性 (RAS) エンジン

NVIDIA Rubin プラットフォームは、高度な信頼性機能を備えたラックスケールの回復力を提供します。 NVIDIA Rubin GPU は専用の第 2 世代 RAS エンジンを搭載し、ダウンタイムのないプロアクティブ メンテナンスとリアルタイムの正常性の確認を実現します。一方、NVIDIA Vera CPU は、SOCAMM LPDDR5X と CPU コアのインシステム テストで保守性が向上します。このラックはモジュール式のケーブル不要トレイ設計を採用し、NVIDIA Blackwell と比較して 18 倍高速な組み立てと保守性を実現します。また、インテリジェントな回復性とソフトウェア デファインドの NVLink ルーティングを組み合わせて、継続的な運用を確保し、保守コストを削減します。

NVIDIA Vera CPU

NVIDIA Vera CPU は、アクセラレーテッド システム全体でのデータ移動とエージェント型推論のために設計されており、コンフィデンシャル コンピューティングを完全にサポートします。 NVIDIA GPU とシームレスにペアリングできます。また、分析、クラウド、オーケストレーション、ストレージ、ハイパフォーマンス コンピューティング (HPC) ワークロード向けに独立して動作します。 Vera は、88 基の NVIDIA 設計のコア、最大 1.2 TB/秒の LPDDR5X メモリ帯域幅、NVIDIA Scalable Coherency Fabric を組み合わせて、データおよびメモリ集約型のワークロードに予測可能なエネルギー効率に優れたパフォーマンスを提供します。Arm® との完全な互換性を備えています。 統合された NVLink-C2C 接続により、高帯域幅でコヒーレントな CPU-GPU メモリ アクセスが可能になり、システム利用率と効率性を最大化します。

NVIDIA Rubin製品を詳しく見る

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 は、72 基の NVIDIA Rubin GPU、36 基の NVIDIA Vera CPU、NVIDIA ConnectX®-9 SuperNIC、NVIDIA BlueField®-4 DPU を統合します。 これは、第 6 世代 NVLink と NVLink スイッチを採用したラックスケール プラットフォームでインテリジェンスを拡張し、NVIDIA Quantum-X800 InfiniBand と NVIDIA Spectrum-X™ Ethernet によるスケールアウトを実現し、大規模な AI 産業革命を推進します。

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72 は、NVIDIA Rubin プラットフォームを基盤とするすぐに導入可能な AI インフラ ソリューションを企業に提供します。このソリューションは、非常に複雑な AI モデルを高速化するために大規模にデプロイできるように構築されています。

NVIDIA DGX Rubin NVL8

NVIDIA DGX Rubin NVL8 は、8 基の NVIDIA Rubin GPU と第 6 世代 NVLink を搭載した水冷 AI システムであり、あらゆる AI ワークロードのトレーニング、推論、事後トレーニングを高速化するために構築されました。

NVIDIA Rubin プラットフォームの内部: 6 つの新チップと AI スーパーコンピューター

この詳細な技術的解説を読んで、NVIDIA Vera Rubin がチップではなくデータセンターをコンピューティングの単位として扱い、大規模な環境において効率的、安全、予測可能な形でインテリジェンスを生成する新たな基盤を確立する仕組みをご覧ください。