NVIDIA Rubin プラットフォーム

次世代の AI を創り上げる。

概要
技術のブレークスルー
製品
Rubin の内部

概要
技術のブレークスルー
製品
Rubin の内部

概要

エージェント型 AI 時代を推進

NVIDIA Rubin プラットフォームは、エージェント型 AI と推論の時代に向けて構築され、マルチステップの問題解決と大規模な長文脈ワークフローを習得するように設計されています。通信とメモリ移動における重大なボトルネックを解消することで、Rubin プラットフォームは推論性能を飛躍的に向上させ、NVIDIA Blackwell 世代と比較してワットあたりのトークン数を増加させ、トークンあたりのコストを削減します。

NVIDIA、Rubin で次世代 AI を始動 — 6 つの新チップと驚異的な AI スーパーコンピューター

この最先端のプラットフォームは、メインストリームでの導入を拡張し、推論およびエージェント型 AI モデルに適した 5 つの画期的な技術革新によりトークンあたりのコストを大幅に削減します。

プレスリリースを読む

技術的なブレイクスルーの詳細を見る

Transformer Engine

Rubin プラットフォームは、ハードウェアアクセラレーション対応の適応圧縮を備えた新しい Transformer Engine を搭載し、精度を維持しながら NVFP4 のパフォーマンスを向上させ、最大 50 petaFLOPS の NVFP4 推論を可能にします。Transformer Engine は、NVIDIA Blackwell と完全な互換性を持つため、シームレスなアップグレードを可能にします。そのため、以前に最適化されたコードは、Rubin プラットフォームに簡単に移行できます。

第 3 世代のコンフィデンシャルコンピューティング

第 3 世代の NVIDIA コンフィデンシャルコンピューティングは、NVIDIA Vera Rubin NVL72 によりセキュリティをフルラックスケールに拡張します。このプラットフォームは、36 基の NVIDIA Vera CPU、72 基の NVIDIA Rubin GPU、そしてこれらをシームレスに接続する NVIDIA NVLink™ ファブリック全体にわたる統合された信頼できる実行環境を構築します。このプラットフォームは、CPU、GPU、NVLink ドメイン全体のデータセキュリティを維持します。暗号化コンプライアンス証明のための認証サービスにより、大規模と完全な保護を両立させ、世界最大級の独自モデル、トレーニングデータ、推論ワークロードを保護します。

NVIDIA コンフィデンシャルコンピューティングの詳細を見る

第 6 世代 NVLink と NVLink スイッチ

第 6 世代 NVLink は、72 基の NVIDIA Rubin GPU を単一のパフォーマンスドメインに統合する、NVIDIA の高速 GPU 相互接続ファブリックに大きな飛躍をもたらします。 NVIDIA Blackwell のパフォーマンスを倍増させた Rubin は、GPU あたり 3.6 テラバイト/秒 (TB/秒) の帯域幅と、低遅延で 260 TB/秒の接続を提供し、通信を高速化します。 NVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ と組み合わせることで、集合演算のネットワークの輻輳を最大 50% 削減するこの次世代の相互接続は、世界最大級のモデルのトレーニングと推論を大規模に性能を犠牲にすることなく高速化します。

NVIDIA NVLink および NVLink Switch の詳細を見る

第 2 世代の信頼性、可用性、保守性 (RAS) エンジン

NVIDIA Rubin プラットフォームは、高度な信頼性機能を備えたラックスケールの回復力を提供します。 NVIDIA Rubin GPU は専用の第 2 世代 RAS エンジンを搭載し、ダウンタイムのないプロアクティブメンテナンスとリアルタイムの正常性の確認を実現します。一方、NVIDIA Vera CPU は、SOCAMM LPDDR5X と CPU コアのインシステムテストで保守性が向上します。このラックはモジュール式のケーブル不要トレイ設計を採用し、NVIDIA Blackwell と比較して 18 倍高速な組み立てと保守性を実現します。また、インテリジェントな回復性とソフトウェアデファインドの NVLink ルーティングを組み合わせて、継続的な運用を確保し、保守コストを削減します。

NVIDIA Vera CPU

NVIDIA Vera CPU は、アクセラレーテッドシステム全体でのデータ移動とエージェント型推論のために設計されており、コンフィデンシャルコンピューティングを完全にサポートします。 NVIDIA GPU とシームレスにペアリングできます。また、分析、クラウド、オーケストレーション、ストレージ、ハイパフォーマンスコンピューティング (HPC) ワークロード向けに独立して動作します。 Vera は、88 基の NVIDIA 設計のコア、最大 1.2 TB/秒の LPDDR5X メモリ帯域幅、NVIDIA Scalable Coherency Fabric を組み合わせて、データおよびメモリ集約型のワークロードに予測可能なエネルギー効率に優れたパフォーマンスを提供します。Arm® との完全な互換性を備えています。統合された NVLink-C2C 接続により、高帯域幅でコヒーレントな CPU-GPU メモリアクセスが可能になり、システム利用率と効率性を最大化します。

NVIDIA Vera の詳細を見る

NVIDIA Rubin製品を詳しく見る

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 は、72 基の NVIDIA Rubin GPU、36 基の NVIDIA Vera CPU、NVIDIA ConnectX®-9 SuperNIC、NVIDIA BlueField®-4 DPU を統合します。これは、第 6 世代 NVLink と NVLink スイッチを採用したラックスケールプラットフォームでインテリジェンスを拡張し、NVIDIA Quantum-X800 InfiniBand と NVIDIA Spectrum-X™ Ethernet によるスケールアウトを実現し、大規模な AI 産業革命を推進します。

詳細を見る