次世代の AI を創り上げる。
概要
NVIDIA Rubin プラットフォームは、エージェント型 AI と推論の時代に向けて構築され、マルチステップの問題解決と大規模な長文脈ワークフローを習得するように設計されています。通信とメモリ移動における重大なボトルネックを解消することで、Rubin プラットフォームは推論性能を飛躍的に向上させ、NVIDIA Blackwell 世代と比較してワットあたりのトークン数を増加させ、トークンあたりのコストを削減します。
Rubin プラットフォームは、ハードウェア アクセラレーション対応の適応圧縮を備えた新しい Transformer Engine を搭載し、精度を維持しながら NVFP4 のパフォーマンスを向上させ、最大 50 petaFLOPS の NVFP4 推論を可能にします。Transformer Engine は、NVIDIA Blackwell と完全な互換性を持つため、シームレスなアップグレードを可能にします。そのため、以前に最適化されたコードは、Rubin プラットフォームに簡単に移行できます。
第 3 世代の NVIDIA コンフィデンシャル コンピューティングは、NVIDIA Vera Rubin NVL72 によりセキュリティをフルラック スケールに拡張します。 このプラットフォームは、36 基の NVIDIA Vera CPU、72 基の NVIDIA Rubin GPU、そしてこれらをシームレスに接続する NVIDIA NVLink™ ファブリック全体にわたる統合された信頼できる実行環境を構築します。 このプラットフォームは、CPU、GPU、NVLink ドメイン全体のデータ セキュリティを維持します。 暗号化コンプライアンス証明のための認証サービスにより、大規模と完全な保護を両立させ、世界最大級の独自モデル、トレーニング データ、推論ワークロードを保護します。
第 6 世代 NVLink は、72 基の NVIDIA Rubin GPU を単一のパフォーマンス ドメインに統合する、NVIDIA の高速 GPU 相互接続ファブリックに大きな飛躍をもたらします。 NVIDIA Blackwell のパフォーマンスを倍増させた Rubin は、GPU あたり 3.6 テラバイト/秒 (TB/秒) の帯域幅と、低遅延で 260 TB/秒の接続を提供し、通信を高速化します。 NVIDIA® Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ と組み合わせることで、集合演算のネットワークの輻輳を最大 50% 削減するこの次世代の相互接続は、世界最大級のモデルのトレーニングと推論を大規模に性能を犠牲にすることなく高速化します。
NVIDIA Rubin プラットフォームは、高度な信頼性機能を備えたラックスケールの回復力を提供します。 NVIDIA Rubin GPU は専用の第 2 世代 RAS エンジンを搭載し、ダウンタイムのないプロアクティブ メンテナンスとリアルタイムの正常性の確認を実現します。一方、NVIDIA Vera CPU は、SOCAMM LPDDR5X と CPU コアのインシステム テストで保守性が向上します。このラックはモジュール式のケーブル不要トレイ設計を採用し、NVIDIA Blackwell と比較して 18 倍高速な組み立てと保守性を実現します。また、インテリジェントな回復性とソフトウェア デファインドの NVLink ルーティングを組み合わせて、継続的な運用を確保し、保守コストを削減します。
NVIDIA Vera CPU は、アクセラレーテッド システム全体でのデータ移動とエージェント型推論のために設計されており、コンフィデンシャル コンピューティングを完全にサポートします。 NVIDIA GPU とシームレスにペアリングできます。また、分析、クラウド、オーケストレーション、ストレージ、ハイパフォーマンス コンピューティング (HPC) ワークロード向けに独立して動作します。 Vera は、88 基の NVIDIA 設計のコア、最大 1.2 TB/秒の LPDDR5X メモリ帯域幅、NVIDIA Scalable Coherency Fabric を組み合わせて、データおよびメモリ集約型のワークロードに予測可能なエネルギー効率に優れたパフォーマンスを提供します。Arm® との完全な互換性を備えています。 統合された NVLink-C2C 接続により、高帯域幅でコヒーレントな CPU-GPU メモリ アクセスが可能になり、システム利用率と効率性を最大化します。
この詳細な技術的解説を読んで、NVIDIA Vera Rubin がチップではなくデータセンターをコンピューティングの単位として扱い、大規模な環境において効率的、安全、予測可能な形でインテリジェンスを生成する新たな基盤を確立する仕組みをご覧ください。