特化型 AI とは、幅広さよりも情報の深みを重視して、明確に定義された特定のタスクを実行したり、特定の分野内で動作するように、構築、トレーニングされたシステムです。
特化型 AI には、その開発を促進する 3 つのスケーリングの法則が存在します。
事前学習スケーリング: 膨大なデータセットを使用した大規模な基盤モデルのトレーニングを通じて、汎用的な知識とパターン認識能力を構築します。
事後学習スケーリング: 教師ありファインチューニング、フィードバックによる強化学習、合成データを用いた特化型タスクにのためのモデルのファインチューニングなどを通じて、汎用的なインテリジェンスを強化します。
テストタイム スケーリング: 複雑なリーズニングを行う際、AI モデルが「長時間思考」を実行して、計算リソースを動的に割り当てることを可能にします。
このスケーリング法則のフレームワークにより、汎用的な基盤モデルを、完全な再トレーニングを必要とせずに専門分野のエキスパートへと転換させ、企業における AI デプロイをより実用的でコスト効率の高いものにします。
業界の専門用語は一般的なインテリジェンス ツールでは表現されないことが多いため、企業は専門的なインテリジェンスが、エンドユーザーと従業員の双方を支援する、よりカスタマイズされたソリューションを提供してくれると認識しつつあります。
エージェント型 AI における特化の例として、エンドユーザーを理解し、対話しながらタスクを実行するモデル群の構築が挙げられるでしょう。 これらのマルチエージェント システムは、PDF 分析に特化したエージェントと、レポート生成に特化したエージェントを併用できます。
フィジカル AI では、周囲の世界を認識、感知して、シームレスにやり取りできるモデルを特別にトレーニングできます。 これにより、ロボットや自動運転車などの自律システムが、物理世界で複雑なタスクを実行できるようになります。
人間の従業員が汎用的な能力から始めて、特定の役割に特化した専門知識を身につけるのと同じく、AI システムも同様の軌跡をたどります。 汎用的な基盤モデルは、ドメイン固有のアプリケーション向けに調整されているため、ビジネス成果の測定が容易になります。
例えば、ChatGPT と Perplexity は、主に消費者のニーズに対応するために構築された汎用インテリジェンス ツールです。複数のドメインにわたる膨大な知識にアクセスできるため、タスクの完了方法に関するガイダンスから詳細な説明まで、さまざまなリクエストに柔軟に対応できます。
一方で、特化型のインテリジェンスは独自のデータを使用してトレーニングを行う企業にとって、より大きな価値を生み出します。AI を自社の業界の環境で有用なものにするには、深い専門知識が必要なためです。 これらの専門ツールは、特定のプロセスと KPI に合わせて最適化されています。
汎用型のインテリジェンスは幅広いアクセス性と多様性を通じて消費者にサービスを提供し、特化型のインテリジェンスはドメイン固有の専門知識とビジネス プロセスの統合を通じて、変革的な企業価値を創出します。 特化型 AI の目標は、次世代の AI アプリケーションが単なるツールではなく、デジタル ワークフォースの一員として機能するのを支援することにあります。
文書、コード、患者など、扱う対象が何であれ、特化型のインテリジェンスは、あらゆる言語で対話、動作する能力により、さまざまな分野に価値をもたらします
例えば、エンジニアは Cursor AI を AI コーダー ツールとして使用し、ソフトウェア開発の生産性を高めています。その結果バグが減少し、アプリケーション開発サイクルが短縮されます。 医師や看護師は、医学研究を集約して臨床的な疑問への回答に役立つ OpenEvidence などの企業から支援を受けています。 Harvey のようなツールは、法務チームが高い精度と規模で文書を処理し、重大性の高い意思決定を支援します。
デジタル アプリケーションだけでなく、特化型 AI は物理世界のアプリケーションにも橋渡しを行います。 製造分野とロボティクス分野では、AI を活用したシステムが現実世界の物理法則と力学を理解し、相互作用することが求められています。 1 つの例が、専門的な物理ベースのモデルを活用したデジタル ツインを備えたフィジカル AI 対応スマート ファクトリーを開発している Foxconn です。
AI アプリケーションが単一のモデルのみで強化されることはめったにありません。 実世界のほとんどのシステムは、複数の特化型モデルを組み合わせています。たとえば、リーズニング モデルと視覚言語モデル、リトリーバー、安全モデルを組み合わせることで、動画検索、要約エージェントを提供できます。
開発者は通常、ユース ケースに最も適したモデル タイプを選択することから始め、必要に応じてそれらを組み合わせてカスタマイズします。
開発者が特化型 AI アプリケーションを構築する際に利用するモデルの主なカテゴリは、以下の通りです。
これらのカテゴリにわたって、開発者は、オープン モデル、独自モデル、または NVIDIA や幅広いエコシステムが提供するエンタープライズ対応モデルから選択できます。
特化型 AI の構築は、まずジョブに最適なモデルを選択し、適切なデータで形成することから始まります。 複雑な分析のための推論モデル、リアルタイム タスクのための軽量モデル、テキストと画像の両方を理解するマルチモーダル モデルなどが必要かどうかにかかわらず、プロセスは同じです。強力なベース モデルを選択し、ドメインに合わせて調整し、評価と改良を重ねます。 NVIDIA は、開発者が一般的な基盤モデルから高性能なドメイン固有のシステムに迅速かつ効率的に移行できるように、オープン モデル、データセット、チューニング ツール、エンドツーエンドのワークフローを提供しています。
NVIDIA Nemotron™ は、あらゆる段階で効率的な AI 開発を可能にするために設計された、オープンソースの AI 技術のコレクションです。 内容:
NVIDIA NeMo™ や NVIDIA Dynamo などのツールは、汎用型 AI モデルを、専門的なインテリジェンスに特化したカスタム モデルに変換します。 NVIDIA AI Blueprints は、検索拡張生成 (RAG) など、特定のユース ケースに対応するエージェント開発の出発点も提供します。 ブループリントには、企業向けのサンプル アプリケーション、リファレンス コード、サンプル データ、ツール、ドキュメントが含まれています。