ストックマーク、日本語特化のソブリン AI で製造業の情報収集と知的判断を加速

製造業

ストックマーク、日本語特化のソブリン AI で製造業の情報収集と知的判断を加速

画像提供: Stockmark

目的

ストックマークは、高度な AI 技術を活用し、製造業をはじめとした多くの企業の意思決定を支援しています。独自開発の AI エージェント基盤と NVIDIA の先端技術を組み合わせることで、複雑な技術資料の解析を高速化。これにより、多くの企業の生産性向上とイノベーション創出に貢献します。

顧客

ストックマーク 株式会社

ユース ケース

生成 AI / LLM

製品

NVIDIA NeMo
NVIDIA TensorRT-LLM

ストックマークは、NVIDIA NeMo や TensorRT-LLM を活用して日本語特化の大規模言語モデルを開発し、製造業の意思決定と生産性を進化させています。

フルスクラッチで開発した、日本語や日本の企業文化、製造業の専門技術に強い 1000 億パラメーターの大規模言語モデル (LLM) を NVIDIA NeMo フレームワークを活用して高速にファインチューニングしています。

LLM に最適化された推論ライブラリである NVIDIA TensorRT-LLM を活用して、大量な合成データの生成を 1.36 倍高速化。ネット上では存在しない技術情報を AI で効率的に生成し、AI 学習に活用しています。

多言語対応かつ長文検索に強い NVIDIA NeMo Retriever で、業界特有の専門用語や略語、曖昧な表現を正確に処理。検索精度は 94 ポイントと高く、設計や開発現場での意思決定の確度とスピードを大きく向上させています。

ビジネスの意思決定に、精度とスピードを

多くの企業にとって、情報収集や文書作成にかかる負担が、イノベーションを妨げる要因になっている。この課題に挑んでいるのが、自然言語処理に特化した AI スタートアップのストックマーク株式会社だ。同社では、ビジネス、日本語領域に特化した LLM をフルスクラッチで開発してきた。

これまでに製造業向け AI エージェント『 Aconnect 』と、業務 AI の実装支援プラットフォーム『 SAT 』を展開。さらに、企業に特化した生成 AI の開発や、独自システムの構築支援も手掛け、導入実績は製造業を中心に、トヨタ自動車やパナソニックといった自動車、家電、部品メーカーから、日清食品やサントリーなどの食品製造企業まで多岐にわたる。

同社は、自社開発した 1000 億パラメーター マルチモーダル文書読解 LLM のさらなる精度、速度の向上に向けて NVIDIA AI ソフトウェアである NVIDIA NeMo や TensorRT-LLM を採用。その結果、日本語のドキュメント理解において世界有数の LLM を超える性能を獲得した。

ストックマーク株式会社

ストックマーク 株式会社

多言語対応のリランキングモデルで応答精度を飛躍的に向上

2025 年、ストックマークは、日本の製造業に強い LLM 開発にむけて、モデルをファインチューニングするための『NVIDIA NeMo フレームワーク』と、AI 推論を高速化する『NVIDIA TensorRT-LLM』、そして、多言語、多形式のデータ検索を強化し、応答精度を向上するために『NVIDIA NeMo Retriever』の 3 つを導入した。

なかでも有馬氏が注目したのが、『NeMo Retriever』に搭載されたリランキング モデルである。略語や言い換えが多い日本語の技術文書に対応しつつ、英語や中国語といった多言語の資料も高精度に処理。有馬氏が「日本語で約 2 万字の技術書にも対応できる」と語るように、長文への高い処理性能も、製造業向けにはフィットしていた。

「日本語のみに強いリランキング モデルはあるが、多言語の資料から正確な答えを返せるものはなかなか見当たらず、弊社でも開発に取り組みましたが、その精度には満足できませんでした。そこを、『NeMo Retriever』はあっさりとクリアしてくれたのです」

顧客からの質問に対して AI が適切な回答を提示できる精度は、従来の 89 ポイントから 94 ポイントへと 5 ポイントも改善したという。たった 1 回でも的外れな回答をされると、 AI への信頼は大きく損なわれる。

また、「NVIDIA Retriever がマイクロサービスとして提供されていたことで、既存の検索基盤に影響を与えることなく、スムーズかつ安全な統合が可能となった」と有馬氏は語る。機能ごとに独立したモジュールとしてサービスを実装できるマイクロサービス化により、機能の柔軟な組み合わせや変更が可能となるのだ。

「たとえば従来型のモデルでリランキングを変更しようとすれば、企業ごとに何万件と存在する文書をすべてベクトル化し直す必要があり、まるで “家をフルリフォームする” ような改修になる。既存の大規模なプロジェクトをステップバイステップで改善していくうえで、マイクロサービスで実装できたことは非常に助けになりました」

ストックマーク 株式会社

合成データを大量かつ高速に生成

その他 2 つの AI ソフトウェアの導入効果についても、有馬氏は「期待どおりだった」と手ごたえを感じている。

NeMo フレームワークを使って LLM ファインチューニングの検証を始めたのは 2025 年の年明け。15B パラメーター サイズの LLM で SFT を実施した結果、 25% の高速化を確認できたため活用を即断した。「ファインチューニングは複数の GPU に分散しながら処理をさせる必要があるが、その分散学習においても NVIDIA のソフトウェアは最適化されていた」と有馬氏は語る。

さらに、『TensorRT-LLM』により、製造業の設計資料や社内文書に近い合成データを大量に生成するプロセスの高速化を実現。具体的には、「スループット (一定時間あたりの処理量) が最大 1.36 倍に向上した」という。テストで使えるような資料はネット上には存在せず、自ら準備する必要があったがそれにはかなりコストがかかる。TensorRT-LLM を活用することで時間とコストの両方が節約できた。

ソブリン AI で拓く未来の共創と情報共有のかたち

ストックマークは、社内向けニュース キュレーションサービスとして展開を始めた「Anews」を、特許、論文、社内情報など幅広いビジネス情報を提供し、単なる情報キュレーションに留まらない、組織の共創を支えるツールとして進化させてきた。また、2025 年 7 月には、製造業向け AI エージェント『Aconnect』へとブランド再構築を行い、1 人ひとりの業務に最適化された AI エージェントへと進化をさせた。

「たとえば、担当者が自身の研究テーマに関連する過去の商談履歴や顧客フィードバック、開発の経緯まで一括して調べられるようになり、『調査の網羅性が飛躍的に高まった』との評価をいただいています。ほかにもある技術について調べているうちに、グループ会社の専門人材が作成した資料に辿り着き、その人物と連携して新事業を立ち上げた事例もあります。情報検索の精度向上にとどまらず、埋もれていた技術や人材に光を当て、新たなコラボレーションを生む。こうした “社内文化変革” を促すことこそ、私たちが目指すところです」

最後に、有馬氏は今後の展望についてこう語った。

「今後は、いわゆる “ソブリン AI ” (国家や組織が自国のデータや技術を基に独立して運用、管理する AI システム) の考え方を、国家単位にとどまらず、企業単位にも広げていくことが重要で、そこは、 NVIDIA 社が掲げる方向性とも一致しています。 NVIDIA のような技術パートナーとともに取り組んでいければ、日本の産業全体にとっても大きな価値があるのではないかと考えています」

「多言語の資料から正確な答えを返せるものはなかなか見当たらず、弊社でも開発に取り組みましたが、その精度には満足できませんでした。そこを、『NeMo Retriever』はあっさりとクリアしてくれたのです」

有馬 幸介 氏
CTO

NVIDIA NeMo を使って、生成 AI を構築、カスタマイズ、デプロイする方法を確認してください。