すべての業種

FastLabel が NVIDIA
NeMo Curator を使用して自動運転車の画像データ処理を高速化

目的

日本を拠点とする AI スタートアップの FastLabel は、自動運転、製造、スマートインフラストラクチャなどの業界を支援するために、コンピュータービジョンデータセットのキュレーションの自動化と拡張を模索しました。迅速な AI 開発を維持するにあたって、FastLabel の中核となる目標は、大規模で高品質な画像データの準備に通常伴う手作業のボトルネックを排除し、低いデータ冗長性を維持しながら、プロセスの高速化とコスト効率の向上を確保することでした。

顧客

FastLabel

ユースケース

生成 AI / LLM

製品

NVIDIA NeMo

主なポイント

より迅速な AI 開発のためのスケーラブルなデータキュレーション

FastLabel は、重複データを自動的に削除することで手作業のレビュープロセスを削減し、その結果、コンピューティングリソースとエネルギー使用量の削減を実現しました。

大幅なコスト削減

A100 GPU を使用した 10,000 枚の画像のキュレーションのコストは 57 ドル以下で、重要な重複排除ステップには 0.26 ドルしかかかりませんでした。

高速処理

かつて、かなりの手作業を要していたキャプション作成は、記録によると 10,000 枚の画像にキャプションを付与するのに 333 時間 (1 人が作業した場合 42 営業日相当) を要していましたが、自動化により約 14.6 時間で処理できるようになりました。さらに、テキストの埋め込みやセマンティック重複排除などの追加ステップがそれぞれわずか 6 分と 4 分に短縮されました。

なぜ FastLabel の画像データ自動処理が有効なのか

高品質な画像データセットを大量に準備することは困難です。従来の方法では、微妙な冗長性を見逃してしまい、時間のかかる手作業のレビューや非効率的なリソース運用を余儀なくされるため、困難な課題となっています。

NVIDIA ソリューションの導入に先立って、FastLabel は、特に自動運転などの分野で必要なロングテール型のデータセットにおいて、画像フィルタリングおよび重複排除のような低速でリソース負荷の高いプロセスに取り組んでいました。従来のルールベースのツールは、意味的な類似性に基づく冗長性の特定に苦労し、その結果としてデータの繰り返しが生じ、全体的な生産性を低下させていました。

これらの問題を克服するために、FastLabel は、冗長なデータを特定して削除するための堅牢かつスケーラブルな技術を必要とし、特に従来のヒューリスティックではなく生成 AI モデルの進歩を活用しました。数時間ではなく数分で重複データを自動的に削除する機能により、NVIDIA NeMo™ Curator は、データ処理パイプラインの拡張に最適な選択肢として際立っており、従来の手作業で時間のかかるアプローチに比べて大幅な改善をもたらしました。

FastLabel

NeMo Curator を活用し高品質の画像データキュレーションパイプラインを構築

FastLabel は、Google Cloud Platform (GCP) の NVIDIA A100 GPU に NeMo Curator 画像処理機能を実装し、画像埋め込みとキャプション生成用に GCP でホストした ISV モデルと組み合わせました。同社は、このソリューションを使用して大規模な自動運転画像データセットをキュレーションし、スケーラブルな方法でセマンティックに類似した画像を除外するクリーンなデータセットの作成を可能にしました。

主なイノベーションは、ドメイン固有の事前定義された特徴に基づいて各画像の詳細なキャプションを生成する視覚言語モデル (VLM) の統合でした。その後、これらのキャプションを埋め込み、 NeMo Curator の意味的重複排除機能を通して処理することで、一般的な画像意味的な類似性手法では実現が困難な、ターゲットを絞ったドメイン固有のキュレーションが可能になります。

NeMo Curator でコスト削減と市場投入までの時間短縮を実現

NVIDIA NeMo Curator の採用は、FastLabel に変革的な結果をもたらしました。

自動処理速度: かつて 1 か月以上かかっていたキャプション処理が自動化され、約 14.6 時間で 10,000 枚の画像にキャプションが付与され、テキストの埋め込みやセマンティックな重複排除などの追加ステップがそれぞれわずか 6 分と 4 分に短縮されました。
手動レビューの排除: 従来の方法ではなく、セマンティック分析を通じて 1,076 枚の「駐車している車」の画像のうち重複した 242 枚に自動的にフラグを立てる機能が、手動レビュー要件の大幅な減少に役立ちます。
大幅なコスト削減と持続可能性: Google Cloud の A100 GPU を使用した場合、プロセス全体のコストは 10,000 枚の画像あたり 57 ドル未満で、コアとなる意味的な重複排除ステップのコストはわずか 0.26 ドルとなります。それと同時に計算の無駄を削減し、FastLabel プロジェクト全体でより持続可能な AI トレーニングをサポートします。

この効率化は、データセットの準備を高速化するだけでなく、計算の無駄を削減し、FastLabel プロジェクト全体でより持続可能な AI トレーニングを支えます。

「NVIDIA 搭載ソリューションを導入する前は、自動運転向けの画像の重複排除がリソースのボトルネックでした。NVIDIA NeMo Curator でデータセットのキュレーションを自動化、拡張したことで、コストと人力による作業の大幅削減を実現しました。わずか数分で 10,000 枚の画像の重複を排除し、従来の方法では見逃されていた数百もの重複を特定することが可能になりました。これによって、AI プロジェクトが高速化するだけでなく、安全が重要な業界の顧客に迅速かつ高品質なデータを提供できるようになります」

内田修平氏
CPO

今後の展望

FastLabel の場合、このソリューションは「FastLabel Data Curation」サービスの展開を可能にし、高品質かつ自動でタグ付けされた、重複排除済みのデータセットに迅速かつ信頼性の高いアクセスを顧客に提供しました。これにより、手作業でのレビューにかかる時間が大幅に削減され、下流のプロジェクトサイクルが高速化しました。これらのイノベーションは、自動運転などの安全に重要な分野における AI ソリューションのデプロイを、より安全でスケーラブルなものにしました。

FastLabel Data Curation は、画像だけでなくテキストデータ向けの高速でスケーラブルなキュレーションサービスの展開を計画しており、NeMo Curator を活用して LLM および VLM 向けに高品質なデータを顧客に提供する予定です。

より大きな視点では、NVIDIA の技術を活用した FastLabel のアプローチは、持続可能で大規模な AI 開発への移行を体現しています。これにより、世界中の組織がより良いデータセットをこれまで以上に迅速かつ低コストで作成・維持できるようになります。

NVIDIA NeMo Curator は、テキスト、画像、ビデオデータを大量に処理し、トレーニングとカスタマイズを実行することで生成 AI モデルの精度を高めます。

NeMo Curator の詳細を見る

FastLabel が NVIDIA NeMo Curator を使用して自動運転車の画像データ処理を高速化

目的

顧客

ユース ケース

製品