すべての業種
日本を拠点とする AI スタートアップの FastLabel は、自動運転、製造、スマート インフラストラクチャなどの業界を支援するために、コンピューター ビジョン データセットのキュレーションの自動化と拡張を模索しました。 迅速な AI 開発を維持するにあたって、FastLabel の中核となる目標は、大規模で高品質な画像データの準備に通常伴う手作業のボトルネックを排除し、低いデータ冗長性を維持しながら、プロセスの高速化とコスト効率の向上を確保することでした。
FastLabel
生成 AI / LLM
NVIDIA NeMo
主なポイント
高品質な画像データセットを大量に準備することは困難です。従来の方法では、微妙な冗長性を見逃してしまい、時間のかかる手作業のレビューや非効率的なリソース運用を余儀なくされるため、困難な課題となっています。
NVIDIA ソリューションの導入に先立って、FastLabel は、特に自動運転などの分野で必要なロングテール型のデータセットにおいて、画像フィルタリングおよび重複排除のような低速でリソース負荷の高いプロセスに取り組んでいました。 従来のルール ベースのツールは、意味的な類似性に基づく冗長性の特定に苦労し、その結果としてデータの繰り返しが生じ、全体的な生産性を低下させていました。
これらの問題を克服するために、FastLabel は、冗長なデータを特定して削除するための堅牢かつスケーラブルな技術を必要とし、特に従来のヒューリスティックではなく生成 AI モデルの進歩を活用しました。 数時間ではなく数分で重複データを自動的に削除する機能により、NVIDIA NeMo™ Curator は、データ処理パイプラインの拡張に最適な選択肢として際立っており、従来の手作業で時間のかかるアプローチに比べて大幅な改善をもたらしました。
FastLabel
FastLabel は、Google Cloud Platform (GCP) の NVIDIA A100 GPU に NeMo Curator 画像処理機能を実装し、画像埋め込みとキャプション生成用に GCP でホストした ISV モデルと組み合わせました。 同社は、このソリューションを使用して大規模な自動運転画像データセットをキュレーションし、スケーラブルな方法でセマンティックに類似した画像を除外するクリーンなデータセットの作成を可能にしました。
主なイノベーションは、ドメイン固有の事前定義された特徴に基づいて各画像の詳細なキャプションを生成する視覚言語モデル (VLM) の統合でした。 その後、これらのキャプションを埋め込み、 NeMo Curator の意味的重複排除機能を通して処理することで、一般的な画像意味的な類似性手法では実現が困難な、ターゲットを絞ったドメイン固有のキュレーションが可能になります。
NVIDIA NeMo Curator の採用は、FastLabel に変革的な結果をもたらしました。
この効率化は、データセットの準備を高速化するだけでなく、計算の無駄を削減し、FastLabel プロジェクト全体でより持続可能な AI トレーニングを支えます。
「NVIDIA 搭載ソリューションを導入する前は、自動運転向けの画像の重複排除がリソースのボトルネックでした。NVIDIA NeMo Curator でデータセットのキュレーションを自動化、拡張したことで、コストと人力による作業の大幅削減を実現しました。 わずか数分で 10,000 枚の画像の重複を排除し、従来の方法では見逃されていた数百もの重複を特定することが可能になりました。 これによって、AI プロジェクトが高速化するだけでなく、安全が重要な業界の顧客に迅速かつ高品質なデータを提供できるようになります」
内田 修平 氏
CPO
FastLabel の場合、このソリューションは「FastLabel Data Curation」サービスの展開を可能にし、高品質かつ自動でタグ付けされた、重複排除済みのデータセットに迅速かつ信頼性の高いアクセスを顧客に提供しました。これにより、手作業でのレビューにかかる時間が大幅に削減され、下流のプロジェクト サイクルが高速化しました。 これらのイノベーションは、自動運転などの安全に重要な分野における AI ソリューションのデプロイを、より安全でスケーラブルなものにしました。
FastLabel Data Curation は、画像だけでなくテキスト データ向けの高速でスケーラブルなキュレーション サービスの展開を計画しており、NeMo Curator を活用して LLM および VLM 向けに高品質なデータを顧客に提供する予定です。
より大きな視点では、NVIDIA の技術を活用した FastLabel のアプローチは、持続可能で大規模な AI 開発への移行を体現しています。これにより、世界中の組織がより良いデータセットをこれまで以上に迅速かつ低コストで作成・維持できるようになります。
NVIDIA NeMo Curator は、テキスト、画像、ビデオ データを大量に処理し、トレーニングとカスタマイズを実行することで生成 AI モデルの精度を高めます。