Todos os Setores

FastLabel Acelera o Processamento de Dados de Imagens para Veículos Autônomos Usando o NVIDIA
NeMo Curator

Objetivo

A FastLabel, uma startup de IA com sede no Japão, buscou automatizar e escalar a curadoria de conjuntos de dados de visão computacional para apoiar setores como condução autônoma, manufatura e infraestrutura inteligente. Para manter o desenvolvimento de IA em ritmo acelerado, o objetivo central da FastLabel era eliminar os gargalos manuais tipicamente associados à preparação de dados de imagens grandes e de alta qualidade, garantindo que o processo fosse rápido e econômico, mantendo a baixa redundância de dados.

Cliente

FastLabel

Caso de Uso

IA Generativa/LLMs

Produtos

NVIDIA NeMo

Pontos Principais

Curadoria de Dados em Escala para o Desenvolvimento de IA Mais Rápido
  • A FastLabel reduziu o processo de revisão manual removendo automaticamente dados duplicados, resultando em menos recursos computacionais e menos uso de energia.
Economia Significativa de Custos
  • A curadoria de 10.000 imagens custa menos de US$ 57, com a etapa crítica de deduplicação custando apenas US$ 0,26 em uma GPU A100.
Processamento Rápido
  • As tarefas de legenda que antes exigiam esforço manual significativo, que nossos registros mostram que exigiram 333 horas (o equivalente a 42 dias úteis) para legendar 10.000 imagens, foram automatizadas, oferecendo legendas de 10.000 imagens em aproximadamente 14,6 horas, com etapas adicionais, como incorporação de texto e deduplicação semântica, reduzidas para apenas 6 e 4 minutos, respectivamente.

Por que Escolher o Processamento Automatizado de Dados de Imagens da FastLabel

A preparação de conjuntos de dados de imagens de alta qualidade em escala é desafiadora porque os métodos convencionais não detectam redundâncias sutis, forçando revisões manuais demoradas e o uso ineficiente de recursos.

Antes de implementar as soluções da NVIDIA, a FastLabel enfrentava dificuldades com processos lentos e intensivos em recursos para filtragem e deduplicação de imagens, particularmente para long-tail datasets exigidos por setores como o de direção autônoma. As ferramentas tradicionais baseadas em regras tinham dificuldade para identificar a redundância com base na similaridade semântica, resultando em ciclos desnecessários de dados repetitivos e reduzindo a produtividade geral.

Para superar esses problemas, a FastLabel precisava de uma técnica robusta e escalável para identificar e remover dados redundantes, especialmente aproveitando os avanços em modelos de IA generativa, em vez de heurísticas convencionais. Com a capacidade de remover automaticamente dados duplicados em minutos, em vez de horas, o NVIDIA NeMo™ Curator se destacou como uma escolha ideal para escalar pipelines de processamento de dados, uma melhoria significativa em relação às abordagens manuais anteriores e demoradas.

FastLabel

Criação de um Pipeline de Curadoria de Dados de Imagens de Alta Qualidade com o NeMo Curator

A FastLabel implementou os recursos de processamento de imagens do NeMo Curator nas GPUs NVIDIA A100 no Google Cloud Platform (GCP), emparelhados com modelos ISV hospedados na Cloud para incorporação de imagens e geração de legendas. A empresa usou essa solução para curar conjuntos de dados de imagens de direção autônoma em larga escala, permitindo a criação de conjuntos de dados limpos que excluem imagens semanticamente semelhantes de maneira escalável.

A principal inovação envolveu a integração de modelos de linguagem visual (VLMs) que geram legendas detalhadas para cada imagem com base em recursos predefinidos específicos do domínio. Essas legendas são incorporadas e processadas por meio do recurso de deduplicação semântica NeMo Curator, permitindo uma curadoria altamente direcionada e específica do domínio que seria difícil de alcançar usando métodos gerais de similaridade semântica de imagens.

Reduzindo Custos e Acelerando o Tempo de Entrada no Mercado com o NeMo Curator

A adoção do NVIDIA NeMo Curator trouxe resultados transformadores para a FastLabel.

  • Velocidade de Processamento Automatizado: As tarefas de legendas que antes levavam mais de um mês foram automatizadas, oferecendo legendas para 10.000 imagens em aproximadamente 14,6 horas, com etapas adicionais como incorporação de texto e deduplicação semântica reduzidas para apenas 6 e 4 minutos, respectivamente.
  • Eliminando a Revisão Manual: Os requisitos de revisão manual caíram significativamente, exemplificados pela capacidade de sinalizar automaticamente 242 das 1.076 imagens duplicadas de "carros estacionados" por meio de análise semântica, em vez de métodos tradicionais.
  • Economia Substancial de Custos e Sustentabilidade: Todo o processo custa menos de US$ 57 por 10.000 imagens, com a principal etapa de deduplicação semântica custando apenas US$ 0,26 usando uma GPU A100 na Nuvem, reduzindo o desperdício computacional e apoiando o treinamento em IA mais sustentável em projetos da FastLabel.

Essa eficiência não apenas acelerou a preparação de conjuntos de dados, mas também reduziu o desperdício computacional, apoiando um treinamento em IA mais sustentável em projetos da FastLabel.

“Antes de implementar as soluções com tecnologia da NVIDIA, a deduplicação de imagens para condução autônoma era um gargalo de recursos. O NVIDIA NeMo Curator nos permitiu automatizar e escalar nossa curadoria de conjuntos de dados, reduzindo significativamente os custos e o esforço manual. Deduplicamos 10.000 imagens em apenas minutos e identificamos centenas de duplicatas que os métodos tradicionais teriam perdido. Isso não apenas acelera nossos projetos de IA, mas nos permite oferecer dados imediatos e de alta qualidade aos clientes em setores críticos para a segurança.”

Shuhei Uchida
CPO

Perspectivas para o Futuro

Para a FastLabel, a solução permitiu o lançamento de seu serviço "FastLabel Data Curation", fornecendo aos clientes acesso rápido e confiável a conjuntos de dados de alta qualidade, automaticamente marcados e deduplicados. Isso reduziu significativamente o tempo necessário para revisões manuais e acelerou os ciclos de projetos downstream. Essas inovações capacitaram a implantação mais segura e escalável de soluções de IA em domínios críticos para a segurança, como a direção autônoma.

A FastLabel Data Curation planeja lançar um serviço de curadoria escalável e de alta velocidade para dados de texto, além de imagens, aproveitando o NeMo Curator para fornecer aos clientes dados de alta qualidade para LLMs e VLMs.

Em uma escala maior, a abordagem da FastLabel, habilitada pelas tecnologias da NVIDIA, incorpora um movimento em direção à inteligência artificial sustentável e em larga escala, ajudando as empresas globalmente a criar e manter melhores conjuntos de dados mais rapidamente e a um custo menor.

O NVIDIA NeMo Curator melhora a precisão dos modelos de IA Generativa processando dados de texto, imagem e vídeo em escala para treinamento e personalização.

Histórias de Clientes Relacionadas