Todos os Setores
A FastLabel, uma startup de IA com sede no Japão, buscou automatizar e escalar a curadoria de conjuntos de dados de visão computacional para apoiar setores como condução autônoma, manufatura e infraestrutura inteligente. Para manter o desenvolvimento de IA em ritmo acelerado, o objetivo central da FastLabel era eliminar os gargalos manuais tipicamente associados à preparação de dados de imagens grandes e de alta qualidade, garantindo que o processo fosse rápido e econômico, mantendo a baixa redundância de dados.
FastLabel
IA Generativa/LLMs
NVIDIA NeMo
Pontos Principais
A preparação de conjuntos de dados de imagens de alta qualidade em escala é desafiadora porque os métodos convencionais não detectam redundâncias sutis, forçando revisões manuais demoradas e o uso ineficiente de recursos.
Antes de implementar as soluções da NVIDIA, a FastLabel enfrentava dificuldades com processos lentos e intensivos em recursos para filtragem e deduplicação de imagens, particularmente para long-tail datasets exigidos por setores como o de direção autônoma. As ferramentas tradicionais baseadas em regras tinham dificuldade para identificar a redundância com base na similaridade semântica, resultando em ciclos desnecessários de dados repetitivos e reduzindo a produtividade geral.
Para superar esses problemas, a FastLabel precisava de uma técnica robusta e escalável para identificar e remover dados redundantes, especialmente aproveitando os avanços em modelos de IA generativa, em vez de heurísticas convencionais. Com a capacidade de remover automaticamente dados duplicados em minutos, em vez de horas, o NVIDIA NeMo™ Curator se destacou como uma escolha ideal para escalar pipelines de processamento de dados, uma melhoria significativa em relação às abordagens manuais anteriores e demoradas.
FastLabel
A FastLabel implementou os recursos de processamento de imagens do NeMo Curator nas GPUs NVIDIA A100 no Google Cloud Platform (GCP), emparelhados com modelos ISV hospedados na Cloud para incorporação de imagens e geração de legendas. A empresa usou essa solução para curar conjuntos de dados de imagens de direção autônoma em larga escala, permitindo a criação de conjuntos de dados limpos que excluem imagens semanticamente semelhantes de maneira escalável.
A principal inovação envolveu a integração de modelos de linguagem visual (VLMs) que geram legendas detalhadas para cada imagem com base em recursos predefinidos específicos do domínio. Essas legendas são incorporadas e processadas por meio do recurso de deduplicação semântica NeMo Curator, permitindo uma curadoria altamente direcionada e específica do domínio que seria difícil de alcançar usando métodos gerais de similaridade semântica de imagens.
A adoção do NVIDIA NeMo Curator trouxe resultados transformadores para a FastLabel.
Essa eficiência não apenas acelerou a preparação de conjuntos de dados, mas também reduziu o desperdício computacional, apoiando um treinamento em IA mais sustentável em projetos da FastLabel.
“Antes de implementar as soluções com tecnologia da NVIDIA, a deduplicação de imagens para condução autônoma era um gargalo de recursos. O NVIDIA NeMo Curator nos permitiu automatizar e escalar nossa curadoria de conjuntos de dados, reduzindo significativamente os custos e o esforço manual. Deduplicamos 10.000 imagens em apenas minutos e identificamos centenas de duplicatas que os métodos tradicionais teriam perdido. Isso não apenas acelera nossos projetos de IA, mas nos permite oferecer dados imediatos e de alta qualidade aos clientes em setores críticos para a segurança.”
Shuhei Uchida
CPO
Para a FastLabel, a solução permitiu o lançamento de seu serviço "FastLabel Data Curation", fornecendo aos clientes acesso rápido e confiável a conjuntos de dados de alta qualidade, automaticamente marcados e deduplicados. Isso reduziu significativamente o tempo necessário para revisões manuais e acelerou os ciclos de projetos downstream. Essas inovações capacitaram a implantação mais segura e escalável de soluções de IA em domínios críticos para a segurança, como a direção autônoma.
A FastLabel Data Curation planeja lançar um serviço de curadoria escalável e de alta velocidade para dados de texto, além de imagens, aproveitando o NeMo Curator para fornecer aos clientes dados de alta qualidade para LLMs e VLMs.
Em uma escala maior, a abordagem da FastLabel, habilitada pelas tecnologias da NVIDIA, incorpora um movimento em direção à inteligência artificial sustentável e em larga escala, ajudando as empresas globalmente a criar e manter melhores conjuntos de dados mais rapidamente e a um custo menor.
O NVIDIA NeMo Curator melhora a precisão dos modelos de IA Generativa processando dados de texto, imagem e vídeo em escala para treinamento e personalização.