Todas las Industrias

FastLabel Acelera el Procesamiento de Datos de Imágenes para Vehículos Autónomos con NVIDIA
NeMo Curator

Objetivo

FastLabel, una startup de IA con sede en Japón, buscó automatizar y escalar la selección de conjuntos de datos de visión por computadora para apoyar a industrias como la conducción autónoma, la manufactura y la infraestructura inteligente. A fin de mantener el ritmo acelerado del desarrollo de la IA, el objetivo principal de FastLabel fue eliminar los cuellos de botella manuales que normalmente se asocian con la preparación de datos de imágenes grandes y de alta calidad, garantizando que el proceso se hiciera rápido y rentable, manteniendo al mismo tiempo una baja redundancia de datos.

Cliente

FastLabel

Caso de Uso

IA Generativa / LLM

Productos

NVIDIA NeMo

Aprendizajes Clave

Selección de Datos Escalada para un Desarrollo de IA Más Rápido
  • FastLabel redujo el proceso de revisión manual al eliminar automáticamente datos duplicados, lo que resulta en un menor requerimiento de recursos de computación y un menor uso de energía.
Ahorro Significativo de Costos
  • La selección de 10,000 imágenes cuesta menos de $57, y el paso fundamental de la deduplicación cuesta solo $0.26 con una GPU A100.
Procesamiento Rápido
  • Tareas de rotulado que antes representaban un esfuerzo manual significativo y que, según nuestros registros, requirieron 333 horas (el equivalente a 42 días laborables) para rotular 10,000 imágenes, ahora se automatizaron. Esto permite el rotulado de la misma cantidad de imágenes (10,000) en aproximadamente 14.6 horas, con pasos adicionales como la incrustación de texto y la desduplicación semántica reducidos a solo 6 y 4 minutos, respectivamente.

Por qué FastLabel Automatizó el Procesamiento de Datos de Imágenes

La preparación de conjuntos de datos sobre imágenes de alta calidad a escala es un desafío porque los métodos convencionales omiten redundancias sutiles, lo que obliga a revisiones manuales lentas y a un uso ineficiente de recursos.

Antes de implementar las soluciones de NVIDIA, FastLabel tuvo que lidiar con procesos lentos y de uso intensivo de recursos para el filtrado y la desduplicación de imágenes, particularmente para los long-tail datasets que requieren sectores como la conducción autónoma. Las herramientas tradicionales basadas en reglas no resultaron óptimas para identificar la redundancia en función de la similitud semántica, lo que resulta en ciclos inútiles de datos repetitivos y reduce la productividad general.

Para superar estos problemas, FastLabel necesitaba una técnica sólida y escalable para identificar y eliminar datos redundantes, y sobre todo para aprovechar los avances en los modelos de IA generativa en lugar de la heurística convencional. Con la capacidad de eliminar automáticamente datos duplicados en minutos en lugar de horas, NVIDIA NeMo™ Curator se destacó como una opción ideal para escalar pipelines de procesamiento de datos, una mejora significativa con respecto a los enfoques manuales anteriores.

FastLabel

Desarrollo de un Pipeline de Selección de Datos de Imágenes de Alta Calidad con NeMo Curator

FastLabel implementó funciones de procesamiento de imágenes de NeMo Curator en las GPU NVIDIA A100 en la nube de Google Cloud Platform (GCP), junto con modelos ISV alojados por GCP para la incrustación de imágenes y la generación de rótulos. La empresa usó esta solución para seleccionar conjuntos de datos de imágenes de conducción autónoma a gran escala, logrando así crear conjuntos de datos limpios que excluyen imágenes semánticamente similares de manera escalable.

La innovación clave involucró la integración de modelos de lenguaje de visión (VLMs) que generan rótulos detallados para cada imagen de acuerdo a funciones predefinidas específicas de dominio. Luego, esos rótulos se integran y procesan a través de la función de deduplicación semántica de NeMo Curator, lo que permite una selección altamente específica de dominios que sería difícil de lograr con métodos generales de similitud semántica de imágenes.

Reducción de Costos y Aceleración del Tiempo de Lanzamiento al Mercado con NeMo Curator.

La adopción de NVIDIA NeMo Curator trajo resultados transformadores para FastLabel.

  • Velocidad de Procesamiento Automatizado: Tareas de creación de rótulos que solían tomar más de un mes se automatizaron, permitiendo así crear rótulos para 10,000 imágenes en aproximadamente 14.6 horas; además, otros pasos como la incrustación de texto y la deduplicación semántica se redujeron a solo 6 y 4 minutos, respectivamente.
  • Eliminación de la Revisión Manual: Los requisitos de revisión manual se han reducido drásticamente. Así lo demuestra la capacidad de marcar automáticamente 242 de 1076 imágenes duplicadas de “automóviles estacionados” mediante el análisis semántico en lugar de usar métodos tradicionales.
  • Ahorro Sustancial de Costos y Sostenibilidad: Todo el proceso cuesta menos de $57 por 10,000 imágenes, y el paso central de deduplicación semántica cuesta solo $0.26 si se usa una GPU A100 en Google Cloud, lo que reduce los desechos computacionales y respalda un entrenamiento de IA más sostenible en todos los proyectos de FastLabel.

Este nivel de eficiencia no solo aceleró la preparación de conjuntos de datos, sino que también redujo el desperdicio computacional, permitiendo así un entrenamiento de IA más sostenible en todos los proyectos de FastLabel.

“Antes de implementar las soluciones impulsadas por NVIDIA, la deduplicación de imágenes para la conducción autónoma era un cuello de botella de recursos. NVIDIA NeMo Curator nos permitió automatizar y escalar nuestra selección de conjuntos de datos, lo que redujo significativamente nuestros costos y el esfuerzo manual requerido. Deduplicamos 10.000 imágenes en solo minutos e identificamos cientos de duplicados que los métodos tradicionales habrían pasado por alto. Esto no solo acelera nuestros proyectos de IA, sino que además nos permite ofrecer datos inmediatos y de alta calidad a clientes en industrias donde la seguridad es crucial”.

Shuhei Uchida
CPO

Mirando al Futuro

La solución permitió a FastLabel lanzar su servicio “FastLabel Data Curation”, que brinda a los clientes acceso rápido y confiable a conjuntos de datos de alta calidad, etiquetados y deduplicados automáticamente. Esto redujo significativamente el tiempo necesario para las revisiones manuales y aceleró los ciclos posteriores de los proyectos. Estas innovaciones permitieron una implementación más segura y escalable de soluciones de IA en dominios críticos para la seguridad, como la conducción autónoma.

FastLabel Data Curation planea lanzar un servicio de selección de alta velocidad y escalable también para datos de texto, haciendo uso de NeMo Curator para proporcionar a los clientes datos de alta calidad para Modelos de Lenguaje Grandes (LLM) y Modelos de Visión y Lenguaje (VLM).

En un sentido más amplio, el enfoque de FastLabel, habilitado por las tecnologías de NVIDIA, representa un avance hacia una inteligencia artificial sostenible y a gran escala que ayudará a las organizaciones de todo el mundo a crear y mantener mejores conjuntos de datos más rápido y a un costo menor.

NVIDIA NeMo Curator mejora la precisión de los modelos de IA generativa al procesar datos de texto, imagen y video a escala para el entrenamiento y la personalización.

Historias de Clientes Relacionadas