Todas las Industrias
FastLabel, una startup de IA con sede en Japón, buscó automatizar y escalar la selección de conjuntos de datos de visión por computadora para apoyar a industrias como la conducción autónoma, la manufactura y la infraestructura inteligente. A fin de mantener el ritmo acelerado del desarrollo de la IA, el objetivo principal de FastLabel fue eliminar los cuellos de botella manuales que normalmente se asocian con la preparación de datos de imágenes grandes y de alta calidad, garantizando que el proceso se hiciera rápido y rentable, manteniendo al mismo tiempo una baja redundancia de datos.
FastLabel
IA Generativa / LLM
NVIDIA NeMo
Aprendizajes Clave
La preparación de conjuntos de datos sobre imágenes de alta calidad a escala es un desafío porque los métodos convencionales omiten redundancias sutiles, lo que obliga a revisiones manuales lentas y a un uso ineficiente de recursos.
Antes de implementar las soluciones de NVIDIA, FastLabel tuvo que lidiar con procesos lentos y de uso intensivo de recursos para el filtrado y la desduplicación de imágenes, particularmente para los long-tail datasets que requieren sectores como la conducción autónoma. Las herramientas tradicionales basadas en reglas no resultaron óptimas para identificar la redundancia en función de la similitud semántica, lo que resulta en ciclos inútiles de datos repetitivos y reduce la productividad general.
Para superar estos problemas, FastLabel necesitaba una técnica sólida y escalable para identificar y eliminar datos redundantes, y sobre todo para aprovechar los avances en los modelos de IA generativa en lugar de la heurística convencional. Con la capacidad de eliminar automáticamente datos duplicados en minutos en lugar de horas, NVIDIA NeMo™ Curator se destacó como una opción ideal para escalar pipelines de procesamiento de datos, una mejora significativa con respecto a los enfoques manuales anteriores.
FastLabel
FastLabel implementó funciones de procesamiento de imágenes de NeMo Curator en las GPU NVIDIA A100 en la nube de Google Cloud Platform (GCP), junto con modelos ISV alojados por GCP para la incrustación de imágenes y la generación de rótulos. La empresa usó esta solución para seleccionar conjuntos de datos de imágenes de conducción autónoma a gran escala, logrando así crear conjuntos de datos limpios que excluyen imágenes semánticamente similares de manera escalable.
La innovación clave involucró la integración de modelos de lenguaje de visión (VLMs) que generan rótulos detallados para cada imagen de acuerdo a funciones predefinidas específicas de dominio. Luego, esos rótulos se integran y procesan a través de la función de deduplicación semántica de NeMo Curator, lo que permite una selección altamente específica de dominios que sería difícil de lograr con métodos generales de similitud semántica de imágenes.
La adopción de NVIDIA NeMo Curator trajo resultados transformadores para FastLabel.
Este nivel de eficiencia no solo aceleró la preparación de conjuntos de datos, sino que también redujo el desperdicio computacional, permitiendo así un entrenamiento de IA más sostenible en todos los proyectos de FastLabel.
“Antes de implementar las soluciones impulsadas por NVIDIA, la deduplicación de imágenes para la conducción autónoma era un cuello de botella de recursos. NVIDIA NeMo Curator nos permitió automatizar y escalar nuestra selección de conjuntos de datos, lo que redujo significativamente nuestros costos y el esfuerzo manual requerido. Deduplicamos 10.000 imágenes en solo minutos e identificamos cientos de duplicados que los métodos tradicionales habrían pasado por alto. Esto no solo acelera nuestros proyectos de IA, sino que además nos permite ofrecer datos inmediatos y de alta calidad a clientes en industrias donde la seguridad es crucial”.
Shuhei Uchida
CPO
La solución permitió a FastLabel lanzar su servicio “FastLabel Data Curation”, que brinda a los clientes acceso rápido y confiable a conjuntos de datos de alta calidad, etiquetados y deduplicados automáticamente. Esto redujo significativamente el tiempo necesario para las revisiones manuales y aceleró los ciclos posteriores de los proyectos. Estas innovaciones permitieron una implementación más segura y escalable de soluciones de IA en dominios críticos para la seguridad, como la conducción autónoma.
FastLabel Data Curation planea lanzar un servicio de selección de alta velocidad y escalable también para datos de texto, haciendo uso de NeMo Curator para proporcionar a los clientes datos de alta calidad para Modelos de Lenguaje Grandes (LLM) y Modelos de Visión y Lenguaje (VLM).
En un sentido más amplio, el enfoque de FastLabel, habilitado por las tecnologías de NVIDIA, representa un avance hacia una inteligencia artificial sostenible y a gran escala que ayudará a las organizaciones de todo el mundo a crear y mantener mejores conjuntos de datos más rápido y a un costo menor.
NVIDIA NeMo Curator mejora la precisión de los modelos de IA generativa al procesar datos de texto, imagen y video a escala para el entrenamiento y la personalización.