Telecomunicaciones

AT&T impulsa la precisión, la eficiencia y el rendimiento de los agentes de IA con NVIDIA

Objetivo

AT&T, una de las mayores empresas de telecomunicaciones del mundo, reimagina la atención al cliente a través de la potencia de la IA. Con una ingente base de clientes y una cartera creciente de servicios digitales, AT&T ha dado prioridad durante mucho tiempo a la innovación y la eficiencia operativa para satisfacer las expectativas cambiantes de los clientes. A medida que la demanda de soporte personalizado y siempre activo continúa creciendo, la empresa está ampliando la implementación de agentes impulsados por IA en sus operaciones para ofrecer un servicio más rápido y preciso. Frente a desafíos como la deriva de modelos, el aumento de las demandas computacionales y la necesidad de acceso a datos en tiempo real, AT&T recurrió a NVIDIA AI Enterprise, NVIDIA NIM y los microservicios NVIDIA NeMo™ para crear una plataforma de IA basada en comentarios que mejora continuamente el rendimiento al tiempo que optimiza los costes, la velocidad y el cumplimiento normativo.

Cliente

AT&T

Caso de uso

IA generativa/LLM

Productos

NVIDIA NeMo
NVIDIA RAPIDS
NVIDIA AI Enterprise
NIM

Escalado de agentes de IA de servicio al cliente con un volante de datos

AT&T desarrolló agentes de IA Ask AT&T para satisfacer las necesidades de los clientes mientras operaba a gran escala. Estos agentes mejoran significativamente las experiencias de los usuarios a través de servicios automatizados, como el análisis de cuentas de clientes para ofrecer recomendaciones de servicio personalizadas y actualizaciones de software, al tiempo que refuerzan la prevención del fraude y optimizan el rendimiento de la red, lo que lleva a una disminución del 84 % en los análisis de los centros de llamadas.

Esta iniciativa forma parte de la ambiciosa estrategia de AT&T para implementar docenas de casos de uso impulsados por IA, con cientos más en proceso. 

Para escalar esta visión, AT&T necesitaba superar desafíos clave: reducir la latencia, reducir los costes operativos y mejorar la precisión de los modelos que impulsan estos agentes de IA.

Otro obstáculo es la variación en la precisión de los modelos. Con casi 10 000 documentos actualizados varias veces a la semana, los agentes de IA deben actualizarse con la información más reciente para seguir siendo efectivos.

Para abordar esto, aprovecharon un volante de datos, un bucle de retroalimentación continua que garantiza que los sistemas multiagente se mantengan actualizados y ofrezcan un rendimiento máximo de forma coherente.

Principales conclusiones

  • Optimización de IA continua con el volante de datos: AT&T aprovechó los microservicios NVIDIA NeMo para crear un ciclo autosostenible de selección de datos, ajuste preciso de modelos y evaluación en tiempo real, garantizando que los agentes de IA mejoraran continuamente en precisión y eficiencia.
  • Equilibrio de rendimiento, costos y cumplimiento: AT&T redujo la latencia y los costes operativos al implementar modelos ligeros y ajustados al tiempo que mantenía los estrictos estándares de seguridad, de privacidad y regulatorios.
  • Innovación escalable en IA para el futuro: el éxito del ajuste preciso de la IA llevó a AT&T a desarrollar una plataforma independiente para la optimización de IA escalable e impulsada por comentarios, allanando el camino para la automatización mejorada y la adopción de IA más amplia en toda la empresa.

Desde el coste hasta el rendimiento: cómo AT&T navega por los desafíos de implementación de IA

Uno de los mayores desafíos a los que se enfrentó AT&T fue la reducción de la latencia y los costes a medida que crecía la adopción de la IA. Con más aplicaciones que dependen de soluciones impulsadas por IA, las demandas computacionales aumentan y es crucial encontrar una forma de mantener el alto rendimiento mientras se optimiza la eficiencia. Lograr el equilibrio adecuado entre la velocidad y el costo se volvió esencial para las operaciones de IA sostenibles.

AT&T también tuvo que garantizar la disponibilidad de datos de alta calidad para el entrenamiento y el ajuste preciso de la IA. El proceso de selección y limpieza de datos se convirtió en un cuello de botella y, sin una preparación de datos robusta, los modelos se arriesgaban a entrenarse con información obsoleta o irrelevante, lo que afectaba negativamente a su precisión y fiabilidad.

La gestión de la complejidad de los sistemas de IA multiagente también era una preocupación apremiante. Los agentes de IA necesitaban adaptarse y optimizarse continuamente para alinearse con el entorno empresarial dinámico de AT&T. Garantizar que estos modelos siguieran siendo relevantes, seguros y de alto rendimiento en tiempo real requería un enfoque sistemático para el refinamiento y la evaluación continuos.

 

«La historia de éxito de la optimización de este caso de uso y otros similares fue suficiente evidencia para seguir creando una plataforma completa de optimización que admita tanto los flujos de usuarios como los flujos diferenciados de optimización en varias tareas».

Kostikey Moustakas
Director de Ciencia de Datos en AT&T

Creación de agentes de IA optimizados y de alto rendimiento

Para superar estos desafíos, AT&T trabajó con Quantiphi para aprovechar NVIDIA AI Enterprise, que incluye NVIDIA NeMo y los microservicios NIM, para implementar un enfoque de volante de datos para mejorar continuamente el rendimiento de los agentes de IA:

  • Refinamiento de la calidad de los datos con NeMo Curator: utilizando NeMo Curator, AT&T limpió y filtró los datos de entrenamiento, aprovechando la experiencia en el dominio y los registros de aplicaciones históricos. Técnicas como el modelado de temas y el filtrado iterativo garantizaron que solo se utilizaran conjuntos de datos de alta calidad.
  • Personalización de modelos de IA para el máximo rendimiento: AT&T experimentó con varios modelos de base, incluidos Mistral, Mixtral y Llama, utilizando NeMo Customizer. A través de un proceso de ajuste preciso iterativo, Mistral 7B emergió como el mejor intérprete, equilibrando la precisión y la eficiencia.
  • Implementación de evaluación rigurosa: NeMo Evaluator de NVIDIA permitió a AT&T establecer un sistema de evaluación robusto, que mide el rendimiento de los agentes de IA a través de métricas como Rouge, BERT F1, la relevancia de las preguntas y la calidad de las respuestas. Esto garantiza que se mide el rendimiento del modelo en las métricas más apropiadas.
  • Actuación en función de la información más reciente: AT&T utilizó NeMo Retriever para configurar canales con acceso rápido al repositorio de la empresa para que los agentes puedan tomar decisiones y actuar utilizando información actualizada.
  • Implementación en una infraestructura segura: los modelos se implementan como microservicios NIM™, que ofrecen un rendimiento de inferencia optimizado, admiten API estándar del sector y proporcionan la flexibilidad necesaria para ejecutarse en cualquier infraestructura acelerada por GPU.

Resultados revolucionarios con optimización de IA

La implementación de los microservicios NVIDIA NIM y NeMo produjo mejoras significativas de rendimiento, así como ahorros sustanciales de costes, al tiempo que se mantenía la escalabilidad y el cumplimiento de estándares empresariales:

  • Precisión de IA mejorada: las respuestas de los agentes de IA mostraron una mejora de hasta el 40 % en la precisión en las respuestas con el entrenamiento posterior en métricas clave, especialmente en las puntuaciones de Rouge y BERT F1.
  • Menor latencia: la implementación de modelos ligeros y ajustados permitió a AT&T reducir la sobrecarga computacional mientras mantenía respuestas de alta calidad
  • Mejora sostenida de la IA: el enfoque de volante de datos facilitó el aprendizaje continuo, garantizando que los agentes de IA se adaptasen a las necesidades empresariales en evolución y a los comentarios de los usuarios.

La implementación de Ask AT&T con NVIDIA NIM y NeMo permitió a AT&T lograr una disminución del 84 % en el coste de análisis de centros de llamadas.

El camino por delante: innovación en IA escalable y basada en comentarios.

Mirando hacia el futuro, AT&T tiene como objetivo centralizar un bucle de retroalimentación para refinar la calidad de los agentes de IA de forma continua. Al integrar un sistema de evaluación híbrido, que aprovecha tanto los revisores humanos como los modelos de IA como jueces, AT&T garantiza que su ecosistema de IA siga respondiendo a las necesidades empresariales.

Además, AT&T, en colaboración con Arize AI, automatiza la identificación y la gestión de interacciones de IA desafiantes. Esto garantiza que los modelos se evalúen y ajusten rigurosamente en función de los comentarios del mundo real, lo que mejora aún más la precisión y el cumplimiento de la IA.

Al refinar sus agentes de IA a través de las capacidades avanzadas de NVIDIA NeMo y NIM, AT&T no solo mejora la eficiencia operativa, sino que también establece un nuevo punto de referencia para las soluciones de IA escalables y adaptativas.

Cree e impulse sus agentes de IA con un ciclo de datos para lograr un rendimiento óptimo y máximo utilizando los microservicios NVIDIA NeMo.