Globant compartió su nuevo agente de IA

SWE-bench-lite es un marco de evaluación simplificado que consiste en 300 instancias centradas en correcciones de errores funcionales. Este subconjunto preserva la diversidad y distribución de los repositorios del conjunto de datos original, abarcando 11 de los 12 repositorios.

Globant compartió que su Agente de IA “Code Fixer” logró la puntuación más alta y se clasificó entre los mejores en SWE-bench-lite, demostrando capacidades excepcionales para resolver necesidades de corrección de errores.

SWE-bench-lite es un marco de evaluación simplificado que consiste en 300 instancias centradas en correcciones de errores funcionales. Este subconjunto preserva la diversidad y distribución de los repositorios del conjunto de datos original, abarcando 11 de los 12 repositorios. Además, se han curado 23 instancias de desarrollo para apoyar el desarrollo continuo de las tareas de SWE-bench.

El SWE-bench Lite, como parte del proceso de validación, mostró resultados consistentes que colocan al Agente de IA Code Fixer entre los modelos más avanzados y de mejor rendimiento a nivel mundial, alcanzando una tasa de resolución de tickets del 48.33%.

Impulsado por Globant Enterprise AI, el Agente de IA Code Fixer aprovecha un sistema de múltiples agentes que opera dentro de un flujo de trabajo estructurado, permitiendo que varios Agentes colaboren en cada etapa de la resolución de problemas de código, asegurando un flujo comprensible mientras se priorizan la precisión y la velocidad.

“En Globant, estamos mejorando nuestras propias capacidades de ingeniería de software aprovechando tecnologías avanzadas de IA para abordar de manera efectiva los desafíos de codificación del mundo real”, señaló Guibert Englebienne, cofundador de Globant y presidente de Globant X.

Fuente: Globant

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Noticias relacionadas
Leer más

La IA cambia las reglas del juego fintech

El negocio financiero empieza a premiar menos a las interfaces atractivas y más a quienes controlan licencias, riesgo, cumplimiento y procesamiento local de pagos. En América Latina, donde el e-commerce sigue creciendo a doble dígito, esa discusión ya impacta en ingresos concretos.
Leer más

El 95% de los proyectos de IA no genera retorno

Porque ese 95% no habla de modelos mal entrenados ni de pipelines con errores técnicos. Habla de organizaciones que implementaron una solución sin un modelo de adopción. La tecnología funcionó. Lo que falló fue todo lo que la rodea.
Total
0
Share