
¡Increíble! La verdad detrás de cómo medimos la inteligencia artificial hoy.
En la actual era de la inteligencia artificial, medir la capacidad de los modelos se ha convertido en una tarea compleja y crítica. La llegada de SWE-Bench ha cambiado la forma en que se evalúan las habilidades de codificación de la IA, utilizando problemas de programación reales de repositorios públicos. Sin embargo, a medida que…