
¡Descubre el escándalo detrás de las pruebas de inteligencia artificial que nadie quiere que sepas!
Desde su lanzamiento en noviembre de 2024, SWE-Bench se ha convertido en el referencial clave para evaluar las habilidades de programación de modelos de inteligencia artificial, utilizando más de 2,000 problemas reales tomados de proyectos de Python en GitHub. Sin embargo, a medida que su popularidad se ha disparado, también lo ha hecho el cuestionamiento…