
Descubre la verdad oculta detrás de las pruebas de inteligencia artificial que están cambiando todo.
La creación de SWE-Bench, un nuevo estándar para evaluar las habilidades de programación de modelos de inteligencia artificial, ha desatado un intenso debate en la industria. Desde su lanzamiento en noviembre de 2024, ha ganado popularidad entre desarrolladores y se ha convertido en un referente para grandes aprobados por empresas como OpenAI, Anthropic y Google….