¡Increíble! El gran dilema detrás de las pruebas de inteligencia artificial hoy en día

Las pruebas y escalas de evaluación para la inteligencia artificial, como SWE-Bench, están en el ojo del huracán. Aunque esta herramienta, lanzada en 2024, ha ganado popularidad al medir las habilidades de programación de modelos de IA, ha surgido una creciente preocupación sobre su efectividad real. Expertos como John Yang de Princeton advierten que los…

Read More