
Google DeepMind ha lanzado Gemini Robotics, un modelo que combina su avanzado lenguaje artificial con capacidades robóticas. Este sistema permite a los robots ser más versátiles, seguir instrucciones en lenguaje natural y adaptarse a nuevas tareas sin un entrenamiento extenso. Kanishka Rao, director de robótica en DeepMind, destaca que hasta ahora, los robots han tenido dificultades para generalizar fuera de escenarios conocidos, pero este avance promete superar esos límites.
Gemini Robotics no solo facilita la ejecución de tareas complejas como poner plátanos en un recipiente, sino que también permite a los robots interactuar y comunicarse con los humanos de manera más natural. En demos impactantes, los robots han ejecutado acciones como plegar gafas y realizar un ‘slam dunk’ con una pelota, mostrando un nivel de comprensión que antes parecía inalcanzable. Estas interacciones revelan una nueva era de robots más intuitivos y funcionales.
Además, Google está colaborando con empresas como Agility Robotics y Boston Dynamics para desarrollar un modelo complementario, Gemini Robotics-ER, que se enfocará en el razonamiento espacial. Este fuerte impulso en la robótica, respaldado por inteligencia artificial avanzada, podría transformar la manera en que los robots nos asisten en nuestra vida cotidiana, acercándonos a un futuro donde estos podrían ser compañeros y ayudantes en una variedad de tareas diarias.