Los pioneros de la inteligencia artificial han recibido el premio Turing por su trabajo en aprendizaje por refuerzo.
Dos pioneros en el campo de la informática han ganado el Premio Turing de 2024 por su trabajo en el aprendizaje por refuerzo, un campo en el que las máquinas aprenden mediante un enfoque basado en la recompensa y la prueba y error, lo que les permite adaptarse en entornos constreñidos o dinámicos.
Andrew G. Barto, profesor emérito de la Universidad de Massachusetts Amherst; y Richard S. Sutton, profesor de la Universidad de Alberta, desarrollaron algoritmos y teorías clave a través de una serie de papers seminales a partir de la década de 1980. Esto incluye el trabajo sobre una técnica de refuerzo llamada aprendizaje por diferencia temporal; más tarde publicaron un libro académico llamado Introducción al Aprendizaje por Refuerzo.
El matemático Alan Turing (fotografiado arriba), en honor a quien se nombra el Premio Turing, también escribió un artículo en la década de 1950 llamado La Inteligencia de las Máquinas Computacionales, que cuestionaba si las computadoras pueden pensar y tocaba conceptos similares sobre el aprendizaje a partir de la experiencia.
En años más recientes, el aprendizaje por refuerzo ha recibido más atención después de que Google Deepmind utilizara la técnica para construir una IA que derrotó a los mejores jugadores de AlphaGo del mundo. Y en los últimos meses, el emergente chino DeepSeek ha llamado la atención por su modelo R1 de razonamiento, que se basó en gran medida en el aprendizaje por refuerzo para crear modelos de fundamento más eficientes.
Premio Nobel de la informática
El Premio Turing, administrado por la Association for Computing Machinery (ACM), a menudo se ha llamado el “Premio Nobel de la informática”. Sin embargo, el Premio Nobel mismo ha comenzado a adentrarse en el ámbito de la informática, especialmente en el campo de la inteligencia artificial; Geoff Hinton y John Hopfield ganaron el Premio Nobel de Física por su trabajo en la inteligencia artificial fundacional el año pasado. Esto fue seguido de cerca por Demis Hassabis y John Jumper de DeepMind quienes fueron galardonados con el Premio Nobel de Química por su trabajo en AlphaFold.
“Las áreas de investigación que van desde la ciencia cognitiva y la psicología hasta la neurociencia inspiraron el desarrollo del aprendizaje por refuerzo, que ha sentando las bases de algunos de los avances más importantes en la inteligencia artificial y nos ha dado una mayor comprensión de cómo funciona el cerebro,” dijo Yannis Ioannidis, presidente de la ACM en un comunicado de prensa. “El trabajo de Barto y Sutton no es un paso intermedio que ya hemos superado. El aprendizaje por refuerzo sigue creciendo y ofrece un gran potencial para futuros avances en la informática y muchas otras disciplinas. Es adecuado que los honremos con el premio más prestigioso de nuestro campo.”
Otros pioneros en inteligencia artificial que han ganado el Premio Turing incluyen a Yann LeCun, el jefe de ciencia de inteligencia artificial de Meta, quien ganó el premio en 2018 junto con Geoff Hinton y Yoshua Bengio por su trabajo en redes neuronales profundas.
Barto y Sutton compartirán el premio en efectivo de $1 millón, que fue proporcionado con el apoyo de Google.