Andrew Barto, de 76 años, y Richard Sutton, de 67, han sido galardonados con el Premio A.M. Turing, el mayor reconocimiento en el campo de la informática, por su trabajo pionero en el aprendizaje por refuerzo. Este método, que se basa en enseñar a las máquinas de manera similar a como los entrenadores enseñan a los animales, ha sido fundamental para avances recientes en inteligencia artificial.
Desde finales de la década de 1970, Barto y Sutton han estado desarrollando teorías y algoritmos que hoy son fundamentales en la IA. Su investigación sentó las bases para logros como la victoria de un programa de Google sobre los mejores jugadores humanos de go, o el uso de IA en herramientas populares como ChatGPT. Además, el aprendizaje por refuerzo ha mejorado tecnologías como la robótica y el comercio financiero.
El trabajo de Barto y Sutton, que comenzó en la Universidad de Massachusetts, se basó en teorías psicológicas y neurocientíficas sobre cómo las neuronas responden a recompensas y castigos. Su artículo clave de los años 80 sobre el “equilibrio de un palo en un carro” ayudó a dar forma a la disciplina del aprendizaje por refuerzo.
A pesar de que su campo no era popular en sus primeros días, Barto se mostró gratamente sorprendido por el reconocimiento actual.
“Es gratificante ver cómo esto se ha convertido en algo relevante e interesante”, expresó Barto.
El Premio Turing, patrocinado por Google, incluye un millón de dólares y destaca el impacto duradero de su investigación, que ha impulsado avances tecnológicos y atraído a nuevos investigadores. Aunque la IA generativa, como la de los chatbots, es tendencia actualmente, Barto y Sutton hicieron énfasis en la importancia de la experiencia en lugar de los datos de las personas para entrenar a los agentes de IA.
A pesar de sus diferencias de opinión sobre los riesgos futuros de la IA, ambos científicos continúan siendo una parte esencial del desarrollo tecnológico en este campo.