Ученые удостоены награды за разработку основ обучения с подкреплением.
Двое ученых удостоились высочайшей награды в сфере компьютерных технологий за их революционный вклад в развитие искусственного интеллекта. Профессор Ричард Саттон из Альберты и его коллега Эндрю Барто из Массачусетса были отмечены престижной премией А.М. Тьюринга 2024 года.
Основоположники обучения с подкреплением
Ассоциация вычислительной техники (ACM) высоко оценила работу ученых в области обучения с подкреплением — ключевого подхода к созданию интеллектуальных систем. Их многолетние исследования, начавшиеся еще в 1980-х годах, заложили фундамент для развития этого направления.
Саттон и Барто разработали математическую основу и важнейшие алгоритмы, вдохновляясь идеями из психологии, в частности, концепцией "вознаграждения". Этот термин обозначает сигнал, получаемый агентом в ответ на его действия, что позволяет системе обучаться более эффективному поведению.
Влияние на современные технологии
Хотите уехать в Канаду? Мы предоставляем поддержку в вопросах иммиграции и помогаем в получении визы. Запишитесь на консультацию, чтобы обсудить вашу ситуацию с нашими лицензированными специалистами и узнать, как мы можем помочь осуществить вашу мечту.
Результаты их исследований нашли широкое применение в различных областях искусственного интеллекта. Обучение с подкреплением используется в таких передовых разработках, как ChatGPT и роботы, способные решать кубик Рубика. Кроме того, эта технология лежит в основе программы AlphaGo, победившей лучших игроков в го.
Их учебник "Обучение с подкреплением: Введение", опубликованный в 1998 году, до сих пор считается стандартным справочником в этой области.
Премия А.М. Тьюринга, названная в честь выдающегося британского математика, считается аналогом Нобелевской премии в сфере компьютерных наук. Помимо признания, лауреаты получат денежное вознаграждение в размере 1 миллиона долларов США.
