Ричард С. Саттон
Ричард С. Саттон | |
---|---|
![]() | |
Национальность | Канадский |
Гражданство | Канадский |
Альма-матер | Массачусетский университет в Амхерсте Стэнфордский университет |
Известный | Обучение временной разнице , Dyna, Options, GQ(λ) |
Награды | AAAI Сотрудник (2001) Премия Президента (ИННС) (2003 г.) Королевского общества Канады Стипендиат (2016 г.) |
Научная карьера | |
Поля | Искусственный интеллект Обучение с подкреплением |
Учреждения | Университет Альберты |
Диссертация | Присвоение временных кредитов в обучении с подкреплением (1984) |
Докторантура | Эндрю Барто |
Докторанты | Дэвид Сильвер , Дойна Прекап |
Веб-сайт | неполные идеи |
Ричард С. Саттон FRS FRSC — канадский учёный-компьютерщик . Он профессор информатики в Университете Альберты и научный сотрудник Keen Technologies. [1] Саттон считается одним из основателей современного компьютерного обучения с подкреплением . [2] внес несколько значительных вкладов в эту область, включая методы обучения временной разнице и методы политического градиента. [3]
Жизнь и образование [ править ]
Ричард Саттон родился в Огайо и вырос в Оук-Бруке, штат , пригороде Чикаго Иллинойс .
Саттон получил степень бакалавра психологии . в Стэнфордском университете в 1978 году, а затем получил степень магистра (1980) и доктора философии (1984) по специальности информатика в Массачусетском университете в Амхерсте под руководством Эндрю Барто . Его докторская диссертация «Присвоение временных кредитов в обучении с подкреплением» представила архитектуры «актёр-критик» и временное присвоение кредитов . [4] [3]
На него повлияла работа Гарри Клопфа 1970-х годов, который предположил, что контролируемое обучение недостаточно для искусственного интеллекта или объяснения разумного поведения, и необходимо обучение методом проб и ошибок, движимое «гедонистическими аспектами поведения». Это сосредоточило его интерес к обучению с подкреплением. [5]
Карьера [ править ]
В 1984 году Саттон работал научным сотрудником в Массачусетском университете.
С 1985 по 1994 год он был главным техническим сотрудником Лаборатории компьютеров и интеллектуальных систем GTE в Уолтеме, Массачусетс . [3] После этого он провел 3 года в Массачусетском университете в Амхерсте в качестве старшего научного сотрудника. [3]
С 1998 по 2002 год Саттон работал в лаборатории AT&T Shannon во Флорхэм-Парке, штат Нью-Джерси, в качестве главного технического сотрудника отдела искусственного интеллекта. [3]
С 2003 года он является профессором информатики в Университете Альберты . До 2018 года он возглавлял лабораторию обучения с подкреплением и искусственного интеллекта. [6] [3]
Сохранив свою профессорскую должность, Саттон присоединился к Deepmind в июне 2017 года в качестве выдающегося ученого-исследователя и соучредителя офиса в Эдмонтоне . [4] [7] [8]
Саттон стал гражданином Канады в 2015 году и отказался от гражданства США. [8] в 2017 году.
В эссе 2019 года Саттон раскритиковал область исследований ИИ за неспособность «усвоить горький урок о том, что формирование того, как мы думаем, мы думаем, не работает в долгосрочной перспективе», утверждая, что «70 лет исследований ИИ [показали], что общие методы, использующие вычисления, в конечном итоге являются наиболее эффективными и с большим отрывом», превосходя усилия, основанные на человеческих знаниях в конкретных областях, таких как компьютерное зрение, распознавание речи, шахматы или го. [9] [10]
В 2023 году он и Джон Кармак объявили о партнёрстве по развитию AGI . [11]
Избранные публикации [ править ]
- Саттон Р.С., Барто А.Г. Обучение с подкреплением: Введение . MIT Press, 1998. Также переведено на японский и русский языки. Второе издание MIT Press 2018.
- Миллер В.Т., Саттон Р.С., Вербос П.Дж. (ред.), Нейронные сети для управления . Массачусетский технологический институт Пресс, 1991.
- Саттон, Р.С. (ред.), Обучение с подкреплением. Перепечатка специального выпуска журнала Machine Learning Journal. Клювер Академик Пресс, 1992 г.
Награды и почести [ править ]
Саттон является членом Ассоциации по развитию искусственного интеллекта (AAAI) с 2001 года. [12] В 2003 году он получил Президентскую премию Международного общества нейронных сетей. [13] а в 2013 году — награда Массачусетского университета в Амхерсте за выдающиеся достижения в области исследований . [14]
Номинация Саттона на должность члена AAAI гласит: [12]
За значительный вклад во многие темы машинного обучения, включая обучение с подкреплением, методы временных различий и нейронные сети.
В 2016 году Саттон была избрана членом Королевского общества Канады. [15] В 2021 году он был избран членом Королевского общества. [16]
Ссылки [ править ]
- ^ «Джон Кармак и Рич Саттон вместе ускоряют разработку общего искусственного интеллекта» . market.businessinsider.com . Проверено 2 октября 2023 г.
- ^ «Эксклюзив: интервью с Ричем Саттоном, отцом обучения с подкреплением» . 11 января 2018 г. Архивировано из оригинала 11 января 2018 г. Проверено 17 декабря 2018 г.
- ^ Jump up to: Перейти обратно: а б с д и ж Пятецкий, Григорий (5 декабря 2017 г.). «Эксклюзив: интервью с Ричем Саттоном, отцом обучения с подкреплением» . КДнаггетс . Проверено 10 февраля 2024 г.
- ^ Jump up to: Перейти обратно: а б «Краткая биография Ричарда Саттона» . incompleteideas.net . Проверено 17 декабря 2018 г.
- ^ Саттон, Ричард С.; Барто, Эндрю (2020). Обучение с подкреплением: введение (второе изд.). Кембридж, Массачусетс: MIT Press. стр. 22–23. ISBN 978-0-262-03924-6 .
- ^ Браун, Майкл (10 мая 2021 г.). «Новатор в области искусственного интеллекта Ричард Саттон включен в Королевское общество» . Альбертский институт машинного интеллекта . Проверено 10 февраля 2024 г.
- ^ «DeepMind расширяется в Канаде, открывая новый исследовательский офис в Эдмонтоне, Альберта» . ДипМайнд . Проверено 17 декабря 2018 г.
- ^ Jump up to: Перейти обратно: а б «Эдмонтонский гуру искусственного интеллекта Рич Саттон потерял свой DeepMind, но не свои амбиции» . Национальная почта . 19 марта 2023 г. Проверено 2 июля 2023 г.
- ^ Саттон, Рич (13 марта 2019 г.). «Горький урок» . www.incompleteideas.net . Проверено 22 сентября 2022 г.
- ^ Танстолл, Льюис; Верра, Леандро фон; Вольф, Томас (26 января 2022 г.). Обработка естественного языка с помощью преобразователей . «О'Рейли Медиа, Инк.». ISBN 978-1-0981-0319-4 .
- ^ «Джон Кармак и Рич Саттон вместе ускоряют разработку общего искусственного интеллекта» . market.businessinsider.com . Проверено 2 октября 2023 г.
- ^ Jump up to: Перейти обратно: а б «Избранные члены AAAI» . www.aaai.org . Проверено 17 декабря 2018 г.
- ^ «Лауреаты премии ИННС» . www.inns.org . Проверено 17 декабря 2018 г.
- ^ «Лауреаты премии за выдающиеся достижения и пропаганду» . Колледж информационных и компьютерных наук Массачусетского университета в Амхерсте . 05.10.2010 . Проверено 17 декабря 2018 г.
- ^ Браун, Майкл (19 сентября 2016 г.). «Ученые Университета А вступают в ряды Королевского общества» . Квадрат . Проверено 24 августа 2023 г.
- ^ «Королевское общество выбирает новых выдающихся членов и иностранных членов» . royalsociety.org . Проверено 8 июня 2021 г.
Внешние ссылки [ править ]
- Живые люди
- Канадские ученые-компьютерщики
- Академический состав Университета Альберты
- Члены Ассоциации развития искусственного интеллекта
- Выпускники Стэнфордского университета
- Выпускники Массачусетского университета в Амхерсте
- Канадские исследователи искусственного интеллекта
- Канадские члены Королевского общества