Jump to content

Ричард С. Саттон

Ричард С. Саттон
Национальность Канадский
Гражданство Канадский
Альма-матер Массачусетский университет в Амхерсте
Стэнфордский университет
Известный Обучение временной разнице , Dyna, Options, GQ(λ)
Награды AAAI Сотрудник (2001)
Премия Президента (ИННС) (2003 г.)
Королевского общества Канады Стипендиат (2016 г.)
Научная карьера
Поля Искусственный интеллект
Обучение с подкреплением
Учреждения Университет Альберты
Диссертация Присвоение временных кредитов в обучении с подкреплением   (1984)
Докторантура Эндрю Барто
Докторанты Дэвид Сильвер , Дойна Прекап
Веб-сайт неполные идеи .сеть

Ричард С. Саттон FRS FRSC — канадский учёный-компьютерщик . Он профессор информатики в Университете Альберты и научный сотрудник Keen Technologies. [1] Саттон считается одним из основателей современного компьютерного обучения с подкреплением . [2] внес несколько значительных вкладов в эту область, включая методы обучения временной разнице и методы политического градиента. [3]

Жизнь и образование [ править ]

Ричард Саттон родился в Огайо и вырос в Оук-Бруке, штат , пригороде Чикаго Иллинойс .

Саттон получил степень бакалавра психологии . в Стэнфордском университете в 1978 году, а затем получил степень магистра (1980) и доктора философии (1984) по специальности информатика в Массачусетском университете в Амхерсте под руководством Эндрю Барто . Его докторская диссертация «Присвоение временных кредитов в обучении с подкреплением» представила архитектуры «актёр-критик» и временное присвоение кредитов . [4] [3]

На него повлияла работа Гарри Клопфа 1970-х годов, который предположил, что контролируемое обучение недостаточно для искусственного интеллекта или объяснения разумного поведения, и необходимо обучение методом проб и ошибок, движимое «гедонистическими аспектами поведения». Это сосредоточило его интерес к обучению с подкреплением. [5]

Карьера [ править ]

В 1984 году Саттон работал научным сотрудником в Массачусетском университете.

С 1985 по 1994 год он был главным техническим сотрудником Лаборатории компьютеров и интеллектуальных систем GTE в Уолтеме, Массачусетс . [3] После этого он провел 3 года в Массачусетском университете в Амхерсте в качестве старшего научного сотрудника. [3]

С 1998 по 2002 год Саттон работал в лаборатории AT&T Shannon во Флорхэм-Парке, штат Нью-Джерси, в качестве главного технического сотрудника отдела искусственного интеллекта. [3]

С 2003 года он является профессором информатики в Университете Альберты . До 2018 года он возглавлял лабораторию обучения с подкреплением и искусственного интеллекта. [6] [3]

Сохранив свою профессорскую должность, Саттон присоединился к Deepmind в июне 2017 года в качестве выдающегося ученого-исследователя и соучредителя офиса в Эдмонтоне . [4] [7] [8]

Саттон стал гражданином Канады в 2015 году и отказался от гражданства США. [8] в 2017 году.

В эссе 2019 года Саттон раскритиковал область исследований ИИ за неспособность «усвоить горький урок о том, что формирование того, как мы думаем, мы думаем, не работает в долгосрочной перспективе», утверждая, что «70 лет исследований ИИ [показали], что общие методы, использующие вычисления, в конечном итоге являются наиболее эффективными и с большим отрывом», превосходя усилия, основанные на человеческих знаниях в конкретных областях, таких как компьютерное зрение, распознавание речи, шахматы или го. [9] [10]

В 2023 году он и Джон Кармак объявили о партнёрстве по развитию AGI . [11]

Избранные публикации [ править ]

Награды и почести [ править ]

Саттон является членом Ассоциации по развитию искусственного интеллекта (AAAI) с 2001 года. [12] В 2003 году он получил Президентскую премию Международного общества нейронных сетей. [13] а в 2013 году — награда Массачусетского университета в Амхерсте за выдающиеся достижения в области исследований . [14]

Номинация Саттона на должность члена AAAI гласит: [12]

За значительный вклад во многие темы машинного обучения, включая обучение с подкреплением, методы временных различий и нейронные сети.

В 2016 году Саттон была избрана членом Королевского общества Канады. [15] В 2021 году он был избран членом Королевского общества. [16]

Ссылки [ править ]

  1. ^ «Джон Кармак и Рич Саттон вместе ускоряют разработку общего искусственного интеллекта» . market.businessinsider.com . Проверено 2 октября 2023 г.
  2. ^ «Эксклюзив: интервью с Ричем Саттоном, отцом обучения с подкреплением» . 11 января 2018 г. Архивировано из оригинала 11 января 2018 г. Проверено 17 декабря 2018 г.
  3. ^ Jump up to: Перейти обратно: а б с д и ж Пятецкий, Григорий (5 декабря 2017 г.). «Эксклюзив: интервью с Ричем Саттоном, отцом обучения с подкреплением» . КДнаггетс . Проверено 10 февраля 2024 г.
  4. ^ Jump up to: Перейти обратно: а б «Краткая биография Ричарда Саттона» . incompleteideas.net . Проверено 17 декабря 2018 г.
  5. ^ Саттон, Ричард С.; Барто, Эндрю (2020). Обучение с подкреплением: введение (второе изд.). Кембридж, Массачусетс: MIT Press. стр. 22–23. ISBN  978-0-262-03924-6 .
  6. ^ Браун, Майкл (10 мая 2021 г.). «Новатор в области искусственного интеллекта Ричард Саттон включен в Королевское общество» . Альбертский институт машинного интеллекта . Проверено 10 февраля 2024 г.
  7. ^ «DeepMind расширяется в Канаде, открывая новый исследовательский офис в Эдмонтоне, Альберта» . ДипМайнд . Проверено 17 декабря 2018 г.
  8. ^ Jump up to: Перейти обратно: а б «Эдмонтонский гуру искусственного интеллекта Рич Саттон потерял свой DeepMind, но не свои амбиции» . Национальная почта . 19 марта 2023 г. Проверено 2 июля 2023 г.
  9. ^ Саттон, Рич (13 марта 2019 г.). «Горький урок» . www.incompleteideas.net . Проверено 22 сентября 2022 г.
  10. ^ Танстолл, Льюис; Верра, Леандро фон; Вольф, Томас (26 января 2022 г.). Обработка естественного языка с помощью преобразователей . «О'Рейли Медиа, Инк.». ISBN  978-1-0981-0319-4 .
  11. ^ «Джон Кармак и Рич Саттон вместе ускоряют разработку общего искусственного интеллекта» . market.businessinsider.com . Проверено 2 октября 2023 г.
  12. ^ Jump up to: Перейти обратно: а б «Избранные члены AAAI» . www.aaai.org . Проверено 17 декабря 2018 г.
  13. ^ «Лауреаты премии ИННС» . www.inns.org . Проверено 17 декабря 2018 г.
  14. ^ «Лауреаты премии за выдающиеся достижения и пропаганду» . Колледж информационных и компьютерных наук Массачусетского университета в Амхерсте . 05.10.2010 . Проверено 17 декабря 2018 г.
  15. ^ Браун, Майкл (19 сентября 2016 г.). «Ученые Университета А вступают в ряды Королевского общества» . Квадрат . Проверено 24 августа 2023 г.
  16. ^ «Королевское общество выбирает новых выдающихся членов и иностранных членов» . royalsociety.org . Проверено 8 июня 2021 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ce1d83b34fe988f8e228125e420b50f3__1714966800
URL1:https://arc.ask3.ru/arc/aa/ce/f3/ce1d83b34fe988f8e228125e420b50f3.html
Заголовок, (Title) документа по адресу, URL1:
Richard S. Sutton - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)