Jump to content

Дэвид Сильвер (ученый-компьютерщик)

Дэвид Сильвер
Рожденный 1976 (47–48 лет)
Альма-матер Кембриджский университет (бакалавр)
Университет Альберты (доктор философии)
Известный АльфаГо
АльфаЗеро
АльфаСтар
Награды Университетская исследовательская стипендия Королевского общества (2011 г.)
Премия ACM в области вычислительной техники (2019)
Научная карьера
Поля Искусственный интеллект
Машинное обучение
Обучение с подкреплением
Планирование
Компьютерные игры [1]
Учреждения Гугл Дипмайнд
Университетский колледж Лондона
Эликсир Студии
Диссертация Обучение с подкреплением и поиск на основе моделирования в компьютерном Go   (2009)
Веб-сайт www .davidsilver .uk Отредактируйте это в Викиданных

Дэвид Сильвер FRS (1976 г.р.) — ведущий научный сотрудник Google DeepMind и профессор Университетского колледжа Лондона . Он руководил исследованиями в области обучения с подкреплением вместе с AlphaGo , AlphaZero и соруководителем AlphaStar . [1] [2]

Образование [ править ]

Он учился в Крайстс-колледже в Кембридже . [3] окончил университет в 1997 году с премией Аддисона-Уэсли и подружился с Демисом Хассабисом во время учебы в Кембридже. [4] Сильвер вернулся в академические круги в 2004 году в Университете Альберты, чтобы получить докторскую степень по обучению с подкреплением . [5] где он представил алгоритмы, используемые в первых программах 9 × 9 Go на уровне мастера , и окончил обучение в 2009 году. [6] [7] Его версия программы MoGo (в соавторстве с Сильвеном Джелли) была одной из самых сильных программ Го по состоянию на 2009 год. [8]

и исследования Карьера

После окончания университета Сильвер стал соучредителем компании по производству видеоигр Elixir Studios , где был техническим директором и ведущим программистом, получив несколько наград за технологии и инновации. [4] [9]

Сильвер был удостоен университетской исследовательской стипендии Королевского общества в 2011 году и впоследствии стал преподавателем в Университетском колледже Лондона . [10] Его лекции по обучению с подкреплением доступны на YouTube. [11] Сильвер консультировал компанию Google DeepMind с момента ее основания и присоединился к ней на постоянной основе в 2013 году.

Его недавняя работа была сосредоточена на сочетании обучения с подкреплением и глубокого обучения , включая программу, которая учится играть в игры Atari непосредственно с пикселей. [12] Сильвер возглавил проект AlphaGo, кульминацией которого стала первая программа, позволившая победить лучшего профессионального игрока в полноразмерной игре Го. [13] Впоследствии AlphaGo получила почетный профессиональный сертификат 9 дана; и получил награду «Каннский лев» за инновации. [14] Затем он возглавил разработку AlphaZero , которая использовала тот же искусственный интеллект, чтобы научиться играть в го с нуля (обучение только играя в себя, а не в человеческих играх), прежде чем научиться играть в шахматы и сёги таким же образом, на более высоких уровнях, чем на любом другом компьютере. программа.

Сильвер входит в число наиболее публикуемых сотрудников Google DeepMind: его цитируют более 170 000 раз, а его Хирша индекс равен 86, по данным ученого Google . [1]

Награды и почести [ править ]

Сильвер был удостоен премии ACM в области вычислительной техники 2019 года за выдающиеся достижения в области компьютерных игр. [15]

В 2021 году Сильвер был избран членом Королевского общества (FRS) за вклад в Deep Q-Networks и AlphaGo . [16] В 2022 году он был избран членом Ассоциации по развитию искусственного интеллекта . [17]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б с Публикации Дэвида Сильвера, проиндексированные Google Scholar Отредактируйте это в Викиданных
  2. ^ Ориол Виньялс ; Игорь Бабушкин; Войцех М. Чарнецкий; и др. (30 октября 2019 г.). «Уровень гроссмейстера в StarCraft II с использованием многоагентного обучения с подкреплением». Природа . 575 (7782): 350–354. дои : 10.1038/S41586-019-1724-Z . ISSN   1476-4687 . PMID   31666705 . Викиданные   Q72988805 .
  3. ^ Список членов Кембриджского университета до 31 июля 1998 г.
  4. Перейти обратно: Перейти обратно: а б Шид, Сэм. «Дэвид Сильвер: невоспетый герой и интеллектуальный центр Google DeepMind» . businessinsider.com . Проверено 26 сентября 2020 г.
  5. ^ Дэвид Сильвер в проекте «Математическая генеалогия» Отредактируйте это в Викиданных
  6. ^ Сильвер, Дэвид (2009). Обучение с подкреплением и поиск на основе моделирования в Computer Go . ualberta.ca (кандидатская диссертация). Университет Альберты. дои : 10.7939/R39D8T . OCLC   575410609 .
  7. ^ Сильвен Желли; Дэвид Сильвер (2008). «Достижение мастерского уровня в компьютерной игре 9 × 9» (PDF) . Материалы двадцать третьей конференции AAAI по искусственному интеллекту .
  8. ^ Стюарт Дж. Рассел ; Питер Норвиг (2009). Искусственный интеллект: современный подход (3-е изд.). Прентис Холл .
  9. ^ «Чему искусственный интеллект, стоящий за AlphaGo, может научить нас тому, как быть человеком» . Wired.com . Проверено 17 мая 2016 г.
  10. ^ «CSML | Дэвид Сильвер» . ucl.ac.uk. ​Архивировано из оригинала 24 апреля 2021 года . Проверено 27 мая 2017 г.
  11. ^ «Курс RL Дэвида Сильвера — Лекция 1: Введение в обучение с подкреплением» . 13 мая 2015 г. — через YouTube .
  12. ^ Владимир Мних; Корай Кавукчуоглу; Дэвид Сильвер ; и др. (25 февраля 2015 г.). «Контроль на человеческом уровне посредством глубокого обучения с подкреплением». Природа . 518 (7540): 529–533. дои : 10.1038/NATURE14236 . ISSN   1476-4687 . ПМИД   25719670 . Викиданные   Q27907579 .
  13. ^ Дэвид Сильвер ; Аджа Хуанг ; Крис Дж. Мэддисон; и др. (27 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа . 529 (7587): 484–489. дои : 10.1038/NATURE16961 . ISSN   1476-4687 . ПМИД   26819042 . Викиданные   Q28005460 .
  14. ^ «Google DeepMind AlphaGo в Великобритании выигрывает Гран-при инноваций» . Проверено 27 мая 2017 г.
  15. ^ Ормонд, Джим. «Премия ACM в области вычислений присуждена разработчику AlphaGo: Дэвид Сильвер отмечен за выдающиеся достижения в области компьютерных игр» . acm.org . Проверено 2 апреля 2020 г.
  16. ^ «Королевское общество выбирает новых выдающихся членов и иностранных членов» . royalsociety.org . Проверено 8 июня 2021 г.
  17. ^ «Избранные члены AAAI» . АААИ . Проверено 3 января 2024 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 25d2048889c619ce71f85e2337af8bb2__1704260520
URL1:https://arc.ask3.ru/arc/aa/25/b2/25d2048889c619ce71f85e2337af8bb2.html
Заголовок, (Title) документа по адресу, URL1:
David Silver (computer scientist) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)