Дэвид Сильвер (ученый-компьютерщик)

Дэвид Сильвер
ФРС
Дэвид Сильвер ФРС
Рожденный	1976 (47–48 лет)
Альма-матер	Кембриджский университет (бакалавр) ; Университет Альберты (доктор философии)
Известный	АльфаГо ; АльфаЗеро ; АльфаСтар
Награды	Университетская исследовательская стипендия Королевского общества (2011 г.) ; Премия ACM в области вычислительной техники (2019)
	Научная карьера
Поля	Искусственный интеллект ; Машинное обучение ; Обучение с подкреплением ; Планирование ; Компьютерные игры
Учреждения	Гугл Дипмайнд ; Университетский колледж Лондона ; Эликсир Студии
Диссертация	Обучение с подкреплением и поиск на основе моделирования в компьютерном Go (2009)
Веб-сайт	www .davidsilver .uk

Дэвид Сильвер FRS (1976 г.р.) — ведущий научный сотрудник Google DeepMind и профессор Университетского колледжа Лондона . Он руководил исследованиями в области обучения с подкреплением вместе с AlphaGo , AlphaZero и соруководителем AlphaStar . ^[1]^[2]

Образование [ править ]

Он учился в Крайстс-колледже в Кембридже . ^[3] окончил университет в 1997 году с премией Аддисона-Уэсли и подружился с Демисом Хассабисом во время учебы в Кембридже. ^[4] Сильвер вернулся в академические круги в 2004 году в Университете Альберты, чтобы получить докторскую степень по обучению с подкреплением . ^[5] где он представил алгоритмы, используемые в первых программах 9 × 9 Go на уровне мастера , и окончил обучение в 2009 году. ^[6]^[7] Его версия программы MoGo (в соавторстве с Сильвеном Джелли) была одной из самых сильных программ Го по состоянию на 2009 год. ^[8]

и исследования Карьера

После окончания университета Сильвер стал соучредителем компании по производству видеоигр Elixir Studios , где был техническим директором и ведущим программистом, получив несколько наград за технологии и инновации. ^[4]^[9]

Сильвер был удостоен университетской исследовательской стипендии Королевского общества в 2011 году и впоследствии стал преподавателем в Университетском колледже Лондона . ^[10] Его лекции по обучению с подкреплением доступны на YouTube. ^[11] Сильвер консультировал компанию Google DeepMind с момента ее основания и присоединился к ней на постоянной основе в 2013 году.

Его недавняя работа была сосредоточена на сочетании обучения с подкреплением и глубокого обучения , включая программу, которая учится играть в игры Atari непосредственно с пикселей. ^[12] Сильвер возглавил проект AlphaGo, кульминацией которого стала первая программа, позволившая победить лучшего профессионального игрока в полноразмерной игре Го. ^[13] Впоследствии AlphaGo получила почетный профессиональный сертификат 9 дана; и получил награду «Каннский лев» за инновации. ^[14] Затем он возглавил разработку AlphaZero , которая использовала тот же искусственный интеллект, чтобы научиться играть в го с нуля (обучение только играя в себя, а не в человеческих играх), прежде чем научиться играть в шахматы и сёги таким же образом, на более высоких уровнях, чем на любом другом компьютере. программа.

Сильвер входит в число наиболее публикуемых сотрудников Google DeepMind: его цитируют более 170 000 раз, а его Хирша индекс равен 86, по данным ученого Google . ^[1]

Награды и почести [ править ]

Сильвер был удостоен премии ACM в области вычислительной техники 2019 года за выдающиеся достижения в области компьютерных игр. ^[15]

В 2021 году Сильвер был избран членом Королевского общества (FRS) за вклад в Deep Q-Networks и AlphaGo . ^[16] В 2022 году он был избран членом Ассоциации по развитию искусственного интеллекта . ^[17]

Ссылки [ править ]

↑ Перейти обратно: Перейти обратно: ^а ^б ^с Публикации Дэвида Сильвера, проиндексированные Google Scholar
^ Ориол Виньялс ; Игорь Бабушкин; Войцех М. Чарнецкий; и др. (30 октября 2019 г.). «Уровень гроссмейстера в StarCraft II с использованием многоагентного обучения с подкреплением». Природа . 575 (7782): 350–354. дои : 10.1038/S41586-019-1724-Z . ISSN 1476-4687 . PMID 31666705 . Викиданные Q72988805 .
^ Список членов Кембриджского университета до 31 июля 1998 г.
↑ Перейти обратно: Перейти обратно: ^а ^б Шид, Сэм. «Дэвид Сильвер: невоспетый герой и интеллектуальный центр Google DeepMind» . businessinsider.com . Проверено 26 сентября 2020 г.
^ Дэвид Сильвер в проекте «Математическая генеалогия»
^ Сильвер, Дэвид (2009). Обучение с подкреплением и поиск на основе моделирования в Computer Go . ualberta.ca (кандидатская диссертация). Университет Альберты. дои : 10.7939/R39D8T . OCLC 575410609 .
^ Сильвен Желли; Дэвид Сильвер (2008). «Достижение мастерского уровня в компьютерной игре 9 × 9» (PDF) . Материалы двадцать третьей конференции AAAI по искусственному интеллекту .
^ Стюарт Дж. Рассел ; Питер Норвиг (2009). Искусственный интеллект: современный подход (3-е изд.). Прентис Холл .
^ «Чему искусственный интеллект, стоящий за AlphaGo, может научить нас тому, как быть человеком» . Wired.com . Проверено 17 мая 2016 г.
^ «CSML | Дэвид Сильвер» . ucl.ac.uk. Архивировано из оригинала 24 апреля 2021 года . Проверено 27 мая 2017 г.
^ «Курс RL Дэвида Сильвера — Лекция 1: Введение в обучение с подкреплением» . 13 мая 2015 г. — через YouTube .
^ Владимир Мних; Корай Кавукчуоглу; Дэвид Сильвер ; и др. (25 февраля 2015 г.). «Контроль на человеческом уровне посредством глубокого обучения с подкреплением». Природа . 518 (7540): 529–533. дои : 10.1038/NATURE14236 . ISSN 1476-4687 . ПМИД 25719670 . Викиданные Q27907579 .
^ Дэвид Сильвер ; Аджа Хуанг ; Крис Дж. Мэддисон; и др. (27 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа . 529 (7587): 484–489. дои : 10.1038/NATURE16961 . ISSN 1476-4687 . ПМИД 26819042 . Викиданные Q28005460 .
^ «Google DeepMind AlphaGo в Великобритании выигрывает Гран-при инноваций» . Проверено 27 мая 2017 г.
^ Ормонд, Джим. «Премия ACM в области вычислений присуждена разработчику AlphaGo: Дэвид Сильвер отмечен за выдающиеся достижения в области компьютерных игр» . acm.org . Проверено 2 апреля 2020 г.
^ «Королевское общество выбирает новых выдающихся членов и иностранных членов» . royalsociety.org . Проверено 8 июня 2021 г.
^ «Избранные члены AAAI» . АААИ . Проверено 3 января 2024 г.

[gs-1] Перейти обратно: Перейти обратно: ^а ^б ^с Публикации Дэвида Сильвера, проиндексированные Google Scholar

[astar-2] Ориол Виньялс ; Игорь Бабушкин; Войцех М. Чарнецкий; и др. (30 октября 2019 г.). «Уровень гроссмейстера в StarCraft II с использованием многоагентного обучения с подкреплением». Природа . 575 (7782): 350–354. дои : 10.1038/S41586-019-1724-Z . ISSN 1476-4687 . PMID 31666705 . Викиданные Q72988805 .

[3] Список членов Кембриджского университета до 31 июля 1998 г.

[Unsung_Hero-4] Перейти обратно: Перейти обратно: ^а ^б Шид, Сэм. «Дэвид Сильвер: невоспетый герой и интеллектуальный центр Google DeepMind» . businessinsider.com . Проверено 26 сентября 2020 г.

[mathgene-5] Дэвид Сильвер в проекте «Математическая генеалогия»

[6] Сильвер, Дэвид (2009). Обучение с подкреплением и поиск на основе моделирования в Computer Go . ualberta.ca (кандидатская диссертация). Университет Альберты. дои : 10.7939/R39D8T . OCLC 575410609 .

[7] Сильвен Желли; Дэвид Сильвер (2008). «Достижение мастерского уровня в компьютерной игре 9 × 9» (PDF) . Материалы двадцать третьей конференции AAAI по искусственному интеллекту .

[8] Стюарт Дж. Рассел ; Питер Норвиг (2009). Искусственный интеллект: современный подход (3-е изд.). Прентис Холл .

[MyUser_Wired.com_May_17_2016c-9] «Чему искусственный интеллект, стоящий за AlphaGo, может научить нас тому, как быть человеком» . Wired.com . Проверено 17 мая 2016 г.

[10] «CSML | Дэвид Сильвер» . ucl.ac.uk. Архивировано из оригинала 24 апреля 2021 года . Проверено 27 мая 2017 г.

[11] «Курс RL Дэвида Сильвера — Лекция 1: Введение в обучение с подкреплением» . 13 мая 2015 г. — через YouTube .

[humanlevel-12] Владимир Мних; Корай Кавукчуоглу; Дэвид Сильвер ; и др. (25 февраля 2015 г.). «Контроль на человеческом уровне посредством глубокого обучения с подкреплением». Природа . 518 (7540): 529–533. дои : 10.1038/NATURE14236 . ISSN 1476-4687 . ПМИД 25719670 . Викиданные Q27907579 .

[go-13] Дэвид Сильвер ; Аджа Хуанг ; Крис Дж. Мэддисон; и др. (27 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа . 529 (7587): 484–489. дои : 10.1038/NATURE16961 . ISSN 1476-4687 . ПМИД 26819042 . Викиданные Q28005460 .

[14] «Google DeepMind AlphaGo в Великобритании выигрывает Гран-при инноваций» . Проверено 27 мая 2017 г.

[15] Ормонд, Джим. «Премия ACM в области вычислений присуждена разработчику AlphaGo: Дэвид Сильвер отмечен за выдающиеся достижения в области компьютерных игр» . acm.org . Проверено 2 апреля 2020 г.

[16] «Королевское общество выбирает новых выдающихся членов и иностранных членов» . royalsociety.org . Проверено 8 июня 2021 г.

[17] «Избранные члены AAAI» . АААИ . Проверено 3 января 2024 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

Образование [ править ]

и исследования Карьера ​

Награды и почести [ править ]

Ссылки [ править ]

и исследования Карьера