Дэвид Сильвер (ученый-компьютерщик)
Дэвид Сильвер | |
---|---|
Рожденный | 1976 (47–48 лет) |
Альма-матер | Кембриджский университет (бакалавр) Университет Альберты (доктор философии) |
Известный | АльфаГо АльфаЗеро АльфаСтар |
Награды | Университетская исследовательская стипендия Королевского общества (2011 г.) Премия ACM в области вычислительной техники (2019) |
Научная карьера | |
Поля | Искусственный интеллект Машинное обучение Обучение с подкреплением Планирование Компьютерные игры [1] |
Учреждения | Гугл Дипмайнд Университетский колледж Лондона Эликсир Студии |
Диссертация | Обучение с подкреплением и поиск на основе моделирования в компьютерном Go (2009) |
Веб-сайт | www |
Дэвид Сильвер FRS (1976 г.р.) — ведущий научный сотрудник Google DeepMind и профессор Университетского колледжа Лондона . Он руководил исследованиями в области обучения с подкреплением вместе с AlphaGo , AlphaZero и соруководителем AlphaStar . [1] [2]
Образование [ править ]
Он учился в Крайстс-колледже в Кембридже . [3] окончил университет в 1997 году с премией Аддисона-Уэсли и подружился с Демисом Хассабисом во время учебы в Кембридже. [4] Сильвер вернулся в академические круги в 2004 году в Университете Альберты, чтобы получить докторскую степень по обучению с подкреплением . [5] где он представил алгоритмы, используемые в первых программах 9 × 9 Go на уровне мастера , и окончил обучение в 2009 году. [6] [7] Его версия программы MoGo (в соавторстве с Сильвеном Джелли) была одной из самых сильных программ Го по состоянию на 2009 год. [8]
и исследования Карьера
После окончания университета Сильвер стал соучредителем компании по производству видеоигр Elixir Studios , где был техническим директором и ведущим программистом, получив несколько наград за технологии и инновации. [4] [9]
Сильвер был удостоен университетской исследовательской стипендии Королевского общества в 2011 году и впоследствии стал преподавателем в Университетском колледже Лондона . [10] Его лекции по обучению с подкреплением доступны на YouTube. [11] Сильвер консультировал компанию Google DeepMind с момента ее основания и присоединился к ней на постоянной основе в 2013 году.
Его недавняя работа была сосредоточена на сочетании обучения с подкреплением и глубокого обучения , включая программу, которая учится играть в игры Atari непосредственно с пикселей. [12] Сильвер возглавил проект AlphaGo, кульминацией которого стала первая программа, позволившая победить лучшего профессионального игрока в полноразмерной игре Го. [13] Впоследствии AlphaGo получила почетный профессиональный сертификат 9 дана; и получил награду «Каннский лев» за инновации. [14] Затем он возглавил разработку AlphaZero , которая использовала тот же искусственный интеллект, чтобы научиться играть в го с нуля (обучение только играя в себя, а не в человеческих играх), прежде чем научиться играть в шахматы и сёги таким же образом, на более высоких уровнях, чем на любом другом компьютере. программа.
Сильвер входит в число наиболее публикуемых сотрудников Google DeepMind: его цитируют более 170 000 раз, а его Хирша индекс равен 86, по данным ученого Google . [1]
Награды и почести [ править ]
Сильвер был удостоен премии ACM в области вычислительной техники 2019 года за выдающиеся достижения в области компьютерных игр. [15]
В 2021 году Сильвер был избран членом Королевского общества (FRS) за вклад в Deep Q-Networks и AlphaGo . [16] В 2022 году он был избран членом Ассоциации по развитию искусственного интеллекта . [17]
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б с Публикации Дэвида Сильвера, проиндексированные Google Scholar
- ^ Ориол Виньялс ; Игорь Бабушкин; Войцех М. Чарнецкий; и др. (30 октября 2019 г.). «Уровень гроссмейстера в StarCraft II с использованием многоагентного обучения с подкреплением». Природа . 575 (7782): 350–354. дои : 10.1038/S41586-019-1724-Z . ISSN 1476-4687 . PMID 31666705 . Викиданные Q72988805 .
- ^ Список членов Кембриджского университета до 31 июля 1998 г.
- ↑ Перейти обратно: Перейти обратно: а б Шид, Сэм. «Дэвид Сильвер: невоспетый герой и интеллектуальный центр Google DeepMind» . businessinsider.com . Проверено 26 сентября 2020 г.
- ^ Дэвид Сильвер в проекте «Математическая генеалогия»
- ^ Сильвер, Дэвид (2009). Обучение с подкреплением и поиск на основе моделирования в Computer Go . ualberta.ca (кандидатская диссертация). Университет Альберты. дои : 10.7939/R39D8T . OCLC 575410609 .
- ^ Сильвен Желли; Дэвид Сильвер (2008). «Достижение мастерского уровня в компьютерной игре 9 × 9» (PDF) . Материалы двадцать третьей конференции AAAI по искусственному интеллекту .
- ^ Стюарт Дж. Рассел ; Питер Норвиг (2009). Искусственный интеллект: современный подход (3-е изд.). Прентис Холл .
- ^ «Чему искусственный интеллект, стоящий за AlphaGo, может научить нас тому, как быть человеком» . Wired.com . Проверено 17 мая 2016 г.
- ^ «CSML | Дэвид Сильвер» . ucl.ac.uk. Архивировано из оригинала 24 апреля 2021 года . Проверено 27 мая 2017 г.
- ^ «Курс RL Дэвида Сильвера — Лекция 1: Введение в обучение с подкреплением» . 13 мая 2015 г. — через YouTube .
- ^ Владимир Мних; Корай Кавукчуоглу; Дэвид Сильвер ; и др. (25 февраля 2015 г.). «Контроль на человеческом уровне посредством глубокого обучения с подкреплением». Природа . 518 (7540): 529–533. дои : 10.1038/NATURE14236 . ISSN 1476-4687 . ПМИД 25719670 . Викиданные Q27907579 .
- ^ Дэвид Сильвер ; Аджа Хуанг ; Крис Дж. Мэддисон; и др. (27 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа . 529 (7587): 484–489. дои : 10.1038/NATURE16961 . ISSN 1476-4687 . ПМИД 26819042 . Викиданные Q28005460 .
- ^ «Google DeepMind AlphaGo в Великобритании выигрывает Гран-при инноваций» . Проверено 27 мая 2017 г.
- ^ Ормонд, Джим. «Премия ACM в области вычислений присуждена разработчику AlphaGo: Дэвид Сильвер отмечен за выдающиеся достижения в области компьютерных игр» . acm.org . Проверено 2 апреля 2020 г.
- ^ «Королевское общество выбирает новых выдающихся членов и иностранных членов» . royalsociety.org . Проверено 8 июня 2021 г.
- ^ «Избранные члены AAAI» . АААИ . Проверено 3 января 2024 г.