AlphaGo против Ли Седоля
Сеул , Южная Корея , 9–15 марта 2016 г. | |
---|---|
Игра первая | АльфаГо W+R |
Игра вторая | АльфаГо Б+Р |
Игра третья | АльфаГо W+R |
Игра четвертая | Ли Седоль W+R |
Игра пятая | АльфаГо W+R |
AlphaGo против Ли Седоля , также известный как DeepMind Challenge Match , — это матч из пяти игр в го между лучшим игроком в го Ли Седолем и AlphaGo , компьютерной программой го , разработанной DeepMind , который проходил в Сеуле , Южная Корея, с 9 по 15 марта 2016 года. AlphaGo выиграла все игры, кроме четвертой; [1] все игры были выиграны путем отставки. [2] Матч сравнивают с историческим шахматным матчем между Deep Blue и Гарри Каспаровым в 1997 году.
Победитель матча должен был выиграть 1 миллион долларов. Поскольку AlphaGo победила, компания Google DeepMind заявила, что приз будет передан благотворительным организациям, включая ЮНИСЕФ и организации Go . [3] Ли получил 170 000 долларов (150 000 долларов за участие в пяти играх и еще 20 000 долларов за победу в одной игре). [4]
После матча Корейская ассоциация бадук наградила AlphaGo высшим званием гроссмейстера го – «почетный 9 дан ». Награда была вручена в знак признания «искренних усилий» AlphaGo по освоению го. [5] этот матч был выбран журналом Science как один из занявших второе место в номинации «Прорыв года» . 22 декабря 2016 года [6]
Фон
[ редактировать ]Сложная задача в области искусственного интеллекта
[ редактировать ]Внешние видео | |
---|---|
Машина тренирует себя, чтобы побеждать людей в самой сложной игре в мире, Retro Report , 2:51, Retro Report [7] |
Го — сложная настольная игра, требующая интуиции, творческого и стратегического мышления. [8] [9] Это уже давно считается сложной задачей в области искусственного интеллекта (ИИ), но она значительно сложнее. [10] решить, чем шахматы . Многие в области искусственного интеллекта считают, что в Го требуется больше элементов, имитирующих человеческое мышление, чем в шахматах . [11] Математик И. Дж. Гуд писал в 1965 году: [12]
Зайти за компьютер? – Чтобы запрограммировать компьютер для разумной игры в го, а не просто для легальной игры, необходимо формализовать принципы хорошей стратегии или разработать программу обучения. Принципы более качественные и загадочные, чем в шахматах, и больше зависят от суждения. Поэтому я думаю, что запрограммировать компьютер для разумной игры в го будет еще сложнее, чем для игры в шахматы.
До 2015 года [13] лучшим программам Го удавалось достичь только любительского уровня. [14] На маленькой доске 9×9 компьютер работал лучше, и некоторым программам удалось выиграть часть игр 9×9 у профессиональных игроков. До AlphaGo некоторые исследователи утверждали, что компьютеры никогда не смогут победить лучших людей в Го. [15] Илон Маск , один из первых инвесторов Deepmind, сказал в 2016 году, что эксперты в этой области считали, что ИИ находится в 10 годах от победы над ведущим профессиональным игроком в го. [16]
Матч AlphaGo против Ли Седоля можно сравнить с шахматным матчем 1997 года, когда Гарри Каспаров проиграл компьютеру IBM Deep Blue . Поражение Каспарова от Deep Blue считается моментом, когда компьютер стал лучше человека в шахматах. [17]
AlphaGo существенно отличается от предыдущих проектов в области искусственного интеллекта. Вместо использования вероятностных алгоритмов, жестко закодированных программистами-людьми, AlphaGo использует нейронные сети для оценки вероятности выигрыша. AlphaGo получает доступ и анализирует всю онлайн-библиотеку Go; включая все матчи, игроков, аналитику и литературу; а также игры, в которые AlphaGo играет против себя и других игроков. После установки AlphaGo не зависит от команды разработчиков и определяет лучший путь к решению Го (т. е. к победе в игре). Используя нейронные сети и поиск по дереву Монте-Карло , AlphaGo вычисляет колоссальное количество вероятных и маловероятных вероятностей, многие из которых перемещаются в будущее. [ нужна ссылка ] .
Результаты соответствующих исследований применяются в таких областях, как когнитивная наука , распознавание образов и машинное обучение . [18] : 150
Матч против Фань Хуэя
[ редактировать ]AlphaGo победила чемпиона Европы Фань Хуэя , профессионала с 2 даном, со счетом 5:0 в октябре 2015 года. Впервые ИИ обыграл профессионального игрока-человека в игре на полноразмерной доске без гандикапа. [19] [20] Некоторые комментаторы подчеркнули пропасть между Фаном и Ли, имеющим 9-й профессиональный дан. [21] Компьютерные программы Zen и Crazy Stone ранее побеждали игроков-людей с рейтингом 9 данов среди профессионалов с гандикапом в четыре или пять камней. [22] [23] Канадский специалист по искусственному интеллекту Джонатан Шеффер , комментируя победу над Fan, сравнил AlphaGo с «вундеркиндом», которому не хватало опыта, и посчитал, что «настоящее достижение будет тогда, когда программа будет играть с игроком настоящего высшего эшелона». Тогда он считал, что Ли выиграет матч в марте 2016 года. [20] Хаджин Ли , профессиональный игрок в го и генеральный секретарь Международной федерации го , отметила, что она «очень взволнована» перспективой того, что ИИ бросит вызов Ли, и считает, что у двух игроков равные шансы на победу. [20]
После матча против AlphaGo Фань Хуэй отметил, что игра научила его быть лучшим игроком и видеть то, чего он раньше не видел. К марту 2016 года Wired сообщил, что его рейтинг в мире поднялся с 633-го места примерно до 300-го. [24]
Подготовка
[ редактировать ]Эксперты Го обнаружили ошибки в игре AlphaGo против Fan, в частности, связанные с недостаточной осведомленностью всей доски. До игры с Ли было неизвестно, насколько программа улучшила свою игру со времени октябрьского матча. [21] [25] Исходный набор тренировочных данных AlphaGo начинался с игр сильных игроков-любителей с интернет-серверов го, после чего AlphaGo тренировалась, играя против себя в течение десятков миллионов игр. [26] [27]
Игроки
[ редактировать ]АльфаГо
[ редактировать ]AlphaGo — компьютерная программа, разработанная Google DeepMind для настольной игры Го . Алгоритм AlphaGo использует комбинацию машинного обучения и методов поиска по дереву в сочетании с обширным обучением как на людях, так и на компьютере. Нейронные сети системы изначально были созданы на основе человеческого опыта игрового процесса. Первоначально AlphaGo была обучена имитировать человеческую игру, пытаясь сопоставить ходы опытных игроков из записанных исторических игр, используя базу данных KGS Go Server, содержащую около 30 миллионов ходов из 160 000 игр, сделанных игроками-людьми с 6-9 данами KGS. [13] [28] Как только он достиг определенного уровня мастерства, его обучали дальше, заставляя играть в большое количество игр против других экземпляров самого себя, используя обучение с подкреплением для улучшения своей игры. [29] Система не использует «базу данных» ходов для игры. Как объяснил один из создателей AlphaGo: [30]
Хотя мы запрограммировали эту машину на игру, мы понятия не имеем, какие ходы она будет делать. Его движения являются новым явлением в результате тренировок. Мы просто создаем наборы данных и алгоритмы обучения. Но ходы, которые он затем придумывает, находятся вне нашей власти — и гораздо лучше, чем мы, игроки в го, могли бы придумать.
В матче против Ли AlphaGo использовала примерно ту же вычислительную мощность, что и в матче против Фань Хуэя. [31] где использовалось 1202 процессора и 176 графических процессоров . [13] The Economist сообщил, что он использовал 1920 процессоров и 280 графических процессоров. [32] Google также заявила, что ее фирменные тензорные процессоры . в матче против Ли Седоля использовались [33]
Ли Седол
[ редактировать ]Ли Седоль – профессиональный игрок в го, 9 дан. [34] и является одним из сильнейших игроков в истории го . Он начал свою карьеру в 1996 году (получил профессиональный дан в возрасте 12 лет), выиграв с тех пор 18 международных титулов. [35] Он «национальный герой» в своей родной Южной Корее, известный своей нетрадиционной и творческой игрой. [36] Ли Седоль изначально предсказал, что победит AlphaGo с «полным перевесом». [36] За несколько недель до матча он выиграл Кореи Мёнгин . крупный чемпионат [37]
Игры
[ редактировать ]Матч состоял из пяти игр с главным призом в один миллион долларов США. [3] по китайским правилам 7,5 баллов с коми . [4] Для каждой игры был установлен двухчасовой лимит времени для каждого игрока, за которым следовали три 60-секундных дополнительных периода байоми . [4] Каждая игра начиналась в 13:00 по корейскому времени (04:00 по Гринвичу ). [38]
Матч проходил в отеле Four Seasons в Сеуле , Южная Корея, в марте 2016 года и транслировался в прямом эфире с комментариями; комментарии на английском языке подготовили Майкл Редмонд (профессионал с 9 даном) и Крис Гарлок. [39] [40] [41] Аджа Хуанг , член команды DeepMind и игрок в го-любитель с 6 даном, разместил камни на доске для го для AlphaGo, которая работала через облачную платформу Google с сервером, расположенным в США. [42]
Краткое содержание
[ редактировать ]Игра | Дата | Черный | Белый | Результат | Ходы |
---|---|---|---|---|---|
1 | 9 марта 2016 г. | Ли Седол | АльфаГо | Ли Седоль подал в отставку | 186 Игра 1 |
2 | 10 марта 2016 г. | АльфаГо | Ли Седол | Ли Седоль подал в отставку | 211 Игра 2 |
3 | 12 марта 2016 г. | Ли Седол | АльфаГо | Ли Седоль подал в отставку | 176 Игра 3 |
4 | 13 марта 2016 г. | АльфаГо | Ли Седол | AlphaGo подала в отставку | 180 Игра 4 |
5 | 15 марта 2016 г. | Ли Седол [примечание 1] | АльфаГо | Ли Седоль подал в отставку | 280 Игра 5 |
Результат: AlphaGo 4 – 1 Ли Седол | |||||
^ примечание 1: В пятой игре, согласно официальным правилам, предполагалось, что назначение цветов будет производиться случайным образом. [43] Однако во время пресс-конференции после четвертого матча Ли спросил: «… поскольку я выиграл белыми, я очень надеюсь, что в пятом матче я смогу выиграть черными, потому что победа черными гораздо более ценна». [44] Хассабис согласился позволить Седолю играть черными. |
Игра 1
[ редактировать ]AlphaGo (белые) выиграла первую игру. Ли, казалось, контролировал ситуацию на протяжении большей части матча, но AlphaGo получила преимущество в последние 20 минут, и Ли сдался. [45] Ли впоследствии заявил, что допустил критическую ошибку в начале матча; он сказал, что стратегия компьютера в начале игры была «превосходной» и что ИИ сделал один необычный ход, который не сделал бы ни один игрок в го-человек. [45] Дэвид Ормерод, комментируя игру на сайте Go Game Guru, охарактеризовал седьмой камень Ли как «странный ход для проверки силы AlphaGo в дебюте», охарактеризовав этот ход как ошибку, а ответ AlphaGo как «точный и эффективный». Он описал позицию AlphaGo в первой части игры как благоприятную, учитывая, что Ли начал возвращаться с хода 81, прежде чем сделать «сомнительные» ходы на 119 и 123, за которыми последовал «проигрышный» ход на 129. [46] Профессиональный игрок в го Чо Хансын отметил, что игра AlphaGo значительно улучшилась по сравнению с победой над Fan Hui в октябре 2015 года. [46] Майкл Редмонд охарактеризовал игру компьютера как более агрессивную, чем против Фана. [47]
По словам гроссмейстера го Ким Сон Рёна, обладателя 9 дана, Ли, казалось, был ошеломлен сильной игрой AlphaGo на 102-м камне. [48] Увидев, как AlphaGo делает 102-й ход в игре, Ли более 10 минут обдумывал свои варианты. [48]
Первые 99 ходов |
Ходы 100–186 |
Игра 2
[ редактировать ]AlphaGo (черная) выиграла вторую игру. Ли впоследствии заявил, что «AlphaGo сыграла почти идеальную игру». [49] «С самого начала игры у меня не было ощущения, что я лидирую». [50] Один из создателей AlphaGo Демис Хассабис рассказал, что система была уверена в победе с середины игры, хотя профессиональные комментаторы не могли сказать, какой игрок впереди. [50]
Майкл Редмонд ( 9p ) отметил, что 19-й камень AlphaGo (ход 37) был «творческим» и «уникальным». Это был шаг, который ни один человек никогда бы не сделал. [30] Ли потребовалось необычно много времени, чтобы отреагировать на этот шаг. [30] Янггил (8p) назвал 37-й ход AlphaGo «редким и интригующим ударом в плечо», но сказал, что контрудар Ли был «изысканным». Он заявил, что перед финалом контроль между игроками несколько раз переходил между игроками, и особенно похвалил ходы AlphaGo 151, 157 и 159, назвав их «блестящими». [51]
AlphaGo продемонстрировала аномалии и ходы с более широкой точки зрения, которые профессиональные игроки в го описывали как ошибки на первый взгляд, но в ретроспективе как преднамеренную стратегию. [52] Как объяснил один из создателей системы, AlphaGo не пытается максимизировать свои очки или преимущество в победе, а пытается максимизировать вероятность выигрыша. [30] [53] Если AlphaGo придется выбирать между сценарием, в котором она выиграет с разницей в 20 очков с вероятностью 80 процентов, и сценарием, в котором она выиграет с разницей в полтора очка с вероятностью 99 процентов, она выберет последний вариант, даже если ей придется отказаться от очков, чтобы достичь цели. это. [30] В частности, ход 167 AlphaGo, казалось, давал Ли шанс на борьбу и был объявлен комментаторами очевидной ошибкой. Ан Ёнгил сказал: «Значит, когда AlphaGo делает вялый на вид ход, мы можем расценивать это как ошибку, но, возможно, точнее это следует рассматривать как объявление победы?» [54]
Первые 99 ходов |
Ходы 100–199 |
Ходы 200–211 |
Игра 3
[ редактировать ]AlphaGo (белые) выиграла третью игру. [55]
После второй игры среди игроков все еще были сильные сомнения, действительно ли AlphaGo был сильным игроком в том смысле, в котором мог бы быть человек. Третья игра была описана как развеявшая это сомнение; аналитики отмечают, что:
AlphaGo победила настолько убедительно, что из умов опытных игроков исчезли все сомнения в ее силе. На самом деле, оно играло так хорошо, что было почти страшно... Заставив AlphaGo выдержать очень жестокую, одностороннюю атаку, Ли раскрыл свою доселе необнаруженную силу... Ли не получал достаточной прибыли от своей атаки.. Один из величайших виртуозов миттельшпиля только что был отодвинут на второй план в черно-белой ясности. [54]
По словам Ан Янггила (8p) и Дэвида Ормерода, игра показала, что «AlphaGo просто сильнее любого известного игрока в го-человека». [54] Было замечено, что AlphaGo умело ориентируется в сложных ситуациях, известных как ко , которые не возникали в двух предыдущих матчах. [56] Ан и Ормерод считают ход 148 особенно примечательным: в середине сложного боя с нокаутом AlphaGo продемонстрировала достаточную «уверенность» в том, что выигрывает бой, чтобы сделать большой ход в другом месте. [54]
Ли, играя черными, начал игру с высококитайской формации и создал большую зону влияния черных, в которую AlphaGo вторглась на 12-м ходу. Это потребовало от программы защиты слабой группы, что она и сделала успешно. [54] Ан Ёнгил назвал 31-й ход Ли, возможно, «проигрышным». [54] и Энди Джексон из Американской ассоциации го считали, что исход уже решен 35-м ходом. [53] AlphaGo получила контроль над игрой на 48-м ходу и вынудила Ли перейти в оборону. Ли контратаковал ходами 77/79, но ответ AlphaGo был эффективен, и ход 90 позволил упростить позицию. Затем он получил большую зону контроля внизу доски, укрепив свою позицию ходами со 102 по 112, которые Ан назвал «сложными». [54] Ли снова атаковал на 115 и 125 ходах, но ответ AlphaGo снова оказался эффективным. В конце концов Ли попытался выполнить сложное ко со 131-го хода, не вызвав ошибки в программе, и сдался на 176-м ходу. [54]
Первые 99 ходов |
Ходы 100–176 (122 по 113, 154 в , 163 и 145, 164 и 151, 166 и 171 в 160, 169 в 145, 175 в ) |
Игра 4
[ редактировать ]Ли (белый) выиграл четвертую игру. Ли решил использовать тип экстремальной стратегии, известный как амаси , в ответ на очевидное предпочтение AlphaGo к Соуба Го (попытка выиграть с большим небольшим выигрышем, когда появляется возможность), захватывая территорию по периметру, а не в центре. [57] При этом его очевидной целью было создать ситуацию в стиле «все или ничего» - возможную слабость для противника, сильного в переговорных типах игры, и которая могла бы сделать способность AlphaGo определять небольшие преимущества в значительной степени неактуальной. [57]
Первые 11 ходов были идентичны второй партии, где Ли тоже играл белыми. В начале игры Ли сосредоточился на захвате территории по краям и углам доски, позволяя AlphaGo получить влияние наверху и в центре. Затем Ли вторгся в зону влияния AlphaGo наверху ходами с 40 по 48, следуя стратегии амаши . AlphaGo ответила ударом в плечо на 47-м ходу, впоследствии пожертвовав четыре камня в другом месте и получив инициативу ходами с 47 по 53 и 69. Ли протестировал AlphaGo ходами с 72 по 76, не вызвав ошибки, и к этому моменту комментаторы игры уже начал чувствовать, что игра Ли безнадежна. Однако неожиданная игра ходом белых 78, названная «блестящим тэсудзи », перевернула игру. [57] В результате этого хода в центре образовался белый клин, что увеличило сложность игры. [58] Гу Ли (9р) назвал это « божественным ходом » и заявил, что этот ход был им совершенно непредвиден. [57]
AlphaGo плохо отреагировала на 79-й ход, когда, по ее оценкам, ее шансы на победу составляли 70%. Ли сделал сильный ход ходом белых 82. [57] Первоначальная реакция AlphaGo на ходах с 83 по 85 была адекватной, но на 87-м ходу ее оценка шансов на победу внезапно резко упала. [59] [ нужен неосновной источник ] [60] [ нужен неосновной источник ] спровоцировав его на серию очень плохих ходов от хода черных 87 к 101. Дэвид Ормерод охарактеризовал ходы с 87 по 101 как типичные ошибки программы Монте-Карло. [57] Ли повел ходом белых 92, а Ан Ёнгил назвал ход 105 черными последним проигрышным ходом. Несмотря на хорошую тактику на ходах со 131 по 141, AlphaGo не смогла восстановиться в эндшпиле и сдалась. [57] Отставка AlphaGo была вызвана тем, что она оценила свои шансы на победу менее 20%; это призвано соответствовать решению профессионалов, которые скорее уходят в отставку, чем играют до конца, когда их положение кажется безвозвратным. [58]
Ёнгил из Go Game Guru пришел к выводу, что эта игра была «шедевром для Ли Седоля и почти наверняка станет знаменитой игрой в истории го». [57] Ли прокомментировал после матча, что, по его мнению, AlphaGo была сильнейшей при игре белыми (вторая). [61] По этой причине он попросил в пятой партии сыграть черными, что считается более рискованным.
Дэвид Ормерод из Go Game Guru заявил, что, хотя анализ игры AlphaGo в районе 79–87 еще не был доступен, он полагал, что это результат известной слабости игровых алгоритмов, которые используют поиск по дереву Монте-Карло . По сути, поиск пытается отсеять менее релевантные последовательности. В некоторых случаях игра может привести к очень специфической линии игры, которая важна, но которую упускают из виду при обрезке дерева, и поэтому этот результат «с радара поиска». [62]
Первые 99 ходов |
Ходы 100–180 (177 в , 178 в ) |
Игра 5
[ редактировать ]AlphaGo (белые) выиграла пятую игру. [63] Игра была описана как близкая. Хассабис заявил, что результат появился после того, как программа допустила «серьезную ошибку» в начале игры. [63]
Ли, играя черными, начал игру так же, как и в первой партии, а затем начал застолбить территорию в правом и верхнем левом углах – стратегия, аналогичная той, которую он успешно применил в четвертой игре – в то время как AlphaGo получила влияние в центре доска. Игра оставалась равной до тех пор, пока белые не сделали ход 48 на 58, который AlphaGo сыграла в правом нижнем углу. Эти ходы без необходимости лишили ко угроз и аджи, позволив Ли взять на себя инициативу. [64] Майкл Редмонд (9p) предположил, что, возможно, AlphaGo пропустила «сжатие надгробия» черных тэсудзи . Людей учат распознавать конкретный шаблон, но это длинная последовательность ходов, если ее приходится вычислять с нуля.
Затем AlphaGo начала развивать верхнюю часть доски, а также центр, и успешно защитилась от атаки Ли на ходах с 69 по 81, которую Дэвид Ормерод охарактеризовал как чрезмерно осторожную. К ходу белых 90 AlphaGo восстановила равенство, а затем сыграла серию ходов, которые Ормерод назвал «необычными... но слегка впечатляющими», что дало небольшое преимущество. Ли попробовал пас «Радуйся, Мария» ходами 167 и 169, но защита AlphaGo оказалась успешной. Ан Янггил отметил, что ходы белых 154, 186 и 194 особенно сильны, и программа сыграла безупречный эндшпиль, сохраняя лидерство до тех пор, пока Ли не ушел в отставку. [64]
Первые 99 ходов |
Ходы 100–199 (118 на 107, 161 на ) |
Ходы 200–280 (240 на 200, 271 на 200). , 275 в , 276 в ) |
Покрытие
[ редактировать ]Прямая трансляция игр и соответствующие комментарии транслировались на корейском, китайском, японском и английском языках. Репортаж на корейском языке велся через Baduk TV. [65] Репортаж первой игры на китайском языке с комментариями игроков 9 дана Гу Ли и Кэ Цзе был предоставлен Tencent и LeTV соответственно, и его посмотрели около 60 миллионов зрителей. [66] Онлайн-освещение на английском языке, представленное обладателем 9 дана США Майклом Редмондом и Крисом Гарлоком, вице-президентом Американской ассоциации го , достигло в среднем 80 тысяч зрителей с пиком в 100 тысяч зрителей ближе к концу первой игры. [67]
Ответы
[ редактировать ]ИИ-сообщество
[ редактировать ]Победа AlphaGo стала важной вехой в исследованиях искусственного интеллекта. [68] Раньше Go считался сложной задачей в машинном обучении, которая, как ожидалось, была недоступна для технологий того времени. [68] [69] [70] Большинство экспертов считали, что до появления такой мощной программы Go, как AlphaGo, осталось как минимум пять лет; [71] некоторые эксперты считали, что пройдет как минимум еще десять лет, прежде чем компьютеры победят чемпионов по го. [72] [73] Большинство наблюдателей в начале матчей 2016 года ожидали, что Ли победит AlphaGo. [68]
Поскольку такие игры, как шашки, шахматы, а теперь и го, выигрывают компьютерные игроки, победы в популярных настольных играх больше не могут служить важными вехами для искусственного интеллекта, как это было раньше. Deep Blue из Мюррей Кэмпбелл назвал победу AlphaGo «концом эпохи… настольные игры более или менее закончены, и пришло время двигаться дальше». [68]
По сравнению с Deep Blue или Watson , лежащие в его основе алгоритмы AlphaGo потенциально более универсальны и могут свидетельствовать о том, что научное сообщество добивается прогресса в направлении искусственного общего интеллекта . [74] Некоторые комментаторы полагают, что победа AlphaGo дает обществу хорошую возможность начать обсуждение подготовки к возможному будущему влиянию машин с интеллектом общего назначения . В марте 2016 года исследователь ИИ Стюарт Рассел заявил, что «методы ИИ развиваются гораздо быстрее, чем ожидалось, (что) делает вопрос о долгосрочных результатах более актуальным», добавив, что «чтобы гарантировать, что все более мощные системы ИИ остаются полностью под контролем человека... предстоит много работы». [75] Некоторые ученые, такие как физик Стивен Хокинг , предупреждают, что некоторые будущие самосовершенствующиеся ИИ могут обрести настоящий общий интеллект, что приведет к неожиданному захвату власти ИИ ; другие учёные с этим не согласны: эксперт по искусственному интеллекту Жан-Габриэль Ганасия считает, что «такие вещи, как «здравый смысл»… невозможно воспроизвести», [76] [77] и говорит: «Я не понимаю, зачем нам говорить о страхах. Напротив, это вселяет надежды во многих областях, таких как здравоохранение и освоение космоса». [75] Ричард Саттон сказал: «Я не думаю, что людям следует бояться… но я думаю, что люди должны обращать внимание». [78]
Команда DeepMind AlphaGo получила первую медаль IJCAI Марвина Мински за выдающиеся достижения в области искусственного интеллекта. «AlphaGo — это замечательное достижение и прекрасный пример признания медали Мински», — сказал профессор Майкл Вулдридж , председатель комитета по наградам IJCAI. «Что особенно впечатлило IJCAI, так это то, что AlphaGo достигает своих целей благодаря блестящему сочетанию классических методов искусственного интеллекта и новейших методов машинного обучения, с которыми DeepMind так тесно связан. Это захватывающая дух демонстрация современного искусственного интеллекта. и мы рады возможности отметить это этой наградой». [79]
Перейти к сообществу
[ редактировать ]Го — популярная игра в Южной Корее, Китае и Японии, и этот матч смотрели и анализировали миллионы людей по всему миру. [68] Многие ведущие игроки в го охарактеризовали неортодоксальные ходы AlphaGo как, казалось бы, сомнительные ходы, которые поначалу сбивали с толку зрителей, но, оглядываясь назад, обрели смысл: [72] «Все игроки в го, кроме самых лучших, создают свой стиль, подражая лучшим игрокам. Кажется, что у AlphaGo есть совершенно оригинальные ходы, которые она создает сама». [68] AlphaGo неожиданно стала намного сильнее, даже по сравнению с матчем против Фань Хуэй в октябре 2015 года. [80] где компьютер впервые обыграл профессионала го без преимущества гандикапа. [81]
Игрок номер один в Китае Кэ Цзе , который в то время был лучшим игроком в мире, первоначально утверждал, что сможет победить AlphaGo, но отказался играть против него, опасаясь, что он «копирует мой стиль». [82] По ходу матчей Кэ Цзе ходил взад и вперед, заявляя, что «весьма вероятно, что я (могу) проиграть» после анализа первых трех матчей. [83] но вновь обретает уверенность после четвертого матча. [84]
Тоби Мэннинг, судья матча AlphaGo против Фань Хуэя, и Хаджин Ли, генеральный секретарь Международной федерации го , считают, что в будущем игроки в го получат помощь от компьютеров, чтобы узнать, что они сделали неправильно в играх, и улучшить свои навыки. навыки. [81]
Ли извинился за свои поражения, заявив после третьей игры, что «я недооценил возможности AlphaGo и почувствовал себя бессильным». [68] Он подчеркнул, что это поражение было «поражением Ли Се Доля», а «не поражением человечества». [77] [85] Ли сказал, что его окончательная потеря от машины была «неизбежной», но заявил, что «роботы никогда не поймут красоту игры так, как мы, люди». [77] Ли назвал свою победу в четвертой игре «бесценной победой, которую я (не променяю) ни на что». [85]
Правительство
[ редактировать ]В ответ на этот матч правительство Южной Кореи объявило 17 марта 2016 года, что в течение следующих пяти лет инвестирует 1 триллион вон (863 миллиона долларов США) в исследования в области искусственного интеллекта (ИИ). [86]
В СМИ
[ редактировать ]В 2017 году был снят отмеченный наградами документальный фильм о матчах «АльфаГо» . [87] [88] 13 марта 2020 года фильм был доступен бесплатно онлайн на YouTube-канале DeepMind. [89]
Матчи были показаны в романе Бенджамина Лабатута 2023 года «МАНИАК» . [90] [91]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Искусственный интеллект: мастер го Ли Седол побеждает программу AlphaGo» . Новости BBC онлайн . 13 марта 2016 года . Проверено 13 марта 2016 г.
- ^ «Компьютер Гоу» . Иди, гуру игры. Архивировано из оригинала 14 марта 2016 года . Проверено 13 марта 2016 г.
- ^ Jump up to: а б «Человек-чемпион уверен, что победит ИИ в древней китайской игре» . Ассошиэйтед Пресс. 22 февраля 2016 г. Архивировано из оригинала 22 декабря 2018 г. Проверено 22 февраля 2016 г.
- ^ Jump up to: а б с «Ли Седоль против AlphaGo, состоялась пресс-конференция «Google DeepMind Challenge Match»» (на корейском языке). Корейская ассоциация бадук . 22 февраля 2016 г. Архивировано из оригинала 3 марта 2016 г. . Проверено 22 февраля 2016 г.
- ^ «Google AlphaGo получает «божественный» рейтинг в го» . «Стрейтс Таймс» . 15 марта 2016 г.
- ^ «От искусственного интеллекта к сворачиванию белка: наш прорыв, занявший второе место» . Наука . 22 декабря 2016 года . Проверено 30 декабря 2016 г.
- ^ «Машина тренируется побеждать людей в самой сложной игре в мире» . Ретро-отчет . 10 марта 2016 г. Архивировано из оригинала 20 декабря 2016 г. Проверено 15 декабря 2016 г. .
- ^ «ИИ Google выиграл первую игру в историческом матче с чемпионом по го» . ПРОВОДНОЙ . 9 марта 2016 г.
- ^ «AlphaGo снова победила» . «Корея Таймс» . 11 марта 2016 года . Проверено 16 марта 2016 г.
- ^ Бузи, Бруно; Казенав, Тристан (9 августа 2001 г.). «Computer Go: опрос, ориентированный на искусственный интеллект». Искусственный интеллект . 132 (1): 39–103. дои : 10.1016/S0004-3702(01)00127-8 .
- ^ Джонсон, Джордж (29 июля 1997 г.), «Чтобы протестировать мощный компьютер, сыграйте в древнюю игру» , The New York Times , получено 16 июня 2008 г.
- ^ Хорошо, IJ (21 января 1965 г.). «Иди, Джек Гуд» . Новый учёный . Проверено 16 марта 2016 г. - через компьютерную лабораторию Атлас, Чилтон.
- ^ Jump up to: а б с Сильвер, Дэвид ; Хуанг, Аджа ; Мэддисон, Крис Дж.; Гез, Артур; Сифре, Лоран; Дрессе, Джордж ван ден; Шритвизер, Джулиан; Антоноглу, Иоаннис; Паннеершелвам, Веда; Ланкто, Марк; Дилеман, Сандер; Греве, Доминик; Нхам, Джон; Кальхбреннер, Нал; Суцкевер, Илия ; Лилликрап, Тимоти; Лич, Мадлен; Кавукчуоглу, Корай; Грепель, Торе; Хассабис, Демис (28 января 2016 г.). «Освоение игры в го с помощью глубоких нейронных сетей и поиска по дереву». Природа . 529 (7587): 484–489. Бибкод : 2016Natur.529..484S . дои : 10.1038/nature16961 . ISSN 0028-0836 . ПМИД 26819042 . S2CID 515925 .
- ^ Уэдд, Ник. «Задачи человеко-компьютерного взаимодействия» . компьютер-go.info . Проверено 28 октября 2011 г.
- ^ Чо, Адриан (27 января 2016 г.). « Огромный скачок вперед»: компьютер, имитирующий человеческий мозг, побеждает профессионала в игре в го» . Наука .
- ^ Хоффман, Уильям (9 марта 2016 г.). «Илон Маск говорит, что победа Google Deepmind Go — это 10-летний скачок для ИИ» Обратное . Проверено 12 марта 2016 г.
- ^ «Искусственный интеллект: AlphaGo от Google превосходит мастера го Ли Се Доля» . Новости Би-би-си . 12 марта 2016 г.
- ^ Мюллер, Мартин (январь 2002 г.). «Компьютер Гоу». Искусственный интеллект . 134 (1–2): 145–179. дои : 10.1016/S0004-3702(01)00121-7 .
- ^ «Google добилась «прорыва» в области искусственного интеллекта, победив чемпиона по го» . Новости Би-би-си . 27 января 2016 года . Проверено 28 января 2016 г.
- ^ Jump up to: а б с Гибни, Элизабет (27 января 2016 г.), «Игроки в го реагируют на поражение компьютера» , Nature , doi : 10.1038/nature.2016.19255 , S2CID 146868978
- ^ Jump up to: а б Маккензи, Дана (9 марта 2016 г.). «Обновление: почему матч «человек против машины» на этой неделе не имеет значения (и что имеет значение)» . Наука . дои : 10.1126/science.aaf4152 .
- ^ «Программа Zen Computer Go побеждает Такемию Масаки всего с 4 камнями!» . Иди, гуру игры. Архивировано из оригинала 1 февраля 2016 года . Проверено 28 января 2016 г.
- ^ «Сила любителя с 6 даном. Он может быть гением». Игрок в го проигрывает компьютеру в первом официальном матче» Архивировано из оригинала 24 марта . 2013 г. .
- ^ «Печаль и красота наблюдения за игрой Google AI Play Go» . ПРОВОДНОЙ . 11 марта 2016 г.
- ^ Клостер, Бен (4 марта 2016 г.). «Сможет ли AlphaGo победить Ли Седоля?» . Иди, гуру игры. Архивировано из оригинала 11 марта 2016 года . Проверено 10 марта 2016 г.
- ^ «Матч 4 — Матч Google DeepMind Challenge: Ли Седол против AlphaGo» . Ютуб . 13 марта 2016 г. Событие происходит в 6:09:35-6:11:20 . Проверено 24 марта 2016 г.
- ^ «Матч 3 — Матч Google DeepMind Challenge: Ли Седоль против AlphaGo» . Ютуб . 12 марта 2016 года . Проверено 20 марта 2016 г.
- ^ Мец, Кейд (27 января 2016 г.). «В ходе крупного прорыва в области искусственного интеллекта система Google тайно обыграла лучшего игрока в древней игре го» . ПРОВОДНОЙ . Проверено 1 февраля 2016 года .
- ^ «Исследовательский блог: AlphaGo: освоение древней игры го с помощью машинного обучения» . Блог исследований Google . 27 января 2016 г.
- ^ Jump up to: а б с д и «ИИ Google выиграл решающую вторую игру в матче с гроссмейстером го» . ПРОВОДНОЙ . 10 марта 2016 г. Проверено 12 марта 2016 г.
- ^ Хассабис, Демис [@demishassabis] (11 марта 2016 г.). «Мы используем примерно такое же количество вычислительной мощности, как и в матче с Фань Хуэй: распределение поиска по другим машинам приводит к уменьшению отдачи» ( Твит ) . Проверено 14 марта 2016 г. - через Twitter .
- ^ «Разборки» . Экономист . 12 марта 2016 года . Проверено 19 ноября 2016 г.
- ^ Жуппи, Норм (18 мая 2016 г.). «Google усложняет задачи машинного обучения с помощью специального чипа TPU» . Блог об облачной платформе Google . Проверено 26 июня 2016 г.
- ^ Ли Седоль . gobase.org. Проверено 22 июня 2010 г.
- ^ «Ли Седоль ожидает «непростой» игры с AlphaGo в матче третьего го» . Шанхай Дейли .
- ^ Jump up to: а б Застроу, Марк. « Я в шоке!» Как ИИ победил лучшего человека в мире в Го» . Новый учёный .
- ^ «Комментарий Go: Ли Седоль против Пак Чон Хвана – 43-й финал Мёнина, игра 4» . Иди, гуру игры. Архивировано из оригинала 3 мая 2016 года . Проверено 13 марта 2016 г.
- ^ «АльфаГо» . Гугл ДипМайнд. Архивировано из оригинала 30 января 2016 года . Проверено 10 марта 2016 г.
- ^ «ИИ AlphaGo от Google сразится с первой ракеткой мира Ли Седолем в прямой трансляции» . Хранитель . 5 февраля 2016 года . Проверено 15 февраля 2016 г. .
- ^ «Google DeepMind собирается сразиться с лучшим в мире игроком в го в роскошном 5-звездочном отеле в Южной Корее» . Бизнес-инсайдер . 22 февраля 2016 года . Проверено 23 февраля 2016 г.
- ^ Новет, Иордания (4 февраля 2016 г.). «В марте YouTube проведет прямую трансляцию игры искусственного интеллекта Google, играющей суперзвезду го Ли Седоля» . ВенчурБит . Проверено 7 февраля 2016 г.
- ^ «Ли Седол: Alpha Go все равно может победить, даже если ее обновят» (на китайском языке) Джун Ан Ильбо , 23 февраля 2016 г. , дата обращения 24 февраля 2016 г.
- ^ «Почему финальная игра между AlphaGo и Ли Седолем имеет такое большое значение для человечества» . Проводной . 14 марта 2016 года . Проверено 18 марта 2016 г.
- ^ «Матч 4 — Матч Google DeepMind Challenge: Ли Седол против AlphaGo» . ДипМайнд.
- ^ Jump up to: а б «ИИ Google обыграл чемпиона мира по го в первом из пяти матчей» . Би-би-си. 9 марта 2016 года . Проверено 9 марта 2016 г.
- ^ Jump up to: а б «AlphaGo побеждает Ли Седоля в первой игре исторического матча человек против машины» . Иди, гуру игры. 9 марта 2016 г. Архивировано из оригинала 3 мая 2016 г. . Проверено 9 марта 2016 г.
- ^ Шуар, Танги (9 марта 2016 г.). «Файлы го: компьютер с искусственным интеллектом выигрывает первый матч у мастера-игрока в го» . Природа . дои : 10.1038/nature.2016.19544 . S2CID 180287588 .
- ^ Jump up to: а б «Удивленный своим поражением, Ли Седоль говорит, что с нетерпением ждет еще одного шанса» . Ханкёре .
- ^ «Google AI выиграл вторую игру в го у чемпиона мира» . Би-би-си. 10 марта 2016 г. Проверено 10 марта 2016 г.
- ^ Jump up to: а б Байфорд, Сэм (10 марта 2016 г.). «Google DeepMind снова обыграл Ли Се Доля и поднялся со счетом 2:0 в исторической серии го» . Грань .
- ^ Ормерод, Дэвид (10 марта 2016 г.). «AlphaGo вырывается вперед со счетом 2:0 против Ли Седоля» . Иди, гуру игры. Архивировано из оригинала 11 марта 2016 года . Проверено 11 марта 2016 г.
- ^ «Ли Седоль ожидает «непростой» игры с AlphaGo в матче третьего го» . Шанхай Дейли . 10 марта 2016 г. Проверено 10 марта 2016 г.
- ^ Jump up to: а б Шуар, Танги (12 марта 2016 г.). «Файлы го: компьютер с искусственным интеллектом одерживает победу над чемпионом по го» . Природа . дои : 10.1038/nature.2016.19553 . S2CID 155164502 .
- ^ Jump up to: а б с д и ж г час Ормерод, Дэвид (12 марта 2016 г.). «AlphaGo показывает свою истинную силу в третьей победе над Ли Седолем» . Иди, гуру игры. Архивировано из оригинала 13 марта 2016 года . Проверено 12 марта 2016 г.
- ^ «Искусственный интеллект: AlphaGo от Google превосходит мастера го Ли Се Доля» . Би-би-си. 12 марта 2016 года . Проверено 12 марта 2016 г.
- ^ Байфорд, Сэм (12 марта 2016 г.). «AlphaGo снова побеждает Ли Се Доля и принимает участие в серии Google DeepMind Challenge» . Грань . Проверено 12 марта 2016 г.
- ^ Jump up to: а б с д и ж г час Ормерод, Дэвид (13 марта 2016 г.). «Ли Седоль побеждает AlphaGo в мастерском камбэке – игра 4» . Иди, гуру игры. Архивировано из оригинала 16 ноября 2016 года . Проверено 13 марта 2016 г.
- ^ Jump up to: а б Мец, Кейд (13 марта 2016 г.). «Go Grandmaster Ли Седоль одержал утешительную победу над искусственным интеллектом Google» . Проводной . Проверено 14 марта 2016 г.
- ^ Хассабис, Демис. «Пост в Твиттере (12:09 – 13 марта 2016 г.)» . Проверено 13 марта 2016 г.
- ^ Хассабис, Демис. «Пост в Твиттере (12:36 – 13 марта 2016 г.)» . Проверено 13 марта 2016 г.
- ^ Ли Седол на послематчевой пресс-конференции Google DeepMind Challenge Match 4 (13 марта 2016 г.)
- ^ «Ли Седоль побеждает AlphaGo в мастерском камбэке — игра 4» . Иди, гуру игры. Архивировано из оригинала 16 ноября 2016 года . Проверено 13 марта 2016 г.
- ^ Jump up to: а б Байфорд, Сэм (15 марта 2016 г.). «ИИ AlphaGo от Google снова обыграл Ли Се Доля и выиграл серию Го со счетом 4–1» . Грань . Проверено 15 марта 2016 г.
- ^ Jump up to: а б Ормерод, Дэвид (16 марта 2016 г.), AlphaGo побеждает Ли Седоля со счетом 4–1 в матче Google DeepMind Challenge , Go Game Guru, заархивировано из оригинала 17 марта 2016 г. , получено 16 марта 2016 г.
- ^ «Бадук ТВ» . Бадук ТВ.
- ^ «Печаль и красота наблюдения за игрой Google AI Play Go» . ПРОВОДНОЙ . 11 марта 2016 года . Проверено 12 марта 2016 г.
- ^ «Искусственный интеллект: «Альфа Го играет как богиня» » . Golem.de.
- ^ Jump up to: а б с д и ж г Стивен Боровец; Трейси Лиен (12 марта 2016 г.). «AlphaGo побеждает чемпиона по го среди людей, став важной вехой в развитии искусственного интеллекта» . Лос-Анджелес Таймс . Проверено 13 марта 2016 г.
- ^ Коннор, Стив (27 января 2016 г.). «Компьютер победил профессионала в самой сложной настольной игре в мире» . Независимый . Архивировано из оригинала 28 января 2016 года . Проверено 28 января 2016 г.
- ^ «ИИ Google побеждает чемпиона среди людей в Го» . Новости ЦБК . 27 января 2016 года . Проверено 28 января 2016 г.
- ^ Дэйв Гершгорн (12 марта 2016 г.). «Google AlphaGo обыграла чемпиона мира в третьем матче и выиграла всю серию» . Популярная наука . Проверено 13 марта 2016 г.
- ^ Jump up to: а б «Компьютер Google DeepMind AlphaGo обогнал чемпиона среди людей в матчах по Го» . Новости ЦБК . Ассошиэйтед Пресс . 12 марта 2016 года . Проверено 13 марта 2016 г.
- ^ София Ян (12 марта 2016 г.). «Компьютер Google одержал победу над чемпионом мира по игре в го» . CNN Деньги . Проверено 13 марта 2016 г.
- ^ «AlphaGo: искусственный интеллект Google сразится с чемпионом мира по древней китайской настольной игре» . Австралийская радиовещательная корпорация . 8 марта 2016 года . Проверено 13 марта 2016 г.
- ^ Jump up to: а б Мариетт Ле Ру (12 марта 2016 г.). «Восстание машин: следите за искусственным интеллектом, предупреждают эксперты» . Физика.орг . Проверено 13 марта 2016 г.
- ^ «Игра окончена? Новый искусственный интеллект бросает вызов человеческому интеллекту (обновление)» . физ.орг . Проверено 13 марта 2016 г.
- ^ Jump up to: а б с Мариетт Ле Ру; Паскаль Моллар (8 марта 2016 г.). «Игра окончена? Новый искусственный интеллект бросает вызов человеческому интеллекту (обновление)» . физ.орг . Проверено 13 марта 2016 г.
- ^ Таня Льюис (11 марта 2016 г.). «Эксперт по искусственному интеллекту говорит, что в программе Google Go-play отсутствует одна ключевая особенность человеческого интеллекта» . Бизнес-инсайдер . Проверено 13 марта 2016 г.
- ^ «Медаль Марвина Мински за выдающиеся достижения в области искусственного интеллекта» . Международная совместная конференция по искусственному интеллекту . 19 октября 2017 г. Проверено 21 октября 2017 г.
- ^ Джон Рибейро (12 марта 2016 г.). «Программа искусственного интеллекта AlphaGo от Google сильна, но не идеальна, — говорит побежденный южнокорейский игрок в го» . Мир ПК . Проверено 13 марта 2016 г.
- ^ Jump up to: а б Гибни, Элизабет (2016). «Игроки в го реагируют на поражение компьютера» . Природа . дои : 10.1038/nature.2016.19255 . S2CID 146868978 .
- ^ Нил Коннор (11 марта 2016 г.). «Google AlphaGo «не сможет меня победить», — говорит гроссмейстер China Go» . Телеграф (Великобритания) . Проверено 13 марта 2016 г.
- ^ «Китайский мастер го Кэ Цзе говорит, что может проиграть AlphaGo» . Донг-а Ильбо . 14 марта 2016 года . Проверено 17 марта 2016 г.
- ^ « Ли Седол, первый не-преемник, имеет левое и правое отношение на 9-м дане в Кеджи… Где будет проходить 5-я трансляция с AlphaGo?» . Ханкук Ильбо (на корейском языке). 14 марта 2016 г. Архивировано из оригинала 15 марта 2016 г. . Проверено 17 марта 2016 г. «...если сегодняшнее выступление было его истинными возможностями, то он не заслуживает того, чтобы играть против меня».
- ^ Jump up to: а б Юн Сон Вон (14 марта 2016 г.). «Ли Се Дол показывает, что AlphaGo можно победить» . «Корея Таймс» . Проверено 15 марта 2016 г.
- ^ Застроу, Марк (18 марта 2016 г.). «Южная Корея трубит о фонде искусственного интеллекта стоимостью 860 миллионов долларов после «шока» от AlphaGo » . Природа . дои : 10.1038/nature.2016.19595 . S2CID 167331855 . Проверено 20 марта 2016 г.
- ^ «Фильм АльфаГо» . Фильм АльфаГо .
- ^ «АльфаГо» . Гнилые помидоры .
- ^ «AlphaGo — Фильм | Полный документальный фильм» . Ютуб . Проверено 20 марта 2020 г.
- ^ Саймон, Эд (25 ноября 2023 г.). «Кошмары разума: О романе Бенджамина Лабатута «МАНИАК» » . Лос-Анджелесский обзор книг . Проверено 30 декабря 2023 г.
- ^ Ротфельд, Бекка (21 сентября 2023 г.). «Обзор | «МАНИАК» сочетает в себе вымысел и историю на грани разумного» . Вашингтон Пост . Проверено 30 декабря 2023 г.
Внешние ссылки
[ редактировать ]Официальный комментарий матча
[ редактировать ]Официальный комментарий матча Майкла Редмонда (9 дан профессионал) и Криса Гарлока на YouTube-канале Google DeepMind:
- Игра 1 ( обзор 15 минут )
- Игра 2 ( обзор 15 минут )
- Игра 3 ( обзор 15 минут )
- Игра 4 ( обзор 15 минут )
- Игра 5 ( обзор 15 минут )
SGF -файлы
[ редактировать ]- Игра 1 (Go Game Guru)
- Игра 2 (Go Game Guru)
- Игра 3 (Go Game Guru)
- Игра 4 (Go Game Guru)
- Игра 5 (Go Game Guru)
37 ° 34'14 "с.ш. 126 ° 58'31" в.д. / 37,5706 ° с.ш. 126,9754 ° в.д.