Подробнее (покерный бот)
Pluribus — это компьютерный игрок в покер , использующий искусственный интеллект , созданный Лабораторией искусственного интеллекта Facebook и Университетом Карнеги-Меллон . Pluribus играет в вариант покера безлимитный техасский холдем и является «первым ботом, победившим людей в сложном многопользовательском соревновании». [1] Разработчики бота опубликовали свои результаты в 2019 году. [2]
По словам создателей Pluribus, «разработка сверхчеловеческого искусственного интеллекта для многопользовательского покера была широко признанной основной вехой» в компьютерном покере до появления Pluribus. Pluribus полагается на самостоятельную игру в автономном режиме для построения базовой стратегии, но затем продолжает обучение в режиме реального времени во время онлайн-игры. Базовая стратегия была рассчитана за восемь дней, и по рыночным ценам ее создание будет стоить около 144 долларов, что намного меньше, чем современные вехи в сверхчеловеческих играх, такие как AlphaZero . В ИИ игры с нулевой суммой для двух игроков (например, хедз-ап холдем) обычно выигрываются путем приближения к равновесной стратегии Нэша; однако этот подход не работает для игр с тремя и более игроками. Вместо этого Pluribus использует подход, которому не хватает серьезных теоретических гарантий, но, тем не менее, он, тем не менее, эмпирически хорошо работает для победы над игроками-людьми. В ходе соревнований Pluribus выигрывал в среднем более 30 миллионов больших блайндов за игру. Самообученный стиль игры Pluribus избегает «лимпа» (колла на большой блайнд) и участвует в «донк-ставках» (завершение раунда коллом и начало следующего раунда ставкой) чаще, чем это делают эксперты-люди. [2]
Среди опытных игроков в покер Джейсон Лес заявил, что чувствует себя «очень безнадежно. Вы не чувствуете, что можете что-то сделать, чтобы выиграть». Крис Фергюсон заявил: «Против Плюрибуса очень сложно играть. Его действительно сложно удержать с любой рукой». Джимми Чоу заявил: «Всякий раз, играя с ботом, я чувствую, что подбираю что-то новое, чтобы включить его в свою игру». В The Wall Street Journal научный редактор Даниэла Эрнандес охарактеризовала Pluribus как «продвинутого в ключевом человеческом навыке — обмане». [3] [4]
Играя в безлимитный холдем против пяти профессиональных игроков в покер, Pluribus выигрывал в среднем 5 долларов за раздачу при выигрыше в 1000 долларов в час, что Facebook назвал «решающим перевесом в победе». [5] [6]
После победы разработчики отказались опубликовать исходный код, опасаясь, что он будет использован не по назначению для тайного мошенничества против игроков в покер в онлайн-матчах. [7] [8]
Ссылки [ править ]
- ^ Солли, Мейлан (15 июля 2019 г.). «Этот ИИ, играющий в покер, знает, когда держать их, а когда сбрасывать» . Смитсоновский институт . Проверено 23 февраля 2023 г.
- ↑ Перейти обратно: Перейти обратно: а б Браун, Ноам; Сандхольм, Туомас (11 июля 2019 г.). «Сверхчеловеческий ИИ для многопользовательского покера» . Наука . 365 (6456): 885–890. Бибкод : 2019Sci...365..885B . дои : 10.1126/science.aay2400 . ПМИД 31296650 .
- ^ Винсент, Джеймс (11 июля 2019 г.). «Сверхчеловеческий покерный ИИ Facebook и CMU превосходит профессионалов-людей» . Грань . Проверено 4 февраля 2021 г.
- ^ Эрнандес, Даниэла (11 июля 2019 г.). «Компьютеры теперь могут блефовать, как чемпионы по покеру. На самом деле даже лучше» . Уолл Стрит Джорнал . Проверено 4 февраля 2021 г.
- ^ Браун, Ноам; Сандхольм, Туомас (2019). «Сверхчеловеческий ИИ для многопользовательского покера» . Наука . 365 (6456): 885–890. Бибкод : 2019Sci...365..885B . дои : 10.1126/science.aay2400 . ПМИД 31296650 . S2CID 195892791 .
- ^ Браун, Ноам (11 июля 2019 г.). «Facebook и Карнеги-Меллон создали первый искусственный интеллект, который побеждает профессионалов в покере с шестью игроками» . ai.facebook.com . Проверено 23 февраля 2023 г.
- ^ Уэллетт, Дженнифер (11 июля 2019 г.). «Facebook AI Pluribus побеждает лучших профессионалов покера в Техасском Холдеме на 6 игроков» . Арс Техника .
- ^ Найт, Уилл (11 июля 2019 г.). «Новый искусственный интеллект Facebook, играющий в покер, может разрушить индустрию онлайн-покера, поэтому его не выпускают» . Обзор технологий Массачусетского технологического института .