Весы
Libratus — это компьютерная программа с искусственным интеллектом , предназначенная для игры в покер , в частности в безлимитный техасский холдем один на один . Создатели Libratus намерены распространить его на другие приложения, не связанные с покером. Он был разработан в Университете Карнеги-Меллон в Питтсбурге.
Фон
[ редактировать ]Хотя Libratus был написан с нуля, он является номинальным преемником Claudico . Как и его предшественник, его название является латинским выражением и означает «сбалансированный».
Libratus был построен с использованием более 15 миллионов ядерных часов вычислений по сравнению с 2-3 миллионами у Claudico. Вычисления проводились на новом суперкомпьютере «Бриджес» в Питтсбургском суперкомпьютерном центре . По словам одного из создателей Libratus, профессора Туомаса Сандхольма, Libratus не имеет фиксированной встроенной стратегии, а имеет алгоритм, который ее вычисляет. Используемая техника представляет собой новый вариант минимизации контрфактического сожаления . [1] а именно метод CFR+, представленный в 2014 году Оскари Таммелином. [2] Помимо CFR+, Либратус использовал новую технику, которую Сэндхольм и его аспирант Ноам Браун разработали для решения задачи эндшпиля. Их новый метод избавляется от предыдущего стандарта де-факто в программировании покера, называемого «отображением действий».
Поскольку Libratus играет только с одним игроком-человеком или компьютером, в Техасском холдеме для двух игроков применяются специальные правила «хедз-ап».
Матч «Люди против ИИ», 2017 г.
[ редактировать ]С 11 по 31 января 2017 года Libratus участвовал в турнире против четырех высококлассных игроков в покер. [3] а именно Джейсон Лес, Донг Ким, Дэниел Маколи и Джимми Чоу. Чтобы получить более статистически значимые результаты, необходимо было сыграть 120 000 рук, что на 50% больше, чем в предыдущем турнире, в котором Клаудико играл в 2015 году. Чтобы справиться с дополнительным объемом, продолжительность турнира была увеличена с 13 до 20 дней. .
Четыре игрока были сгруппированы в две подкоманды по два игрока в каждой. Одна из подкоманд играла под открытым небом, а другая располагалась в отдельной комнате под названием «Подземелье», где не разрешалось пользоваться мобильными телефонами или другими внешними средствами связи. Подгруппа Подземелья получила ту же последовательность карт, что и в открытой игре, за исключением того, что стороны поменялись местами: люди в Подземелье получили карты, которые ИИ получил в открытой игре, и наоборот. Эта установка была призвана свести на нет эффект удачи карт.
Призовой фонд в размере 200 000 долларов был разделен исключительно между игроками-людьми. Каждый игрок получил минимум 20 000 долларов, а остальная часть была распределена в зависимости от их успеха в игре против ИИ. Как заранее написано в правилах турнира, сам ИИ не получил призовых, даже несмотря на то, что выиграл турнир у команды людей.
Во время турнира Libratus соревновался с игроками в течение дня. За ночь он самостоятельно оттачивал свою стратегию, анализируя предыдущий игровой процесс и результаты дня, особенно свои потери. Таким образом, он смог постоянно исправлять недостатки, которые человеческая команда обнаружила в ходе обширного анализа, что привело к постоянной гонке вооружений между людьми и Весами. Для целей конкурса компания использовала еще 4 миллиона часов работы ядра суперкомпьютера Bridges.
Сила ИИ
[ редактировать ]Либратус лидировал против игроков-людей с первого дня турнира. Игрок Дон Ким процитировал силу ИИ следующим образом: «До сегодняшнего дня я не осознавал, насколько он хорош. У меня было ощущение, будто я играю против кого-то, кто жульничает, как будто он может видеть мои карты. Я не обвиняю это мошенничество. Это было так хорошо». [4]
На 16-й день соревнований Libratus впервые преодолел барьер в $1 000 000. В конце дня он опережал команду людей по фишкам на $1 194 402. По итогам соревнования Libratus опередил фишек на $1 766 250 и, таким образом, одержал убедительную победу. Поскольку большой блайнд в матчах был установлен на уровне 100 долларов, процент побед Libratus эквивалентен 14,7 больших блайндов на 100 рук. Это считается исключительно высоким процентом выигрышей в покере и имеет высокую статистическую значимость. [5]
Из игроков-людей первое место занял Донг Ким, второе Маколей, третье Джимми Чоу и четвертое Джейсон Лес.
Имя | Классифицировать | Результаты (в фишках) |
---|---|---|
Донг Ким | 1 | -$85,649 |
Дэниел Маколей | 2 | -$277,657 |
Джимми Чоу | 3 | -$522,857 |
Джейсон Лес | 4 | -$880,087 |
Общий: | -$1,766,250 |
Другие возможные применения
[ редактировать ]Хотя первым приложением Libratus была игра в покер, у его разработчиков была гораздо более широкая миссия перед ИИ. [6] Следователи разработали ИИ таким образом, чтобы он мог изучать любую игру или ситуацию, в которой доступна неполная информация, а «противники» могут скрывать информацию или даже заниматься обманом. По этой причине Сэндхольм и его коллеги предлагают применить систему и для решения других реальных проблем, включая кибербезопасность, деловые переговоры или медицинское планирование. [7]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Сюй, Джереми (10 января 2017 г.). «Знакомьтесь с новым искусственным интеллектом, бросающим вызов профессионалам в покере» . IEEE-спектр . Проверено 10 января 2022 г.
- ^ Браун, Ноам; Сандхольм, Туомас (2017). «Безопасное и вложенное решение эндшпиля для игр с несовершенной информацией» (PDF) . Материалы семинара AAAI по компьютерному покеру и играм с несовершенной информацией .
- ^ Спайс, Байрон; Аллен, Гаррет (4 января 2017 г.). «Повышаем ставку: лучшие профессионалы покера противостоят искусственному интеллекту» . Университет Карнеги-Меллона . Проверено 12 января 2017 г.
- ^ Мец, Кейд (24 января 2017 г.). «Искусственный интеллект вот-вот победит покер, но не без помощи человека» . Проводной . Проверено 24 января 2017 г.
- ^ «ИИ Libratus Poker обыграл людей на 1,76 миллиона долларов; конец близок?» . Покерлистингс . 30 января 2017 года . Проверено 16 марта 2018 г.
- ^ Найт, Уилл (23 января 2017 г.). «Почему так важно, что ИИ умеет блефовать в покере» . Обзор технологий Массачусетского технологического института .
- ^ «Искусственный интеллект выиграл 800 000 долларов у четырех мастеров покера» . Интересная инженерия . 27 января 2017 г.
Внешние ссылки
[ редактировать ]- «Мозги против искусственного интеллекта» Официальный сайт в казино Rivers