Jump to content

Весы

Libratus — это компьютерная программа с искусственным интеллектом , предназначенная для игры в покер , в частности в безлимитный техасский холдем один на один . Создатели Libratus намерены распространить его на другие приложения, не связанные с покером. Он был разработан в Университете Карнеги-Меллон в Питтсбурге.

Хотя Libratus был написан с нуля, он является номинальным преемником Claudico . Как и его предшественник, его название является латинским выражением и означает «сбалансированный».

Libratus был построен с использованием более 15 миллионов ядерных часов вычислений по сравнению с 2-3 миллионами у Claudico. Вычисления проводились на новом суперкомпьютере «Бриджес» в Питтсбургском суперкомпьютерном центре . По словам одного из создателей Libratus, профессора Туомаса Сандхольма, Libratus не имеет фиксированной встроенной стратегии, а имеет алгоритм, который ее вычисляет. Используемая техника представляет собой новый вариант минимизации контрфактического сожаления . [1] а именно метод CFR+, представленный в 2014 году Оскари Таммелином. [2] Помимо CFR+, Либратус использовал новую технику, которую Сэндхольм и его аспирант Ноам Браун разработали для решения задачи эндшпиля. Их новый метод избавляется от предыдущего стандарта де-факто в программировании покера, называемого «отображением действий».

Поскольку Libratus играет только с одним игроком-человеком или компьютером, в Техасском холдеме для двух игроков применяются специальные правила «хедз-ап».

Матч «Люди против ИИ», 2017 г.

[ редактировать ]

С 11 по 31 января 2017 года Libratus участвовал в турнире против четырех высококлассных игроков в покер. [3] а именно Джейсон Лес, Донг Ким, Дэниел Маколи и Джимми Чоу. Чтобы получить более статистически значимые результаты, необходимо было сыграть 120 000 рук, что на 50% больше, чем в предыдущем турнире, в котором Клаудико играл в 2015 году. Чтобы справиться с дополнительным объемом, продолжительность турнира была увеличена с 13 до 20 дней. .

Четыре игрока были сгруппированы в две подкоманды по два игрока в каждой. Одна из подкоманд играла под открытым небом, а другая располагалась в отдельной комнате под названием «Подземелье», где не разрешалось пользоваться мобильными телефонами или другими внешними средствами связи. Подгруппа Подземелья получила ту же последовательность карт, что и в открытой игре, за исключением того, что стороны поменялись местами: люди в Подземелье получили карты, которые ИИ получил в открытой игре, и наоборот. Эта установка была призвана свести на нет эффект удачи карт.

Призовой фонд в размере 200 000 долларов был разделен исключительно между игроками-людьми. Каждый игрок получил минимум 20 000 долларов, а остальная часть была распределена в зависимости от их успеха в игре против ИИ. Как заранее написано в правилах турнира, сам ИИ не получил призовых, даже несмотря на то, что выиграл турнир у команды людей.

Во время турнира Libratus соревновался с игроками в течение дня. За ночь он самостоятельно оттачивал свою стратегию, анализируя предыдущий игровой процесс и результаты дня, особенно свои потери. Таким образом, он смог постоянно исправлять недостатки, которые человеческая команда обнаружила в ходе обширного анализа, что привело к постоянной гонке вооружений между людьми и Весами. Для целей конкурса компания использовала еще 4 миллиона часов работы ядра суперкомпьютера Bridges.

Либратус лидировал против игроков-людей с первого дня турнира. Игрок Дон Ким процитировал силу ИИ следующим образом: «До сегодняшнего дня я не осознавал, насколько он хорош. У меня было ощущение, будто я играю против кого-то, кто жульничает, как будто он может видеть мои карты. Я не обвиняю это мошенничество. Это было так хорошо». [4]

На 16-й день соревнований Libratus впервые преодолел барьер в $1 000 000. В конце дня он опережал команду людей по фишкам на $1 194 402. По итогам соревнования Libratus опередил фишек на $1 766 250 и, таким образом, одержал убедительную победу. Поскольку большой блайнд в матчах был установлен на уровне 100 долларов, процент побед Libratus эквивалентен 14,7 больших блайндов на 100 рук. Это считается исключительно высоким процентом выигрышей в покере и имеет высокую статистическую значимость. [5]

Из игроков-людей первое место занял Донг Ким, второе Маколей, третье Джимми Чоу и четвертое Джейсон Лес.

Имя Классифицировать Результаты (в фишках)
Донг Ким 1 -$85,649
Дэниел Маколей 2 -$277,657
Джимми Чоу 3 -$522,857
Джейсон Лес 4 -$880,087
Общий: -$1,766,250

Другие возможные применения

[ редактировать ]

Хотя первым приложением Libratus была игра в покер, у его разработчиков была гораздо более широкая миссия перед ИИ. [6] Следователи разработали ИИ таким образом, чтобы он мог изучать любую игру или ситуацию, в которой доступна неполная информация, а «противники» могут скрывать информацию или даже заниматься обманом. По этой причине Сэндхольм и его коллеги предлагают применить систему и для решения других реальных проблем, включая кибербезопасность, деловые переговоры или медицинское планирование. [7]

См. также

[ редактировать ]
  1. ^ Сюй, Джереми (10 января 2017 г.). «Знакомьтесь с новым искусственным интеллектом, бросающим вызов профессионалам в покере» . IEEE-спектр . Проверено 10 января 2022 г.
  2. ^ Браун, Ноам; Сандхольм, Туомас (2017). «Безопасное и вложенное решение эндшпиля для игр с несовершенной информацией» (PDF) . Материалы семинара AAAI по компьютерному покеру и играм с несовершенной информацией .
  3. ^ Спайс, Байрон; Аллен, Гаррет (4 января 2017 г.). «Повышаем ставку: лучшие профессионалы покера противостоят искусственному интеллекту» . Университет Карнеги-Меллона . Проверено 12 января 2017 г.
  4. ^ Мец, Кейд (24 января 2017 г.). «Искусственный интеллект вот-вот победит покер, но не без помощи человека» . Проводной . Проверено 24 января 2017 г.
  5. ^ «ИИ Libratus Poker обыграл людей на 1,76 миллиона долларов; конец близок?» . Покерлистингс . 30 января 2017 года . Проверено 16 марта 2018 г.
  6. ^ Найт, Уилл (23 января 2017 г.). «Почему так важно, что ИИ умеет блефовать в покере» . Обзор технологий Массачусетского технологического института .
  7. ^ «Искусственный интеллект выиграл 800 000 долларов у четырех мастеров покера» . Интересная инженерия . 27 января 2017 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8e17ffba17b98b73d1fa6652c10db6e4__1703770680
URL1:https://arc.ask3.ru/arc/aa/8e/e4/8e17ffba17b98b73d1fa6652c10db6e4.html
Заголовок, (Title) документа по адресу, URL1:
Libratus - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)