Идеальное равновесие в подигре

Подигра «Идеальное равновесие»
Подигра «Идеальное равновесие»
Концепция решения в теории игр
Отношение
Подмножество	Равновесие Нэша
Пересекается с	Эволюционно стабильная стратегия
Значение
Предложено	Райнхард Зельтен
Используется для	Обширная форма игры
Пример	Ультиматум игра

В теории игр ( идеальное равновесие подигры или идеальное равновесие Нэша подигры ) является уточнением равновесия Нэша, используемого в динамических играх . Профиль стратегии является идеальным равновесием подигры, если он представляет равновесие Нэша каждой подигры исходной игры. Неформально это означает, что в любой момент игры поведение игроков с этого момента должно представлять собой равновесие Нэша продолжения игры (т. е. подигры), независимо от того, что произошло раньше. Каждая конечная обширная игра с идеальным отзывом имеет идеальное равновесие подигры. ^[1] Совершенное припоминание — это термин, введенный Гарольдом В. Куном в 1953 году и «эквивалентный утверждению, что правила игры позволяют каждому игроку помнить все, что он знал на предыдущих ходах, и все свои решения на этих ходах» . ^[2]

Распространенным методом определения идеального равновесия в подыграх в случае конечной игры является обратная индукция . Здесь сначала рассматриваются последние действия игры и определяются, какие действия последний игрок должен предпринять в каждом возможном случае, чтобы максимизировать свою полезность . Затем предполагается, что эти действия выполнит последний актор, и рассматриваются предпоследние действия, снова выбирая те, которые максимизируют полезность этого актора. Этот процесс продолжается до тех пор, пока не будет достигнут первый ход игры. Оставшиеся стратегии представляют собой набор всех совершенных равновесий подигр для обширных игр с конечной информацией и конечным интервалом. ^[1] Однако обратную индукцию нельзя применять к играм с несовершенной или неполной информацией неодноэлементной , поскольку это влечет за собой прорезание наборов информации .

Идеальное равновесие в подыгре обязательно удовлетворяет принципу одноразового отклонения .

Набор идеальных равновесий подыгры для данной игры всегда является подмножеством множества равновесий Нэша для этой игры. В некоторых случаях наборы могут быть идентичными.

Игра «Ультиматум» представляет собой интуитивный пример игры с меньшим количеством идеальных равновесий в подыграх, чем равновесия Нэша.

Пример

Определение идеального равновесия подигры с помощью обратной индукции показано ниже на рисунке 1. Стратегии для игрока 1 задаются как {Up, Uq, Dp, Dq}, тогда как у игрока 2 есть стратегии среди {TL, TR, BL, BR}. В этом примере есть 4 подигры с 3 собственными подиграми.

Используя обратную индукцию, игроки будут предпринимать следующие действия для каждой подигры:

Подигра для действий p и q: Игрок 1 предпримет действие p с выигрышем (3, 3), чтобы максимизировать выигрыш Игрока 1, поэтому выигрыш для действия L станет (3,3).
Подигра для действий L и R: Игрок 2 выполнит действие L при 3 > 2, поэтому выигрыш за действие D составит (3, 3).
Подигра для действий T и B: Игрок 2 предпримет действие T, чтобы максимизировать выигрыш Игрока 2, поэтому выигрыш за действие U станет (1, 4).
Подигра для действий U и D: Игрок 1 предпримет действие D, чтобы максимизировать выигрыш Игрока 1.

Таким образом, идеальным равновесием в подыгре является {Dp, TL} с выигрышем (3, 3).

Игра развернутой формы с неполной информацией представлена ниже на рисунке 2. Обратите внимание, что узел для Игрока 1 с действиями A и B, а также всеми последующими действиями является подигрой. Узлы игрока 2 не являются подигрой, поскольку они являются частью одного и того же набора информации.

Первая игра в нормальной форме — это представление в нормальной форме всей игры в развернутой форме. На основании предоставленной информации (UA, X), (DA, Y) и (DB, Y) являются равновесиями Нэша для всей игры.

Вторая игра в нормальной форме представляет собой представление подигры в нормальной форме, начиная со второго узла Игрока 1 с действиями A и B. Для второй игры в нормальной форме равновесие по Нэшу в подигре равно (A, X).

Для всей игры равновесия Нэша (DA, Y) и (DB, Y) не являются идеальными равновесиями подыгры, поскольку ход Игрока 2 не представляет собой равновесие Нэша. Равновесие Нэша (UA, X) является совершенным подигрой, поскольку оно включает равновесие Нэша подигры (A, X) как часть своей стратегии. ^[3]

Чтобы решить эту игру, сначала найдите равновесия Нэша по взаимному наилучшему ответу в подигре 1. Затем используйте обратную индукцию и подставьте (A,X) → (3,4), чтобы (3,4) стали выигрышами в подигре 2. ^[3]

Пунктирная линия показывает, что игрок 2 не знает, будет ли игрок 1 играть в A или B в одновременной игре.

Игрок 1 выбирает U, а не D, потому что 3 > 2 для выигрыша Игрока 1. В результате равновесие будет (A, X) → (3,4).

Таким образом, идеальным равновесием подигры посредством обратной индукции является (UA, X) с выигрышем (3, 4).

Повторные игры

Для конечно повторяющихся игр, если этапная игра имеет только одно уникальное равновесие Нэша, идеальное равновесие подигры состоит в том, чтобы играть без учета прошлых действий, рассматривая текущую подигру как игру с одним выстрелом. Примером этого является конечно повторяющаяся игра «Дилемма Узника» . Дилемма Узника получила свое название от ситуации, в которой есть два виновных. Когда их допрашивают, у них есть возможность промолчать или сбежать. Если оба преступника промолчат, они оба отсидят короткий срок. Если оба дезертируют, они оба отбывают умеренное наказание. Если они выберут противоположные варианты, то виновный в отступничестве освобождается, а виновный, который хранит молчание, получает длительный срок. В конечном счете, используя обратную индукцию, последняя подигра в конечно повторяющейся дилемме Узника требует, чтобы игроки играли в уникальное равновесие Нэша (оба игрока отступают). По этой причине во всех играх, предшествующих последней подигре, также будет использоваться равновесие Нэша, чтобы максимизировать свои выигрыши за один период. ^[4] Если сценическая игра в конечно повторяющейся игре имеет несколько равновесий Нэша, идеальные равновесия подигры могут быть построены для выполнения действий равновесия Нэша, не относящихся к сценической игре, с помощью структуры «кнута и пряника». Один игрок может использовать равновесие Нэша на одном этапе игры, чтобы стимулировать выполнение действий, не относящихся к равновесию Нэша, при этом используя равновесие Нэша на этапе игры с более низким выигрышем для другого игрока, если он решит отказаться. ^[5]

Нахождение идеального равновесия для подыгры

Рейнхард Зельтен доказал, что любая игра, которую можно разбить на «подигры», содержащие подмножество всех доступных вариантов выбора в основной игре, будет иметь подыгру, идеальную стратегию равновесия Нэша (возможно, как смешанную стратегию, дающую недетерминированные подыгры). игровые решения). Совершенство подигр используется только в играх с полной информацией . Совершенство подигр можно использовать в играх развернутой формы с полной, но несовершенной информацией .

Идеальное для подигры равновесие Нэша обычно выводится путем « обратной индукции » из различных конечных результатов игры, исключая ветки, которые предполагают, что любой игрок сделает ход, который не заслуживает доверия (потому что он неоптимален) из этого узла . Одна игра, в которой хорошо известно решение обратной индукции, — это «крестики-нолики» , но теоретически даже в го есть такая оптимальная стратегия для всех игроков. Проблема взаимосвязи между совершенством подигр и обратной индукцией была решена Камински (2019), который доказал, что обобщенная процедура обратной индукции создает все идеальные равновесия подигр в играх, которые могут иметь бесконечную длину, бесконечные действия в качестве каждого набора информации и несовершенные информацию, если условие окончательной поддержки выполнено.

Интересный аспект слова «достоверный» в предыдущем абзаце заключается в том, что в целом (не обращая внимания на необратимость достижения подигр) существуют стратегии, которые превосходят идеальные подыгровые стратегии, но которые не являются заслуживающими доверия в том смысле, что угроза их выполнение нанесет вред игроку, создающему угрозу, и предотвратит эту комбинацию стратегий. Например, в игре « цыпленок », если у одного игрока есть возможность оторвать руль от своей машины, он всегда должен ею воспользоваться, поскольку это приводит к «дополнительной игре», в которой его разумный противник не может сделать то же самое ( и убить их обоих). Колесо-рыхлитель всегда выиграет игру (заставив своего противника отклониться), и угроза противника последовать его примеру неправдоподобна.

См. также

Ссылки

^ Jump up to: ^а ^б Осборн, MJ (2004). Введение в теорию игр . Издательство Оксфордского университета.
^ Кун, Гарольд Уильям; Такер, Альберт Уильям (2 марта 2016 г.). Вклад в теорию игр (AM-28), том II . Издательство Принстонского университета. ISBN 978-1-4008-8197-0 .
^ Jump up to: ^а ^б Джоэл., Ватсон (9 мая 2013 г.). Стратегия: введение в теорию игр (Третье изд.). Нью-Йорк. ISBN 9780393918380 . OCLC 842323069 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
^ Йылдыз, Мухамет (2012). «12 повторяющихся игр» . 14.12. Экономические приложения теории игр . Массачусетский технологический институт: MIT OpenCourseWare . Проверено 27 апреля 2021 г.
^ Такако, Фудзивара-Греве (27 июня 2015 г.). Теория некооперативных игр . Токио. ISBN 9784431556442 . OCLC 911616270 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )

Внешние ссылки

Зельтен, Р. (1965). Теория игр трактует модель олигополии с инерцией спроса. Журнал всей политической науки/Журнал институциональной и теоретической экономики , (H. 2), 301–324, 667–689. [на немецком языке — часть 1 , часть 2 ]
Пример игры с расширенной формой и несовершенной информацией
Java-апплет для поиска идеального решения равновесия Нэша для подигры обширной игры с сайта gametheory.net.
Java-апплет для поиска идеального решения равновесия Нэша для подигры обширной игры с сайта gametheory.net.
Каминский, М. М. Обобщенная обратная индукция: обоснование народного алгоритма . Игры 2019, 10, 34.

[Osborne2004-1] Jump up to: ^а ^б Осборн, MJ (2004). Введение в теорию игр . Издательство Оксфордского университета.

[2] Кун, Гарольд Уильям; Такер, Альберт Уильям (2 марта 2016 г.). Вклад в теорию игр (AM-28), том II . Издательство Принстонского университета. ISBN 978-1-4008-8197-0 .

[:0-3] Jump up to: ^а ^б Джоэл., Ватсон (9 мая 2013 г.). Стратегия: введение в теорию игр (Третье изд.). Нью-Йорк. ISBN 9780393918380 . OCLC 842323069 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )

[4] Йылдыз, Мухамет (2012). «12 повторяющихся игр» . 14.12. Экономические приложения теории игр . Массачусетский технологический институт: MIT OpenCourseWare . Проверено 27 апреля 2021 г.

[5] Такако, Фудзивара-Греве (27 июня 2015 г.). Теория некооперативных игр . Токио. ISBN 9784431556442 . OCLC 911616270 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )

[1]

[2]

[3]

[4]

[5]

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра-обмен подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Электронная почтовая игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теория Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	Альфа-бета-обрезка Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования