Выбор равновесия

Выбор равновесия — это концепция теории игр , которая направлена на устранение причин, по которым игроки в игре выбирают одно равновесие вместо другого. Эта концепция особенно актуальна в эволюционной теории игр , где разные методы выбора равновесия отвечают разным представлениям о том, какие равновесия будут стабильными и постоянными для игры одного игрока даже перед лицом отклонений (и мутаций) других игроков. Это важно, поскольку существуют различные концепции равновесия , и для многих конкретных концепций, таких как равновесие Нэша , во многих играх имеется несколько равновесий.

Выбор равновесия с помощью повторяющихся игр

Этапическая игра — это игра для n игроков , в которой игроки выбирают из конечного набора действий, и для их выбора существует профиль выигрыша. Повторная игра — это несколько повторений сценической игры в дискретные промежутки времени (Watson, 2013). Репутация игрока влияет на действия и поведение других игроков. Другими словами, то, как игрок ведет себя в предыдущих раундах, определяет действия его противников в последующих раундах. Примером может служить взаимодействие между работником и работодателем, когда работник уклоняется от ответственности за краткосрочную выгоду, а затем теряет бонус, который работодатель прекращает после наблюдения за поведением работника (Watson, 2013). Динамику выбора равновесия для повторяющихся игр можно проиллюстрировать на примере игры с двумя периодами. При каждом действии игроков за один период запускается новая подигра на основе этого профиля действий. Для равновесия Нэша всей игры требуется идеальное равновесие подыгры в каждой игре. Следовательно, в последнем периоде повторной игры игроки выберут этап игры «Равновесие Нэша». Действия по обеспечению равновесия, которые не являются стратегиями равновесия Нэша в поэтапной игре, по-прежнему поддерживаются. Этого можно достичь, установив репутацию «сотрудничества» в предыдущие периоды, что приведет к тому, что противник выберет более выгодную стратегию равновесия Нэша в заключительном периоде. Если игрок завоевывает репутацию отклоняющегося вместо сотрудничества, то противник может «наказать» игрока, выбрав менее благоприятное Равновесие в заключительном периоде повторяющейся игры.

Координатор

Еще одна концепция, которая может помочь выбрать равновесие, — это точка фокуса . Эту концепцию впервые представил Томас Шеллинг, теоретик игр, лауреат Нобелевской премии, в своей книге «Стратегия конфликта» в 1960 году (Schelling, 1960). Когда участники участвуют в координатной игре, в которой у игроков нет возможности заранее обсудить свои стратегии, фокусом становится решение, которое каким-то образом выделяется как естественный ответ.

Например, в эксперименте, проведенном в 1990 году Мехтой и др. (1994), исследователи предложили участникам ответить на вопросник, который содержал вопросы «назовите год» или «назовите город в Англии». Участникам было предложено дать первый ответ, который пришел им в голову, и многие указали год своего рождения или город, в котором они родились.

Однако когда у них появился стимул координировать свои действия (участникам сказали, что им заплатят, если они смогут ответить на вопрос так же, как анонимный партнер), большинство из них выбрали 1990 год (год на тот момент) и Лондон (крупнейший год). город в Великобритании). Это не первые ответы, которые пришли им в голову, но они являются лучшим выбором после размышлений при попытке найти партнера без предварительного обсуждения. В данном случае 1990 год или город Лондон является центральной точкой этой игры, чтобы помочь игрокам выбрать лучшее равновесие в этой координатной игре.

Кроме того, даже в ситуации, когда игрокам разрешено общаться друг с другом, например, во время переговоров, фокус все равно может быть полезен для них, выбирая подходящее равновесие: когда переговоры подходят к концу, каждый игрок должен сделать последнее минутное решение о том, насколько агрессивными им следует быть и в какой степени им следует доверять своим оппонентам (Hyde, 2017).

Симметрии

Различные авторы изучали игры с симметрией (по игрокам или действиям), особенно в случае полностью кооперативных игр. Например, командная игра «Ханаби» рассмотрена , в которой разные игроки и масти симметричны. В связи с этим некоторые авторы рассмотрели, как равновесный выбор связан между изоморфными играми. В целом утверждалось, что группа игроков не должна выбирать стратегии, которые произвольно нарушают эту симметрию, т. е. должна использовать симметричные стратегии, стремясь к симметричному равновесию. ^[1] Точно так же они должны изоморфно играть в изоморфные игры. ^[2] Например, в Ханаби подсказки, соответствующие разным мастям, должны иметь аналогичные (симметричные) значения. В командных играх оптимальная симметричная стратегия также является (симметричным) равновесием Нэша. ^[3] Хотя нарушение симметрии может обеспечить более высокую полезность, это приводит к неестественным, бесчеловечным стратегиям. ^[1] Каждая конечная симметричная игра (включая некомандные игры) имеет симметричное равновесие по Нэшу. ^[4]

Примеры концепций равновесного выбора

Доминирование рисков и выплат

Определение : рассмотрим ситуацию, когда в игре имеется несколько равновесий Нэша (NE), равновесие можно разделить на две категории:

Равновесие Нэша считается доминирующим по риску, если оно имеет наибольшую зону притяжения (т. е. менее рискованно).
Равновесие Нэша считается доминирующим по выигрышу, если оно превосходит по Парето все другие равновесия Нэша в игре.

Пояснение: NE с доминирующим риском выбирается, когда игрок хочет избежать больших потерь, в то время как NE с доминирующим выигрышем рассматривается как оптимальное решение по выплате. Обратите внимание, что типичным типом НЭ является либо доминанта риска, либо доминанта выигрыша.

Пример. В качестве примера возьмем матрицу выигрышей нормальной формы игры:

**Таблица 1: Нормальная форма примера игры**
	л	Р
В	10, 10	0, 9
Д	9, 0	5, 5

В этой игре есть два NE, т.е. (U, L) и (D,R). Здесь (U, L) — NE с доминирующим выигрышем, поскольку такая стратегия может принести оптимальный общий выигрыш. Однако, учитывая неопределенность действий противника, один из игроков может рассмотреть более консервативную стратегию (D для игрока 1 и R для игрока 2), которая позволит избежать ситуации «большого проигрыша», т.е. получения нулевого выигрыша после того, как противник отклоняется. Следовательно, (D, R) является NE с доминирующим риском.

1/2 доминирования

См. также

Ссылки

^ Jump up to: ^а ^б Ху, Хэнъюань; Лерер, Адам; Пейсахович, Алекс; Ферстер, Якоб (2020). « Другая игра» для координации с нулевым выстрелом». Материалы 37-й Международной конференции по машинному обучению . arXiv : 2003.02979 .
^ Харсаньи, Джон К.; Зельтен, Рейнхард (1988). Общая теория равновесного выбора . С Прессой.
^ Эммонс, Скотт; Эстерхельд, Каспар; Критч, Эндрю; Конитцер, Винсент; Рассел, Стюарт (2022). «Для обучения в симметричных командах локальными оптимумами являются глобальные равновесия Нэша». Материалы 39-й Международной конференции по машинному обучению . стр. 5924–5943.
^ Нэш, Джон (1951). «Некооперативные игры». Анналы математики . 54 (2): 286–295. дои : 10.2307/1969529 .

Харсаньи, Джон К. и Селтен, Рейнхард, Общая теория выбора равновесия в играх , MIT Press (1988)
Уотсон, Дж. (2013). Повторные игры и репутация. В книге «Стратегия: введение в теорию игр» (3-е изд., стр. 291–305). эссе, Norton & Company.
Хайд, Т., 2017. Могут ли координаторы Шеллинга помочь нам понять переговоры с высокими ставками? [онлайн] Aeaweb.org. Доступно по адресу: <https://www.aeaweb.org/research/can-schellings-focal-points-help-us-understand-high-stakes-negotiations> [Проверено 9 декабря 2021 г.].
Мехта Дж., Стармер К. и Сагден Р. (1994). Природа значимости: экспериментальное исследование чистых координационных игр. Американский экономический обзор, 84 (3), 658–673. JSTOR 2118074
Шеллинг, Т.К. (1960). Стратегия конфликта. Кембридж, Массачусетс.

Эта по теории игр статья незавершена . Вы можете помочь Википедии, расширив ее .

[Hu2020-1] Jump up to: ^а ^б Ху, Хэнъюань; Лерер, Адам; Пейсахович, Алекс; Ферстер, Якоб (2020). « Другая игра» для координации с нулевым выстрелом». Материалы 37-й Международной конференции по машинному обучению . arXiv : 2003.02979 .

[Harsanyi1988-2] Харсаньи, Джон К.; Зельтен, Рейнхард (1988). Общая теория равновесного выбора . С Прессой.

[Emmons2022-3] Эммонс, Скотт; Эстерхельд, Каспар; Критч, Эндрю; Конитцер, Винсент; Рассел, Стюарт (2022). «Для обучения в симметричных командах локальными оптимумами являются глобальные равновесия Нэша». Материалы 39-й Международной конференции по машинному обучению . стр. 5924–5943.

[Nash1951-4] Нэш, Джон (1951). «Некооперативные игры». Анналы математики . 54 (2): 286–295. дои : 10.2307/1969529 .

[1]

[2]

[3]

[4]

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра-обмен подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Электронная почтовая игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теория Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	Альфа-бета-обрезка Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования