Выбор равновесия
Выбор равновесия — это концепция теории игр , которая направлена на устранение причин, по которым игроки в игре выбирают одно равновесие вместо другого. Эта концепция особенно актуальна в эволюционной теории игр , где разные методы выбора равновесия отвечают разным представлениям о том, какие равновесия будут стабильными и постоянными для игры одного игрока даже перед лицом отклонений (и мутаций) других игроков. Это важно, поскольку существуют различные концепции равновесия , и для многих конкретных концепций, таких как равновесие Нэша , во многих играх имеется несколько равновесий.
Выбор равновесия с помощью повторяющихся игр
[ редактировать ]Этапическая игра — это игра для n игроков , в которой игроки выбирают из конечного набора действий, и для их выбора существует профиль выигрыша. Повторная игра — это несколько повторений сценической игры в дискретные промежутки времени (Watson, 2013). Репутация игрока влияет на действия и поведение других игроков. Другими словами, то, как игрок ведет себя в предыдущих раундах, определяет действия его противников в последующих раундах. Примером может служить взаимодействие между работником и работодателем, когда работник уклоняется от ответственности за краткосрочную выгоду, а затем теряет бонус, который работодатель прекращает после наблюдения за поведением работника (Watson, 2013). Динамику выбора равновесия для повторяющихся игр можно проиллюстрировать на примере игры с двумя периодами. При каждом действии игроков за один период запускается новая подигра на основе этого профиля действий. Для равновесия Нэша всей игры требуется идеальное равновесие подыгры в каждой игре. Следовательно, в последнем периоде повторной игры игроки выберут этап игры «Равновесие Нэша». Действия по обеспечению равновесия, которые не являются стратегиями равновесия Нэша в поэтапной игре, по-прежнему поддерживаются. Этого можно достичь, установив репутацию «сотрудничества» в предыдущие периоды, что приведет к тому, что противник выберет более выгодную стратегию равновесия Нэша в заключительном периоде. Если игрок завоевывает репутацию отклоняющегося вместо сотрудничества, то противник может «наказать» игрока, выбрав менее благоприятное Равновесие в заключительном периоде повторяющейся игры.
Координатор
[ редактировать ]Еще одна концепция, которая может помочь выбрать равновесие, — это точка фокуса . Эту концепцию впервые представил Томас Шеллинг, теоретик игр, лауреат Нобелевской премии, в своей книге «Стратегия конфликта» в 1960 году (Schelling, 1960). Когда участники участвуют в координатной игре, в которой у игроков нет возможности заранее обсудить свои стратегии, фокусом становится решение, которое каким-то образом выделяется как естественный ответ.
Например, в эксперименте, проведенном в 1990 году Мехтой и др. (1994), исследователи предложили участникам ответить на вопросник, который содержал вопросы «назовите год» или «назовите город в Англии». Участникам было предложено дать первый ответ, который пришел им в голову, и многие указали год своего рождения или город, в котором они родились.
Однако когда у них появился стимул координировать свои действия (участникам сказали, что им заплатят, если они смогут ответить на вопрос так же, как анонимный партнер), большинство из них выбрали 1990 год (год на тот момент) и Лондон (крупнейший год). город в Великобритании). Это не первые ответы, которые пришли им в голову, но они являются лучшим выбором после размышлений при попытке найти партнера без предварительного обсуждения. В данном случае 1990 год или город Лондон является центральной точкой этой игры, чтобы помочь игрокам выбрать лучшее равновесие в этой координатной игре.
Кроме того, даже в ситуации, когда игрокам разрешено общаться друг с другом, например, во время переговоров, фокус все равно может быть полезен для них, выбирая подходящее равновесие: когда переговоры подходят к концу, каждый игрок должен сделать последнее минутное решение о том, насколько агрессивными им следует быть и в какой степени им следует доверять своим оппонентам (Hyde, 2017).
Симметрии
[ редактировать ]Различные авторы изучали игры с симметрией (по игрокам или действиям), особенно в случае полностью кооперативных игр. Например, командная игра «Ханаби» рассмотрена , в которой разные игроки и масти симметричны. В связи с этим некоторые авторы рассмотрели, как равновесный выбор связан между изоморфными играми. В целом утверждалось, что группа игроков не должна выбирать стратегии, которые произвольно нарушают эту симметрию, т. е. должна использовать симметричные стратегии, стремясь к симметричному равновесию. [1] Точно так же они должны изоморфно играть в изоморфные игры. [2] Например, в Ханаби подсказки, соответствующие разным мастям, должны иметь аналогичные (симметричные) значения. В командных играх оптимальная симметричная стратегия также является (симметричным) равновесием Нэша. [3] Хотя нарушение симметрии может обеспечить более высокую полезность, это приводит к неестественным, бесчеловечным стратегиям. [1] Каждая конечная симметричная игра (включая некомандные игры) имеет симметричное равновесие по Нэшу. [4]
Примеры концепций равновесного выбора
[ редактировать ]Доминирование рисков и выплат
[ редактировать ]Определение : рассмотрим ситуацию, когда в игре имеется несколько равновесий Нэша (NE), равновесие можно разделить на две категории:
- Равновесие Нэша считается доминирующим по риску, если оно имеет наибольшую зону притяжения (т. е. менее рискованно).
- Равновесие Нэша считается доминирующим по выигрышу, если оно превосходит по Парето все другие равновесия Нэша в игре.
Пояснение: NE с доминирующим риском выбирается, когда игрок хочет избежать больших потерь, в то время как NE с доминирующим выигрышем рассматривается как оптимальное решение по выплате. Обратите внимание, что типичным типом НЭ является либо доминанта риска, либо доминанта выигрыша.
Пример. В качестве примера возьмем матрицу выигрышей нормальной формы игры:
л | Р | |
---|---|---|
В | 10, 10 | 0, 9 |
Д | 9, 0 | 5, 5 |
В этой игре есть два NE, т.е. (U, L) и (D,R). Здесь (U, L) — NE с доминирующим выигрышем, поскольку такая стратегия может принести оптимальный общий выигрыш. Однако, учитывая неопределенность действий противника, один из игроков может рассмотреть более консервативную стратегию (D для игрока 1 и R для игрока 2), которая позволит избежать ситуации «большого проигрыша», т.е. получения нулевого выигрыша после того, как противник отклоняется. Следовательно, (D, R) является NE с доминирующим риском.
1/2 доминирования
[ редактировать ]Этот раздел пуст. Вы можете помочь, добавив к нему . ( декабрь 2021 г. ) |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Ху, Хэнъюань; Лерер, Адам; Пейсахович, Алекс; Ферстер, Якоб (2020). « Другая игра» для координации с нулевым выстрелом». Материалы 37-й Международной конференции по машинному обучению . arXiv : 2003.02979 .
- ^ Харсаньи, Джон К.; Зельтен, Рейнхард (1988). Общая теория равновесного выбора . С Прессой.
- ^ Эммонс, Скотт; Эстерхельд, Каспар; Критч, Эндрю; Конитцер, Винсент; Рассел, Стюарт (2022). «Для обучения в симметричных командах локальными оптимумами являются глобальные равновесия Нэша». Материалы 39-й Международной конференции по машинному обучению . стр. 5924–5943.
- ^ Нэш, Джон (1951). «Некооперативные игры». Анналы математики . 54 (2): 286–295. дои : 10.2307/1969529 .
- Харсаньи, Джон К. и Селтен, Рейнхард, Общая теория выбора равновесия в играх , MIT Press (1988)
- Уотсон, Дж. (2013). Повторные игры и репутация. В книге «Стратегия: введение в теорию игр» (3-е изд., стр. 291–305). эссе, Norton & Company.
- Хайд, Т., 2017. Могут ли координаторы Шеллинга помочь нам понять переговоры с высокими ставками? [онлайн] Aeaweb.org. Доступно по адресу: <https://www.aeaweb.org/research/can-schellings-focal-points-help-us-understand-high-stakes-negotiations> [Проверено 9 декабря 2021 г.].
- Мехта Дж., Стармер К. и Сагден Р. (1994). Природа значимости: экспериментальное исследование чистых координационных игр. Американский экономический обзор, 84 (3), 658–673. JSTOR 2118074
- Шеллинг, Т.К. (1960). Стратегия конфликта. Кембридж, Массачусетс.