Соответствующие пенни

	Руководители	Решка
Руководители	+1, −1	−1, +1
Решка	−1, +1	+1, −1
Соответствующие пенни

Сопоставление монет — это некооперативная игра, изучаемая в теории игр . В нее играют два игрока: четный и нечетный. У каждого игрока есть пенни , и он должен тайно перевернуть монету орлом или решкой. Затем игроки одновременно раскрывают свой выбор. Если монеты совпадают (оба орла или обе решки), то выигрывает Чет и сохраняет обе монеты. Если монеты не совпадают (одна орла, другая решка), то Одд побеждает и оставляет себе обе монеты.

Теория [ править ]

Сопоставление пенни — это игра с нулевой суммой, поскольку выигрыш или потеря полезности каждого участника точно уравновешиваются потерями или выигрышами в полезности других участников. Если общие выигрыши участников сложить и вычесть их общие потери, сумма будет равна нулю.

Игру можно записать в виде матрицы выигрышей (на фото справа — с точки зрения Эвена). В каждой ячейке матрицы показаны выигрыши двух игроков, причем первыми указаны выигрыши Эвена.

Соответствующие монеты используются в первую очередь для иллюстрации концепции смешанных стратегий и смешанной стратегии равновесия Нэша . ^[1]

В этой игре нет в чистой стратегии, равновесия Нэша поскольку не существует чистой стратегии («орла» или «решки»), которая была бы лучшим ответом на лучший ответ. Другими словами, не существует пары чистых стратегий, где ни один из игроков не захотел бы переключаться, если бы ему сказали, что будет делать другой. Вместо этого уникальное равновесие Нэша в этой игре заключается в смешанных стратегиях : каждый игрок выбирает орел или решку с равной вероятностью. ^[2] Таким образом, каждый игрок делает другого безразличным к выбору орла или решки, поэтому ни у одного из игроков нет стимула пробовать другую стратегию. Функции наилучшего ответа для смешанных стратегий изображены на рисунке 1 ниже:

Рисунок 1. Наилучшие соответствия ответов для игроков в **игре «Сопоставь монеты»** . Крайнее левое отображение предназначено для четного игрока, среднее — для нечетного игрока. Единственное равновесие Нэша показано на правом графике. x — вероятность выпадения орла нечетным игроком, y — вероятность выпадения орла четным игроком. Уникальное пересечение — единственная точка, где стратегия «Чет» является лучшим ответом на стратегию «Нечет» и наоборот.

Когда любой из игроков играет в равновесии, ожидаемый выигрыш каждого равен нулю.

Варианты [ править ]

	Руководители	Решка
Руководители	+7, -1	-1, +1
Решка	-1, +1	+1, -1
Соответствующие пенни

Изменение выплат в матрице может изменить точку равновесия. Например, в таблице справа у четного есть шанс выиграть 7, если и он, и нечетный сыграют головой. Чтобы вычислить точку равновесия в этой игре, заметим, что игроку, играющему в смешанной стратегии, должно быть безразлично, какие два его действия он совершает (иначе он перешел бы на чистую стратегию). Это дает нам два уравнения:

Для четного игрока ожидаемый выигрыш при игре «Орел» равен $+7\cdot x-1\cdot (1-x)$ и при игре в Тейлз $-1\cdot x+1\cdot (1-x)$ (где $x$ — вероятность Одда выпасть решкой), и они должны быть равны, поэтому $x=0.2$ .
Для нечетного игрока ожидаемый выигрыш при игре в «Орел» равен $+1\cdot y-1\cdot (1-y)$ и при игре в Тейлз $-1\cdot y+1\cdot (1-y)$ (где $y$ — вероятность Эвена сыграть решкой), и они должны быть равны, поэтому $y=0.5$ .

Обратите внимание, что поскольку $x$ - вероятность выпадения орла для нечетных и $y$ является вероятностью выпадания чета , изменение выигрыша чета влияет на равновесную стратегию нечетного, а не на собственную равновесную стратегию четного. Поначалу это может показаться неинтуитивным. Причина в том, что в равновесии выбор должен быть одинаково привлекательным. Возможность +7 для Четного варианта очень привлекательна по сравнению с +1, поэтому для поддержания равновесия игра Одда должна снизить вероятность этого результата, чтобы компенсировать и уравнять ожидаемые значения двух вариантов. Это означает, что в равновесии Нечетный будет играть решкой реже и Решка чаще.

Лабораторные эксперименты [ править ]

Люди-игроки не всегда придерживаются равновесной стратегии. Лабораторные эксперименты выявили несколько факторов, которые заставляют игроков отклоняться от равновесной стратегии, особенно если повторяющиеся монеты разыгрываются неоднократно:

Люди не умеют рандомизировать. Они могут пытаться создавать «случайные» последовательности, переключая свои действия с «орла» на «решку» и наоборот, но они переключают свои действия слишком часто (из-за ошибки игрока ). Это позволяет опытным игрокам предсказывать свои следующие действия с вероятностью успеха более 50%. Таким образом, положительный ожидаемый выигрыш . может быть достигнут
Люди обучены обнаруживать закономерности. Они пытаются обнаружить закономерности в последовательности действий противника, даже если такие закономерности не существуют, и соответствующим образом корректируют свою стратегию. ^[3]
На поведение людей влияют эффекты фрейминга . ^[4] Когда нечетного игрока называют «вводящим в заблуждение», а четного игрока называют «отгадывающим», первый сосредотачивается на попытке рандомизировать, а второй - на попытке обнаружить закономерность, и это увеличивает шансы на успех угадывающего. Кроме того, тот факт, что Эвен выигрывает при совпадении, дает ему преимущество, поскольку люди лучше справляются с сопоставлением, чем с несоответствием (из-за эффекта совместимости стимул-реакция ).

Более того, когда матрица выигрышей асимметрична, на поведение человека влияют другие факторы, даже если игра не повторяется:

Игроки имеют тенденцию увеличивать вероятность совершения действия, которое принесет им более высокий выигрыш, например, в приведенной выше матрице выигрышей Эвен будет склонен разыгрывать больше решек. Это интуитивно понятно, но это не равновесие Нэша: как объяснялось выше, вероятность смешивания игрока должна зависеть только от выигрыша другого игрока, а не от его собственного выигрыша. Это отклонение можно объяснить как квантовое равновесие реакции . ^[5]^[6] В равновесии квантового отклика кривые наилучшего отклика не такие резкие, как в стандартном равновесии Нэша. Скорее, они плавно изменяются от действия, вероятность которого равна 0, к действию, вероятность которого равна 1 (другими словами, находясь в равновесии по Нэшу, игрок выбирает лучший ответ с вероятностью 1 и худший ответ с вероятностью 0, в квантовом -response-equilibrium игрок выбирает лучший ответ с высокой вероятностью (меньше 1) и худший ответ с меньшей вероятностью (выше 0). Точка равновесия — это точка пересечения сглаженных кривых двух игроков, отличная от точки равновесия Нэша.
Эффект собственной выгоды смягчается неприятием риска . ^[7] Игроки склонны недооценивать высокие выигрыши и переоценивать большие потери; это перемещает кривые квантового ответа и изменяет точку равновесия квантового ответа. Это явно противоречит теоретическим результатам о неуместности неприятия риска в конечно повторяющихся играх с нулевой суммой. ^[8]

Реальные данные [ править ]

Выводы лабораторных экспериментов подверглись критике по нескольким причинам. ^[9]^[10]

Игры в лабораторных экспериментах искусственны и упрощены и не имитируют поведение в реальной жизни.
Выигрыш в лабораторных экспериментах невелик, поэтому у испытуемых нет особого стимула играть оптимально. В реальной жизни рынок может наказать за такую иррациональность и заставить игроков вести себя более рационально.
Помимо максимизации денежного вознаграждения у испытуемых есть и другие соображения, например, чтобы не выглядеть глупо или доставить удовольствие экспериментатору.
Лабораторные эксперименты короткие, и у испытуемых нет достаточно времени для изучения оптимальной стратегии.

Чтобы преодолеть эти трудности, несколько авторов провели статистический анализ профессиональных спортивных игр. Это игры с нулевой суммой и очень высокими выигрышами, и игроки посвятили свою жизнь тому, чтобы стать экспертами. Часто такие игры стратегически похожи на сопоставление монет:

При в футболе пенальти у бьющего игрока есть два варианта: удар влево или удар вправо, а у вратаря есть два варианта: прыгнуть влево или прыгнуть вправо. ^[11] Вероятность того, что игрок, выполняющий удар, забьет гол, выше, если варианты выбора не совпадают, и ниже, если варианты совпадают. В целом выигрыши асимметричны, поскольку у каждого игрока, выполняющего удар, более сильная нога (обычно правая), и его шансы выше при ударе в противоположном направлении (влево). При внимательном рассмотрении действий игроков, выполняющих удары и вратарей, было обнаружено ^[9]^[10] что их действия существенно не отклоняются от предсказания равновесия Нэша.
В теннисных играх с подачей и ответом ситуация аналогичная. Это было найдено ^[12] что процент побед соответствует гипотезе минимакса, но выбор игроков не случаен: даже профессиональные теннисисты не умеют рандомизировать и слишком часто меняют свои действия.

См. также [ править ]

«Четы и шансы» — игра с той же стратегической структурой, в которой вместо монет используются пальцы.
Камень-ножницы-бумага — аналогичная игра, в которой у каждого игрока есть три стратегии вместо двух.
Игра на четность — гораздо более сложная логическая игра для двух игроков, играемая на цветном графе.

Ссылки [ править ]

^ Гиббонс, Роберт (1992). Теория игр для экономистов-прикладников . Издательство Принстонского университета. стр. 29–33. ISBN 978-0-691-00395-5 .
^ «Соответствующие пенни» . GameTheory.net. Архивировано из оригинала 1 октября 2006 г.
^ Мукерджи, Дилип; Софер, Барри (1994). «Обучение поведению в экспериментальной игре в сопоставление монет». Игры и экономическое поведение . 7 : 62–91. дои : 10.1006/game.1994.1037 .
^ Элиаз, Кфир; Рубинштейн, Ариэль (2011). «Загадка Эдгара Аллана По: эффекты обрамления в повторяющихся играх на совпадение монет». Игры и экономическое поведение . 71 : 88–99. дои : 10.1016/j.geb.2009.05.010 .
^ Окс, Джек (1995). «Игры с уникальными равновесиями смешанной стратегии: экспериментальное исследование». Игры и экономическое поведение . 10 : 202–217. дои : 10.1006/game.1995.1030 .
^ Маккелви, Ричард ; Палфри, Томас (1995). «Равновесия квантового ответа для игр нормальной формы». Игры и экономическое поведение . 10 :6–38. CiteSeerX 10.1.1.30.5152 . дои : 10.1006/game.1995.1023 .
^ Гури, Джейкоб К.; Холт, Чарльз А.; Палфри, Томас Р. (2003). «Поведение, не склонное к риску, в обобщенных играх с сопоставлением монет» (PDF) . Игры и экономическое поведение . 45 : 97–113. дои : 10.1016/s0899-8256(03)00052-6 .
^ Вудерс, Джон; Шачат, Джейсон М. (2001). «О неуместности отношения к риску в повторяющихся играх с двумя исходами». Игры и экономическое поведение . 34 (2): 342. doi : 10.1006/game.2000.0808 . S2CID 2401322 .
^ Jump up to: Перейти обратно: ^а ^б Кьяппори, П.; Левитт, С .; Гросеклоуз, Т. (2002). «Тестирование равновесия смешанной стратегии, когда игроки разнородны: пример пенальти в футболе» (PDF) . Американский экономический обзор . 92 (4): 1138–1151. CiteSeerX 10.1.1.178.1646 . дои : 10.1257/00028280260344678 . JSTOR 3083302 .
^ Jump up to: Перейти обратно: ^а ^б Паласиос-Уэрта, И. (2003). «Профессионалы играют в минимакс». Обзор экономических исследований . 70 (2): 395–415. CiteSeerX 10.1.1.127.9097 . дои : 10.1111/1467-937X.00249 .
^ Также существует вариант удара ногой/стояния посередине, но он используется реже.
^ Уокер, Марк; Вудерс, Джон (2001). «Минимакс-игра на Уимблдоне». Американский экономический обзор . 91 (5): 1521–1538. CiteSeerX 10.1.1.614.5372 . дои : 10.1257/aer.91.5.1521 . JSTOR 2677937 .

[1] Гиббонс, Роберт (1992). Теория игр для экономистов-прикладников . Издательство Принстонского университета. стр. 29–33. ISBN 978-0-691-00395-5 .

[2] «Соответствующие пенни» . GameTheory.net. Архивировано из оригинала 1 октября 2006 г.

[ms94-3] Мукерджи, Дилип; Софер, Барри (1994). «Обучение поведению в экспериментальной игре в сопоставление монет». Игры и экономическое поведение . 7 : 62–91. дои : 10.1006/game.1994.1037 .

[er11-4] Элиаз, Кфир; Рубинштейн, Ариэль (2011). «Загадка Эдгара Аллана По: эффекты обрамления в повторяющихся играх на совпадение монет». Игры и экономическое поведение . 71 : 88–99. дои : 10.1016/j.geb.2009.05.010 .

[o95-5] Окс, Джек (1995). «Игры с уникальными равновесиями смешанной стратегии: экспериментальное исследование». Игры и экономическое поведение . 10 : 202–217. дои : 10.1006/game.1995.1030 .

[mp95-6] Маккелви, Ричард ; Палфри, Томас (1995). «Равновесия квантового ответа для игр нормальной формы». Игры и экономическое поведение . 10 :6–38. CiteSeerX 10.1.1.30.5152 . дои : 10.1006/game.1995.1023 .

[ghp03-7] Гури, Джейкоб К.; Холт, Чарльз А.; Палфри, Томас Р. (2003). «Поведение, не склонное к риску, в обобщенных играх с сопоставлением монет» (PDF) . Игры и экономическое поведение . 45 : 97–113. дои : 10.1016/s0899-8256(03)00052-6 .

[ws01-8] Вудерс, Джон; Шачат, Джейсон М. (2001). «О неуместности отношения к риску в повторяющихся играх с двумя исходами». Игры и экономическое поведение . 34 (2): 342. doi : 10.1006/game.2000.0808 . S2CID 2401322 .

[clg02-9] Jump up to: Перейти обратно: ^а ^б Кьяппори, П.; Левитт, С .; Гросеклоуз, Т. (2002). «Тестирование равновесия смешанной стратегии, когда игроки разнородны: пример пенальти в футболе» (PDF) . Американский экономический обзор . 92 (4): 1138–1151. CiteSeerX 10.1.1.178.1646 . дои : 10.1257/00028280260344678 . JSTOR 3083302 .

[p03-10] Jump up to: Перейти обратно: ^а ^б Паласиос-Уэрта, И. (2003). «Профессионалы играют в минимакс». Обзор экономических исследований . 70 (2): 395–415. CiteSeerX 10.1.1.127.9097 . дои : 10.1111/1467-937X.00249 .

[11] Также существует вариант удара ногой/стояния посередине, но он используется реже.

[ww01-12] Уокер, Марк; Вудерс, Джон (2001). «Минимакс-игра на Уимблдоне». Американский экономический обзор . 91 (5): 1521–1538. CiteSeerX 10.1.1.614.5372 . дои : 10.1257/aer.91.5.1521 . JSTOR 2677937 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра по обмену подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теорема Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	Альфа-бета-обрезка Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования