Jump to content

Соответствующие пенни

Руководители Решка
Руководители +1, −1 −1, +1
Решка −1, +1 +1, −1
Соответствующие пенни

Сопоставление монет — это некооперативная игра, изучаемая в теории игр . В нее играют два игрока: четный и нечетный. У каждого игрока есть пенни , и он должен тайно перевернуть монету орлом или решкой. Затем игроки одновременно раскрывают свой выбор. Если монеты совпадают (оба орла или обе решки), то выигрывает Чет и сохраняет обе монеты. Если монеты не совпадают (одна орла, другая решка), то Одд побеждает и оставляет себе обе монеты.

Теория [ править ]

Сопоставление пенни — это игра с нулевой суммой, поскольку выигрыш или потеря полезности каждого участника точно уравновешиваются потерями или выигрышами в полезности других участников. Если общие выигрыши участников сложить и вычесть их общие потери, сумма будет равна нулю.

Игру можно записать в виде матрицы выигрышей (на фото справа — с точки зрения Эвена). В каждой ячейке матрицы показаны выигрыши двух игроков, причем первыми указаны выигрыши Эвена.

Соответствующие монеты используются в первую очередь для иллюстрации концепции смешанных стратегий и смешанной стратегии равновесия Нэша . [1]

В этой игре нет в чистой стратегии, равновесия Нэша поскольку не существует чистой стратегии («орла» или «решки»), которая была бы лучшим ответом на лучший ответ. Другими словами, не существует пары чистых стратегий, где ни один из игроков не захотел бы переключаться, если бы ему сказали, что будет делать другой. Вместо этого уникальное равновесие Нэша в этой игре заключается в смешанных стратегиях : каждый игрок выбирает орел или решку с равной вероятностью. [2] Таким образом, каждый игрок делает другого безразличным к выбору орла или решки, поэтому ни у одного из игроков нет стимула пробовать другую стратегию. Функции наилучшего ответа для смешанных стратегий изображены на рисунке 1 ниже:

Рисунок 1. Наилучшие соответствия ответов для игроков в игре «Сопоставь монеты» . Крайнее левое отображение предназначено для четного игрока, среднее — для нечетного игрока. Единственное равновесие Нэша показано на правом графике. x — вероятность выпадения орла нечетным игроком, y — вероятность выпадения орла четным игроком. Уникальное пересечение — единственная точка, где стратегия «Чет» является лучшим ответом на стратегию «Нечет» и наоборот.

Когда любой из игроков играет в равновесии, ожидаемый выигрыш каждого равен нулю.

Варианты [ править ]

Руководители Решка
Руководители +7, -1 -1, +1
Решка -1, +1 +1, -1
Соответствующие пенни

Изменение выплат в матрице может изменить точку равновесия. Например, в таблице справа у четного есть шанс выиграть 7, если и он, и нечетный сыграют головой. Чтобы вычислить точку равновесия в этой игре, заметим, что игроку, играющему в смешанной стратегии, должно быть безразлично, какие два его действия он совершает (иначе он перешел бы на чистую стратегию). Это дает нам два уравнения:

  • Для четного игрока ожидаемый выигрыш при игре «Орел» равен и при игре в Тейлз (где вероятность Одда выпасть решкой), и они должны быть равны, поэтому .
  • Для нечетного игрока ожидаемый выигрыш при игре в «Орел» равен и при игре в Тейлз (где вероятность Эвена сыграть решкой), и они должны быть равны, поэтому .

Обратите внимание, что поскольку - вероятность выпадения орла для нечетных и является вероятностью выпадания чета , изменение выигрыша чета влияет на равновесную стратегию нечетного, а не на собственную равновесную стратегию четного. Поначалу это может показаться неинтуитивным. Причина в том, что в равновесии выбор должен быть одинаково привлекательным. Возможность +7 для Четного варианта очень привлекательна по сравнению с +1, поэтому для поддержания равновесия игра Одда должна снизить вероятность этого результата, чтобы компенсировать и уравнять ожидаемые значения двух вариантов. Это означает, что в равновесии Нечетный будет играть решкой реже и Решка чаще.

Лабораторные эксперименты [ править ]

Люди-игроки не всегда придерживаются равновесной стратегии. Лабораторные эксперименты выявили несколько факторов, которые заставляют игроков отклоняться от равновесной стратегии, особенно если повторяющиеся монеты разыгрываются неоднократно:

  • Люди не умеют рандомизировать. Они могут пытаться создавать «случайные» последовательности, переключая свои действия с «орла» на «решку» и наоборот, но они переключают свои действия слишком часто (из-за ошибки игрока ). Это позволяет опытным игрокам предсказывать свои следующие действия с вероятностью успеха более 50%. Таким образом, положительный ожидаемый выигрыш . может быть достигнут
  • Люди обучены обнаруживать закономерности. Они пытаются обнаружить закономерности в последовательности действий противника, даже если такие закономерности не существуют, и соответствующим образом корректируют свою стратегию. [3]
  • На поведение людей влияют эффекты фрейминга . [4] Когда нечетного игрока называют «вводящим в заблуждение», а четного игрока называют «отгадывающим», первый сосредотачивается на попытке рандомизировать, а второй - на попытке обнаружить закономерность, и это увеличивает шансы на успех угадывающего. Кроме того, тот факт, что Эвен выигрывает при совпадении, дает ему преимущество, поскольку люди лучше справляются с сопоставлением, чем с несоответствием (из-за эффекта совместимости стимул-реакция ).

Более того, когда матрица выигрышей асимметрична, на поведение человека влияют другие факторы, даже если игра не повторяется:

  • Игроки имеют тенденцию увеличивать вероятность совершения действия, которое принесет им более высокий выигрыш, например, в приведенной выше матрице выигрышей Эвен будет склонен разыгрывать больше решек. Это интуитивно понятно, но это не равновесие Нэша: как объяснялось выше, вероятность смешивания игрока должна зависеть только от выигрыша другого игрока, а не от его собственного выигрыша. Это отклонение можно объяснить как квантовое равновесие реакции . [5] [6] В равновесии квантового отклика кривые наилучшего отклика не такие резкие, как в стандартном равновесии Нэша. Скорее, они плавно изменяются от действия, вероятность которого равна 0, к действию, вероятность которого равна 1 (другими словами, находясь в равновесии по Нэшу, игрок выбирает лучший ответ с вероятностью 1 и худший ответ с вероятностью 0, в квантовом -response-equilibrium игрок выбирает лучший ответ с высокой вероятностью (меньше 1) и худший ответ с меньшей вероятностью (выше 0). Точка равновесия — это точка пересечения сглаженных кривых двух игроков, отличная от точки равновесия Нэша.
  • Эффект собственной выгоды смягчается неприятием риска . [7] Игроки склонны недооценивать высокие выигрыши и переоценивать большие потери; это перемещает кривые квантового ответа и изменяет точку равновесия квантового ответа. Это явно противоречит теоретическим результатам о неуместности неприятия риска в конечно повторяющихся играх с нулевой суммой. [8]

Реальные данные [ править ]

Выводы лабораторных экспериментов подверглись критике по нескольким причинам. [9] [10]

  • Игры в лабораторных экспериментах искусственны и упрощены и не имитируют поведение в реальной жизни.
  • Выигрыш в лабораторных экспериментах невелик, поэтому у испытуемых нет особого стимула играть оптимально. В реальной жизни рынок может наказать за такую ​​иррациональность и заставить игроков вести себя более рационально.
  • Помимо максимизации денежного вознаграждения у испытуемых есть и другие соображения, например, чтобы не выглядеть глупо или доставить удовольствие экспериментатору.
  • Лабораторные эксперименты короткие, и у испытуемых нет достаточно времени для изучения оптимальной стратегии.

Чтобы преодолеть эти трудности, несколько авторов провели статистический анализ профессиональных спортивных игр. Это игры с нулевой суммой и очень высокими выигрышами, и игроки посвятили свою жизнь тому, чтобы стать экспертами. Часто такие игры стратегически похожи на сопоставление монет:

  • При в футболе пенальти у ​​бьющего игрока есть два варианта: удар влево или удар вправо, а у вратаря есть два варианта: прыгнуть влево или прыгнуть вправо. [11] Вероятность того, что игрок, выполняющий удар, забьет гол, выше, если варианты выбора не совпадают, и ниже, если варианты совпадают. В целом выигрыши асимметричны, поскольку у каждого игрока, выполняющего удар, более сильная нога (обычно правая), и его шансы выше при ударе в противоположном направлении (влево). При внимательном рассмотрении действий игроков, выполняющих удары и вратарей, было обнаружено [9] [10] что их действия существенно не отклоняются от предсказания равновесия Нэша.
  • В теннисных играх с подачей и ответом ситуация аналогичная. Это было найдено [12] что процент побед соответствует гипотезе минимакса, но выбор игроков не случаен: даже профессиональные теннисисты не умеют рандомизировать и слишком часто меняют свои действия.

См. также [ править ]

  • «Четы и шансы» — игра с той же стратегической структурой, в которой вместо монет используются пальцы.
  • Камень-ножницы-бумага — аналогичная игра, в которой у каждого игрока есть три стратегии вместо двух.
  • Игра на четность — гораздо более сложная логическая игра для двух игроков, играемая на цветном графе.

Ссылки [ править ]

  1. ^ Гиббонс, Роберт (1992). Теория игр для экономистов-прикладников . Издательство Принстонского университета. стр. 29–33. ISBN  978-0-691-00395-5 .
  2. ^ «Соответствующие пенни» . GameTheory.net. Архивировано из оригинала 1 октября 2006 г.
  3. ^ Мукерджи, Дилип; Софер, Барри (1994). «Обучение поведению в экспериментальной игре в сопоставление монет». Игры и экономическое поведение . 7 : 62–91. дои : 10.1006/game.1994.1037 .
  4. ^ Элиаз, Кфир; Рубинштейн, Ариэль (2011). «Загадка Эдгара Аллана По: эффекты обрамления в повторяющихся играх на совпадение монет». Игры и экономическое поведение . 71 : 88–99. дои : 10.1016/j.geb.2009.05.010 .
  5. ^ Окс, Джек (1995). «Игры с уникальными равновесиями смешанной стратегии: экспериментальное исследование». Игры и экономическое поведение . 10 : 202–217. дои : 10.1006/game.1995.1030 .
  6. ^ Маккелви, Ричард ; Палфри, Томас (1995). «Равновесия квантового ответа для игр нормальной формы». Игры и экономическое поведение . 10 :6–38. CiteSeerX   10.1.1.30.5152 . дои : 10.1006/game.1995.1023 .
  7. ^ Гури, Джейкоб К.; Холт, Чарльз А.; Палфри, Томас Р. (2003). «Поведение, не склонное к риску, в обобщенных играх с сопоставлением монет» (PDF) . Игры и экономическое поведение . 45 : 97–113. дои : 10.1016/s0899-8256(03)00052-6 .
  8. ^ Вудерс, Джон; Шачат, Джейсон М. (2001). «О неуместности отношения к риску в повторяющихся играх с двумя исходами». Игры и экономическое поведение . 34 (2): 342. doi : 10.1006/game.2000.0808 . S2CID   2401322 .
  9. ^ Jump up to: Перейти обратно: а б Кьяппори, П.; Левитт, С .; Гросеклоуз, Т. (2002). «Тестирование равновесия смешанной стратегии, когда игроки разнородны: пример пенальти в футболе» (PDF) . Американский экономический обзор . 92 (4): 1138–1151. CiteSeerX   10.1.1.178.1646 . дои : 10.1257/00028280260344678 . JSTOR   3083302 .
  10. ^ Jump up to: Перейти обратно: а б Паласиос-Уэрта, И. (2003). «Профессионалы играют в минимакс». Обзор экономических исследований . 70 (2): 395–415. CiteSeerX   10.1.1.127.9097 . дои : 10.1111/1467-937X.00249 .
  11. ^ Также существует вариант удара ногой/стояния посередине, но он используется реже.
  12. ^ Уокер, Марк; Вудерс, Джон (2001). «Минимакс-игра на Уимблдоне». Американский экономический обзор . 91 (5): 1521–1538. CiteSeerX   10.1.1.614.5372 . дои : 10.1257/aer.91.5.1521 . JSTOR   2677937 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d67cf65f288c30c3b405a8f1789f3030__1706822640
URL1:https://arc.ask3.ru/arc/aa/d6/30/d67cf65f288c30c3b405a8f1789f3030.html
Заголовок, (Title) документа по адресу, URL1:
Matching pennies - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)