Jump to content

Теорема очистки

В теории игр теорему очистки ввел нобелевский лауреат Джон Харсаньи в 1973 году. [1] Теорема призвана оправдать загадочный аспект в смешанной стратегии равновесия Нэша : каждому игроку совершенно безразлично каждое из действий, которым он придает ненулевой вес, однако он смешивает их так, чтобы сделать любого другого игрока также безразличным.

Равновесия смешанной стратегии объясняются как предел равновесия чистой стратегии для нарушенной игры с неполной информацией , в которой выигрыши каждого игрока известны им самим, но не их противникам. Идея состоит в том, что предсказанная смешанная стратегия исходной игры возникает как постоянно улучшающаяся аппроксимация игры, которую не заметил теоретик, создавший исходную идеализированную игру.

Кажущаяся смешанная природа стратегии на самом деле является результатом того, что каждый игрок использует чистую стратегию с пороговыми значениями, которые зависят от ожидаемого распределения по континууму выигрышей, которые может получить игрок. По мере того как этот континуум сжимается до нуля, стратегии игроков сходятся к предсказанному равновесию Нэша исходной, невозмущенной, полной информационной игры.

Результат также является важным аспектом современных исследований в области эволюционной теории игр , где искаженные значения интерпретируются как распределения по типам игроков, случайно объединенных в пары для игры.

Пример [ править ]

С Д
С 3, 3 2, 4
Д 4, 2 0, 0
Рис. 1: Ястреб-Голубь. игра

Рассмотрим показанную здесь игру «Ястреб–Голубь» . В игре есть два равновесия чистой стратегии (Дефект, Сотрудничество) и (Сотрудничество, Дефект). Также существует смешанное равновесие, в котором каждый игрок играет «Сотрудничать» с вероятностью 2/3.

Предположим, что каждый игрок i несет дополнительные затраты a i от игры в «Сотрудничать», которые равномерно распределены на [− A , A ]. Игроки знают только свою ценность этой стоимости. Итак, это игра с неполной информацией , которую мы можем решить, используя байесовское равновесие Нэша . Вероятность того, что a i а* равно ( а* + А /2 А. ) Если игрок 2 сотрудничает, когда a 2 a* , то ожидаемая полезность игрока 1 от сотрудничества равна a 1 + 3( a* + A )/2 A + 2(1 − ( a* + A )/2 A ) ; его ожидаемая полезность от дезертирства равна 4( a* + A )/2 A . Следовательно, он сам должен Сотрудничать, когда a 1 ≤ 2 - 3( a* + A )/2 A . Ища симметричное равновесие, при котором оба игрока сотрудничают, если a i a* , мы решаем эту задачу для а* = 1/(2 + 3/ А ).Теперь, когда мы вычислили a* , мы можем вычислить вероятность того, что каждый игрок будет играть в «Сотрудничать» как

При А → 0 это приближается к 2/3 – той же вероятности, что и в смешанной стратегии в полной информационной игре.

Таким образом, мы можем думать о равновесии смешанной стратегии как о результате чистых стратегий, которым следуют игроки, обладающие небольшим количеством частной информации о своих выигрышах.

Технические подробности [ править ]

Доказательство Харсаньи основано на сильном предположении, что возмущения каждого игрока независимы от других игроков. Однако были предприняты дальнейшие уточнения, чтобы сделать теорему более общей. [2] [3]

Основной результат теоремы состоит в том, что все равновесия смешанных стратегий данной игры можно очистить, используя одну и ту же последовательность возмущенных игр. Однако, помимо независимости от возмущений, он опирается на полноценный набор выигрышей для этой последовательности игр. Существуют игры патологического характера, для которых это условие не выполняется.

Основная проблема этих игр попадает в одну из двух категорий: (1) различные смешанные стратегии игры очищаются различными последовательностями возмущенных игр и (2) некоторые смешанные стратегии игры включают в себя слабо доминируемые стратегии. Ни одна смешанная стратегия, включающая слабо доминируемую стратегию, не может быть очищена с помощью этого метода, потому что, если когда-либо существует какая-либо неотрицательная вероятность того, что противник будет использовать стратегию, для которой стратегия со слабо доминируемой стратегией не является лучшим ответом, тогда никто никогда не захочет играть. стратегия со слабым доминированием. Следовательно, предел не соблюдается, поскольку он предполагает разрыв. [4]

Ссылки [ править ]

  1. ^ Харсаньи, Джон К. (1973). «Игры со случайно нарушенными выигрышами: новое обоснование точек равновесия смешанной стратегии». Международный журнал теории игр . 2 : 1–23. дои : 10.1007/BF01737554 . S2CID   154484458 .
  2. ^ Ауманн, Р.Дж. ; Кацнельсон, Ю .; Раднер, Р .; Розенталь, RW ; Вайс, Б. (1983). «Приблизительная очистка смешанных стратегий». Математика исследования операций . 8 (3): 327–341. CiteSeerX   10.1.1.422.3903 . дои : 10.1287/moor.8.3.327 .
  3. ^ Говиндан, Шрихари; Рени, Филип Дж.; Робсон, Артур Дж. (2003). «Краткое доказательство теоремы об очистке Харсаньи». Игры и экономическое поведение . 45 (2): 369–374. дои : 10.1016/S0899-8256(03)00149-0 .
  4. ^ Фуденберг, Дрю ; Тироль, Жан (1991). Теория игр . МТИ Пресс. стр. 233–234. ISBN  9780262061414 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d1b839935444a700713244a3ad6ce76c__1704984000
URL1:https://arc.ask3.ru/arc/aa/d1/6c/d1b839935444a700713244a3ad6ce76c.html
Заголовок, (Title) документа по адресу, URL1:
Purification theorem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)