Теорема очистки

В теории игр теорему очистки ввел нобелевский лауреат Джон Харсаньи в 1973 году. ^[1] Теорема призвана оправдать загадочный аспект в смешанной стратегии равновесия Нэша : каждому игроку совершенно безразлично каждое из действий, которым он придает ненулевой вес, однако он смешивает их так, чтобы сделать любого другого игрока также безразличным.

Равновесия смешанной стратегии объясняются как предел равновесия чистой стратегии для нарушенной игры с неполной информацией , в которой выигрыши каждого игрока известны им самим, но не их противникам. Идея состоит в том, что предсказанная смешанная стратегия исходной игры возникает как постоянно улучшающаяся аппроксимация игры, которую не заметил теоретик, создавший исходную идеализированную игру.

Кажущаяся смешанная природа стратегии на самом деле является результатом того, что каждый игрок использует чистую стратегию с пороговыми значениями, которые зависят от ожидаемого распределения по континууму выигрышей, которые может получить игрок. По мере того как этот континуум сжимается до нуля, стратегии игроков сходятся к предсказанному равновесию Нэша исходной, невозмущенной, полной информационной игры.

Результат также является важным аспектом современных исследований в области эволюционной теории игр , где искаженные значения интерпретируются как распределения по типам игроков, случайно объединенных в пары для игры.

Пример [ править ]

	С	Д
С	3, 3	2, 4
Д	4, 2	0, 0
Рис. 1: Ястреб-Голубь. игра

Рассмотрим показанную здесь игру «Ястреб–Голубь» . В игре есть два равновесия чистой стратегии (Дефект, Сотрудничество) и (Сотрудничество, Дефект). Также существует смешанное равновесие, в котором каждый игрок играет «Сотрудничать» с вероятностью 2/3.

Предположим, что каждый игрок i несет дополнительные затраты a _i от игры в «Сотрудничать», которые равномерно распределены на [− A , A ]. Игроки знают только свою ценность этой стоимости. Итак, это игра с неполной информацией , которую мы можем решить, используя байесовское равновесие Нэша . Вероятность того, что a _i ≤ а* равно ( а* + А /2 А. ) Если игрок 2 сотрудничает, когда a ₂ ≤ a* , то ожидаемая полезность игрока 1 от сотрудничества равна − a ₁ + 3( a* + A )/2 A + 2(1 − ( a* + A )/2 A ) ; его ожидаемая полезность от дезертирства равна 4( a* + A )/2 A . Следовательно, он сам должен Сотрудничать, когда a ₁ ≤ 2 - 3( a* + A )/2 A . Ища симметричное равновесие, при котором оба игрока сотрудничают, если a _i ≤ a* , мы решаем эту задачу для а* = 1/(2 + 3/ А ).Теперь, когда мы вычислили a* , мы можем вычислить вероятность того, что каждый игрок будет играть в «Сотрудничать» как

\Pr(a_{i}\leq a^{*})={\frac {{\frac {1}{2+3/A}}+A}{2A}}={\frac {A}{4A^{2}+6A}}+{\frac {1}{2}}.

При А → 0 это приближается к 2/3 – той же вероятности, что и в смешанной стратегии в полной информационной игре.

Таким образом, мы можем думать о равновесии смешанной стратегии как о результате чистых стратегий, которым следуют игроки, обладающие небольшим количеством частной информации о своих выигрышах.

Технические подробности [ править ]

Доказательство Харсаньи основано на сильном предположении, что возмущения каждого игрока независимы от других игроков. Однако были предприняты дальнейшие уточнения, чтобы сделать теорему более общей. ^[2]^[3]

Основной результат теоремы состоит в том, что все равновесия смешанных стратегий данной игры можно очистить, используя одну и ту же последовательность возмущенных игр. Однако, помимо независимости от возмущений, он опирается на полноценный набор выигрышей для этой последовательности игр. Существуют игры патологического характера, для которых это условие не выполняется.

Основная проблема этих игр попадает в одну из двух категорий: (1) различные смешанные стратегии игры очищаются различными последовательностями возмущенных игр и (2) некоторые смешанные стратегии игры включают в себя слабо доминируемые стратегии. Ни одна смешанная стратегия, включающая слабо доминируемую стратегию, не может быть очищена с помощью этого метода, потому что, если когда-либо существует какая-либо неотрицательная вероятность того, что противник будет использовать стратегию, для которой стратегия со слабо доминируемой стратегией не является лучшим ответом, тогда никто никогда не захочет играть. стратегия со слабым доминированием. Следовательно, предел не соблюдается, поскольку он предполагает разрыв. ^[4]

Ссылки [ править ]

^ Харсаньи, Джон К. (1973). «Игры со случайно нарушенными выигрышами: новое обоснование точек равновесия смешанной стратегии». Международный журнал теории игр . 2 : 1–23. дои : 10.1007/BF01737554 . S2CID 154484458 .
^ Ауманн, Р.Дж. ; Кацнельсон, Ю .; Раднер, Р .; Розенталь, RW ; Вайс, Б. (1983). «Приблизительная очистка смешанных стратегий». Математика исследования операций . 8 (3): 327–341. CiteSeerX 10.1.1.422.3903 . дои : 10.1287/moor.8.3.327 .
^ Говиндан, Шрихари; Рени, Филип Дж.; Робсон, Артур Дж. (2003). «Краткое доказательство теоремы об очистке Харсаньи». Игры и экономическое поведение . 45 (2): 369–374. дои : 10.1016/S0899-8256(03)00149-0 .
^ Фуденберг, Дрю ; Тироль, Жан (1991). Теория игр . МТИ Пресс. стр. 233–234. ISBN 9780262061414 .

[1] Харсаньи, Джон К. (1973). «Игры со случайно нарушенными выигрышами: новое обоснование точек равновесия смешанной стратегии». Международный журнал теории игр . 2 : 1–23. дои : 10.1007/BF01737554 . S2CID 154484458 .

[2] Ауманн, Р.Дж. ; Кацнельсон, Ю .; Раднер, Р .; Розенталь, RW ; Вайс, Б. (1983). «Приблизительная очистка смешанных стратегий». Математика исследования операций . 8 (3): 327–341. CiteSeerX 10.1.1.422.3903 . дои : 10.1287/moor.8.3.327 .

[3] Говиндан, Шрихари; Рени, Филип Дж.; Робсон, Артур Дж. (2003). «Краткое доказательство теоремы об очистке Харсаньи». Игры и экономическое поведение . 45 (2): 369–374. дои : 10.1016/S0899-8256(03)00149-0 .

[4] Фуденберг, Дрю ; Тироль, Жан (1991). Теория игр . МТИ Пресс. стр. 233–234. ISBN 9780262061414 .

[1]

[2]

[3]

[4]

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра по обмену подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теорема Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	Альфа-бета-обрезка Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования