Доминирование риска

Доминирование риска
Доминирование выплат
Доминирование риска ; Доминирование выплат
Концепция решения в теории игр
Отношение
Подмножество	Равновесие Нэша
Значение
Предложено	Джон Харсаньи , Райнхард Зельтен
Используется для	Некооперативные игры
Пример	Охота на оленя

Доминирование риска и доминирование выигрыша — это два связанных уточнения равновесия Нэша (NE) концепции решения в теории игр , определенных Джоном Харсаньи и Рейнхардом Зельтеном . Равновесие Нэша считается доминирующим по выигрышу, если оно превосходит по Парето все другие равновесия Нэша в игре. ¹ Столкнувшись с выбором среди равновесий, все игроки согласятся с доминирующим равновесием по выигрышу, поскольку оно предлагает каждому игроку по крайней мере такой же выигрыш, как и другие равновесия Нэша. И наоборот, равновесие Нэша считается доминирующим по риску, если оно имеет самый большой бассейн притяжения (т. е. менее рискованно). Это означает, что чем больше неопределённости у игроков относительно действий другого игрока(ов), тем больше вероятность, что они выберут соответствующую ей стратегию.

Матрица выигрышей на рисунке 1 представляет собой простой пример игры для двух игроков и двух стратегий с двумя чистыми равновесиями Нэша. Пара стратегий (Охота, Охота) является доминирующей по выигрышу, поскольку выигрыши для обоих игроков выше по сравнению с другим чистым NE (Собрать, Собрать). С другой стороны, риск (Собрать, Собрать) доминирует (Охота, Охота), поскольку, если существует неопределенность в отношении действий другого игрока, сбор обеспечит более высокий ожидаемый выигрыш. Игра на рис. 1 представляет собой хорошо известную теоретико-игровую дилемму, называемую « охотой на оленя» . Обоснование этого состоит в том, что совместные действия (охота) дают более высокую прибыль, если все игроки объединяют свои навыки, но если неизвестно, помогает ли другой игрок в охоте, собирательство может оказаться лучшей индивидуальной стратегией обеспечения продовольствием, поскольку это не зависит от координации с другим игроком. Кроме того, сбор в одиночку предпочтительнее, чем сбор в соревновании с другими. Как и дилемма Узника , она объясняет, почему коллективные действия могут потерпеть неудачу в отсутствие заслуживающие доверия обязательства .

	Охота	Собирать
Охота	5, 5	0, 4
Собирать	4, 0	2, 2
Рис. 1: охоты на оленя Пример

	ЧАС	Г
ЧАС	А, а	С, б
Г	Б, в	Д, д
Рис. 2: Общая координационная игра.

Формальное определение

Игра, представленная на рис. 2, является координационной , если для игрока 1 (строки) выполняются следующие неравенства выигрышей: A > B, D > C, а для игрока 2 (столбцы): a > b, d > c. Пары стратегий (H, H) и (G, G) являются тогда единственными чистыми равновесиями Нэша. Кроме того, существует смешанное равновесие Нэша, где игрок 1 играет H с вероятностью p = (dc)/(ab-c+d) и G с вероятностью 1–p; игрок 2 играет H с вероятностью q = (DC)/(AB-C+D) и G с вероятностью 1–q.

Выигрыш пары стратегий (H, H) доминирует (G, G), если A ≥ D, a ≥ d и хотя бы одно из двух является строгим неравенством: A > D или a > d.

Риск пары стратегий (G, G) доминирует (H, H), если произведение потерь от отклонения выше для (G, G) (Harsany and Selten, 1988, лемма 5.4.4). Другими словами, если выполнено следующее неравенство: (C – D)(c – d)≥(B – A)(b – a) . Если неравенство строгое, то (G, G) строго доминирует риск (H, H). ²(То есть у игроков больше стимулов отклоняться).

Если игра симметрична, то есть A = a, B = b и т. д., неравенство допускает простую интерпретацию: мы предполагаем, что игроки не уверены в том, какую стратегию выберет противник, и назначаем вероятности для каждой стратегии. Если каждый игрок присваивает вероятности ½ для H и G, то (G, G) риск доминирует (H, H), если ожидаемый выигрыш от игры G превышает ожидаемый выигрыш от игры H: ½ B + ½ D ≥ ½ A + ½ C или просто B + D ≥ A + C.

Другой способ расчета равновесия с доминирующим риском — это вычислить фактор риска для всех равновесий и найти равновесие с наименьшим фактором риска. Чтобы рассчитать фактор риска в нашей игре 2x2, рассмотрим ожидаемый выигрыш игрока, если он сыграет H: $E[\pi _{H}]=pA+(1-p)C$ (где p — вероятность того, что другой игрок сыграет H) и сравните ее с ожидаемым выигрышем, если он сыграет G: $E[\pi _{G}]=pB+(1-p)D$ . Значение p , которое делает эти два ожидаемых значения равными, является фактором риска для равновесия (H, H), при этом $1-p$ фактор риска для игры (G, G). Вы также можете вычислить фактор риска для игры (G, G), выполнив тот же расчет, но установив p как вероятность того, что другой игрок сыграет G. Интерпретация p заключается в том, что это наименьшая вероятность того, что противник должен будет использовать эту стратегию. так что собственный выигрыш человека от копирования стратегии противника больше, чем если бы он использовал другую стратегию.

Выбор равновесия

Ряд эволюционных подходов установили, что при игре в большой популяции игроки могут не использовать стратегию равновесия с доминированием выигрыша и вместо этого оказаться в равновесии с доминированием выигрыша и доминированием риска. Две отдельные эволюционные модели поддерживают идею о том, что равновесие с доминированием риска более вероятно. Первая модель, основанная на динамике репликаторов , предсказывает, что популяция с большей вероятностью примет равновесие с доминированием риска, чем равновесие с доминированием выигрыша. Вторая модель, основанная на стратегии наилучшего реагирования пересмотре и мутации , предсказывает, что состояние с доминирующим риском является единственным стохастически стабильным равновесием. Обе модели предполагают, что в популяции из N игроков играют несколько игр для двух игроков. Игроки подбираются с противниками случайным образом, при этом каждый игрок имеет равную вероятность вытянуть любого из N-1 других игроков. Игроки начинают с чистой стратегии G или H и разыгрывают эту стратегию против своего противника. В динамике репликатора популяционная игра повторяется в последовательных поколениях, где субпопуляции меняются в зависимости от успеха выбранных ими стратегий. В лучшем случае игроки обновляют свои стратегии, чтобы улучшить ожидаемые выигрыши в последующих поколениях. Кандори, Майлат и Роб (1993) и Янг (1993) признали, что если правило обновления стратегии допускает мутации ⁴, и вероятность мутации исчезает, т.е. асимптотически достигает нуля с течением времени, вероятность того, что равновесие с доминирующим риском будет достигнуто, становится равным единице, даже если в нем доминирует выигрыш. ³

Примечания

^ 1 Единственное равновесие Нэша тривиально является доминирующим по выигрышу и риску, если оно является единственным NE в игре.
^ 2 Подобные различия между строгими и слабыми существуют для большинства определений здесь, но не обозначаются явно, если это не необходимо.
^ 3 Харсаньи и Селтен (1988) предполагают, что равновесие с доминирующим выигрышем является рациональным выбором в игре «Охота на оленей», однако Харсаньи (1995) отказался от этого вывода, приняв доминирование риска в качестве соответствующего критерия выбора.

Ссылки

Сэмюэл Боулз: Микроэкономика: поведение, институты и эволюция , Princeton University Press, стр. 45–46 (2004). ISBN 0-691-09163-3
Дрю Фуденберг и Дэвид К. Левин: Теория обучения в играх , MIT Press, стр. 27 (1999) ISBN 0-262-06194-5
Джон К. Харсаньи: « Новая теория выбора равновесия для игр с полной информацией », Games and Economic Behavior 8, стр. 91–122 (1995).
Джон К. Харсаньи и Рейнхард Зельтен: Общая теория выбора равновесия в играх , MIT Press (1988) ISBN 0-262-08173-3
Мичихиро Кандори , Джордж Дж. Майлат и Рафаэль Роб : «Обучение, мутация и долгосрочное равновесие в играх», Econometrica 61, стр. 29–56 (1993) .
Роджер Б. Майерсон: Теория игр, анализ конфликтов , издательство Гарвардского университета, стр. 118–119 (1991) ISBN 0-674-34115-5
Ларри Самуэльсон : Эволюционные игры и выбор равновесия , MIT Press (1997) ISBN 0-262-19382-5
Х. Пейтон Янг: «Эволюция конвенций», Econometrica , 61, стр. 57–84 (1993) .
Х. Пейтон Янг: индивидуальная стратегия и социальная структура , Princeton University Press (1998) ISBN 0-691-08687-7

v т и Темы теории игр
Определения	Игра с пробками Кооперативная игра Определенность Эскалация обязательств Игра развернутой формы Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Краткая игра Конструкция механизма
Равновесие концепции	Байесовское коррелированное равновесие Байесовское равновесие Нэша Равновесие Бержа Основной Коррелированное равновесие Коалиционно-устойчивое равновесие Нэша Эпсилон-равновесие Эволюционно стабильная стратегия Равновесие Гиббса Устойчивое равновесие Мертенса Марковское совершенное равновесие Равновесие Нэша Парето-эффективность Идеальное байесовское равновесие Правильное равновесие Равновесие квантового ответа Практически идеальный баланс Доминирование риска Равновесие удовлетворенности Самоподтверждающееся равновесие Последовательное равновесие Значение Шепли Сильное равновесие Нэша Совершенство подигры Дрожащая рука, равновесие
Стратегии	Умиротворение Обратная индукция Затенение ставок Сговор Дешевый разговор Деэскалация Сдерживание Эскалация Прямая индукция Мрачный триггер Марковская стратегия Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент о краже стратегии Око за око
Классы игр	Аукцион Проблема с переговорами Глобальная игра Непереходная игра Среднее поле игры n игроков игра для Идеальная информация Большая игра Пуассона Потенциальная игра Повторная игра Скрининговая игра Сигнальная игра Строго определенная игра Стохастическая игра Симметричная игра Игра с нулевой суммой
Игры	Идти шахматы Бесконечные шахматы Шашки Аукцион с полной оплатой Дилемма заключенного Игра-обмен подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица игра многоножка Сигнальная игра Льюиса Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Электронная почтовая игра Камень-ножницы-бумага Пиратская игра Диктатор игра Игра «Общественные блага» Блото игра Война на истощение Проблема с баром Эль-Фарол Ярмарочный отдел Ярмарка разрезания торта Бертран конкурс Конкурс Курно конкурс Штакельберга Тупик Дилемма закусочной Угадайте 2/3 от среднего Кун покер Торговая игра Нэша Индукционные головоломки Доверительная игра Игра Принцесса и монстр Проблема встречи
Теоремы	Теорема согласия Ауманна Народная теория Теорема о минимаксе Nash's theorem Теорема Негамакса Теорема очистки Принцип откровения Теорема Спрэга – Гранди Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Дэниел Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Джон Конвей Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Разнообразный	Альфа-бета-обрезка Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации сотрудничество Эволюционная теория игр Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыходная ситуация Топологическая игра Трагедия общего пользования