Доминирование риска
Доминирование риска Доминирование выплат | |
---|---|
Концепция решения в теории игр | |
Отношение | |
Подмножество | Равновесие Нэша |
Значение | |
Предложено | Джон Харсаньи , Райнхард Зельтен |
Используется для | Некооперативные игры |
Пример | Охота на оленя |
Доминирование риска и доминирование выигрыша — это два связанных уточнения равновесия Нэша (NE) концепции решения в теории игр , определенных Джоном Харсаньи и Рейнхардом Зельтеном . Равновесие Нэша считается доминирующим по выигрышу, если оно превосходит по Парето все другие равновесия Нэша в игре. 1 Столкнувшись с выбором среди равновесий, все игроки согласятся с доминирующим равновесием по выигрышу, поскольку оно предлагает каждому игроку по крайней мере такой же выигрыш, как и другие равновесия Нэша. И наоборот, равновесие Нэша считается доминирующим по риску, если оно имеет самый большой бассейн притяжения (т. е. менее рискованно). Это означает, что чем больше неопределённости у игроков относительно действий другого игрока(ов), тем больше вероятность, что они выберут соответствующую ей стратегию.
Матрица выигрышей на рисунке 1 представляет собой простой пример игры для двух игроков и двух стратегий с двумя чистыми равновесиями Нэша. Пара стратегий (Охота, Охота) является доминирующей по выигрышу, поскольку выигрыши для обоих игроков выше по сравнению с другим чистым NE (Собрать, Собрать). С другой стороны, риск (Собрать, Собрать) доминирует (Охота, Охота), поскольку, если существует неопределенность в отношении действий другого игрока, сбор обеспечит более высокий ожидаемый выигрыш. Игра на рис. 1 представляет собой хорошо известную теоретико-игровую дилемму, называемую « охотой на оленя» . Обоснование этого состоит в том, что совместные действия (охота) дают более высокую прибыль, если все игроки объединяют свои навыки, но если неизвестно, помогает ли другой игрок в охоте, собирательство может оказаться лучшей индивидуальной стратегией обеспечения продовольствием, поскольку это не зависит от координации с другим игроком. Кроме того, сбор в одиночку предпочтительнее, чем сбор в соревновании с другими. Как и дилемма Узника , она объясняет, почему коллективные действия могут потерпеть неудачу в отсутствие заслуживающие доверия обязательства .
|
|
Формальное определение
[ редактировать ]Игра, представленная на рис. 2, является координационной , если для игрока 1 (строки) выполняются следующие неравенства выигрышей: A > B, D > C, а для игрока 2 (столбцы): a > b, d > c. Пары стратегий (H, H) и (G, G) являются тогда единственными чистыми равновесиями Нэша. Кроме того, существует смешанное равновесие Нэша, где игрок 1 играет H с вероятностью p = (dc)/(ab-c+d) и G с вероятностью 1–p; игрок 2 играет H с вероятностью q = (DC)/(AB-C+D) и G с вероятностью 1–q.
Выигрыш пары стратегий (H, H) доминирует (G, G), если A ≥ D, a ≥ d и хотя бы одно из двух является строгим неравенством: A > D или a > d.
Риск пары стратегий (G, G) доминирует (H, H), если произведение потерь от отклонения выше для (G, G) (Harsany and Selten, 1988, лемма 5.4.4). Другими словами, если выполнено следующее неравенство: (C – D)(c – d)≥(B – A)(b – a) . Если неравенство строгое, то (G, G) строго доминирует риск (H, H). 2 (То есть у игроков больше стимулов отклоняться).
Если игра симметрична, то есть A = a, B = b и т. д., неравенство допускает простую интерпретацию: мы предполагаем, что игроки не уверены в том, какую стратегию выберет противник, и назначаем вероятности для каждой стратегии. Если каждый игрок присваивает вероятности ½ для H и G, то (G, G) риск доминирует (H, H), если ожидаемый выигрыш от игры G превышает ожидаемый выигрыш от игры H: ½ B + ½ D ≥ ½ A + ½ C или просто B + D ≥ A + C.
Другой способ расчета равновесия с доминирующим риском — это вычислить фактор риска для всех равновесий и найти равновесие с наименьшим фактором риска. Чтобы рассчитать фактор риска в нашей игре 2x2, рассмотрим ожидаемый выигрыш игрока, если он сыграет H: (где p — вероятность того, что другой игрок сыграет H) и сравните ее с ожидаемым выигрышем, если он сыграет G: . Значение p , которое делает эти два ожидаемых значения равными, является фактором риска для равновесия (H, H), при этом фактор риска для игры (G, G). Вы также можете вычислить фактор риска для игры (G, G), выполнив тот же расчет, но установив p как вероятность того, что другой игрок сыграет G. Интерпретация p заключается в том, что это наименьшая вероятность того, что противник должен будет использовать эту стратегию. так что собственный выигрыш человека от копирования стратегии противника больше, чем если бы он использовал другую стратегию.
Выбор равновесия
[ редактировать ]Ряд эволюционных подходов установили, что при игре в большой популяции игроки могут не использовать стратегию равновесия с доминированием выигрыша и вместо этого оказаться в равновесии с доминированием выигрыша и доминированием риска. Две отдельные эволюционные модели поддерживают идею о том, что равновесие с доминированием риска более вероятно. Первая модель, основанная на динамике репликаторов , предсказывает, что популяция с большей вероятностью примет равновесие с доминированием риска, чем равновесие с доминированием выигрыша. Вторая модель, основанная на стратегии наилучшего реагирования пересмотре и мутации , предсказывает, что состояние с доминирующим риском является единственным стохастически стабильным равновесием. Обе модели предполагают, что в популяции из N игроков играют несколько игр для двух игроков. Игроки подбираются с противниками случайным образом, при этом каждый игрок имеет равную вероятность вытянуть любого из N-1 других игроков. Игроки начинают с чистой стратегии G или H и разыгрывают эту стратегию против своего противника. В динамике репликатора популяционная игра повторяется в последовательных поколениях, где субпопуляции меняются в зависимости от успеха выбранных ими стратегий. В лучшем случае игроки обновляют свои стратегии, чтобы улучшить ожидаемые выигрыши в последующих поколениях. Кандори, Майлат и Роб (1993) и Янг (1993) признали, что если правило обновления стратегии допускает мутации 4 , и вероятность мутации исчезает, т.е. асимптотически достигает нуля с течением времени, вероятность того, что равновесие с доминирующим риском будет достигнуто, становится равным единице, даже если в нем доминирует выигрыш. 3
Примечания
[ редактировать ]- ^ 1 Единственное равновесие Нэша тривиально является доминирующим по выигрышу и риску, если оно является единственным NE в игре.
- ^ 2 Подобные различия между строгими и слабыми существуют для большинства определений здесь, но не обозначаются явно, если это не необходимо.
- ^ 3 Харсаньи и Селтен (1988) предполагают, что равновесие с доминирующим выигрышем является рациональным выбором в игре «Охота на оленей», однако Харсаньи (1995) отказался от этого вывода, приняв доминирование риска в качестве соответствующего критерия выбора.
Ссылки
[ редактировать ]- Сэмюэл Боулз: Микроэкономика: поведение, институты и эволюция , Princeton University Press, стр. 45–46 (2004). ISBN 0-691-09163-3
- Дрю Фуденберг и Дэвид К. Левин: Теория обучения в играх , MIT Press, стр. 27 (1999) ISBN 0-262-06194-5
- Джон К. Харсаньи: « Новая теория выбора равновесия для игр с полной информацией », Games and Economic Behavior 8, стр. 91–122 (1995).
- Джон К. Харсаньи и Рейнхард Зельтен: Общая теория выбора равновесия в играх , MIT Press (1988) ISBN 0-262-08173-3
- Мичихиро Кандори , Джордж Дж. Майлат и Рафаэль Роб : «Обучение, мутация и долгосрочное равновесие в играх», Econometrica 61, стр. 29–56 (1993) .
- Роджер Б. Майерсон: Теория игр, анализ конфликтов , издательство Гарвардского университета, стр. 118–119 (1991) ISBN 0-674-34115-5
- Ларри Самуэльсон : Эволюционные игры и выбор равновесия , MIT Press (1997) ISBN 0-262-19382-5
- Х. Пейтон Янг: «Эволюция конвенций», Econometrica , 61, стр. 57–84 (1993) .
- Х. Пейтон Янг: индивидуальная стратегия и социальная структура , Princeton University Press (1998) ISBN 0-691-08687-7