Стратегия с доминированием Макса
В теории игр стратегия с доминированием по максимуму — это стратегия , которая не является лучшим ответом на какой-либо стратегический профиль других игроков. Это расширение понятия строго доминируемых стратегий , которые также имеют максимальное доминирование.
Определение
[ редактировать ]Стратегии с доминированием Макса
[ редактировать ]Стратегия игрока является максимально доминируемым , если для каждого профиля стратегии других игроков есть стратегия такой, что . Это определение означает, что не является лучшим ответом ни на один профиль стратегии , поскольку для каждого такого профиля стратегии существует другая стратегия что дает более высокую полезность, чем для игрока .
Если стратегия доминирует строго стратегия тогда оно также является максимально доминируемым , поскольку для каждого профиля стратегии других игроков , это стратегия, по которой .
Даже если строго доминируется смешанная стратегия, а также максимально доминируемая .
Стратегии со слабым доминированием по максимуму
[ редактировать ]Стратегия игрока является слабо максимально доминируемым , если для каждого профиля стратегии других игроков есть стратегия такой, что . Это определение означает, что либо не лучший ответ , либо не единственный лучший ответ на любой профиль стратегии. , поскольку для каждого такого профиля стратегии существует другая стратегия который дает по крайней мере ту же полезность, что и для игрока .
Если стратегия доминирует слабо стратегия тогда он также слабо доминируется по максимуму , поскольку для каждого профиля стратегии других игроков , это стратегия, по которой .
Даже если слабо доминируется смешанной стратегией, а также слабо доминируется по максимуму .
Макс-решаемые игры
[ редактировать ]Определение
[ редактировать ]Игра называется макс-разрешимой, если путем итерационного исключения стратегий с макс-доминированием в конце остается только один профиль стратегии.
Более формально мы говорим, что является макс-разрешимой, если существует последовательность игр такой, что:
- получается путем удаления одной стратегии с доминированием максимального максимума из пространства стратегий одного игрока в .
- Остался только один профиль стратегии. .
Очевидно, что каждая максимально разрешимая игра имеет уникальное чистое равновесие Нэша , которое представляет собой профиль стратегии, оставшийся в .
Как и в предыдущей части, можно соответственно определить понятие слабо максимально разрешимых игр , которые представляют собой игры, для которых игра с единым профилем стратегии может быть достигнута путем исключения стратегий со слабо макс-доминированием . Основное отличие состоит в том, что игры со слабым доминированием максимума могут иметь более одного чистого равновесия Нэша и что порядок исключения может привести к различным равновесиям Нэша.
Пример
[ редактировать ]Сотрудничать | Дефект | |
Сотрудничать | -1, -1 | -5, 0 |
Дефект | 0, -5 | -3, -3 |
Рис. 1: матрица выигрышей заключенного дилеммы |
Дилемма заключенного является примером игры с максимальным разрешением (поскольку она также разрешима с доминированием). В стратегии сотрудничества максимально доминирует дефект стратегии для обоих игроков, поскольку дефект игры всегда дает игроку более высокую полезность, независимо от того, что играет другой игрок. Чтобы увидеть это, обратите внимание: если игрок в ряду играет в сотрудничестве, то игрок в столбце предпочтет сыграть в отказ и выйти на свободу, чем играть в сотрудничество и отсидеть один год в тюрьме. Если игрок в ряду играет в «дефект», то игрок в столбце предпочтет сыграть в «дефект» и отсидеть три года в тюрьме, а не играть в сотрудничество и отсидеть пять лет в тюрьме.
Максимально решаемые игры и динамика лучших ответов
[ редактировать ]В любой игре с максимальным разрешением динамика наилучшего ответа в конечном итоге приводит к уникальному чистому равновесию по Нэшу в игре. Чтобы увидеть это, все, что нам нужно сделать, это заметить, что если представляет собой последовательность выбывания в игре (это означает, что сначала исключается из пространства стратегий некоторого игрока, поскольку в нем доминирует максимум, то исключается и т. д.), то в динамике наилучшего ответа никогда не будет воспроизводиться игроком после одной итерации лучших ответов, никогда не будет сыгран игроком после двух итераций лучших ответов и так далее. Причина этого в том, что не лучший ответ на любой стратегический профиль других игроков поэтому после одной итерации лучших ответов игрок, должно быть, выбрал другую стратегию. Поскольку мы понимаем, что никогда не вернемся в в любой итерации лучших ответов мы можем рассматривать игру после одной итерации лучших ответов так, как будто выбыл из игры, и завершите доказательство по индукции.
1, 1 | 0, 0 |
1, 0 | 0, 1 |
0, 1 | 1, 0 |
Тогда может показаться неожиданным, что слабо решаемые по максимуму игры не обязательно сходятся к чистому равновесию Нэша при использовании динамики наилучшего ответа , как можно видеть в игре справа. Если игра начинается с нижней левой ячейки матрицы, то возможна следующая наилучшая динамика повтора: игрок строки перемещается на одну строку вверх в центральную строку, игрок столбца перемещается в правый столбец, игрок строки возвращается в нижний ряд, игрок столбца возвращается к левому столбцу и так далее. Очевидно, что это никогда не сходится к единственному чистому равновесию по Нэшу в игре (которое представляет собой верхнюю левую ячейку в матрице выигрышей ).
См. также
[ редактировать ]Внешние ссылки и ссылки
[ редактировать ]- Нисан, Ноам; Шапира, Майкл; Зохар, Авив (2009), Асинхронная динамика лучшего ответа , Берлин: Springer-Verlag, заархивировано из оригинала 17 апреля 2003 г. Асинхронная динамика наилучшего ответа. [1] .