Jump to content

Стратегия с доминированием Макса

В теории игр стратегия с доминированием по максимуму — это стратегия , которая не является лучшим ответом на какой-либо стратегический профиль других игроков. Это расширение понятия строго доминируемых стратегий , которые также имеют максимальное доминирование.

Определение

[ редактировать ]

Стратегии с доминированием Макса

[ редактировать ]

Стратегия игрока является максимально доминируемым , если для каждого профиля стратегии других игроков есть стратегия такой, что . Это определение означает, что не является лучшим ответом ни на один профиль стратегии , поскольку для каждого такого профиля стратегии существует другая стратегия что дает более высокую полезность, чем для игрока .

Если стратегия доминирует строго стратегия тогда оно также является максимально доминируемым , поскольку для каждого профиля стратегии других игроков , это стратегия, по которой .

Даже если строго доминируется смешанная стратегия, а также максимально доминируемая .

Стратегии со слабым доминированием по максимуму

[ редактировать ]

Стратегия игрока является слабо максимально доминируемым , если для каждого профиля стратегии других игроков есть стратегия такой, что . Это определение означает, что либо не лучший ответ , либо не единственный лучший ответ на любой профиль стратегии. , поскольку для каждого такого профиля стратегии существует другая стратегия который дает по крайней мере ту же полезность, что и для игрока .

Если стратегия доминирует слабо стратегия тогда он также слабо доминируется по максимуму , поскольку для каждого профиля стратегии других игроков , это стратегия, по которой .

Даже если слабо доминируется смешанной стратегией, а также слабо доминируется по максимуму .

Макс-решаемые игры

[ редактировать ]

Определение

[ редактировать ]

Игра называется макс-разрешимой, если путем итерационного исключения стратегий с макс-доминированием в конце остается только один профиль стратегии.

Более формально мы говорим, что является макс-разрешимой, если существует последовательность игр такой, что:

  • получается путем удаления одной стратегии с доминированием максимального максимума из пространства стратегий одного игрока в .
  • Остался только один профиль стратегии. .

Очевидно, что каждая максимально разрешимая игра имеет уникальное чистое равновесие Нэша , которое представляет собой профиль стратегии, оставшийся в .

Как и в предыдущей части, можно соответственно определить понятие слабо максимально разрешимых игр , которые представляют собой игры, для которых игра с единым профилем стратегии может быть достигнута путем исключения стратегий со слабо макс-доминированием . Основное отличие состоит в том, что игры со слабым доминированием максимума могут иметь более одного чистого равновесия Нэша и что порядок исключения может привести к различным равновесиям Нэша.

Сотрудничать Дефект
Сотрудничать -1, -1 -5, 0
Дефект 0, -5 -3, -3
Рис. 1: матрица выигрышей заключенного дилеммы

Дилемма заключенного является примером игры с максимальным разрешением (поскольку она также разрешима с доминированием). В стратегии сотрудничества максимально доминирует дефект стратегии для обоих игроков, поскольку дефект игры всегда дает игроку более высокую полезность, независимо от того, что играет другой игрок. Чтобы увидеть это, обратите внимание: если игрок в ряду играет в сотрудничестве, то игрок в столбце предпочтет сыграть в отказ и выйти на свободу, чем играть в сотрудничество и отсидеть один год в тюрьме. Если игрок в ряду играет в «дефект», то игрок в столбце предпочтет сыграть в «дефект» и отсидеть три года в тюрьме, а не играть в сотрудничество и отсидеть пять лет в тюрьме.

Максимально решаемые игры и динамика лучших ответов

[ редактировать ]

В любой игре с максимальным разрешением динамика наилучшего ответа в конечном итоге приводит к уникальному чистому равновесию по Нэшу в игре. Чтобы увидеть это, все, что нам нужно сделать, это заметить, что если представляет собой последовательность выбывания в игре (это означает, что сначала исключается из пространства стратегий некоторого игрока, поскольку в нем доминирует максимум, то исключается и т. д.), то в динамике наилучшего ответа никогда не будет воспроизводиться игроком после одной итерации лучших ответов, никогда не будет сыгран игроком после двух итераций лучших ответов и так далее. Причина этого в том, что не лучший ответ на любой стратегический профиль других игроков поэтому после одной итерации лучших ответов игрок, должно быть, выбрал другую стратегию. Поскольку мы понимаем, что никогда не вернемся в в любой итерации лучших ответов мы можем рассматривать игру после одной итерации лучших ответов так, как будто выбыл из игры, и завершите доказательство по индукции.

Слабо макс-решаемая игра
1, 1 0, 0
1, 0 0, 1
0, 1 1, 0

Тогда может показаться неожиданным, что слабо решаемые по максимуму игры не обязательно сходятся к чистому равновесию Нэша при использовании динамики наилучшего ответа , как можно видеть в игре справа. Если игра начинается с нижней левой ячейки матрицы, то возможна следующая наилучшая динамика повтора: игрок строки перемещается на одну строку вверх в центральную строку, игрок столбца перемещается в правый столбец, игрок строки возвращается в нижний ряд, игрок столбца возвращается к левому столбцу и так далее. Очевидно, что это никогда не сходится к единственному чистому равновесию по Нэшу в игре (которое представляет собой верхнюю левую ячейку в матрице выигрышей ).

См. также

[ редактировать ]

Доминирование (теория игр)

[ редактировать ]
  • Нисан, Ноам; Шапира, Майкл; Зохар, Авив (2009), Асинхронная динамика лучшего ответа , Берлин: Springer-Verlag, заархивировано из оригинала 17 апреля 2003 г. Асинхронная динамика наилучшего ответа. [1] .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 75feac272d6db6dc56f6df9ad60e3f1d__1680015780
URL1:https://arc.ask3.ru/arc/aa/75/1d/75feac272d6db6dc56f6df9ad60e3f1d.html
Заголовок, (Title) документа по адресу, URL1:
Max-dominated strategy - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)