Jump to content

Стратегическое доминирование

Доминирующая стратегия
Концепция решения в теории игр
Отношение
Подмножество Стратегия (теория игр)
Суперсет Рационализируемая стратегия
Значение
Используется для Дилемма заключенного

В теории игр доминирующая стратегия — это стратегия , которая лучше любой другой стратегии для одного игрока, независимо от того, как будет играть противник этого игрока. Некоторые очень простые игры можно решить, используя доминирование.

Терминология

[ редактировать ]

Игрок может сравнить две стратегии A и B, чтобы определить, какая из них лучше. Результатом сравнения является один из:

  • B строго доминирует (≥) A: выбор B всегда дает лучший результат, чем выбор A, независимо от того, что делают другие игроки.
  • B слабо доминирует (≤) A: выбор B всегда дает по крайней мере такой же хороший результат, как и выбор A, независимо от того, что делают другие игроки, и существует по крайней мере один набор действий противников, для которого B дает лучший результат, чем A. (Обратите внимание, что если B строго доминирует над A, то B слабо доминирует над A. Следовательно, мы можем сказать, что «B доминирует над A» как синоним слова «B слабо доминирует над A».) [1]
  • A слабо доминирует над B: существует по крайней мере один набор действий оппонентов, для которого B дает худший результат, чем A, в то время как все остальные наборы действий противников дают A такой же выигрыш, как и B. (Стратегия A слабо доминирует над B) .
  • игрок В строго доминирует А: выбор Б всегда дает худший результат, чем выбор А, независимо от того, что делают другие игроки. (Стратегия А строго доминирует над Б).
  • Ни A, ни B не доминируют над другим: B и A не эквивалентны, и B не доминирует и не доминирует над A. Выбор A лучше в некоторых случаях, тогда как выбор B лучше в других случаях, в зависимости от того, как именно оппонент выбирает играть. Например, B — «бросить камень», а A — «бросить ножницы» в «Камень, ножницы, бумага » .

Это понятие можно обобщить, выйдя за рамки сравнения двух стратегий.

  • Стратегия B является строго доминирующей , если стратегия B строго доминирует над любой другой возможной стратегией.
  • Стратегия B является слабо доминантной , если стратегия B слабо доминирует над любой другой возможной стратегией.
  • Стратегия B является строго доминируемой , если существует другая стратегия, которая строго доминирует над B.
  • Стратегия B является слабо доминируемой , если существует другая стратегия, слабо доминирующая над B.

Стратегия: Полный план действий для игрока в игре. Полный план на случай непредвиденных обстоятельств — это полная спецификация поведения игрока, описывающая каждое действие, которое игрок предпримет в каждой возможной точке принятия решения. Поскольку наборы информации представляют собой моменты в игре, где игрок должен принять решение, стратегия игрока описывает, что этот игрок будет делать в каждом наборе информации. [2]

Рациональность: предположение, что каждый игрок действует таким образом, чтобы добиться того, что он или она больше всего предпочитает, учитывая вероятности различных результатов; фон Нейман и Моргенштерн показали, что если эти предпочтения удовлетворяют определенным условиям, это математически эквивалентно максимизации выигрыша. Прямым примером максимизации выигрыша является денежная выгода, но для целей анализа теории игр этот выигрыш может иметь любой желаемый результат: денежное вознаграждение, минимизация усилий или дискомфорта или содействие справедливости — все это можно смоделировать как накопление общего дохода. «полезность» для игрока. Допущение рациональности гласит, что игроки всегда будут действовать таким образом, который наилучшим образом соответствует их порядку от лучшего к худшему из различных возможных результатов. [2]

Общее знание : предположение, что каждый игрок знает игру, знает правила и выигрыши, связанные с каждым способом действий, и осознает, что каждый другой игрок имеет такой же уровень понимания. Это предпосылка, которая позволяет игроку вынести оценочное суждение о действиях другого игрока, подкрепленное предположением о рациональности, которое следует принять во внимание при выборе действия. [2]

Доминирование и равновесие Нэша

[ редактировать ]
С Д
С 1, 1 0, 0
Д 0, 0 0, 0

игры Если для одного игрока в игре существует строго доминирующая стратегия, этот игрок будет использовать эту стратегию в каждом из равновесий Нэша . Если оба игрока имеют строго доминирующую стратегию, в игре существует только одно уникальное равновесие Нэша, называемое «равновесием доминирующей стратегии». Однако это равновесие Нэша не обязательно является «эффективным», а это означает, что в игре могут быть неравновесные результаты, которые были бы лучше для обоих игроков. Классическая игра, используемая для иллюстрации этого, — «Дилемма узника» .

Стратегии со строгим доминированием не могут быть частью равновесия Нэша, и поэтому для любого игрока играть ими иррационально. С другой стороны, стратегии со слабым доминированием могут быть частью равновесия Нэша. Например, рассмотрим матрицу выигрышей , изображенную справа.

Стратегия C слабо доминирует над стратегией D. Рассмотрим вариант C : если оппонент играет C, он получает 1; если оппонент играет D, он получает 0. Сравните это с D, где каждый получает 0 независимо от этого. Поскольку в одном случае можно добиться большего, играя в C вместо D и никогда не добиться худшего результата, C слабо доминирует над D. , Несмотря на это, — равновесие Нэша. оба игрока выбирают D. Предположим , Ни один из игроков не добьется большего, отклонившись в одностороннем порядке: если игрок переключится на игру C, он все равно получит 0. Это удовлетворяет требованиям равновесия Нэша. Предположим, что оба игрока выбирают C. Ни один из игроков не добьется большего, если отклонится в одностороннем порядке — если игрок переключится на игру D, он получит 0. Это также удовлетворяет требованиям равновесия Нэша.

Повторное устранение строго доминируемых стратегий

[ редактировать ]

Итерированное устранение (или удаление, или удаление) доминируемых стратегий (также называемое IESDS, или IDSDS, или IRSDS) является одним из распространенных методов решения игр, который включает в себя итеративное удаление доминируемых стратегий. На первом этапе из пространства стратегий каждого из игроков удаляется не более одной доминируемой стратегии, поскольку ни один рациональный игрок никогда не будет использовать эти стратегии. В результате получается новая игра меньшего размера. Некоторые стратегии, над которыми раньше не доминировали, могут доминировать в более мелкой игре. Первый шаг повторяется, создается новая игра еще меньшего размера и так далее. Процесс останавливается, когда ни для одного игрока не найдена доминирующая стратегия. Этот процесс действителен, поскольку предполагается, что рациональность среди игроков общеизвестна , то есть каждый игрок знает, что остальные игроки рациональны, и каждый игрок знает, что остальные игроки знают, что он знает, что остальные игроки игроки рациональны, и так до бесконечности (см. Aumann, 1976).

См. также

[ редактировать ]
  1. ^ Лейтон-Браун, Кевин; Шохам, Йоав (январь 2008 г.). «Основы теории игр: краткое междисциплинарное введение». Обобщающие лекции по искусственному интеллекту и машинному обучению . 2 (1): 36. doi : 10.2200/S00108ED1V01Y200802AIM003 .
  2. ^ Jump up to: а б с Джоэл, Ватсон (9 мая 2013 г.). Стратегия: введение в теорию игр (Третье изд.). Нью-Йорк. ISBN  9780393918380 . OCLC   842323069 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
Эта статья включает в себя материалы из стратегии Dominant на PlanetMath , которая распространяется по лицензии Creative Commons Attribution/Share-Alike .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 33b1aaf29320b19e0b1ad1211b4e6e05__1719321420
URL1:https://arc.ask3.ru/arc/aa/33/05/33b1aaf29320b19e0b1ad1211b4e6e05.html
Заголовок, (Title) документа по адресу, URL1:
Strategic dominance - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)