Стратегическое доминирование
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( январь 2016 г. ) |
Доминирующая стратегия | |
---|---|
Концепция решения в теории игр | |
Отношение | |
Подмножество | Стратегия (теория игр) |
Суперсет | Рационализируемая стратегия |
Значение | |
Используется для | Дилемма заключенного |
В теории игр доминирующая стратегия — это стратегия , которая лучше любой другой стратегии для одного игрока, независимо от того, как будет играть противник этого игрока. Некоторые очень простые игры можно решить, используя доминирование.
Терминология
[ редактировать ]Игрок может сравнить две стратегии A и B, чтобы определить, какая из них лучше. Результатом сравнения является один из:
- B строго доминирует (≥) A: выбор B всегда дает лучший результат, чем выбор A, независимо от того, что делают другие игроки.
- B слабо доминирует (≤) A: выбор B всегда дает по крайней мере такой же хороший результат, как и выбор A, независимо от того, что делают другие игроки, и существует по крайней мере один набор действий противников, для которого B дает лучший результат, чем A. (Обратите внимание, что если B строго доминирует над A, то B слабо доминирует над A. Следовательно, мы можем сказать, что «B доминирует над A» как синоним слова «B слабо доминирует над A».) [1]
- A слабо доминирует над B: существует по крайней мере один набор действий оппонентов, для которого B дает худший результат, чем A, в то время как все остальные наборы действий противников дают A такой же выигрыш, как и B. (Стратегия A слабо доминирует над B) .
- игрок В строго доминирует А: выбор Б всегда дает худший результат, чем выбор А, независимо от того, что делают другие игроки. (Стратегия А строго доминирует над Б).
- Ни A, ни B не доминируют над другим: B и A не эквивалентны, а B не доминирует и не доминирует над A. Выбор A лучше в некоторых случаях, тогда как выбор B лучше в других случаях, в зависимости от того, как именно противник выбирает играть. Например, B — «бросить камень», а A — «бросить ножницы» в «Камень, ножницы, бумага » .
Это понятие можно обобщить, выйдя за рамки сравнения двух стратегий.
- Стратегия B является строго доминирующей , если стратегия B строго доминирует над любой другой возможной стратегией.
- Стратегия B является слабо доминантной , если стратегия B слабо доминирует над любой другой возможной стратегией.
- Стратегия B является строго доминируемой , если существует другая стратегия, которая строго доминирует над B.
- Стратегия B является слабо доминируемой , если существует другая стратегия, слабо доминирующая над B.
Стратегия: Полный план действий для игрока в игре. Полный план на случай непредвиденных обстоятельств — это полная спецификация поведения игрока, описывающая каждое действие, которое игрок предпримет в каждой возможной точке принятия решения. Поскольку наборы информации представляют собой моменты в игре, где игрок должен принять решение, стратегия игрока описывает, что этот игрок будет делать в каждом наборе информации. [2]
Рациональность: предположение, что каждый игрок действует таким образом, чтобы добиться того, что он или она больше всего предпочитает, учитывая вероятности различных результатов; фон Нейман и Моргенштерн показали, что если эти предпочтения удовлетворяют определенным условиям, это математически эквивалентно максимизации выигрыша. Прямым примером максимизации выигрыша является денежная выгода, но для целей анализа теории игр этот выигрыш может иметь любой желаемый результат: денежное вознаграждение, минимизация усилий или дискомфорта или содействие справедливости — все это можно смоделировать как накопление общего дохода. «полезность» для игрока. Допущение рациональности гласит, что игроки всегда будут действовать таким образом, который наилучшим образом соответствует их порядку от лучшего к худшему из различных возможных результатов. [2]
Общее знание : предположение, что каждый игрок знает игру, знает правила и выигрыши, связанные с каждым способом действий, и осознает, что каждый другой игрок имеет такой же уровень понимания. Это предпосылка, которая позволяет игроку вынести оценочное суждение о действиях другого игрока, подкрепленное предположением о рациональности, которое следует принять во внимание при выборе действия. [2]
Доминирование и равновесие Нэша
[ редактировать ]С | Д | |
---|---|---|
С | 1, 1 | 0, 0 |
Д | 0, 0 | 0, 0 |
игры Если для одного игрока в игре существует строго доминирующая стратегия, этот игрок будет использовать эту стратегию в каждом из равновесий Нэша . Если оба игрока имеют строго доминирующую стратегию, в игре существует только одно уникальное равновесие Нэша, называемое «равновесием доминирующей стратегии». Однако это равновесие Нэша не обязательно является «эффективным», а это означает, что в игре могут быть неравновесные результаты, которые были бы лучше для обоих игроков. Классическая игра, используемая для иллюстрации этого, — «Дилемма узника» .
Стратегии со строгим доминированием не могут быть частью равновесия Нэша, и поэтому для любого игрока играть ими иррационально. С другой стороны, стратегии со слабым доминированием могут быть частью равновесия Нэша. Например, рассмотрим матрицу выигрышей , изображенную справа.
Стратегия C слабо доминирует над стратегией D. Рассмотрим вариант C : если оппонент играет C, он получает 1; если оппонент играет D, он получает 0. Сравните это с D, где каждый получает 0 в любом случае. Поскольку в одном случае можно добиться большего, играя в C вместо D и никогда не добиться худшего результата, C слабо доминирует над D. , Несмотря на это, — равновесие Нэша. оба игрока выбирают D. Предположим , Ни один из игроков не добьется большего, отклонившись в одностороннем порядке: если игрок переключится на игру C, он все равно получит 0. Это удовлетворяет требованиям равновесия Нэша. Предположим, что оба игрока выбирают C. Ни один из игроков не добьется большего, если отклонится в одностороннем порядке — если игрок переключится на игру D, он получит 0. Это также удовлетворяет требованиям равновесия Нэша.
Повторное устранение строго доминируемых стратегий
[ редактировать ]Итерированное устранение (или удаление, или удаление) доминируемых стратегий (также называемое IESDS, или IDSDS, или IRSDS) является одним из распространенных методов решения игр, который включает в себя итеративное удаление доминируемых стратегий. На первом этапе из пространства стратегий каждого из игроков удаляется не более одной доминируемой стратегии, поскольку ни один рациональный игрок никогда не будет использовать эти стратегии. В результате получается новая игра меньшего размера. Некоторые стратегии, над которыми раньше не доминировали, могут доминировать в более мелкой игре. Первый шаг повторяется, создается новая игра еще меньшего размера и так далее. Процесс останавливается, когда ни для одного игрока не найдена доминирующая стратегия. Этот процесс действителен, поскольку предполагается, что рациональность среди игроков общеизвестна , то есть каждый игрок знает, что остальные игроки рациональны, и каждый игрок знает, что остальные игроки знают, что он знает, что остальные игроки игроки рациональны, и так до бесконечности (см. Aumann, 1976).
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Лейтон-Браун, Кевин; Шохам, Йоав (январь 2008 г.). «Основы теории игр: краткое междисциплинарное введение». Обобщающие лекции по искусственному интеллекту и машинному обучению . 2 (1): 36. doi : 10.2200/S00108ED1V01Y200802AIM003 .
- ^ Jump up to: а б с Джоэл, Ватсон (9 мая 2013 г.). Стратегия: введение в теорию игр (Третье изд.). Нью-Йорк. ISBN 9780393918380 . OCLC 842323069 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )
- Фуденберг, Дрю; Тироль, Жан (1993). Теория игр . МТИ Пресс.
- Гиббонс, Роберт (1992). Теория игр для экономистов-прикладников . Издательство Принстонского университета. ISBN 0-691-00395-5 .
- Гинтис, Герберт (2000). Развитие теории игр . Издательство Принстонского университета. ISBN 0-691-00943-0 .
- Лейтон-Браун, Кевин; Шохам, Йоав (2008). Основы теории игр: краткое междисциплинарное введение . Сан-Рафаэль, Калифорния: Издательство Morgan & Claypool. ISBN 978-1-59829-593-1 . . 88-страничное математическое введение; см. раздел 3.3. Бесплатно онлайн во многих университетах.
- Рапопорт, А. (1966). Теория игр двух человек: основные идеи . Издательство Мичиганского университета.
- Курс теории игр Джима Рэтлиффа: стратегическое доминирование
- Шохам, Йоав; Лейтон-Браун, Кевин (2009). Мультиагентные системы: алгоритмические, теоретико-игровые и логические основы . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-89943-7 . Полный справочник с вычислительной точки зрения; см. разделы 3.4.3, 4.5. Можно скачать бесплатно в Интернете .
- «Строгое доминирование в смешанных стратегиях - Теория игр 101». gametheory101.com . Проверено 17 декабря 2021 г.
- Уотсон Джоэл. Стратегия: Введение в теорию игр . Третье изд. WW Нортон и компания, 2013.
- Эта статья включает в себя материалы из стратегии Dominant на PlanetMath , которая распространяется по лицензии Creative Commons Attribution/Share-Alike .