Равновесие удовлетворенности
Равновесие удовлетворенности | |
---|---|
Концепция решения в теории игр | |
Отношение | |
Подмножество | концепция решения |
Суперсет | Теория некооперативных игр |
Значение | |
Используется для | Все некооперативные игры |
В теории игр равновесие удовлетворения — это концепция решения для класса некооперативных игр , а именно игр в форме удовлетворения . Игры с удовлетворением формируют модельные ситуации, в которых игроки стремятся удовлетворить заданному индивидуальному ограничению, например, показатель производительности должен быть меньше или больше заданного порога. Когда игрок удовлетворяет своему собственному ограничению, говорят, что игрок удовлетворен . Равновесие удовлетворения , если оно существует, возникает, когда все игроки в игре удовлетворены.
История [ править ]
Термин «равновесие удовлетворенности» (SE) впервые был использован для обозначения стабильной точки динамического взаимодействия между игроками, которые учатся равновесию , совершая действия и наблюдая за своими собственными выигрышами. Равновесие основано на принципе удовлетворения , согласно которому агент, удовлетворенный своим текущим выигрышем, не меняет своего текущего действия. [1]
Позже понятие равновесия удовлетворения было введено как концепция решения для игр в форме удовлетворения . [2] Такая концепция решения была введена в области электротехники для анализа качества обслуживания (QoS) в беспроводных одноранговых сетях . В этом контексте радиоустройства (сетевые компоненты) моделируются как проигрыватели, которые сами определяют свои рабочие конфигурации для удовлетворения некоторого целевого качества обслуживания.
Игры в форме удовлетворения и понятие равновесия удовлетворения использовались в контексте пятого поколения сотовой связи (5G) для решения проблемы энергоэффективности. [3] совместное использование спектра [4] и управление мощностью передачи. [5] [6] В интеллектуальной сети игры в форме удовлетворения использовались для моделирования проблемы атак с внедрением данных. [7]
Игры форме удовлетворения в
В статических играх с полной и совершенной информацией представление игры в форме удовлетворения представляет собой спецификацию набора игроков, наборов действий игроков и их предпочтений. Предпочтения для данного игрока определяются отображением, часто называемым отображением предпочтений , декартова произведения наборов действий всех других игроков на набор действий данного игрока. То есть, учитывая действия, предпринятые всеми остальными игроками, отображение предпочтений определяет подмножество действий, которые удовлетворяют игрока.
Определение [Игры в форме удовлетворения [2] ]
Игра в форме удовлетворения описывается кортежем
где, набор , с , представляет набор игроков; набор , с и , представляет собой набор действий, которые игрок можно играть. Отображение предпочтений
определяет набор действий, с помощью которых игрок удовлетворен действиями всех остальных игроков. Набор это мощности набор .
В отличие от других существующих формулировок игр, например, нормальной формы и нормальной формы с ограниченным набором действий, [8] понятие оптимизации производительности, т.е. максимизации полезности или минимизации затрат, не существует. Игры в форме удовлетворения моделируют случай, когда игроки предпринимают свои действия, стремясь удовлетворить конкретное индивидуальное ограничение с учетом действий, предпринятых всеми остальными игроками. Важное замечание заключается в том, что предполагается, что игроки не заботятся о том, могут ли другие игроки удовлетворить их индивидуальные ограничения.
Равновесие удовлетворенности
Профиль действия представляет собой кортеж . Профиль действия, при котором все игроки удовлетворены, является равновесием соответствующей игры в форме удовлетворения. При равновесии удовлетворения игроки не проявляют особого интереса к изменению своего текущего действия.
Определение. Равновесие удовлетворенности в чистых стратегиях. [2] ]
Профиль действия является равновесием удовлетворения в чистых стратегиях игры если для всех ,
- .
- .
удовлетворенности в смешанных Равновесие стратегиях
Для всех , обозначаем множество всех возможных распределений вероятностей на множестве к , с . Обозначим через распределение вероятностей ( смешанная стратегия ), принятое игроком выбирать свои действия. Для всех , представляет вероятность, с которой игрок выбирает действие . Обозначения представляет смешанные стратегии всех игроков, кроме игрока .
Определение [Распространение формы удовлетворения на смешанные стратегии [2] ] Расширение в смешанных стратегиях игры описывается кортежем , где переписка
определяет набор всех возможных распределений вероятностей, которые позволяют игроку выбрать действие, удовлетворяющее его индивидуальным условиям с вероятностью единица, т. е.
Равновесие удовлетворения в смешанных стратегиях определяется следующим образом.
Определение. Равновесие удовлетворенности в смешанных стратегиях. [2] ]
Профиль смешанной стратегии является SE в смешанных стратегиях, если для всех ,
- .
- .
Пусть -е действие игрока , то есть, , быть сопоставлено с унитарным вектором , где все компоненты равны нулю, кроме -ая компонента, равная единице. Вектор представляет собой вырожденное распределение вероятностей, где действие выбирается детерминированно. Используя этот аргумент, становится ясно, что любое равновесие удовлетворения в чистых стратегиях игры также является равновесием удовлетворения в смешанных стратегиях игры .
В SE игры , игроки выбирают свои действия в соответствии с распределением вероятностей, так что с положительной вероятностью разыгрываются только те профили действий, которые позволяют всем игрокам одновременно удовлетворять свои индивидуальные условия с вероятностью единица. Следовательно, в случае, когда одного УЭ в чистых стратегиях не существует, то не существует и УЭ в смешанных стратегиях в игре. .
ε удовлетворенности - Равновесие
При определенных условиях всегда можно построить смешанные стратегии, позволяющие игрокам довольствоваться вероятностью. , для некоторых . Это наблюдение приводит к определению концепции решения, известной как - равновесие удовлетворения ( -СЭ).
Определение: [Равновесие ε-удовлетворения [2] ]
Позволять удовлетворить . Профиль смешанной стратегии представляет собой равновесие эпсилон-удовлетворения ( -SE) игры , если для всех , отсюда следует, что
- ,
где
Из определения, приведенного выше, можно предположить, что если профиль смешанной стратегии это -SE, он утверждает, что,
То есть игроков не устраивает вероятность . Актуальность -SE заключается в том, что он моделирует тот факт, что игроки могут быть терпимы к определенному уровню неудовлетворенности. При данном -SE, ни один из игроков не заинтересован в изменении своего профиля смешанной стратегии, пока его устраивает вероятность выше или равная , для некоторых .
В отличие от условий существования СЭ как в чистой, так и в смешанной стратегиях, условия существования СЭ -SE мягкие.
Предложение [Существование - ЮВ [2] ]
Позволять , быть конечной игрой в форме удовлетворения. Тогда, если для всех , всегда существует профиль действия такой, что
- ,
тогда всегда существует профиль стратегии и настоящий , с , такой, что, это - СЭ.
Выбор равновесия
Игры в форме удовлетворения могут демонстрировать несколько равновесий удовлетворения. В таком случае игроки могут связать с каждым из своих действий значение, представляющее усилия или затраты на выполнение такого действия. С этой точки зрения, если существует несколько SE, игроки могут предпочесть тот, который требует наименьших (глобальных или индивидуальных) усилий или затрат. Чтобы смоделировать это предпочтение, игры в форме удовлетворения могут быть оснащены функциями затрат для каждого из игроков.
Для всех , пусть функция определить усилия или затраты, заплаченные игроком за использование каждого из его действий. Точнее, учитывая пару действий , действие предпочтительнее против по игроку если
Обратите внимание, что это предпочтение для игрока не зависит от действий всех остальных игроков.
Определение: [Эффективное равновесие удовлетворенности (ESE)]
Позволять — множество равновесий удовлетворения в чистых стратегиях игры в форме удовлетворения . Профиль стратегии это эффективное равновесие удовлетворения если для всех , отсюда следует, что
- .
- .
В тривиальном случае, когда для всех функция является постоянной функцией, набор ESE и набор SE идентичны. Это подчеркивает актуальность способности игроков дифференцировать усилия по совершению того или иного действия с целью выбора одного равновесия (удовлетворения) среди всех существующих равновесий.
В играх в форме удовлетворения с непустыми множествами равновесий удовлетворения, когда все игроки приписывают своим действиям разные затраты, т. е. для всех и для всех , он утверждает, что , всегда существует ESE. Тем не менее, оно не обязательно уникально, а это означает, что все еще существует место для других уточнений равновесия, помимо понятия индивидуальных функций затрат. [5] [6]
Обобщения [ править ]
Говорят, что игры в форме удовлетворения, для которых не существует профиля действий, в котором все игроки удовлетворены, не обладают равновесием удовлетворения. В этом случае профиль действия вызывает разбиение множества образованный наборами и . С одной стороны, игроки в удовлетворены. С другой стороны, игроки в недовольны. Если игроки в сете не может быть удовлетворен ни одним из своих действий, учитывая действия всех остальных игроков, эти игроки не заинтересованы в изменении своего текущего действия. Это означает, что профили действий, удовлетворяющие этому условию, также являются равновесиями. Это происходит потому, что никто из игроков не особо заинтересован в изменении своих текущих действий, даже тех, которые не удовлетворены. Это рассуждение привело к другой концепции решения , известной как равновесие общего удовлетворения (GSE).Это обобщение предлагается в контексте новой формулировки игры, а именно формы обобщенного удовлетворения. [9]
Определение: [Обобщенная форма удовлетворенности]
Игра в форме обобщенного удовлетворения описывается кортежем ,где, набор , с , представляет набор игроков; набор , с и , представляет собой набор действий, которые игрок может играть; и отображение предпочтений
- ,
определяет набор функций массы вероятности (смешанных стратегий) с поддержкой которые удовлетворяют игрока учитывая смешанные стратегии, принятые всеми остальными игроками.
Обобщенное равновесие удовлетворения определяется следующим образом.
Определение: [Обобщенное равновесие удовлетворенности (GSE) [9] ]
Профиль смешанной стратегии представляет собой обобщенное равновесие удовлетворения в игре в форме обобщенного удовлетворения. если существует раздел множества образованный наборами и и имеет место следующее:
(и) Для всех , ; и
(ii) Для всех ,
Обратите внимание, что GSE сводится к понятию -SE игры в форме удовлетворения когда, и для всех , переписка выбран быть
с .Точно так же GSE сводится к понятию SE в смешанных стратегиях, когда и . Наконец, заметим, что любая SE является GSE, но обратное неверно.
Ссылки [ править ]
- ^ Росс, С.; Чайб-драа, Б. (май 2006 г.). «Равновесие удовлетворенности: достижение сотрудничества в играх с неполной информацией» . Материалы Канадской конференции по искусственному интеллекту . Оттава, Онтарио, Канада. дои : 10.1007/11766247_6 .
- ↑ Перейти обратно: Перейти обратно: а б с д и ж г Перлаза, С.; Тембине, Х.; Ласолес, С.; Дебба, М. (апрель 2012 г.). «Обеспечение качества обслуживания в децентрализованных сетях: подход, основанный на равновесии удовлетворенности» . Журнал IEEE по избранным темам обработки сигналов . 6 (2): 104–116. arXiv : 1112.1730 . Бибкод : 2012ИССП...6..104П . дои : 10.1109/JSTSP.2011.2180507 . S2CID 9567688 .
- ^ Эльхаммути, Х.; Сабир, Э.; Бенджиллили, М.; Эчабби, Л.; Тембине, Х. (сентябрь 2017 г.). «Самоорганизующиеся подключенные объекты: переосмысление обеспечения качества обслуживания для служб Интернета вещей» . Журнал коммуникаций IEEE . 55 (9): 41–47. дои : 10.1109/MCOM.2017.1600614 . S2CID 27329276 .
- ^ Саутвелл, Р.; Чен, X.; Хуанг, Дж. (март 2014 г.). «Игры качества обслуживания для совместного использования спектра» . Журнал IEEE по избранным областям коммуникаций . 32 (3): 589–600. arXiv : 1310.2354 . дои : 10.1109/JSAC.2014.1403008 . S2CID 9227076 .
- ↑ Перейти обратно: Перейти обратно: а б Промпонас, П.; Циропулу, Э.Э.; Папавассилиу, С. (май 2021 г.). «Переосмысление управления мощностью в беспроводных сетях: перспектива равновесия удовлетворенности» . Транзакции IEEE по управлению сетевыми системами . 8 (4): 1680–1691. дои : 10.1109/TCNS.2021.3078123 . S2CID 236728675 .
- ↑ Перейти обратно: Перейти обратно: а б Промпонас, П.; Пелекис, К.; Циропулу, Э.Э.; Папавассилиу, С. (июль 2021 г.). «Игры в обычной форме и в форме удовлетворения для эффективного распределения мощности передачи в рамках парадигмы двойного беспроводного множественного доступа 5G» . Транзакции IEEE/ACM в сети . 29 (6): 2574–2587. дои : 10.1109/TNET.2021.3095351 . S2CID 237965568 .
- ^ Санджаб, А.; Саад, В. (июль 2016 г.). «Атаки путем внедрения данных на интеллектуальные сети с участием нескольких противников: теоретико-игровая перспектива» . Транзакции IEEE в Smart Grid . 7 (4): 2038–2049. arXiv : 1604.00118 . дои : 10.1109/TSG.2016.2550218 . S2CID 14309194 .
- ^ Дебре, Г. (октябрь 1952 г.). «Теорема существования социального равновесия» (PDF) . Труды Национальной академии наук Соединенных Штатов Америки . 38 (10): 886–893. Бибкод : 1952PNAS...38..886D . дои : 10.1073/pnas.38.10.886 . ПМК 1063675 . ПМИД 16589195 .
- ↑ Перейти обратно: Перейти обратно: а б Гуневардена, М.; Перлаза, С.; Ядав, А.; Аджиб, В. (июнь 2017 г.). «Обобщенное равновесие удовлетворенности при обеспечении уровня обслуживания в беспроводных сетях» . Транзакции IEEE в области коммуникаций . 65 (6): 2427–2437. дои : 10.1109/TCOMM.2017.2662701 . S2CID 25391577 .