Jump to content

Потенциальная игра

В теории игр игра называется потенциальной игрой , если стимул всех игроков изменить свою стратегию может быть выражен с помощью одной глобальной функции, называемой потенциальной функцией . Эта концепция возникла в статье 1996 года Дова Мондерера и Ллойда Шепли . [1]

С тех пор были изучены свойства нескольких типов потенциальных игр. Игры могут быть порядковыми или кардинальными потенциальными играми. В кардинальных играх разница в индивидуальных выигрышах каждого игрока от индивидуального изменения стратегии при прочих равных условиях должна иметь то же значение, что и разница в значениях потенциальной функции. В обычных играх одинаковыми должны быть только знаки различий.

Потенциальная функция — полезный инструмент для анализа равновесных свойств игр, поскольку стимулы всех игроков отображаются в одну функцию, а набор чистых равновесий Нэша можно найти, найдя локальные оптимумы потенциальной функции. Сходимость и сходимость повторной игры за конечное время к равновесию Нэша также можно понять, изучая потенциальную функцию.

Потенциальные игры можно изучать как повторяющиеся игры с состоянием, так что каждый сыгранный раунд имеет прямое влияние на состояние игры в следующем раунде. [2] Этот подход находит применение в распределенном управлении, например, при распределенном распределении ресурсов, когда игроки без центрального механизма корреляции могут сотрудничать для достижения глобально оптимального распределения ресурсов.

Определение [ править ]

Позволять быть числом игроков, набор профилей действий над наборами действий каждого игрока и быть функцией выигрыша для игрока .

Учитывая игру , мы говорим, что является потенциальной игрой с точной (взвешенной, порядковой, обобщенной порядковой, лучшим ответом) потенциальной функцией , если — точная (соответственно взвешенная, порядковая, обобщенная порядковая, лучший ответ) потенциальная функция для . Здесь, называется

  • точная потенциальная функция, если ,
То есть: когда игрок переключается с действия к действию , изменение потенциала равно изменению полезности этого игрока.
  • если взвешенная потенциальная функция, существует вектор такой, что ,
То есть: когда игрок переключает действие, изменение равно изменению полезности игрока, умноженному на положительный вес, специфичный для игрока. Каждый точный ПФ является взвешенным ПФ с w i =1 для всех i .
  • порядковая потенциальная функция, если ,
То есть: когда игрок переключает действие, знак изменения равен знаку изменения полезности игрока, тогда как величина изменения может отличаться. Каждый взвешенный ПФ является порядковым ПФ.
  • обобщенная порядковая потенциальная функция, если ,
То есть: когда игрок меняет действие, если полезность игрока увеличивается, то и потенциал увеличивается (но не обязательно обратное). Всякая порядковая ПФ является обобщенно-порядковой ПФ.
  • потенциальная функция наилучшего ответа, если ,
где это лучшее действие для игрока данный .

Обратите внимание, что, хотя существуют функции полезности, по одной для каждого игрока, существует только одна потенциальная функция. Таким образом, сквозь призму потенциальных функций игроки становятся взаимозаменяемыми (в смысле одного из приведенных выше определений). Из-за такой симметрии игры децентрализованные алгоритмы, основанные на общей потенциальной функции, часто приводят к сходимости (в некотором смысле) к равновесию Нэша.

Простой пример [ править ]

В игре двумя игроками и двумя действиями с внешними эффектами выигрыши отдельных игроков определяются функцией u i ( a i , a j ) = b i a i + wa i a с j , где a i - действие игрока i. , a j — действие противника, а w положительный от внешний эффект выбора того же действия. Варианты действий — +1 и —1, как видно из матрицы выигрышей на рисунке 1.

В этой игре есть P потенциальная функция ( a 1 , a 2 ) = b 1 a 1 + b 2 a 2 + w a 1 a 2 .

Если игрок 1 перемещается от −1 к +1, разница выигрышей равна Δ u 1 = u 1 (+1, a 2 ) – u 1 (–1, a 2 ) = 2 b 1 + 2 w a 2 .

Изменение потенциала равно ΔP = P(+1, a 2 ) – P(–1, a 2 ) = ( b 1 + b 2 a 2 + w a 2 ) – (– b 1 + b 2 a 2 w а 2 ) знак равно 2 б 1 + 2 ш а 2 знак равно Δ ты 1 .

Решение для игрока 2 эквивалентно. Используя числовые значения b 1 = 2 , b 2 = −1 , w = 3 , этот пример превращается в простую ( битву полов , как показано на рисунке 2. В игре есть два чистых равновесия Нэша +1, +1). и (−1, −1) . Это и есть локальные максимумы потенциальной функции (рис. 3). Единственное стохастически устойчивое равновесие — это (+1, +1) глобальный максимум потенциальной функции.

+1 –1
+1 + б 1 + ш , + б 2 + ш + б 1 ш , – б 2 ш
–1 б 1 ж , + б 2 ш б 1 + ш , – б 2 + ш
Рис. 1: Пример потенциальной игры
+1 –1
+1 5, 2 –1, –2
–1 –5, –4 1, 4
Рис. 2: Битва полов
(выплаты)
+1 –1
+1 4 0
–1 –6 2
Рис. 3: Битва полов
(потенциалы)

Игра для двух игроков и двух действий не может быть потенциальной игрой, если только

Потенциальные игры и перегрузками с игры

Точные потенциальные игры эквивалентны играм с перегрузками : Розенталь [3] доказал, что каждая игра с перегрузками имеет точный потенциал; Мондерер и Шепли [1] доказал обратное: всякая игра с точной потенциальной функцией является игрой с перегруженностью .

Потенциальные игры и пути улучшения [ править ]

Путь улучшения (также называемый динамикой Нэша ) — это последовательность векторов стратегий, в которой каждый вектор достигается из предыдущего вектора, когда один игрок переключает свою стратегию на стратегию, которая строго увеличивает его полезность. Если игра имеет функцию обобщенного порядкового потенциала , затем строго возрастает на каждом пути улучшения, поэтому каждый путь улучшения является ациклическим. Если, кроме того, в игре конечное число стратегий, то каждый путь улучшения должен быть конечным. Это свойство называется свойством конечного улучшения (FIP) . Мы только что доказали, что каждая конечная игра с обобщенным порядковым потенциалом имеет FIP. Верно и обратное: в каждой конечной игре FIP имеет функцию обобщенного порядкового потенциала. [4] [ нужны разъяснения ] Конечное состояние на каждом пути конечного улучшения представляет собой равновесие Нэша, поэтому FIP подразумевает существование равновесия Нэша чистой стратегии. Более того, это означает, что равновесие Нэша может быть вычислено с помощью распределенного процесса, в котором каждому агенту нужно только улучшить свою собственную стратегию.

Путь наилучшего ответа — это частный случай пути улучшения, в котором каждый вектор достигается из предыдущего вектора, когда один игрок переключает свою стратегию на стратегию наилучшего ответа. Свойство конечности каждого пути наилучшего ответа называется свойством конечного наилучшего ответа (FBRP) . FBRP слабее, чем FIP, и он по-прежнему подразумевает существование чисто стратегического равновесия Нэша. Это также означает, что равновесие Нэша может быть вычислено с помощью распределенного процесса, но вычислительная нагрузка на агентов выше, чем при использовании FIP, поскольку им приходится вычислять наилучший ответ.

Еще более слабое свойство — слабая ацикличность (WA) . [5] Это означает, что для любого начального вектора стратегии существует конечный путь наилучшего ответа, начинающийся с этого вектора. Слабой ацикличности недостаточно для существования потенциальной функции (поскольку некоторые пути улучшения могут быть циклическими), но ее достаточно для существования равновесия по Нэшу в чистой стратегии. вычислить Это означает, что равновесие Нэша можно почти наверняка с помощью стохастического распределенного процесса, в котором в каждой точке игрок выбирается случайным образом, и этот игрок случайным образом выбирает лучшую стратегию. [4]

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б Мондерер, Дов; Шепли, Ллойд (1996). «Потенциальные игры». Игры и экономическое поведение . 14 : 124–143. дои : 10.1006/game.1996.0044 .
  2. ^ Марден, Дж., (2012) Потенциальные игры на уровне штата http://ecee.colorado.edu/marden/files/state-based-games.pdf
  3. ^ Розенталь, Роберт В. (1973), «Класс игр, обладающих равновесием Нэша в чистой стратегии», International Journal of Game Theory , 2 : 65–67, doi : 10.1007/BF01737559 , MR   0319584 , S2CID   121904640 .
  4. ^ Jump up to: Перейти обратно: а б Мильхтайх, Игаль (1 марта 1996 г.). «Игры с перегрузками и функциями выигрыша для конкретного игрока» . Игры и экономическое поведение . 13 (1): 111–124. дои : 10.1006/game.1996.0027 . ISSN   0899-8256 .
  5. ^ Янг, Х. Пейтон (1993). «Эволюция конвенций» . Эконометрика . 61 (1): 57–84. дои : 10.2307/2951778 . ISSN   0012-9682 . JSTOR   2951778 .
  6. ^ Воорневельд, Марк; Норде, Хенк (1 мая 1997 г.). «Характеристика порядковых потенциальных игр» . Игры и экономическое поведение . 19 (2): 235–242. дои : 10.1006/game.1997.0554 . ISSN   0899-8256 . S2CID   122795041 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2e8007a06d40d0361b936367a729b025__1707154620
URL1:https://arc.ask3.ru/arc/aa/2e/25/2e8007a06d40d0361b936367a729b025.html
Заголовок, (Title) документа по адресу, URL1:
Potential game - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)