Алгоритм Лемке – Хаусона

Алгоритм Лемке-Хаусона — это алгоритм , который вычисляет равновесие Нэша в биматричной игре , названный в честь его изобретателей Карлтона Э. Лемке и Дж. Т. Хаусона . ^{[ 1 ]} Говорят, что это «наиболее известный среди комбинаторных алгоритмов поиска равновесия Нэша». ^{[ 2 ]} хотя в последнее время алгоритм Портера-Нудельмана-Шохама ^{[ 3 ]} превзошла по ряду показателей. ^{[ 4 ]}^{[ 5 ]}

Описание

Входными данными для алгоритма является игра $G$ для двух игроков . Здесь $G$ представлена двумя $m \times n$ игровыми матрицами размера $A$ и $B$ , содержащими выигрыши для игроков 1 и 2 соответственно, которые имеют $m$ и $n$ чистых стратегий соответственно. Далее предполагается, что все выигрыши положительны. (Благодаря изменению масштаба любую игру можно превратить в стратегически эквивалентную игру с положительными выигрышами.)

$G$ имеет два соответствующих многогранника (называемых многогранниками наилучшего ответа ) $P 1$ и $P 2$ в $измерениях m$ и $n$ соответственно, определяемых следующим образом:

$P 1$ находится в $R м$ ; пусть ${x 1,..., x m}$ обозначают координаты. $P 1$ определяется $m$ неравенствами $x i \geq 0$ для всех $i \in {1,..., m}$ и еще $n$ неравенствами $B_{1,j}x_{1}+\dots +B_{m,j}x_{m}\leq 1,$ для всех $j \in {1,..., n}$ .
$P 2$ находится в $R н$ ; пусть ${x m +1,..., x m + n}$ обозначают координаты. $P 2$ определяется $n$ неравенствами $x m + i \geq 0$ для всех $i \in {1,..., n}$ и еще $m$ неравенствами $A_{i,1}x_{m+1}+\dots +A_{i,n}x_{m+n}\leq 1,$ для всех $i \in {1,..., m}$ .

Здесь $P 1$ представляет собой набор ненормализованных распределений вероятностей по игрокам 1. $m$ чистых стратегий, таких, что ожидаемый выигрыш игрока 2 не превышает 1. Первые $m$ ограничений требуют, чтобы вероятности были неотрицательными, а остальные $n$ ограничений требуют, чтобы каждая из $n$ чистых стратегий игрока 2 имела ожидаемый выигрыш при большинство 1. $P 2$ имеет аналогичное значение, меняя роли игроков.

Каждой вершине $v$ графа $P1 множества$ сопоставлен набор меток из ${1,..., m + n}$ следующим образом. Для $i \in {1, ..., m}$ вершина $v$ получает метку $i,$ если $x i = 0$ в вершине $v$ . Для $j \in {1, ..., n}$ вершина $v$ получает метку $m + j,$ если $B_{1,j}x_{1}+\dots +B_{m,j}x_{m}=1.$ Предполагая, что $P 1$ невырожден, каждая вершина инцидентна $m$ граням $P 1$ и имеет $m$ меток. Обратите внимание, что начало координат, которое является вершиной $P 1$ , имеет метки ${1, ..., m}$ .

Каждой вершине $графа$ P2 $сопоставлен w$ набор меток из множества ${1, ..., m + n}$ следующим образом. Для $j \in {1, ..., n}$ вершина $w$ получает метку $m + j,$ если $x m + j = 0$ в вершине $w$ . Для $i \in {1, ..., m}$ вершина $w$ получает метку $i,$ если $A_{i,1}x_{m+1}+\dots +A_{i,n}x_{m+n}=1.$ Предполагая, что $невырождена P2$ , каждая вершина инцидентна $n$ граням $P2 n$ и имеет $меток$ . Обратите внимание, что начало координат, которое является вершиной $P 2$ , имеет метки ${m + 1, ..., m + n}$ .

Рассмотрим пары вершин $(v, w)$ , $v \in P 1$ , $w \in P 2$ . Пары вершин $(v, w)$ называются полностью помеченными, если множества, связанные с $v$ и $w,$ содержат все метки ${1, ..., m + n}$ . Обратите внимание, что если $v$ и $w$ являются началами $R м$ и $Р н$ соответственно, тогда $(v, w)$ полностью помечено. Пары вершин $(v, w)$ называются почти полностью помеченными (относительно некоторой отсутствующей метки $g$ ), если множества, связанные с $v$ и $w,$ содержат все метки в ${1, ..., m + n},$ кроме $г$ . Обратите внимание, что в этом случае будет повторяющаяся метка , связанная как с $v$ , так и $с w$ .

Операция поворота состоит из взятия некоторой пары $(v, w)$ и замены $v$ на некоторую смежную с $v$ в $P1 вершину ,$ , или, альтернативно, замену $некоторой$ вершиной, смежной с $w$ в $P2 w$ . Это имеет эффект (в случае, если $v$ заменяется) замены некоторой метки $v$ какой-то другой меткой. Говорят, что замененная метка отброшена . Учитывая любую метку $v$ , можно удалить эту метку, перейдя к вершине, смежной с $v$ , которая не содержит гиперплоскости, связанной с этой меткой.

Алгоритм начинается с полностью помеченной пары $(v, w),$ состоящей из пары начальных координат. Произвольная метка $g$ удаляется с помощью операции поворота, что приводит нас к почти полностью помеченной паре $(v', w')$ . Любая почти полностью помеченная пара допускает две операции поворота, соответствующие удалению той или иной копии ее дублированной метки, и каждая из этих операций может привести к созданию другой почти полностью помеченной пары или полностью помеченной пары. В конечном итоге алгоритм находит полностью помеченная пара $(v *, В *)$ , что не является началом координат. $(в *, В *)$ соответствует паре ненормализованных распределений вероятностей, в которых каждая стратегия $i$ игрока 1 либо платит этому игроку 1, либо платит меньше 1 и используется этим игроком с вероятностью 0 (аналогичное наблюдение справедливо и для игрока 2). Нормализуя эти значения к распределениям вероятностей, мы получаем равновесие Нэша (выигрыши которого для игроков являются обратными факторам нормализации).

Характеристики

Алгоритм может найти не более $n + m$ различных равновесий Нэша. Любой выбор изначально отброшенной метки определяет равновесие, которое в конечном итоге находится алгоритмом.

Алгоритм Лемке-Хаусона эквивалентен следующему гомотопическому подходу. Измените $G$ , выбрав произвольную чистую стратегию $g$ и предоставив игроку, владеющему этой стратегией, большую плату $B$ за ее игру. В модифицированной игре стратегия $g$ используется с вероятностью 1, а другой игрок будет использовать свой лучший ответ на $g$ с вероятностью 1. Рассмотрим континуум игр, в которых $B$ непрерывно сводится к 0. Существует путь равновесия Нэша. соединяющее единственное равновесие модифицированной игры с равновесием $G$ . Чистая стратегия $g,$ выбранная для получения бонуса $B,$ соответствует первоначально выпавшей метке. ^{[ 6 ]} Хотя на практике алгоритм эффективен, в худшем случае количество операций поворота может экспоненциально зависеть от количества чистых стратегий в игре. ^{[ 7 ]} Впоследствии было показано, что PSPACE-полно найти любое из решений. которые можно получить с помощью алгоритма Лемке–Хаусона. ^{[ 8 ]}

Ссылки

^ Лемке, CE ; Хаусон, Дж. Т. (1964). «Точки равновесия биматричных игр». SIAM Journal по прикладной математике . 12 (2): 413–423. дои : 10.1137/0112033 .
^ Пападимитриу, Христос Х. (2007). «Сложность поиска равновесия Нэша». Алгоритмическая теория игр . стр. 29–52. дои : 10.1017/CBO9780511800481.004 . ISBN 978-0-521-87282-9 .
^ Портер, Райан; Нудельман, Евгений; Шохам, Йоав (1 июля 2008 г.). «Простые методы поиска равновесия по Нэшу». Игры и экономическое поведение . 63 (2): 642–662. дои : 10.1016/j.geb.2006.03.015 .
^ Сэндхольм, Томас; Гилпин, Эндрю; Конитцер, Винсент (9 июля 2005 г.). «Методы смешанно-целочисленного программирования для поиска равновесия Нэша» (PDF) . Материалы 20-й Национальной конференции по искусственному интеллекту . Том. 2. С. 495–501. ISBN 978-1-57735-236-5 .
^ Чеппи, София; Гатти, Никола; Базилико, Никола (сентябрь 2009 г.). «Вычисление равновесия Байеса-Нэша с помощью методов перебора поддержки в байесовских играх стратегической формы с двумя игроками». 2009 Международная совместная конференция IEEE/WIC/ACM по веб-аналитике и технологиям интеллектуальных агентов . Том. 2. С. 541–548. дои : 10.1109/WI-IAT.2009.209 . ISBN 978-0-7695-3801-3 . S2CID 656183 .
^ Херингс, П. Дж.; Питерс, Р. (2010). «Гомотопические методы вычисления равновесия в теории игр» . Экономическая теория . 42 (1): 119–156. дои : 10.1007/s00199-009-0441-5 .
^ Савани, Р.; фон Стенгель, Б. (2006). «Труднорешаемые биматричные игры». Эконометрика . 74 (2): 397–429. CiteSeerX 10.1.1.63.1548 . дои : 10.1111/j.1468-0262.2006.00667.x .
^ Гольдберг, П.В.; Пападимитриу, Швейцария ; Савани, Р. (2011). Сложность гомотопического метода, подбора равновесия и решений Лемке–Хаусона . Учеб. 52-й ФОКС. стр. 67–76. arXiv : 1006.5352 . дои : 10.1109/FOCS.2011.26 .

[lh-1] Лемке, CE ; Хаусон, Дж. Т. (1964). «Точки равновесия биматричных игр». SIAM Journal по прикладной математике . 12 (2): 413–423. дои : 10.1137/0112033 .

[papadimitriou-2] Пападимитриу, Христос Х. (2007). «Сложность поиска равновесия Нэша». Алгоритмическая теория игр . стр. 29–52. дои : 10.1017/CBO9780511800481.004 . ISBN 978-0-521-87282-9 .

[pnsalg-3] Портер, Райан; Нудельман, Евгений; Шохам, Йоав (1 июля 2008 г.). «Простые методы поиска равновесия по Нэшу». Игры и экономическое поведение . 63 (2): 642–662. дои : 10.1016/j.geb.2006.03.015 .

[sgc-4] Сэндхольм, Томас; Гилпин, Эндрю; Конитцер, Винсент (9 июля 2005 г.). «Методы смешанно-целочисленного программирования для поиска равновесия Нэша» (PDF) . Материалы 20-й Национальной конференции по искусственному интеллекту . Том. 2. С. 495–501. ISBN 978-1-57735-236-5 .

[cgb-5] Чеппи, София; Гатти, Никола; Базилико, Никола (сентябрь 2009 г.). «Вычисление равновесия Байеса-Нэша с помощью методов перебора поддержки в байесовских играх стратегической формы с двумя игроками». 2009 Международная совместная конференция IEEE/WIC/ACM по веб-аналитике и технологиям интеллектуальных агентов . Том. 2. С. 541–548. дои : 10.1109/WI-IAT.2009.209 . ISBN 978-0-7695-3801-3 . S2CID 656183 .

[hr-6] Херингс, П. Дж.; Питерс, Р. (2010). «Гомотопические методы вычисления равновесия в теории игр» . Экономическая теория . 42 (1): 119–156. дои : 10.1007/s00199-009-0441-5 .

[rvs-7] Савани, Р.; фон Стенгель, Б. (2006). «Труднорешаемые биматричные игры». Эконометрика . 74 (2): 397–429. CiteSeerX 10.1.1.63.1548 . дои : 10.1111/j.1468-0262.2006.00667.x .

[gpscomplex-8] Гольдберг, П.В.; Пападимитриу, Швейцария ; Савани, Р. (2011). Сложность гомотопического метода, подбора равновесия и решений Лемке–Хаусона . Учеб. 52-й ФОКС. стр. 67–76. arXiv : 1006.5352 . дои : 10.1109/FOCS.2011.26 .

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]