Алгоритм Лемке – Хаусона
Алгоритм Лемке-Хаусона — это алгоритм , который вычисляет равновесие Нэша в биматричной игре , названный в честь его изобретателей Карлтона Э. Лемке и Дж. Т. Хаусона . [ 1 ] Говорят, что это «наиболее известный среди комбинаторных алгоритмов поиска равновесия Нэша». [ 2 ] хотя в последнее время алгоритм Портера-Нудельмана-Шохама [ 3 ] превзошла по ряду показателей. [ 4 ] [ 5 ]
Описание
[ редактировать ]Входными данными для алгоритма является игра G для двух игроков . Здесь G представлена двумя m × n игровыми матрицами размера A и B , содержащими выигрыши для игроков 1 и 2 соответственно, которые имеют m и n чистых стратегий соответственно. Далее предполагается, что все выигрыши положительны. (Благодаря изменению масштаба любую игру можно превратить в стратегически эквивалентную игру с положительными выигрышами.)
G имеет два соответствующих многогранника (называемых многогранниками наилучшего ответа ) P 1 и P 2 в измерениях m и n соответственно, определяемых следующим образом:
- P 1 находится в R м ; пусть { x 1 ,..., x m } обозначают координаты. P 1 определяется m неравенствами x i ≥ 0 для всех i ∈ {1,..., m } и еще n неравенствами для всех j ∈ {1,..., n } .
- P 2 находится в R н ; пусть { x m +1 ,..., x m + n } обозначают координаты. P 2 определяется n неравенствами x m + i ≥ 0 для всех i ∈ {1,..., n } и еще m неравенствами для всех i ∈ {1,..., m } .
Здесь P 1 представляет собой набор ненормализованных распределений вероятностей по игрокам 1. m чистых стратегий, таких, что ожидаемый выигрыш игрока 2 не превышает 1. Первые m ограничений требуют, чтобы вероятности были неотрицательными, а остальные n ограничений требуют, чтобы каждая из n чистых стратегий игрока 2 имела ожидаемый выигрыш при большинство 1. P 2 имеет аналогичное значение, меняя роли игроков.
Каждой вершине v графа P1 множества сопоставлен набор меток из {1,..., m + n } следующим образом. Для i ∈ {1, ..., m } вершина v получает метку i, если x i = 0 в вершине v . Для j ∈ {1, ..., n } вершина v получает метку m + j, если Предполагая, что P 1 невырожден, каждая вершина инцидентна m граням P 1 и имеет m меток. Обратите внимание, что начало координат, которое является вершиной P 1 , имеет метки {1, ..., m } .
Каждой вершине графа P2 сопоставлен w набор меток из множества {1, ..., m + n } следующим образом. Для j ∈ {1, ..., n } вершина w получает метку m + j, если x m + j = 0 в вершине w . Для i ∈ {1, ..., m } вершина w получает метку i, если Предполагая, что невырождена P2 , каждая вершина инцидентна n граням P2 n и имеет меток . Обратите внимание, что начало координат, которое является вершиной P 2 , имеет метки { m + 1, ..., m + n } .
Рассмотрим пары вершин ( v , w ) , v ∈ P 1 , w ∈ P 2 . Пары вершин ( v , w ) называются полностью помеченными, если множества, связанные с v и w, содержат все метки {1, ..., m + n } . Обратите внимание, что если v и w являются началами R м и Р н соответственно, тогда ( v , w ) полностью помечено. Пары вершин ( v , w ) называются почти полностью помеченными (относительно некоторой отсутствующей метки g ), если множества, связанные с v и w, содержат все метки в {1, ..., m + n }, кроме г . Обратите внимание, что в этом случае будет повторяющаяся метка , связанная как с v , так и с w .
Операция поворота состоит из взятия некоторой пары ( v , w ) и замены v на некоторую смежную с v в P1 вершину , , или, альтернативно, замену некоторой вершиной, смежной с w в P2 w . Это имеет эффект (в случае, если v заменяется) замены некоторой метки v какой-то другой меткой. Говорят, что замененная метка отброшена . Учитывая любую метку v , можно удалить эту метку, перейдя к вершине, смежной с v , которая не содержит гиперплоскости, связанной с этой меткой.
Алгоритм начинается с полностью помеченной пары ( v , w ), состоящей из пары начальных координат. Произвольная метка g удаляется с помощью операции поворота, что приводит нас к почти полностью помеченной паре ( v ′ , w ′ ) . Любая почти полностью помеченная пара допускает две операции поворота, соответствующие удалению той или иной копии ее дублированной метки, и каждая из этих операций может привести к созданию другой почти полностью помеченной пары или полностью помеченной пары. В конечном итоге алгоритм находит полностью помеченная пара ( v * , В * ) , что не является началом координат. ( в * , В * ) соответствует паре ненормализованных распределений вероятностей, в которых каждая стратегия i игрока 1 либо платит этому игроку 1, либо платит меньше 1 и используется этим игроком с вероятностью 0 (аналогичное наблюдение справедливо и для игрока 2). Нормализуя эти значения к распределениям вероятностей, мы получаем равновесие Нэша (выигрыши которого для игроков являются обратными факторам нормализации).
Характеристики
[ редактировать ]Алгоритм может найти не более n + m различных равновесий Нэша. Любой выбор изначально отброшенной метки определяет равновесие, которое в конечном итоге находится алгоритмом.
Алгоритм Лемке-Хаусона эквивалентен следующему гомотопическому подходу. Измените G , выбрав произвольную чистую стратегию g и предоставив игроку, владеющему этой стратегией, большую плату B за ее игру. В модифицированной игре стратегия g используется с вероятностью 1, а другой игрок будет использовать свой лучший ответ на g с вероятностью 1. Рассмотрим континуум игр, в которых B непрерывно сводится к 0. Существует путь равновесия Нэша. соединяющее единственное равновесие модифицированной игры с равновесием G . Чистая стратегия g, выбранная для получения бонуса B, соответствует первоначально выпавшей метке. [ 6 ] Хотя на практике алгоритм эффективен, в худшем случае количество операций поворота может экспоненциально зависеть от количества чистых стратегий в игре. [ 7 ] Впоследствии было показано, что PSPACE-полно найти любое из решений. которые можно получить с помощью алгоритма Лемке–Хаусона. [ 8 ]
Ссылки
[ редактировать ]- ^ Лемке, CE ; Хаусон, Дж. Т. (1964). «Точки равновесия биматричных игр». SIAM Journal по прикладной математике . 12 (2): 413–423. дои : 10.1137/0112033 .
- ^ Пападимитриу, Христос Х. (2007). «Сложность поиска равновесия Нэша». Алгоритмическая теория игр . стр. 29–52. дои : 10.1017/CBO9780511800481.004 . ISBN 978-0-521-87282-9 .
- ^ Портер, Райан; Нудельман, Евгений; Шохам, Йоав (1 июля 2008 г.). «Простые методы поиска равновесия по Нэшу». Игры и экономическое поведение . 63 (2): 642–662. дои : 10.1016/j.geb.2006.03.015 .
- ^ Сэндхольм, Томас; Гилпин, Эндрю; Конитцер, Винсент (9 июля 2005 г.). «Методы смешанно-целочисленного программирования для поиска равновесия Нэша» (PDF) . Материалы 20-й Национальной конференции по искусственному интеллекту . Том. 2. С. 495–501. ISBN 978-1-57735-236-5 .
- ^ Чеппи, София; Гатти, Никола; Базилико, Никола (сентябрь 2009 г.). «Вычисление равновесия Байеса-Нэша с помощью методов перебора поддержки в байесовских играх стратегической формы с двумя игроками». 2009 Международная совместная конференция IEEE/WIC/ACM по веб-аналитике и технологиям интеллектуальных агентов . Том. 2. С. 541–548. дои : 10.1109/WI-IAT.2009.209 . ISBN 978-0-7695-3801-3 . S2CID 656183 .
- ^ Херингс, П. Дж.; Питерс, Р. (2010). «Гомотопические методы вычисления равновесия в теории игр» . Экономическая теория . 42 (1): 119–156. дои : 10.1007/s00199-009-0441-5 .
- ^ Савани, Р.; фон Стенгель, Б. (2006). «Труднорешаемые биматричные игры». Эконометрика . 74 (2): 397–429. CiteSeerX 10.1.1.63.1548 . дои : 10.1111/j.1468-0262.2006.00667.x .
- ^ Гольдберг, П.В.; Пападимитриу, Швейцария ; Савани, Р. (2011). Сложность гомотопического метода, подбора равновесия и решений Лемке–Хаусона . Учеб. 52-й ФОКС. стр. 67–76. arXiv : 1006.5352 . дои : 10.1109/FOCS.2011.26 .