Jump to content

Алгоритм Лемке – Хаусона

Алгоритм Лемке-Хаусона — это алгоритм , который вычисляет равновесие Нэша в биматричной игре , названный в честь его изобретателей Карлтона Э. Лемке и Дж. Т. Хаусона . [ 1 ] Говорят, что это «наиболее известный среди комбинаторных алгоритмов поиска равновесия Нэша». [ 2 ] хотя в последнее время алгоритм Портера-Нудельмана-Шохама [ 3 ] превзошла по ряду показателей. [ 4 ] [ 5 ]

Описание

[ редактировать ]

Входными данными для алгоритма является игра G для двух игроков . Здесь G представлена ​​двумя m × n игровыми матрицами размера A и B , содержащими выигрыши для игроков 1 и 2 соответственно, которые имеют m и n чистых стратегий соответственно. Далее предполагается, что все выигрыши положительны. (Благодаря изменению масштаба любую игру можно превратить в стратегически эквивалентную игру с положительными выигрышами.)

G имеет два соответствующих многогранника (называемых многогранниками наилучшего ответа ) P 1 и P 2 в измерениях m и n соответственно, определяемых следующим образом:

  • P 1 находится в R м ; пусть { x 1 ,..., x m } обозначают координаты. P 1 определяется m неравенствами x i ≥ 0 для всех i ∈ {1,..., m } и еще n неравенствами для всех j ∈ {1,..., n } .
  • P 2 находится в R н ; пусть { x m +1 ,..., x m + n } обозначают координаты. P 2 определяется n неравенствами x m + i ≥ 0 для всех i ∈ {1,..., n } и еще m неравенствами для всех i ∈ {1,..., m } .

Здесь P 1 представляет собой набор ненормализованных распределений вероятностей по игрокам 1. m чистых стратегий, таких, что ожидаемый выигрыш игрока 2 не превышает 1. Первые m ограничений требуют, чтобы вероятности были неотрицательными, а остальные n ограничений требуют, чтобы каждая из n чистых стратегий игрока 2 имела ожидаемый выигрыш при большинство 1. P 2 имеет аналогичное значение, меняя роли игроков.

Каждой вершине v графа P1 множества сопоставлен набор меток из {1,..., m + n } следующим образом. Для i ∈ {1, ..., m } вершина v получает метку i, если x i = 0 в вершине v . Для j ∈ {1, ..., n } вершина v получает метку m + j, если Предполагая, что P 1 невырожден, каждая вершина инцидентна m граням P 1 и имеет m меток. Обратите внимание, что начало координат, которое является вершиной P 1 , имеет метки {1, ..., m } .

Каждой вершине графа P2 сопоставлен w набор меток из множества {1, ..., m + n } следующим образом. Для j ∈ {1, ..., n } вершина w получает метку m + j, если x m + j = 0 в вершине w . Для i ∈ {1, ..., m } вершина w получает метку i, если Предполагая, что невырождена P2 , каждая вершина инцидентна n граням P2 n и имеет меток . Обратите внимание, что начало координат, которое является вершиной P 2 , имеет метки { m + 1, ..., m + n } .

Рассмотрим пары вершин ( v , w ) , v P 1 , w P 2 . Пары вершин ( v , w ) называются полностью помеченными, если множества, связанные с v и w, содержат все метки {1, ..., m + n } . Обратите внимание, что если v и w являются началами R м и Р н соответственно, тогда ( v , w ) полностью помечено. Пары вершин ( v , w ) называются почти полностью помеченными (относительно некоторой отсутствующей метки g ), если множества, связанные с v и w, содержат все метки в {1, ..., m + n }, кроме г . Обратите внимание, что в этом случае будет повторяющаяся метка , связанная как с v , так и с w .

Операция поворота состоит из взятия некоторой пары ( v , w ) и замены v на некоторую смежную с v в P1 вершину , , или, альтернативно, замену некоторой вершиной, смежной с w в P2 w . Это имеет эффект (в случае, если v заменяется) замены некоторой метки v какой-то другой меткой. Говорят, что замененная метка отброшена . Учитывая любую метку v , можно удалить эту метку, перейдя к вершине, смежной с v , которая не содержит гиперплоскости, связанной с этой меткой.

Алгоритм начинается с полностью помеченной пары ( v , w ), состоящей из пары начальных координат. Произвольная метка g удаляется с помощью операции поворота, что приводит нас к почти полностью помеченной паре ( v , w ) . Любая почти полностью помеченная пара допускает две операции поворота, соответствующие удалению той или иной копии ее дублированной метки, и каждая из этих операций может привести к созданию другой почти полностью помеченной пары или полностью помеченной пары. В конечном итоге алгоритм находит полностью помеченная пара ( v * , В * ) , что не является началом координат. ( в * , В * ) соответствует паре ненормализованных распределений вероятностей, в которых каждая стратегия i игрока 1 либо платит этому игроку 1, либо платит меньше 1 и используется этим игроком с вероятностью 0 (аналогичное наблюдение справедливо и для игрока 2). Нормализуя эти значения к распределениям вероятностей, мы получаем равновесие Нэша (выигрыши которого для игроков являются обратными факторам нормализации).

Характеристики

[ редактировать ]

Алгоритм может найти не более n + m различных равновесий Нэша. Любой выбор изначально отброшенной метки определяет равновесие, которое в конечном итоге находится алгоритмом.

Алгоритм Лемке-Хаусона эквивалентен следующему гомотопическому подходу. Измените G , выбрав произвольную чистую стратегию g и предоставив игроку, владеющему этой стратегией, большую плату B за ее игру. В модифицированной игре стратегия g используется с вероятностью 1, а другой игрок будет использовать свой лучший ответ на g с вероятностью 1. Рассмотрим континуум игр, в которых B непрерывно сводится к 0. Существует путь равновесия Нэша. соединяющее единственное равновесие модифицированной игры с равновесием G . Чистая стратегия g, выбранная для получения бонуса B, соответствует первоначально выпавшей метке. [ 6 ] Хотя на практике алгоритм эффективен, в худшем случае количество операций поворота может экспоненциально зависеть от количества чистых стратегий в игре. [ 7 ] Впоследствии было показано, что PSPACE-полно найти любое из решений. которые можно получить с помощью алгоритма Лемке–Хаусона. [ 8 ]

  1. ^ Лемке, CE ; Хаусон, Дж. Т. (1964). «Точки равновесия биматричных игр». SIAM Journal по прикладной математике . 12 (2): 413–423. дои : 10.1137/0112033 .
  2. ^ Пападимитриу, Христос Х. (2007). «Сложность поиска равновесия Нэша». Алгоритмическая теория игр . стр. 29–52. дои : 10.1017/CBO9780511800481.004 . ISBN  978-0-521-87282-9 .
  3. ^ Портер, Райан; Нудельман, Евгений; Шохам, Йоав (1 июля 2008 г.). «Простые методы поиска равновесия по Нэшу». Игры и экономическое поведение . 63 (2): 642–662. дои : 10.1016/j.geb.2006.03.015 .
  4. ^ Сэндхольм, Томас; Гилпин, Эндрю; Конитцер, Винсент (9 июля 2005 г.). «Методы смешанно-целочисленного программирования для поиска равновесия Нэша» (PDF) . Материалы 20-й Национальной конференции по искусственному интеллекту . Том. 2. С. 495–501. ISBN  978-1-57735-236-5 .
  5. ^ Чеппи, София; Гатти, Никола; Базилико, Никола (сентябрь 2009 г.). «Вычисление равновесия Байеса-Нэша с помощью методов перебора поддержки в байесовских играх стратегической формы с двумя игроками». 2009 Международная совместная конференция IEEE/WIC/ACM по веб-аналитике и технологиям интеллектуальных агентов . Том. 2. С. 541–548. дои : 10.1109/WI-IAT.2009.209 . ISBN  978-0-7695-3801-3 . S2CID   656183 .
  6. ^ Херингс, П. Дж.; Питерс, Р. (2010). «Гомотопические методы вычисления равновесия в теории игр» . Экономическая теория . 42 (1): 119–156. дои : 10.1007/s00199-009-0441-5 .
  7. ^ Савани, Р.; фон Стенгель, Б. (2006). «Труднорешаемые биматричные игры». Эконометрика . 74 (2): 397–429. CiteSeerX   10.1.1.63.1548 . дои : 10.1111/j.1468-0262.2006.00667.x .
  8. ^ Гольдберг, П.В.; Пападимитриу, Швейцария ; Савани, Р. (2011). Сложность гомотопического метода, подбора равновесия и решений Лемке–Хаусона . Учеб. 52-й ФОКС. стр. 67–76. arXiv : 1006.5352 . дои : 10.1109/FOCS.2011.26 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 599075cbca0e2963653db53553ce26f2__1701044820
URL1:https://arc.ask3.ru/arc/aa/59/f2/599075cbca0e2963653db53553ce26f2.html
Заголовок, (Title) документа по адресу, URL1:
Lemke–Howson algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)