Jump to content

Эпсилон-равновесие

Эпсилон-равновесие
Концепция решения в теории игр
Отношение
Суперсет Равновесие Нэша
Значение
Используется для стохастические игры

В теории игр эпсилон -равновесие , или равновесие, близкое к Нэшу, представляет собой профиль стратегии , который приблизительноудовлетворяет условию равновесия Нэша . В равновесии Нэша ни у одного игрока нет стимула менять своюповедение. В приближенном равновесии Нэша это требование ослаблено, чтобы допустить возможность того, чтоу игрока может быть небольшой стимул сделать что-то другое. Это все еще можно считать адекватнымконцепция решения, предполагающая, например, предвзятость статус-кво . Эта концепция решения может быть предпочтительнее Нэша.равновесие из-за того, что его легче вычислить, или, альтернативно, из-за возможности того, что в играх с болеечем 2 игрока, вероятности, участвующие в точном равновесии Нэша, не обязательно должны быть рациональными числами . [1]

Определение [ править ]

Существует более одного альтернативного определения.

Стандартное определение [ править ]

Учитывая игру и реальный неотрицательный параметр , стратегический профиль называется -равновесие, если ни один игрок не может получить больше, чем в ожидаемом выигрыше за счет одностороннего отклонения от своей стратегии . [2] : 45  Каждое равновесие Нэша эквивалентно -равновесие, где .

Формально пусть быть -игровая игра с наборами действий для каждого игрока и функция полезности .Позволять обозначают выигрыш игроку когда профиль стратегии играется.Позволять — пространство вероятностных распределений по .Вектор стратегий это -Равновесие Нэша для если

для всех

Хорошо приблизительное поддерживаемое равновесие

Следующее определение [3] накладывает более строгое требование, согласно которому игрок может присваивать только положительную вероятность чистой стратегии. если выплата ожидал выплаты в лучшем случае меньше, чем выигрыш за лучший ответ.Позволять быть вероятностью того, что профиль стратегии играется. Для игрока позволять быть стратегическими профилями игроков, отличных от ; для и чистая стратегия из позволять быть профилем стратегии, где играет и другие игроки играют .Позволять быть расплатой за когда профиль стратегии используется.Требование можно выразить формулой

Результаты [ править ]

Существование схемы аппроксимации с полиномиальным временем (PTAS) для ε-равновесий по Нэшу являетсяэквивалентно вопросу о том, существует ли такой для ε-хорошо подтвержденногоприближенные равновесия Нэша, [4] но существование PTAS остается открытой проблемой.Для постоянных значений ε полиномиальные алгоритмы приближенного равновесияизвестны для более низких значений ε, чем известны для хорошо обоснованныхприблизительное равновесие.Для игр с выигрышами в диапазоне [0,1] и ε=0,3393 ε-равновесия Нэша могутвычисляться за полиномиальное время. [5] Для игр с выигрышами в диапазоне [0,1] и ε=2/3 ε-хорошо поддерживаемые равновесия могутвычисляться за полиномиальное время. [6]

Пример [ править ]

Понятие ε-равновесий важно в теории стохастические игры потенциально бесконечной продолжительности. Есть простые примеры стохастических игр без равновесия Нэша но с ε-равновесием для любого ε, строго большего 0.

Возможно, самым простым примером является следующий вариант Matching Pennies , предложенный Эвереттом. Игрок 1 прячет копейку иИгрок 2 должен угадать, орел или решка. Если Игрок 2 угадает правильно, онвыигрывает пенни у Игрока 1, и игра заканчивается. Если Игрок 2 неправильно угадает, что монета это голова вверх,игра заканчивается с нулевым выигрышем для обоих игроков. Если он неправильно угадает, что решка вверх, игра повторяется . Если игра продолжается вечно, выигрыш обоих игроков равен нулю.

Учитывая параметр ε > 0, любой профиль стратегии , в котором Игрок 2 угадывает один на один свероятностью ε и заканчивается с вероятностью 1 − ε (на каждом этапе игры и независимоиз предыдущих этапов) является ε -равновесием игры. Ожидаемый выигрыш игрока 2 втакой профиль стратегии не меньше 1 − ε . Однако легко видеть, что здесь нетстратегия для Игрока 2, которая может гарантировать ожидаемый выигрыш ровно 1. Следовательно, игране имеет равновесия Нэша .

Другим простым примером является конечно повторяющаяся дилемма заключенного для периодов T, где выигрыш усредняется за периоды T. Единственное равновесие Нэша в этой игре — это выбор Дефекта в каждом периоде. Теперь рассмотрим две стратегии «око за око» и «мрачный триггер» . Хотя ни «око за око» , ни «мрачный триггер» не являются равновесием Нэша в этой игре, оба они -равновесия для некоторых положительных . Приемлемые значения зависят от выигрышей составляющей игры и числа периодов T.

В экономике концепция чистой стратегии эпсилон-равновесия используется, когда подход смешанной стратегии считается нереалистичным. В эпсилон-равновесии чистой стратегии каждый игрок выбирает чистую стратегию, которая находится в пределах эпсилона от его лучшей чистой стратегии. Например, в модели Бертрана-Эджворта , где не существует равновесия чистой стратегии, может существовать эпсилон-равновесие чистой стратегии.

Ссылки [ править ]

Встроенные цитаты
  1. ^ В. Бубелис (1979). «О равновесиях в конечных играх». Международный журнал теории игр . 8 (2): 65–79. дои : 10.1007/bf01768703 . S2CID   122843303 .
  2. ^ Вазирани, Виджай В .; Нисан, Ноам ; Рафгарден, Тим ; Тардос, Ева (2007). Алгоритмическая теория игр (PDF) . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN  0-521-87282-0 .
  3. ^ П. В. Голдберг и К. Х. Пападимитриу (2006). «Сводимость среди задач равновесия». 38-й симпозиум по теории вычислений . стр. 61–70. дои : 10.1145/1132516.1132526 .
  4. ^ К. Даскалакис, П.В. Голдберг и Ч. Пападимитриу (2009). «Сложность расчета равновесия Нэша». SIAM Journal по вычислительной технике . 39 (3): 195–259. CiteSeerX   10.1.1.68.6111 . дои : 10.1137/070699652 .
  5. ^ Х. Цакнакис и Пол Г. Спиракис (2008). «Подход к оптимизации приближенного равновесия Нэша» . Интернет-математика . 5 (4): 365–382. дои : 10.1080/15427951.2008.10129172 .
  6. ^ Спирос К. Контояннис и Пол Г. Спиракис (2010). «Хорошо поддерживаемые приближенные равновесия в биматричных играх». Алгоритмика . 57 (4): 653–667. дои : 10.1007/s00453-008-9227-6 . S2CID   15968419 .
Источники
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dc1c7c14043d219e7a42df406e18a2c1__1710188460
URL1:https://arc.ask3.ru/arc/aa/dc/c1/dc1c7c14043d219e7a42df406e18a2c1.html
Заголовок, (Title) документа по адресу, URL1:
Epsilon-equilibrium - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)