Эпсилон-равновесие
Эпсилон-равновесие | |
---|---|
Концепция решения в теории игр | |
Отношение | |
Суперсет | Равновесие Нэша |
Значение | |
Используется для | стохастические игры |
В теории игр эпсилон -равновесие , или равновесие, близкое к Нэшу, представляет собой профиль стратегии , который приблизительноудовлетворяет условию равновесия Нэша . В равновесии Нэша ни у одного игрока нет стимула менять своюповедение. В приближенном равновесии Нэша это требование ослаблено, чтобы допустить возможность того, чтоу игрока может быть небольшой стимул сделать что-то другое. Это все еще можно считать адекватнымконцепция решения, предполагающая, например, предвзятость статус-кво . Эта концепция решения может быть предпочтительнее Нэша.равновесие из-за того, что его легче вычислить, или, альтернативно, из-за возможности того, что в играх с болеечем 2 игрока, вероятности, участвующие в точном равновесии Нэша, не обязательно должны быть рациональными числами . [1]
Определение [ править ]
Существует более одного альтернативного определения.
Стандартное определение [ править ]
Учитывая игру и реальный неотрицательный параметр , стратегический профиль называется -равновесие, если ни один игрок не может получить больше, чем в ожидаемом выигрыше за счет одностороннего отклонения от своей стратегии . [2] : 45 Каждое равновесие Нэша эквивалентно -равновесие, где .
Формально пусть быть -игровая игра с наборами действий для каждого игрока и функция полезности .Позволять обозначают выигрыш игроку когда профиль стратегии играется.Позволять — пространство вероятностных распределений по .Вектор стратегий это -Равновесие Нэша для если
- для всех
Хорошо приблизительное поддерживаемое равновесие
Следующее определение [3] накладывает более строгое требование, согласно которому игрок может присваивать только положительную вероятность чистой стратегии. если выплата ожидал выплаты в лучшем случае меньше, чем выигрыш за лучший ответ.Позволять быть вероятностью того, что профиль стратегии играется. Для игрока позволять быть стратегическими профилями игроков, отличных от ; для и чистая стратегия из позволять быть профилем стратегии, где играет и другие игроки играют .Позволять быть расплатой за когда профиль стратегии используется.Требование можно выразить формулой
Результаты [ править ]
Существование схемы аппроксимации с полиномиальным временем (PTAS) для ε-равновесий по Нэшу являетсяэквивалентно вопросу о том, существует ли такой для ε-хорошо подтвержденногоприближенные равновесия Нэша, [4] но существование PTAS остается открытой проблемой.Для постоянных значений ε полиномиальные алгоритмы приближенного равновесияизвестны для более низких значений ε, чем известны для хорошо обоснованныхприблизительное равновесие.Для игр с выигрышами в диапазоне [0,1] и ε=0,3393 ε-равновесия Нэша могутвычисляться за полиномиальное время. [5] Для игр с выигрышами в диапазоне [0,1] и ε=2/3 ε-хорошо поддерживаемые равновесия могутвычисляться за полиномиальное время. [6]
Пример [ править ]
Понятие ε-равновесий важно в теории стохастические игры потенциально бесконечной продолжительности. Есть простые примеры стохастических игр без равновесия Нэша но с ε-равновесием для любого ε, строго большего 0.
Возможно, самым простым примером является следующий вариант Matching Pennies , предложенный Эвереттом. Игрок 1 прячет копейку иИгрок 2 должен угадать, орел или решка. Если Игрок 2 угадает правильно, онвыигрывает пенни у Игрока 1, и игра заканчивается. Если Игрок 2 неправильно угадает, что монета это голова вверх,игра заканчивается с нулевым выигрышем для обоих игроков. Если он неправильно угадает, что решка вверх, игра повторяется . Если игра продолжается вечно, выигрыш обоих игроков равен нулю.
Учитывая параметр ε > 0, любой профиль стратегии , в котором Игрок 2 угадывает один на один свероятностью ε и заканчивается с вероятностью 1 − ε (на каждом этапе игры и независимоиз предыдущих этапов) является ε -равновесием игры. Ожидаемый выигрыш игрока 2 втакой профиль стратегии не меньше 1 − ε . Однако легко видеть, что здесь нетстратегия для Игрока 2, которая может гарантировать ожидаемый выигрыш ровно 1. Следовательно, игране имеет равновесия Нэша .
Другим простым примером является конечно повторяющаяся дилемма заключенного для периодов T, где выигрыш усредняется за периоды T. Единственное равновесие Нэша в этой игре — это выбор Дефекта в каждом периоде. Теперь рассмотрим две стратегии «око за око» и «мрачный триггер» . Хотя ни «око за око» , ни «мрачный триггер» не являются равновесием Нэша в этой игре, оба они -равновесия для некоторых положительных . Приемлемые значения зависят от выигрышей составляющей игры и числа периодов T.
В экономике концепция чистой стратегии эпсилон-равновесия используется, когда подход смешанной стратегии считается нереалистичным. В эпсилон-равновесии чистой стратегии каждый игрок выбирает чистую стратегию, которая находится в пределах эпсилона от его лучшей чистой стратегии. Например, в модели Бертрана-Эджворта , где не существует равновесия чистой стратегии, может существовать эпсилон-равновесие чистой стратегии.
Ссылки [ править ]
- Встроенные цитаты
- ^ В. Бубелис (1979). «О равновесиях в конечных играх». Международный журнал теории игр . 8 (2): 65–79. дои : 10.1007/bf01768703 . S2CID 122843303 .
- ^ Вазирани, Виджай В .; Нисан, Ноам ; Рафгарден, Тим ; Тардос, Ева (2007). Алгоритмическая теория игр (PDF) . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 0-521-87282-0 .
- ^ П. В. Голдберг и К. Х. Пападимитриу (2006). «Сводимость среди задач равновесия». 38-й симпозиум по теории вычислений . стр. 61–70. дои : 10.1145/1132516.1132526 .
- ^ К. Даскалакис, П.В. Голдберг и Ч. Пападимитриу (2009). «Сложность расчета равновесия Нэша». SIAM Journal по вычислительной технике . 39 (3): 195–259. CiteSeerX 10.1.1.68.6111 . дои : 10.1137/070699652 .
- ^ Х. Цакнакис и Пол Г. Спиракис (2008). «Подход к оптимизации приближенного равновесия Нэша» . Интернет-математика . 5 (4): 365–382. дои : 10.1080/15427951.2008.10129172 .
- ^ Спирос К. Контояннис и Пол Г. Спиракис (2010). «Хорошо поддерживаемые приближенные равновесия в биматричных играх». Алгоритмика . 57 (4): 653–667. дои : 10.1007/s00453-008-9227-6 . S2CID 15968419 .
- Источники
- Х. Диксон Приблизительное равновесие Бертрана в воспроизводимой отрасли , Обзор экономических исследований, 54 (1987), страницы 47–62.
- Х. Эверетт. «Рекурсивные игры». В редакторах HW Kuhn и AW Tucker. Вклады в теорию игр , вып. III, том 39 «Анналов математических исследований» . Издательство Принстонского университета, 1957.
- Лейтон-Браун, Кевин ; Шохам, Йоав (2008), Основы теории игр: краткое междисциплинарное введение , Сан-Рафаэль, Калифорния: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1 . 88-страничное математическое введение; см. раздел 3.7. Бесплатно онлайн. Архивировано 15 августа 2000 г. в Wayback Machine во многих университетах.
- Р. Раднер . Сговорное поведение в некооперативном эпсилон-равновесии олигополий с долгой, но конечной жизнью , Journal of Economic Theory, 22 , 121–157, 1980.
- Шохам, Йоав; Лейтон-Браун, Кевин (2009), Мультиагентные системы: алгоритмические, теоретико-игровые и логические основы , Нью-Йорк: Издательство Кембриджского университета , ISBN 978-0-521-89943-7 . Полный справочник с вычислительной точки зрения; см. раздел 3.4.7. Можно скачать бесплатно онлайн .
- Ш. Тийс. Равновесия Нэша для некооперативных игр n лиц в нормальной форме , SIAM Review, 23 , 225–237, 1981.