Равновесие квантового ответа
Равновесие квантового ответа | |
---|---|
Концепция решения в теории игр | |
Отношение | |
Суперсет | Равновесие Нэша , Равновесие Логита |
Значение | |
Предложено | Ричард МакКелви и Томас Палфри |
Используется для | Некооперативные игры |
Пример | Дилемма путешественника |
Равновесие квантового ответа ( QRE ) — это концепция решения в теории игр . Впервые представлено Ричардом Маккелви и Томасом Палфри . [1] [2] оно обеспечивает понятие равновесия с ограниченной рациональностью . QRE не является уточнением равновесия и может дать результаты, существенно отличающиеся от равновесия Нэша . QRE определяется только для игр с дискретными стратегиями, хотя существуют аналоги с непрерывными стратегиями.
В равновесии квантового ответа предполагается, что игроки совершают ошибки при выборе чистой стратегии для игры. Вероятность выбора какой-либо конкретной стратегии положительно связана с выигрышем от этой стратегии. Другими словами, очень дорогостоящие ошибки маловероятны.
Равновесие возникает в результате реализации убеждений. Выигрыши игрока рассчитываются на основе представлений о распределении вероятностей других игроков по стратегиям. В состоянии равновесия убеждения игрока верны.
Приложение к данным [ править ]
При анализе данных реальных игр, особенно лабораторных экспериментов , особенно экспериментов с игрой в парные монеты , равновесие Нэша может быть неумолимым. Любое неравновесное движение может показаться одинаково «неправильным», но на самом деле его не следует использовать для отклонения теории. QRE позволяет использовать любую стратегию с ненулевой вероятностью, поэтому возможны любые данные (хотя и не обязательно разумные).
Логит-равновесие [ править ]
Наиболее распространенной спецификацией QRE является логит-равновесие ( LQRE ). В логит-равновесии стратегии игрока выбираются в соответствии с распределением вероятностей:
это вероятность игрока выбор стратегии . ожидаемая полезность для игрока выбора стратегии полагая, что другие игроки играют в соответствии с распределением вероятностей . Обратите внимание, что плотность «веры» в ожидаемый выигрыш в правой части должна совпадать с плотностью выбора в левой части. Таким образом, вычисление ожиданий наблюдаемых величин, таких как выигрыш, спрос, выпуск и т. д., требует нахождения фиксированных точек, как в теории среднего поля . [3]
Особый интерес в логит-модели представляет неотрицательный параметр λ (иногда записываемый как 1/μ). λ можно рассматривать как параметр рациональности. При λ → 0 игроки становятся «совершенно нерациональными» и используют каждую стратегию с равной вероятностью. При λ→∞ игроки становятся «совершенно рациональными», и игра приближается к равновесию Нэша. [4]
Для динамичных игр [ править ]
Для динамических ( расширенных ) игр Маккелви и Палфри определили равновесие квантового ответа агента ( AQRE ). AQRE в некоторой степени аналогичен совершенству подигр . В AQRE каждый игрок играет с некоторой ошибкой, как и в QRE. В данном узле принятия решения игрок определяет ожидаемый выигрыш от каждого действия, рассматривая себя в будущем как независимого игрока с известным распределением вероятностей действий. Как и в QRE, в AQRE каждая стратегия используется с ненулевой вероятностью.
Приложения [ править ]
Подход равновесия квантового ответа применялся в различных ситуациях. Например, Goeree et al. (2002) изучают завышение ставок на аукционах частной стоимости, [5] Йи (2005) исследует поведение в ультиматумных играх. [6] Хоппе и Шмитц (2013) изучают роль социальных предпочтений в проблемах принципала и агента. [7] и Каваго и др. (2018) исследуют пошаговые игры с общественными благами с бинарными решениями. [8] Равновесие квантового ответа может быть полезно для математического изучения модели поведения злоумышленника и защитника в проблеме кибербезопасности. [9]
Большинство тестов равновесия квантового ответа основаны на экспериментах, в которых участники не имеют или лишь в небольшой степени заинтересованы в том, чтобы хорошо выполнять задачу. Однако было также обнаружено, что равновесие квантового ответа объясняет поведение в средах с высокими ставками. Масштабный анализ американского телевизионного игрового шоу «Цена правильная» , например, показывает, что поведение участников в так называемой «Showcase Showdown», последовательной игре с совершенной информацией , можно хорошо объяснить с помощью равновесия квантового ответа агента (AQRE). ) модель. [10]
Отзывы [ править ]
Нефальсифицируемость [ править ]
Работа Haile et al. показал, что QRE не фальсифицируемо ни в одной игре нормальной формы, даже со значительными априорными ограничениями на возмущения выигрыша. [11] Авторы утверждают, что концепция LQRE иногда может ограничить набор возможных результатов игры, но может оказаться недостаточной для обеспечения мощного теста поведения без априорных ограничений на возмущения выигрыша.
Потеря информации [ править ]
Как и в статистической механике, подход среднего поля, в частности математическое ожидание показателя степени, приводит к потере информации. [12] В более общем смысле, различия в выигрыше агента по отношению к переменной его стратегии приводят к потере информации.
См. также [ править ]
Ссылки [ править ]
- ^ Маккелви, Ричард ; Палфри, Томас (1995). «Равновесия квантового ответа для игр нормальной формы». Игры и экономическое поведение . 10 :6–38. CiteSeerX 10.1.1.30.5152 . дои : 10.1006/game.1995.1023 .
- ^ Маккелви, Ричард ; Палфри, Томас (1998). «Равновесия квантового ответа для игр с расширенной формой» (PDF) . Экспериментальная экономика . 1 :9–41. дои : 10.1007/BF01426213 .
- ^ Андерсон, Саймон П.; Гури, Джейкоб К.; Холт, Чарльз А. (2004). «Шумное направленное обучение и логит-равновесие». Скандинавский экономический журнал . 106 (3): 581–602. CiteSeerX 10.1.1.81.8574 . дои : 10.1111/j.0347-0520.2004.00378.x . S2CID 14404020 .
- ^ Гури, Джейкоб К.; Холт, Чарльз А.; Палфри, Томас Р. (август 2018 г.). «Стохастическая теория игр для социальных наук: учебник по равновесию квантового ответа» (PDF) . стр. 10–11. Архивировано (PDF) из оригинала 4 августа 2023 г.
- ^ Гури, Джейкоб К.; Холт, Чарльз А.; Палфри, Томас Р. (2002). «Равновесие квантового отклика и завышение ставок на аукционах частной стоимости» (PDF) . Журнал экономической теории . 104 (1): 247–272. дои : 10.1006/jeth.2001.2914 . ISSN 0022-0531 .
- ^ Йи, Кан-О (2005). «Модели равновесия с квантовым откликом в ультиматумной игре». Игры и экономическое поведение . 51 (2): 324–348. дои : 10.1016/s0899-8256(03)00051-4 . ISSN 0899-8256 .
- ^ Хоппе, Ева И.; Шмитц, Патрик В. (2013). «Заключение контрактов при неполной информации и социальных предпочтениях: экспериментальное исследование» . Обзор экономических исследований . 80 (4): 1516–1544. дои : 10.1093/restud/rdt010 .
- ^ Кавагоэ, Тосидзи; Мацубаэ, Тайсуке; Такидзава, Хирокадзу (2018). «Равновесия квантового ответа в обобщенной дилемме волонтера и играх с общественными благами на уровне шагов с бинарным решением». Обзор эволюционной и институциональной экономики . 15 (1): 11–23. дои : 10.1007/s40844-017-0081-6 . ISSN 1349-4961 . S2CID 189937929 .
- ^ Майрадж, Аакиф; Джавайд, Ахмад Ю. (2022). «Теоретико-игровое решение для сетевого узла беспилотных летательных аппаратов, подвергающегося DDoS-атаке». Компьютерные сети . 211 . Эльзевир: 108962.
- ^ Кляйн Тизлинк, Буке; ван Долдер, Денни; ван ден Асем, Мартейн Дж.; Дана, Джейсон (29 июня 2022 г.). «Ошибки обратной индукции с высокими ставками: свидетельства правильной цены» . ССНН 4130176 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Хайле, Филип А.; Ортачу, Али ; Косенок, Григорий (2008). «Об эмпирическом содержании равновесия квантового ответа». Американский экономический обзор . 98 (1): 180–200. CiteSeerX 10.1.1.193.7715 . дои : 10.1257/aer.98.1.180 . S2CID 3083373 .
- ^ Джесси, Дэниел Т.; Саари, Дональд Г. (2016). «От аксиомы выбора Люса к равновесию квантового ответа». Журнал математической психологии . 75 : 3–9. дои : 10.1016/j.jmp.2015.10.001 .