Байесовское убеждение
В экономике и игр теории байесовское убеждение является формой проектирования механизмов . Один участник (отправитель) намеревается убедить другого (получателя) в определенном образе действий. Отправитель должен решить, какое действие предпринять, чтобы максимизировать ожидаемую полезность , предоставив получателю доказательства, исходя из предположения, что получатель пересмотрит свое мнение о состоянии мира, используя правило Байеса . Байесовское убеждение было предложено Каменицей и Генцковым. [1]
Байесовское убеждение — это частный случай проблемы принципала и агента : принципал — отправитель, а агент — получатель. Его также можно рассматривать как протокол связи , сравнимый с сигнальными играми ; [2] отправитель должен решить, какой сигнал передать получателю, чтобы максимизировать ожидаемую полезность . Это также можно рассматривать как форму дешевого разговора . [3]
Пример
[ редактировать ]Каменица и Генцков [1] используйте следующий пример. Отправителем является медицинская компания, а получателем — медицинский регулятор. Компания производит новое лекарство и нуждается в одобрении регулятора. Возможны два состояния мира: лекарство может быть либо «хорошим», либо «плохим». Компания и регулятор не знают истинного положения. Однако компания может провести эксперимент и сообщить о результатах регулятору. Вопрос в том, какой эксперимент следует провести компании, чтобы получить для себя наилучший результат. Предположения таковы:
- Компания получает полезность тогда и только тогда, когда лекарство одобрено.
- Регулятор получает полезность тогда и только тогда, когда он обеспечивает точный результат (одобрение хорошего лекарства или отказ от плохого).
- И компания, и регулирующий орган знают априорную вероятность того, что лекарство хорошее.
- Обе стороны согласовывают план эксперимента и сообщение о результатах (поэтому нет элемента обмана ).
Например, предположим, что априорная вероятность того, что лекарство хорошее, равна 1/3 и что у компании есть выбор из трех действий:
- Проведите тщательный эксперимент, который всегда определит, хорошее или плохое лекарство, и правдиво сообщите о результатах регулирующему органу. В этом случае регулятор одобрит лекарство с вероятностью 1/3, поэтому ожидаемая полезность компании составит 1/3.
- Не проводите никаких экспериментов; Всегда говорите: «Лекарство хорошее». В этом случае сигнал не дает регулятору никакой информации. Поскольку регулирующий орган считает, что лекарство хорошее с вероятностью 1/3, действие, максимизирующее ожидания, состоит в том, чтобы всегда отвергать его. Следовательно, ожидаемая полезность компании равна 0.
- Проведите эксперимент, который, если лекарство хорошее, всегда сообщает «хорошее», а если лекарство плохое, оно сообщает «хорошее» или «плохое» с вероятностью 1/2. Здесь регулятор применяет правило Байеса: при сигнале «хорошо» вероятность того, что лекарство хорошее, равна 1/2, поэтому регулятор его одобряет. При сигнале «плохо» вероятность того, что лекарство хорошее, равна 0, поэтому регулятор его отклоняет. В целом регулятор одобряет препарат в 2/3 случаев, поэтому ожидаемая полезность компании составляет 2/3.
В этом случае третья политика оптимальна для отправителя, поскольку она имеет наибольшую ожидаемую полезность из доступных вариантов. Используя правило Байеса, отправитель убеждает получателя действовать благоприятно для отправителя.
Обобщенная модель
[ редактировать ]Базовая модель была обобщена несколькими способами, в том числе:
- Получатель может иметь личную информацию, не переданную отправителю. [4] [5] [6]
- Отправитель и получатель могут иметь разные приоритеты состояния мира. [7]
- Может быть несколько отправителей, каждый из которых отправляет сигнал одновременно, а все получатели получают все сигналы, прежде чем действовать. [8] [9]
- Может быть несколько отправителей, которые отправляют сигналы последовательно, и получатель получает все сигналы, прежде чем действовать. [10]
- Может быть несколько приемников, включая случаи, когда каждый получает свой собственный сигнал, один и тот же сигнал или сигналы, которые каким-то образом коррелированы , и когда каждый приемник может учитывать действия других приемников. [11]
- Серия сигналов может быть отправлена с течением времени. [12]
Практическое применение
[ редактировать ]Применимость модели была оценена в ряде реальных ситуаций:
- Раскрытие капитала банками резервов регуляторам финансовым . [13]
- Оценивание работ учащихся преподавателями . , где получателями являются потенциальные будущие работодатели [14]
- Предоставление обратной связи работодателем работникам. [15]
- Раскрытие сюжетных линий от создателя художественного произведения для развлечения читателя или зрителя. [16]
Вычислительный подход
[ редактировать ]Для практического расчета оптимальной схемы сигнализации были разработаны алгоритмические методы. Это можно найти в полиномиальном времени по отношению к количеству действий и псевдополиномиальном времени по отношению к количеству состояний мира. [3] Алгоритмы с меньшей вычислительной сложностью также возможны при более сильных предположениях.
Онлайн -случай , когда несколько сигналов отправляются с течением времени, может быть эффективно решен как задача минимизации сожалений . [17]
Ссылки
[ редактировать ]- ^ Jump up to: а б Каменица, Эмир; Генцков, Мэтью (01 октября 2011 г.). «Байесовское убеждение» . Американский экономический обзор . 101 (6): 2590–2615. дои : 10.1257/aer.101.6.2590 . ISSN 0002-8282 .
- ^ Каменица, Эмир (13 мая 2019 г.). «Байесовское убеждение и информационный дизайн» . Ежегодный обзор экономики . 11 : 249–272. doi : 10.1146/annurev- Economics-080218-025739 .
- ^ Jump up to: а б Дугми, Шаддин; Сюй, Хайфэн (июнь 2016 г.). «Алгоритмическое байесовское убеждение» . Материалы сорок восьмого ежегодного симпозиума ACM по теории вычислений . стр. 412–425. arXiv : 1503.05988 . дои : 10.1145/2897518.2897583 . ISBN 978-1-4503-4132-5 .
- ^ Хедлунд, Йонас (01 января 2017 г.). «Байесовское убеждение отправителя, информированного частным образом» . Журнал экономической теории . 167 : 229–268. дои : 10.1016/j.jet.2016.11.003 .
- ^ Колотилин Антон (29 мая 2018 г.). «Оптимальное раскрытие информации: подход линейного программирования» . Теоретическая экономика . 13 (2): 607–635. дои : 10.3982/TE1805 . hdl : 10419/197158 .
- ^ Райо, Луис; Сигал, Илья (01 октября 2010 г.). «Оптимальное раскрытие информации». Журнал политической экономии . 118 (5): 949–987. дои : 10.1086/657922 .
- ^ Камара, Модибо К.; Хартлайн, Джейсон Д.; Джонсен, Алек (01 ноября 2020 г.). «Механизмы агента без сожалений: за пределами общего приоритета» . 61-й ежегодный симпозиум IEEE по основам информатики (FOCS) 2020 г. ИИЭР: 259–270. arXiv : 2009.05518 . дои : 10.1109/focs46700.2020.00033 . ISBN 978-1-7281-9621-3 .
- ^ Генцков, Мэтью; Каменица, Эмир (18 октября 2016 г.). «Соревнование в убеждении» . Обзор экономических исследований . 84 : 300–322. doi : 10.1093/restud/rdw052 .
- ^ Генцков, Мэтью; Шапиро, Джесси М. (2008). «Конкуренция и доверие на рынке новостей». Журнал экономических перспектив . 22 (2): 133–154. дои : 10.1257/jep.22.2.133 .
- ^ Ли, Фэй; Норман, Питер (2021). «Последовательное убеждение» . Теоретическая экономика . 16 (2): 639-675.
- ^ Бергеманн, Дирк; Моррис, Стивен (01 марта 2019 г.). «Информационный дизайн: единый взгляд» . Журнал экономической литературы . 57 : 44–95. дои : 10.1257/jel.20181489 .
- ^ Эли, Джеффри С. (январь 2017 г.). «Гудки» . Американский экономический обзор . 107 (1): 31–53. doi : 10.1257/aer.20150218 .
- ^ Гольдштейн, Италия; Лейтнер, Ярон (сентябрь 2018 г.). «Стресс-тесты и раскрытие информации» . Журнал экономической теории . 177 : 34–69. дои : 10.1016/j.jet.2018.05.013 .
- ^ Болеславский, Рафаэль; Коттон, Кристофер (май 2015 г.). «Стандарты оценивания и качество образования» . Американский экономический журнал: Микроэкономика . 7 (2): 248–279. дои : 10.1257/mic.20130080 .
- ^ Хабиби, Амир (январь 2020 г.). «Мотивация и информационный дизайн» . Журнал экономического поведения и организации . 169 : 1–18. дои : 10.1016/j.jebo.2019.10.015 .
- ^ Эли, Джеффри; Франкель, Александр; Каменица, Эмир (февраль 2015 г.). «Саспенс и сюрприз» . Журнал политической экономии . 123 : 215–260. дои : 10.1086/677350 .
- ^ Бернаскони, Мартино; Кастильони, Маттео (2023). «Оптимальные скорости и эффективные алгоритмы для байесовского убеждения в Интернете» . Труды исследований машинного обучения . 202 : 2164–2183. arXiv : 2303.01296 .