Байесовское убеждение

В экономике и игр теории байесовское убеждение является формой проектирования механизмов . Один участник (отправитель) намеревается убедить другого (получателя) в определенном образе действий. Отправитель должен решить, какое действие предпринять, чтобы максимизировать ожидаемую полезность , предоставив получателю доказательства, исходя из предположения, что получатель пересмотрит свое мнение о состоянии мира, используя правило Байеса . Байесовское убеждение было предложено Каменицей и Генцковым. ^[1]

Байесовское убеждение — это частный случай проблемы принципала и агента : принципал — отправитель, а агент — получатель. Его также можно рассматривать как протокол связи , сравнимый с сигнальными играми ; ^[2] отправитель должен решить, какой сигнал передать получателю, чтобы максимизировать ожидаемую полезность . Это также можно рассматривать как форму дешевого разговора . ^[3]

Пример

Каменица и Генцков ^[1] используйте следующий пример. Отправителем является медицинская компания, а получателем — медицинский регулятор. Компания производит новое лекарство и нуждается в одобрении регулятора. Возможны два состояния мира: лекарство может быть либо «хорошим», либо «плохим». Компания и регулятор не знают истинного положения. Однако компания может провести эксперимент и сообщить о результатах регулятору. Вопрос в том, какой эксперимент следует провести компании, чтобы получить для себя наилучший результат. Предположения таковы:

Компания получает полезность тогда и только тогда, когда лекарство одобрено.
Регулятор получает полезность тогда и только тогда, когда он обеспечивает точный результат (одобрение хорошего лекарства или отказ от плохого).
И компания, и регулирующий орган знают априорную вероятность того, что лекарство хорошее.
Обе стороны согласовывают план эксперимента и сообщение о результатах (поэтому нет элемента обмана ).

Например, предположим, что априорная вероятность того, что лекарство хорошее, равна 1/3 и что у компании есть выбор из трех действий:

Проведите тщательный эксперимент, который всегда определит, хорошее или плохое лекарство, и правдиво сообщите о результатах регулирующему органу. В этом случае регулятор одобрит лекарство с вероятностью 1/3, поэтому ожидаемая полезность компании составит 1/3.
Не проводите никаких экспериментов; Всегда говорите: «Лекарство хорошее». В этом случае сигнал не дает регулятору никакой информации. Поскольку регулирующий орган считает, что лекарство хорошее с вероятностью 1/3, действие, максимизирующее ожидания, состоит в том, чтобы всегда отвергать его. Следовательно, ожидаемая полезность компании равна 0.
Проведите эксперимент, который, если лекарство хорошее, всегда сообщает «хорошее», а если лекарство плохое, оно сообщает «хорошее» или «плохое» с вероятностью 1/2. Здесь регулятор применяет правило Байеса: при сигнале «хорошо» вероятность того, что лекарство хорошее, равна 1/2, поэтому регулятор его одобряет. При сигнале «плохо» вероятность того, что лекарство хорошее, равна 0, поэтому регулятор его отклоняет. В целом регулятор одобряет препарат в 2/3 случаев, поэтому ожидаемая полезность компании составляет 2/3.

В этом случае третья политика оптимальна для отправителя, поскольку она имеет наибольшую ожидаемую полезность из доступных вариантов. Используя правило Байеса, отправитель убеждает получателя действовать благоприятно для отправителя.

Обобщенная модель

Базовая модель была обобщена несколькими способами, в том числе:

Получатель может иметь личную информацию, не переданную отправителю. ^[4]^[5]^[6]
Отправитель и получатель могут иметь разные приоритеты состояния мира. ^[7]
Может быть несколько отправителей, каждый из которых отправляет сигнал одновременно, а все получатели получают все сигналы, прежде чем действовать. ^[8]^[9]
Может быть несколько отправителей, которые отправляют сигналы последовательно, и получатель получает все сигналы, прежде чем действовать. ^[10]
Может быть несколько приемников, включая случаи, когда каждый получает свой собственный сигнал, один и тот же сигнал или сигналы, которые каким-то образом коррелированы , и когда каждый приемник может учитывать действия других приемников. ^[11]
Серия сигналов может быть отправлена с течением времени. ^[12]

Практическое применение

Применимость модели была оценена в ряде реальных ситуаций:

Раскрытие капитала банками резервов регуляторам финансовым . ^[13]
Оценивание работ учащихся преподавателями . , где получателями являются потенциальные будущие работодатели ^[14]
Предоставление обратной связи работодателем работникам. ^[15]
Раскрытие сюжетных линий от создателя художественного произведения для развлечения читателя или зрителя. ^[16]

Вычислительный подход

Для практического расчета оптимальной схемы сигнализации были разработаны алгоритмические методы. Это можно найти в полиномиальном времени по отношению к количеству действий и псевдополиномиальном времени по отношению к количеству состояний мира. ^[3] Алгоритмы с меньшей вычислительной сложностью также возможны при более сильных предположениях.

Онлайн -случай , когда несколько сигналов отправляются с течением времени, может быть эффективно решен как задача минимизации сожалений . ^[17]

Ссылки

^ Jump up to: ^а ^б Каменица, Эмир; Генцков, Мэтью (01 октября 2011 г.). «Байесовское убеждение» . Американский экономический обзор . 101 (6): 2590–2615. дои : 10.1257/aer.101.6.2590 . ISSN 0002-8282 .
^ Каменица, Эмир (13 мая 2019 г.). «Байесовское убеждение и информационный дизайн» . Ежегодный обзор экономики . 11 : 249–272. doi : 10.1146/annurev- Economics-080218-025739 .
^ Jump up to: ^а ^б Дугми, Шаддин; Сюй, Хайфэн (июнь 2016 г.). «Алгоритмическое байесовское убеждение» . Материалы сорок восьмого ежегодного симпозиума ACM по теории вычислений . стр. 412–425. arXiv : 1503.05988 . дои : 10.1145/2897518.2897583 . ISBN 978-1-4503-4132-5 .
^ Хедлунд, Йонас (01 января 2017 г.). «Байесовское убеждение отправителя, информированного частным образом» . Журнал экономической теории . 167 : 229–268. дои : 10.1016/j.jet.2016.11.003 .
^ Колотилин Антон (29 мая 2018 г.). «Оптимальное раскрытие информации: подход линейного программирования» . Теоретическая экономика . 13 (2): 607–635. дои : 10.3982/TE1805 . hdl : 10419/197158 .
^ Райо, Луис; Сигал, Илья (01 октября 2010 г.). «Оптимальное раскрытие информации». Журнал политической экономии . 118 (5): 949–987. дои : 10.1086/657922 .
^ Камара, Модибо К.; Хартлайн, Джейсон Д.; Джонсен, Алек (01 ноября 2020 г.). «Механизмы агента без сожалений: за пределами общего приоритета» . 61-й ежегодный симпозиум IEEE по основам информатики (FOCS) 2020 г. ИИЭР: 259–270. arXiv : 2009.05518 . дои : 10.1109/focs46700.2020.00033 . ISBN 978-1-7281-9621-3 .
^ Генцков, Мэтью; Каменица, Эмир (18 октября 2016 г.). «Соревнование в убеждении» . Обзор экономических исследований . 84 : 300–322. doi : 10.1093/restud/rdw052 .
^ Генцков, Мэтью; Шапиро, Джесси М. (2008). «Конкуренция и доверие на рынке новостей». Журнал экономических перспектив . 22 (2): 133–154. дои : 10.1257/jep.22.2.133 .
^ Ли, Фэй; Норман, Питер (2021). «Последовательное убеждение» . Теоретическая экономика . 16 (2): 639-675.
^ Бергеманн, Дирк; Моррис, Стивен (01 марта 2019 г.). «Информационный дизайн: единый взгляд» . Журнал экономической литературы . 57 : 44–95. дои : 10.1257/jel.20181489 .
^ Эли, Джеффри С. (январь 2017 г.). «Гудки» . Американский экономический обзор . 107 (1): 31–53. doi : 10.1257/aer.20150218 .
^ Гольдштейн, Италия; Лейтнер, Ярон (сентябрь 2018 г.). «Стресс-тесты и раскрытие информации» . Журнал экономической теории . 177 : 34–69. дои : 10.1016/j.jet.2018.05.013 .
^ Болеславский, Рафаэль; Коттон, Кристофер (май 2015 г.). «Стандарты оценивания и качество образования» . Американский экономический журнал: Микроэкономика . 7 (2): 248–279. дои : 10.1257/mic.20130080 .
^ Хабиби, Амир (январь 2020 г.). «Мотивация и информационный дизайн» . Журнал экономического поведения и организации . 169 : 1–18. дои : 10.1016/j.jebo.2019.10.015 .
^ Эли, Джеффри; Франкель, Александр; Каменица, Эмир (февраль 2015 г.). «Саспенс и сюрприз» . Журнал политической экономии . 123 : 215–260. дои : 10.1086/677350 .
^ Бернаскони, Мартино; Кастильони, Маттео (2023). «Оптимальные скорости и эффективные алгоритмы для байесовского убеждения в Интернете» . Труды исследований машинного обучения . 202 : 2164–2183. arXiv : 2303.01296 .

[:0-1] Jump up to: ^а ^б Каменица, Эмир; Генцков, Мэтью (01 октября 2011 г.). «Байесовское убеждение» . Американский экономический обзор . 101 (6): 2590–2615. дои : 10.1257/aer.101.6.2590 . ISSN 0002-8282 .

[2] Каменица, Эмир (13 мая 2019 г.). «Байесовское убеждение и информационный дизайн» . Ежегодный обзор экономики . 11 : 249–272. doi : 10.1146/annurev- Economics-080218-025739 .

[algorithmic-3] Jump up to: ^а ^б Дугми, Шаддин; Сюй, Хайфэн (июнь 2016 г.). «Алгоритмическое байесовское убеждение» . Материалы сорок восьмого ежегодного симпозиума ACM по теории вычислений . стр. 412–425. arXiv : 1503.05988 . дои : 10.1145/2897518.2897583 . ISBN 978-1-4503-4132-5 .

[4] Хедлунд, Йонас (01 января 2017 г.). «Байесовское убеждение отправителя, информированного частным образом» . Журнал экономической теории . 167 : 229–268. дои : 10.1016/j.jet.2016.11.003 .

[5] Колотилин Антон (29 мая 2018 г.). «Оптимальное раскрытие информации: подход линейного программирования» . Теоретическая экономика . 13 (2): 607–635. дои : 10.3982/TE1805 . hdl : 10419/197158 .

[6] Райо, Луис; Сигал, Илья (01 октября 2010 г.). «Оптимальное раскрытие информации». Журнал политической экономии . 118 (5): 949–987. дои : 10.1086/657922 .

[7] Камара, Модибо К.; Хартлайн, Джейсон Д.; Джонсен, Алек (01 ноября 2020 г.). «Механизмы агента без сожалений: за пределами общего приоритета» . 61-й ежегодный симпозиум IEEE по основам информатики (FOCS) 2020 г. ИИЭР: 259–270. arXiv : 2009.05518 . дои : 10.1109/focs46700.2020.00033 . ISBN 978-1-7281-9621-3 .

[8] Генцков, Мэтью; Каменица, Эмир (18 октября 2016 г.). «Соревнование в убеждении» . Обзор экономических исследований . 84 : 300–322. doi : 10.1093/restud/rdw052 .

[9] Генцков, Мэтью; Шапиро, Джесси М. (2008). «Конкуренция и доверие на рынке новостей». Журнал экономических перспектив . 22 (2): 133–154. дои : 10.1257/jep.22.2.133 .

[10] Ли, Фэй; Норман, Питер (2021). «Последовательное убеждение» . Теоретическая экономика . 16 (2): 639-675.

[11] Бергеманн, Дирк; Моррис, Стивен (01 марта 2019 г.). «Информационный дизайн: единый взгляд» . Журнал экономической литературы . 57 : 44–95. дои : 10.1257/jel.20181489 .

[12] Эли, Джеффри С. (январь 2017 г.). «Гудки» . Американский экономический обзор . 107 (1): 31–53. doi : 10.1257/aer.20150218 .

[13] Гольдштейн, Италия; Лейтнер, Ярон (сентябрь 2018 г.). «Стресс-тесты и раскрытие информации» . Журнал экономической теории . 177 : 34–69. дои : 10.1016/j.jet.2018.05.013 .

[14] Болеславский, Рафаэль; Коттон, Кристофер (май 2015 г.). «Стандарты оценивания и качество образования» . Американский экономический журнал: Микроэкономика . 7 (2): 248–279. дои : 10.1257/mic.20130080 .

[15] Хабиби, Амир (январь 2020 г.). «Мотивация и информационный дизайн» . Журнал экономического поведения и организации . 169 : 1–18. дои : 10.1016/j.jebo.2019.10.015 .

[16] Эли, Джеффри; Франкель, Александр; Каменица, Эмир (февраль 2015 г.). «Саспенс и сюрприз» . Журнал политической экономии . 123 : 215–260. дои : 10.1086/677350 .

[17] Бернаскони, Мартино; Кастильони, Маттео (2023). «Оптимальные скорости и эффективные алгоритмы для байесовского убеждения в Интернете» . Труды исследований машинного обучения . 202 : 2164–2183. arXiv : 2303.01296 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]