Jump to content

Байесовское убеждение

В экономике и игр теории байесовское убеждение является формой проектирования механизмов . Один участник (отправитель) намеревается убедить другого (получателя) в определенном образе действий. Отправитель должен решить, какое действие предпринять, чтобы максимизировать ожидаемую полезность , предоставив получателю доказательства, исходя из предположения, что получатель пересмотрит свое мнение о состоянии мира, используя правило Байеса . Байесовское убеждение было предложено Каменицей и Генцковым. [1]

Байесовское убеждение — это частный случай проблемы принципала и агента : принципал — отправитель, а агент — получатель. Его также можно рассматривать как протокол связи , сравнимый с сигнальными играми ; [2] отправитель должен решить, какой сигнал передать получателю, чтобы максимизировать ожидаемую полезность . Это также можно рассматривать как форму дешевого разговора . [3]

Каменица и Генцков [1] используйте следующий пример. Отправителем является медицинская компания, а получателем — медицинский регулятор. Компания производит новое лекарство и нуждается в одобрении регулятора. Возможны два состояния мира: лекарство может быть либо «хорошим», либо «плохим». Компания и регулятор не знают истинного положения. Однако компания может провести эксперимент и сообщить о результатах регулятору. Вопрос в том, какой эксперимент следует провести компании, чтобы получить для себя наилучший результат. Предположения таковы:

  • Компания получает полезность тогда и только тогда, когда лекарство одобрено.
  • Регулятор получает полезность тогда и только тогда, когда он обеспечивает точный результат (одобрение хорошего лекарства или отказ от плохого).
  • И компания, и регулирующий орган знают априорную вероятность того, что лекарство хорошее.
  • Обе стороны согласовывают план эксперимента и сообщение о результатах (поэтому нет элемента обмана ).

Например, предположим, что априорная вероятность того, что лекарство хорошее, равна 1/3 и что у компании есть выбор из трех действий:

  1. Проведите тщательный эксперимент, который всегда определит, хорошее или плохое лекарство, и правдиво сообщите о результатах регулирующему органу. В этом случае регулятор одобрит лекарство с вероятностью 1/3, поэтому ожидаемая полезность компании составит 1/3.
  2. Не проводите никаких экспериментов; Всегда говорите: «Лекарство хорошее». В этом случае сигнал не дает регулятору никакой информации. Поскольку регулирующий орган считает, что лекарство хорошее с вероятностью 1/3, действие, максимизирующее ожидания, состоит в том, чтобы всегда отвергать его. Следовательно, ожидаемая полезность компании равна 0.
  3. Проведите эксперимент, который, если лекарство хорошее, всегда сообщает «хорошее», а если лекарство плохое, оно сообщает «хорошее» или «плохое» с вероятностью 1/2. Здесь регулятор применяет правило Байеса: при сигнале «хорошо» вероятность того, что лекарство хорошее, равна 1/2, поэтому регулятор его одобряет. При сигнале «плохо» вероятность того, что лекарство хорошее, равна 0, поэтому регулятор его отклоняет. В целом регулятор одобряет препарат в 2/3 случаев, поэтому ожидаемая полезность компании составляет 2/3.

В этом случае третья политика оптимальна для отправителя, поскольку она имеет наибольшую ожидаемую полезность из доступных вариантов. Используя правило Байеса, отправитель убеждает получателя действовать благоприятно для отправителя.

Обобщенная модель

[ редактировать ]

Базовая модель была обобщена несколькими способами, в том числе:

  • Получатель может иметь личную информацию, не переданную отправителю. [4] [5] [6]
  • Отправитель и получатель могут иметь разные приоритеты состояния мира. [7]
  • Может быть несколько отправителей, каждый из которых отправляет сигнал одновременно, а все получатели получают все сигналы, прежде чем действовать. [8] [9]
  • Может быть несколько отправителей, которые отправляют сигналы последовательно, и получатель получает все сигналы, прежде чем действовать. [10]
  • Может быть несколько приемников, включая случаи, когда каждый получает свой собственный сигнал, один и тот же сигнал или сигналы, которые каким-то образом коррелированы , и когда каждый приемник может учитывать действия других приемников. [11]
  • Серия сигналов может быть отправлена ​​с течением времени. [12]

Практическое применение

[ редактировать ]

Применимость модели была оценена в ряде реальных ситуаций:

Вычислительный подход

[ редактировать ]

Для практического расчета оптимальной схемы сигнализации были разработаны алгоритмические методы. Это можно найти в полиномиальном времени по отношению к количеству действий и псевдополиномиальном времени по отношению к количеству состояний мира. [3] Алгоритмы с меньшей вычислительной сложностью также возможны при более сильных предположениях.

Онлайн -случай , когда несколько сигналов отправляются с течением времени, может быть эффективно решен как задача минимизации сожалений . [17]

  1. ^ Jump up to: а б Каменица, Эмир; Генцков, Мэтью (01 октября 2011 г.). «Байесовское убеждение» . Американский экономический обзор . 101 (6): 2590–2615. дои : 10.1257/aer.101.6.2590 . ISSN   0002-8282 .
  2. ^ Каменица, Эмир (13 мая 2019 г.). «Байесовское убеждение и информационный дизайн» . Ежегодный обзор экономики . 11 : 249–272. doi : 10.1146/annurev- Economics-080218-025739 .
  3. ^ Jump up to: а б Дугми, Шаддин; Сюй, Хайфэн (июнь 2016 г.). «Алгоритмическое байесовское убеждение» . Материалы сорок восьмого ежегодного симпозиума ACM по теории вычислений . стр. 412–425. arXiv : 1503.05988 . дои : 10.1145/2897518.2897583 . ISBN  978-1-4503-4132-5 .
  4. ^ Хедлунд, Йонас (01 января 2017 г.). «Байесовское убеждение отправителя, информированного частным образом» . Журнал экономической теории . 167 : 229–268. дои : 10.1016/j.jet.2016.11.003 .
  5. ^ Колотилин Антон (29 мая 2018 г.). «Оптимальное раскрытие информации: подход линейного программирования» . Теоретическая экономика . 13 (2): 607–635. дои : 10.3982/TE1805 . hdl : 10419/197158 .
  6. ^ Райо, Луис; Сигал, Илья (01 октября 2010 г.). «Оптимальное раскрытие информации». Журнал политической экономии . 118 (5): 949–987. дои : 10.1086/657922 .
  7. ^ Камара, Модибо К.; Хартлайн, Джейсон Д.; Джонсен, Алек (01 ноября 2020 г.). «Механизмы агента без сожалений: за пределами общего приоритета» . 61-й ежегодный симпозиум IEEE по основам информатики (FOCS) 2020 г. ИИЭР: 259–270. arXiv : 2009.05518 . дои : 10.1109/focs46700.2020.00033 . ISBN  978-1-7281-9621-3 .
  8. ^ Генцков, Мэтью; Каменица, Эмир (18 октября 2016 г.). «Соревнование в убеждении» . Обзор экономических исследований . 84 : 300–322. doi : 10.1093/restud/rdw052 .
  9. ^ Генцков, Мэтью; Шапиро, Джесси М. (2008). «Конкуренция и доверие на рынке новостей». Журнал экономических перспектив . 22 (2): 133–154. дои : 10.1257/jep.22.2.133 .
  10. ^ Ли, Фэй; Норман, Питер (2021). «Последовательное убеждение» . Теоретическая экономика . 16 (2): 639-675.
  11. ^ Бергеманн, Дирк; Моррис, Стивен (01 марта 2019 г.). «Информационный дизайн: единый взгляд» . Журнал экономической литературы . 57 : 44–95. дои : 10.1257/jel.20181489 .
  12. ^ Эли, Джеффри С. (январь 2017 г.). «Гудки» . Американский экономический обзор . 107 (1): 31–53. doi : 10.1257/aer.20150218 .
  13. ^ Гольдштейн, Италия; Лейтнер, Ярон (сентябрь 2018 г.). «Стресс-тесты и раскрытие информации» . Журнал экономической теории . 177 : 34–69. дои : 10.1016/j.jet.2018.05.013 .
  14. ^ Болеславский, Рафаэль; Коттон, Кристофер (май 2015 г.). «Стандарты оценивания и качество образования» . Американский экономический журнал: Микроэкономика . 7 (2): 248–279. дои : 10.1257/mic.20130080 .
  15. ^ Хабиби, Амир (январь 2020 г.). «Мотивация и информационный дизайн» . Журнал экономического поведения и организации . 169 : 1–18. дои : 10.1016/j.jebo.2019.10.015 .
  16. ^ Эли, Джеффри; Франкель, Александр; Каменица, Эмир (февраль 2015 г.). «Саспенс и сюрприз» . Журнал политической экономии . 123 : 215–260. дои : 10.1086/677350 .
  17. ^ Бернаскони, Мартино; Кастильони, Маттео (2023). «Оптимальные скорости и эффективные алгоритмы для байесовского убеждения в Интернете» . Труды исследований машинного обучения . 202 : 2164–2183. arXiv : 2303.01296 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: bd6387942cb1614c12899e2f6eb07f54__1720527720
URL1:https://arc.ask3.ru/arc/aa/bd/54/bd6387942cb1614c12899e2f6eb07f54.html
Заголовок, (Title) документа по адресу, URL1:
Bayesian persuasion - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)