Теорема Блэквелла об информативности
В математических предметах теории информации и теории принятия решений является важным результатом , теорема Блэквелла об информативности связанным с ранжированием информационных структур или экспериментов. В нем утверждается, что существует эквивалентность между тремя возможными рейтингами информационных структур: одним, основанным на ожидаемой полезности , одним, основанным на информативности , и одним, основанным на осуществимости . Этот рейтинг определяет частичный порядок информационных структур, известный как порядок Блэквелла или критерий Блэквелла . [ 1 ] [ 2 ]
Теорема устанавливает эквивалентные условия, при которых любой человек, принимающий решения, максимизирующий ожидаемую полезность, предпочитает информационную структуру. над , для любой проблемы решения. Этот результат был впервые доказан Дэвидом Блэквеллом в 1951 году и обобщен в 1953 году. [ 3 ] [ 4 ]
Параметр
[ редактировать ]Принятие решений в условиях неопределенности
[ редактировать ]Лицо, принимающее решения, сталкивается с набором возможных состояний мира. и набор возможных действий взять. Для каждого и , ее полезность . Она не знает состояния мира , но имеет априорную вероятность для каждого возможного состояния. Для каждого действия, которое она предпринимает, ее ожидаемая полезность равна
Учитывая такой предшествующий , она выбирает действие максимизировать ее ожидаемую полезность. Мы обозначаем такую максимально достижимую полезность (ожидаемую ценность принятия оптимального действия) через
Мы ссылаемся на данные как проблема принятия решений .
Информационные структуры
[ редактировать ]Информационную структуру (или эксперимент ) можно рассматривать как способ улучшить полезность, заданную ранее, в смысле предоставления большего количества информации лицу, принимающему решения. Формально информационная структура представляет собой кортеж , где является сигнальным пространством и это функция, которая дает условную вероятность наблюдения сигнала когда состояние мира . Информационную структуру можно также рассматривать как условия проведения эксперимента.
Наблюдая за сигналом , лицо, принимающее решения, может обновить свои представления о состоянии мира по правилу Байеса , что дает апостериорную вероятность
где . Наблюдая за сигналом и обновление ее убеждений с помощью информационной структуры , новое значение ожидаемой полезности лица, принимающего решения, от принятия оптимального действия равно
и «ожидаемое значение «для лица, принимающего решения (т. е. ожидаемая ценность принятия оптимального действия в рамках информационной структуры) определяется как
Искажение
[ редактировать ]Если две информационные структуры и имеют одно и то же базовое сигнальное пространство, мы злоупотребляем некоторыми обозначениями и ссылаемся на и как сами информационные структуры. Мы говорим, что это искажение если существует стохастическая карта [ 1 ] (для конечных сигнальных пространств , марковская матрица ) такой, что
Интуитивно, искажение — это способ добавления «шума» к информационной структуре, в результате чего искаженная информационная структура считается менее информативной.
Технико-экономическое обоснование
[ редактировать ]в Смешанная стратегия контексте задачи принятия решений – это функция что дает для каждого сигнала , распределение вероятностей над возможными действиями в . По информационной структуре , стратегия вызывает распределение по действиям в зависимости от состояния мира , заданный отображением
То есть, дает вероятность совершить действие учитывая, что состояние мира под информационной структурой – обратите внимание, что это не что иное, как выпуклая комбинация с гирями . Мы говорим, что — это осуществимая стратегия (или условная вероятность действий) при .
Учитывая информационную структуру , позволять
- |
быть множеством всех условных вероятностей над действия (т.е. стратегии), которые осуществимы при .
Учитывая две информационные структуры и , мы говорим, что дает больший набор возможных стратегий, чем если
Заявление
[ редактировать ]Теорема Блэквелла утверждает, что при любой проблеме принятия решений и две информационные структуры и , следующие эквивалентны: [ 1 ] [ 5 ]
- : то есть лицо, принимающее решение, достигает более высокой ожидаемой полезности при чем под .
- Существует стохастическая карта такой, что : то есть, это искажение .
- :, то есть дает больший набор возможных стратегий, чем .
Орден Блэквелла
[ редактировать ]Определение
[ редактировать ]Теорема Блэквелла позволяет нам построить частичный порядок над информационными структурами. Мы говорим, что более информативен в смысле Блэквелла (или просто Блэквелл более информативен ), чем если выполняется любое (а значит, и все) условие теоремы Блэквелла, и запишите .
Порядок не является полным, и большинство экспериментов не могут быть ранжированы по нему. Точнее, это цепочка частично упорядоченного набора информационных структур. [ 2 ]
Приложения
[ редактировать ]Порядок Блэквелла имеет множество приложений в теории принятия решений и экономике , в частности в теории контрактов . Например, если две информационные структуры в модели «принципал-агент» могут быть ранжированы в смысле Блэквелла, то более информативная из них более эффективна в смысле меньших затрат на вторую лучшую реализацию . [ 6 ] [ 7 ]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с де Оливейра, Энрике (2018). «Теорема Блэквелла об информативности диаграмм» . Игры и экономическое поведение . 109 : 126–131. дои : 10.1016/j.geb.2017.12.008 .
- ^ Перейти обратно: а б Косенко, Андре (2021). «Алгебраические свойства порядка Блэквелла и кардинальная мера информативности». arXiv : 2110.11399 [ econ.TH ].
- ^ Блэквелл, Дэвид (1951). «Сравнение экспериментов». Второй симпозиум Беркли по математической статистике и теории вероятности : 2.
- ^ Блэквелл, Дэвид (1953). «Эквивалентное сравнение экспериментов». Анналы математической статистики . 24 (2): 265–272. дои : 10.1214/aoms/1177729032 .
- ^ Карни, Эди ; Сафра, Цви (2022). «Гибридная модель принятия решений и рейтинг экспериментов» . Журнал математической экономики . 101 . дои : 10.1016/j.jmateco.2022.102700 . S2CID 237370357 .
- ^ Гроссман, Сэнфорд Дж .; Харт, Оливер Д. (1983). «Анализ проблемы принципала-агента» . Эконометрика . 51 (1): 7–45. дои : 10.2307/1912246 . JSTOR 1912246 .
- ^ Лаффон, Жан-Жак ; Мартиморт, Дэвид (2002). Теория стимулов: модель принципала-агента . Издательство Принстонского университета. ISBN 978-0691091846 . JSTOR j.ctv7h0rwr .