Теорема Блэквелла об информативности

В математических предметах теории информации и теории принятия решений является важным результатом , теорема Блэквелла об информативности связанным с ранжированием информационных структур или экспериментов. В нем утверждается, что существует эквивалентность между тремя возможными рейтингами информационных структур: одним, основанным на ожидаемой полезности , одним, основанным на информативности , и одним, основанным на осуществимости . Этот рейтинг определяет частичный порядок информационных структур, известный как порядок Блэквелла или критерий Блэквелла . ^{[ 1 ]}^{[ 2 ]}

Теорема устанавливает эквивалентные условия, при которых любой человек, принимающий решения, максимизирующий ожидаемую полезность, предпочитает информационную структуру. $\sigma$ над $\sigma '$ , для любой проблемы решения. Этот результат был впервые доказан Дэвидом Блэквеллом в 1951 году и обобщен в 1953 году. ^{[ 3 ]}^{[ 4 ]}

Параметр

Принятие решений в условиях неопределенности

Лицо, принимающее решения, сталкивается с набором возможных состояний мира. $\Omega$ и набор возможных действий $A$ взять. Для каждого $\omega \in \Omega$ и $a\in A$ , ее полезность $u(\omega ,a)$ . Она не знает состояния мира $\omega$ , но имеет априорную вероятность $p:\Omega \rightarrow [0,1]$ для каждого возможного состояния. Для каждого действия, которое она предпринимает, ее ожидаемая полезность равна

\sum _{\omega \in \Omega }u(a,\omega )p(\omega )

Учитывая такой предшествующий $p$ , она выбирает действие $a\in A$ максимизировать ее ожидаемую полезность. Мы обозначаем такую максимально достижимую полезность (ожидаемую ценность принятия оптимального действия) через

V(p)={\underset {a\in A}{\operatorname {max} }}\sum _{\omega \in \Omega }u(a,\omega )p(\omega )

Мы ссылаемся на данные $(\Omega ,A,u,p)$ как проблема принятия решений .

Информационные структуры

Информационную структуру (или эксперимент ) можно рассматривать как способ улучшить полезность, заданную ранее, в смысле предоставления большего количества информации лицу, принимающему решения. Формально информационная структура представляет собой кортеж $(S,\sigma )$ , где $S$ является сигнальным пространством и $\sigma :\Omega \rightarrow \Delta S$ это функция, которая дает условную вероятность $\sigma (s|\omega )$ наблюдения сигнала $s\in S$ когда состояние мира $\omega$ . Информационную структуру можно также рассматривать как условия проведения эксперимента.

Наблюдая за сигналом $s$ , лицо, принимающее решения, может обновить свои представления о состоянии мира $\omega$ по правилу Байеса , что дает апостериорную вероятность

\pi (\omega |s)={\frac {p(\omega )\sigma (s|\omega )}{\pi (s)}}

где $\pi (s):=\sum _{\omega '\in \Omega }p(\omega ')\sigma (s|\omega ')$ . Наблюдая за сигналом $s$ и обновление ее убеждений с помощью информационной структуры $(S,\sigma )$ , новое значение ожидаемой полезности лица, принимающего решения, от принятия оптимального действия равно

V(\pi ,s)={\underset {a\in A}{\operatorname {max} }}\sum _{\omega \in \Omega }u(a,\omega )\pi (\omega |s)

и «ожидаемое значение $(S,\sigma )$ «для лица, принимающего решения (т. е. ожидаемая ценность принятия оптимального действия в рамках информационной структуры) определяется как

W(\sigma )=\sum _{s\in S}V(\pi ,s)\pi (s)

Искажение

Если две информационные структуры $(S,\sigma )$ и $(S,\sigma ')$ имеют одно и то же базовое сигнальное пространство, мы злоупотребляем некоторыми обозначениями и ссылаемся на $\sigma$ и $\sigma '$ как сами информационные структуры. Мы говорим, что $\sigma '$ это искажение $\sigma$ если существует стохастическая карта ^{[ 1 ]} (для конечных сигнальных пространств $S$ , марковская матрица ) $\Gamma :S\rightarrow S$ такой, что

\sigma '=\Gamma \sigma

Интуитивно, искажение — это способ добавления «шума» к информационной структуре, в результате чего искаженная информационная структура считается менее информативной.

Технико-экономическое обоснование

в Смешанная стратегия контексте задачи принятия решений – это функция $\alpha :S\rightarrow \Delta A$ что дает для каждого сигнала $s\in S$ , распределение вероятностей $\alpha (a|s)$ над возможными действиями в $A$ . По информационной структуре $(S,\sigma )$ , стратегия $\alpha$ вызывает распределение по действиям $\alpha _{\sigma }(a|\omega )$ в зависимости от состояния мира $\omega$ , заданный отображением

\omega \mapsto \alpha _{\sigma }(a|\omega )=\sum _{s\in S}\alpha (a|s)\sigma (s|\omega )\in \Delta A

То есть, $\alpha _{\sigma }(a|\omega )$ дает вероятность совершить действие $a\in A$ учитывая, что состояние мира $\omega \in \Omega$ под информационной структурой $(S,\sigma )$ – обратите внимание, что это не что иное, как выпуклая комбинация $\alpha (a|s)$ с гирями $\sigma (s|\omega )$ . Мы говорим, что $\alpha _{\sigma }(a|\omega )$ — это осуществимая стратегия (или условная вероятность действий) при $(S,\sigma )$ .

Учитывая информационную структуру $(S,\sigma )$ , позволять

\Phi _{\sigma }=\{\alpha _{\sigma }(a|\omega )

|

\alpha :S\rightarrow \Delta A\}

быть множеством всех условных вероятностей над действия (т.е. стратегии), которые осуществимы при $(S,\sigma )$ .

Учитывая две информационные структуры $(S,\sigma )$ и $(S,\sigma ')$ , мы говорим, что $\sigma$ дает больший набор возможных стратегий, чем $\sigma '$ если

\Phi _{\sigma '}\subset \Phi _{\sigma }

Заявление

Теорема Блэквелла утверждает, что при любой проблеме принятия решений $(\Omega ,A,u,p)$ и две информационные структуры $\sigma$ и $\sigma '$ , следующие эквивалентны: ^{[ 1 ]}^{[ 5 ]}

$W(\sigma ')\leq W(\sigma )$ : то есть лицо, принимающее решение, достигает более высокой ожидаемой полезности при $\sigma$ чем под $\sigma '$ .
Существует стохастическая карта $\Gamma$ такой, что $\sigma '=\Gamma \sigma$ : то есть, $\sigma '$ это искажение $\sigma$ .
$\Phi _{\sigma '}\subset \Phi _{\sigma }$ :, то есть $\sigma$ дает больший набор возможных стратегий, чем $\sigma '$ .

Орден Блэквелла

Определение

Теорема Блэквелла позволяет нам построить частичный порядок над информационными структурами. Мы говорим, что $\sigma$ более информативен в смысле Блэквелла (или просто Блэквелл более информативен ), чем $\sigma '$ если выполняется любое (а значит, и все) условие теоремы Блэквелла, и запишите $\sigma '\preceq _{B}\sigma$ .

Порядок $\preceq _{B}$ не является полным, и большинство экспериментов не могут быть ранжированы по нему. Точнее, это цепочка частично упорядоченного набора информационных структур. ^{[ 2 ]}

Приложения

Порядок Блэквелла имеет множество приложений в теории принятия решений и экономике , в частности в теории контрактов . Например, если две информационные структуры в модели «принципал-агент» могут быть ранжированы в смысле Блэквелла, то более информативная из них более эффективна в смысле меньших затрат на вторую лучшую реализацию . ^{[ 6 ]}^{[ 7 ]}

Ссылки

^ Перейти обратно: ^а ^б ^с де Оливейра, Энрике (2018). «Теорема Блэквелла об информативности диаграмм» . Игры и экономическое поведение . 109 : 126–131. дои : 10.1016/j.geb.2017.12.008 .
^ Перейти обратно: ^а ^б Косенко, Андре (2021). «Алгебраические свойства порядка Блэквелла и кардинальная мера информативности». arXiv : 2110.11399 [ econ.TH ].
^ Блэквелл, Дэвид (1951). «Сравнение экспериментов». Второй симпозиум Беркли по математической статистике и теории вероятности : 2.
^ Блэквелл, Дэвид (1953). «Эквивалентное сравнение экспериментов». Анналы математической статистики . 24 (2): 265–272. дои : 10.1214/aoms/1177729032 .
^ Карни, Эди ; Сафра, Цви (2022). «Гибридная модель принятия решений и рейтинг экспериментов» . Журнал математической экономики . 101 . дои : 10.1016/j.jmateco.2022.102700 . S2CID 237370357 .
^ Гроссман, Сэнфорд Дж .; Харт, Оливер Д. (1983). «Анализ проблемы принципала-агента» . Эконометрика . 51 (1): 7–45. дои : 10.2307/1912246 . JSTOR 1912246 .
^ Лаффон, Жан-Жак ; Мартиморт, Дэвид (2002). Теория стимулов: модель принципала-агента . Издательство Принстонского университета. ISBN 978-0691091846 . JSTOR j.ctv7h0rwr .

[oliveira-1] Перейти обратно: ^а ^б ^с де Оливейра, Энрике (2018). «Теорема Блэквелла об информативности диаграмм» . Игры и экономическое поведение . 109 : 126–131. дои : 10.1016/j.geb.2017.12.008 .

[kosenko-2] Перейти обратно: ^а ^б Косенко, Андре (2021). «Алгебраические свойства порядка Блэквелла и кардинальная мера информативности». arXiv : 2110.11399 [ econ.TH ].

[3] Блэквелл, Дэвид (1951). «Сравнение экспериментов». Второй симпозиум Беркли по математической статистике и теории вероятности : 2.

[4] Блэквелл, Дэвид (1953). «Эквивалентное сравнение экспериментов». Анналы математической статистики . 24 (2): 265–272. дои : 10.1214/aoms/1177729032 .

[5] Карни, Эди ; Сафра, Цви (2022). «Гибридная модель принятия решений и рейтинг экспериментов» . Журнал математической экономики . 101 . дои : 10.1016/j.jmateco.2022.102700 . S2CID 237370357 .

[6] Гроссман, Сэнфорд Дж .; Харт, Оливер Д. (1983). «Анализ проблемы принципала-агента» . Эконометрика . 51 (1): 7–45. дои : 10.2307/1912246 . JSTOR 1912246 .

[7] Лаффон, Жан-Жак ; Мартиморт, Дэвид (2002). Теория стимулов: модель принципала-агента . Издательство Принстонского университета. ISBN 978-0691091846 . JSTOR j.ctv7h0rwr .

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]