Многоатрибутная утилита

В теории принятия решений многоатрибутная функция полезности используется для представления предпочтений агента по отношению к наборам товаров либо в условиях уверенности в результатах любого потенциального выбора, либо в условиях неопределенности.

Предварительные сведения

Человеку приходится выбирать между двумя и более вариантами. Решение основывается на атрибутах опционов.

Самый простой случай — когда имеется только один атрибут, например: деньги. Обычно предполагается, что все люди предпочитают больше денег меньшему количеству денег; следовательно, проблема в данном случае тривиальна: выберите вариант, который даст вам больше денег.

В действительности существует два или более атрибутов. Например, человеку приходится выбирать между двумя вариантами трудоустройства: вариант А дает ему 12 тысяч долларов в месяц и 20 дней отпуска, а вариант Б дает ему 15 тысяч долларов в месяц и только 10 дней отпуска. Человеку приходится выбирать между (12К,20) и (15К,10). У разных людей могут быть разные предпочтения. При определенных условиях предпочтения человека могут быть представлены числовой функцией. В статье «Порядковая полезность» описаны некоторые свойства таких функций и способы их вычисления.

Еще одним фактором, который может усложнить проблему принятия решения, является неопределенность . Хотя существует как минимум четыре источника неопределенности - результаты атрибутов и нечеткость лица, принимающего решения, относительно: а) конкретных форм функций полезности отдельных атрибутов, б) значений агрегирующих констант и в) являются ли функции полезности атрибутов аддитивными. , эти термины рассматриваются в настоящее время - неопределенность отныне означает только случайность на уровнях атрибутов. Эта сложность неопределенности существует даже при наличии одного атрибута, например: денег. Например, вариант А может быть лотереей с 50% вероятностью выиграть 2 доллара, а вариант Б — гарантированно выиграть 1 доллар. Человеку предстоит сделать выбор между лотереей <2:0,5> и лотереей <1:1>. Опять же, у разных людей могут быть разные предпочтения. Опять же, при определенных условиях предпочтения могут быть представлены числовой функцией. Такие функции называются кардинальными функциями полезности. Статья Теорема полезности фон Неймана – Моргенштерна описывает некоторые способы их расчета.

Наиболее общая ситуация заключается в том, что существуют как множественные атрибуты , так и неопределенность. Например, вариант А может быть лотереей с 50%-ной вероятностью выиграть два яблока и два банана, а вариант Б — гарантированно выиграть два банана. Решение принимается между <(2,2):(0,5,0,5)> и <(2,0):(1,0)>. Предпочтения здесь могут быть представлены кардинальными функциями полезности , которые принимают несколько переменных (атрибутов). ^[1]^: 26–27 Именно таким функциям посвящена данная статья.

Цель: вычислить функцию полезности. $u(x_{1},...,x_{n})$ который отражает предпочтения человека в лотереях наборов. То есть лотерея A предпочтительнее лотереи B тогда и только тогда, когда математическое ожидание функции $u$ выше под А, чем под Б:

E_{A}[u(x_{1},...,x_{n})]>E_{B}[u(x_{1},...,x_{n})]

Оценка многоатрибутной кардинальной функции полезности

Если число возможных наборов конечно, u можно построить напрямую, как объяснили фон Нейман и Моргенштерн (VNM): упорядочить наборы от наименее предпочтительного к наиболее предпочтительному, присвоить полезность 0 первому и полезность 1 второму и присвоить каждому пакету между ними полезность равна вероятности эквивалентной лотереи. ^[1]^{: 222–223}

Если количество пакетов бесконечно, один из вариантов — начать с игнорирования случайности и оценить полезности . порядковую функцию $v(x_{1},...,x_{n})$ который представляет полезность человека в определенных наборах. Т. е. пакет x предпочтительнее пакета y тогда и только тогда, когда функция $v$ выше для x, чем для y:

v(x_{1},...,x_{n})>v(y_{1},...,y_{n})

Эта функция, по сути, преобразует проблему с несколькими атрибутами в проблему с одним атрибутом: атрибут $v$ . Затем VNM можно использовать для построения функции $u$ . ^[1]^{: 219–220}

Обратите внимание, что u должно быть положительным монотонным преобразованием v . Это означает, что существует монотонно возрастающая функция $r:\mathbb {R} \to \mathbb {R}$ , такой, что:

u(x_{1},...,x_{n})=r(v(x_{1},...,x_{n}))

непросто Проблема этого подхода в том, что оценить функцию r . При оценке кардинальной функции полезности с одним атрибутом с использованием VNM мы задаем такие вопросы, как: «Какая вероятность выиграть 2 доллара эквивалентна 1 доллару?». Итак, чтобы оценить функцию r , нам нужно задать такой вопрос, как: «Какая вероятность выиграть 2 единицы стоимости эквивалентна 1 ценности?». На последний вопрос ответить гораздо труднее, чем на первый, поскольку он касается «стоимости», которая является абстрактной величиной.

Возможное решение — вычислить n одномерных кардинальных функций полезности — по одной для каждого атрибута. Например, предположим, что есть два атрибута: яблоки ( $x_{1}$ ) и бананы ( $x_{2}$ ), оба находятся в диапазоне от 0 до 99. Используя VNM, мы можем вычислить следующие одномерные функции полезности:

$u(x_{1},0)$ - кардинальная полезность на яблоках при отсутствии бананов (южная граница домена);
$u(99,x_{2})$ - кардинальная полезность бананов, когда яблоки максимальны (восточная граница домена).

Используя линейные преобразования, масштабируйте функции так, чтобы они имели одинаковое значение в (99,0).

Тогда для каждого пакета $(x_{1}',x_{2}')$ , найдите эквивалентный расслоение (расслоение с тем же v ), которое имеет любой вид $(x_{1},0)$ или формы $(99,x_{2})$ и установите его полезность на то же число. ^[1]^{: 221–222}

Часто определенные свойства независимости между атрибутами можно использовать, чтобы упростить построение функции полезности. Некоторые такие свойства независимости описаны ниже.

Аддитивная независимость

Самое сильное свойство независимости называется аддитивной независимостью . Два атрибута, 1 и 2, называются аддитивно независимыми , если предпочтение между двумя лотереями (определяемыми как совместные распределения вероятностей по двум атрибутам) зависит только от их предельных распределений вероятностей (предельная ВД для атрибута 1 и предельная ВД для атрибута 2). ).

Это означает, например, что следующие две лотереи эквивалентны:

$L$ : лотерея с равными шансами между $(x_{1},x_{2})$ и $(y_{1},y_{2})$ ;
$M$ : лотерея с равными шансами между $(x_{1},y_{2})$ и $(y_{1},x_{2})$ .

В обеих этих лотереях предельная ВД по атрибуту 1 составляет 50% для $x_{1}$ и 50% за $y_{1}$ . Аналогичным образом, предельная ВД по атрибуту 2 составляет 50 % для $x_{2}$ и 50% за $y_{2}$ . Следовательно, если агент имеет полезности, независимые от добавок, ему должно быть безразлично, какая из этих двух лотерей. ^[1]^{: 229–232}

Фундаментальный результат теории полезности состоит в том, что два атрибута являются аддитивно-независимыми тогда и только тогда, когда их функция полезности с двумя атрибутами аддитивна и имеет вид:

u(x_{1},x_{2})=u_{1}(x_{1})+u_{2}(x_{2})

ДОКАЗАТЕЛЬСТВО:

$\longrightarrow$

Если атрибуты не зависят от добавок, то лотереи $L$ и $M$ , определенные выше, эквивалентны. Это означает, что их ожидаемая полезность одинакова, т.е.: $E_{L}[u]=E_{M}[u]$ .Умножение на 2 дает:

u(x_{1},x_{2})+u(y_{1},y_{2})=u(x_{1},y_{2})+u(y_{1},x_{2})

Это справедливо для любого выбора $x_{i}$ и $y_{i}$ . Предположим теперь, что $y_{1}$ и $y_{2}$ фиксированы. Произвольно задано $u(y_{1},y_{2})=0$ . Писать: $u_{1}(x_{1})=u(x_{1},y_{2})$ и $u_{2}(x_{2})=u(y_{1},x_{2})$ .Приведенное выше уравнение принимает вид:

u(x_{1},x_{2})=u_{1}(x_{1})+u_{2}(x_{2})

$\longleftarrow$

Если функция u аддитивна, то по правилам ожидания для каждой лотереи $L$ :

E_{L}[u(x_{1},x_{2})]=E_{L}[u_{1}(x_{1})]+E_{L}[u_{2}(x_{2})]

Это выражение зависит только от маргинальных распределений вероятностей $L$ по двум атрибутам.

Этот результат обобщается на любое количество атрибутов: если предпочтения лотерей по атрибутам 1,..., n зависят только от их предельных распределений вероятностей, то функция полезности n -атрибутов является аддитивной: ^[1]^: 295

u(x_{1},\dots ,x_{n})=\sum _{i=1}^{n}{k_{i}u_{i}(x_{i})}

где $u$ и $u_{i}$ нормированы на диапазон $[0,1]$ и $k_{i}$ являются константами нормализации.

Большая часть работы в области аддитивной теории полезности была проделана Питером К. Фишберном .

Независимость от коммунальных услуг

Немного более слабое свойство независимости — это независимость от полезности . Атрибут 1 не зависит от полезности атрибута 2, если условные предпочтения в лотереях по атрибуту 1 при постоянном значении атрибута 2 не зависят от этого постоянного значения.

Это означает, например, что предпочтение между лотереей $<(x_{1},x_{2}):(y_{1},x_{2})>$ и лотерея $<(x'_{1},x_{2}):(y'_{1},x_{2})>$ одинаково, независимо от значения $x_{2}$ .

Обратите внимание, что независимость от полезности (в отличие от аддитивной независимости) не симметрична: возможно, что атрибут 1 не зависит от полезности от атрибута 2, а не наоборот. ^[1]^{: 224–229}

Если атрибут 1 не зависит от полезности атрибута 2, то функция полезности для каждого значения атрибута 2 представляет собой линейное преобразование функции полезности для любого другого значения атрибута 2. Следовательно, ее можно записать как:

u(x_{1},x_{2})=c_{1}(x_{2})+c_{2}(x_{2})\cdot u(x_{1},x_{2}^{0})

когда $x_{2}^{0}$ является постоянным значением для атрибута 2. Аналогично, если атрибут 2 не зависит от полезности атрибута 1:

u(x_{1},x_{2})=d_{1}(x_{1})+d_{2}(x_{1})\cdot u(x_{1}^{0},x_{2})

Если атрибуты взаимно независимы от полезности , то функция полезности u имеет следующую полилинейную форму : ^[1]^{: 233–235}

u(x_{1},x_{2})=u_{1}(x_{1})+u_{2}(x_{2})+k\cdot u_{1}(x_{1})\cdot u_{2}(x_{2})

Где $k$ — константа, которая может быть положительной, отрицательной или 0.

Когда $k=0$ , функция u аддитивна, а атрибуты не зависят от аддитивности.
Когда $k\neq 0$ , функция полезности является мультипликативной, поскольку ее можно записать как:

[ku(x_{1},x_{2})+1]=[ku_{1}(x_{1})+1]\cdot [ku_{2}(x_{2})+1]

где каждый член представляет собой линейное преобразование

k\cdot +1

функции полезности.

Эти результаты можно обобщить на любое количество атрибутов. Учитывая атрибуты 1,..., n , если какое-либо подмножество атрибутов не зависит от полезности своего дополнения, то функция полезности n -атрибута является полилинейной и имеет одну из следующих форм:

Добавка , или -
Мультипликативный : ^[1]^{: 289–290}

1+ku(x_{1},\dots ,x_{n})=\prod _{i=1}^{n}{1+kk_{i}u_{i}(x_{i})}

где:

The $u$ и $u_{i}$ нормированы на диапазон $[0,1]$ ;
The $k_{i}$ являются константами в $[0,1]$ ;
$k$ константа, которая либо находится в $(-1,0)$ или в $(0,\infty )$ (обратите внимание, что предел, когда $k\to 0$ является аддитивной формой).

Сравнение концепций независимости

Полезно сравнить три различные концепции, связанные с независимостью атрибутов: аддитивную независимость (AI), независимость от утилит (UI) и преференциальную независимость (PI). ^[1]^: 344

И искусственный интеллект, и пользовательский интерфейс касаются предпочтений в лотереях и описаны выше. PI касается предпочтений в отношении определенных результатов и объясняется в статье о порядковой полезности .

Порядок их следования следующий:

ИИ ⇒ Пользовательский интерфейс ⇒ ПИ

AI является симметричным отношением (если атрибут 1 является AI атрибута 2, то атрибут 2 является AI атрибута 1), а UI и PI — нет.

ИИ подразумевает взаимный пользовательский интерфейс. Обратное, как правило, неверно; это правда, только если $k=0$ в многолинейной формуле атрибутов пользовательского интерфейса. Но если помимо взаимного UI существуют $x_{1},x_{2},y_{1},y_{2}$ для чего две лотереи $L$ и $M$ , определенные выше, эквивалентны - тогда $k$ должно быть равно 0, а это означает, что отношение предпочтения должно быть AI. ^[1]^{: 238–239}

Пользовательский интерфейс подразумевает PI. Обратное, в общем-то, неверно. Но если:

есть как минимум 3 существенных атрибута:
все пары атрибутов {1, i } являются PI своего дополнения и:
атрибут 1 — это пользовательский интерфейс своего дополнения,

тогда все атрибуты являются взаимно UI. Более того, в этом случае существует простая связь между кардинальной функцией полезности $u$ представляющая предпочтения в лотереях, и порядковую функцию полезности $v$ представление предпочтений по определенным пакетам. Функция $u$ должен иметь одну из следующих форм: ^[1]^{: 330–332}^[2]

Добавка: $u(x_{1},...,x_{n})=v(x_{1},...,x_{n})$
Мультипликативный: $u(x_{1},...,x_{n})=[exp(R\cdot v(x_{1},...,x_{n}))-1]/[exp(R)-1]$

где $R\neq 0$ .

ДОКАЗАТЕЛЬСТВО: Достаточно доказать, что u имеет постоянное абсолютное неприятие риска относительно значения v .

Предположение PI с $n\geq 3$ подразумевают, что функция стоимости аддитивна, т.е.:

v(x_{1},\dots ,x_{n})=\sum _{i=1}^{n}{\lambda _{i}v_{i}(x_{i})}

Позволять $x_{1},z_{1}$ — два разных значения атрибута 1. Пусть $y_{1}$ быть эквивалентом достоверности лотереи $<x_{1}:z_{1}>$ . Предположение UI подразумевает, что для каждой комбинации $(w_{2},\dots ,w_{n})$ значений других атрибутов имеет место следующая эквивалентность:

(y_{1},w)\sim <(x_{1},w):(z_{1},w)>

Два предыдущих утверждения подразумевают, что для каждого w в пространстве значений выполняется следующая эквивалентность:

\lambda _{1}v_{1}(y_{1})+\sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}\sim <\lambda _{1}v_{1}(x_{1})+\sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}:\lambda _{1}v_{1}(z_{1})+\sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}>

Это означает, что добавление любого количества к обеим сторонам лотереи (через термин $\sum _{i=2}^{n}{\lambda _{i}v_{i}(w_{i})}$ ), увеличивает эквивалент достоверности лотереи на ту же величину.
Последний факт подразумевает постоянное неприятие риска.

См. также

Ссылки

^ Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л Кини, Ральф Л.; Райффа, Ховард (1993). Решения с несколькими целями . ISBN 0-521-44185-4 .
^ Эта идея приписывается Ричарду Ф. Мейеру и Джону Пратту .

[KR-1] Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л Кини, Ральф Л.; Райффа, Ховард (1993). Решения с несколькими целями . ISBN 0-521-44185-4 .

[2] Эта идея приписывается Ричарду Ф. Мейеру и Джону Пратту .

[1]

[2]