Многоатрибутная утилита
В теории принятия решений многоатрибутная функция полезности используется для представления предпочтений агента по отношению к наборам товаров либо в условиях уверенности в результатах любого потенциального выбора, либо в условиях неопределенности.
Предварительные сведения
[ редактировать ]Человеку приходится выбирать между двумя и более вариантами. Решение основывается на атрибутах опционов.
Самый простой случай — когда имеется только один атрибут, например: деньги. Обычно предполагается, что все люди предпочитают больше денег меньшему количеству денег; следовательно, проблема в данном случае тривиальна: выберите вариант, который даст вам больше денег.
В действительности существует два или более атрибутов. Например, человеку приходится выбирать между двумя вариантами трудоустройства: вариант А дает ему 12 тысяч долларов в месяц и 20 дней отпуска, а вариант Б дает ему 15 тысяч долларов в месяц и только 10 дней отпуска. Человеку приходится выбирать между (12К,20) и (15К,10). У разных людей могут быть разные предпочтения. При определенных условиях предпочтения человека могут быть представлены числовой функцией. В статье «Порядковая полезность» описаны некоторые свойства таких функций и способы их вычисления.
Еще одним фактором, который может усложнить проблему принятия решения, является неопределенность . Хотя существует как минимум четыре источника неопределенности - результаты атрибутов и нечеткость лица, принимающего решения, относительно: а) конкретных форм функций полезности отдельных атрибутов, б) значений агрегирующих констант и в) являются ли функции полезности атрибутов аддитивными. , эти термины рассматриваются в настоящее время - неопределенность отныне означает только случайность на уровнях атрибутов. Эта сложность неопределенности существует даже при наличии одного атрибута, например: денег. Например, вариант А может быть лотереей с 50% вероятностью выиграть 2 доллара, а вариант Б — гарантированно выиграть 1 доллар. Человеку предстоит сделать выбор между лотереей <2:0,5> и лотереей <1:1>. Опять же, у разных людей могут быть разные предпочтения. Опять же, при определенных условиях предпочтения могут быть представлены числовой функцией. Такие функции называются кардинальными функциями полезности. Статья Теорема полезности фон Неймана – Моргенштерна описывает некоторые способы их расчета.
Наиболее общая ситуация заключается в том, что существуют как множественные атрибуты , так и неопределенность. Например, вариант А может быть лотереей с 50%-ной вероятностью выиграть два яблока и два банана, а вариант Б — гарантированно выиграть два банана. Решение принимается между <(2,2):(0,5,0,5)> и <(2,0):(1,0)>. Предпочтения здесь могут быть представлены кардинальными функциями полезности , которые принимают несколько переменных (атрибутов). [1] : 26–27 Именно таким функциям посвящена данная статья.
Цель: вычислить функцию полезности. который отражает предпочтения человека в лотереях наборов. То есть лотерея A предпочтительнее лотереи B тогда и только тогда, когда математическое ожидание функции выше под А, чем под Б:
Оценка многоатрибутной кардинальной функции полезности
[ редактировать ]Если число возможных наборов конечно, u можно построить напрямую, как объяснили фон Нейман и Моргенштерн (VNM): упорядочить наборы от наименее предпочтительного к наиболее предпочтительному, присвоить полезность 0 первому и полезность 1 второму и присвоить каждому пакету между ними полезность равна вероятности эквивалентной лотереи. [1] : 222–223
Если количество пакетов бесконечно, один из вариантов — начать с игнорирования случайности и оценить полезности . порядковую функцию который представляет полезность человека в определенных наборах. Т. е. пакет x предпочтительнее пакета y тогда и только тогда, когда функция выше для x, чем для y:
Эта функция, по сути, преобразует проблему с несколькими атрибутами в проблему с одним атрибутом: атрибут . Затем VNM можно использовать для построения функции . [1] : 219–220
Обратите внимание, что u должно быть положительным монотонным преобразованием v . Это означает, что существует монотонно возрастающая функция , такой, что:
непросто Проблема этого подхода в том, что оценить функцию r . При оценке кардинальной функции полезности с одним атрибутом с использованием VNM мы задаем такие вопросы, как: «Какая вероятность выиграть 2 доллара эквивалентна 1 доллару?». Итак, чтобы оценить функцию r , нам нужно задать такой вопрос, как: «Какая вероятность выиграть 2 единицы стоимости эквивалентна 1 ценности?». На последний вопрос ответить гораздо труднее, чем на первый, поскольку он касается «стоимости», которая является абстрактной величиной.
Возможное решение — вычислить n одномерных кардинальных функций полезности — по одной для каждого атрибута. Например, предположим, что есть два атрибута: яблоки ( ) и бананы ( ), оба находятся в диапазоне от 0 до 99. Используя VNM, мы можем вычислить следующие одномерные функции полезности:
- - кардинальная полезность на яблоках при отсутствии бананов (южная граница домена);
- - кардинальная полезность бананов, когда яблоки максимальны (восточная граница домена).
Используя линейные преобразования, масштабируйте функции так, чтобы они имели одинаковое значение в (99,0).
Тогда для каждого пакета , найдите эквивалентный расслоение (расслоение с тем же v ), которое имеет любой вид или формы и установите его полезность на то же число. [1] : 221–222
Часто определенные свойства независимости между атрибутами можно использовать, чтобы упростить построение функции полезности. Некоторые такие свойства независимости описаны ниже.
Аддитивная независимость
[ редактировать ]Самое сильное свойство независимости называется аддитивной независимостью . Два атрибута, 1 и 2, называются аддитивно независимыми , если предпочтение между двумя лотереями (определяемыми как совместные распределения вероятностей по двум атрибутам) зависит только от их предельных распределений вероятностей (предельная ВД для атрибута 1 и предельная ВД для атрибута 2). ).
Это означает, например, что следующие две лотереи эквивалентны:
- : лотерея с равными шансами между и ;
- : лотерея с равными шансами между и .
В обеих этих лотереях предельная ВД по атрибуту 1 составляет 50% для и 50% за . Аналогичным образом, предельная ВД по атрибуту 2 составляет 50 % для и 50% за . Следовательно, если агент имеет полезности, независимые от добавок, ему должно быть безразлично, какая из этих двух лотерей. [1] : 229–232
Фундаментальный результат теории полезности состоит в том, что два атрибута являются аддитивно-независимыми тогда и только тогда, когда их функция полезности с двумя атрибутами аддитивна и имеет вид:
ДОКАЗАТЕЛЬСТВО:
Если атрибуты не зависят от добавок, то лотереи и , определенные выше, эквивалентны. Это означает, что их ожидаемая полезность одинакова, т.е.: .Умножение на 2 дает:
Это справедливо для любого выбора и . Предположим теперь, что и фиксированы. Произвольно задано . Писать: и .Приведенное выше уравнение принимает вид:
Если функция u аддитивна, то по правилам ожидания для каждой лотереи :
Это выражение зависит только от маргинальных распределений вероятностей по двум атрибутам.
Этот результат обобщается на любое количество атрибутов: если предпочтения лотерей по атрибутам 1,..., n зависят только от их предельных распределений вероятностей, то функция полезности n -атрибутов является аддитивной: [1] : 295
где и нормированы на диапазон и являются константами нормализации.
Большая часть работы в области аддитивной теории полезности была проделана Питером К. Фишберном .
Независимость от коммунальных услуг
[ редактировать ]Немного более слабое свойство независимости — это независимость от полезности . Атрибут 1 не зависит от полезности атрибута 2, если условные предпочтения в лотереях по атрибуту 1 при постоянном значении атрибута 2 не зависят от этого постоянного значения.
Это означает, например, что предпочтение между лотереей и лотерея одинаково, независимо от значения .
Обратите внимание, что независимость от полезности (в отличие от аддитивной независимости) не симметрична: возможно, что атрибут 1 не зависит от полезности от атрибута 2, а не наоборот. [1] : 224–229
Если атрибут 1 не зависит от полезности атрибута 2, то функция полезности для каждого значения атрибута 2 представляет собой линейное преобразование функции полезности для любого другого значения атрибута 2. Следовательно, ее можно записать как:
когда является постоянным значением для атрибута 2. Аналогично, если атрибут 2 не зависит от полезности атрибута 1:
Если атрибуты взаимно независимы от полезности , то функция полезности u имеет следующую полилинейную форму : [1] : 233–235
Где — константа, которая может быть положительной, отрицательной или 0.
- Когда , функция u аддитивна, а атрибуты не зависят от аддитивности.
- Когда , функция полезности является мультипликативной, поскольку ее можно записать как:
- где каждый член представляет собой линейное преобразование функции полезности.
Эти результаты можно обобщить на любое количество атрибутов. Учитывая атрибуты 1,..., n , если какое-либо подмножество атрибутов не зависит от полезности своего дополнения, то функция полезности n -атрибута является полилинейной и имеет одну из следующих форм:
где:
- The и нормированы на диапазон ;
- The являются константами в ;
- константа, которая либо находится в или в (обратите внимание, что предел, когда является аддитивной формой).
Сравнение концепций независимости
[ редактировать ]Полезно сравнить три различные концепции, связанные с независимостью атрибутов: аддитивную независимость (AI), независимость от утилит (UI) и преференциальную независимость (PI). [1] : 344
И искусственный интеллект, и пользовательский интерфейс касаются предпочтений в лотереях и описаны выше. PI касается предпочтений в отношении определенных результатов и объясняется в статье о порядковой полезности .
Порядок их следования следующий:
- ИИ ⇒ Пользовательский интерфейс ⇒ ПИ
AI является симметричным отношением (если атрибут 1 является AI атрибута 2, то атрибут 2 является AI атрибута 1), а UI и PI — нет.
ИИ подразумевает взаимный пользовательский интерфейс. Обратное, как правило, неверно; это правда, только если в многолинейной формуле атрибутов пользовательского интерфейса. Но если помимо взаимного UI существуют для чего две лотереи и , определенные выше, эквивалентны - тогда должно быть равно 0, а это означает, что отношение предпочтения должно быть AI. [1] : 238–239
Пользовательский интерфейс подразумевает PI. Обратное, в общем-то, неверно. Но если:
- есть как минимум 3 существенных атрибута:
- все пары атрибутов {1, i } являются PI своего дополнения и:
- атрибут 1 — это пользовательский интерфейс своего дополнения,
тогда все атрибуты являются взаимно UI. Более того, в этом случае существует простая связь между кардинальной функцией полезности представляющая предпочтения в лотереях, и порядковую функцию полезности представление предпочтений по определенным пакетам. Функция должен иметь одну из следующих форм: [1] : 330–332 [2]
- Добавка:
- Мультипликативный:
где .
ДОКАЗАТЕЛЬСТВО: Достаточно доказать, что u имеет постоянное абсолютное неприятие риска относительно значения v .
- Предположение PI с подразумевают, что функция стоимости аддитивна, т.е.:
- Позволять — два разных значения атрибута 1. Пусть быть эквивалентом достоверности лотереи . Предположение UI подразумевает, что для каждой комбинации значений других атрибутов имеет место следующая эквивалентность:
- Два предыдущих утверждения подразумевают, что для каждого w в пространстве значений выполняется следующая эквивалентность:
- Это означает, что добавление любого количества к обеим сторонам лотереи (через термин ), увеличивает эквивалент достоверности лотереи на ту же величину.
- Последний факт подразумевает постоянное неприятие риска.
См. также
[ редактировать ]- Многоатрибутный аукцион
- Многокритериальная оптимизация
- Голосование по нескольким вопросам
- Программное обеспечение для принятия решений
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час я дж к л Кини, Ральф Л.; Райффа, Ховард (1993). Решения с несколькими целями . ISBN 0-521-44185-4 .
- ^ Эта идея приписывается Ричарду Ф. Мейеру и Джону Пратту .