Jump to content

Сожаление (теория принятия решений)

(Перенаправлено с минимаксного сожаления )

В теории принятия решений при принятии решений в условиях неопределенности (если информация о наилучшем образе действий поступает после принятия твердого решения) часто возникает человеческая эмоциональная реакция сожаления , которую можно измерить как величину разницы между принятым решением и оптимальное решение.

Теория неприятия сожаления или ожидаемого сожаления предполагает, что, столкнувшись с решением, люди могут предвидеть сожаление и, таким образом, включить в свой выбор свое желание устранить или уменьшить эту возможность. Сожаление – это негативная эмоция с мощным социальным и репутационным компонентом, которая играет центральную роль в том, как люди учатся на собственном опыте, а также в человеческой психологии неприятия риска . Сознательное ожидание сожаления создает петлю обратной связи , которая выводит сожаление из эмоциональной сферы – часто моделируемой как простое человеческое поведение – в область поведения рационального выбора, которое моделируется в теории принятия решений.

Описание

[ редактировать ]

Теория сожаления — модель в теоретической экономике, одновременно разработанная в 1982 году Грэмом Лумсом и Робертом Сагденом . [1] Дэвид Э. Белл, [2] и Питер К. Фишберн . [3] Теория сожаления моделирует выбор в условиях неопределенности, принимая во внимание эффект ожидаемого сожаления. Впоследствии несколько других авторов усовершенствовали его. [4]

член сожаления Он включает в функцию полезности , который отрицательно зависит от реализованного результата и положительно от лучшего альтернативного результата с учетом разрешения неопределенности. Этот член сожаления обычно представляет собой возрастающую, непрерывную и неотрицательную функцию, вычитаемую из традиционного индекса полезности. Предпочтения такого типа всегда нарушают транзитивность в традиционном смысле. [5] хотя большинство удовлетворяет более слабой версии. [4]

Для независимых лотерей, когда сожаление оценивается по разнице между полезностями, а затем усредняется по всем комбинациям результатов, сожаление все еще может быть транзитивным, но только для определенной формы функционального сожаления. Показано, что только функция гиперболического синуса сохранит это свойство. [6] Эта форма сожаления наследует большинство желаемых характеристик, таких как сохранение правильных предпочтений перед лицом стохастического доминирования первого порядка , неприятие риска для логарифмических полезностей и способность объяснять парадокс Алле .

Неприятие сожаления — это не только теоретическая экономическая модель, но и когнитивное предубеждение, возникающее, когда было принято решение воздержаться от сожаления об альтернативном решении. В качестве предисловия можно сказать, что отвращение к сожалениям можно рассматривать как страх перед совершением или бездействием; перспектива совершить неудачу или упустить возможность, которой мы стремимся избежать. [7] Сожаление, чувство печали или разочарования по поводу того, что произошло, могут быть оправданы определенным решением, но могут определять предпочтения и сбивать людей с пути. Это способствует распространению дезинформации, поскольку вещи не рассматриваются как личная ответственность.

Доказательство

[ редактировать ]

Несколько экспериментов, посвященных как стимулирующему, так и гипотетическому выбору, подтверждают масштабы этого эффекта.

Эксперименты на аукционах первой цены показывают, что, манипулируя обратной связью, которую участники ожидают получить, наблюдаются значительные различия в средних ставках. [8] В частности, «сожаление проигравшего» можно вызвать, раскрывая выигрышную ставку всем участникам аукциона и, таким образом, раскрывая проигравшим, смогли бы они получить прибыль и сколько она могла бы быть (участник, который при оценке в 50 долларов, делает ставку в 30 долларов и узнает, что выигрышная ставка составила 35 долларов, также узнает, что он или она могли бы заработать до 15 долларов, предложив что-нибудь более 35 долларов.) Это, в свою очередь, допускает возможность сожаления и, если участники торгов правильно предвидят при этом они будут склонны предлагать более высокие ставки, чем в случае, когда не предоставляется никакой обратной связи по выигравшей ставке, чтобы уменьшить вероятность сожаления.

При принятии решений по лотереям эксперименты также предоставляют подтверждающие доказательства ожидаемого сожаления. [9] [10] [11] Как и в случае с аукционами первой цены, различия в отзывах по поводу разрешения неопределенности могут вызвать сожаление, а если это предвидится, это может привести к различным предпочтениям.Например, когда вы сталкиваетесь с выбором между 40 долларами с уверенностью и броском монеты, при котором выплачивается 100 долларов, если результат угадан правильно, и 0 долларов в противном случае, не только определенный вариант оплаты минимизирует риск, но и возможность сожаления, поскольку обычно монета не будет подброшен (и, следовательно, неопределенность не будет решена), в то время как, если выбран подбрасывание монеты, результат, при котором выплачивается 0 долларов, вызовет сожаление. Если монета подбрасывается независимо от выбранной альтернативы, то альтернативный выигрыш всегда будет известен и тогда не будет выбора, который исключит возможность сожаления.

Ожидаемое сожаление и пережитое сожаление

[ редактировать ]

Ожидаемое сожаление имеет тенденцию переоцениваться как в отношении выбора, так и действий, за которые люди считают себя ответственными. [12] [13] Люди особенно склонны переоценивать сожаление, которое они испытают, если с небольшим отрывом не достигнут желаемый результат. В одном исследовании пассажиры пригородной зоны предсказывали, что они испытают большее сожаление, если опоздают на поезд на 1 минуту чаще, чем, например, на 5 минут, но пассажиры, которые на самом деле опоздали на поезд на 1 или 5 минут, испытали (равные и) меньшие потери. сожаления. Пассажиры, похоже, переоценивали сожаление, которое они испытывали, опоздав на поезд, с небольшим перевесом, потому что они были склонны недооценивать степень, в которой они объясняли опоздание на поезд внешними причинами (например, потерей кошелька или проведением меньшего количества времени в душе). . [12]

Приложения

[ редактировать ]

Помимо традиционного выбора по сравнению с лотереями, неприятие сожалений было предложено в качестве объяснения обычно наблюдаемого завышения ставок на аукционах первой цены. [14] и эффект диспозиции , [15] среди других.

Минимаксное сожаление

[ редактировать ]

Подход «минимаксного сожаления» заключается в минимизации сожалений в худшем случае, первоначально предложенный Леонардом Сэвиджем в 1951 году. [16] Целью этого является максимально приближенное к оптимальному курсу. Поскольку применяемый здесь минимаксный критерий относится к сожалению (разнице или соотношению выигрышей), а не к самому выигрышу, он не столь пессимистичен, как обычный минимаксный подход. Подобные подходы использовались в различных областях, таких как:

Одним из преимуществ минимакса (в отличие от ожидаемого сожаления) является то, что он не зависит от вероятностей различных результатов: таким образом, если сожаление можно точно вычислить, можно надежно использовать минимаксное сожаление. Однако вероятность исхода оценить сложно.

Он отличается от стандартного минимаксного подхода тем, что он использует различия или соотношения между результатами и, следовательно, требует измерения интервалов или отношений, а также порядковых измерений (ранжирования), как в стандартном минимаксе.

Предположим, инвестору приходится выбирать между инвестированием в акции, облигации или денежный рынок, и общий доход зависит от того, что произойдет с процентными ставками. В следующей таблице показаны некоторые возможные доходы:

Возвращаться Процентные ставки растут Статические ставки Процентные ставки падают Худший возврат
Акции −4 4 12 −4
Облигации −2 3 8 −2
Денежный рынок 3 2 1 1
Лучший возврат 3 4 12

Грубый максиминный выбор, основанный на доходности, — это инвестировать в денежный рынок, гарантируя доходность не менее 1. Однако, если процентные ставки упадут, то сожаление, связанное с этим выбором, будет большим. Это будет 11, то есть разница между 12, которые можно было бы получить, если бы результат был известен заранее, и полученной 1. Смешанный портфель, включающий около 11,1% акций и 88,9% денежного рынка, обеспечил бы доходность как минимум 2,22; но если процентные ставки упадут, то будет сожаление о значении около 9,78.

Таблица сожалений для этого примера, построенная путем вычитания фактической доходности из наилучшей доходности, выглядит следующим образом:

Сожалеть Процентные ставки растут Статические ставки Процентные ставки падают Худшее сожаление
Акции 7 0 0 7
Облигации 5 1 4 5
Денежный рынок 0 2 11 11

Следовательно, при использовании минимаксного выбора, основанного на сожалении, лучшим курсом было бы инвестирование в облигации, гарантируя сожаление не хуже 5. Смешанный инвестиционный портфель показал бы себя еще лучше: 61,1% инвестировано в акции, а 38,9% - в деньги. рынок произвел бы сожаление не хуже, чем примерно 4,28.

Пример: настройка линейной оценки

[ редактировать ]

Далее следует иллюстрация того, как концепция сожаления может быть использована для разработки средства линейной оценки . В этом примере задача состоит в том, чтобы построить линейную оценку конечномерного вектора параметров. из его зашумленного линейного измерения с известной ковариационной структурой шума. Утрата реконструкции измеряется с использованием среднеквадратической ошибки (MSE). Известно, что вектор неизвестного параметра лежит в эллипсоиде. с центром в нуле. Сожаление определяется как разница между MSE линейной оценки, которая не знает параметра и СКО линейной оценки, которая знает . Кроме того, поскольку оценка ограничена линейностью, в последнем случае невозможно достичь нулевой MSE. В этом случае решение задачи выпуклой оптимизации дает оптимальную, минимаксную линейную оценку, минимизирующую сожаление, что можно увидеть с помощью следующего аргумента.

Согласно предположениям, наблюдаемый вектор и неизвестный вектор детерминированных параметров связаны линейной моделью

где является известным матрица с полным рангом столбца , и представляет собой случайный вектор с нулевым средним значением с известной ковариационной матрицей .

Позволять

быть линейной оценкой от , где это какой-то матрица. СКО этой оценки определяется выражением

Поскольку MSE явно зависит от его нельзя свести к минимуму напрямую. Вместо этого можно использовать концепцию сожаления, чтобы определить линейную оценку с хорошей производительностью MSE. Чтобы определить здесь сожаление, рассмотрим линейную оценку, которая знает значение параметра , т. е. матрица может явно зависеть от :

MSE является

Чтобы найти оптимальную , дифференцируется по отношению к и производная приравнивается к 0, получая

Тогда, используя лемму об обращении матрицы

Подставив это обратно в , человек получает

Это наименьшая MSE, достижимая с линейной оценкой, которая знает . На практике эта MSE не может быть достигнута, но она служит границей оптимальной MSE. Сожаление об использовании линейной оценки, указанной равно

Подход минимаксного сожаления здесь заключается в минимизации сожаления в худшем случае, т.е. Это позволит получить производительность, максимально приближенную к наилучшей достижимой производительности в худшем случае параметра. . Хотя эта проблема кажется сложной, она представляет собой пример выпуклой оптимизации , и, в частности, можно эффективно вычислить численное решение. [17] Подобные идеи можно использовать, когда является случайным с неопределенностью в ковариационной матрице . [18] [19]

Сожаление о проблемах принципала и агента

[ редактировать ]

Камара, Хартлайн и Джонсон [20] изучайте проблемы принципала и агента . Это игры с неполной информацией между двумя игроками, называемыми Принципалом и Агентом , выигрыши которых зависят от естественного состояния, известного только Агенту. Принципал принимает политику, затем агент реагирует, и тогда раскрывается естественное состояние. Они предполагают, что принципал и агент неоднократно взаимодействуют и могут со временем учиться на истории состояния, используя обучение с подкреплением . Они предполагают, что агентом движет неприятие сожалений. В частности, агент минимизирует свое контрфактическое внутреннее сожаление . Основываясь на этом предположении, они разрабатывают механизмы , которые минимизируют сожаление директора.

Коллина, Рот и Шао [21] улучшить их механизм как во времени выполнения, так и в пределах сожаления (в зависимости от количества различных состояний природы).

См. также

[ редактировать ]
  1. ^ Лумс, Г.; Сагден, Р. (1982). «Теория сожаления: альтернативная теория рационального выбора в условиях неопределенности». Экономический журнал . 92 (4): 805–824. дои : 10.2307/2232669 . JSTOR   2232669 .
  2. ^ Белл, Делавэр (1982). «Сожаление о принятии решения в условиях неопределенности». Исследование операций . 30 (5): 961–981. дои : 10.1287/опре.30.5.961 .
  3. ^ Фишберн, ПК (1982). Основы ожидаемой полезности . Библиотека теории и решений. ISBN  90-277-1420-7 .
  4. ^ Jump up to: а б Дисидью, Э.; Сомасундарам, Дж. (2017). «Теория сожаления: новый фундамент». Журнал экономической теории . 172 : 88–119. дои : 10.1016/j.jet.2017.08.006 . S2CID   36505167 .
  5. ^ Бихчандани, С.; Сигал, У. (2011). «Транзитивное сожаление» . Теоретическая экономика . 6 (1): 95–108. дои : 10.3982/TE738 . hdl : 10419/150148 .
  6. ^ Бардахчян В.; Аллахвердян, А. (2023). «Теория сожаления, парадокс Алле и омлет Сэвиджа». Журнал математической психологии . 117 . arXiv : 2301.02447 . дои : 10.1016/j.jmp.2023.102807 .
  7. ^ «Почему мы ожидаем сожаления, прежде чем принять решение?» . Лаборатория решений .
  8. ^ Филиз-Озбай, Э.; Озбай, EY (2007). «Аукционы с ожидаемым сожалением: теория и эксперимент». Американский экономический обзор . 97 (4): 1407–1418. дои : 10.1257/aer.97.4.1407 . S2CID   51815774 .
  9. ^ Зеленберг, М.; Битти, Дж.; Ван дер Плигт, Дж.; де Врис, Северная Каролина (1996). «Последствия неприятия сожалений: влияние ожидаемой обратной связи на принятие рискованных решений» . Организационное поведение и процессы принятия человеческих решений . 65 (2): 148–158. дои : 10.1006/obhd.1996.0013 .
  10. ^ Зеленберг, М.; Битти, Дж. (1997). «Последствия неприятия сожалений 2: дополнительные доказательства влияния обратной связи на принятие решений» . Организационное поведение и процессы принятия человеческих решений . 72 (1): 63–78. дои : 10.1006/obhd.1997.2730 .
  11. ^ Сомасундарам, Дж.; Дисидью, Э. (2016). «Теория сожаления и отношение к риску». Журнал риска и неопределенности . 55 (2–3): 1–29. дои : 10.1007/s11166-017-9268-9 . S2CID   254978441 .
  12. ^ Jump up to: а б Гилберт, Дэниел Т.; Морведж, Кэри К.; Ризен, Джейн Л.; Уилсон, Тимоти Д. (1 мая 2004 г.). «С нетерпением жду возможности оглянуться назад. Неверный прогноз сожаления». Психологическая наука . 15 (5): 346–350. CiteSeerX   10.1.1.492.9980 . дои : 10.1111/j.0956-7976.2004.00681.x . ISSN   0956-7976 . ПМИД   15102146 . S2CID   748553 .
  13. ^ Севдалис, Ник; Харви, Найджел (1 августа 2007 г.). «Предвзятое прогнозирование эффекта после принятия решения». Психологическая наука . 18 (8): 678–681. дои : 10.1111/j.1467-9280.2007.01958.x . ISSN   0956-7976 . ПМИД   17680936 . S2CID   7524552 .
  14. ^ Энгельбрехт-Вигганс, Р. (1989). «Влияние сожаления на оптимальные ставки на аукционах». Наука управления . 35 (6): 685–692. дои : 10.1287/mnsc.35.6.685 . hdl : 2142/28707 .
  15. ^ Фогель, SOC; Берри, Т. (2006). «Эффект диспозиции и решения отдельных инвесторов: роль сожаления и контрфактических альтернатив». Журнал поведенческих финансов . 7 (2): 107–116. дои : 10.1207/s15427579jpfm0702_5 . S2CID   153522835 .
  16. ^ Сэвидж, ЖЖ (1951). «Теория статистических решений». Журнал Американской статистической ассоциации . 46 (253): 55–67. дои : 10.1080/01621459.1951.10500768 .
  17. ^ Эльдар, ЮК; Бен-Тал, А.; Немировский, А. (2004). «Линейная минимаксная оценка детерминированных параметров с ограниченной неопределенностью данных». IEEE Транс. Сигнальный процесс . 52 (8): 2177–2188. Бибкод : 2004ITSP...52.2177E . дои : 10.1109/TSP.2004.831144 . S2CID   16417895 .
  18. ^ Эльдар, ЮК; Мерхав, Нери (2004). «Конкурентный минимаксный подход к робастной оценке случайных параметров». IEEE Транс. Сигнальный процесс . 52 (7): 1931–1946. Бибкод : 2004ITSP...52.1931E . дои : 10.1109/TSP.2004.828931 . S2CID   15596014 .
  19. ^ Эльдар, ЮК; Мерхав, Нери (2005). «Минимаксная оценка отношения MSE с неопределенностями ковариации сигнала». IEEE Транс. Сигнальный процесс . 53 (4): 1335–1347. Бибкод : 2005ITSP...53.1335E . дои : 10.1109/TSP.2005.843701 . S2CID   16732469 .
  20. ^ Камара, Модибо К.; Хартлайн, Джейсон Д.; Джонсен, Алек (01 ноября 2020 г.). «Механизмы агента без сожалений: за пределами общего приоритета» . 61-й ежегодный симпозиум IEEE по основам информатики (FOCS) 2020 г. IEEE. стр. 259–270. arXiv : 2009.05518 . дои : 10.1109/focs46700.2020.00033 . ISBN  978-1-7281-9621-3 . S2CID   221640554 .
  21. ^ Коллина, Натали; Рот, Аарон; Шао, Хан (2023). «Эффективные механизмы без предварительной записи для агентов, не допускающих сожалений». arXiv : 2311.07754 [ cs.GT ].
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3d91b8f8c51b1cb373978d6478676bcd__1722517980
URL1:https://arc.ask3.ru/arc/aa/3d/cd/3d91b8f8c51b1cb373978d6478676bcd.html
Заголовок, (Title) документа по адресу, URL1:
Regret (decision theory) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)