Jump to content

Теорема фон Неймана – Моргенштерна о полезности

В теории принятия решений фон Неймана-Моргенштерна ( VNM ) теорема полезности показывает, что при определенных аксиомах рационального поведения лицо, принимающее решения, столкнувшееся с рискованными (вероятностными) результатами различных вариантов выбора, будет вести себя так, как если бы оно максимизировало ожидаемую ценность некоторого функция, определенная для потенциальных результатов в определенный момент в будущем. Эта функция известна как функция полезности фон Неймана – Моргенштерна. Теорема является основой теории ожидаемой полезности .

В 1947 году Джон фон Нейман и Оскар Моргенштерн доказали, что любой человек, чьи предпочтения удовлетворяют четырем аксиомам, имеет функцию полезности , где предпочтения такого человека могут быть представлены в интервальной шкале , и человек всегда будет предпочитать действия, которые максимизируют ожидаемую полезность. [1] То есть они доказали, что агент (VNM-)рационален тогда и только тогда, когда существует действительнозначная функция u, определяемая возможными результатами, такая, что каждое предпочтение агента характеризуется максимизацией ожидаемого значения u , что затем может агента определяется как VNM-утилита (она уникальна с точностью до добавления константы и умножения на положительную скалярную величину). Не утверждается, что у агента есть «сознательное желание» максимизировать u , а только то, что вы существует.

VNM-утилита — это утилита принятия решений , поскольку она используется для описания решений . не обязательно эквивалентно, с полезностью Бентама утилитаризма Это связано, но . [2]

Настраивать

[ редактировать ]

В теореме отдельный агент сталкивается с вариантами, называемыми лотереями . Учитывая некоторые взаимоисключающие исходы, лотерея — это сценарий, в котором каждый исход произойдет с заданной вероятностью , причем все вероятности в сумме равны единице. Например, для двух исходов A и B :

обозначает сценарий, где P ( A ) = 25 % — это вероятность возникновения A , а P ( B ) = 75 % (и произойдет ровно одно из них). В более общем смысле для лотереи со многими возможными исходами A i мы пишем:

с суммой s равен 1.

Исходы в лотерее сами по себе могут быть лотереями между другими исходами, а расширенное выражение считается эквивалентной лотереей: 0,5(0,5 А 0,5 В ) + 0,5 С = 0,25 А + 0,25 В + 0,50 С. +

Если лотерея M предпочтительнее лотереи L , мы пишем или, что то же самое, . Если агент безразличен между L и M , запишем отношение безразличия [3] Если M либо предпочтительнее, либо рассматривается безразлично по отношению к L , мы пишем

Четыре аксиомы ВНМ-рациональности — это полнота , транзитивность , непрерывность и независимость . Эти аксиомы, помимо непрерывности, часто обосновываются с помощью теорем голландской книги (тогда как непрерывность используется для исключения лексикографических или бесконечно малых полезностей).

Полнота предполагает, что у человека есть четко определенные предпочтения:

Аксиома 1 (Полнота) Для любых лотерей и , или или .

(человек должен выразить какое-то предпочтение или безразличие [4] ). Обратите внимание, что это подразумевает рефлексивность .

Транзитивность предполагает, что предпочтения одинаковы для любых трех вариантов:

Аксиома 2 (Транзитивность) Если и , затем .

Непрерывность предполагает, что существует «переломный момент» между тем, чтобы быть лучше или хуже, чем данный средний вариант:

Аксиома 3 (непрерывность): если , то существует вероятность такой, что

где обозначение слева относится к ситуации, в которой L принимается с вероятностью p, а N принимается с вероятностью (1– p ).

Вместо непрерывности можно предположить альтернативную аксиому, не предполагающую точного равенства, называемую архимедовым свойством . [3] Он гласит, что любое разделение по предпочтениям может сохраняться при достаточно малом отклонении вероятностей:

Аксиома 3' (свойство Архимеда): Если , то существует вероятность такой, что

Необходимо принять только одно из (3) или (3′), а другое будет подразумеваться из теоремы.

Независимость предполагает, что предпочтение сохраняется независимо от вероятности другого результата.

Аксиома 4 (Независимость): Для любого и (с подчеркнутой «нерелевантной» частью лотереи):

Другими словами, вероятности, связанные с компенсируются и не влияют на наше решение, поскольку вероятность одинаков в обеих лотереях.

Обратите внимание, что для работы теоремы необходимо направление «только если». Без этого мы имеем контрпример: есть только два результата. , и агент безразличен к , и строго предпочитает их всем . Используя направление «только если», мы можем утверждать, что подразумевает , тем самым исключая этот контрпример.

Из аксиомы независимости следует аксиома редукции сложных лотерей: [5]

Аксиома 4' (Редукция составных лотерей): Для любых лотерей и любой ,

Чтобы увидеть, как из аксиомы 4 следует аксиома 4', положим в выражении аксиомы 4 и разверните.

Для любого VNM-рационального агента (т. е. удовлетворяющего аксиомам 1–4) существует функция u , которая присваивает каждому результату A действительное число u(A) такое, что для любых двух лотерей

где E(u(L)) или, короче, Eu ( L ) определяется выражением

Таким образом, u может быть однозначно определено (вплоть до добавления константы и умножения на положительную скалярную величину) по предпочтениям между простыми лотереями , то есть лотереями вида pA + (1 − p ) B , имеющими только два результата. И наоборот, любой агент, стремящийся максимизировать математическое ожидание функции u, будет подчиняться аксиомам 1–4. Такая функция называется полезностью агента фон Неймана-Моргенштерна (ВНМ) .

Эскиз доказательства

[ редактировать ]

Доказательство конструктивно: оно показывает, как искомая функция можно построить. Здесь мы описываем процесс построения для случая, когда число верных исходов конечно. [6] : 132–134 

Предположим, что существует n надежных исходов, . Обратите внимание, что каждый гарантированный исход можно рассматривать как лотерею: это вырожденная лотерея, в которой исход выбирается с вероятностью 1. Следовательно, согласно аксиомам полноты и транзитивности, можно упорядочить исходы от худшего к лучшему:

Предположим, что хотя бы одно из неравенств является строгим (в противном случае функция полезности тривиальна — константа). Так . Мы используем эти два крайних результата — худший и лучший — в качестве единицы масштабирования нашей функции полезности и определяем:

и

Для каждой вероятности , определите лотерею, в которой с вероятностью выбирается лучший результат и худший результат в противном случае:

Обратите внимание, что и .

По аксиоме непрерывности для каждого верного исхода , есть вероятность такой, что:

и

Для каждого , функция полезности для результата определяется как

так что полезность каждой лотереи ждут чего от тебя :

Чтобы понять, почему эта функция полезности имеет смысл, рассмотрим лотерею. , который выбирает результат с вероятностью . Но, по нашему предположению, лицу, принимающему решение, безразличен верный результат и лотерея . Итак, согласно аксиоме редукции, ему безразлично, будет ли лотерея и следующая лотерея:

лотерея по сути, это лотерея, в которой с вероятностью выигран лучший результат. , и худший исход в противном случае.

Следовательно, если , человек, принимающий рациональные решения, предпочел бы лотерею над лотереей , потому что это дает ему больше шансов добиться наилучшего результата.

Следовательно:

тогда и только тогда, когда

Фон Нейман и Моргенштерн ожидали удивления от силы своего вывода. Но, по их мнению, причина, по которой их функция полезности работает, заключается в том, что она создана именно для того, чтобы выполнять роль чего-то, чье ожидание максимизировано:

«Многим экономистам покажется, что мы слишком много предполагаем… Разве мы не показали слишком много?… Насколько мы видим, наши постулаты [являются] правдоподобными… Мы практически определили числовую полезность как то, что вещь, для которой законно исчисление математических ожиданий». – ВНМ 1953 г., § 3.1.1 п.16 и § 3.7.1 п.16. 28 [1]

Таким образом, содержание теоремы состоит в том, что построение и возможно, а о его природе мало что говорят.

Последствия

[ редактировать ]

Автоматическое рассмотрение неприятия риска

[ редактировать ]

Часто бывает так, что человек, сталкивающийся с реальными азартными играми с деньгами, не действует для максимизации ожидаемой стоимости своих долларовых активов. Например, человек, у которого есть сбережения всего на 1000 долларов, может не захотеть рисковать всем ради 20% шанса выиграть 10000 долларов, даже если

Однако если человек VNM-рационален, такие факты автоматически учитываются в его функции полезности u . В этом примере мы могли бы заключить, что

где суммы в долларах здесь действительно представляют собой результаты (ср. « ценность »), три возможные ситуации, с которыми может столкнуться человек. В частности, u может проявлять такие свойства, как u ($1) + u ($1) ≠ u ($2), вообще не противореча VNM-рациональности. Это приводит к количественной теории неприятия денежного риска.

Последствия для гипотезы ожидаемой полезности

[ редактировать ]

В 1738 году Даниил Бернулли опубликовал трактат. [7] в котором он утверждает, что рациональное поведение можно описать как максимизацию ожидания функции u , которая, в частности, не обязательно должна иметь денежную оценку, что объясняет неприятие риска. Это гипотеза ожидаемой полезности . Как уже говорилось, эта гипотеза может показаться смелым утверждением. Цель теоремы об ожидаемой полезности - предоставить «скромные условия» (т.е. аксиомы), описывающие, когда справедлива гипотеза ожидаемой полезности, которые можно оценить напрямую и интуитивно:

«Аксиом не должно быть слишком много, их система должна быть максимально простой и прозрачной, и каждая аксиома должна иметь непосредственный интуитивный смысл, по которому можно напрямую судить о ее целесообразности. В ситуации, подобной нашей, это последнее требование особенно важно. , несмотря на ее неясность: мы хотим сделать интуитивное понятие поддающимся математической обработке и как можно яснее увидеть, какие гипотезы для этого требуются». – ВНМ 1953 г. § 3.5.2, с. 25 [1]

Таким образом, утверждения о том, что гипотеза ожидаемой полезности не характеризует рациональность, должны отвергать одну из аксиом VNM. множество обобщенных теорий ожидаемой полезности Возникло , большинство из которых отвергают или ослабляют аксиому независимости.

Последствия для этики и моральной философии

[ редактировать ]

Поскольку теорема ничего не предполагает о природе возможных результатов азартных игр, они могут быть морально значимыми событиями, например, связанными с жизнью, смертью, болезнью или здоровьем других людей. Рациональный агент фон Неймана-Моргенштерна способен действовать с большой заботой о таких событиях, жертвуя большим количеством личного богатства или благополучия, и все эти действия будут учитываться при построении/определении функции VNM-полезности агента. Другими словами, и то, что естественным образом воспринимается как «личная выгода», и то, что естественным образом воспринимается как «альтруизм», имплицитно сбалансированы в функции VNM-полезности VNM-рационального человека. полный спектр агенто-ориентированного и агентно-нейтрального поведения. Таким образом, с помощью различных служебных функций VNM возможен [ нужны разъяснения ] .

Если полезность является , рациональный агент фон Неймана–Моргенштерна должен быть безразличен между и . Таким образом, рациональный агент фон Неймана-Моргенштерна, ориентированный на агента, не может выступать за более равное или «справедливое» распределение полезности между своими возможными будущими «я».

Отличие от других понятий полезности

[ редактировать ]

Некоторые утилитарные моральные теории касаются величин, называемых «общая полезность» и «средняя полезность» коллективов, и характеризуют мораль с точки зрения предпочтения полезности или счастья других, игнорируя свое собственное. Эти понятия могут быть связаны с утилитой VNM, но отличаются от нее:

  • 1) VNM-утилита — это утилита принятия решений : [2] это то, в соответствии с чем человек принимает решения, и, следовательно, по определению не может быть чем-то, что можно игнорировать.
  • 2) VNM-полезность не является канонически аддитивной для нескольких людей (см. Ограничения), поэтому «общая VNM-полезность» и «средняя VNM-полезность» не имеют непосредственного смысла (требуется какое-то допущение о нормализации).

термин E-utility, обозначающий «полезность опыта». Был придуман [2] для обозначения типов «гедонистической» полезности, подобных Бентама принципу величайшего счастья . Поскольку мораль влияет на решения, мораль VNM-рационального агента будет влиять на определение его собственной функции полезности (см. Выше). Таким образом, мораль VNM-рационального агента может быть охарактеризована соотношением VNM-полезности агента с VNM-полезностью, E-полезностью или «счастьем» других, среди прочих средств, но не пренебрежением к собственным собственным возможностям агента . ВНМ-полезность, противоречие в терминах.

Ограничения

[ редактировать ]

Вложенные азартные игры

[ редактировать ]

Поскольку если L и M являются лотереями, то pL + (1 - p ) M просто «расширяется» и считается лотереей, формализм VNM игнорирует то, что можно воспринимать как «вложенную азартную игру». Это связано с проблемой Эллсберга , когда люди предпочитают избегать восприятия рисков по поводу рисков . Фон Нейман и Моргенштерн признали это ограничение:

«...такие понятия, как специфическая полезность азартных игр, не могут быть сформулированы без противоречий на этом уровне. Это утверждение может показаться парадоксальным. Но любой, кто серьезно пытался аксиоматизировать эту неуловимую концепцию, вероятно, согласится с ней». – ВНМ 1953 г. § 3.7.1, с. 28 . [1]

Несравнимость между агентами

[ редактировать ]

Поскольку для любых двух VNM-агентов X и Y их функции VNM-полезности u X и ​​u Y определяются только с точностью до аддитивных констант и мультипликативных положительных скаляров, теорема не дает какого-либо канонического способа их сравнения. Следовательно, такие выражения, как u X ( L ) + u Y ( L ) и u X ( L ) − u Y ( L ), не являются канонически определенными, а сравнения типа u X ( L ) < u Y ( L ) не являются канонически истинными или ложными. . В частности, вышеупомянутые «общая VNM-полезность» и «средняя VNM-полезность» популяции не имеют канонического смысла без предположений о нормализации.

Применимость к экономике

[ редактировать ]

, было показано, что гипотеза ожидаемой полезности В ряде лабораторных эмпирических экспериментов, таких как парадокс Алле имеет несовершенную точность прогнозирования .

Ссылки и дальнейшее чтение

[ редактировать ]
  1. ^ Jump up to: а б с д Нейман, Джон фон и Моргенштерн, Оскар , Теория игр и экономическое поведение . Принстон, Нью-Джерси. Издательство Принстонского университета, 1953.
  2. ^ Jump up to: а б с Канеман; Ваккер; Зарин (1997). «Назад к Бентаму? Исследования опытной полезности» . Ежеквартальный экономический журнал . 112 (2): 375–406. дои : 10.1162/003355397555235 . hdl : 1765/23011 .
  3. ^ Jump up to: а б Крепс, Дэвид М. Заметки по теории выбора . Westview Press (12 мая 1988 г.), главы 2 и 5.
  4. ^ Неявно обозначая безразличие через равенство, являются такие утверждения, как если бы затем . Чтобы сделать такие отношения явными в аксиомах, Крепс (1988) в главе 2 обозначает безразличие как , поэтому его можно кратко рассмотреть на предмет интуитивного смысла.
  5. ^ EconPort, «Теория ожидаемой полезности фон Неймана – Моргенштерна» http://www.econport.org/content/handbook/decisions-uncertainty/basic/von.html
  6. ^ Кини, Ральф Л.; Райффа, Ховард (1993). Решения с несколькими целями . ISBN  0-521-44185-4 .
  7. ^ Образцы theoriae novae de mensura sortis или Изложение новой теории измерения риска
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e73f2984e743c6644cebec26d18add58__1722033600
URL1:https://arc.ask3.ru/arc/aa/e7/58/e73f2984e743c6644cebec26d18add58.html
Заголовок, (Title) документа по адресу, URL1:
Von Neumann–Morgenstern utility theorem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)