Проблема с двумя конвертами
Проблема двух конвертов , также известная как парадокс обмена , является парадоксом в теории вероятностей . Это представляет особый интерес для теории принятия решений и для байесовской интерпретации теории вероятностей . Это вариант более старой проблемы, известной как парадокс галстука .Проблема обычно возникает путем формулирования гипотетической задачи, как в следующем примере:
Представьте, что вам дали два одинаковых конверта , в каждом из которых лежат деньги. В одном содержится в два раза больше, чем в другом. Вы можете выбрать один конверт и оставить деньги, которые в нем содержатся. Выбрав конверт по своему желанию, но перед его осмотром, вам предоставляется возможность поменять конверты. Стоит ли переключаться?
Поскольку ситуация симметрична, кажется очевидным, что менять конверты нет смысла. С другой стороны, простой расчет с использованием ожидаемых значений позволяет сделать противоположный вывод: менять конверты всегда выгодно, поскольку человек может получить в два раза больше денег, если перейдет, в то время как единственный риск - это сократить вдвое то, что у него есть на данный момент. [1]
Введение
[ редактировать ]Проблема
[ редактировать ]Человеку дают два неразличимых конверта, в каждом из которых лежит сумма денег. В одном конверте в два раза больше, чем в другом. Человек может выбрать один конверт и оставить себе любую содержащуюся в нем сумму. Они выбирают один конверт наугад, но прежде чем открыть его, им предоставляется возможность вместо этого взять другой конверт. [1]
Аргумент переключения
[ редактировать ]Теперь предположим, что человек рассуждает следующим образом:
- Обозначим через А сумму в выбранном игроком конверте.
- Вероятность того, что A представляет собой меньшую сумму, равна 1/2, а вероятность того, что это большая сумма, также равна 1/2.
- Другой конверт может содержать либо 2 А , либо А /2.
- Если А — меньшая сумма, то в другом конверте будет А. 2
- Если А — большая сумма, то в другом конверте содержится А /2.
- Таким образом, другой конверт содержит 2 A с вероятностью 1/2 и A /2 с вероятностью 1/2.
- Таким образом, ожидаемая стоимость денег в другом конверте равна
- Это больше, чем А , поэтому в среднем человек считает, что он выиграет от обмена.
- После переключения обозначьте это содержимое буквой B и рассуждайте точно так же, как указано выше.
- Человек приходит к выводу, что наиболее разумным решением будет снова поменяться местами.
- Таким образом, человек будет бесконечно менять конверты.
- Поскольку рациональнее просто открыть конверт, чем бесконечно менять местами, игрок приходит к противоречию.
Головоломка
[ редактировать ]Загадка состоит в том, чтобы найти изъян в рассуждении аргумента о переключении. Это включает в себя точное определение того, почему и при каких условиях этот шаг неверен, чтобы не допустить этой ошибки в ситуации, когда оплошность может быть не столь очевидной. Короче говоря, проблема в том, чтобы разрешить парадокс. Загадку не решить, если найти другой способ вычисления вероятностей, не приводящий к противоречию.
Множество предлагаемых решений
[ редактировать ]Было предложено много решений, и обычно один автор предлагает решение проблемы в том виде, в котором он был сформулирован, после чего другой автор показывает, что изменение проблемы немного оживляет парадокс. Такая последовательность дискуссий привела к появлению семейства тесно связанных формулировок проблемы, что привело к появлению объемной литературы по этому вопросу. [2]
Ни одно из предложенных решений не получило широкого признания в качестве окончательного. [3] Несмотря на это, авторы часто утверждают, что решение проблемы легко и даже элементарно. [4] Однако при исследовании этих элементарных решений они часто различаются у разных авторов.
Пример разрешения
[ редактировать ]Предположим, что общая сумма в обоих конвертах постоянна. , с в одном конверте и в другом. Если вы выберете конверт с сначала вы получите сумму путем обмена. Если вы выберете конверт с сначала ты потеряешь сумму путем обмена. Таким образом, вы в среднем получаете путем обмена.
Итак, если предположить, что общая сумма фиксирована, обмен не лучше, чем сохранение. Ожидаемое значение одинаково для обоих конвертов. Таким образом, никакого противоречия не существует. [5]
Известная мистификация возникает из-за того, что путают ситуацию, когда общая сумма в двух конвертах фиксирована, с ситуацией, когда сумма в одном конверте фиксирована, а в другом может быть либо вдвое, либо вдвое больше этой суммы. Так называемый парадокс представляет собой два уже назначенных и уже заблокированных конверта, где в одном конверте уже заблокирована сумма в два раза больше, чем в другом, уже заблокированном конверте. В то время как шаг 6 смело утверждает: «Таким образом, другой конверт содержит 2А с вероятностью 1/2 и А/2 с вероятностью 1/2», в данной ситуации это утверждение никогда не может быть применимо к какому-либо А или к любому среднему А.
Это утверждение никогда не соответствует представленной ситуации; это утверждение применимо только к асимметричному варианту Nalebuff (см. ниже). В представленной ситуации другой конверт вообще не может содержать 2А, но может содержать 2А только в том очень специфическом случае, когда конверт А случайно содержит меньшее количество , но больше нигде. Другой конверт вообще не может содержать A/2, но может содержать A/2 только в том очень специфическом случае, когда конверт A случайно действительно содержит , но больше нигде. Разница между двумя уже назначенными и заблокированными конвертами всегда . Никакая «средняя сумма А» никогда не сможет сформировать начальную основу для какой-либо ожидаемой стоимости, поскольку она не затрагивает суть проблемы. [6]
Другие простые решения
[ редактировать ]Широко обсуждаемый способ разрешения парадокса, как в популярной литературе, так и в части академической литературы, особенно в философии, состоит в том, чтобы предположить, что буква «А» на шаге 7 должна быть ожидаемым значением в конверте А и что мы намеревались записать формулу ожидаемого значения в конверте B.
Шаг 7 утверждает, что ожидаемое значение в B = 1/2(2A + A/2).
Отмечается, что «А» в первой части формулы представляет собой ожидаемое значение, учитывая, что конверт A содержит меньше, чем конверт B, но «А» во второй части формулы представляет собой ожидаемое значение в A. , учитывая, что конверт A содержит больше, чем конверт B. Недостаток аргумента заключается в том, что один и тот же символ используется с двумя разными значениями в обеих частях одного и того же расчета, но предполагается, что он имеет одно и то же значение в обоих случаях. Эта линия аргументации представлена МакГрю, Широм и Сильверстайном (1997). [7]
Правильный расчет будет такой:
Если затем мы возьмем сумму в одном конверте равной x, а сумму в другом — 2x, расчеты ожидаемого значения станут такими:
что равно ожидаемой сумме в A.
Говоря нетехническим языком, что-то идет не так (см. «Парадокс галстука» ), так это то, что в представленном сценарии математика использует относительные значения A и B (то есть предполагается, что можно получить больше денег, если A меньше B, чем B). можно было бы проиграть, если бы было наоборот). Однако две стоимости денег фиксированы (в одном конверте содержится, скажем, 20 долларов, а в другом — 40 долларов). Если значения конвертов переформулировать как x и 2 x , гораздо легче увидеть, что, если бы A было больше, можно было бы потерять x при переключении, а если бы B было больше, можно было бы получить x при переключении. Никто не получит большую сумму денег, переключившись, потому что общая сумма Т A и B (3 x ) остается прежней, а разница x фиксирована на уровне T/3 .
Строку 7 следовало проработать более тщательно следующим образом:
A будет больше, когда A больше B, чем когда оно меньше B. Таким образом, его средние значения (ожидаемые значения) в этих двух случаях различны. И в любом случае среднее значение А не совпадает с самим А. Допускаются две ошибки: автор забыл, что принимает ожидаемые значения, и он забыл, что принимает ожидаемые значения при двух разных условиях.
Было бы проще вычислить E(B) напрямую. Обозначив меньшую из двух сумм через x и приняв ее фиксированной (даже если она неизвестна), мы находим, что
Мы узнаем, что 1,5 x — это ожидаемое значение суммы в конверте B. По тем же расчетам это также ожидаемое значение суммы в конверте A. Они одинаковы, поэтому нет причин предпочитать один конверт другому. Этот вывод, конечно, был очевиден заранее; Дело в том, что мы определили ложный шаг в аргументации в пользу переключения, объяснив, где именно сделанный там расчет пошел не по плану.
Мы также могли бы продолжить правильный, но трудный для интерпретации результат разработки в строке 7:
поэтому (конечно) разные способы расчета одного и того же дают один и тот же ответ.
Цикогианнопулос предложил другой способ проведения этих расчетов. [9] По определению правильно приписывать равные вероятности событиям, когда другой конверт содержит сумму, двойную или половину суммы в конверте А. Таким образом, «аргумент переключения» верен до шага 6. Учитывая, что конверт игрока содержит сумму А, он различает реальную ситуацию в двух разных играх: в первой игре используются суммы (A, 2A), а во второй — суммы (A/2, A). На самом деле играется только один из них, но мы не знаем, какой именно. К этим двум играм нужно относиться по-разному. Если игрок хочет вычислить ожидаемый доход (прибыль или убыток) в случае обмена, он/она должен взвесить доход, полученный в каждой игре, по средней сумме в двух конвертах в этой конкретной игре. В первом случае прибыль составит А со средней суммой 3А/2, тогда как во втором случае убыток составит А/2 со средней суммой 3А/4. Таким образом, формула ожидаемой прибыли в случае обмена, рассматриваемая как доля общей суммы в двух конвертах, выглядит следующим образом:
Этот результат еще раз означает, что игроку не следует ожидать ни прибыли, ни убытка при обмене своего конверта.
На самом деле мы могли бы открыть конверт, прежде чем принять решение о переходе или нет, и приведенная выше формула все равно даст нам правильный ожидаемый доход. Например, если бы мы открыли конверт и увидели, что в нем 100 евро, то в приведенной выше формуле мы бы установили A=100, и ожидаемый доход в случае переключения был бы:
Асимметричный вариант Nalebuff
[ редактировать ]Механизм, с помощью которого определяются суммы двух конвертов, имеет решающее значение для решения игрока сменить конверт. [9] [10] Предположим, что суммы в двух конвертах A и B не были определены путем сначала фиксации содержимого двух конвертов E1 и E2, а затем случайного присвоения им названий A и B (например, путем подбрасывания честной монеты). [11] ). Вместо этого мы начинаем с самого начала, кладя некоторую сумму в конверт A, а затем заполняем B таким образом, который зависит как от случайности (бросок монеты), так и от того, что мы кладем в конверт A. Предположим, что прежде всего сумма a в конверте А фиксируется тем или иным образом, а затем фиксируется сумма в конверте Б в зависимости от того, что уже находится в А, в соответствии с результатом честной монеты. Если монета упала орлом, то 2 a помещается в конверт B, если монета упала решкой, то / 2 помещается в конверт B. Если игрок знал об этом механизме и знает, что у него есть конверт A, но не знает результат подбрасывания монеты и не знаю , то аргумент переключения верен, и им рекомендуется поменять конверты. Эта версия проблемы была предложена Нейлебаффом (1988) и часто называется проблемой Али-Бабы. Обратите внимание, что нет необходимости заглядывать в конверт А, чтобы решить, переключаться или нет.
Было предложено еще много вариантов проблемы. Никерсон и Фальк систематически опрашивают в общей сложности 8 человек. [11]
Байесовские разрешения
[ редактировать ]Простое решение, приведенное выше, предполагало, что человек, придумавший аргумент в пользу переключения, пытался вычислить математическое ожидание суммы в конверте A, думая о двух суммах в конвертах как о фиксированных ( x и 2 x ). Единственная неопределенность заключается в том, в каком конверте находится меньшая сумма x . Однако многие математики и статистики интерпретируют этот аргумент как попытку вычислить ожидаемую сумму в конверте B, учитывая реальную или гипотетическую сумму «А» в конверте A. Не нужно заглядывать в конверт, чтобы увидеть, сколько там находится. , чтобы произвести расчет. Если результатом расчета является рекомендация поменять конверты, какая бы сумма там ни была, то получается, что все равно надо переключаться, не глядя. В этом случае на шагах 6, 7 и 8 рассуждений «А» — любое фиксированное возможное значение суммы денег в первом конверте.
Такая интерпретация проблемы двух конвертов появляется в первых публикациях, в которых парадокс был представлен в его современной форме, Гарднер (1989) и Нейлбафф (1988). [12] ) Это часто встречается в математической литературе по этой проблеме. Это также относится к модификации проблемы (которая, похоже, началась с Nalebuff), в которой владелец конверта A действительно заглядывает в свой конверт, прежде чем решить, переключаться или нет; хотя Налебафф также подчеркивает, что владельцу конверта А не обязательно заглядывать в свой конверт. Если он воображает, что смотрит туда, и если для любой суммы, которую он может себе представить, у него есть аргумент, чтобы переключиться, то он все равно решит переключиться. Наконец, эта интерпретация также была основой более ранних версий проблемы двух конвертов (парадоксы переключения Литтлвуда, Шредингера и Крайчика); см. заключительный раздел об истории ТЭП .
Этот вид интерпретации часто называют «байесовским», поскольку он предполагает, что автор также включает априорное распределение вероятностей возможных сумм денег в двух конвертах в аргумент переключения.
Простая форма байесовского разрешения
[ редактировать ]Простое решение зависело от конкретной интерпретации того, что автор аргумента пытается вычислить: а именно, предполагалось, что он искал (безусловное) математическое ожидание того, что находится в конверте B. В математической литературе по проблеме двух конвертов используется другой вариант. интерпретация является более распространенной и включает в себя условное математическое ожидание (в зависимости от того, что может находиться в конверте A). Для решения этой и связанных с ней интерпретаций или версий проблемы большинство авторов используют байесовскую интерпретацию вероятности. знаний) о вещах, которые фиксированы, но неизвестны, например, о двух суммах, первоначально помещенных в два конверта, прежде чем один из них будет выбран случайным образом и назван «Конвертом А». Более того, согласно давней традиции, восходящей, по крайней мере, к Лапласу и его принципу недостаточного основания, предполагается, что человек приписывает равные вероятности тогда, когда у него вообще нет знаний о возможных значениях некоторой величины. Таким образом, тот факт, что нам ничего не сообщают о том, как заполняются конверты, уже можно превратить в вероятностные утверждения об этих суммах. Отсутствие информации означает, что вероятности равны.
На шагах 6 и 7 аргумента переключения автор воображает, что конверт A содержит определенное количество a , а затем, кажется, полагает, что, учитывая эту информацию, другой конверт с равной вероятностью будет содержать вдвое или половину этого количества. Это предположение может быть правильным только в том случае, если до того, как узнать, что было в конверте А, автор счел бы равновероятными следующие две пары значений для обоих конвертов: суммы а /2 и а ; и суммы a и 2 a . (Это следует из правила Байеса в форме шансов: апостериорные шансы равны априорным шансам, умноженным на отношение правдоподобия). Но теперь мы можем применить те же рассуждения, представляя не a, а a/2 в конверте A. И аналогично для 2 a . И аналогично, до бесконечности, многократно уменьшая вдвое или многократно удваивая столько раз, сколько захотите. [13]
Предположим, в целях рассуждения, мы начнем с представления суммы 32 в конверте А. Чтобы рассуждения в шагах 6 и 7 были верными, какая бы сумма ни находилась в конверте А, мы, по-видимому, заранее полагаем, что все следующие десять все суммы с равной вероятностью будут меньшими из двух сумм в двух конвертах: 1, 2, 4, 8, 16, 32, 64, 128, 256, 512 (равновероятные степени 2 [13] ). Но при переходе к еще большим или даже меньшим суммам предположение о «равновероятности» начинает казаться немного необоснованным. Предположим, мы остановимся на этих десяти равновероятных возможностях получения меньшей суммы в двух конвертах. В этом случае рассуждения в шагах 6 и 7 были совершенно правильными, если бы конверт A содержал любую из сумм 2, 4, ... 512: переключение конвертов дало бы ожидаемый (средний) выигрыш в 25%. Если в конверте А оказалась сумма 1, то ожидаемая прибыль фактически равна 100%. Но если бы там оказалась сумма 1024, то был бы понесен огромный убыток в 50% (довольно большой суммы). Такое случается только один раз из двадцати, но этого ровно достаточно, чтобы сбалансировать ожидаемый выигрыш в остальных 19 случаях из 20.
В качестве альтернативы мы можем продолжать до бесконечности, но сейчас мы работаем с довольно нелепым предположением, подразумевающим, например, что сумма в конверте А с бесконечно большей вероятностью будет меньше 1 и с бесконечно большей вероятностью будет больше 1024. , чем между этими двумя значениями. Это так называемое неправильное априорное распределение : исчисление вероятностей не работает; ожидаемые значения даже не определены. [13]
Многие авторы также отмечают, что если существует максимальная сумма, которую можно положить в конверт с меньшей суммой, то очень легко увидеть, что Шаг 6 дает сбой, поскольку, если у игрока есть сумма, превышающая максимальную сумму, которую можно положить в конверт. помещенные в «меньший» конверт, они должны удерживать конверт, содержащий большую сумму, и, таким образом, наверняка проиграют при переключении. Это может происходить нечасто, но когда это происходит, большие потери, которые несет игрок, означают, что в среднем у него нет никакого преимущества при переключении. Некоторые авторы считают, что это решает все практические случаи проблемы. [14]
Но проблему можно решить и математически, не предполагая максимальную сумму. Налебафф, [14] Кристенсен и Уттс, [15] Фальк и Конольд, [13] Блахман, Кристенсен и Уттс, [16] Никерсон и Фальк, [11] отметил, что если суммы денег в двух конвертах имеют какое-либо правильное распределение вероятностей, отражающее предыдущие убеждения игрока о суммах денег в двух конвертах, то невозможно, чтобы какой бы ни была сумма A=a в первом конверте, согласно этим предыдущим убеждениям, было бы одинаково вероятно, что второе содержит / 2 или 2a . Таким образом, шаг 6 аргумента, который приводит к постоянному переключению , является нелогичным, даже когда нет максимума сумм в конвертах.
Введение в дальнейшие разработки в области байесовской теории вероятностей
[ редактировать ]Первые две резолюции, обсуждавшиеся выше («простая резолюция» и «байесовская резолюция»), соответствуют двум возможным интерпретациям того, что происходит на этапе 6 аргумента. Они оба предполагают, что шаг 6 действительно является «плохим шагом». Но описание в шаге 6 неоднозначное. Стремится ли автор к безусловному (общему) ожиданию того, что находится в конверте B (возможно, при условии меньшего количества x ), или он гонится за условным ожиданием того, что находится в конверте B, учитывая любую возможную сумму a, которая могла бы быть в конверте А? Таким образом, существуют две основные интерпретации намерения автора парадоксального аргумента в пользу переключения и два основных решения.
По вариантам проблемы создана большая литература. [17] [18] Стандартное предположение о том, как устроены конверты, заключается в том, что в одном конверте находится денежная сумма, а в другом — вдвое большая сумма. Один из двух конвертов случайным образом дается игроку ( конверт A ). Первоначально предложенная задача не проясняет, как именно определяется меньшая из двух сумм, какие значения она может принимать и, в частности, существует ли минимальная или максимальная сумма, которую она может содержать. [19] [20] Однако если мы используем байесовскую интерпретацию вероятности, то мы начинаем с выражения наших априорных убеждений относительно меньшего количества в двух конвертах через распределение вероятностей. Недостаток знаний также можно выразить через вероятность.
Первый вариант байесовской версии состоит в том, чтобы придумать правильное априорное распределение вероятностей меньшей суммы денег в двух конвертах, так что при правильном выполнении шага 6 советом будет по-прежнему отдавать предпочтение конверту B, что бы ни было в нем. Конверт A. Таким образом, хотя конкретный расчет, выполненный на шаге 6, был неправильным (не существует правильного предварительного распределения, такого, что, учитывая то, что находится в первом конверте A, другой конверт всегда с равной вероятностью будет больше или меньше), правильный расчет, в зависимости от того, какой априор мы используем, приводит к результату для всех возможных значений a . [21]
В этих случаях можно показать, что ожидаемая сумма в обоих конвертах бесконечна. В среднем при обмене нет никакой выгоды.
Второй математический вариант
[ редактировать ]Хотя байесовская теория вероятностей может разрешить первую математическую интерпретацию вышеописанного парадокса, оказывается, что можно найти примеры правильных распределений вероятностей, таких, что ожидаемое значение суммы во втором конверте, обусловленное суммой в первом конверте, не соответствует действительности. превысить сумму в первом, какой бы она ни была. Первый подобный пример уже привел Nalebuff. [14] См. также Кристенсен и Уттс (1992). [15] [22] [23] [24]
Обозначим еще раз сумму денег в первом конверте через A а во втором — через B. , Мы считаем их случайными. Пусть X будет меньшей из двух сумм, а Y=2X будет большей. Обратите внимание: как только мы зафиксировали распределение вероятностей для X A B , = , фиксировано совместное распределение вероятностей A, B, поскольку X , Y или Y, X каждый с вероятностью 1/2, независимо от X, Y .
Плохой шаг 6 в аргументе «всегда переключаться» привел нас к выводу E(B|A=a)>a для всех a и, следовательно, к рекомендации переключиться, независимо от того, знаем мы a или нет . Теперь оказывается, что можно довольно легко изобрести правильное распределение вероятностей для X , меньшей из двух сумм денег, так что этот плохой вывод по-прежнему верен. Один пример будет проанализирован более подробно, в данный момент.
Как упоминалось ранее, не может быть правдой, что независимо от a , при условии A=a , B с равной вероятностью будет a /2 или 2 a , но может быть верно, что независимо от a , при условии A=a , B имеет большее ожидаемое значение. чем .
Предположим, например, что конверт с меньшей суммой на самом деле содержит 2 н долларов с вероятностью 2 н /3 п +1 где n = 0, 1, 2, ... Сумма этих вероятностей равна 1, следовательно, распределение является правильным априорным (для субъективистов) и вполне приличным законом вероятности также и для частотников. [25]
Представьте, что может быть в первом конверте. Разумной стратегией, безусловно, было бы поменять местами, когда первый конверт содержит 1, поскольку тогда другой конверт должен содержать 2. Предположим, с другой стороны, первый конверт содержит 2. В этом случае есть две возможности: пара конвертов перед нами. либо {1, 2}, либо {2, 4}. Все остальные пары невозможны. Условная вероятность того, что мы имеем дело с парой {1, 2}, учитывая, что первый конверт содержит 2, равна
и, следовательно, вероятность того, что это пара {2, 4}, равна 2/5, поскольку это единственные две возможности. В этом выводе - вероятность того, что пара конвертов представляет собой пару 1 и 2, а конверт A содержит 2; — это вероятность того, что пара конвертов представляет собой пару 2 и 4, и (опять же) конверт A содержит 2. Это единственные два способа, которыми конверт A может в конечном итоге содержать сумму 2.
Оказывается, что эти пропорции в целом сохраняются, если только первый конверт не содержит 1. Обозначим через a сумму, которую мы предполагаем найти в конверте A, если бы мы открыли этот конверт, и предположим, что a = 2. н для некоторого n ≥ 1. В этом случае другой конверт содержит a /2 с вероятностью 3/5 и 2 a с вероятностью 2/5.
Таким образом, либо первый конверт содержит 1, и в этом случае условно ожидаемая сумма в другом конверте равна 2, либо первый конверт содержит > 1, и хотя второй конверт, скорее всего, будет меньше, чем больше, его условно ожидаемая сумма равна больше: условно ожидаемая сумма в конверте Б равна
что больше, . чем Это означает, что игрок, посмотревший в конверт А, решит переключить то, что он там увидел. Следовательно, для принятия такого решения нет необходимости заглядывать в конверт А.
Этот вывод столь же явно неверен, как и предыдущие интерпретации проблемы двух конвертов. Но теперь отмеченные выше недостатки не применимы; a в расчете ожидаемого значения является константой, а условные вероятности в формуле получаются из заданного и правильного предварительного распределения.
Предлагаемые решения с помощью математической экономики
[ редактировать ]Большинство авторов считают, что новый парадокс можно разрешить, хотя для его разрешения требуются концепции математической экономики. [26] Предполагать для всех . Можно показать, что это возможно для некоторых вероятностных распределений X (меньшей суммы денег в двух конвертах), только если . То есть только в том случае, если среднее всех возможных значений денег в конвертах бесконечно. Чтобы понять почему, сравните описанную выше серию, в которой вероятность каждого X составляет 2/3 вероятности предыдущего X , с серией, в которой вероятность каждого X составляет всего 1/3 вероятности предыдущего X . Когда вероятность каждого последующего термина превышает половину вероятности термина перед ним (и каждый X в два раза больше, чем X перед ним), среднее значение бесконечно, но когда коэффициент вероятности меньше половины , среднее сходится. В случаях, когда коэффициент вероятности меньше половины, для всех a, кроме первого, наименьшего a и общее ожидаемое значение переключения сходится к 0. Кроме того, если текущее распределение с коэффициентом вероятности больше половины становится конечным путем после любого количества членов, устанавливая последний термин со «всю оставшуюся вероятность», то есть 1 минус вероятность всех предыдущих членов, ожидаемое значение переключения относительно вероятности того, что A равно последнему, наибольшему a, будет точно отрицать сумму положительные ожидаемые значения, которые были раньше, и снова общее ожидаемое значение переключения падает до 0 (это общий случай задания равной вероятности конечного набора значений в описанных выше конвертах). Таким образом, единственные распределения, которые, по-видимому, указывают на положительное математическое ожидание переключения, — это те, в которых . Усредняя по a , получаем, что (поскольку A и B имеют идентичные распределения вероятностей по симметрии, и оба A и B больше или равны X ).
Если мы не заглянем в первый конверт, то, очевидно, нет смысла переключаться, поскольку мы будем обменивать одну неизвестную сумму денег ( A ), ожидаемая стоимость которой бесконечна, на другую неизвестную сумму денег ( B ), с то же распределение вероятностей и бесконечное математическое ожидание. Однако если мы посмотрим на первый конверт, то для всех наблюдаемых значений ( ) мы хотели бы переключиться, потому что для всех а . Как заметил Дэвид Чалмерс , эту проблему можно охарактеризовать как провал рассуждений о доминировании. [27]
Согласно рассуждениям о доминировании, тот факт, что мы строго предпочитаем A перед B для всех возможных наблюдаемых значений a, должен означать, что мы строго предпочитаем A перед B, не наблюдая a ; однако, как уже было показано, это неверно, поскольку . Чтобы спасти рассуждения о доминировании, позволяя , нужно было бы заменить ожидаемую стоимость в качестве критерия принятия решения, тем самым используя более сложный аргумент из математической экономики.
Например, мы могли бы предположить, что лицо, принимающее решения, — это максимизатор ожидаемой полезности с начальным богатством W , чья функция полезности , выбран для удовлетворения по крайней мере для некоторых значений a (т. е. сохраняя строго предпочтительнее перехода на B для некоторого a ). Хотя это верно не для всех функций полезности, это было бы верно, если бы имел верхнюю границу, , когда w увеличивается до бесконечности (распространенное предположение в математической экономике и теории принятия решений). [28] Майкл Р. Пауэрс приводит необходимые и достаточные условия для того, чтобы функция полезности разрешила парадокс, и отмечает, что ни ни требуется. [29]
Некоторые авторы предпочли бы утверждать, что в реальной ситуации и ограничены просто потому, что количество денег в конверте ограничено общим количеством денег в мире ( M ), подразумевая и . С этой точки зрения второй парадокс разрешается, поскольку постулируемое распределение вероятностей для X (с ) не может возникнуть в реальной ситуации. Подобные аргументы часто используются для разрешения петербургского парадокса .
Споры среди философов
[ редактировать ]Как упоминалось выше, любое распределение, создающее этот вариант парадокса, должно иметь бесконечное среднее. Таким образом, прежде чем игрок откроет конверт, ожидаемый выигрыш от переключения составит «∞ − ∞», который не определен. По словам Дэвида Чалмерса , это «просто еще один пример знакомого явления, странного поведения бесконечности». [27] Чалмерс предполагает, что теория принятия решений обычно терпит неудачу, когда сталкивается с играми с разными ожиданиями, и сравнивает ее с ситуацией, возникающей в результате классического петербургского парадокса .
Однако Кларк и Шакел утверждают, что обвинение во всем «странном поведении бесконечности» вообще не разрешает парадокс; ни в единичном, ни в усреднённом случае. Они представляют собой простой пример пары случайных величин, каждая из которых имеет бесконечное среднее значение, но явно разумно предпочесть одну другой, как условно, так и в среднем. [30] Они утверждают, что теорию принятия решений следует расширить, чтобы в некоторых ситуациях допускать бесконечные значения ожидания.
Невероятностный вариант Смалляна
[ редактировать ]Логик Рэймонд Смалльян задался вопросом, имеет ли этот парадокс вообще какое-либо отношение к вероятностям. [31] Он сделал это, сформулировав проблему таким образом, чтобы не использовать вероятности. Следующие явно логические аргументы приводят к противоречивым выводам:
- Пусть сумма в конверте, выбранном игроком, A. равна Поменяв местами, игрок может получить A или потерять A /2. Таким образом, потенциальный выигрыш строго превышает потенциальный убыток.
- Пусть суммы в конвертах равны X и 2 X . меняя местами, игрок может получить X или потерять X. Теперь , Таким образом, потенциальный выигрыш равен потенциальным потерям.
Предлагаемые резолюции
[ редактировать ]Был предложен ряд решений. Некоторые логики провели тщательный анализ. Хотя решения различаются, все они указывают на семантические проблемы, связанные с контрфактическими рассуждениями. Мы хотим сравнить сумму, которую мы получили бы от перехода, если бы мы выиграли от перехода, с суммой, которую мы потеряли бы от перехода, если бы мы действительно потеряли от перехода. Однако мы не можем и выиграть, и проиграть, переключившись одновременно. Нас просят сравнить две несовместимые ситуации. Реально может произойти только один из них, другой — это контрфактическая ситуация — как-то воображаемая. Чтобы вообще их сравнивать, мы должны каким-то образом «выровнять» две ситуации, предоставив некоторые определенные точки соприкосновения.
Джеймс Чейз утверждает, что второй аргумент верен, поскольку он действительно соответствует способу выравнивания двух ситуаций (одну, в которой мы выигрываем, другую, в которой мы проигрываем), на что предпочтительно указывает описание проблемы. [32] Эту точку зрения отстаивают также Бернард Кац и Дорис Олин. [33] Во втором аргументе мы считаем суммы денег в двух конвертах фиксированными; варьируется то, какой из них сначала дается игроку. Поскольку это был произвольный и физический выбор, контрфактический мир , в котором игрок контрафактно получил другой конверт по сравнению с тем, который ему фактически (фактически) дали, является весьма значимым контрфактическим миром, и, следовательно, сравнение между выигрышами и потерями в двух миры имеют смысл. На это сравнение однозначно указывает описание задачи, в которой сначала в два конверта кладут две суммы денег, и только после этого произвольно выбирают одну и отдают игроку. Однако в первом аргументе мы считаем сумму денег в конверте, впервые переданном игроку, фиксированной, и рассматриваем ситуации, когда второй конверт содержит половину или вдвое больше этой суммы. Это был бы разумный контрфактический мир, если бы на самом деле конверты были заполнены следующим образом: сначала некоторая сумма денег помещается в конкретный конверт, который будет передан игроку; и, во-вторых, в результате какого-то произвольного процесса другой конверт заполняется (произвольно или случайно) либо двойной, либо половиной этой суммы денег.
Бён-Ук Йи, с другой стороны, утверждает, что сравнение суммы, которую вы выиграете, если вы выиграете от перехода, с суммой, которую вы потеряете, если вы потеряете при переходе, является бессмысленным занятием с самого начала. [34] Согласно его анализу, все три импликации (переключиться, безразлично, не переключаться) неверны. Он подробно анализирует аргументы Смалляна, показывая, что предпринимаются промежуточные шаги, и точно указывает, где сделан неправильный вывод согласно его формализации контрфактического вывода. Важным отличием от анализа Чейза является то, что он не принимает во внимание ту часть истории, где нам говорят, что конверт, называемый конвертом А, определяется совершенно случайно. Таким образом, Чейз возвращает вероятность в описание задачи, чтобы сделать вывод, что аргументы 1 и 3 неверны, аргумент 2 верен, в то время как Йи сохраняет «задачу двух конвертов без вероятности» совершенно свободной от вероятности и приходит к выводу, что не существует никаких причины предпочитать какое-либо действие. Это соответствует точке зрения Альберса и др., согласно которой без фактора вероятности в любом случае невозможно утверждать, что одно действие лучше другого.
Блисс утверждает, что источник парадокса заключается в том, что когда кто-то ошибочно верит в возможность более крупного выигрыша, которого на самом деле не существует, он ошибается в большей степени, чем когда он верит в возможность меньшего выигрыша, который действительно существует. на самом деле не существует. [35] Если, например, конверты содержали 5,00 и 10,00 долларов США соответственно, игрок, открывший конверт с 10,00 долларами, ожидал бы возможности выплаты 20,00 долларов, которой просто не существует. Если бы этот игрок вместо этого открыл конверт в 5 долларов, он бы поверил в возможность выплаты 2,50 доллара, что представляет собой меньшее отклонение от истинной стоимости; это приводит к парадоксальному несоответствию.
Альберс, Кои и Шаафсма считают, что без добавления вероятностных (или других) компонентов к проблеме [18] Аргументы Смалляна в любом случае не дают никаких оснований менять или не менять. Таким образом, никакого парадокса нет. Такое пренебрежительное отношение распространено среди авторов, занимающихся вероятностями и экономикой: парадокс Смалляна возникает именно потому, что он не принимает во внимание вероятность или полезность.
Условное переключение
[ редактировать ]В качестве расширения проблемы рассмотрим случай, когда игроку разрешено просмотреть конверт А, прежде чем решить, следует ли переключиться. В этой задаче «условного переключения» часто можно получить выигрыш по сравнению со стратегией «никогда не переключаться» в зависимости от распределения вероятностей конвертов. [36]
История парадокса
[ редактировать ]Парадокс конверта восходит как минимум к 1953 году, когда бельгийский математик Морис Крайчик предложил головоломку, в своей книге «Развлекательная математика» касающуюся двух одинаково богатых мужчин, которые встречаются и сравнивают свои красивые галстуки, подарки своих жен, задаваясь вопросом, какой галстук на самом деле стоит больше денег. Он также предлагает вариант, в котором двое мужчин сравнивают содержимое своих кошельков. Он предполагает, что каждый кошелек с равной вероятностью может содержать от 1 до некоторого большого числа х пенни — общее количество пенни, отчеканенных к настоящему моменту. Мужчины не заглядывают в свои сумочки, а ищут причины, по которым им следует переключиться. Он не объясняет, в чем заключается ошибка в их рассуждениях. Неясно, появлялась ли эта головоломка в более раннем издании его книги 1942 года. Он также упоминается в книге 1953 года по элементарной математике и математическим головоломкам математика Джона Эденсора Литтлвуда , который приписал его физику Эрвину Шредингеру , где речь идет о колоде карт, на каждой карте написано два числа, игрок получает увидеть случайную сторону случайной карты, и вопрос в том, следует ли переворачивать карту. Колода карт Литтлвуда бесконечно велика, и его парадокс — это парадокс неправильного априорного распределения.
Мартин Гарднер популяризировал головоломку Крайчика в своей книге 1982 года «Ага!» Попался , в виде игры-кошелька:
Два человека, одинаково богатые, встречаются, чтобы сравнить содержимое своих кошельков. Каждый из них не знает о содержимом двух кошельков. Игра заключается в следующем: у кого меньше денег, тот получает содержимое кошелька другого (в случае равенства сумм ничего не происходит). Один из двух мужчин может рассуждать: «У меня в кошельке есть сумма А. Это максимум, который я могу проиграть. Если я выиграю (вероятность 0,5), то сумма, которая будет у меня в распоряжении в конце игры. будет больше 2 А , поэтому игра мне выгодна». Другой человек может рассуждать точно так же. На самом деле, благодаря симметрии, игра честная. Где ошибка в рассуждениях каждого человека?
— Мартин Гарднер , Ага! Попался
Гарднер признался, что, хотя он, как и Крайчик, мог дать здравый анализ, ведущий к правильному ответу (нет смысла переключаться), он не мог четко указать, что не так с обоснованием перехода, и Крайчик не дал никаких объяснений. любая помощь в этом направлении.
В 1988 и 1989 годах Барри Нейлбафф представил две разные задачи с двумя конвертами, каждая из которых содержит в два раза больше, чем в другой, и каждая с вычислением среднего значения 5 A /4. В первой статье просто представлены две проблемы. Во втором обсуждаются многие решения для них обоих. Вторая из двух его проблем в настоящее время является более распространенной и представлена в этой статье. Согласно этой версии, сначала заполняются два конверта, затем случайным образом выбирается один и называется Конверт А. Мартин Гарднер Эту же версию независимо упомянул в своей книге 1989 года «Плитки Пенроуза к шифрам с потайными дверями и возвращение доктора Матрицы» . В асимметричном варианте Барри Нейлбаффа, часто известном как проблема Али-Бабы, сначала заполняется один конверт, называемый Конверт А, и передается Али. Затем бросают честную монету, чтобы решить, должен ли конверт Б содержать половину или вдвое больше этой суммы, и только после этого отдают Бабе.
Брум в 1995 году назвал распределение вероятностей «парадоксальным», если для любой заданной суммы x в первом конверте ожидание другого конверта, обусловленного x, больше, чем x . В литературе содержатся десятки комментариев по этой проблеме, в большинстве из которых отмечается, что распределение конечных значений может иметь бесконечное математическое ожидание. [37]
См. также
[ редактировать ]Примечания и ссылки
[ редактировать ]- ^ Перейти обратно: а б Фальк, Рума (2008). «Парадокс неумолимого обмена». Преподавание статистики . 30 (3): 86–88. дои : 10.1111/j.1467-9639.2008.00318.x . S2CID 120397860 .
- ^ Полный список опубликованных и неопубликованных источников в хронологическом порядке можно найти на странице обсуждения .
- ^ Маркосян, Нед (2011). «Простое решение проблемы двух конвертов» . Логос и эпистема . II (3): 347–57. doi : 10.5840/logos-episteme20112318 .
- ^ Макдоннелл, Марк Д; Грант, Алекс Дж; Земля, Ингмар; Велламби, Бадри Н; Эбботт, Дерек; Левер, Кен (2011). «Выигрыш от проблемы двух конвертов за счет асимметрии информации: о неоптимальности рандомизированного переключения». Труды Королевского общества А. 467 (2134): 2825–2851. Бибкод : 2011RSPSA.467.2825M . дои : 10.1098/rspa.2010.0541 .
- ^ Священник, Грэм; Рестолл, Грег (2007), «Конверты и безразличие» (PDF) , Диалоги, логика и другие странные вещи , Публикации колледжа: 135–140
- ^ Священник, Грэм; Рестолл, Грег (2007), «Конверты и безразличие» (PDF) , Диалоги, логика и другие странные вещи , Публикации колледжа: 135–140
- ^ МакГрю, Тимоти; Шир, Дэвид; Сильверстайн, Гарри (1997). «Проблема двух конвертов решена» . Анализ . 57 (1): 28–33. дои : 10.1093/analys/57.1.28 .
- ^ Швицгебе, Эрик; Девер, Джош (2008), «Парадокс двух конвертов и использование переменных в формуле ожидания» (PDF) , Sorites : 135–140
- ^ Перейти обратно: а б Цикогианнопулос, Панайотис (2012). «Вариации задачи о двух конвертах». Математические обзоры (на греческом языке). arXiv : 1411.2823 . Бибкод : 2014arXiv1411.2823T .
- ^ Священник, Грэм; Рестолл, Грег (2007), «Конверты и безразличие» (PDF) , Диалоги, логика и другие странные вещи , Публикации колледжа: 135–140
- ^ Перейти обратно: а б с Никерсон, Раймонд С.; Фальк, Рума (1 мая 2006 г.). «Парадокс обмена: вероятностный и когнитивный анализ психологической загадки» . Мышление и рассуждение . 12 (2): 181–213. дои : 10.1080/13576500500200049 . ISSN 1354-6783 . S2CID 143472998 .
- ^ Нейлебафф, Барри (весна 1988 г.). «Головоломки: сидр в ухе, продолжающаяся дилемма, последнее будет первым и многое другое» . Журнал экономических перспектив . 2 (2): 149–156. дои : 10.1257/jep.2.2.149 . и Гарднер, Мартин (1989) Плитки Пенроуза для шифров с люками: и возвращение доктора Матрицы.
- ^ Перейти обратно: а б с д Фальк, Рума; Конольд, Клиффорд (1992). «Психология вероятности обучения» (PDF) . Статистика XXI века – через Математическая ассоциация Америки.
- ^ Перейти обратно: а б с Нейлебафф, Барри (1989), «Загадки: конверт другого человека всегда зеленее», Journal of Economic Perspectives , 3 (1): 171–181, doi : 10.1257/jep.3.1.171 .
- ^ Перейти обратно: а б Кристенсен, Р; Уттс, Дж. (1992), «Байесовское разрешение «парадокса обмена» », The American Statistician , 46 (4): 274–76, doi : 10.1080/00031305.1992.10475902 .
- ^ Блахман, Нью-Мексико; Кристенсен, Р; Уттс, Дж (1996). «Письма в редакцию». Американский статистик . 50 (1): 98–99. дои : 10.1080/00031305.1996.10473551 .
- ^ Альберс, Каспер (март 2003 г.), «2. Попытка решить проблему двух конвертов», Распределительный вывод: пределы разума (тезис) .
- ^ Перейти обратно: а б Альберс, Каспер Дж; Коой, Бартелд П; Шаафсма, Виллем (2005), «Пытаясь решить проблему двух конвертов», Synthese , vol. 145, нет. 1, с. 91 .
- ^ Фальк, Рума; Никерсон, Рэймонд (2009), «Взгляд изнутри на парадокс двух конвертов», Teaching Статистика , 31 (2): 39–41, doi : 10.1111/j.1467-9639.2009.00346.x , S2CID 122078010 .
- ^ Чен, Джефф, Загадка головоломки с двумя конвертами — логический подход (онлайн-изд.), стр. 274 .
- ^ Брум, Джон (1995), «Парадокс двух конвертов», Анализ , 55 (1): 6–11, doi : 10.1093/analys/55.1.6 .
- ^ Биндер, Д.А. (1993), «Письмо редактору и ответ», The American Statistician , 47 (2): 160, doi : 10.1080/00031305.1991.10475791 .
- ^ Росс (1994), «Письмо редактору и ответ», The American Statistician , 48 (3): 267–269, doi : 10.1080/00031305.1994.10476075 .
- ^ Блахман, Нью-Мексико; Кристенсен, Р; Уттс, Дж. М. (1996), «Письмо с исправлениями к оригинальной статье», The American Statistician , 50 (1): 98–99, doi : 10.1080/00031305.1996.10473551 .
- ^ Брум, Джон (1995). «Парадокс двух конвертов». Анализ . 55 (1): 6–11. дои : 10.1093/analys/55.1.6 . Знаменитый пример правильного распределения вероятностей сумм денег в двух конвертах, для которого для всех а .
- ^ Биндер, Д.А. (1993). «Письма в редакцию». Американский статистик . 47 (2): 157–163. дои : 10.1080/00031305.1993.10475966 . Комментарий к Кристенсену и Уттсу (1992)
- ^ Перейти обратно: а б Чалмерс, Дэвид Дж. (2002). «Петербургский парадокс двух конвертов». Анализ . 62 (2): 155–157. дои : 10.1093/анализ/62.2.155 .
- ^ ДеГрут, Моррис Х. (1970). Оптимальные статистические решения . МакГроу-Хилл. п. 109.
- ^ Пауэрс, Майкл Р. (2015). «Доказательные парадоксы функции полезности для выплат с тяжелым хвостом: две поучительные задачи с двумя конвертами» . Риски . 3 (1): 26–34. дои : 10.3390/risks3010026 . hdl : 10419/167837 .
- ^ Кларк, М.; Шакель, Н. (2000). «Парадокс двух конвертов» (PDF) . Разум . 109 (435): 415–442. дои : 10.1093/mind/109.435.415 .
- ^ Смалльян, Раймонд (1992). Сатана, Кантор, бесконечность и другие умопомрачительные головоломки . Альфред А. Кнопф . стр. 189–192 . ISBN 978-0-679-40688-4 .
- ^ Чейз, Джеймс (2002). «Невероятностный парадокс двух конвертов» (PDF) . Анализ . 62 (2): 157–160. дои : 10.1093/анализ/62.2.157 .
- ^ Кац, Бернард; Олин, Дорис (2007). «Сказка о двух конвертах». Разум . 116 (464): 903–926. дои : 10.1093/mind/fzm903 .
- ^ Бён-Ук Йи (2009). «Парадокс двух конвертов без вероятности» (PDF) . Архивировано из оригинала (PDF) 29 сентября 2011 г.
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Блаженство (2012). «Краткое решение парадокса двух конвертов». arXiv : 1202.4669 [ стат.ОТ ].
- ^ Макдоннелл, доктор медицины; Эботт, Д. (2009). «Рандомизированное переключение в задаче о двух конвертах». Труды Королевского общества А. 465 (2111): 3309–3322. Бибкод : 2009RSPSA.465.3309M . дои : 10.1098/rspa.2009.0312 .
- ^ Сиверсон, Пол (1 апреля 2010 г.). «Открытие двух конвертов». Акта Аналитика . 25 (4): 479–498. дои : 10.1007/s12136-010-0096-7 . S2CID 12344371 .