Jump to content

Проблема трех заключенных

Задача трех заключенных появилась в Мартина Гарднера « Математические игры колонке » в журнале Scientific American в 1959 году. [1] [2] Математически это эквивалентно задаче Монти Холла , в которой автомобиль и коза заменены соответственно свободой и казнью. [3]

Проблема

[ редактировать ]

Трое заключенных, А, Б и С, содержатся в отдельных камерах и приговорены к смертной казни. Губернатор наугад выбрал одного из них для помилования. Начальник тюрьмы знает, кто из них помилован, но не имеет права говорить об этом. Заключенный А умоляет надзирателя сообщить ему личность одного из двоих, которых собираются казнить. «Если нужно помиловать Б, назовите мне имя С. Если нужно помиловать С, назовите мне имя Б. А если меня нужно помиловать, тайно подбросьте монетку, чтобы решить, назвать ли имя Б или С».

Надзиратель сообщает А, что Б должен быть казнен. Заключенный А доволен, потому что считает, что его вероятность выжить возросла с 1 / 3 до 1 / 2 , как сейчас между ним и C. Заключенный А тайно сообщает новость C, который считает, что шансы A на помилование не изменились в 1 / 3 , но он доволен, потому что его собственный шанс увеличился до 2 / 3 . Кто из заключенных прав?

Ответ заключается в том, что заключенный А не получил никакой информации о своей судьбе, поскольку он уже знал, что надзиратель назовет ему чужое имя. Заключенный А, до получения известия от начальника тюрьмы, оценивает свои шансы на помилование как 1 / 3 , то же самое, что и B, и C. Как говорит надзиратель, B будет казнен, либо потому, что C будет помилован ( 1/3 шанс) , или А будет помилован ( 1 / 3 шанс), и монета, чтобы решить, назвать ли имя B или C, которую подбросил надзиратель, выпала B ( 1/2 ; шанс в целом 1 / 2 × 1 / 3 = 1/6 шанс , что B был назван, потому что A будет помилован). Следовательно, после того, как он узнал, что B будет казнен, оценка шансов A на помилование вдвое меньше, чем у C. Это означает, что его шансы на помилование, теперь зная, что B не будет помилован, снова равны 1/3 , но C имеет 2/3 шанс быть . помилованным

Объяснение, приведенное выше, можно резюмировать в следующей таблице. Поскольку А спрашивает надзирателя, он может ответить только Б или С, чтобы его казнили (или «не помиловали»).

Быть помилованным Надзиратель: «не Б» Надзиратель: «не С» Сумма
А 1/6 1/6 1/3
Б 0 1/3 1/3
С 1/3 0 1/3

Поскольку надзиратель ответил, что Б не будет помилован, решение исходит из второй колонки «не Б». Похоже, что шансы на помилование А против С составляют 1:2.

Математическая формулировка

[ редактировать ]

Вызов , и события, при которых соответствующий заключенный будет помилован, и Если надзиратель сообщает А, что заключенный Б должен быть казнен, то, используя теорему Байеса , апостериорная вероятность помилования А равна: [4]

С другой стороны, вероятность того, что C будет помилован, равна:

Решающее различие, делающее A и C неравными, заключается в том, что но . Если А будет помилован, надзиратель может сказать А, что казнить следует либо Б, либо С, и, следовательно, ; тогда как, если C будет помилован, надзиратель может только сказать A, что B казнен, поэтому .

Интуитивное объяснение

[ редактировать ]

У заключенного А есть только 1/3 на шанс помилование. Знание того, будет ли казнен B или C, не меняет его шансов. Узнав, что Б будет казнен, заключенный А понимает, что, если он сам не получит помилования, то оно должно быть направлено только к С. Это означает, что у С есть шанс 2/3 получить помилование. Это сравнимо с проблемой Монти Холла .

Перечень возможных случаев

[ редактировать ]

Могут возникнуть следующие сценарии:

  1. А помилован, и надзиратель предлагает казнить Б: 1 / 3 × 1 / 2 = 1 / 6 случаев
  2. А помилован, и надзиратель предлагает казнить С: 1 / 3 × 1 / 2 = 1 / 6 случаев
  3. Б помилован, и надзиратель предлагает казнить С: 1 / 3 случаев
  4. C помилован, и надзиратель предлагает казнить B: 1 / 3 случаев

При условии, что надзиратель будет выбирать случайным образом, в 1/3 времени , в течение которого А подлежит помилованию, 1/2 шанс , что он скажет Б и 1/2 шанс , что он скажет C. Это означает, что в целом, 1 / 6 времени ( 1 / 3 [что А помилован] × 1 / 2 [этот надзиратель говорит B]), надзиратель скажет B, потому что A будет помилован, и 1 / 6 времени ( 1 / 3 [что А помилован] × 1 / 2 [этот надзиратель говорит C]) он скажет C, потому что A помилован. Это в сумме составляет 1 / 3 времени ( 1 / 6 + 1 / 6 ) А прощается, и это правда.

Теперь ясно, что если надзиратель ответит Б на А ( 1/2 то всех случаев), 1/3 и только времени, когда C будет помилован, а A все равно будет казнен (случай 4), 1/6 ) . времени помилования А (случай 1 Следовательно, шансы C равны ( 1 / 3 )/( 1 / 2 ) = 2/3 и ( А равны 1 / 6 )/( 1 / 2 ) = 1 / 3 .

Ключом к этой проблеме является то, что надзиратель может не назвать имя заключенного, который будет помилован. Если мы устраним это требование, это может продемонстрировать исходную проблему другим способом. Единственное изменение в этом примере заключается в том, что заключенный А просит надзирателя раскрыть судьбу одного из других заключенных (не указывая, кто будет казнен). В этом случае надзиратель подбрасывает монету и выбирает один из B и C, чтобы раскрыть судьбу. Случаи следующие:

  1. А помилован, надзиратель говорит: Б казнён( 1 / 6 )
  2. Помилованный, надзиратель говорит: C казнён( 1 / 6 )
  3. Б помилован, надзиратель говорит: Б помилован ( 1 / 6 )
  4. Б помилован, надзиратель говорит: С казнен ( 1 / 6 )
  5. C помилован, надзиратель говорит: B казнен ( 1 / 6 )
  6. C помилован, надзиратель говорит: C помилован ( 1 / 6 )

Каждый сценарий имеет 1/6 вероятность . Исходную задачу о трех заключенных можно рассматривать в следующем свете: у надзирателя в этой задаче все еще есть шесть ящиков, в каждом из которых есть 1/6 возникновения . вероятность Однако надзиратель в первоначальном случае не может раскрыть судьбу помилованного заключенного. Таким образом, например, в случае 3, поскольку сказать «Б помилован» невозможно, надзиратель вместо этого говорит «С казнен» (что делает его таким же, как в случае 4). Это оставляет случаи 4 и 5 каждый с 1/3 . раньше вероятность возникновения и оставляет нас с той же вероятностью, что и

Почему парадокс?

[ редактировать ]

Склонность людей давать ответ 1/2, скорее всего, связана с тенденцией игнорировать контекст, который может показаться незначительным. Например, то, как вопрос задан надзирателю, может повлиять на ответ. Это можно показать, рассмотрев модифицированный случай, когда и все остальное, касающееся проблемы, остается прежним. [4] Еще раз воспользуемся теоремой Байеса:

Однако если А просто спросит, будет ли казнен Б, и надзиратель ответит «да», вероятность того, что А будет помилован, составит:

[4]

Аналогичное предположение состоит в том, что А планирует заранее запросить эту информацию у начальника тюрьмы. Аналогичный вышеописанному случай возникает, если А не планирует ничего спрашивать у надзирателя, а надзиратель просто сообщает ему, что он будет казнить Б. [5]

Еще одно предположение, которое, вероятно, упускают из виду, заключается в том, что у начальника тюрьмы есть вероятностный выбор. Давайте определим как условная вероятность того, что надзиратель назовет B при условии, что C будет казнен. Условная вероятность тогда можно выразить как: [6]

Если мы предположим, что , то есть мы не учитываем, что надзиратель делает вероятностный выбор, тогда . Однако реальность проблемы в том, что надзиратель подбрасывает монетку ( ), так . [5]

Джудея Перл (1988) использовал вариант этого примера, чтобы продемонстрировать, что обновление убеждений должно зависеть не только от наблюдаемых фактов, но и от эксперимента (т. е. запроса), который привел к этим фактам. [7]

[ редактировать ]
  1. ^ Гарднер, Мартин (октябрь 1959 г.). «Математические игры: задачи, связанные с вопросами вероятности и неоднозначности». Научный американец . 201 (4): 174–182. дои : 10.1038/scientificamerican1059-174 .
  2. ^ Гарднер, Мартин (1959). «Математические игры: как три современных математика опровергли знаменитую гипотезу Леонарда Эйлера». Научный американец . 201 (5): 188. doi : 10.1038/scientificamerican1159-181 .
  3. ^ Бейли, Херб (2000). «Монти Холл использует смешанную стратегию». Журнал «Математика» . 73 (2): 135–141. JSTOR   2691085 .
  4. ^ Перейти обратно: а б с Симодзё, Синсуке; Итикава, Синъити (август 1990 г.). «Интуитивные рассуждения о вероятности: Теоретический и экспериментальный анализ «проблемы трех заключенных» ». Познание . 36 (2): 205. дои : 10.1016/0010-0277(89)90012-7 . ПМИД   2752704 . S2CID   45658299 .
  5. ^ Перейти обратно: а б Векслер, Серджио; Эстевес, Л.Г.; Симонис, А.; Пейшото, К. (февраль 2005 г.). «Безразличие, нейтралитет и информативность: обобщение парадокса трех узников» . Синтезируйте . 143 (3): 255–272. дои : 10.1007/s11229-005-7016-1 . JSTOR   20118537 . S2CID   16773272 . Проверено 15 декабря 2021 г.
  6. ^ Биллингсли, Патрик (1995). Вероятность и мера . Серия Уайли по вероятности и математической статистике (третье издание оригинального издания 1979 г.). Нью-Йорк: John Wiley & Sons, Inc., упражнение 33.3, стр. 441 и 576. ISBN.  0-471-00710-2 . МР   1324786 .
  7. ^ Перл, Дж. (1988). Вероятностные рассуждения в интеллектуальных системах: сети правдоподобного вывода (первое изд.). Сан-Матео, Калифорния: Морган Кауфманн.

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ee6ff55b45d216778dbd9ccf4b138075__1710279900
URL1:https://arc.ask3.ru/arc/aa/ee/75/ee6ff55b45d216778dbd9ccf4b138075.html
Заголовок, (Title) документа по адресу, URL1:
Three prisoners problem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)