Задача 100 заключенных
Задача о 100 заключенных — математическая задача теории вероятностей и комбинаторики . В этой задаче 100 пронумерованных заключенных должны найти свои номера в одном из 100 ящиков, чтобы выжить. Правила гласят, что каждый заключенный может открывать только 50 ящиков и не может общаться с другими заключенными. На первый взгляд ситуация кажется безнадежной, но продуманная стратегия дает заключенным реальный шанс на выживание.
Анна Галь и Питер Бро Мильтерсен впервые предложили эту проблему в 2003 году.
Проблема
[ редактировать ]Проблема 100 заключенных имеет в литературе разные интерпретации. Следующая версия принадлежит Филиппу Флажоле и Роберту Седжвику : [1]
- Директор тюрьмы предлагает 100 заключенным, приговоренным к смертной казни, пронумерованным от 1 до 100, последний шанс. В комнате есть шкаф со 100 ящиками. В каждый закрытый ящик директор случайным образом кладет по одному номеру заключенного. Заключенные входят в комнату один за другим. Каждый заключенный может открыть и просмотреть 50 ящиков в любом порядке. После этого ящики снова закрываются. Если в ходе обыска каждый заключенный найдет свой номер в одном из ящиков, все заключенные будут помилованы. Если хотя бы один заключенный не найдет свой номер, все заключенные погибнут. Прежде чем первый заключенный войдет в комнату, заключенные могут обсудить стратегию, но не могут общаться, когда первый заключенный входит, чтобы заглянуть в ящики. Какова лучшая стратегия заключенных?
выберет 50 ящиков Если каждый заключенный самостоятельно и случайным образом , вероятность того, что один заключенный найдет их число, составит 50%. Вероятность того, что все заключенные найдут свои номера, является произведением одиночных вероятностей, то есть ( 1 / 2 ) 100 ≈ 0,000 000 000 000 000 000 000 000 000 0008 , исчезающе малое число. Ситуация кажется безнадежной.
Решение
[ редактировать ]Стратегия
[ редактировать ]Удивительно, но существует стратегия, обеспечивающая вероятность выживания более 30%. Залог успеха в том, что заключенным не нужно заранее решать, какие ящики открывать. Каждый заключенный может использовать информацию, полученную из содержимого каждого ящика, который он уже открыл, чтобы решить, какой из них открыть следующим. Еще одно важное наблюдение состоит в том, что таким образом успех одного заключенного не зависит от успеха других заключенных, поскольку все они зависят от того, как распределены числа. [2]
Для описания стратегии не только заключенные, но и ящики пронумерованы от 1 до 100; например, ряд за рядом, начиная с верхнего левого ящика. Стратегия теперь следующая: [3]
- Каждый заключенный сначала открывает ящик, помеченный своим номером.
- Если в этом ящике содержится их номер, значит, они готовы и прошли успешно.
- В противном случае в ящике содержится номер другого заключенного, и затем они открывают ящик, отмеченный этим номером.
- Заключенный повторяет шаги 2 и 3 до тех пор, пока не найдет свой номер, или не потерпит неудачу, потому что номер не найден в первых пятидесяти открытых ящиках.
Если бы заключенный мог продолжать таким образом бесконечно, он неизбежно вернулся бы к тому ящику, с которого начал, образуя цикл перестановок (см. Ниже ). Начав со своего номера, заключенный гарантирует, что он находится в определенном цикле ящиков, содержащем его номер. Единственный вопрос заключается в том, длиннее ли какой-либо цикл более пятидесяти ящиков - и только один цикл может быть слишком длинным, поскольку максимум один может составлять более половины от общего числа ящиков.
Примеры
[ редактировать ]Причина, по которой эта стратегия является многообещающей, иллюстрируется следующим примером с использованием 8 заключенных и ящиков, где каждый заключенный может открыть 4 ящика. Начальник тюрьмы разложил номера заключенных по ящикам следующим образом:
количество ящиков 1 2 3 4 5 6 7 8 количество заключенных 7 4 6 8 1 3 5 2
Теперь заключенные действуют следующим образом:
- Заключенный 1 сначала открывает ящик 1 и находит номер 7. Затем он открывает ящик 7 и находит номер 5. Затем он открывает ящик 5, где находит свой номер и добивается успеха.
- Заключенный 2 открывает ящики 2, 4 и 8 в этом порядке. В последнем ящике они находят свой номер — 2.
- Заключенный 3 открывает ящики 3 и 6, где находит свой номер.
- Заключенный 4 открывает ящики 4, 8 и 2, где находит свой номер. Это тот же цикл, с которым столкнулся заключенный 2 и с которым столкнется заключенный 8. Каждый из этих заключенных найдет свой номер в третьем открытом ящике.
- Заключенные с 5 по 7 также найдут свои номера аналогичным образом.
В этом случае все заключенные узнают свои номера. Однако это не всегда так. Например, небольшое изменение количества перепутанных ящиков 5 и 8 приведет к тому, что заключенный 1 потерпит неудачу после открытия 1, 7, 5 и 2 (и не нахождения своего собственного номера):
количество ящиков 1 2 3 4 5 6 7 8 количество заключенных 7 4 6 8 2 3 5 1
А в следующей схеме заключенный 1 открывает ящики 1, 3, 7 и 4, и в этот момент им приходится безуспешно останавливаться:
количество ящиков 1 2 3 4 5 6 7 8 количество заключенных 3 1 7 5 8 6 4 2
Действительно, все заключенные, за исключением шестерых (которые добиваются прямого успеха), терпят неудачу.
Представление перестановок
[ редактировать ]Распределение директором тюрьмы номеров заключенных по ящикам математически можно описать как перестановку чисел от 1 до 100. Такая перестановка представляет собой взаимно однозначное отображение набора натуральных чисел от 1 до 100 в себя. Последовательность чисел, которая после многократного применения перестановки возвращается к первому числу, называется циклом перестановки. Любую перестановку можно разложить на непересекающиеся циклы, то есть циклы, не имеющие общих элементов. Перестановку первого примера выше можно записать в обозначениях цикла как
и, таким образом, состоит из двух циклов длины 3 и одного цикла длины 2. Перестановка третьего примера соответственно имеет вид
и состоит из цикла длины 7 и цикла длины 1. Обозначение цикла не уникально, поскольку цикл длины можно написать в разными способами в зависимости от стартового номера цикла. При открытии ящиков с использованием описанной выше стратегии каждый заключенный выполняет один цикл, который всегда заканчивается его собственным номером. В случае восьми заключенных эта стратегия следования за циклом успешна тогда и только тогда, когда длина самого длинного цикла перестановки не превышает 4. Если перестановка содержит цикл длиной 5 или более, все заключенные, номера которых лежат в такой цикл не достигает своего числа после четырех шагов.
Вероятность успеха
[ редактировать ]В исходной задаче 100 заключенных добьются успеха, если длина самого длинного цикла перестановки не превышает 50. Таким образом, вероятность их выживания равна вероятности того, что случайная перестановка чисел от 1 до 100 не содержит циклов длины большей чем 50. Эта вероятность определяется следующим.
Перестановка чисел от 1 до 100 может содержать не более одного цикла длиной . Есть точно способы выбора чисел такого цикла (см. сочетание ). Внутри этого цикла эти числа можно расположить в способы, поскольку существуют перестановки для представления различных циклов длины из-за циклической симметрии. Остальные числа можно расположить в пути. Следовательно, количество перестановок чисел от 1 до 100 с циклом длины равно
Вероятность того, что ( равномерно распределенная ) случайная перестановка не содержит циклов длиной более 50, рассчитывается по формуле для одиночных событий и формуле для дополнительных событий, определяемой следующим образом:
где это -й номер гармоники . Таким образом, при использовании стратегии следования циклу заключенные выживают в удивительных 31% случаев. [3]
Асимптотика
[ редактировать ]Если вместо 100 заключенных считаются, где произвольное натуральное число, вероятность выживания заключенных при использовании стратегии следования циклу определяется выражением
С постоянной Эйлера-Машерони , для
имеет место, что приводит к асимптотической вероятности выживания
Поскольку последовательность вероятностей монотонно убывает , заключенные выживают при использовании стратегии следования циклу более чем в 30% случаев независимо от количества заключенных. [3]
Оптимальность
[ редактировать ]В 2006 году Юджин Кертин и Макс Варшауэр доказали оптимальность стратегии следования за циклом. Доказательство основано на эквиваленте аналогичной задачи, в которой всем заключенным разрешено присутствовать в комнате и наблюдать за открытием ящиков. Математически эта эквивалентность основана на лемме о переходе Фоаты , взаимно однозначном соответствии (канонического) обозначения цикла и однострочного обозначения перестановок. Во второй задаче вероятность выживания не зависит от выбранной стратегии и равна вероятности выживания в исходной задаче со стратегией следования по циклу. Поскольку произвольная стратегия для исходной задачи также может быть применена ко второй задаче, но не может обеспечить там более высокую вероятность выживания, стратегия следования по циклу должна быть оптимальной. [2]
История
[ редактировать ]Проблема 100 заключенных была впервые рассмотрена в 2003 году Анной Галь и Питером Бро Мильтерсеном в материалах 30- го Международного коллоквиума по автоматам, языкам и программированию ( ICALP ). [4] В их версии игрок А (начальник тюрьмы) случайным образом раскрашивает полоски бумаги с именами игроков команды Б (заключенных) в красный или синий цвет и кладет каждую полоску в отдельную коробку. Некоторые поля могут быть пустыми (см. ниже ). Для победы своей команды каждый игрок команды Б должен правильно угадать свой цвет после открытия половины коробок. [4] Первоначально Галь и Мильтерсен предположили, что вероятность выигрыша быстро стремится к нулю с увеличением числа игроков. Однако Свен Скюм, коллега из Орхусского университета , обратил внимание на стратегию следования циклу для случая этой задачи, когда пустых ящиков нет. Поиск этой стратегии был оставлен открытым в качестве упражнения в публикации. Статья была удостоена награды за лучшую работу. [2]
Весной 2004 года задача появилась в Джо Бюлера и Элвина Берлекэмпа колонке-головоломке в ежеквартальном журнале The Emissary of the Mathematical Sciences Research Institute . Таким образом, авторы заменили коробки на ПЗУ , а цветные полоски бумаги — на подписанные номера. Авторы отметили, что вероятность выигрыша может быть увеличена и в том случае, если участники команды не найдут свои номера. Если данный ответ является произведением всех найденных знаков и если длина самого длинного цикла равна половине (четного) числа игроков плюс один, то все члены команды в этом цикле либо все угадывают неправильно, либо все угадывают правильно. Даже если такое расширение стратегии предлагает видимое улучшение для небольшого числа игроков, оно становится незначительным, когда число игроков становится большим. [5]
В последующие годы задача вошла в математическую литературу, где ее формулировали по-разному, например, с картами на столе. [6] или кошельки в шкафчиках ( загадка шкафчика ). [2] В форме задачи пленника она была поставлена в 2006 году Кристофом Пёппе в журнале Spektrum der Wissenschaft и Питером Винклером в College Mathematics Journal . [7] [8] С небольшими изменениями эту форму переняли Филипп Флажоле, Роберт Седжвик и Ричард П. Стэнли в своих учебниках по комбинаторике. [1] [3] Задача, или загадка, вместе с подробным объяснением решения была представлена каналом Veritasium в видеоролике на YouTube в 2023 году .
Варианты
[ редактировать ]Пустые коробки
[ редактировать ]Сначала Галь и Мильтерсен рассмотрели в своей статье случай, когда количество ящиков в два раза превышает количество членов команды, а половина ящиков пуста. Это более сложная проблема, поскольку пустые ячейки никуда не ведут и, следовательно, стратегия следования за циклом не может быть применена. Вопрос о том, стремится ли в этом случае вероятность победы к нулю с ростом числа членов команды, остается открытым. [4]
В 2005 году Навин Гоял и Майкл Сакс разработали стратегию для команды B, основанную на стратегии следования циклу для более общей задачи, в которой доля пустых коробок, а также доля коробок, которые может открыть каждый член команды, являются переменными. Вероятность выигрыша в этом случае все еще стремится к нулю, но медленнее, чем предполагали Гал и Мильтерсен. Если количество членов команды и доля открываемых коробок фиксированы, вероятность победы остается строго больше нуля при добавлении большего количества пустых коробок. [9]
Дэвид Эвис и Энн Бродбент рассмотрели в 2009 году квантово-теоретический вариант, в котором команда Б уверенно побеждает. [10]
Злонамеренный директор
[ редактировать ]В случае, если директору тюрьмы не нужно распределять номера по ящикам случайным образом, и он понимает, что заключенные могут применять вышеупомянутую стратегию, и угадывает нумерацию ячеек, которые заключенные будут применять (например, номера, указанные на ящиках), он может сорвать стратегию. Для этого им достаточно добиться того, чтобы их распределение номеров заключенных по ящикам представляло собой перестановку с циклом длиной больше 50. Заключенные, в свою очередь, могут противодействовать этому, договариваясь между собой о конкретной случайной нумерации ящиков, при условии, что директор этого не подслушает или не потрудится отреагировать заменой цифр в ящиках до того, как впустят заключенных. [11]
Один заключенный может внести одно изменение
[ редактировать ]В случае, если один заключенный сможет первым войти в комнату, осмотреть все ящики , а затем поменять содержимое двух ящиков, все заключенные выживут. Это так, поскольку любой цикл длиной больше 50 можно прервать, так что можно гарантировать, что все циклы имеют длину не более 50.
Для достаточно большого количества заключенных , они могут обеспечить свой побег, открыв значительно меньше половины ящиков. В частности, каждому заключенному необходимо открыть только ящики для обеспечения побега всех заключенных. [12]
Любой заключенный, нашедший свой номер, освобождается.
[ редактировать ]В варианте, когда любой заключенный, нашедший свой номер, оказывается на свободе, ожидаемая вероятность выживания человека при случайной перестановке выглядит следующим образом:
Без стратегии:
Со стратегией исходной проблемы:
Примечательно, что хотя мы получаем одинаковые ожидаемые значения, они происходят из очень разных распределений. При использовании второй стратегии некоторым заключенным просто суждено умереть или выжить при определенной расстановке сил, а при использовании первой стратегии (т. е. отсутствия стратегии) существует «действительно» шанс 1/2 для каждой перестановки.
Проблема Монти Холла
[ редактировать ]В 2009 году Адам С. Ландсберг предложил следующий более простой вариант задачи о 100 заключенных, основанный на известной задаче Монти Холла : [13]
- За тремя закрытыми дверями случайным образом распределены машина, ключи от машины и коза. Играют два игрока: первый должен найти машину, второй — ключи от машины. Только если оба игрока добьются успеха, они смогут поехать на машине домой. Первый игрок входит в комнату и может последовательно открыть две двери из трех. Если они успешны, двери снова закрываются и в комнату входит второй игрок. Второй игрок также может открыть две из трех дверей, но не может ни в какой форме общаться с первым игроком. Какова вероятность победы, если оба игрока действуют оптимально?
Если игроки выбирают свои двери случайным образом, вероятность выигрыша составляет всего 4/9 ( около 44% ) . Однако оптимальная стратегия заключается в следующем:
- Игрок 1 первым открывает дверь 1. Если машина находится за дверью, игрок добился успеха. Если ключи находились за дверью, игрок затем открывает дверь 2; если вместо этого коза была за дверью, игрок затем открывает дверь 3.
- Игрок 2 первым открывает дверь 2. Если ключи находятся за дверью, игрок добился успеха. Если коза была за дверью, игрок затем открывает дверь 3; тогда как, если машина находилась за дверью, игрок затем открывает дверь 1.
В шести возможных распределениях машины, ключей и козла за тремя дверями игроки открывают следующие двери (в зеленых случаях игрок добился успеха):
Машина — Ключи — Коза Автомобиль — Коза — Ключи Ключи — Машина — Коза Ключи — Коза — Автомобиль Коза — Машина — Ключи Коза — Ключи — Автомобиль Игрок 1 Дверь 1: Автомобиль Дверь 1: Автомобиль Дверь 1: Ключи
Дверь 2: АвтомобильДверь 1: Ключи
Дверь 2: КозаДверь 1: Коза
Дверь 3: КлючиДверь 1: Коза
Дверь 3: АвтомобильИгрок 2 Дверь 2: Ключи Дверь 2: Коза
Дверь 3: КлючиДверь 2: Автомобиль
Дверь 1: Ключи(Дверь 2: Коза)
(Дверь 3: Автомобиль)(Дверь 2: Автомобиль)
(Дверь 1: Коза)Дверь 2: Ключи
Успех стратегии основан на построении корреляции между успехами и неудачами двух игроков. Здесь вероятность выигрыша равна 2 / 3 , что является оптимальным, поскольку первый игрок не может иметь более высокую вероятность выигрыша, чем эта. [13] В дальнейшем варианте три приза спрятаны за тремя дверями, и три игрока должны самостоятельно найти назначенные им призы с двух попыток. В этом случае вероятность выигрыша также равна 2 / 3 при использовании оптимальной стратегии. [14]
Нечетное количество попыток
[ редактировать ]Вместо того, чтобы находить их количество в первых 50 попытках, тест может заключаться в поиске числа в 50 попытках с нечетными номерами: 1, 3, ..., 97, 99 . Любой заключенный имеет 50% шанс найти свой номер при попытке с нечетным номером. Основная стратегия будет работать для всех заключенных, если перестановка заключенных содержит только циклы нечетной длины. Для 100 заключенных вероятность того, что все добьются успеха, используя основную стратегию, составляет примерно 7,9589%, что существенно выше вероятности (1/2). 100 это было бы получено, если бы каждый заключенный открывал ящики самостоятельно и наугад.
См. также
[ редактировать ]- Дилемма заключенного
- Проблема трех заключенных
- Неожиданный парадокс зависания
- Статистика случайных перестановок
- Постоянная Голомба – Дикмана
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Филипп Флажоле, Роберт Седжвик (2009), Аналитическая комбинаторика , Издательство Кембриджского университета, стр. 124
- ^ Перейти обратно: а б с д Юджин Кертин, Макс Варшауэр (2006), «Загадка шкафчика», Mathematical Intelligencer , 28 : 28–31, doi : 10.1007/BF02986999 , S2CID 123089718
- ^ Перейти обратно: а б с д Ричард П. Стэнли (2013), Алгебраическая комбинаторика: прогулки, деревья, таблицы и многое другое , Springer, стр. 187–189.
- ^ Перейти обратно: а б с Анна Галь, Питер Бро Мильтерсен (2003), «Сложность клеточного зондирования кратких структур данных», Труды 30-го Международного коллоквиума по автоматам, языкам и программированию (ICALP) , стр. 332–344.
- ^ Джо Бюлер, Элвин Берлекамп (2004), «Колонка головоломок» , «Эмиссар» , весна 2004 г.: 3
- ^ Ричард Э. Блаут (2014), Криптография и безопасная связь , Cambridge University Press, стр. 29–30.
- ^ Кристоф Пёппе (2006), «Математические беседы: свобода для комбинатористов» , Spektrum der Wissenschaft (на немецком языке), 6/2006: 106–108
- ^ Питер Винклер (2006), «Загадка с именами в коробках», College Mathematics Journal , 37 (4): 260, 285, 289
- ^ Навин Гоял, Майкл Сакс (2005), «Игра с параллельным поиском», Случайные структуры и алгоритмы , 27 (2): 227–234, doi : 10.1002/rsa.20068 , S2CID 90893
- ^ Дэвид Авис , Энн Бродбент (2009), «Загадка квантового шкафчика», Третья международная конференция по квантовым, нано и микротехнологиям ICQNM '09 , стр. 63–66.
- ^ Филипп Флажоле, Роберт Седжвик (2009), Аналитическая комбинаторика , Издательство Кембриджского университета, стр. 177
- ^ Ури Мендлович (2024), Заключенные и обмен: достаточно меньше половины (препринт) , arXiv, arXiv : 2407.07190
- ^ Перейти обратно: а б Адам С. Ландсберг (2009), «Возвращение Монти Холла», Mathematical Intelligencer , 31 (2): 1, doi : 10.1007/s00283-008-9016-8
- ^ Эрик Грундвальд (2010), «Re: Загадка шкафчика», Mathematical Intelligencer , 32 (2): 1, doi : 10.1007/s00283-009-9107-1
Литература
[ редактировать ]- Филипп Флажоле , Роберт Седжвик (2009), Аналитическая комбинаторика , Издательство Кембриджского университета, ISBN 978-1-139-47716-1
- Ричард П. Стэнли (2013), Алгебраическая комбинаторика: прогулки, деревья, таблицы и многое другое , Тексты для студентов по математике , Springer, ISBN 978-1-461-46998-8
- Питер Винклер (2007), Математические повелители разума , Тейлор и Фрэнсис, ISBN 978-1-568-81336-3
Внешние ссылки
[ редактировать ]- Роб Хитон: Математики ненавидят гражданские свободы – 100 заключенных и 100 ящиков , 13 января 2014 г.
- Оливер Нэш: Пожалейте заключенных. Архивировано 14 июля 2014 г. в Wayback Machine , 12 декабря 2009 г.
- Джейми Малхолланд: Узники в коробках , весна 2011 г. (PDF)
- MinutePhysics : Невозможная ставка на YouTube и решение невозможной ставки на YouTube , 8 декабря 2014 г.
- Роберт Фельдт: Стохастическое моделирование в Джулии для проверки оптимальной стратегии, 6 июля 2022 г.