Jump to content

Проблема с секретарем

(Перенаправлено с «Проблемы секретаря» )

Графики вероятностей получения лучшего кандидата (красные кружки) из n заявок и k / n (синие крестики), где k — размер выборки

демонстрирует Задача секретаря сценарий, включающий оптимальной остановки . теорию [ 1 ] [ 2 ] которая широко изучается в области прикладной теории вероятностей , статистики и теории принятия решений . Она также известна как проблема брака , проблема приданого султана , проблема суетливого жениха , игра в гугол и проблема лучшего выбора . Его решение также известно как правило 37% . [ 3 ]

Основная форма задачи такова: представьте себе администратора, который хочет нанять лучшего секретаря из числа достойные претенденты на должность. Кандидаты проходят собеседование по одному в случайном порядке. Решение по каждому конкретному претенденту принимается сразу после собеседования. В случае отклонения заявитель не может быть отозван. В ходе собеседования администратор получает информацию, достаточную для того, чтобы отнести заявителя к числу всех кандидатов, опрошенных на данный момент, но он не осведомлен о качестве еще не замеченных кандидатов. Вопрос в том, какая оптимальная стратегия ( правило остановки ) позволит максимизировать вероятность выбора лучшего претендента. Если решение можно отложить до конца, это можно решить с помощью простого алгоритма выбора максимума , отслеживающего текущий максимум (и того, кто его достиг) и выбора общего максимума в конце. Сложность в том, что решение должно быть принято немедленно.

Самое короткое строгое доказательство, известное на данный момент, обеспечивается алгоритмом шансов . Это означает, что оптимальная вероятность выигрыша всегда не менее (где e — основание натурального логарифма ), и что последнее справедливо даже в гораздо большей общности. Правило оптимальной остановки предписывает всегда отклонять первый кандидатов, которые проходят собеседование, а затем останавливаются на первом заявителе, который лучше, чем все кандидаты, опрошенные на данный момент (или продолжают до последнего заявителя, если этого не происходит). Иногда эту стратегию называют правило остановки, поскольку вероятность остановки на лучшем претенденте при этой стратегии уже составляет около для умеренных значений . Одна из причин, почему проблеме секретаря уделяется так много внимания, заключается в том, что оптимальная политика для решения этой проблемы (правило остановки) проста и выбирает единственного лучшего кандидата примерно в 37% случаев, независимо от того, 100 или 100 миллионов претендентов.

Формулировка

[ редактировать ]

Хотя существует множество вариантов, основную проблему можно сформулировать следующим образом:

  • Необходимо заполнить одну вакансию.
  • На эту должность имеется n претендентов, и значение n известно.
  • Претендентов, если рассматривать их всех вместе, можно однозначно ранжировать от лучшего к худшему.
  • Кандидаты опрашиваются последовательно в случайном порядке, причем каждый порядок имеет одинаковую вероятность.
  • Сразу после собеседования опрашиваемый заявитель либо принимается, либо отклоняется, и решение является безотзывным.
  • Решение о принятии или отклонении кандидата может быть основано только на относительном ранге кандидатов, опрошенных на данный момент.
  • Цель общего решения — обеспечить наибольшую вероятность выбора лучшего претендента из всей группы. Это то же самое, что и максимизация ожидаемого выигрыша, при этом выигрыш определяется как один для лучшего претендента и нулевой в противном случае.

Кандидат . определяется как кандидат, который на собеседовании оказался лучше, чем все кандидаты, опрошенные ранее Пропустить означает «отклонить сразу после собеседования». Поскольку цель задачи состоит в том, чтобы выбрать единственного лучшего кандидата, для принятия будут рассматриваться только кандидаты. «Кандидат» в этом контексте соответствует понятию записи в перестановке.

Выведение оптимальной политики

[ редактировать ]

Оптимальным решением проблемы является правило остановки . При нем интервьюер отклоняет первых r − 1 претендентов (пусть претендент M является лучшим претендентом среди этих r − 1 претендентов), а затем выбирает первого последующего претендента, который лучше претендента M . Можно показать, что оптимальная стратегия принадлежит этому классу стратегий. [ нужна ссылка ] (Обратите внимание, что мы никогда не должны выбирать кандидата, который не является лучшим из всех, кого мы видели до сих пор, поскольку он не может быть лучшим кандидатом в целом.) Для произвольного отсечения r вероятность того, что будет выбран лучший кандидат, равна

Сумма не определена для r = 1, но в этом случае единственно возможным решением является выбор первого заявителя и, следовательно, P (1) = 1/ n . Эта сумма получается, если отметить, что если заявитель i является лучшим заявителем, то он выбирается тогда и только тогда, когда лучший заявитель среди первых i - 1 заявителей входит в число первых r - 1 заявителей, которым было отказано. Стремя n к бесконечности, написав в качестве предела (r−1) / n , используя t для (i−1) / n и dt для 1/ n , сумму можно аппроксимировать интегралом

Взяв производную P ( x ) по , установив его равным 0 и вычислив x , мы находим, что оптимальный x равен 1/ e . Таким образом, оптимальное сокращение стремится к n / e по мере увеличения n , и лучший кандидат выбирается с вероятностью 1/ e .

Для малых значений n оптимальное значение r также можно получить стандартными методами динамического программирования . Оптимальные пороги r и вероятность выбора лучшей альтернативы P для нескольких значений n показаны в следующей таблице. [ примечание 1 ]

1 2 3 4 5 6 7 8 9 10
1 1 2 2 3 3 3 4 4 4
1.000 0.500 0.500 0.458 0.433 0.428 0.414 0.410 0.406 0.399

Вероятность выбора лучшего кандидата в классической задаче о секретаре стремится к .

Альтернативное решение

[ редактировать ]

Эта проблема и несколько ее модификаций могут быть решены (включая доказательство оптимальности) простым способом с помощью алгоритма шансов , который также имеет и другие приложения. Модификации задачи секретаря, которые можно решить с помощью этого алгоритма, включают случайное наличие кандидатов, более общие гипотезы о том, что кандидаты могут представлять интерес для лица, принимающего решения, групповые собеседования для кандидатов, а также определенные модели для случайного числа кандидатов. [ нужна ссылка ]

Ограничения

[ редактировать ]

Решение проблемы секретаря имеет смысл только в том случае, если обоснованно предположить, что кандидаты не знают используемой стратегии принятия решения, поскольку у ранних кандидатов вообще нет шансов и они могут не появиться в противном случае.

Важным недостатком применения решения классической задачи секретаря является то, что число претендентов должно быть известно заранее, что бывает редко. Один из способов решить эту проблему — предположить, что количество претендентов является случайной величиной. с известным распределением (Пресман и Сонин, 1972). Однако для этой модели оптимальное решение, как правило, гораздо сложнее. Более того, оптимальная вероятность успеха теперь уже не составляет около 1/ e , а обычно ниже. Это можно понять в контексте «цены», которую приходится платить за незнание количества претендентов. Однако в этой модели цена высока. В зависимости от выбора распределения оптимальная вероятность выигрыша может приближаться к нулю. Поиск способов справиться с этой новой проблемой привел к созданию новой модели, дающей так называемый закон наилучшего выбора 1/e.

1/электронный закон лучшего выбора

[ редактировать ]

Суть модели основана на идее о том, что жизнь последовательна и что проблемы реального мира возникают в реальном времени. Кроме того, легче оценить время, в течение которого конкретные события (прибытие заявителей) должны происходить чаще (если они происходят), чем оценить распределение количества конкретных событий, которые будут происходить. Эта идея привела к следующему подходу, так называемому унифицированному подходу (1984):

Модель определяется следующим образом: Заявитель должен быть выбран на некотором временном интервале. с неизвестного номера рейтинговых претендентов. Цель состоит в том, чтобы максимизировать вероятность выбора только лучшего при условии, что все порядки прибытия разных рангов одинаково вероятны. Предположим, что все заявители имеют одинаковую, но независимую друг от друга плотность времени прибытия. на и пусть обозначаем соответствующую функцию распределения времени прибытия, т.е.

, .

Позволять быть таким, что Рассмотрите стратегию ожидания и своевременного наблюдения за всеми кандидатами. а затем выбрать, если возможно, первого кандидата по истечении времени что лучше всех предыдущих. Тогда эта стратегия, называемая 1/e-стратегией , обладает следующими свойствами:

Стратегия 1/e

(i) доходность для всех вероятность успеха не менее 1/e,
(ii) является минимаксно-оптимальной стратегией для селектора, который не знает ,
(iii) выбирает, если есть хотя бы один претендент, вообще ни одного с вероятностью ровно 1/e.

Закон 1/e, доказанный в 1984 году Ф. Томасом Бруссом , стал неожиданностью. Причина заключалась в том, что значение около 1/e ранее считалось недостижимым в модели для неизвестных. , тогда как это значение 1/e теперь достигалось как нижняя граница вероятности успеха, и это в модели с, возможно, гораздо более слабыми гипотезами (см., например, Math. Reviews 85:m).

Однако существует множество других стратегий, которые достигают (i) и (ii) и, более того, работают строго лучше, чем стратегия 1/e. одновременно для всех >2. Простым примером является стратегия, которая выбирает (если возможно) первого относительно лучшего кандидата по истечении определенного времени. при условии, что хотя бы один претендент прибыл до этого времени, а в противном случае выбирает (если возможно) второго относительно лучшего кандидата по истечении времени . [ 4 ]

Закон 1/e иногда путают с решением классической проблемы секретаря, описанной выше, из-за схожей роли числа 1/e. Однако в законе 1/e эта роль носит более общий характер. Результат также является более сильным, поскольку он справедлив для неизвестного числа заявителей и поскольку модель, основанная на распределении времени прибытия F, более приемлема для заявок.

Игра в Гугол

[ редактировать ]

В статье «Кто решил проблему секретаря?» ( Фергюсон , 1989) [ 1 ] Утверждается, что задача о секретаре впервые появилась в печати в Мартина Гарднера «Математические игры» в феврале 1960 года колонке в журнале Scientific American :

Попросите кого-нибудь взять столько листов бумаги, сколько ему захочется, и на каждом листе написать разные положительные числа. Числа могут варьироваться от небольших долей 1 до числа размером с гугол (1, за которым следует сотня нулей) или даже больше. Эти листочки переворачивают лицевой стороной вниз и кладут на стол. По одному переворачивайте листочки лицевой стороной вверх. Цель состоит в том, чтобы перестать поворачиваться, когда вы дойдете до числа, которое, по вашему мнению, является самым большим из ряда. Вы не можете вернуться и выбрать ранее перевернутый лист. Если вы перевернете все листы, то, конечно, вам придется выбрать последний перевернутый. [ 5 ]

Фергюсон отметил, что игра с секретарем осталась нерешенной, поскольку это игра с нулевой суммой с двумя антагонистическими игроками. [ 1 ] В этой игре:

  • Алиса, информированный игрок, тайно записывает отдельные числа на карты.
  • Боб, останавливающий игрок, наблюдает за фактическими значениями и может прекратить переворачивать карты, когда захочет, выигрывая, если последняя перевернутая карта имеет общее максимальное число.
  • Боб хочет угадать максимальное число с максимально возможной вероятностью, а цель Алисы — сделать эту вероятность как можно более низкой.

Отличий от основной задачи секретаря два:

  • Алисе не обязательно записывать числа равномерно и наугад. Она может записать их в соответствии с любым совместным распределением вероятностей, чтобы обмануть Боба.
  • Боб наблюдает за фактическими значениями, записанными на картах, которые он может использовать в своих процедурах принятия решений.

Стратегический анализ

[ редактировать ]

Алиса сначала записывает n чисел, которые затем перемешиваются. Таким образом, их порядок не имеет значения, а это означает, что числа Алисы должны быть заменяемой последовательностью случайных величин. . Тогда стратегия Алисы заключается в простом выборе самой сложной последовательности случайных величин, которую можно заменить.

Стратегию Боба можно формализовать как правило остановки. для последовательности .

Мы говорим, что правило остановки для Боба является стратегией остановки относительного ранга тогда и только тогда, когда она зависит только от относительных рангов , а не от их числовых значений. Другими словами, это как если бы кто-то тайно вмешался после того, как Алиса выбрала свои числа, и изменил каждое число в в его относительный ранг (разрыв связей случайным образом). Например, меняется на или с равной вероятностью. Это создает впечатление, будто Алиса разыграла заменяемую случайную перестановку на . Теперь, поскольку единственная заменяемая случайная перестановка на это просто равномерное распределение по всем перестановкам на , оптимальная стратегия остановки относительного ранга — это оптимальное правило остановки для задачи секретаря, приведенной выше, с вероятностью выигрыша Цель Алисы тогда состоит в том, чтобы убедиться, что Боб не сможет добиться большего, чем стратегия остановки относительного ранга.

По правилам игры последовательность Алисы должна быть взаимозаменяемой, но для успеха в игре Алиса не должна делать ее независимой. Если Алиса выберет числа независимо от некоторого фиксированного распределения, это позволит Бобу добиться большего. Чтобы увидеть это интуитивно, представьте, что , а Алиса должна выбрать оба числа из нормального распределения , независимо. Тогда, если Боб перевернет одно число и увидит , то он вполне уверенно может перевернуть второе число, а если Боб перевернёт одно число и увидит , то он вполне уверенно сможет выбрать первое число. Алиса может добиться большего, выбрав которые положительно коррелируют.

Итак, полностью формальное заявление выглядит следующим образом:

Существует ли сменная последовательность случайных величин , такой, что для любого правила остановки , ?

Для , если Боб использует оптимальную стратегию остановок относительного ранга, то вероятность победы Боба равна 1/2. Удивительно, но у Алисы нет минимаксной стратегии, что тесно связано с парадоксом Т. Ковера. [ 6 ] и парадокс двух конвертов . Конкретно, Боб может использовать эту стратегию: выбрать случайное число. . Если , затем выбери , иначе выбери . Теперь Боб может выиграть с вероятностью строго больше 1/2. Предположим, что числа Алисы разные, тогда при условии, что , Боб выигрывает с вероятностью 1/2, но при условии , Боб выигрывает с вероятностью 1.

Обратите внимание, что случайное число можно выбрать из любого случайного распределения, при условии, что имеет ненулевую вероятность.

Однако для любого , Алиса может построить заменяемую последовательность такая, что вероятность победы Боба не более . [ 1 ]

Но для , ответ — да: Алиса может выбирать случайные числа (которые являются зависимыми случайными величинами) таким образом, что Боб не сможет играть лучше, чем использовать классическую стратегию остановки, основанную на относительных рангах. [ 7 ]

Эвристическая производительность

[ редактировать ]

Оставшаяся часть статьи снова посвящена проблеме секретаря для известного числа претендентов.

Ожидаемые вероятности успеха для трех эвристик

Штейн, Сил и Рапопорт 2003 вывели ожидаемые вероятности успеха для нескольких психологически правдоподобных эвристик, которые можно было бы использовать в задаче о секретаре. Эвристики, которые они исследовали, были следующими:

  • Правило отсечения (CR): не принимать ни одного из первых y кандидатов; после этого выберите первого встреченного кандидата (т. е. заявителя с относительным рангом 1). В качестве частного случая это правило имеет оптимальную стратегию для классической задачи секретаря, для которой y = r .
  • Правило подсчета кандидатов (CCR): выберите y -го встреченного кандидата. Обратите внимание, что это правило не обязательно пропускает каких-либо заявителей; он учитывает только количество наблюдаемых кандидатов, а не то, насколько глубоко лицо, принимающее решения, находится в последовательности кандидатов.
  • Правило последовательного некандидата (SNCR): выберите первого встреченного кандидата после наблюдения за y некандидатами (т. е. претендентами с относительным рангом > 1).

Каждая эвристика имеет один параметр y . На рисунке (показанном справа) показаны ожидаемые вероятности успеха для каждой эвристики в зависимости от y для задач с n = 80.

Кардинальный вариант выигрыша

[ редактировать ]

Поиск единственного лучшего претендента может показаться довольно строгой задачей. Можно себе представить, что интервьюер скорее наймет более ценного кандидата, чем менее ценного, и не будет заботиться только о том, чтобы получить лучшее. То есть интервьюер получит некоторую ценность от выбора кандидата, который не обязательно является лучшим, и полученная ценность увеличивается вместе с ценностью выбранного кандидата.

Для моделирования этой проблемы предположим, что претенденты имеют «истинные» значения, которые являются случайными величинами X, из взятыми равномерного распределения на [0, 1]. Подобно классической проблеме, описанной выше, интервьюер только наблюдает, является ли каждый кандидат лучшим на данный момент (кандидатом), должен принять или отклонить каждого на месте и должен принять последнего, если с ним/ей достигнута связь. (Для ясности: интервьюер не узнает фактический относительный ранг каждого заявителя. Он/она узнает только, имеет ли заявитель относительный ранг 1.) Однако в этой версии выигрыш определяется истинной ценностью выбранного заявителя. Например, если он/она выберет заявителя, истинное значение которого равно 0,8, то он/она заработает 0,8. Цель интервьюера – максимизировать ожидаемую ценность выбранного кандидата.

Поскольку значения заявителя равны iid, они основаны на равномерном распределении на [0, 1], ожидаемое значение t - го заявителя, учитывая, что дается

Как и в классической задаче, оптимальная политика задается порогом, который для этой задачи мы обозначим через , после чего интервьюер должен начать прием кандидатов. Берден показал, что c либо или . [ 8 ] (На самом деле, в зависимости от того, что ближе всего к .) Это следует из того, что при заданной проблеме с претенденты, ожидаемый выигрыш для некоторого произвольного порога является

Дифференциация относительно c получаем

Обучение в парадигме последовательного поиска частичной информации. Числа отображают ожидаемую ценность кандидатов на основе их относительного ранга (из общего числа m кандидатов, просмотренных на данный момент) на различных этапах поиска. Ожидания рассчитываются на основе случая, когда их значения равномерно распределены между 0 и 1. Информация об относительном ранге позволяет интервьюеру более точно оценивать кандидатов, поскольку они накапливают больше точек данных для их сравнения.

С для всех допустимых значений , мы находим это максимизируется при . Поскольку V выпукло в , оптимальный целочисленный порог должен быть либо или . Таким образом, для большинства значений интервьюер начнет принимать кандидатов раньше в версии с кардинальным выигрышем, чем в классической версии, где цель состоит в том, чтобы выбрать единственного лучшего кандидата. Обратите внимание, что это не асимптотический результат: он справедлив для всех . Однако это не оптимальная политика для максимизации ожидаемой ценности от известного распределения. В случае известного распределения оптимальную игру можно рассчитать с помощью динамического программирования.

Более общая форма этой проблемы, предложенная Пэлли и Кремером (2014). [ 9 ] предполагает, что по мере прибытия каждого нового заявителя интервьюер наблюдает за его рангом относительно всех кандидатов, за которыми наблюдалось ранее. Эта модель согласуется с идеей обучения интервьюеров по мере того, как они продолжают процесс поиска, накапливая набор прошлых данных, которые они могут использовать для оценки новых кандидатов по мере их поступления. Преимущество этой так называемой модели частичной информации заключается в том, что решения и результаты, достигнутые с учетом информации об относительном ранге, можно напрямую сравнить с соответствующими оптимальными решениями и результатами, если бы интервьюеру была предоставлена ​​полная информация о ценности каждого заявителя. Эта проблема полной информации, в которой кандидаты выбираются независимо от известного распределения, а интервьюер стремится максимизировать ожидаемую ценность выбранного кандидата, была первоначально решена Мозером (1956): [ 10 ] Сакагути (1961), [ 11 ] и Карлин (1962).

Другие модификации

[ редактировать ]

Существует несколько вариантов задачи о секретаре, которые также имеют простые и изящные решения.

Выберите второе лучшее, используя одну попытку

[ редактировать ]

Один вариант заменяет желание выбирать лучшее желанием выбирать второсортное. [ 12 ] [ 13 ] [ 14 ] Роберт Дж. Вандербей называет это проблемой «постдоктора», утверждая, что «лучшие» пойдут в Гарвард. Для этой задачи вероятность успеха для четного числа претендентов равна точно . Эта вероятность стремится к 1/4, поскольку n стремится к бесконечности, иллюстрируя тот факт, что легче выбрать лучшее, чем второе лучшее.

Выберите k лучших, используя k попыток.

[ редактировать ]

Рассмотрим задачу выбора k лучших секретарей из n кандидатов, используя k попыток.

В общем, метод оптимального решения начинается с наблюдения кандидатов, не выбирая ни одного из них, затем выберите каждого кандидата, который лучше первого кандидатов, пока у нас не закончатся кандидаты или кандидаты. Если остается постоянным, пока , то вероятность успеха сходится к . [ 15 ] Вандербей , 1980 , если , то вероятность успеха равна .

Выбирайте лучшее, используя несколько попыток

[ редактировать ]

В этом варианте игроку разрешено выбор и побеждает, если какой-либо выбор является лучшим. Оптимальная стратегия для этой задачи принадлежит к классу стратегий, определяемых набором пороговых чисел , где .

В частности, представьте, что у вас есть письма о приеме с пометкой к . У тебя было бы сотрудники, работающие с заявлениями, каждый из которых имеет по одному письму. Вы продолжаете проводить собеседования с кандидатами и ранжировать их в таблице, которую может видеть каждый специалист по подаче заявлений. Теперь офицер отправит письмо о принятии первому кандидату, который лучше всех кандидатов к . (Неотправленные письма о зачислении по умолчанию передаются последним претендентам, как и в стандартной задаче о секретаре.) [ 16 ]

В лимит, каждый , для некоторого рационального числа . [ 17 ]

Вероятность выигрыша

[ редактировать ]

Когда , вероятность выигрыша сходится к . В более общем смысле, для положительных целых чисел , вероятность выигрыша сходится к , где . [ 17 ]

[ 16 ] вычислено до , с .

Мацуи и Ано 2016 дали общий алгоритм. Например, .

Экспериментальные исследования

[ редактировать ]

экспериментаторы Психологи- и экономисты изучали при принятии решений в проблемных ситуациях секретаря. поведение реальных людей [ 18 ] По большей части эта работа показала, что люди склонны слишком рано прекращать поиск. Это можно объяснить, по крайней мере частично, затратами на оценку кандидатов. В реальных условиях это может означать, что люди недостаточно ищут, когда сталкиваются с проблемами, в которых альтернативы решения встречаются последовательно. Например, пытаясь решить, на какой заправочной станции вдоль шоссе остановиться для заправки, люди могут недостаточно поискать, прежде чем остановиться. Если это правда, то они, как правило, будут платить больше за бензин, чем если бы они искали дольше. То же самое может произойти, когда люди ищут в Интернете авиабилеты. Экспериментальные исследования таких проблем, как проблема секретаря, иногда называют исследованием поведенческих операций .

Нейронные корреляты

[ редактировать ]

Несмотря на то, что существует значительный объем нейробиологических исследований по интеграции информации или представлению убеждений в задачах по перцептивному принятию решений с использованием как животных, так и животных. [ 19 ] [ 20 ] и человеческие субъекты, [ 21 ] относительно мало известно о том, как принимается решение о прекращении сбора информации.

Исследователи изучили нейронные основы решения проблемы секретаря у здоровых добровольцев с помощью функциональной МРТ . [ 22 ] Марковский процесс принятия решений (MDP) использовался для количественной оценки ценности продолжения поиска по сравнению с выбором текущего варианта. Принятие решения о выборе или отклонении варианта затрагивает теменную и дорсолатеральную префронтальную кору, а также вентральное полосатое тело , переднюю островковую часть и переднюю поясную извилину . Таким образом, области мозга, ранее участвовавшие в интеграции доказательств и представлении вознаграждения , кодируют пересечение пороговых значений, которые запускают принятие решения о выборе.

Проблема секретаря, очевидно, была предложена в 1949 году Меррилом М. Фладом , который назвал ее проблемой невесты в лекции, которую он прочитал в том же году. Он упоминал об этом несколько раз в течение 1950-х годов, например, во время выступления на конференции в Purdue 9 мая 1958 года, и в конечном итоге оно стало широко известно в фольклоре, хотя в то время ничего не было опубликовано. В 1958 году он отправил письмо Леонарду Гиллману с копиями дюжине друзей, включая Сэмюэля Карлина и Дж. Роббинса, с изложением доказательства оптимальной стратегии и приложением Р. Палермо, который доказал, что над всеми стратегиями доминирует стратегия форма «безоговорочно отклонить первое p , затем принять следующего кандидата, который лучше». [ 23 ]

Первая публикация, очевидно, была сделана Мартином Гарднером в журнале Scientific American в феврале 1960 года. Он слышал об этом от Джона Х. Фокса-младшего и Л. Джеральда Марни, которые независимо предложили аналогичную проблему в 1958 году; они назвали это «игрой в гугол». Фокс и Марни не знали оптимального решения; Гарднер попросил совета у Лео Мозера , который (вместе с Дж. Р. Паундером) предоставил правильный анализ для публикации в журнале. Вскоре после этого несколько математиков написали Гарднеру, чтобы рассказать ему об аналогичной задаче, о которой они услышали по слухам, и все из которых, скорее всего, можно отнести к оригинальной работе Флада. [ 24 ]

закону 1/ e Наилучший выбор принадлежит -закона Ф. Томасу Бруссу . [ 25 ]

Фергюсон имеет обширную библиографию и указывает, что подобная (но другая) проблема рассматривалась Артуром Кэли в 1875 году и даже Иоганном Кеплером задолго до этого, который потратил 2 года на исследование 11 кандидатов на брак в период с 1611 по 1613 годы после смерти. своей первой жены. [ 26 ]

Комбинаторное обобщение

[ редактировать ]

Задачу секретаря можно обобщить на случай, когда имеется несколько разных должностей. Опять же, есть претенденты приходят в случайном порядке. Когда приходит кандидат, она показывает набор неотрицательных чисел. Каждое значение указывает ее квалификацию для одной из должностей. Администратору не только предстоит решить, брать кандидатуру или нет, но, если да, то он также должен назначить ее на постоянное место на одну из должностей. Цель состоит в том, чтобы найти задание, в котором сумма квалификаций будет как можно большей. Эта проблема идентична поиску паросочетания максимального веса в двудольном графе, взвешенном по ребрам , где узлы одной стороны поступают в сеть в случайном порядке. Таким образом, это частный случай онлайн-задачи двустороннего сопоставления .

Обобщая классический алгоритм задачи секретаря, можно получить задание, в котором ожидаемая сумма квалификаций является лишь фактором меньше оптимального (оффлайн) назначения. [ 27 ]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Перейти обратно: а б с д Фергюсон, Томас С. (август 1989 г.). «Кто решил проблему с секретарем?» . Статистическая наука . 4 (3): 282–289. дои : 10.1214/ss/1177012493 .
  2. ^ Хилл, Теодор П. (2009). «Знать, когда остановиться». Американский учёный . 97 (2): 126–133. дои : 10.1511/2009.77.126 . ISSN   1545-2786 . S2CID   124798270 . Перевод на французский язык см. на обложке июльского номера журнала Pour la Science (2009).
  3. ^ Томсон, Джонни (21 апреля 2022 г.). «Математики предлагают «правило 37%» для самых важных решений в вашей жизни» . Большое Думай . Проверено 6 февраля 2024 г.
  4. ^ Гнедин 2021 .
  5. ^ Гарднер 1966 .
  6. ^ Обложка, Томас М. (1987), Обложка, Томас М.; Гопинат Б. (ред.), «Выберите наибольшее число» , Открытые проблемы коммуникации и вычислений , Нью-Йорк, Нью-Йорк: Springer, стр. 152, номер домена : 10.1007/978-1-4612-4808-8_43 , ISBN  978-1-4612-4808-8 , получено 25 июня 2023 г.
  7. ^ Гнедин 1994 .
  8. ^ Бороды 2006 .
  9. ^ Палли, Аса Б.; Кремер, Мирко (8 июля 2014 г.). «Последовательный поиск и обучение на основе ранговой обратной связи: теория и экспериментальные данные» . Наука управления . 60 (10): 2525–2542. дои : 10.1287/mnsc.2014.1902 . ISSN   0025-1909 .
  10. ^ Мозер, Лео (1956). «О задаче Кэли». Скриптовая математика . 22 : 289–292.
  11. ^ Сакагути, Минору (1 июня 1961 г.). «Динамическое программирование некоторой последовательной схемы выборки» . Журнал математического анализа и приложений . 2 (3): 446–466. дои : 10.1016/0022-247X(61)90023-3 . ISSN   0022-247X .
  12. ^ Роуз, Джон С. (1982). «Отбор неэкстремальных кандидатов из случайной последовательности». Дж. Оптим. Теория Прикл . 38 (2): 207–219. дои : 10.1007/BF00934083 . ISSN   0022-3239 . S2CID   121339045 .
  13. ^ Шайовский, Кшиштоф (1982). «Оптимальный выбор объекта восьмого ранга» Дипломированный математик . Летопись Польского математического общества, серия III. 10 (19): 51–65. дои : 10.14708/ma.v10i19.1533 . ISSN   0137-2890 .
  14. ^ Вандербей, Роберт Дж. (21 июня 2021 г.). «Постдок-вариант задачи о секретаре» . Прикладная математика Летопись Польского математического общества, серия III. 49 (1): 3–13. дои : 10.14708/ma.v49i1.7076 . ISSN   2299-4009 . {{cite journal}}: CS1 maint: дата и год ( ссылка )
  15. ^ Гирдхар и Дудек 2009 .
  16. ^ Перейти обратно: а б Гилберт и Мостеллер, 1966 .
  17. ^ Перейти обратно: а б Мацуи и Ано 2016 .
  18. ^ Берден, Мерфи и Рапопорт, 2006; Берден, Рапопорт и Мерфи, 2006 г.; Сил и Рапопорт, 1997 г.; Пэлли и Кремер, 2014 г.
  19. ^ Шадлен, Миннесота; Ньюсом, WT (23 января 1996 г.). «Восприятие движения: увидеть и решить» . Труды Национальной академии наук . 93 (2): 628–633. Бибкод : 1996PNAS...93..628S . дои : 10.1073/pnas.93.2.628 . ПМК   40102 . ПМИД   8570606 .
  20. ^ Ройтман, Джейми Д.; Шадлен, Майкл Н. (1 ноября 2002 г.). «Реакция нейронов латеральной внутритеменной области во время комбинированной задачи на время реакции зрительной дискриминации» . Журнал неврологии . 22 (21): 9475–9489. doi : 10.1523/JNEUROSCI.22-21-09475.2002 . ПМК   6758024 . ПМИД   12417672 .
  21. ^ Хекерен, Хауке Р.; Марретт, Шон; Унгерлейдер, Лесли Г. (9 мая 2008 г.). «Нервные системы, которые опосредуют процесс принятия решений человеком». Обзоры природы Неврология . 9 (6): 467–479. дои : 10.1038/nrn2374 . ПМИД   18464792 . S2CID   7416645 .
  22. ^ Коста, В.Д.; Авербек, BB (18 октября 2013 г.). «Лобно-теменная и лимбически-полосатая активность лежит в основе выборки информации в задаче наилучшего выбора» . Кора головного мозга . 25 (4): 972–982. дои : 10.1093/cercor/bht286 . ПМК   4366612 . ПМИД   24142842 .
  23. ^ Наводнение 1958 года .
  24. ^ Гарднер 1966 , Задача 3.
  25. ^ Сода 1984 .
  26. ^ Фергюсон 1989 .
  27. ^ Кессельхайм, Томас; Радке, Клаус; Тённис, Андреас; Фёкинг, Бертольд (2013). «Оптимальный онлайн-алгоритм для взвешенного двустороннего сопоставления и расширения комбинаторных аукционов». Алгоритмы – ЕКА 2013 . Конспекты лекций по информатике. Том. 8125. стр. 589–600. дои : 10.1007/978-3-642-40450-4_50 . ISBN  978-3-642-40449-8 .
[ редактировать ]

Примечания

[ редактировать ]
  1. ^
    import numpy as np
    import pandas as pd
    
    # Define the function for which you want to find the maximum
    def func(r, n):
        if r == 1:
            return 0
        else:
            return (r - 1) / n * np.sum([1 / (i - 1) for i in range(r, n+1)])
    
    # Define a function to solve the problem for a specific n
    def solve(n):
        values = [func(r, n) for r in range(1, n+1)]
        r_max = np.argmax(values) + 1
        return r_max, values[r_max - 1]
    
    # Define a function to print the results as a Markdown table
    def print_table(n_max):
        # Prepare data for the table
        data = [solve(n) for n in range(1, n_max+1)]
        df = pd.DataFrame(data, columns=['r', 'Max Value'], index=range(1, n_max+1))
        df.index.name = 'n'
        
        # Convert the DataFrame to Markdown and print
        print(df.transpose().to_markdown())
    
    # Print the table for n from 1 to 10
    print_table(10)
    
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 89e345217e0af9655f68ebde2a7df76d__1714425120
URL1:https://arc.ask3.ru/arc/aa/89/6d/89e345217e0af9655f68ebde2a7df76d.html
Заголовок, (Title) документа по адресу, URL1:
Secretary problem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)