Jump to content

Алгоритм шансов

(Перенаправлено из алгоритма Брюсса )

В теории принятия решений алгоритм шансов (или алгоритм Брюсса ) — это математический метод вычисления оптимальных стратегий для класса задач, принадлежащих к области задач оптимальной остановки . Их решение следует из стратегии шансов , а важность стратегии шансов заключается в ее оптимальности, как объяснено ниже.

Алгоритм шансов применим к классу задач, называемых проблемами последнего успеха . Формально целью этих задач является максимизация вероятности выделения в последовательности последовательно наблюдаемых независимых событий последнего события, удовлетворяющего определенному критерию («конкретное событие»). Эта идентификация должна быть сделана во время наблюдения. Пересмотр предыдущих наблюдений не допускается. Обычно конкретное событие определяется лицом, принимающим решения, как событие, представляющее подлинный интерес с точки зрения «остановки» для совершения четко определенного действия. Подобные проблемы встречаются в ряде ситуаций.

Две разные ситуации иллюстрируют заинтересованность в максимизации вероятности остановки на последнем конкретном событии.

  1. Предположим, что автомобиль выставлен на продажу тому, кто предложит самую высокую цену (лучшее «предложение»). Позволять потенциальные покупатели откликаются и просят показать машину. Каждый настаивает на немедленном решении продавца принять предложение или нет. Определите ставку как интересную и присвойте ей код 1, если она лучше всех предыдущих ставок, и код 0 в противном случае. Ставки будут формировать случайную последовательность 0 и 1. Только единицы интересуют продавца, который может опасаться, что каждая последующая единица может оказаться последней. Из определения следует, что самая последняя 1 – это наибольшая ставка. Таким образом, максимизация вероятности продажи на последней единице означает максимизацию вероятности лучшей продажи .
  2. Врач, применяющий специальное лечение, может использовать код 1 для успешного лечения, в противном случае — 0. Врач лечит последовательность пациентов таким же образом, и хочет свести к минимуму любые страдания и последовательно лечить каждого отзывчивого пациента. Остановка на последней единице в такой случайной последовательности нулей и единиц позволит достичь этой цели. Поскольку врач не пророк, цель состоит в том, чтобы максимизировать вероятность остановки на последней единице. (См. Сострадательное использование .)

Определения

[ редактировать ]

Рассмотрим последовательность независимые мероприятия . Свяжите с этой последовательностью другую последовательность независимых событий. со значениями 1 или 0. Здесь , называемый успехом, означаетсобытие, когда k-е наблюдение является интересным (как определено лицом, принимающим решение), и ибо неинтересно.Эти случайные величины наблюдаются последовательно, и цель состоит в том, чтобы правильно выбрать последний успех, когда он наблюдается.

Позволять — вероятность того, что k-е событие является интересным. Дальше пусть и . Обратите внимание, что представляет вероятность того, что k-е событие окажется интересным, что объясняет название алгоритма вероятности.

Алгоритмическая процедура

[ редактировать ]

Алгоритм шансов суммирует шансы в обратном порядке.

до тех пор, пока эта сумма впервые не достигнет или не превысит значение 1. Если это происходит с индексом s , сохраняется s и соответствующая сумма.

Если сумма шансов не достигает 1, он устанавливает s = 1. В то же время он вычисляет

Результат:

  1. , порог остановки
  2. , вероятность победы.

Стратегия шансов

[ редактировать ]

Стратегия шансов — это правило наблюдать события одно за другим и останавливаться на первом интересном событии, начиная с индекса s (если таковой имеется), где s — порог остановки выхода a.

Важность стратегии шансов и, следовательно, алгоритма шансов заключается в следующей теореме о шансах.

Теорема о шансах

[ редактировать ]

Теорема шансов утверждает, что

  1. Стратегия шансов оптимальна , то есть максимизирует вероятность остановки на последней 1.
  2. Вероятность выигрыша стратегии шансов равна
  3. Если , вероятность выигрыша всегда не меньше 1/ e = 0,367879... , и эта нижняя граница является наилучшей из возможных .

Алгоритм шансов вычисляет оптимальную стратегию и оптимальную вероятность выигрыша одновременно . Кроме того, количество операций алгоритма шансов (суб)линейно по n. Следовательно, ни один более быстрый алгоритм не можетсуществуют для всех последовательностей, так что алгоритм шансов в то же время является оптимальным как алгоритм.

Источники

[ редактировать ]

Брюсс в 2000 году разработал алгоритм шансов и придумал ему название. Он также известен как алгоритм (стратегия) Брюсса. Бесплатные реализации можно найти в Интернете.

Приложения

[ редактировать ]

Приложения варьируются от медицинских вопросов в клинических испытаниях , проблем продаж, проблем секретаря , выбора портфеля , стратегий (одностороннего) поиска, проблем траектории и проблемы парковки , до проблем онлайн-обслуживания и других.

В том же духе существует теорема о шансах для непрерывных процессов прибытия с независимыми приращениями, таких как процесс Пуассона ( Bruss 2000 ). В некоторых случаях шансы не обязательно известны заранее (как в примере 2 выше), поэтому применение алгоритма шансов напрямую невозможно. В этом случае на каждом этапе можно использовать последовательные оценки шансов. Это имеет смысл, если количество неизвестных параметров не велико по сравнению с количеством наблюдений n. Однако в этом случае вопрос оптимальности более сложен и требует дополнительных исследований. Обобщения алгоритма шансов допускают различные вознаграждения за неспособность остановиться.и неправильные остановки, а также замена предположений о независимости более слабыми ( Ferguson 2008 ).

Вариации

[ редактировать ]

Bruss & Paindaveine 2000 обсуждали проблему выбора последнего успехи.

Тамаки в 2010 году доказал теорему о мультипликативных шансах, которая решает проблему остановки на любом из последних чисел. успехи.Точная нижняя граница вероятности победы получена Мацуи и Ано в 2014 году .

Мацуи и Ано 2017 обсудили проблему выбора из последнего успехов и получил точную нижнюю границу вероятности победы. Когда эта проблема эквивалентна проблеме шансов Брюсса. Если проблема эквивалентна проблеме Bruss & Paindaveine 2000 . Проблема, обсуждаемая Тамаки 2010, достигается путем установки

Проблема с множественным выбором

[ редактировать ]

Игроку разрешено выбора, и он побеждает, если какой-либо выбор является последним успехом.Для классической задачи секретаря Гилберт и Мостеллер в 1966 г. обсудили случаи .Проблема шансов с обсуждается Ано, Какинумой и Миёси, 2010 г.Дополнительные случаи проблемы шансов см. в Matsui & Ano 2016 .

Оптимальная стратегия для этой задачи принадлежит к классу стратегий, определяемых набором пороговых чисел , где .

В частности, представьте, что у вас есть письма о приеме с пометкой к . У тебя было бы сотрудники, работающие с заявлениями, каждый из которых имеет по одному письму. Вы продолжаете проводить собеседования с кандидатами и ранжировать их в таблице, которую может видеть каждый специалист по подаче заявлений. Теперь офицер отправит письмо о принятии первому кандидату, который лучше всех кандидатов к . (Неотправленные письма о зачислении по умолчанию передаются последним претендентам, как и в стандартной задаче о секретаре.)

Когда , Ano, Kakinuma & Miyoshi 2010 показали, что точная нижняя граница вероятности победы равна Для общего положительного целого числа , Мацуи и Ано 2016 доказали, что точная нижняя граница вероятности победы — это вероятность победы варианта задачи о секретаре, где нужно выбрать k лучших кандидатов, используя всего k попыток .

Когда , точные нижние границы вероятностей выигрыша равны , и соответственно.

Для дальнейших числовых случаев для , а алгоритм для общих случаев см. в Matsui & Ano 2016 .

См. также

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d1387b26e3e24db839b9e37fe314527d__1718472900
URL1:https://arc.ask3.ru/arc/aa/d1/7d/d1387b26e3e24db839b9e37fe314527d.html
Заголовок, (Title) документа по адресу, URL1:
Odds algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)