Алгоритм шансов
В теории принятия решений алгоритм шансов (или алгоритм Брюсса ) — это математический метод вычисления оптимальных стратегий для класса задач, принадлежащих к области задач оптимальной остановки . Их решение следует из стратегии шансов , а важность стратегии шансов заключается в ее оптимальности, как объяснено ниже.
Алгоритм шансов применим к классу задач, называемых проблемами последнего успеха . Формально целью этих задач является максимизация вероятности выделения в последовательности последовательно наблюдаемых независимых событий последнего события, удовлетворяющего определенному критерию («конкретное событие»). Эта идентификация должна быть сделана во время наблюдения. Пересмотр предыдущих наблюдений не допускается. Обычно конкретное событие определяется лицом, принимающим решения, как событие, представляющее подлинный интерес с точки зрения «остановки» для совершения четко определенного действия. Подобные проблемы встречаются в ряде ситуаций.
Примеры
[ редактировать ]Две разные ситуации иллюстрируют заинтересованность в максимизации вероятности остановки на последнем конкретном событии.
- Предположим, что автомобиль выставлен на продажу тому, кто предложит самую высокую цену (лучшее «предложение»). Позволять потенциальные покупатели откликаются и просят показать машину. Каждый настаивает на немедленном решении продавца принять предложение или нет. Определите ставку как интересную и присвойте ей код 1, если она лучше всех предыдущих ставок, и код 0 в противном случае. Ставки будут формировать случайную последовательность 0 и 1. Только единицы интересуют продавца, который может опасаться, что каждая последующая единица может оказаться последней. Из определения следует, что самая последняя 1 – это наибольшая ставка. Таким образом, максимизация вероятности продажи на последней единице означает максимизацию вероятности лучшей продажи .
- Врач, применяющий специальное лечение, может использовать код 1 для успешного лечения, в противном случае — 0. Врач лечит последовательность пациентов таким же образом, и хочет свести к минимуму любые страдания и последовательно лечить каждого отзывчивого пациента. Остановка на последней единице в такой случайной последовательности нулей и единиц позволит достичь этой цели. Поскольку врач не пророк, цель состоит в том, чтобы максимизировать вероятность остановки на последней единице. (См. Сострадательное использование .)
Определения
[ редактировать ]Рассмотрим последовательность независимые мероприятия . Свяжите с этой последовательностью другую последовательность независимых событий. со значениями 1 или 0. Здесь , называемый успехом, означаетсобытие, когда k-е наблюдение является интересным (как определено лицом, принимающим решение), и ибо неинтересно.Эти случайные величины наблюдаются последовательно, и цель состоит в том, чтобы правильно выбрать последний успех, когда он наблюдается.
Позволять — вероятность того, что k-е событие является интересным. Дальше пусть и . Обратите внимание, что представляет вероятность того, что k-е событие окажется интересным, что объясняет название алгоритма вероятности.
Алгоритмическая процедура
[ редактировать ]Алгоритм шансов суммирует шансы в обратном порядке.
до тех пор, пока эта сумма впервые не достигнет или не превысит значение 1. Если это происходит с индексом s , сохраняется s и соответствующая сумма.
Если сумма шансов не достигает 1, он устанавливает s = 1. В то же время он вычисляет
Результат:
- , порог остановки
- , вероятность победы.
Стратегия шансов
[ редактировать ]Стратегия шансов — это правило наблюдать события одно за другим и останавливаться на первом интересном событии, начиная с индекса s (если таковой имеется), где s — порог остановки выхода a.
Важность стратегии шансов и, следовательно, алгоритма шансов заключается в следующей теореме о шансах.
Теорема о шансах
[ редактировать ]Теорема шансов утверждает, что
- Стратегия шансов оптимальна , то есть максимизирует вероятность остановки на последней 1.
- Вероятность выигрыша стратегии шансов равна
- Если , вероятность выигрыша всегда не меньше 1/ e = 0,367879... , и эта нижняя граница является наилучшей из возможных .
Функции
[ редактировать ]Алгоритм шансов вычисляет оптимальную стратегию и оптимальную вероятность выигрыша одновременно . Кроме того, количество операций алгоритма шансов (суб)линейно по n. Следовательно, ни один более быстрый алгоритм не можетсуществуют для всех последовательностей, так что алгоритм шансов в то же время является оптимальным как алгоритм.
Источники
[ редактировать ]Брюсс в 2000 году разработал алгоритм шансов и придумал ему название. Он также известен как алгоритм (стратегия) Брюсса. Бесплатные реализации можно найти в Интернете.
Приложения
[ редактировать ]Приложения варьируются от медицинских вопросов в клинических испытаниях , проблем продаж, проблем секретаря , выбора портфеля , стратегий (одностороннего) поиска, проблем траектории и проблемы парковки , до проблем онлайн-обслуживания и других.
В том же духе существует теорема о шансах для непрерывных процессов прибытия с независимыми приращениями, таких как процесс Пуассона ( Bruss 2000 ). В некоторых случаях шансы не обязательно известны заранее (как в примере 2 выше), поэтому применение алгоритма шансов напрямую невозможно. В этом случае на каждом этапе можно использовать последовательные оценки шансов. Это имеет смысл, если количество неизвестных параметров не велико по сравнению с количеством наблюдений n. Однако в этом случае вопрос оптимальности более сложен и требует дополнительных исследований. Обобщения алгоритма шансов допускают различные вознаграждения за неспособность остановиться.и неправильные остановки, а также замена предположений о независимости более слабыми ( Ferguson 2008 ).
Вариации
[ редактировать ]Bruss & Paindaveine 2000 обсуждали проблему выбора последнего успехи.
Тамаки в 2010 году доказал теорему о мультипликативных шансах, которая решает проблему остановки на любом из последних чисел. успехи.Точная нижняя граница вероятности победы получена Мацуи и Ано в 2014 году .
Мацуи и Ано 2017 обсудили проблему выбора из последнего успехов и получил точную нижнюю границу вероятности победы. Когда эта проблема эквивалентна проблеме шансов Брюсса. Если проблема эквивалентна проблеме Bruss & Paindaveine 2000 . Проблема, обсуждаемая Тамаки 2010, достигается путем установки
Проблема с множественным выбором
[ редактировать ]Игроку разрешено выбора, и он побеждает, если какой-либо выбор является последним успехом.Для классической задачи секретаря Гилберт и Мостеллер в 1966 г. обсудили случаи .Проблема шансов с обсуждается Ано, Какинумой и Миёси, 2010 г.Дополнительные случаи проблемы шансов см. в Matsui & Ano 2016 .
Оптимальная стратегия для этой задачи принадлежит к классу стратегий, определяемых набором пороговых чисел , где .
В частности, представьте, что у вас есть письма о приеме с пометкой к . У тебя было бы сотрудники, работающие с заявлениями, каждый из которых имеет по одному письму. Вы продолжаете проводить собеседования с кандидатами и ранжировать их в таблице, которую может видеть каждый специалист по подаче заявлений. Теперь офицер отправит письмо о принятии первому кандидату, который лучше всех кандидатов к . (Неотправленные письма о зачислении по умолчанию передаются последним претендентам, как и в стандартной задаче о секретаре.)
Когда , Ano, Kakinuma & Miyoshi 2010 показали, что точная нижняя граница вероятности победы равна Для общего положительного целого числа , Мацуи и Ано 2016 доказали, что точная нижняя граница вероятности победы — это вероятность победы варианта задачи о секретаре, где нужно выбрать k лучших кандидатов, используя всего k попыток .
Когда , точные нижние границы вероятностей выигрыша равны , и соответственно.
Для дальнейших числовых случаев для , а алгоритм для общих случаев см. в Matsui & Ano 2016 .
См. также
[ редактировать ]Ссылки
[ редактировать ]- Ано, К.; Какинума, Х.; Миёси, Н. (2010). «Теорема о шансах при множественных шансах выбора» . Журнал прикладной вероятности . 47 (4): 1093–1104. дои : 10.1239/яп/1294170522 . S2CID 17598431 .
- Брюсс, Ф. Томас (2000). «Суммируйте шансы к единице и остановитесь» . Анналы вероятности . 28 (3). Институт математической статистики: 1384–1391. дои : 10.1214/aop/1019160340 . ISSN 0091-1798 .
- « Заметка об границах теоремы об оптимальной остановке о шансах », Annals of Probability Vol. 31, 1859–1862 (2003).
- « Искусство правильного решения », Информационный бюллетень Европейского математического общества , выпуск 62, 14–20, (2005).
- Т.С. Фергюсон : (2008, неопубликовано)
- Брусс, FT; Пайндавейн, Д. (2000). «Выбор последовательности последних успехов в независимых испытаниях» (PDF) . Журнал прикладной вероятности . 37 (2): 389–399. дои : 10.1239/яп/1014842544 .
- Гилберт, Дж; Мостеллер, Ф (1966). «Распознавание максимума последовательности». Журнал Американской статистической ассоциации . 61 (313): 35–73. дои : 10.2307/2283044 . JSTOR 2283044 .
- Мацуи, Т; Ано, К. (2014). «Заметка о нижней оценке теоремы мультипликативных шансов оптимальной остановки» . Журнал прикладной вероятности . 51 (3): 885–889. дои : 10.1239/яп/1409932681 .
- Мацуи, Т; Ано, К. (2016). «Нижние оценки проблемы шансов Брусса с несколькими остановками». Математика исследования операций . 41 (2): 700–714. arXiv : 1204.5537 . дои : 10.1287/moor.2015.0748 . S2CID 31778896 .
- Мацуи, Т; Ано, К. (2017). «Сравнить отношение симметричных многочленов шансов к единице и остановиться» . Журнал прикладной вероятности . 54 : 12–22. дои : 10.1017/января 2016.83 . S2CID 41639968 .
- Шу-Рен Сяо и Цзиинг-Ру. Ян: « Выбор последнего успеха в марково-зависимых испытаниях », Journal of Applied Probability , Vol. 93, 271–281 (2002).
- Тамаки, М. (2010). «Суммируйте мультипликативные шансы к единице и остановитесь» . Журнал прикладной вероятности . 47 (3): 761–777. дои : 10.1239/яп/1285335408 . S2CID 32236265 .
- Мицуши Тамаки: « Оптимальная остановка на траекториях и проблема голосования », Journal of Applied Probability Vol. 38, 946–959 (2001).
- Э. Томас, Э. Леврат, Б. Юнг: « Алгоритм Брусса как вклад в профилактическое обслуживание », Automation Sciences and Technologies , Vol. 4, 13–18 (2007).
Внешние ссылки
[ редактировать ]- Алгоритм Брюсса http://www.p-roesler.de/odds.html