Оптимальная остановка
В математике теория оптимальной остановки [ 1 ] [ 2 ] или ранняя остановка [ 3 ] занимается проблемой выбора времени для совершения определенного действия, чтобы максимизировать ожидаемое вознаграждение или минимизировать ожидаемые затраты. Задачи оптимальной остановки можно найти в областях статистики , экономики и математических финансов (связанных с ценообразованием американских опционов ). Ключевым примером задачи оптимальной остановки является задача секретаря . Задачи оптимальной остановки часто можно записать в форме уравнения Беллмана и поэтому часто решают с помощью динамического программирования .
Определение
[ редактировать ]Случай дискретного времени
[ редактировать ]Проблемы с правилом остановки связаны с двумя объектами:
- Последовательность случайных величин , совместное распределение которых предполагается известным
- Последовательность функций «награды» которые зависят от наблюдаемых значений случайных величин в 1:
Учитывая эти объекты, проблема заключается в следующем:
- Вы наблюдаете за последовательностью случайных величин, и на каждом шаге , вы можете либо прекратить наблюдение, либо продолжить
- Если вы перестанете наблюдать на шаге , вы получите награду
- Вы хотите выбрать правило остановки , чтобы максимизировать ожидаемое вознаграждение (или, что то же самое, минимизировать ожидаемый убыток).
Случай непрерывного времени
[ редактировать ]Рассмотрим процесс получения определенный в отфильтрованном вероятностном пространстве и предположим, что адаптирован к фильтрации. Задача оптимальной остановки состоит в нахождении времени остановки. который максимизирует ожидаемый выигрыш
где называется функцией ценности . Здесь может иметь значение .
Более конкретная формулировка выглядит следующим образом. Мы рассматриваем адаптированный сильный марковский процесс определенный в отфильтрованном вероятностном пространстве где обозначает вероятностную меру, при которой случайный процесс начинается в точке . Учитывая непрерывные функции , и , задача оптимальной остановки
Иногда ее называют формулировкой MLS (что означает Майер, Лагранж и супремум соответственно). [ 4 ]
Методы решения
[ редактировать ]Обычно существует два подхода к решению задач оптимальной остановки. [ 4 ] Когда основной процесс (или процесс выигрыша) описывается его безусловными конечномерными распределениями , подходящим методом решения является подход мартингала, названный так потому, что он использует теорию мартингала , наиболее важной концепцией которого является конверт Снеллиуса . В случае дискретного времени, если горизонт планирования конечна, проблема также может быть легко решена с помощью динамического программирования .
Когда основной процесс определяется семейством (условных) функций перехода, приводящих к марковскому семейству вероятностей перехода, часто можно использовать мощные аналитические инструменты, предоставляемые теорией марковских процессов , и этот подход называется методом Маркова. Решение обычно получается путем решения связанных задач со свободной границей ( задач Стефана ).
Результат скачкообразной диффузии
[ редактировать ]Позволять быть диффузией Леви в предоставлено SDE
где это -мерное броуновское движение , это -мерная компенсированная случайная мера Пуассона , , , и заданы функции такие, что единственное решение существует. Позволять быть открытым множеством (область платежеспособности) и
быть время банкротства. Оптимальная задача остановки:
Оказывается, при некоторых условиях регулярности [ 5 ] имеет место следующая проверочная теорема:
Если функция удовлетворяет
- где находится область продолжения ,
- на , и
- на , где является генератором бесконечно малым
затем для всех . Более того, если
- на
Затем для всех и – оптимальное время остановки.
Эти условия можно записать и в более компактной форме ( интегро-вариационное неравенство ):
- на
Примеры
[ редактировать ]Подбрасывание монет
[ редактировать ](Пример, где сходится)
У вас есть честная монета, и вы постоянно ее подбрасываете. Каждый раз, прежде чем он будет подброшен, вы можете прекратить его подбрасывать и получить оплату (скажем, в долларах) за среднее количество наблюдаемых орлов.
Вы хотите максимизировать сумму, которую вам платят, выбрав правило остановки. Если X i (при i ≥ 1) образует последовательность независимых одинаково распределенных случайных величин с распределением Бернулли
и если
тогда последовательности , и являются объектами, связанными с этой проблемой.
Продажа дома
[ редактировать ](Пример, где не обязательно сходится)
У вас есть дом и вы хотите его продать. Каждый день вам предлагают за свой дом и заплати продолжать рекламировать его. Если вы продадите свой дом в день , ты заработаешь , где .
Вы хотите максимизировать заработанную сумму, выбрав правило остановки.
В этом примере последовательность ( ) — это последовательность предложений для вашего дома, а последовательность функций вознаграждения — это то, сколько вы заработаете. [ 6 ]
Проблема с секретарем
[ редактировать ](Пример, где является конечной последовательностью)
Вы наблюдаете последовательность объектов, которые можно ранжировать от лучшего к худшему. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы выбрать лучший объект.
Вот, если ( n — некоторое большое число) — ранги объектов, а это шанс, что вы выберете лучший объект, если перестанете намеренно отвергать объекты на шаге i, а затем и являются последовательностями, связанными с этой проблемой. Эту проблему решили в начале 1960-х годов несколько человек. Элегантное решение проблемы секретаря и несколько модификаций этой проблемы обеспечивает более поздний алгоритм оптимальной остановки (алгоритм Брюсса).
Теория поиска
[ редактировать ]Экономисты изучили ряд задач оптимальной остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска уделяет особое внимание поиску работником высокооплачиваемой работы или поиску потребителем дешевого товара.
Проблема с парковкой
[ редактировать ]Особым примером применения теории поиска является задача оптимального выбора парковочного места водителем, направляющимся в оперу (театр, магазин и т.п.). Подъезжая к месту назначения, водитель идет по улице, вдоль которой есть парковочные места – обычно на парковке только некоторые места свободны. Цель хорошо видна, поэтому легко оценить расстояние до цели. Задача водителя – выбрать свободное парковочное место как можно ближе к пункту назначения, не оборачиваясь, чтобы расстояние от этого места до пункта назначения было кратчайшим. [ 7 ]
Опционная торговля
[ редактировать ]При торговле опционами на финансовых рынках держателю американского опциона разрешается реализовать право купить (или продать) базовый актив по заранее установленной цене в любое время до или в дату истечения срока действия. Таким образом, оценка американских опционов, по сути, представляет собой задачу оптимальной остановки. Рассмотрим классическую Блэка–Шоулза и пусть схему быть безрисковой процентной ставкой и и быть ставкой дивидендов и волатильностью акций. Цена акции следует геометрическому броуновскому движению
в рамках риск-нейтральной меры.
Когда опцион бессрочный, задача оптимальной остановки имеет вид
где функция выигрыша для опциона колл и для опциона пут. Вариационное неравенство
для всех где является границей упражнения. Известно, что решение [ 8 ]
- (Вечный звонок) где и
- (вечный пут) где и
С другой стороны, когда срок годности конечен, проблема связана с двумерной задачей со свободной границей без известного решения в замкнутой форме. Однако можно использовать различные численные методы. См . здесь модель Блэка-Шоулза#Американские опционы для различных методов оценки, а также метод Fugit для дискретного древовидного расчета оптимального времени для исполнения.
См. также
[ редактировать ]- Проблема с остановкой
- Марковский процесс принятия решения
- Необязательная теорема об остановке
- Неравенство Пророка
- Стохастический контроль
Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ Чоу, Ю.С.; Роббинс, Х .; Зигмунд, Д. (1971). Большие надежды: теория оптимальной остановки . Бостон: Хоутон Миффлин .
- ^ Фергюсон, Томас С. (2007). Оптимальная остановка и приложения . Калифорнийский университет в Лос-Анджелесе.
- ^ Хилл, Теодор П. (2009). «Знать, когда остановиться». Американский учёный . 97 (2): 126–133. дои : 10.1511/2009.77.126 . ISSN 1545-2786 . S2CID 124798270 .
- (Перевод на французский язык см. на обложке июльского номера журнала Pour la Science (2009).)
- ^ Jump up to: а б Пескир, Горан; Ширяев, Альберт (2006). Оптимальная остановка и задачи со свободной границей . Лекции по математике. ETH Цюрих. дои : 10.1007/978-3-7643-7390-0 . ISBN 978-3-7643-2419-3 .
- ^ Оксендалл, Б. ; Сулем, А. (2007). Прикладное стохастическое управление скачкообразными диффузиями . дои : 10.1007/978-3-540-69826-5 . ISBN 978-3-540-69825-8 . S2CID 123531718 .
- ^ Фергюсон, Томас С .; Класс, Майкл Дж. (2010). «Поиски дома без вторых мгновений». Последовательный анализ . 29 (3): 236–244. дои : 10.1080/07474946.2010.487423 . ISSN 0747-4946 .
- ^ Маккуин, Дж.; Миллер-младший, Р.Г. (1960). «Оптимальная политика сохранения». Исследование операций . 8 (3): 362–380. дои : 10.1287/opre.8.3.362 . ISSN 0030-364X .
- ^ Карацас, Иоаннис; Шрив, Стивен Э. (1998). Методы математических финансов . Стохастическое моделирование и прикладная теория вероятности. Том. 39. дои : 10.1007/b98840 . ISBN 978-0-387-94839-3 .
Источники
[ редактировать ]- Томас С. Фергюсон , « Кто решил проблему секретаря? » Статистическая наука , Vol. 4., 282–296, (1989)
- Ф. Томас Брусс . «Суммируйте шансы к одному и остановитесь». Анналы вероятности , Том. 28, 1384–1391, (2000)
- Ф. Томас Брусс. «Искусство правильного решения: почему лица, принимающие решения, хотят знать алгоритм шансов». Информационный бюллетень Европейского математического общества , выпуск 62, 14–20, (2006)
- Роджерсон, Р.; Шимер, Р.; Райт, Р. (2005). «Поисковые модели рынка труда: обзор» (PDF) . Журнал экономической литературы . 43 (4): 959–88. дои : 10.1257/002205105775362014 . JSTOR 4129380 .