Jump to content

Оптимальная остановка

(Перенаправлено с «Оптимальной остановки »)

В математике теория оптимальной остановки [ 1 ] [ 2 ] или ранняя остановка [ 3 ] занимается проблемой выбора времени для совершения определенного действия, чтобы максимизировать ожидаемое вознаграждение или минимизировать ожидаемые затраты. Задачи оптимальной остановки можно найти в областях статистики , экономики и математических финансов (связанных с ценообразованием американских опционов ). Ключевым примером задачи оптимальной остановки является задача секретаря . Задачи оптимальной остановки часто можно записать в форме уравнения Беллмана и поэтому часто решают с помощью динамического программирования .

Определение

[ редактировать ]

Случай дискретного времени

[ редактировать ]

Проблемы с правилом остановки связаны с двумя объектами:

  1. Последовательность случайных величин , совместное распределение которых предполагается известным
  2. Последовательность функций «награды» которые зависят от наблюдаемых значений случайных величин в 1:

Учитывая эти объекты, проблема заключается в следующем:

  • Вы наблюдаете за последовательностью случайных величин, и на каждом шаге , вы можете либо прекратить наблюдение, либо продолжить
  • Если вы перестанете наблюдать на шаге , вы получите награду
  • Вы хотите выбрать правило остановки , чтобы максимизировать ожидаемое вознаграждение (или, что то же самое, минимизировать ожидаемый убыток).

Случай непрерывного времени

[ редактировать ]

Рассмотрим процесс получения определенный в отфильтрованном вероятностном пространстве и предположим, что адаптирован к фильтрации. Задача оптимальной остановки состоит в нахождении времени остановки. который максимизирует ожидаемый выигрыш

где называется функцией ценности . Здесь может иметь значение .

Более конкретная формулировка выглядит следующим образом. Мы рассматриваем адаптированный сильный марковский процесс определенный в отфильтрованном вероятностном пространстве где обозначает вероятностную меру, при которой случайный процесс начинается в точке . Учитывая непрерывные функции , и , задача оптимальной остановки

Иногда ее называют формулировкой MLS (что означает Майер, Лагранж и супремум соответственно). [ 4 ]

Методы решения

[ редактировать ]

Обычно существует два подхода к решению задач оптимальной остановки. [ 4 ] Когда основной процесс (или процесс выигрыша) описывается его безусловными конечномерными распределениями , подходящим методом решения является подход мартингала, названный так потому, что он использует теорию мартингала , наиболее важной концепцией которого является конверт Снеллиуса . В случае дискретного времени, если горизонт планирования конечна, проблема также может быть легко решена с помощью динамического программирования .

Когда основной процесс определяется семейством (условных) функций перехода, приводящих к марковскому семейству вероятностей перехода, часто можно использовать мощные аналитические инструменты, предоставляемые теорией марковских процессов , и этот подход называется методом Маркова. Решение обычно получается путем решения связанных задач со свободной границей ( задач Стефана ).

Результат скачкообразной диффузии

[ редактировать ]

Позволять быть диффузией Леви в предоставлено SDE

где это -мерное броуновское движение , это -мерная компенсированная случайная мера Пуассона , , , и заданы функции такие, что единственное решение существует. Позволять быть открытым множеством (область платежеспособности) и

быть время банкротства. Оптимальная задача остановки:

Оказывается, при некоторых условиях регулярности [ 5 ] имеет место следующая проверочная теорема:

Если функция удовлетворяет

  • где находится область продолжения ,
  • на , и
  • на , где является генератором бесконечно малым

затем для всех . Более того, если

  • на

Затем для всех и – оптимальное время остановки.

Эти условия можно записать и в более компактной форме ( интегро-вариационное неравенство ):

  • на

Подбрасывание монет

[ редактировать ]

(Пример, где сходится)

У вас есть честная монета, и вы постоянно ее подбрасываете. Каждый раз, прежде чем он будет подброшен, вы можете прекратить его подбрасывать и получить оплату (скажем, в долларах) за среднее количество наблюдаемых орлов.

Вы хотите максимизировать сумму, которую вам платят, выбрав правило остановки. Если X i (при i ≥ 1) образует последовательность независимых одинаково распределенных случайных величин с распределением Бернулли

и если

тогда последовательности , и являются объектами, связанными с этой проблемой.

Продажа дома

[ редактировать ]

(Пример, где не обязательно сходится)

У вас есть дом и вы хотите его продать. Каждый день вам предлагают за свой дом и заплати продолжать рекламировать его. Если вы продадите свой дом в день , ты заработаешь , где .

Вы хотите максимизировать заработанную сумму, выбрав правило остановки.

В этом примере последовательность ( ) — это последовательность предложений для вашего дома, а последовательность функций вознаграждения — это то, сколько вы заработаете. [ 6 ]

Проблема с секретарем

[ редактировать ]

(Пример, где является конечной последовательностью)

Вы наблюдаете последовательность объектов, которые можно ранжировать от лучшего к худшему. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы выбрать лучший объект.

Вот, если ( n — некоторое большое число) — ранги объектов, а это шанс, что вы выберете лучший объект, если перестанете намеренно отвергать объекты на шаге i, а затем и являются последовательностями, связанными с этой проблемой. Эту проблему решили в начале 1960-х годов несколько человек. Элегантное решение проблемы секретаря и несколько модификаций этой проблемы обеспечивает более поздний алгоритм оптимальной остановки (алгоритм Брюсса).

Теория поиска

[ редактировать ]

Экономисты изучили ряд задач оптимальной остановки, подобных «проблеме секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска уделяет особое внимание поиску работником высокооплачиваемой работы или поиску потребителем дешевого товара.

Проблема с парковкой

[ редактировать ]

Особым примером применения теории поиска является задача оптимального выбора парковочного места водителем, направляющимся в оперу (театр, магазин и т.п.). Подъезжая к месту назначения, водитель идет по улице, вдоль которой есть парковочные места – обычно на парковке только некоторые места свободны. Цель хорошо видна, поэтому легко оценить расстояние до цели. Задача водителя – выбрать свободное парковочное место как можно ближе к пункту назначения, не оборачиваясь, чтобы расстояние от этого места до пункта назначения было кратчайшим. [ 7 ]

Опционная торговля

[ редактировать ]

При торговле опционами на финансовых рынках держателю американского опциона разрешается реализовать право купить (или продать) базовый актив по заранее установленной цене в любое время до или в дату истечения срока действия. Таким образом, оценка американских опционов, по сути, представляет собой задачу оптимальной остановки. Рассмотрим классическую Блэка–Шоулза и пусть схему быть безрисковой процентной ставкой и и быть ставкой дивидендов и волатильностью акций. Цена акции следует геометрическому броуновскому движению

в рамках риск-нейтральной меры.

Когда опцион бессрочный, задача оптимальной остановки имеет вид

где функция выигрыша для опциона колл и для опциона пут. Вариационное неравенство

для всех где является границей упражнения. Известно, что решение [ 8 ]

  • (Вечный звонок) где и
  • (вечный пут) где и

С другой стороны, когда срок годности конечен, проблема связана с двумерной задачей со свободной границей без известного решения в замкнутой форме. Однако можно использовать различные численные методы. См . здесь модель Блэка-Шоулза#Американские опционы для различных методов оценки, а также метод Fugit для дискретного древовидного расчета оптимального времени для исполнения.

См. также

[ редактировать ]
  1. ^ Чоу, Ю.С.; Роббинс, Х .; Зигмунд, Д. (1971). Большие надежды: теория оптимальной остановки . Бостон: Хоутон Миффлин .
  2. ^ Фергюсон, Томас С. (2007). Оптимальная остановка и приложения . Калифорнийский университет в Лос-Анджелесе.
  3. ^ Хилл, Теодор П. (2009). «Знать, когда остановиться». Американский учёный . 97 (2): 126–133. дои : 10.1511/2009.77.126 . ISSN   1545-2786 . S2CID   124798270 .
    (Перевод на французский язык см. на обложке июльского номера журнала Pour la Science (2009).)
  4. ^ Jump up to: а б Пескир, Горан; Ширяев, Альберт (2006). Оптимальная остановка и задачи со свободной границей . Лекции по математике. ETH Цюрих. дои : 10.1007/978-3-7643-7390-0 . ISBN  978-3-7643-2419-3 .
  5. ^ Оксендалл, Б. ; Сулем, А. (2007). Прикладное стохастическое управление скачкообразными диффузиями . дои : 10.1007/978-3-540-69826-5 . ISBN  978-3-540-69825-8 . S2CID   123531718 .
  6. ^ Фергюсон, Томас С .; Класс, Майкл Дж. (2010). «Поиски дома без вторых мгновений». Последовательный анализ . 29 (3): 236–244. дои : 10.1080/07474946.2010.487423 . ISSN   0747-4946 .
  7. ^ Маккуин, Дж.; Миллер-младший, Р.Г. (1960). «Оптимальная политика сохранения». Исследование операций . 8 (3): 362–380. дои : 10.1287/opre.8.3.362 . ISSN   0030-364X .
  8. ^ Карацас, Иоаннис; Шрив, Стивен Э. (1998). Методы математических финансов . Стохастическое моделирование и прикладная теория вероятности. Том. 39. дои : 10.1007/b98840 . ISBN  978-0-387-94839-3 .

Источники

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5f9f79a015fd9b80d07ea1f396e91b04__1713507300
URL1:https://arc.ask3.ru/arc/aa/5f/04/5f9f79a015fd9b80d07ea1f396e91b04.html
Заголовок, (Title) документа по адресу, URL1:
Optimal stopping - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)