Jump to content

Марковская модель вознаграждения

В теории вероятностей модель вознаграждения Маркова или процесс вознаграждения Маркова — это стохастический процесс, который расширяет либо цепь Маркова , либо цепь Маркова с непрерывным временем , добавляя ставку вознаграждения к каждому состоянию. Дополнительная переменная записывает вознаграждение, накопленное к текущему моменту. [1] Особенности модели, представляющие интерес, включают ожидаемое вознаграждение в данный момент времени и ожидаемое время для накопления данного вознаграждения. [2] Модель появляется в Рональда А. Ховарда . книге [3] Модели часто изучаются в контексте марковских процессов принятия решений , где стратегия принятия решений может повлиять на получаемое вознаграждение.

Инструмент Markov Reward Model Checker можно использовать для численного расчета переходных и стационарных свойств моделей вознаграждения Маркова.

Цепь Маркова с непрерывным временем

[ редактировать ]

Накопленное вознаграждение в момент времени t может быть вычислено численно во временной области или путем оценки линейной гиперболической системы уравнений, которая описывает накопленное вознаграждение, с использованием методов преобразования или методов конечных разностей. [4]

См. также

[ редактировать ]
  1. ^ Бегейн, К.; Болч, Г.; Герольд, Х. (2001). «Теоретическая основа». Практическое моделирование производительности . стр. 9 . дои : 10.1007/978-1-4615-1387-2_2 . ISBN  978-1-4613-5528-1 .
  2. ^ Ли, Квинсленд (2010). «Марковские процессы вознаграждения». Конструктивные вычисления в стохастических моделях с приложениями . стр. 526–573. дои : 10.1007/978-3-642-11492-2_10 . ISBN  978-3-642-11491-5 .
  3. ^ Ховард, РА (1971). Динамические вероятностные системы, Том II: Полумарковские процессы и процессы принятия решений . Нью-Йорк: Уайли. ISBN  0471416657 .
  4. ^ Рейбман, А.; Смит, Р.; Триведи, К. (1989). «Анализ переходных процессов модели Маркова и вознаграждения Маркова: обзор численных подходов» (PDF) . Европейский журнал операционных исследований . 40 (2): 257. дои : 10.1016/0377-2217(89)90335-4 .


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e7a82345801956eca6f33ef7dd3d7192__1710289980
URL1:https://arc.ask3.ru/arc/aa/e7/92/e7a82345801956eca6f33ef7dd3d7192.html
Заголовок, (Title) документа по адресу, URL1:
Markov reward model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)