Теория обновления
Теория возобновления — это раздел теории вероятностей , который обобщает процесс Пуассона для произвольного времени удерживания. Вместо экспоненциально распределенных времен удержания процесс обновления может иметь любое независимое и одинаково распределенное (IID) время удержания, имеющее конечное среднее значение. Процесс продления-вознаграждения дополнительно имеет случайную последовательность вознаграждений, получаемых в каждое время удержания, которые являются IID, но не обязательно должны быть независимыми от времени удержания.
Процесс восстановления имеет асимптотические свойства, аналогичные усиленному закону больших чисел и центральной предельной теореме . Функция обновления (ожидаемое количество прибытий) и функция вознаграждения (ожидаемая величина вознаграждения) имеют ключевое значение в теории обновления. Функция восстановления удовлетворяет рекурсивному интегральному уравнению — уравнению восстановления. Ключевое уравнение восстановления дает предельное свертки значение с подходящей неотрицательной функцией. Суперпозицию процессов восстановления можно изучать как частный случай марковских процессов восстановления .
Приложения включают расчет лучшей стратегии замены изношенного оборудования на заводе и сравнение долгосрочных выгод от различных страховых полисов. Парадокс проверки связан с тем фактом, что наблюдение интервала обновления в момент времени t дает интервал со средним значением, большим, чем средний интервал обновления.
Процессы обновления
[ редактировать ]Введение
[ редактировать ]Процесс восстановления является обобщением процесса Пуассона . По сути, процесс Пуассона представляет собой марковский процесс с непрерывным временем для положительных целых чисел (обычно начиная с нуля), который имеет независимые экспоненциально распределенные времена удержания для каждого целого числа. прежде чем перейти к следующему целому числу, . В процессе возобновления время ожидания не обязательно должно иметь экспоненциальное распределение; скорее, времена удержания могут иметь любое распределение по положительным числам, при условии, что времена удержания независимы и одинаково распределены ( IID ) и имеют конечное среднее значение.
Формальное определение
[ редактировать ]Позволять быть последовательностью положительных независимых одинаково распределенных случайных величин с конечным математическим ожиданием.
Мы имеем в виду случайную величину как " -е время выдержки".
Определите для каждого n > 0:
каждый упоминается как « -е время прыжка" и интервалы называются «интервалами обновления».
Затем задается случайной величиной
где индикаторная функция
представляет количество скачков, произошедших к моменту времени t , и называется процессом восстановления.
Интерпретация
[ редактировать ]Если рассматривать события, происходящие в случайное время, можно подумать о времени удержания. как случайное время, прошедшее между двумя последовательными событиями. Например, если процесс обновления моделирует количество поломок различных машин, то время ожидания представляет собой время между выходом одной машины из строя до того, как выйдет из строя другая.
Процесс Пуассона — это уникальный процесс восстановления, обладающий марковским свойством . [1] поскольку экспоненциальное распределение является единственной непрерывной случайной величиной, обладающей свойством безпамяти.
Процессы продления и вознаграждения
[ редактировать ]Позволять быть последовательностью случайных величин IID ( наград ), удовлетворяющих
Тогда случайная величина
называется процессом возобновления-вознаграждения . Обратите внимание, что в отличие от , каждый может принимать как отрицательные, так и положительные значения.
Случайная величина зависит от двух последовательностей: времени выдержки и награды Эти две последовательности не обязательно должны быть независимыми. В частности, может быть функциейиз .
Интерпретация
[ редактировать ]В контексте приведенной выше интерпретации времени выдержки как времени между последовательными неисправностями машины «награды» (которые в данном случае оказываются отрицательными) можно рассматривать как последовательные затраты на ремонт, понесенные в результате последовательных неисправностей.
Альтернативная аналогия: у нас есть волшебная гусь, которая откладывает яйца через определенные промежутки времени (время выдержки), распределенное как . Иногда он откладывает золотые яйца случайного веса, а иногда — токсичные яйца (тоже случайного веса), требующие ответственной (и дорогостоящей) утилизации. «Награды» — это последовательные (случайные) финансовые потери/прибыли, возникающие в результате последовательных яиц ( i = 1,2,3,...) и записывает общее финансовое «вознаграждение» в момент времени t .
Функция продления
[ редактировать ]Мы определяем функцию восстановления как математическое ожидание числа скачков, наблюдавшихся до некоторого момента времени. :
Элементарная теорема восстановления
[ редактировать ]Функция восстановления удовлетворяет
Доказательство
Элементарная теорема возобновления для процессов вознаграждения за возобновление
[ редактировать ]Определим функцию вознаграждения :
Функция вознаграждения удовлетворяет
Уравнение обновления
[ редактировать ]Функция восстановления удовлетворяет
где — кумулятивная функция распределения и – соответствующая функция плотности вероятности.
Доказательство [2]
Ключевая теорема восстановления
[ редактировать ]Пусть X — процесс восстановления с функцией восстановления и среднее междувозобновлением . Позволять быть функцией, удовлетворяющей:
- g монотонно и не возрастает
Ключевая теорема восстановления утверждает, что, поскольку : [3]
Теорема восстановления
[ редактировать ]Учитывая для любого дает в качестве частного случая теорему восстановления: [4]
- как
Результат можно доказать с помощью интегральных уравнений или аргумента связи . [5] Хотя это частный случай ключевой теоремы восстановления, его можно использовать для вывода полной теоремы путем рассмотрения ступенчатых функций и последующего возрастания последовательностей ступенчатых функций. [3]
Асимптотические свойства
[ редактировать ]Процессы обновления и процессы возобновления-вознаграждения обладают свойствами, аналогичными усиленному закону больших чисел , который можно вывести из той же теоремы. Если представляет собой процесс обновления и это процесс обновления-вознаграждения, тогда:
почти наверняка.
Доказательство
Процессы восстановления дополнительно обладают свойством, аналогичным центральной предельной теореме : [6]
Инспекционный парадокс
[ редактировать ]Любопытная особенность процессов обновления заключается в том, что если мы подождём какое-то заранее определённое время t , а затем посмотрим, насколько велик интервал обновления, содержащий t , мы должны ожидать, что он обычно будет больше, чем интервал обновления среднего размера.
Математически парадокс проверки гласит: для любого t > 0 интервал обновления, содержащий t, стохастически больше, чем первый интервал обновления. То есть для всех x > 0 и для всех t > 0:
где F S — кумулятивная функция распределения времен удерживания IID S i . Ярким примером является парадокс времени ожидания автобуса : при данном случайном распределении прибытия автобусов средний пассажир на автобусной остановке наблюдает больше задержек, чем средний оператор автобусов.
Разрешение парадокса состоит в том, что наше выборочное распределение в момент времени t смещено по размеру (см. смещение выборки ), поскольку вероятность выбора интервала пропорциональна его размеру. Однако интервал обновления среднего размера не зависит от размера.
Доказательство
Суперпозиция
[ редактировать ]Если процесс восстановления не является процессом Пуассона, суперпозиция (сумма) двух независимых процессов восстановления не является процессом восстановления. [7] Однако такие процессы можно описать в рамках более широкого класса процессов, называемых процессами марковского обновления . [8] Однако кумулятивная функция распределения первого времени между событиями в процессе суперпозиции определяется выражением [9]
где R k ( t ) и α k > 0 — CDF времен между событиями и скорости прибытия процесса k . [10]
Пример приложения
[ редактировать ]Предприниматель Эрик имеет n машин, срок службы каждой из которых равномерно распределен между нулем и двумя годами. Эрик может позволить каждой машине работать до тех пор, пока она не выйдет из строя, стоимость замены составит 2600 евро; в качестве альтернативы он может заменить машину в любое время, пока она еще работает, за 200 евро.
Какова его оптимальная политика замены?
Решение
См. также
[ редактировать ]Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Июль 2010 г. ) |
Примечания
[ редактировать ]- ^ Гримметт и Стирзакер (1992) , с. 393.
- ^ Гримметт и Стирзакер (1992) , с. 390.
- ^ Jump up to: а б с Гримметт и Стирзакер (1992) , с. 395.
- ^ Феллер (1971) , с. 347–351.
- ^ Гримметт и Стирзакер (1992) , с. 394–5.
- ^ Jump up to: а б Гримметт и Стирзакер (1992) , с. 394.
- ^ Гримметт и Стирзакер (1992) , с. 405.
- ^ Чинлар, Эрхан (1969). «Теория Марковского обновления». Достижения в области прикладной теории вероятности . 1 (2). Прикладное вероятностное доверие: 123–187. дои : 10.2307/1426216 . JSTOR 1426216 .
- ^ Лоуренс, Эй Джей (1973). «Зависимость интервалов между событиями в процессах суперпозиции». Журнал Королевского статистического общества. Серия Б (Методическая) . 35 (2): 306–315. дои : 10.1111/j.2517-6161.1973.tb00960.x . JSTOR 2984914 . формула 4.1
- ^ Чунгмо Фофак, Никез; Нейн, Филипп; Нелья, Джованни; Таусли, Дон (6 марта 2012 г.). Анализ сетей кэширования на основе TTL . Материалы 6-й Международной конференции по методологиям и инструментам оценки эффективности (отчет) . Проверено 15 ноября 2012 г.
Ссылки
[ редактировать ]- Кокс, Дэвид (1970). Теория обновления . Лондон: Methuen & Co. 142. ИСБН 0-412-20570-Х .
- Дуб, Дж.Л. (1948). «Теория обновления с точки зрения теории вероятностей» (PDF) . Труды Американского математического общества . 63 (3): 422–438. дои : 10.2307/1990567 . JSTOR 1990567 .
- Феллер, Уильям (1971). Введение в теорию вероятностей и ее приложения . Том. 2 (второе изд.). Уайли.
- Гриметт, Греция ; Стирзакер, Д.Р. (1992). Вероятность и случайные процессы (второе изд.). Издательство Оксфордского университета. ISBN 0198572220 .
- Смит, Уолтер Л. (1958). «Теория обновления и ее последствия». Журнал Королевского статистического общества, серия B. 20 (2): 243–302. JSTOR 2983891 .
- Ванли Ван, Йоханнес Х. П. Шульц, Вэйхуа Дэн и Эли Баркай (2018). «Теория обновления с распределенным временем пребывания: типичное и редкое». Физ. Преподобный Е. 98 (4): 042139. arXiv : 1809.05856 . Бибкод : 2018PhRvE..98d2139W . дои : 10.1103/PhysRevE.98.042139 . S2CID 54727926 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )