Jump to content

Теория обновления

(Перенаправлено из «Парадокса инспекции »)

Теория возобновления — это раздел теории вероятностей , который обобщает процесс Пуассона для произвольного времени удерживания. Вместо экспоненциально распределенных времен удержания процесс обновления может иметь любое независимое и одинаково распределенное (IID) время удержания, имеющее конечное среднее значение. Процесс продления-вознаграждения дополнительно имеет случайную последовательность вознаграждений, получаемых в каждое время удержания, которые являются IID, но не обязательно должны быть независимыми от времени удержания.

Процесс восстановления имеет асимптотические свойства, аналогичные усиленному закону больших чисел и центральной предельной теореме . Функция обновления (ожидаемое количество прибытий) и функция вознаграждения (ожидаемая величина вознаграждения) имеют ключевое значение в теории обновления. Функция восстановления удовлетворяет рекурсивному интегральному уравнению — уравнению восстановления. Ключевое уравнение восстановления дает предельное свертки значение с подходящей неотрицательной функцией. Суперпозицию процессов восстановления можно изучать как частный случай марковских процессов восстановления .

Приложения включают расчет лучшей стратегии замены изношенного оборудования на заводе и сравнение долгосрочных выгод от различных страховых полисов. Парадокс проверки связан с тем фактом, что наблюдение интервала обновления в момент времени t дает интервал со средним значением, большим, чем средний интервал обновления.

Процессы обновления

[ редактировать ]

Введение

[ редактировать ]

Процесс восстановления является обобщением процесса Пуассона . По сути, процесс Пуассона представляет собой марковский процесс с непрерывным временем для положительных целых чисел (обычно начиная с нуля), который имеет независимые экспоненциально распределенные времена удержания для каждого целого числа. прежде чем перейти к следующему целому числу, . В процессе возобновления время ожидания не обязательно должно иметь экспоненциальное распределение; скорее, времена удержания могут иметь любое распределение по положительным числам, при условии, что времена удержания независимы и одинаково распределены ( IID ) и имеют конечное среднее значение.

Формальное определение

[ редактировать ]
Пример эволюции процесса восстановления со временем удержания S i и временем скачка J n .

Позволять быть последовательностью положительных независимых одинаково распределенных случайных величин с конечным математическим ожиданием.

Мы имеем в виду случайную величину как " -е время выдержки".

Определите для каждого n > 0:

каждый упоминается как « -е время прыжка" и интервалы называются «интервалами обновления».

Затем задается случайной величиной

где индикаторная функция

представляет количество скачков, произошедших к моменту времени t , и называется процессом восстановления.

Интерпретация

[ редактировать ]

Если рассматривать события, происходящие в случайное время, можно подумать о времени удержания. как случайное время, прошедшее между двумя последовательными событиями. Например, если процесс обновления моделирует количество поломок различных машин, то время ожидания представляет собой время между выходом одной машины из строя до того, как выйдет из строя другая.

Процесс Пуассона — это уникальный процесс восстановления, обладающий марковским свойством . [1] поскольку экспоненциальное распределение является единственной непрерывной случайной величиной, обладающей свойством безпамяти.

Процессы продления и вознаграждения

[ редактировать ]
Пример эволюции процесса возобновления и вознаграждения со ожидания Si и , временем перехода J n вознаграждениями Wi временем

Позволять быть последовательностью случайных величин IID ( наград ), удовлетворяющих

Тогда случайная величина

называется процессом возобновления-вознаграждения . Обратите внимание, что в отличие от , каждый может принимать как отрицательные, так и положительные значения.

Случайная величина зависит от двух последовательностей: времени выдержки и награды Эти две последовательности не обязательно должны быть независимыми. В частности, может быть функциейиз .

Интерпретация

[ редактировать ]

В контексте приведенной выше интерпретации времени выдержки как времени между последовательными неисправностями машины «награды» (которые в данном случае оказываются отрицательными) можно рассматривать как последовательные затраты на ремонт, понесенные в результате последовательных неисправностей.

Альтернативная аналогия: у нас есть волшебная гусь, которая откладывает яйца через определенные промежутки времени (время выдержки), распределенное как . Иногда он откладывает золотые яйца случайного веса, а иногда — токсичные яйца (тоже случайного веса), требующие ответственной (и дорогостоящей) утилизации. «Награды» — это последовательные (случайные) финансовые потери/прибыли, возникающие в результате последовательных яиц ( i = 1,2,3,...) и записывает общее финансовое «вознаграждение» в момент времени t .

Функция продления

[ редактировать ]

Мы определяем функцию восстановления как математическое ожидание числа скачков, наблюдавшихся до некоторого момента времени. :

Элементарная теорема восстановления

[ редактировать ]

Функция восстановления удовлетворяет

Элементарная теорема возобновления для процессов вознаграждения за возобновление

[ редактировать ]

Определим функцию вознаграждения :

Функция вознаграждения удовлетворяет

Уравнение обновления

[ редактировать ]

Функция восстановления удовлетворяет

где — кумулятивная функция распределения и – соответствующая функция плотности вероятности.

Ключевая теорема восстановления

[ редактировать ]

Пусть X — процесс восстановления с функцией восстановления и среднее междувозобновлением . Позволять быть функцией, удовлетворяющей:

  • g монотонно и не возрастает

Ключевая теорема восстановления утверждает, что, поскольку : [3]

Теорема восстановления

[ редактировать ]

Учитывая для любого дает в качестве частного случая теорему восстановления: [4]

как

Результат можно доказать с помощью интегральных уравнений или аргумента связи . [5] Хотя это частный случай ключевой теоремы восстановления, его можно использовать для вывода полной теоремы путем рассмотрения ступенчатых функций и последующего возрастания последовательностей ступенчатых функций. [3]

Асимптотические свойства

[ редактировать ]

Процессы обновления и процессы возобновления-вознаграждения обладают свойствами, аналогичными усиленному закону больших чисел , который можно вывести из той же теоремы. Если представляет собой процесс обновления и это процесс обновления-вознаграждения, тогда:

[6]

почти наверняка.

Процессы восстановления дополнительно обладают свойством, аналогичным центральной предельной теореме : [6]

Инспекционный парадокс

[ редактировать ]
Интервал обновления, определяемый случайной точкой t (показанной красным), стохастически больше, чем первый интервал обновления.

Любопытная особенность процессов обновления заключается в том, что если мы подождём какое-то заранее определённое время t , а затем посмотрим, насколько велик интервал обновления, содержащий t , мы должны ожидать, что он обычно будет больше, чем интервал обновления среднего размера.

Математически парадокс проверки гласит: для любого t > 0 интервал обновления, содержащий t, стохастически больше, чем первый интервал обновления. То есть для всех x > 0 и для всех t > 0:

где F S — кумулятивная функция распределения времен удерживания IID S i . Ярким примером является парадокс времени ожидания автобуса : при данном случайном распределении прибытия автобусов средний пассажир на автобусной остановке наблюдает больше задержек, чем средний оператор автобусов.

Разрешение парадокса состоит в том, что наше выборочное распределение в момент времени t смещено по размеру (см. смещение выборки ), поскольку вероятность выбора интервала пропорциональна его размеру. Однако интервал обновления среднего размера не зависит от размера.

Суперпозиция

[ редактировать ]

Если процесс восстановления не является процессом Пуассона, суперпозиция (сумма) двух независимых процессов восстановления не является процессом восстановления. [7] Однако такие процессы можно описать в рамках более широкого класса процессов, называемых процессами марковского обновления . [8] Однако кумулятивная функция распределения первого времени между событиями в процессе суперпозиции определяется выражением [9]

где R k ( t ) и α k > 0 — CDF времен между событиями и скорости прибытия процесса k . [10]

Пример приложения

[ редактировать ]

Предприниматель Эрик имеет n машин, срок службы каждой из которых равномерно распределен между нулем и двумя годами. Эрик может позволить каждой машине работать до тех пор, пока она не выйдет из строя, стоимость замены составит 2600 евро; в качестве альтернативы он может заменить машину в любое время, пока она еще работает, за 200 евро.

Какова его оптимальная политика замены?

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Гримметт и Стирзакер (1992) , с. 393.
  2. ^ Гримметт и Стирзакер (1992) , с. 390.
  3. ^ Jump up to: а б с Гримметт и Стирзакер (1992) , с. 395.
  4. ^ Феллер (1971) , с. 347–351.
  5. ^ Гримметт и Стирзакер (1992) , с. 394–5.
  6. ^ Jump up to: а б Гримметт и Стирзакер (1992) , с. 394.
  7. ^ Гримметт и Стирзакер (1992) , с. 405.
  8. ^ Чинлар, Эрхан (1969). «Теория Марковского обновления». Достижения в области прикладной теории вероятности . 1 (2). Прикладное вероятностное доверие: 123–187. дои : 10.2307/1426216 . JSTOR   1426216 .
  9. ^ Лоуренс, Эй Джей (1973). «Зависимость интервалов между событиями в процессах суперпозиции». Журнал Королевского статистического общества. Серия Б (Методическая) . 35 (2): 306–315. дои : 10.1111/j.2517-6161.1973.tb00960.x . JSTOR   2984914 . формула 4.1
  10. ^ Чунгмо Фофак, Никез; Нейн, Филипп; Нелья, Джованни; Таусли, Дон (6 марта 2012 г.). Анализ сетей кэширования на основе TTL . Материалы 6-й Международной конференции по методологиям и инструментам оценки эффективности (отчет) . Проверено 15 ноября 2012 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6939faa604e1b52c06b20af229f62879__1708940400
URL1:https://arc.ask3.ru/arc/aa/69/79/6939faa604e1b52c06b20af229f62879.html
Заголовок, (Title) документа по адресу, URL1:
Renewal theory - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)