Jump to content

Экспоненциальное распределение

Страница полузащищена

Экспоненциальный
Функция плотности вероятности
график функции плотности вероятности экспоненциального распределения
Кумулятивная функция распределения
Кумулятивная функция распределения
Параметры ставка или обратная шкала
Поддерживать
PDF
CDF
Квантиль
Иметь в виду
медиана
Режим
Дисперсия
асимметрия
Избыточный эксцесс
Энтропия
МГФ
CF
Информация о Фишере
Расхождение Кульбака – Лейблера
Ожидаемый дефицит

В теории вероятностей и статистике экспоненциальное распределение или отрицательное экспоненциальное распределение — это распределение вероятностей расстояния между событиями в точечном процессе Пуассона , т. е. процессе, в котором события происходят непрерывно и независимо с постоянной средней скоростью; параметром расстояния может быть любая значимая одномерная мера процесса, например, время между производственными ошибками или длина рулона ткани в процессе ткацкого производства. Это частный случай гамма -распределения . Это непрерывный аналог геометрического распределения , и его ключевым свойством является отсутствие памяти . Помимо использования для анализа точечных процессов Пуассона, он встречается и в различных других контекстах.

Показательное распределение — это не то же самое, что класс экспоненциальных семейств распределений. Это большой класс вероятностных распределений, который включает экспоненциальное распределение в качестве одного из своих членов, но также включает в себя множество других распределений, таких как нормальное , биномиальное , гамма- распределение и распределение Пуассона .

Определения

Функция плотности вероятности

Функция плотности вероятности (pdf) экспоненциального распределения равна

Здесь λ > 0 — параметр распределения, часто называемый параметром скорости . Распределение поддерживается на интервале [0, ∞) . Если случайная величина X имеет такое распределение, мы пишем X ~ Exp( λ ) .

Экспоненциальное распределение демонстрирует бесконечную делимость .

Кумулятивная функция распределения

Кумулятивная функция распределения определяется выражением

Альтернативная параметризация

Экспоненциальное распределение иногда параметризуется с помощью масштабного параметра β = 1/ λ , который также является средним значением:

Характеристики

Среднее значение, дисперсия, моменты и медиана

Среднее значение — это вероятностный центр масс, то есть первый момент .
Медиана — это прообраз F −1 (1/2).

Среднее или ожидаемое значение экспоненциально распределенной случайной величины X с параметром скорости λ определяется выражением

В свете приведенных ниже примеров это имеет смысл; человек, который принимает в среднем два телефонных звонка в час, может рассчитывать, что время между последовательными звонками составит 0,5 часа или 30 минут.

Дисперсия выражением X определяется поэтому стандартное отклонение равно среднему значению.

Моменты X для , даны

Центральные моменты X для , даны где ! n является субфакториалом n

Медиана X выражением определяется где ln относится к натуральному логарифму . Таким образом, абсолютная разница между средним значением и медианой равна

в соответствии с медианно-средним неравенством .

Свойство безпамяти экспоненциальной случайной величины

Экспоненциально распределенная случайная величина T подчиняется соотношению

В этом можно убедиться, рассмотрев дополнительную кумулятивную функцию распределения :

Когда T интерпретируется как время ожидания возникновения события относительно некоторого начального времени, это соотношение подразумевает, что, если T обусловлено невозможностью наблюдения события в течение некоторого начального периода времени s , распределение оставшегося времени ожидания такое же, как исходное безусловное распределение. Например, если событие не произошло через 30 секунд, условная вероятность того, что возникновение займет еще как минимум 10 секунд, равна безусловной вероятности наблюдения события более чем через 10 секунд после начального времени.

Экспоненциальное распределение и геометрическое распределение являются единственными распределениями вероятностей без памяти .

Следовательно, экспоненциальное распределение также обязательно является единственным непрерывным распределением вероятностей, имеющим постоянную частоту отказов .

Квантили

Критерии аномалии Тьюки для экспоненциальной функции распределения вероятностей.
Критерии Тьюки для аномалий. [ нужна ссылка ]

Функция квантиля (обратная кумулятивная функция распределения) для Exp( λ ) равна

составляют Таким образом , квартили :

  • первый квартиль: ln(4/3)/ λ
  • медиана : ln(2)/ λ
  • третий квартиль: ln(4)/ λ

И, как следствие, межквартильный размах равен ln(3)/ λ .

Условная стоимость под угрозой (ожидаемый дефицит)

Условное значение риска (CVaR), также известное как ожидаемый дефицит или суперквантиль для Exp( λ ), рассчитывается следующим образом: [1]

Буферизованная вероятность превышения (bPOE)

Буферизованная вероятность превышения равна единице минус уровень вероятности, при котором CVaR равен порогу. . Его получают следующим образом: [1]

Расхождение Кульбака – Лейблера

Направленное расхождение Кульбака–Лейблера в нац . («приблизительное» распределение) от («истинное» распределение) определяется выражением

Максимальное распределение энтропии

Среди всех непрерывных распределений вероятностей с носителем [0, ∞) и средним значением µ экспоненциальное распределение с λ = 1/ µ имеет наибольшую дифференциальную энтропию . Другими словами, это максимальное распределение вероятностей энтропии для случайной величины X , которая больше или равна нулю и для которой E[ X ] фиксировано. [2]

Распределение минимума экспоненциальных случайных величин

Пусть X 1 , …, X n независимые экспоненциально распределенные случайные величины со скоростными параметрами λ 1 , …, λ n . Затем также распределено экспоненциально с параметром

В этом можно убедиться, рассмотрев дополнительную кумулятивную функцию распределения :

Индекс переменной, достигшей минимума, распределяется согласно категориальному распределению.

Доказательство можно увидеть, позволив . Затем,

Обратите внимание, что не распределяется экспоненциально, если X 1 , …, X n имеют параметр 0. не все [3]

Совместные моменты статистики экспоненциального порядка iid

Позволять быть независимые и одинаково распределенные экспоненциальные случайные величины с параметром скорости λ . Позволять обозначают соответствующую порядковую статистику . Для , совместный момент статистики заказов и дается

В этом можно убедиться, обратившись к закону полного ожидания и свойству отсутствия памяти:

Первое уравнение следует из закона полного ожидания .Второе уравнение использует тот факт, что как только мы ставим условие на , из этого должно следовать, что . Третье уравнение основано на свойстве отсутствия памяти для замены с .

Сумма двух независимых экспоненциальных случайных величин

Функция распределения вероятностей (PDF) суммы двух независимых случайных величин представляет собой свертку их отдельных PDF-файлов . Если и являются независимыми экспоненциальными случайными величинами с соответствующими параметрами скорости и тогда плотность вероятности дается Энтропия этого распределения доступна в закрытой форме: полагая (без ограничения общности), тогда где постоянная Эйлера-Машерони , а это дигамма-функция . [4]

В случае равных скоростей параметров результатом является распределение Эрланга с формой 2 и параметром что, в свою очередь, является частным случаем гамма-распределения .

Сумма n независимых Exp( λ) экспоненциальных случайных величин распределена по схеме Gamma(n, λ) .

  • Если X ~ Лапласа(μ, β −1 ) , тогда | Икс - мкм| ~ Эксп(β).
  • Если X ~ Парето(1, λ) , то log( X ) ~ Exp(λ).
  • Если X ~ SkewLogistic(θ) , то .
  • Если X i ~ U (0, 1), то
  • Экспоненциальное распределение является пределом масштабированного бета-распределения :
  • Экспоненциальное распределение является частным случаем распределения Пирсона 3-го типа .
  • Экспоненциальное распределение является частным случаем гамма-распределения с параметром формы 1.
  • Если X ~ Exp(λ) и X i ~ Exp(λ i ), то:
    • , замыкание при масштабировании положительным коэффициентом.
    • 1 + X ~ Бенктандер-Вейбулл (λ, 1), что сводится к усеченному экспоненциальному распределению.
    • тот Х ~ Парето ( k , λ).
    • и −X ~ Бета (л, 1).
    • 1 / k e Х ~ PowerLaw ( k , λ)
    • , распределение Рэлея
    • , распределение Вейбулла
    • µ − β log(λ X ) ∼ Гумбел (µ, β) .
    • , геометрическое распределение на 0,1,2,3,...
    • , геометрическое распределение на 1,2,3,4,...
    • Если также Y ~ Erlang( n , λ) или затем
    • Если также λ ~ Gamma ( k , θ) (параметризация формы, масштаба), то маргинальное распределение X равно Lomax ( k , 1/θ), гамма- смесь
    • λ 1 Икс 1 - λ 2 Y 2 ~ Лаплас(0, 1) .
    • min{ X 1 , ..., X n } ~ Exp(λ 1 + ... + λ n ).
    • Если также λ i = λ, то:
      • Эрланг ( k , λ) = Гамма ( k , λ −1 ) = Gamma( k , λ) (в параметризации ( k , θ ) и (α, β) соответственно) с целочисленным параметром формы k. [5]
      • Если , затем .
      • X i X j ~ Лапласа(0, λ −1 ).
    • Если также X i независимы, то:
      • ~ В (0, 1)
      • имеет функцию плотности вероятности . Это можно использовать для получения доверительного интервала для .
    • Если также λ = 1:
      • , логистическое распределение
      • μ − σ log( X ) ~ GEV(μ, σ, 0) .
      • Далее, если затем ( K-распределение )
    • Если также λ = 1/2, то X ∼ χ 2
      2
      ; т. е. X имеет распределение хи-квадрат с 2 степенями свободы . Следовательно:
  • Если и ~ Пуассон( X ) тогда ( геометрическое распределение )
  • Распределение Хойта можно получить из экспоненциального распределения и арксинусного распределения.
  • Экспоненциальное распределение является пределом κ -экспоненциального распределения в случай.
  • Экспоненциальное распределение является пределом κ-обобщенного гамма-распределения в и случаи:

Другие связанные дистрибутивы:

Статистический вывод

Ниже предположим, что случайная величина X экспоненциально распределена с параметром скорости λ, и являются n независимыми выборками из X со средним значением выборки .

Оценка параметров

Оценка максимального правдоподобия для λ строится следующим образом.

Функция правдоподобия для λ, учитывая независимую и одинаково распределенную выборку x = ( x 1 , …, x n ), полученную из переменной, равна:

где: – выборочное среднее.

Производная логарифма функции правдоподобия равна:

Следовательно, оценка максимального правдоподобия для параметра скорости равна:

Это не объективная оценка хотя является беспристрастным [6] МЛЭ [7] оценщик и среднее распределение.

Предвзятость равно что дает оценку максимального правдоподобия с поправкой на смещение

Приблизительный минимизатор среднеквадратической ошибки (см. также: компромисс между смещением и дисперсией ) можно найти, предполагая, что размер выборки больше двух, с поправочным коэффициентом для MLE: Это значение получено из среднего значения и дисперсии обратного гамма-распределения , . [8]

Информация о Фишере

Информация Фишера , обозначаемая , для оценки параметра скорости дается как:

Подключение распределения и решение дает:

Это определяет объем информации, которую несет каждая независимая выборка экспоненциального распределения о неизвестном параметре скорости. .

Доверительные интервалы

Точный 100(1 - α)% доверительный интервал для параметра скорости экспоненциального распределения определяется следующим образом: [9] что также равно где х 2
p , v
100( p ) процентиль распределения хи-квадрат с v степенями свободы , n — количество наблюдений, а x-bar — среднее значение выборки. Простую аппроксимацию точных конечных точек интервала можно получить, используя нормальную аппроксимацию χ 2
p , v
распределение. Это приближение дает следующие значения для 95% доверительного интервала:

Такое приближение может быть приемлемым для образцов, содержащих не менее 15–20 элементов. [10]

Байесовский вывод

Сопряженным априором экспоненциального распределения является гамма-распределение (частным случаем которого является экспоненциальное распределение). Полезна следующая параметризация функции плотности вероятности гамма-излучения:

Затем апостериорное распределение p можно выразить через функцию правдоподобия, определенную выше, и априорную гамму:

Теперь апостериорная плотность p задана с точностью до отсутствующей нормировочной константы. Поскольку он имеет форму гамма-pdf, его можно легко заполнить и получить:

Здесь гиперпараметр α можно интерпретировать как количество предыдущих наблюдений, а β — как сумму предыдущих наблюдений.Апостериорное среднее здесь равно:

Возникновение и применение

Возникновение событий

Экспоненциальное распределение возникает естественным образом при описании длин времен между приходами в однородном пуассоновском процессе .

Экспоненциальное распределение можно рассматривать как непрерывный аналог геометрического распределения , которое описывает количество испытаний Бернулли, необходимых для того, чтобы дискретный процесс изменил состояние. Напротив, экспоненциальное распределение описывает время, в течение которого непрерывный процесс меняет состояние.

В реальных сценариях предположение о постоянной скорости (или вероятности в единицу времени) редко выполняется. Например, скорость входящих телефонных звонков различается в зависимости от времени суток. Но если мы сосредоточимся на временном интервале, в течение которого скорость примерно постоянна, например, с 14 до 16 часов в рабочие дни, экспоненциальное распределение можно использовать в качестве хорошей приближенной модели времени до следующего телефонного звонка. Аналогичные предостережения применимы к следующим примерам, которые дают примерно экспоненциально распределенные переменные:

  • Время до распада радиоактивной частицы , или время между щелчками счетчика Гейгера
  • Время между получением одного телефонного звонка и следующего
  • Время до дефолта (при выплате держателям долга компании) при моделировании кредитного риска в сокращенной форме

Экспоненциальные переменные также можно использовать для моделирования ситуаций, когда определенные события происходят с постоянной вероятностью на единицу длины, например, расстояние между мутациями в цепи ДНК или между дорожно-транспортными происшествиями на данной дороге.

В теории массового обслуживания время обслуживания агентов в системе (например, сколько времени требуется кассиру банка и т. д. для обслуживания клиента) часто моделируется как экспоненциально распределенные переменные. (Например, поступление клиентов также моделируется распределением Пуассона , если поступления независимы и распределены одинаково.) Длина процесса, который можно рассматривать как последовательность нескольких независимых задач, соответствует распределению Эрланга (которое представляет собой распределение суммы нескольких независимых экспоненциально распределенных переменных). Теория надежности и инженерия надежности также широко используют экспоненциальное распределение. Из-за отсутствия памяти у этого распределения оно хорошо подходит для моделирования с постоянной степенью опасности, части кривой ванны используемой в теории надежности. можно легко добавить интенсивность отказов Это также очень удобно, поскольку в модель надежности . Однако экспоненциальное распределение не подходит для моделирования общего срока службы организмов или технических устройств, поскольку «частота отказов» здесь не является постоянной: больше отказов происходит как для очень молодых, так и для очень старых систем.

Подобрано кумулятивное экспоненциальное распределение максимального годового количества осадков за 1 день с использованием CumFreq. [11]

В физике , если вы наблюдаете газ при фиксированной температуре и давлении в однородном гравитационном поле , высоты различных молекул также подчиняются приблизительному экспоненциальному распределению, известному как барометрическая формула . Это следствие упомянутого ниже свойства энтропии.

В гидрологии экспоненциальное распределение используется для анализа экстремальных значений таких переменных, как месячные и годовые максимальные значения суточного количества осадков и объемы речного стока. [12]

Синее изображение иллюстрирует пример подбора экспоненциального распределения к ранжированному максимальному годовому количеству осадков за один день, демонстрируя также 90% доверительный интервал, основанный на биномиальном распределении . Данные об осадках представлены в виде координат на графике в рамках кумулятивного частотного анализа .

В управлении операционными залами - распределение продолжительности операции по категориям операций без типичного содержания труда (например, в отделении неотложной помощи, охватывающее все виды операций).

Прогноз

После наблюдения выборки из n точек данных из неизвестного экспоненциального распределения общая задача состоит в том, чтобы использовать эти выборки для прогнозирования будущих данных из того же источника. Распространенным прогнозным распределением по будущим выборкам является так называемое подключаемое распределение, формируемое путем включения подходящей оценки параметра скорости λ в функцию экспоненциальной плотности. Обычным выбором оценки является тот, который обеспечивается принципом максимального правдоподобия, и его использование дает прогнозную плотность для будущей выборки x n +1 , обусловленную наблюдаемыми выборками x = ( x 1 , ..., x n ) данный

Байесовский подход обеспечивает прогнозируемое распределение, которое учитывает неопределенность оцениваемого параметра, хотя это может существенно зависеть от выбора априора.

Прогнозирующее распределение, свободное от проблем выбора априорных значений, возникающих при субъективном байесовском подходе, - это

который можно рассматривать как

  1. частотное доверительное распределение , полученное из распределения основной величины ; [13]
  2. прогнозируемая вероятность профиля, полученная путем исключения параметра λ из совместной вероятности x n +1 и λ путем максимизации; [14]
  3. объективное байесовское предсказательное апостериорное распределение, полученное с использованием неинформативного Джеффриса априорного 1/ λ ;
  4. прогнозируемое распределение условного нормализованного максимального правдоподобия (CNML), исходя из соображений теории информации. [15]

Точность прогнозируемого распределения может быть измерена с использованием расстояния или расхождения между истинным экспоненциальным распределением с параметром скорости λ 0 и прогнозирующим распределением на основе выборки x . Дивергенция Кульбака -Лейблера - это широко используемая, не требующая параметризации мера разницы между двумя распределениями. Обозначая Δ( λ 0 || p ) расхождение Кульбака – Лейблера между экспонентой с параметром скорости λ 0 и прогнозирующим распределением p, можно показать, что

где математическое ожидание берется относительно экспоненциального распределения с параметром скорости λ 0 ∈ (0, ∞) , а ψ( · ) – дигамма-функция. Ясно, что прогнозирующее распределение CNML строго превосходит подключаемое распределение максимального правдоподобия с точки зрения среднего расхождения Кульбака-Лейблера для всех размеров выборки n > 0 .

Генерация случайной переменной

Концептуально очень простой метод генерации экспоненциальных переменных основан на выборке обратного преобразования : учитывая случайную величину U, полученную из равномерного распределения на единичном интервале (0, 1) , переменная

имеет показательное распределение, где F −1 функция квантиля , определяемая формулой

Более того, если U равномерен на (0, 1), то и 1 − U равномерен . Это означает, что можно генерировать экспоненциальные переменные следующим образом:

Другие методы генерации экспоненциальных переменных обсуждаются Кнутом. [16] и Деврой. [17]

Также доступен быстрый метод генерации набора готовых упорядоченных экспоненциальных переменных без использования процедуры сортировки. [17]

См. также

Ссылки

  1. ^ Jump up to: а б Нортон, Мэтью; Хохлов, Валентин; Урясев, Стэн (2019). «Расчет CVaR и bPOE для распространенных распределений вероятностей с применением для оптимизации портфеля и оценки плотности» (PDF) . Анналы исследования операций . 299 (1–2). Спрингер: 1281–1315. дои : 10.1007/s10479-019-03373-1 . Архивировано из оригинала (PDF) 31 марта 2023 г. Проверено 27 февраля 2023 г.
  2. ^ Пак, Сон Ю.; Бера, Анил К. (2009). «Модель условной гетероскедастичности авторегрессии с максимальной энтропией» (PDF) . Журнал эконометрики . 150 (2). Эльзевир: 219–230. doi : 10.1016/j.jeconom.2008.12.014 . Архивировано из оригинала (PDF) 7 марта 2016 г. Проверено 2 июня 2011 г.
  3. ^ Майкл, Луго. «Ожидание максимума экспоненты» (PDF) . Архивировано из оригинала (PDF) 20 декабря 2016 года . Проверено 13 декабря 2016 г.
  4. ^ Экфорд, Эндрю В.; Томас, Питер Дж. (2016). «Энтропия суммы двух независимых, неидентично распределенных экспоненциальных случайных величин». arXiv : 1609.02911 [ cs.IT ].
  5. ^ Ибе, Оливер К. (2014). Основы прикладной теории вероятности и случайных процессов (2-е изд.). Академическая пресса. п. 128. ИСБН  9780128010358 .
  6. ^ Ричард Арнольд Джонсон; Дин В. Вичерн (2007). Прикладной многомерный статистический анализ . Пирсон Прентис Холл. ISBN  978-0-13-187715-3 . Проверено 10 августа 2012 г.
  7. ^ Электронный справочник NIST/SEMATECH по статистическим методам
  8. ^ Эльфесси, Абдулазиз; Рейнеке, Дэвид М. (2001). «Байесовский взгляд на классическую оценку: экспоненциальное распределение» . Журнал статистического образования . 9 (1). дои : 10.1080/10691898.2001.11910648 .
  9. ^ Росс, Шелдон М. (2009). Введение в вероятность и статистику для инженеров и ученых (4-е изд.). Ассошиэйтед Пресс. п. 267. ИСБН  978-0-12-370483-2 .
  10. ^ Геррьеро, В. (2012). «Распределение по степенному закону: метод многомасштабной логической статистики» . Журнал современной математики Frontier . 1 : 21–28.
  11. ^ «Cumfreq, бесплатная компьютерная программа для совокупного частотного анализа» .
  12. ^ Ритзема, HP, изд. (1994). Частотный и регрессионный анализ . Глава 6 в: Принципы и применение дренажа, Публикация 16, Международный институт мелиорации и улучшения земель (ILRI), Вагенинген, Нидерланды. стр. 175–224 . ISBN  90-70754-33-9 .
  13. ^ Лоулесс, Дж. Ф.; Фредетт, М. (2005). «Интервалы частотных предсказаний и прогнозные распределения». Биометрика . 92 (3): 529–542. дои : 10.1093/biomet/92.3.529 .
  14. ^ Бьёрнстад, Дж. Ф. (1990). «Прогнозируемая вероятность: обзор» . Статист. Наука . 5 (2): 242–254. дои : 10.1214/ss/1177012175 .
  15. ^ Д. Ф. Шмидт и Э. Макалич, « Универсальные модели экспоненциального распределения », Транзакции IEEE по теории информации , том 55, номер 7, стр. 3087–3090, 2009 г. два : 10.1109/TIT.2009.2018331
  16. ^ Дональд Э. Кнут (1998). Искусство компьютерного программирования , том 2: Получисловые алгоритмы , 3-е изд. Бостон: Аддисон-Уэсли. ISBN   0-201-89684-2 . См. раздел 3.4.1, с. 133.
  17. ^ Jump up to: а б Люк Деврой (1986). Генерация неоднородной случайной переменной . Нью-Йорк: Springer-Verlag. ISBN   0-387-96305-7 . См. главу IX , раздел 2, стр. 392–401.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5f9c79b4b3d37de265b7fa38c6e7ad84__1718782740
URL1:https://arc.ask3.ru/arc/aa/5f/84/5f9c79b4b3d37de265b7fa38c6e7ad84.html
Заголовок, (Title) документа по адресу, URL1:
Exponential distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)