Экспоненциальное распределение
Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Параметры | ставка или обратная шкала | ||
---|---|---|---|
Поддерживать | |||
CDF | |||
Квантиль | |||
Иметь в виду | |||
медиана | |||
Режим | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | |||
Энтропия | |||
МГФ | |||
CF | |||
Информация о Фишере | |||
Расхождение Кульбака – Лейблера | |||
Ожидаемый дефицит |
В теории вероятностей и статистике экспоненциальное распределение или отрицательное экспоненциальное распределение — это распределение вероятностей расстояния между событиями в точечном процессе Пуассона , т. е. процессе, в котором события происходят непрерывно и независимо с постоянной средней скоростью; параметром расстояния может быть любая значимая одномерная мера процесса, например, время между производственными ошибками или длина рулона ткани в процессе ткацкого производства. Это частный случай гамма -распределения . Это непрерывный аналог геометрического распределения , и его ключевым свойством является отсутствие памяти . Помимо использования для анализа точечных процессов Пуассона, он встречается и в различных других контекстах.
Показательное распределение — это не то же самое, что класс экспоненциальных семейств распределений. Это большой класс вероятностных распределений, который включает экспоненциальное распределение в качестве одного из своих членов, но также включает в себя множество других распределений, таких как нормальное , биномиальное , гамма- распределение и распределение Пуассона .
Определения
Функция плотности вероятности
Функция плотности вероятности (pdf) экспоненциального распределения равна
Здесь λ > 0 — параметр распределения, часто называемый параметром скорости . Распределение поддерживается на интервале [0, ∞) . Если случайная величина X имеет такое распределение, мы пишем X ~ Exp( λ ) .
Экспоненциальное распределение демонстрирует бесконечную делимость .
Кумулятивная функция распределения
Кумулятивная функция распределения определяется выражением
Альтернативная параметризация
Экспоненциальное распределение иногда параметризуется с помощью масштабного параметра β = 1/ λ , который также является средним значением:
Характеристики
Среднее значение, дисперсия, моменты и медиана
Среднее или ожидаемое значение экспоненциально распределенной случайной величины X с параметром скорости λ определяется выражением
В свете приведенных ниже примеров это имеет смысл; человек, который принимает в среднем два телефонных звонка в час, может рассчитывать, что время между последовательными звонками составит 0,5 часа или 30 минут.
Дисперсия выражением X определяется поэтому стандартное отклонение равно среднему значению.
Моменты X для , даны
Центральные моменты X для , даны где ! n является субфакториалом n
Медиана X выражением определяется где ln относится к натуральному логарифму . Таким образом, абсолютная разница между средним значением и медианой равна
в соответствии с медианно-средним неравенством .
Свойство безпамяти экспоненциальной случайной величины
Экспоненциально распределенная случайная величина T подчиняется соотношению
В этом можно убедиться, рассмотрев дополнительную кумулятивную функцию распределения :
Когда T интерпретируется как время ожидания возникновения события относительно некоторого начального времени, это соотношение подразумевает, что, если T обусловлено невозможностью наблюдения события в течение некоторого начального периода времени s , распределение оставшегося времени ожидания такое же, как исходное безусловное распределение. Например, если событие не произошло через 30 секунд, условная вероятность того, что возникновение займет еще как минимум 10 секунд, равна безусловной вероятности наблюдения события более чем через 10 секунд после начального времени.
Экспоненциальное распределение и геометрическое распределение являются единственными распределениями вероятностей без памяти .
Следовательно, экспоненциальное распределение также обязательно является единственным непрерывным распределением вероятностей, имеющим постоянную частоту отказов .
Квантили
Функция квантиля (обратная кумулятивная функция распределения) для Exp( λ ) равна
составляют Таким образом , квартили :
- первый квартиль: ln(4/3)/ λ
- медиана : ln(2)/ λ
- третий квартиль: ln(4)/ λ
И, как следствие, межквартильный размах равен ln(3)/ λ .
Условная стоимость под угрозой (ожидаемый дефицит)
Условное значение риска (CVaR), также известное как ожидаемый дефицит или суперквантиль для Exp( λ ), рассчитывается следующим образом: [1]
Буферизованная вероятность превышения (bPOE)
Буферизованная вероятность превышения равна единице минус уровень вероятности, при котором CVaR равен порогу. . Его получают следующим образом: [1]
Расхождение Кульбака – Лейблера
Направленное расхождение Кульбака–Лейблера в нац . («приблизительное» распределение) от («истинное» распределение) определяется выражением
Максимальное распределение энтропии
Среди всех непрерывных распределений вероятностей с носителем [0, ∞) и средним значением µ экспоненциальное распределение с λ = 1/ µ имеет наибольшую дифференциальную энтропию . Другими словами, это максимальное распределение вероятностей энтропии для случайной величины X , которая больше или равна нулю и для которой E[ X ] фиксировано. [2]
Распределение минимума экспоненциальных случайных величин
Пусть X 1 , …, X n – независимые экспоненциально распределенные случайные величины со скоростными параметрами λ 1 , …, λ n . Затем также распределено экспоненциально с параметром
В этом можно убедиться, рассмотрев дополнительную кумулятивную функцию распределения :
Индекс переменной, достигшей минимума, распределяется согласно категориальному распределению.
Доказательство можно увидеть, позволив . Затем,
Обратите внимание, что не распределяется экспоненциально, если X 1 , …, X n имеют параметр 0. не все [3]
Совместные моменты статистики экспоненциального порядка iid
Позволять быть независимые и одинаково распределенные экспоненциальные случайные величины с параметром скорости λ . Позволять обозначают соответствующую порядковую статистику . Для , совместный момент статистики заказов и дается
В этом можно убедиться, обратившись к закону полного ожидания и свойству отсутствия памяти:
Первое уравнение следует из закона полного ожидания .Второе уравнение использует тот факт, что как только мы ставим условие на , из этого должно следовать, что . Третье уравнение основано на свойстве отсутствия памяти для замены с .
Сумма двух независимых экспоненциальных случайных величин
Функция распределения вероятностей (PDF) суммы двух независимых случайных величин представляет собой свертку их отдельных PDF-файлов . Если и являются независимыми экспоненциальными случайными величинами с соответствующими параметрами скорости и тогда плотность вероятности дается Энтропия этого распределения доступна в закрытой форме: полагая (без ограничения общности), тогда где – постоянная Эйлера-Машерони , а это дигамма-функция . [4]
В случае равных параметров скорости результатом является распределение Эрланга с формой 2 и параметром что, в свою очередь, является частным случаем гамма-распределения .
Сумма n независимых Exp( λ) экспоненциальных случайных величин распределена по схеме Gamma(n, λ) .
Связанные дистрибутивы
Этот раздел включает список общих ссылок , но в нем отсутствуют достаточные соответствующие встроенные цитаты . ( Март 2011 г. ) |
- Если X ~ Лапласа(μ, β −1 ) , то | Икс - мкм| ~ Эксп(β).
- Если X ~ Парето(1, λ) , то log( X ) ~ Exp(λ).
- Если X ~ SkewLogistic(θ) , то .
- Если X i ~ U (0, 1), то
- Экспоненциальное распределение является пределом масштабированного бета-распределения :
- Экспоненциальное распределение является частным случаем распределения Пирсона 3-го типа .
- Экспоненциальное распределение является частным случаем гамма-распределения с параметром формы 1.
- Если X ~ Exp(λ) и X i ~ Exp(λ i ), то:
- , замыкание при масштабировании положительным коэффициентом.
- 1 + X ~ Бенктандер-Вейбулл (λ, 1), что сводится к усеченному экспоненциальному распределению.
- тот Х ~ Парето ( k , λ).
- и −X ~ Бета (л, 1).
- 1 / k e Х ~ PowerLaw ( k , λ)
- , распределение Рэлея
- , распределение Вейбулла
- µ − β log(λ X ) ∼ Гумбел (µ, β) .
- , геометрическое распределение на 0,1,2,3,...
- , геометрическое распределение на 1,2,3,4,...
- Если также Y ~ Erlang( n , λ) или затем
- Если также λ ~ Gamma ( k , θ) (параметризация формы, масштаба), то маргинальное распределение X равно Lomax ( k , 1/θ), гамма- смесь
- λ 1 Икс 1 - λ 2 Y 2 ~ Лаплас(0, 1) .
- min{ X 1 , ..., X n } ~ Exp(λ 1 + ... + λ n ).
- Если также λ i = λ, то:
- Если также X i независимы, то:
- ~ В (0, 1)
- имеет функцию плотности вероятности . Это можно использовать для получения доверительного интервала для .
- Если также λ = 1:
- , логистическое распределение
- μ − σ log( X ) ~ GEV(μ, σ, 0) .
- Далее, если затем ( K-распределение )
- Если также λ = 1/2, то X ∼ χ 2
2 ; т. е. X имеет распределение хи-квадрат с 2 степенями свободы . Следовательно:
- Если и ~ Пуассон( X ) тогда ( геометрическое распределение )
- Распределение Хойта можно получить из экспоненциального распределения и арксинусного распределения.
- Экспоненциальное распределение является пределом κ -экспоненциального распределения в случай.
- Экспоненциальное распределение является пределом κ-обобщенного гамма-распределения в и случаи:
Другие связанные дистрибутивы:
- Гиперэкспоненциальное распределение – распределение, плотность которого представляет собой взвешенную сумму экспоненциальных плотностей.
- Гипоэкспоненциальное распределение – распределение общей суммы экспоненциальных случайных величин.
- exGaussianраспределение – сумма экспоненциального распределения и нормального распределения .
Статистический вывод
Ниже предположим, что случайная величина X распределена экспоненциально с параметром скорости λ, и являются n независимыми выборками из X со средним значением выборки .
Оценка параметров
Оценка максимального правдоподобия для λ строится следующим образом.
Функция правдоподобия для λ, учитывая независимую и одинаково распределенную выборку x = ( x 1 , …, x n ), полученную из переменной, равна:
где: – выборочное среднее.
Производная логарифма функции правдоподобия равна:
Следовательно, оценка максимального правдоподобия для параметра скорости равна:
Это не объективная оценка хотя является беспристрастным [6] МЛЭ [7] оценщик и среднее распределение.
Предвзятость равно что дает оценку максимального правдоподобия с поправкой на смещение
Приблизительный минимизатор среднеквадратической ошибки (см. также: компромисс между смещением и дисперсией ) можно найти, предполагая, что размер выборки больше двух, с поправочным коэффициентом для MLE: Это получено из среднего значения и дисперсии обратного гамма-распределения , . [8]
Информация о Фишере
Информация Фишера , обозначаемая , для оценки параметра скорости дается как:
Подключение распределения и решение дает:
Это определяет объем информации, которую несет каждая независимая выборка экспоненциального распределения о неизвестном параметре скорости. .
Доверительные интервалы
Точный 100(1 - α)% доверительный интервал для параметра скорости экспоненциального распределения определяется следующим образом: [9] что также равно где х 2
p , v — 100( p ) процентиль распределения хи-квадрат с v степенями свободы , n — количество наблюдений, а x-bar — среднее значение выборки. Простую аппроксимацию точных конечных точек интервала можно получить, используя нормальную аппроксимацию χ 2
p , v распределение. Это приближение дает следующие значения для 95% доверительного интервала:
Такое приближение может быть приемлемым для образцов, содержащих не менее 15–20 элементов. [10]
Байесовский вывод
Сопряженным априором экспоненциального распределения является гамма-распределение (частным случаем которого является экспоненциальное распределение). Полезна следующая параметризация функции плотности вероятности гамма-излучения:
Затем апостериорное распределение p можно выразить через функцию правдоподобия, определенную выше, и априорную гамму:
Теперь апостериорная плотность p задана с точностью до отсутствующей нормировочной константы. Поскольку он имеет форму гамма-pdf, его можно легко заполнить и получить:
Здесь гиперпараметр α можно интерпретировать как количество предыдущих наблюдений, а β — как сумму предыдущих наблюдений.Апостериорное среднее здесь равно:
Возникновение и применение
Возникновение событий
Экспоненциальное распределение возникает естественным образом при описании длин времен между приходами в однородном пуассоновском процессе .
Экспоненциальное распределение можно рассматривать как непрерывный аналог геометрического распределения , которое описывает количество испытаний Бернулли, необходимых для того, чтобы дискретный процесс изменил состояние. Напротив, экспоненциальное распределение описывает время, в течение которого непрерывный процесс меняет состояние.
В реальных сценариях предположение о постоянной скорости (или вероятности в единицу времени) редко выполняется. Например, скорость входящих телефонных звонков различается в зависимости от времени суток. Но если мы сосредоточимся на временном интервале, в течение которого скорость примерно постоянна, например, с 14 до 16 часов в рабочие дни, экспоненциальное распределение можно использовать в качестве хорошей приближенной модели времени до следующего телефонного звонка. Аналогичные предостережения применимы к следующим примерам, которые дают примерно экспоненциально распределенные переменные:
- Время до распада радиоактивной частицы , или время между щелчками счетчика Гейгера
- Время между получением одного телефонного звонка и следующего
- Время до дефолта (при выплате держателям долгов компании) при моделировании кредитного риска в сокращенной форме
Экспоненциальные переменные также можно использовать для моделирования ситуаций, когда определенные события происходят с постоянной вероятностью на единицу длины, например, расстояние между мутациями в цепи ДНК или между дорожно-транспортными происшествиями на данной дороге.
В теории массового обслуживания время обслуживания агентов в системе (например, сколько времени требуется кассиру банка и т. д. для обслуживания клиента) часто моделируется как экспоненциально распределенные переменные. (Например, поступление клиентов также моделируется распределением Пуассона , если поступления независимы и распределены одинаково.) Длина процесса, который можно рассматривать как последовательность нескольких независимых задач, соответствует распределению Эрланга (которое представляет собой распределение суммы нескольких независимых экспоненциально распределенных переменных). Теория надежности и инженерия надежности также широко используют экспоненциальное распределение. Из-за отсутствия памяти у этого распределения оно хорошо подходит для моделирования с постоянной степенью опасности, части кривой ванны используемой в теории надежности. можно легко добавить интенсивность отказов Это также очень удобно, поскольку в модель надежности . Однако экспоненциальное распределение не подходит для моделирования общего срока службы организмов или технических устройств, поскольку «частота отказов» здесь не постоянна: больше отказов происходит как для очень молодых, так и для очень старых систем.
В физике , если вы наблюдаете газ при фиксированной температуре и давлении в однородном гравитационном поле , высоты различных молекул также подчиняются приблизительному экспоненциальному распределению, известному как барометрическая формула . Это следствие упомянутого ниже свойства энтропии.
В гидрологии экспоненциальное распределение используется для анализа экстремальных значений таких переменных, как месячные и годовые максимальные значения суточного количества осадков и объемы речного стока. [12]
- Синее изображение иллюстрирует пример подбора экспоненциального распределения к ранжированному максимальному годовому количеству осадков за один день, демонстрируя также 90% доверительный интервал, основанный на биномиальном распределении . Данные об осадках представлены в виде координат на графике в рамках кумулятивного частотного анализа .
В управлении операционными залами - распределение продолжительности операции по категориям операций без типичного содержания труда (например, в отделении неотложной помощи, охватывающее все виды операций).
Прогноз
После наблюдения выборки из n точек данных из неизвестного экспоненциального распределения общая задача состоит в том, чтобы использовать эти выборки для прогнозирования будущих данных из того же источника. Распространенным прогнозным распределением по будущим выборкам является так называемое подключаемое распределение, формируемое путем включения подходящей оценки параметра скорости λ в функцию экспоненциальной плотности. Обычным выбором оценки является тот, который обеспечивается принципом максимального правдоподобия, и его использование дает прогнозную плотность для будущей выборки x n +1 , обусловленную наблюдаемыми выборками x = ( x 1 , ..., x n ) данный
Байесовский подход обеспечивает прогнозируемое распределение, которое учитывает неопределенность оцениваемого параметра, хотя это может решающим образом зависеть от выбора априора.
Прогнозирующее распределение, свободное от проблем выбора априорных значений, возникающих при субъективном байесовском подходе, - это
который можно рассматривать как
- частотное доверительное распределение , полученное из распределения основной величины ; [13]
- прогнозируемая вероятность профиля, полученная путем исключения параметра λ из совместной вероятности x n +1 и λ путем максимизации; [14]
- объективное байесовское предсказательное апостериорное распределение, полученное с использованием неинформативного Джеффриса априорного 1/ λ ;
- прогнозируемое распределение условного нормализованного максимального правдоподобия (CNML), исходя из соображений теории информации. [15]
Точность прогнозируемого распределения может быть измерена с использованием расстояния или расхождения между истинным экспоненциальным распределением с параметром скорости λ 0 и прогнозным распределением, основанным на выборке x . Дивергенция Кульбака -Лейблера - это широко используемая, не требующая параметризации мера разницы между двумя распределениями. Обозначая Δ( λ 0 || p ) расхождение Кульбака – Лейблера между экспонентой с параметром скорости λ 0 и прогнозирующим распределением p, можно показать, что
где математическое ожидание берется относительно экспоненциального распределения с параметром скорости λ 0 ∈ (0, ∞) , а ψ( · ) – дигамма-функция. Ясно, что прогнозирующее распределение CNML строго превосходит подключаемое распределение максимального правдоподобия с точки зрения среднего расхождения Кульбака-Лейблера для всех размеров выборки n > 0 .
Генерация случайной переменной
Концептуально очень простой метод генерации экспоненциальных переменных основан на выборке обратного преобразования : учитывая случайную величину U, полученную из равномерного распределения на единичном интервале (0, 1) , переменная
имеет показательное распределение, где F −1 — функция квантиля , определяемая формулой
Более того, если U равномерен на (0, 1), то и 1 − U равномерен . Это означает, что можно генерировать экспоненциальные переменные следующим образом:
Другие методы генерации экспоненциальных переменных обсуждаются Кнутом. [16] и Деврой. [17]
Также доступен быстрый метод генерации набора готовых упорядоченных экспоненциальных переменных без использования процедуры сортировки. [17]
См. также
- Мертвое время - применение экспоненциального распределения к анализу детектора частиц.
- Распределение Лапласа , или «двойное экспоненциальное распределение».
- Отношения между распределениями вероятностей
- Экспоненциальное распределение Маршалла – Олкина
Ссылки
- ^ Jump up to: а б Нортон, Мэтью; Хохлов, Валентин; Урясев, Стэн (2019). «Расчет CVaR и bPOE для распространенных распределений вероятностей с применением для оптимизации портфеля и оценки плотности» (PDF) . Анналы исследования операций . 299 (1–2). Спрингер: 1281–1315. дои : 10.1007/s10479-019-03373-1 . Архивировано из оригинала (PDF) 31 марта 2023 г. Проверено 27 февраля 2023 г.
- ^ Пак, Сон Ю.; Бера, Анил К. (2009). «Модель условной гетероскедастичности авторегрессии с максимальной энтропией» (PDF) . Журнал эконометрики . 150 (2). Эльзевир: 219–230. doi : 10.1016/j.jeconom.2008.12.014 . Архивировано из оригинала (PDF) 7 марта 2016 г. Проверено 2 июня 2011 г.
- ^ Майкл, Луго. «Ожидание максимума экспоненты» (PDF) . Архивировано из оригинала (PDF) 20 декабря 2016 года . Проверено 13 декабря 2016 г.
- ^ Экфорд, Эндрю В.; Томас, Питер Дж. (2016). «Энтропия суммы двух независимых, неидентично распределенных экспоненциальных случайных величин». arXiv : 1609.02911 [ cs.IT ].
- ^ Ибе, Оливер К. (2014). Основы прикладной теории вероятности и случайных процессов (2-е изд.). Академическая пресса. п. 128. ИСБН 9780128010358 .
- ^ Ричард Арнольд Джонсон; Дин В. Вичерн (2007). Прикладной многомерный статистический анализ . Пирсон Прентис Холл. ISBN 978-0-13-187715-3 . Проверено 10 августа 2012 г.
- ^ Электронный справочник NIST/SEMATECH по статистическим методам
- ^ Эльфесси, Абдулазиз; Рейнеке, Дэвид М. (2001). «Байесовский взгляд на классическую оценку: экспоненциальное распределение» . Журнал статистического образования . 9 (1). дои : 10.1080/10691898.2001.11910648 .
- ^ Росс, Шелдон М. (2009). Введение в вероятность и статистику для инженеров и ученых (4-е изд.). Ассошиэйтед Пресс. п. 267. ИСБН 978-0-12-370483-2 .
- ^ Геррьеро, В. (2012). «Распределение по степенному закону: метод многомасштабной логической статистики» . Журнал современной математики Frontier . 1 : 21–28.
- ^ «Cumfreq, бесплатная компьютерная программа для совокупного частотного анализа» .
- ^ Ритзема, HP, изд. (1994). Частотный и регрессионный анализ . Глава 6 в: Принципы и применение дренажа, Публикация 16, Международный институт мелиорации и улучшения земель (ILRI), Вагенинген, Нидерланды. стр. 175–224 . ISBN 90-70754-33-9 .
- ^ Лоулесс, Дж. Ф.; Фредетт, М. (2005). «Интервалы частотных прогнозов и прогнозные распределения». Биометрика . 92 (3): 529–542. дои : 10.1093/biomet/92.3.529 .
- ^ Бьёрнстад, Дж. Ф. (1990). «Прогнозируемая вероятность: обзор» . Статист. Наука . 5 (2): 242–254. дои : 10.1214/ss/1177012175 .
- ^ Д. Ф. Шмидт и Э. Макалич, « Универсальные модели экспоненциального распределения », Транзакции IEEE по теории информации , том 55, номер 7, стр. 3087–3090, 2009 г. два : 10.1109/TIT.2009.2018331
- ^ Дональд Э. Кнут (1998). Искусство компьютерного программирования , том 2: Получисловые алгоритмы , 3-е изд. Бостон: Аддисон-Уэсли. ISBN 0-201-89684-2 . См. раздел 3.4.1, с. 133.
- ^ Jump up to: а б Люк Деврой (1986). Генерация неоднородной случайной переменной . Нью-Йорк: Springer-Verlag. ISBN 0-387-96305-7 . См. главу IX , раздел 2, стр. 392–401.