Распространение Гумбеля
Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Обозначения | |||
---|---|---|---|
Параметры | местоположение ( реальное ) масштаб (реальный) | ||
Поддерживать | |||
где | |||
CDF | |||
Квантиль | |||
Иметь в виду | где постоянная Эйлера -Машерони | ||
медиана | |||
Режим | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | |||
Энтропия | |||
МГФ | |||
CF |
В теории вероятностей и статистике распределение Гамбеля (также известное как типа I обобщенное распределение экстремальных значений ) используется для моделирования распределения максимума (или минимума) ряда выборок различных распределений.
Это распределение можно было бы использовать для представления распределения максимального уровня реки в конкретном году, если бы существовал список максимальных значений за последние десять лет. Это полезно для прогнозирования вероятности возникновения сильного землетрясения, наводнения или другого стихийного бедствия. Потенциальная применимость распределения Гамбеля для представления распределения максимумов связана с теорией экстремальных значений , которая указывает на то, что оно может быть полезным, если распределение основных выборочных данных имеет нормальный или экспоненциальный тип. [а]
Распределение Гамбеля является частным случаем обобщенного распределения экстремальных значений (также известного как распределение Фишера – Типпетта). Оно также известно как логарифмическое распределение Вейбулла и двойное экспоненциальное распределение (термин, который альтернативно иногда используется для обозначения распределения Лапласа ). Это связано с распределением Гомпертца : когда его плотность сначала отражается относительно начала координат, а затем ограничивается положительной полупрямой, получается функция Гомпертца.
В формулировке латентной переменной полиномиальной логит- модели, распространенной в теории дискретного выбора , ошибки латентных переменных подчиняются распределению Гамбеля. Это полезно, поскольку разница двух случайных величин , распределенных по Гамбелу, имеет логистическое распределение .
Распределение Гамбеля названо в честь Эмиля Юлиуса Гамбеля (1891–1966) на основе его оригинальных статей, описывающих это распределение. [1] [2]
Определения
[ редактировать ]Кумулятивная функция распределения распределения Гамбеля равна
Стандартный дистрибутив Gumbel
[ редактировать ]Стандартное распределение Гамбеля — это случай, когда и с кумулятивной функцией распределения
и функция плотности вероятности
В этом случае мода равна 0, медиана равна , среднее значение ( константа Эйлера-Машерони ), а стандартное отклонение равно
Кумулянты для > 1 n имеют вид
Характеристики
[ редактировать ]Мода равна µ, а медиана равна и среднее значение определяется выражением
- ,
где – постоянная Эйлера–Машерони .
Стандартное отклонение является следовательно [3]
В режиме, где , значение становится , независимо от стоимости
Если являются случайными величинами iid Gumbel с параметрами затем также является случайной величиной Гамбеля с параметрами .
Если являются iid случайными величинами такими, что имеет то же распределение, что и для всех натуральных чисел , затем обязательно распределяется по Гамбелю с параметром масштаба (на самом деле достаточно рассмотреть только два различных значения k>1, которые взаимно просты).
Связанные дистрибутивы
[ редактировать ]- Если имеет распределение Гамбеля, то условное распределение Y = − X при условии, что Y положительное, или, что то же самое, при условии, что X отрицательное, имеет распределение Гомпертца . CDF G Y X связан с F , CDF , по формуле при y > 0. Следовательно, плотности связаны соотношением : плотность Гомпертца пропорциональна отраженной плотности Гамбеля, ограниченной положительной полуосью. [4]
- Если X — экспоненциально распределенная переменная со средним значением 1, то −log( X ) имеет стандартное распределение Гамбеля.
- Если и независимы, то (см. Логистическое распределение ).
- Если независимы, то . Обратите внимание, что . В более общем смысле, распределение линейных комбинаций независимых случайных величин Гамбеля может быть аппроксимировано распределениями GNIG и GIG. [5]
Теория, связанная с обобщенным многомерным лог-гамма-распределением, представляет собой многомерную версию распределения Гамбеля.
Возникновение и применение
[ редактировать ]Гамбел показал, что максимальное значение (или статистика последнего порядка ) в выборке случайных величин, следующих экспоненциальному распределению, минус натуральный логарифм размера выборки. [7] приближается к распределению Гамбеля по мере увеличения размера выборки. [8]
Конкретно, пусть быть распределением вероятностей и его кумулятивное распределение. Тогда максимальное значение из реализации меньше, чем тогда и только тогда, когда все реализации меньше, чем . Таким образом, совокупное распределение максимального значения удовлетворяет
и, по большому счету , правая часть сходится к
Поэтому в гидрологии распределение Гумбеля используется для анализа таких переменных, как месячные и годовые максимальные значения суточного количества осадков и объемы речного стока, [3] а также для описания засух. [9]
Гамбель также показал, что оценка r ⁄ ( n +1) для вероятности события — где r — ранг наблюдаемого значения в ряду данных, а — общее количество наблюдений — является несмещенной оценкой кумулятивной вероятности вокруг режима n распределение. Поэтому эта оценка часто используется в качестве позиции для построения графика .
В теории чисел распределение Гамбеля аппроксимирует количество членов в случайном разделе целого числа. [10] а также скорректированные по тренду размеры максимальных промежутков между простыми числами и максимальных промежутков между простыми созвездиями . [11]
Это появляется в задаче сборщика купонов .
Трюки с репараметризацией Gumbel
[ редактировать ]В машинном обучении распределение Гамбеля иногда используется для создания выборок из категориального распределения . Этот метод называется «трюком Гамбел-макса» и представляет собой особый пример « трюков репараметризации ». [12]
Подробно, пусть неотрицательны и не все равны нулю, и пусть быть независимыми выборками Gumbel(0, 1), затем путем обычного интегрирования То есть,
Эквивалентно, учитывая любой , мы можем выполнить выборку из распределения Больцмана по формуле
Связанные уравнения включают: [13]
- Если , затем .
- .
- . То есть дистрибутив Гамбеля представляет собой максимально стабильное семейство дистрибутивов.
Генерация случайной переменной
[ редактировать ]Поскольку функция квантиля (обратная кумулятивная функция распределения ), , распределения Гамбеля определяется выражением
вариант имеет распределение Гамбеля с параметрами и когда случайная величина извлекается из равномерного распределения на интервале .
Вероятностная бумага
[ редактировать ]Во времена, когда еще не было программного обеспечения, для изображения распределения Гамбеля использовалась вероятностная бумага (см. Иллюстрацию). Работа основана на линеаризации кумулятивной функции распределения. :
В статье горизонтальная ось построена в двойном логарифмическом масштабе. Вертикальная ось линейна. Построив график на горизонтальной оси бумаги и -переменная по вертикальной оси, распределение представлено прямой линией с наклоном 1 . Когда для определения распределения, стало доступно программное обеспечение такое как CumFreq , задача построения графика распределения стала проще.
См. также
[ редактировать ]- Распространение гумбеля типа 2
- Теория экстремальных ценностей
- Обобщенное распределение экстремальных значений
- Теорема Фишера – Типпетта – Гнеденко.
- Эмиль Юлиус Гумбель
Примечания
[ редактировать ]- ^ В этой статье для моделирования распределения максимального значения используется распределение Гамбеля . Чтобы смоделировать минимальное значение, используйте отрицательные значения исходных значений.
Ссылки
[ редактировать ]- ^ Гумбель, EJ (1935), «Крайние значения статистических распределений» (PDF) , Annales de l'Institut Henri Poincaré , 5 (2): 115–158
- ^ Гумбель Э.Дж. (1941). «Период возврата паводковых потоков». Анналы математической статистики, 12, 163–190.
- ^ Jump up to: а б Остербан, Р.Дж. (1994). «Глава 6. Частотный и регрессионный анализ» (PDF) . В Ритземе, HP (ред.). Принципы и применение дренажа, Публикация 16 . Вагенинген, Нидерланды: Международный институт мелиорации и улучшения земель (ILRI). стр. 175–224 . ISBN 90-70754-33-9 .
- ^ Виллемс, WJ; Каас, Р. (2007). «Рациональная реконструкция моделей смертности, основанных на слабости, путем обобщения закона смертности Гомпертца» (PDF) . Страхование: Математика и Экономика . 40 (3): 468. doi : 10.1016/j.insmatheco.2006.07.003 . Архивировано из оригинала (PDF) 9 августа 2017 г. Проверено 24 сентября 2019 г.
- ^ Маркес, Ф.; Коэльо, К.; де Карвалью, М. (2015). «О распределении линейных комбинаций независимых случайных величин Гамбеля» (PDF) . Статистика и вычисления . 25 (3): 683–701. дои : 10.1007/s11222-014-9453-5 . S2CID 255067312 .
- ^ "CumFreq, аппроксимация распределения вероятности, бесплатный калькулятор" . www.waterlog.info .
- ^ «Распределение Гумбеля и экспоненциальное распределение» . Математический обмен стеками .
- ^ Гамбель, Э.Дж. (1954). Статистическая теория экстремальных значений и некоторые практические приложения . Серия «Прикладная математика». Том. 33 (1-е изд.). Министерство торговли США, Национальное бюро стандартов. АСИН B0007DSHG4 .
- ^ Берк, Элеонора Дж.; Перри, Ричард Х.Дж.; Браун, Саймон Дж. (2010). «Анализ экстремальных значений засухи в Великобритании и прогнозы изменений в будущем». Журнал гидрологии . 388 (1–2): 131–143. Бибкод : 2010JHyd..388..131B . doi : 10.1016/j.jгидроl.2010.04.035 .
- ^ Эрдеш, Пол; Ленер, Джозеф (1941). «Распределение количества слагаемых в разбиениях натурального числа». Математический журнал Дьюка . 8 (2): 335. doi : 10.1215/S0012-7094-41-00826-8 .
- ^ Курбатов, А. (2013). «Максимальные промежутки между простыми наборами k : статистический подход». Журнал целочисленных последовательностей . 16 . arXiv : 1301.2242 . Бибкод : 2013arXiv1301.2242K . Статья 13.5.2.
- ^ Джанг, Эрик; Гу, Шисян; Пул, Бен (апрель 2017 г.). Категориальная репараметризация с помощью Gumble-Softmax . Международная конференция по обучению представлений (ICLR) 2017.
- ^ Балог, Матей; Трипуранени, Нилеш; Гахрамани, Зубин; Веллер, Адриан (17 июля 2017 г.). «Потерянные родственники трюка с Гамбелом» . Международная конференция по машинному обучению . ПМЛР: 371–379. arXiv : 1706.04161 .