Распределение с тяжелым хвостом
Эта статья может быть слишком технической для понимания большинства читателей . ( Май 2020 г. ) |
В вероятностей теории распределения с тяжелыми хвостами — это распределения вероятностей, хвосты которых не ограничены экспоненциально: [1] то есть у них более тяжелые хвосты, чем у экспоненциального распределения . Во многих приложениях интерес представляет правый хвост распределения, но распределение может иметь тяжелый левый хвост или оба хвоста могут быть тяжелыми.
Существует три важных подкласса распределений с толстым хвостом: распределения с толстым хвостом , распределения с длинным хвостом и субэкспоненциальные распределения . На практике все часто используемые распределения с тяжелым хвостом относятся к субэкспоненциальному классу, введенному Йозефом Тойгельсом . [2]
До сих пор существуют некоторые разногласия по поводу использования термина « тяжелохвостый» . Используются еще два определения. Некоторые авторы используют этот термин для обозначения тех распределений, у которых не все степенные моменты конечны; и некоторые другие к тем распределениям, которые не имеют конечной дисперсии . Определение, данное в этой статье, является наиболее общим в использовании и включает в себя все распределения, охватываемые альтернативными определениями, а также такие распределения, как логарифмически нормальное , которые обладают всеми своими степенными моментами, но которые обычно считаются распределениями с тяжелым хвостом. . (Иногда термин «тяжелый хвост» используется для любого распределения, которое имеет более тяжелые хвосты, чем нормальное распределение.)
Определения
[ редактировать ]Определение распределения с тяжелым хвостом
[ редактировать ]что распределение случайной величины X с функцией распределения F имеет тяжелый (правый) хвост, если производящая функция момента X Говорят , , M X ( t ), бесконечна для всех t > 0. [3]
Это означает
Это также записывается в терминах хвостовой функции распределения
как
Определение распределения с длинным хвостом
[ редактировать ]Говорят , что распределение случайной величины X с функцией распределения F имеет длинный правый хвост. [1] если для всех t > 0,
или эквивалентно
Это имеет интуитивную интерпретацию для правостороннего и длиннохвостого распределенного количества: если количество с длинным хвостом превышает некоторый высокий уровень, вероятность того, что оно превысит любой другой более высокий уровень, приближается к 1.
Все распределения с длинным хвостом имеют тяжелый хвост, но обратное неверно, и можно построить распределения с тяжелым хвостом, которые не являются длиннохвостыми.
Субэкспоненциальные распределения
[ редактировать ]Субэкспоненциальность определяется в терминах свертки вероятностных распределений . Для двух независимых, одинаково распределенных случайных величин с общей функцией распределения , свертка сам с собой, написано и называется квадратом свертки, определяется с использованием интегрирования Лебега – Стилтьеса следующим образом:
и n -кратная свертка определяется индуктивно по правилу:
Хвостовая функция распределения определяется как .
Распределение на положительной полуоси субэкспоненциально [1] [5] [2] если
Это подразумевает [6] что для любого ,
Вероятностная интерпретация [6] это то, что на сумму независимые случайные величины с общим распространением ,
Это часто называют принципом одиночного большого прыжка. [7] или принцип катастрофы. [8]
Распределение на всей вещественной линии субэкспоненциально, если распределение является. [9] Здесь – индикаторная функция положительной полупрямой. Альтернативно, случайная величина поддерживаемая на действительной прямой, является субэкспоненциальной тогда и только тогда, когда является субэкспоненциальным.
Все субэкспоненциальные распределения являются длиннохвостыми, но можно построить примеры распределений с длинным хвостом, которые не являются субэкспоненциальными.
Распространенные распределения с тяжелым хвостом
[ редактировать ]Все широко используемые распределения с тяжелым хвостом являются субэкспоненциальными. [6]
К односторонним относятся:
- распределение Парето ;
- Логнормальное распределение ;
- распределение Леви ;
- распределение Вейбулла с параметром формы больше 0, но меньше 1;
- распределение Берра ;
- лог -логистическое распределение ;
- лог- гамма-распределение ;
- распределение Фреше ;
- q -гауссово распределение ;
- логарифмическое распределение Коши , иногда описываемое как имеющее «сверхтяжелый хвост», поскольку оно демонстрирует логарифмическое затухание , приводящее к более тяжелому хвосту, чем распределение Парето. [10] [11]
К двусторонним относятся:
- Распределение Коши само по себе является частным случаем как стабильного распределения, так и t-распределения;
- Семейство устойчивых распределений , [12] за исключением особого случая нормального распределения внутри этого семейства. Некоторые стабильные распределения являются односторонними (или поддерживаются полупрямой), см., например, распределение Леви . См. также финансовые модели с длиннохвостыми распределениями и кластеризацией волатильности .
- Т -распределение .
- Косое логнормальное каскадное распределение. [13]
Связь с распределениями с толстым хвостом
[ редактировать ]Распределение с толстым хвостом — это распределение, для которого функция плотности вероятности при больших x стремится к нулю как степень . Поскольку такая степень всегда ограничена снизу функцией плотности вероятности экспоненциального распределения, распределения с толстым хвостом всегда имеют тяжелый хвост. Однако у некоторых распределений есть хвост, который стремится к нулю медленнее, чем экспоненциальная функция (это означает, что они имеют «тяжелый хвост»), но быстрее, чем степень (то есть они не имеют «толстый хвост»). Примером является логнормальное распределение. [ противоречивый ] . Однако многие другие распределения с толстым хвостом, такие как логарифмическое распределение и распределение Парето , также имеют толстый хвост.
Оценка хвостового индекса
[ редактировать ]Есть параметрические [6] и непараметрические [14] подходы к задаче оценки хвостового индекса. [ когда определено как? ]
Чтобы оценить хвостовой индекс с использованием параметрического подхода, некоторые авторы используют распределение GEV или распределение Парето ; они могут применить оценку максимального правдоподобия (MLE).
Оценщик индекса хвоста Пиканда
[ редактировать ]С случайная последовательность независимых и одинаковых функций плотности , Область максимального притяжения [15] обобщенной плотности экстремальных значений , где . Если и , то Пикандса равна оценка индекса хвоста [6] [15]
где . Эта оценка сходится по вероятности к .
Оценщик хвостового индекса Хилла
[ редактировать ]Позволять быть последовательностью независимых и одинаково распределенных случайных величин с функцией распределения , максимальная область притяжения обобщенного распределения экстремальных значений , где . Пример пути: где это размер выборки. Если является последовательностью промежуточного порядка, т.е. , и , то оценка индекса хвоста Хилла равна [16]
где это -го статистика порядка .Эта оценка сходится по вероятности к , и является асимптотически нормальным при условии ограничено на основе свойства регулярной вариации более высокого порядка [17] . [18] Согласованность и асимптотическая нормальность распространяются на большой класс зависимых и гетерогенных последовательностей. [19] [20] независимо от того, наблюдается, или вычисленный остаток, или отфильтрованные данные из большого класса моделей и оценщиков, включая модели с неправильным определением и модели с зависимыми ошибками. [21] [22] [23] Обратите внимание, что в оценщиках хвостового индекса Пиканда и Хилла обычно используется логарифм порядковой статистики. [24]
Оценка отношения хвостового индекса
[ редактировать ]Оценка отношения (RE-оценка) хвостового индекса была введена Голди. и Смит. [25] Он построен аналогично оценщику Хилла, но использует неслучайный «параметр настройки».
Сравнение оценок типа Хилла и типа RE можно найти у Новака. [14]
Программное обеспечение
[ редактировать ]- aest Архивировано 25 ноября 2020 г. в Wayback Machine , инструмент C для оценки индекса тяжелого хвоста. [26]
Оценка плотности «тяжелых хвостов»
[ редактировать ]Непараметрические подходы к оценке функций плотности вероятности с тяжелым и сверхтяжелым хвостом приведены в Маркович. [27] Это подходы, основанные на переменной полосе пропускания и ядрах с длинным хвостом; по предварительным данным преобразуются к новой случайной величине на конечных или бесконечных интервалах, что более удобно для оценки, а затем обратное преобразование полученной оценки плотности; и «подход объединения», который обеспечивает определенную параметрическую модель хвоста плотности и непараметрическую модель для аппроксимации режима плотности. Непараметрические оценщики требуют соответствующего выбора параметров настройки (сглаживания), таких как полоса пропускания ядерных оценщиков и ширина интервала гистограммы. Хорошо известными методами такого выбора, основанными на данных, являются перекрестная проверка и ее модификации, методы, основанные на минимизации среднеквадратической ошибки (MSE), ее асимптотики и их верхних границ. [28] Метод неточности, который использует известные непараметрические статистики, такие как статистики Колмогорова-Смирнова, фон Мизеса и Андерсона-Дарлинга, в качестве метрики в пространстве функций распределения (ФР) и квантилей более поздних статистических данных в качестве известной неопределенности или значения невязки. нашел в. [27] Bootstrap — еще один инструмент для поиска параметров сглаживания с использованием аппроксимации неизвестного MSE с помощью различных схем выбора повторных выборок, см., например, [29]
См. также
[ редактировать ]- Лептокуртическое распределение
- Обобщенное распределение экстремальных значений
- Обобщенное распределение Парето
- Выброс
- Длинный хвост
- Степенной закон
- Семь состояний случайности
- Распределение с толстым хвостом
Ссылки
[ редактировать ]- ^ Jump up to: а б с Асмуссен, СР (2003). «Установившиеся свойства GI/G/1». Прикладная вероятность и очереди . Стохастическое моделирование и прикладная теория вероятности. Том. 51. С. 266–301. дои : 10.1007/0-387-21525-5_10 . ISBN 978-0-387-00211-8 .
- ^ Jump up to: а б Тейгельс, Йозеф Л. (1975). «Класс субэкспоненциальных распределений» . Анналы вероятности . 3 (6). Лувенский университет . дои : 10.1214/aop/1176996225 . Проверено 7 апреля 2019 г.
- ^ Рольски, Шмидли, Шмидт, Тойгельс, Случайные процессы в страховании и финансах , 1999.
- ^ С. Фосс, Д. Коршунов, С. Закари, Введение в распределения с тяжелым хвостом и субэкспоненциальные распределения , Springer Science & Business Media, 21 мая 2013 г.
- ^ Чистяков, В.П. (1964). «Теорема о суммах независимых положительных случайных величин и ее приложения к ветвящимся случайным процессам» . Исследовательские ворота . Проверено 7 апреля 2019 г.
- ^ Jump up to: а б с д и Эмбрехтс П.; Клюппельберг К.; Микош Т. (1997). Моделирование экстремальных событий для страхования и финансов . Стохастическое моделирование и прикладная теория вероятности. Том. 33. Берлин: Шпрингер. дои : 10.1007/978-3-642-33483-2 . ISBN 978-3-642-08242-9 .
- ^ Фосс, С.; Константинопулос, Т.; Закари, С. (2007). «Дискретные и непрерывные модулированные по времени случайные блуждания с приращениями с тяжелым хвостом» (PDF) . Журнал теоретической вероятности . 20 (3): 581. arXiv : math/0509605 . CiteSeerX 10.1.1.210.1699 . дои : 10.1007/s10959-007-0081-2 . S2CID 3047753 .
- ^ Вирман, Адам (9 января 2014 г.). «Катастрофы, заговоры и субэкспоненциальные распределения (часть III)» . Блог «Ригор + Релевантность» . RSRG, Калифорнийский технологический институт . Проверено 9 января 2014 г.
- ^ Виллекенс, Э. (1986). «Субэкспоненциальность на действительной линии». Технический отчет . КУ Левен.
- ^ Фальк М., Хюслер Дж. и Рейсс Р. (2010). Законы малых чисел: крайности и редкие события . Спрингер. п. 80. ИСБН 978-3-0348-0008-2 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Алвес, МИФ, де Хаан, Л. и Невес, К. (10 марта 2006 г.). «Статистический вывод для распределений с тяжелыми и сверхтяжелыми хвостами» (PDF) . Архивировано из оригинала (PDF) 23 июня 2007 года . Проверено 1 ноября 2011 г.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Джон П. Нолан (2009). «Стабильные распределения: модели для данных с тяжелыми хвостами» (PDF) . Архивировано из оригинала (PDF) 17 июля 2011 г. Проверено 21 февраля 2009 г.
- ^ Стивен Лин (2009). «Асимметричное логнормальное каскадное распределение» . Архивировано из оригинала 7 апреля 2014 г. Проверено 12 июня 2009 г.
- ^ Jump up to: а б Новак С.Ю. (2011). Методы экстремальной стоимости с применением в финансировании . Лондон: CRC. ISBN 978-1-43983-574-6 .
- ^ Jump up to: а б Пикандс III, Джеймс (январь 1975 г.). «Статистический вывод с использованием статистики крайнего порядка» . Анналы статистики . 3 (1): 119–131. дои : 10.1214/aos/1176343003 . JSTOR 2958083 .
- ^ Хилл Б.М. (1975) Простой общий подход к выводу о хвосте распределения. Энн. Стат., т. 3, 1163–1174.
- ^ Холл, П. (1982) О некоторых оценках показателя регулярной вариации. JR Стат. Соц. Сер. Б., т. 44, 37–42.
- ^ Хойслер, Э. и Дж. Л. Тойгельс (1985) Об асимптотической нормальности оценки Хилла для показателя регулярной вариации. Энн. Стат., т. 13, 743–756.
- ^ Хсинг, Т. (1991) Об оценке индекса хвоста с использованием зависимых данных. Энн. Стат., т. 19, 1547–1569.
- ^ Хилл, Дж. (2010) Об оценке индекса хвоста для зависимых гетерогенных данных. Эконометрический Th., т. 26, 1398–1436.
- ^ Резник С. и Старица К. (1997). Асимптотическое поведение оценки Хилла для данных авторегрессии. Комм. Статист. Стохастические модели 13, 703–721.
- ^ Линг, С. и Пэн, Л. (2004). Оценка Хилла хвостового индекса модели ARMA. Дж. Статист. План. Вывод 123, 279–293.
- ^ Хилл, Дж. Б. (2015). Оценка хвостового индекса для отфильтрованного зависимого временного ряда. Стат. Грех. 25, 609–630.
- ^ Ли, Сеюн; Ким, Джозеф Х.Т. (2019). «Возведенное в степень обобщенное распределение Парето: свойства и приложения к теории экстремальных значений». Коммуникации в статистике - теория и методы . 48 (8): 2014–2038. arXiv : 1708.01686 . дои : 10.1080/03610926.2018.1441418 . S2CID 88514574 .
- ^ Goldie CM, Smith RL (1987) Медленное изменение с остатком: теория и приложения. Кварта. Дж. Математика. Оксфорд, т. 38, 45–71.
- ^ Кровелла, Мэн; Такку, М.С. (1999). «Оценка индекса тяжелого хвоста на основе свойств масштабирования» . Методология и вычисления в прикладной теории вероятности . 1 : 55–79. дои : 10.1023/А:1010012224103 . S2CID 8917289 . Архивировано из оригинала 6 февраля 2007 г. Проверено 3 сентября 2015 г.
- ^ Jump up to: а б Маркович Н.М. (2007). Непараметрический анализ одномерных данных с тяжелыми хвостами: исследования и практика . Читестер: Уайли. ISBN 978-0-470-72359-3 .
- ^ Wand MP, Jones MC (1995). Сглаживание ядра . Нью-Йорк: Чепмен и Холл. ISBN 978-0412552700 .
- ^ Холл П. (1992). Расширение Bootstrap и Edgeworth . Спрингер. ISBN 9780387945088 .