Теория экстремальных ценностей

Теория экстремальных значений или анализ экстремальных значений ( EVA ) — это раздел статистики, занимающийся экстремальными отклонениями от медианы вероятностных распределений . Он стремится оценить на основе заданной упорядоченной выборки данной случайной величины вероятность событий, которые являются более экстремальными, чем любые ранее наблюдавшиеся. Анализ экстремальных значений широко используется во многих дисциплинах, таких как структурное проектирование , финансы , экономика , науки о Земле , прогнозирование дорожного движения и геологическая инженерия . Например, EVA может использоваться в области гидрологии для оценки вероятности необычно крупного наводнения, такого как 100-летнее наводнение . Аналогичным образом, при проектировании волнолома береговой инженер должен попытаться оценить 50-летнюю волну и соответствующим образом спроектировать конструкцию.
Анализ данных
[ редактировать ]Существуют два основных подхода к практическому анализу экстремальных значений.
Первый метод основан на получении блочного ряда максимумов (минимумов) в качестве предварительного шага. Во многих ситуациях принято и удобно извлекать годовые максимумы (минимумы), создавая годовой ряд максимумов (AMS).
Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют методом пика над порогом (POT). [1]
Для данных AMS анализ может частично опираться на результаты теоремы Фишера-Типпета-Гнеденко , что приводит к обобщенного распределения экстремальных значений для подгонки. выбору [2] [3] Однако на практике для выбора между более широким диапазоном распределений применяются различные процедуры. Теорема здесь относится к предельным распределениям минимума или максимума очень большого набора независимых случайных величин из одного и того же распределения. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к распределений, отличных от обобщенного распределения экстремальных значений (GEVD). выбору [4]
Для данных POT анализ может включать подбор двух распределений: одно для количества событий за рассматриваемый период времени, а второе для размера превышений.
Распространенным предположением для первого является распределение Пуассона с обобщенным распределением Парето, используемым для превышений. может Подгонка хвоста быть основана на теореме Пикандса – Балкемы – де Хаана . [5] [6]
Новак (2011) оставляет термин «метод POT» для случая, когда порог неслучайен, и отличает его от случая, когда речь идет о превышении случайного порога. [7]
Приложения
[ редактировать ]Приложения теории экстремальных значений включают прогнозирование распределения вероятностей:
- Экстремальные наводнения ; размер невероятных волн
- торнадо Вспышки [8]
- Максимальные размеры экологических популяций [9]
- Побочные эффекты лекарств ( например, ксимелагатрана )
- Размеры крупных страховых убытков
- Фондовые риски ; ежедневный рыночный риск
- Мутационные события в ходе эволюции
- Крупные лесные пожары [10]
- Экологические нагрузки на конструкции [11]
- Время, когда самые быстрые люди когда-либо могли пробежать дистанцию 100-метровую [12] и выступления в других спортивных дисциплинах [13] [14] [15]
- Аварии трубопроводов из-за питтинговой коррозии
- Аномальный трафик ИТ-сети не позволяет злоумышленникам получить доступ к важным данным.
- безопасности дорожного движения Анализ [16] [17]
- Беспроводная связь [18]
- Эпидемии [19]
- Нейробиология [20]
- Солнечная энергия [21]
- Экстремальная космическая погода [22] [23] [24]
История
[ редактировать ]Пионер теории экстремальных ценностей был Л. Типпетом (1902–1985). Типпетт работал в Британской исследовательской ассоциации хлопковой промышленности , где работал над повышением прочности хлопковой нити. В своих исследованиях он понял, что прочность нити зависит от прочности ее самых слабых волокон. С помощью Р. А. Фишера Типпет получил три асимптотических предела, описывающих распределения экстремумов в предположении независимых переменных. Э. Дж. Гамбель (1958) [25] систематизировал эту теорию. Эти результаты можно расширить, чтобы учесть небольшие корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Особый интерес представляет один класс универсальности — логарифмически коррелированные поля, в которых корреляции логарифмически затухают с расстоянием.
Одномерная теория
[ редактировать ]Теория экстремальных значений одной переменной регулируется теоремой об экстремальных значениях , также называемой теоремой Фишера-Типпета-Гнеденко , которая описывает, какое из трех возможных распределений экстремальных значений применимо для конкретной статистической переменной. которые обобщены в этом разделе.
Многомерная теория
[ редактировать ]Теория экстремальных значений более чем одной переменной ставит дополнительные проблемы, которые необходимо решить. Одна из проблем, которая возникает, заключается в том, что необходимо указать, что представляет собой экстремальное событие. [26] Хотя в одномерном случае это просто, в многомерном случае однозначного способа сделать это не существует. Фундаментальная проблема заключается в том, что, хотя и возможно упорядочить набор действительных чисел, не существует естественного способа упорядочить набор векторов.
Например, в одномерном случае, учитывая набор наблюдений найти самое экстремальное событие несложно, просто взяв максимум (или минимум) наблюдений. Однако в двумерном случае, учитывая набор наблюдений , не сразу понятно, как найти самое экстремальное событие. Предположим, что были измерены значения в определенное время и значения в более позднее время. Какое из этих событий можно было бы считать более экстремальным? На этот вопрос не существует универсального ответа.
Другая проблема в многомерном случае заключается в том, что ограничивающая модель не так полностью задана, как в одномерном случае. В одномерном случае модель ( распределение GEV ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точный вид которой не предписывается теорией. Однако эта функция должна подчиняться определенным ограничениям. [27] [28] Непросто разработать оценки, подчиняющиеся таким ограничениям, хотя некоторые из них были построены недавно. [29] [30] [31]
В качестве примера применения к исследованию океана была применена двумерная теория экстремальных значений. [26] [32]
Нестационарные экстремумы
[ редактировать ]Статистическое моделирование нестационарных временных рядов было разработано в 1990-х годах. [33] Совсем недавно были введены методы определения нестационарных многомерных экстремумов. [34] Последнее можно использовать для отслеживания того, как зависимость между экстремальными значениями меняется с течением времени или по другой ковариате. [35] [36] [37]
См. также
[ редактировать ]- Экстремальный риск
- Экстремальная погода
- Теорема Фишера – Типпетта – Гнеденко.
- Обобщенное распределение экстремальных значений
- Теория больших отклонений
- Выброс
- Распределение Парето
- Теорема Пиканда – Балкемы – де Хаана
- Редкие события
- Принцип резервирования
- Распределения экстремальных значений
Ссылки
[ редактировать ]- ^ Ледбеттер, MR (1991). «На основе моделирования пиков превышения порога». Статистика и вероятностные буквы . 12 (4): 357–362. дои : 10.1016/0167-7152(91)90107-3 .
- ^ Фишер и Типпетт (1928)
- ^ Гнеденко (1943)
- ^ Эмбрехтс, Клуппельберг и Микош (1997)
- ^ Пикандс (1975)
- ^ Балкема и де Хаан (1974)
- ^ Новак (2011)
- ^ Типпетт, Лепор и Коэн (2016)
- ^ Батт, Райан Д.; Карпентер, Стивен Р.; Айвз, Энтони Р. (март 2017 г.). «Экстремальные события во временных рядах экосистемы озера» . Письма по лимнологии и океанографии . 2 (3): 63. Бибкод : 2017LimOL...2...63B . дои : 10.1002/lol2.10037 .
- ^ Альварадо, Сандберг и Пикфорд (1998) , с. 68
- ^ Макконен (2008)
- ^ Эйнмал, JHJ; Смитс, SGWR (2009). Окончательные мировые рекорды на дистанции 100 метров с помощью теории экстремальных значений (PDF) (Отчет). Дискуссионный документ Центра. Том. 57. Тилбургский университет. Архивировано из оригинала (PDF) 12 марта 2016 г. Проверено 12 августа 2009 г.
- ^ Гембрис, Д.; Тейлор, Дж.; Сутер, Д. (2002). «Тенденции и случайные колебания в легкой атлетике» . Природа . 417 (6888): 506. Бибкод : 2002Natur.417..506G . дои : 10.1038/417506a . HDL : 2003/25362 . ПМИД 12037557 . S2CID 13469470 .
- ^ Гембрис, Д.; Тейлор, Дж.; Сутер, Д. (2007). «Эволюция спортивных рекордов: статистические эффекты и реальные улучшения» . Журнал прикладной статистики . 34 (5): 529–545. Бибкод : 2007JApSt..34..529G . дои : 10.1080/02664760701234850 . hdl : 2003/25404 . ПМЦ 11134017 . S2CID 55378036 .
- ^ Спиринг, Х.; Тон, Дж.; Айронс, Д.; Полден, Т.; Беннетт, Г. (2021). «Рейтинг и другие характеристики элитных пловцов с использованием теории экстремальных ценностей» . Журнал Королевского статистического общества . Серия А (Статистика в обществе). 184 (1): 368–395. arXiv : 1910.10070 . дои : 10.1111/rssa.12628 . S2CID 204823947 .
- ^ Сонгчитрукша, П.; Тарко, АП (2006). «Подход теории экстремальных значений к оценке безопасности». Анализ и предотвращение несчастных случаев . 38 (4): 811–822. дои : 10.1016/j.aap.2006.02.003 . ПМИД 16546103 .
- ^ Орсини, Ф.; Геккеле, Г.; Гастальди, М.; Росси, Р. (2019). «Прогнозирование столкновений на кольцевых развязках: сравнительное исследование подходов теории экстремальных значений». Транспортметрика . Серия А: Транспортная наука. 15 (2): 556–572. дои : 10.1080/23249935.2018.1515271 . S2CID 158343873 .
- ^ Цинос, К.Г.; Фукалас, Ф.; Хаттаб, Т.; Лай, Л. (февраль 2018 г.). «О выборе каналов для систем агрегации несущих» . Транзакции IEEE в области коммуникаций . 66 (2): 808–818. дои : 10.1109/TCOMM.2017.2757478 . S2CID 3405114 .
- ^ Вонг, Феликс; Коллинз, Джеймс Дж. (2 ноября 2020 г.). «Доказательства того, что суперраспространение коронавируса носит толстый хвост» . Труды Национальной академии наук США . 117 (47): 29416–29418. Бибкод : 2020PNAS..11729416W . дои : 10.1073/pnas.2018490117 . ISSN 0027-8424 . ПМЦ 7703634 . ПМИД 33139561 .
- ^ Баснаяке, Канишка; Мазо, Дэвид; Бемельманс, Алексис; Руаш, Натали; Коркотян, Эдуард; Холькман, Дэвид (4 июня 2019 г.). «Быстрые переходные процессы кальция в дендритных шипиках, обусловленные экстремальной статистикой» . ПЛОС Биология . 17 (6): e2006202. дои : 10.1371/journal.pbio.2006202 . ISSN 1545-7885 . ПМК 6548358 . ПМИД 31163024 .
- ^ Юнис, Абубакер; Абдельджалил, Анвар; Омер, Али (1 января 2023 г.). «Определение коэффициента генерации панели с использованием метода пиков над порогом и краткосрочных данных для автономной фотоэлектрической системы в Судане: пример города Хартум» . Солнечная энергия . 249 : 242–249. Бибкод : 2023SoEn..249..242Y . дои : 10.1016/j.solener.2022.11.039 . ISSN 0038-092X . S2CID 254207549 .
- ^ Фогг, Александра Рут (2023). «Анализ экстремальных значений наблюдений наземного магнитометра в обсерватории Валентия, Ирландия» . Космическая погода . 21 (е2023SW003565). дои : 10.1029/2023SW003565 .
- ^ Элвидж, Шон (2020). «Оценка возникновения геомагнитной активности с использованием преобразования Гильберта-Хуанга и теории экстремальных значений» . Космическая погода . 17 (е2020SW002513). дои : 10.1029/2020SW002513 .
- ^ Бергин, Эслинг (2023). «Статистика экстремальных событий в геомагнитных индексах Dst, SYM-H и SMR» . Космическая погода . 21 (e2022SW003304). дои : 10.1029/2022SW003304 . hdl : 10037/30641 .
- ^ Гамбель (2004)
- ^ Jump up to: а б Мортон, ID; Бауэрс, Дж. (декабрь 1996 г.). «Анализ экстремальных значений в многомерной морской среде». Прикладные исследования океана . 18 (6): 303–317. Бибкод : 1996AppOR..18..303M . дои : 10.1016/s0141-1187(97)00007-2 . ISSN 0141-1187 .
- ^ Бейрлант, Ян; Гёгебер, Юрий; Тойгельс, Йозеф; Сегерс, Йохан (27 августа 2004 г.). Статистика экстремумов: теория и приложения . Ряд Уайли по вероятности и статистике. Чичестер, Великобритания: John Wiley & Sons, Ltd., номер телефона : 10.1002/0470012382 . ISBN 978-0-470-01238-3 .
- ^ Коулз, Стюарт (2001). Введение в статистическое моделирование экстремальных значений . Серия Спрингера по статистике. дои : 10.1007/978-1-4471-3675-0 . ISBN 978-1-84996-874-4 . ISSN 0172-7397 .
- ^ де Карвалью, М.; Дэвисон, AC (2014). «Модели отношения спектральной плотности для многомерных экстремумов» (PDF) . Журнал Американской статистической ассоциации . 109 : 764–776. дои : 10.1016/j.spl.2017.03.030 . hdl : 20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c . S2CID 53338058 .
- ^ Хэнсон, Т.; де Карвалью, М.; Чен, Юхуэй (2017). «Угловые плотности полинома Бернштейна многомерных распределений экстремальных значений» (PDF) . Статистика и вероятностные буквы . 128 : 60–66. дои : 10.1016/j.spl.2017.03.030 . hdl : 20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c . S2CID 53338058 .
- ^ де Карвальо, М. (2013). «Евклидова оценка правдоподобия для двумерной зависимости хвоста» (PDF) . Коммуникации в статистике – теория и методы . 42 (7): 1176–1192. arXiv : 1204.3524 . дои : 10.1080/03610926.2012.709905 . S2CID 42652601 .
- ^ Закари, С.; Фельд, Г.; Уорд, Г.; Вольфрам, Дж. (октябрь 1998 г.). «Многомерная экстраполяция в морской среде». Прикладные исследования океана . 20 (5): 273–295. Бибкод : 1998AppOR..20..273Z . дои : 10.1016/s0141-1187(98)00027-3 . ISSN 0141-1187 .
- ^ Дэвисон, AC; Смит, Ричард (1990). «Модели превышения высоких пороговых значений» . Журнал Королевского статистического общества . Серия Б (Методическая). 52 (3): 393–425. дои : 10.1111/j.2517-6161.1990.tb01796.x .
- ^ де Карвальо, М. (2016). «Статистика крайностей: вызовы и возможности». Справочник по EVT и его приложениям в финансах и страховании (PDF) . Хобокен, Нью-Джерси: Сыновья Джона Уайли. стр. 195–214. ISBN 978-1-118-65019-6 .
- ^ Кастро, Д.; де Карвалью, М.; Уодсворт, Дж. (2018). «Изменяющаяся во времени чрезвычайная зависимость стоимости применительно к ведущим европейским фондовым рынкам» (PDF) . Анналы прикладной статистики . 12 : 283–309. дои : 10.1214/17-AOAS1089 . S2CID 33350408 .
- ^ Мхалла, Л.; де Карвалью, М.; Чавес-Демулен, В. (2019). «Модели типа регрессии для экстремальной зависимости» (PDF) . Скандинавский статистический журнал . 46 (4): 1141–1167. дои : 10.1111/sjos.12388 . S2CID 53570822 .
- ^ Мхалла, Л.; де Карвалью, М.; Чавес-Демулен, В. (2018). «Локальная робастная оценка функции зависимости Пикандса» . Анналы статистики . 46 (6А): 2806–2843. дои : 10.1214/17-AOS1640 . S2CID 59467614 .
Источники
[ редактировать ]- Абарбанель, Х.; Кунин С.; Левин, Х.; Макдональд, Г.; Ротхаус, О. (январь 1992 г.). «Статистика экстремальных явлений применительно к климату» (PDF) . ДЖЕЙСОН . ИСР-90-30С . Проверено 3 марта 2015 г.
- Альварадо, Эрнесто; Сандберг, Дэвид В.; Пикфорд, Стюарт Г. (1998). «Моделирование крупных лесных пожаров как экстремальных событий» (PDF) . Северо-западная наука . 72 : 66–75. Архивировано из оригинала (PDF) 26 февраля 2009 г. Проверено 6 февраля 2009 г.
- Балкема, А.; де Хаан, Лоуренс (1974). «Остаточная продолжительность жизни в пожилом возрасте» . Анналы вероятности . 2 (5): 792–804. дои : 10.1214/aop/1176996548 . JSTOR 2959306 .
- Берри, К.В. (1975). Статистические методы в прикладной науке . Хобокен, Нью-Джерси: John Wiley & Sons.
- Кастильо, Э. (1988). Теория экстремальных ценностей в технике . Нью-Йорк, штат Нью-Йорк: Academic Press. ISBN 0-12-163475-2 .
- Кастильо, Э.; Хади, А.С.; Балакришнан, Н.; Сарабия, Дж. М. (2005). Экстремальные значения и связанные с ними модели с приложениями в технике и науке . Ряд Уайли по вероятности и статистике. Хобокен, Нью-Джерси: Сыновья Джона Уайли. ISBN 0-471-67172-Х .
- Коулз, С. (2001). Введение в статистическое моделирование экстремальных значений . Лондон, Великобритания: Спрингер.
- Эмбрехтс, П.; Клуппельберг, К. ; Микош, Т. (1997). Моделирование экстремальных событий для страхования и финансов . Берлин, Германия: Springer Verlag.
- Фишер, РА ; Типпетт, БАК (1928). «Предельные формы частотного распределения самого большого и самого маленького члена выборки». Труды Кембриджского философского общества . 24 (2): 180–190. Бибкод : 1928PCPS...24..180F . дои : 10.1017/s0305004100015681 . S2CID 123125823 .
- Гнеденко, Б.В. (1943). «Sur la Distribution Limite du Terme Maximum d'une Serie Aleatoire» [О предельном распределении(ях) максимального значения ряда...]. Анналы математики (на французском языке). 44 (3): 423–453. дои : 10.2307/1968974 . JSTOR 1968974 .
- Гамбель, Э.Дж. , изд. (1935) [1933–1934]. экстремальных значений» «Статистические распределения (pdf) . Анналы Института Анри Пуанкаре (материалы конференции) (на французском языке). 5 (2). Франция: 115–158 . Проверено 1 апреля 2009 г. - через numdam.org.
- Гамбель, Э.Дж. (2004) [1958]. Статистика крайностей (переиздание). Минеола, Нью-Йорк: Дувр. ISBN 978-0-486-43604-3 .
- Макконен, Л. (2008). «Задачи анализа экстремальных значений». Структурная безопасность . 30 (5): 405–419. doi : 10.1016/j.strusafe.2006.12.001 .
- Ледбеттер, MR (1991). «На основе моделирования пиков превышения порога». Статистика и вероятностные буквы . 12 (4): 357–362. дои : 10.1016/0167-7152(91)90107-3 .
- Ледбеттер, MR; Линдгрен, Г.; Рутцен, Х. (1982). Экстремумы и связанные с ними свойства случайных последовательностей и процессов . Нью-Йорк, штат Нью-Йорк: Springer-Verlag.
- Линдгрен, Г.; Рутцен, Х. (1987). «Экстремальные значения: теория и технические приложения». Скандинавский журнал статистики, теории и приложений . 14 : 241–279.
- Новак, С.Ю. (2011). Методы экстремальных значений с применением в финансах . Лондон, Великобритания / Бока-Ратон, Флорида: Chapman & Hall / CRC Press. ISBN 978-1-4398-3574-6 .
- Пикандс, Дж. (1975). «Статистический вывод с использованием статистики крайнего порядка» . Анналы статистики . 3 : 119–131. дои : 10.1214/aos/1176343003 .
- Типпетт, Майкл К.; Лепор, Кьяра; Коэн, Джоэл Э. (16 декабря 2016 г.). «Больше торнадо в самых экстремальных вспышках торнадо в США» . Наука . 354 (6318): 1419–1423. Бибкод : 2016Sci...354.1419T . дои : 10.1126/science.aah7393 . ПМИД 27934705 .
Программное обеспечение
[ редактировать ]- «Статистика экстремальных значений в R» . cran.r-project.org (программное обеспечение). 4 ноября 2023 г. — Пакет для статистики экстремальных значений в R .
- "Экстрим.jl" . github.com (программное обеспечение). — Пакет для статистики экстремальных значений в Джулии .
- «Исходный код для анализа стационарных и нестационарных экстремальных значений» . amir.eng.uci.edu (программное обеспечение). Ирвин, Калифорния: Калифорнийский университет, Ирвин .
Внешние ссылки
[ редактировать ]- Чавес-Демулен, Валери; Рёрль, Армин (8 января 2004 г.). Теория экстремальных ценностей может спасти вашу шею (PDF) . Risknet.de (Отчет). Германия. — Легкое нематематическое введение.
- Шаги по применению теории экстремальной стоимости к финансам: обзор (PDF) . bankofcanada.ca (отчет). Банк Канады (опубликовано в январе 2010 г.). в. 2010.
- Гамбель, Э.Дж. , изд. (1935) [1933–1934]. «Les valeurs extrêmes des Distributions Statistiques» [Статистические распределения экстремальных значений] (pdf) . Annales de l'Institut Henri Poincaré (материалы конференции) (на французском языке). 5 (2). Франция: 115–158 . Проверено 1 апреля 2009 г. - через numdam.org. — Полнотекстовый доступ к конференциям, проведенным Э. Дж. Гумбелем в 1933–1934 гг.