Обобщенное нормальное распределение
Обобщенное нормальное распределение или обобщенное распределение Гаусса ( GGD ) представляет собой одно из двух семейств параметрических непрерывных распределений вероятностей на реальной линии. Оба семейства добавляют параметр формы к нормальному распределению . Чтобы различать эти два семейства, ниже они называются «симметричными» и «асимметричными»; однако это не стандартная номенклатура.
Симметричная версия
[ редактировать ]Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Параметры | местоположение ( реальное ) масштаб (положительный, реальный ) форма (положительная, реальная ) | ||
---|---|---|---|
Поддерживать | |||
| |||
CDF | где параметр формы, является параметром масштаба и – ненормированная неполная нижняя гамма-функция . | ||
Квантиль | | ||
Иметь в виду | |||
медиана | |||
Режим | |||
Дисперсия | |||
асимметрия | 0 | ||
Избыточный эксцесс | |||
Энтропия | [2] |
Симметричное обобщенное нормальное распределение , также известное как экспоненциальное распределение степени или обобщенное распределение ошибок , представляет собой параметрическое семейство симметричных распределений . Оно включает в себя все нормальные распределения и распределения Лапласа , а в качестве предельных случаев — все непрерывные равномерные распределения на ограниченных интервалах вещественной прямой.
Это семейство включает нормальное распределение, когда (со средним и дисперсия ) и включает распределение Лапласа, когда . Как , плотность сходится поточечно к однородной плотности на .
Это семейство допускает хвосты, которые либо тяжелее обычного (когда ) или светлее обычного (когда ). Это полезный способ параметризации континуума симметричных платикуртических плотностей, отходящих от нормальных ( ) до однородной плотности ( ) и континуум симметричных лептокуртических плотностей, начиная с Лапласа ( ) до нормальной плотности ( ).Параметр формы также контролируется острота Помимо хвостов, .
Оценка параметров
[ редактировать ]оценивание параметров методом максимального правдоподобия и методом моментов . Изучено [3] Оценки не имеют замкнутого вида и должны быть получены численно. Также были предложены оценки, не требующие численного расчета. [4]
Обобщенная нормальная логарифмическая функция правдоподобия имеет бесконечно много непрерывных производных (т.е. принадлежит классу C ∞ ) гладких функций только если является положительным, четным целым числом. В противном случае функция имеет непрерывные производные. В результате стандартные результаты о непротиворечивости и асимптотической нормальности максимального правдоподобия оценок применять только тогда, когда .
Оценщик максимального правдоподобия
[ редактировать ]Можно аппроксимировать обобщенное нормальное распределение, используя приближенный метод максимального правдоподобия . [5] [6] С изначально установлен образец первого момента , оценивается с помощью итеративной процедуры Ньютона-Рафсона , начиная с первоначального предположения ,
где
– первый статистический момент абсолютных значений и – второй статистический момент . Итерация
где
и
и где и — это дигамма-функция и тригамма-функция .
Учитывая значение для , можно оценить найдя минимум:
Окончательно оценивается как
Для медиана является более подходящей оценкой . Один раз оценивается, и можно оценить, как описано выше. [7]
Приложения
[ редактировать ]Симметричное обобщенное нормальное распределение использовалось при моделировании, когда концентрация значений вокруг среднего значения и поведение хвоста представляют особый интерес. [8] [9] Другие семейства распределений можно использовать, если основное внимание уделяется другим отклонениям от нормальности. Если основной интерес представляет симметрия распределения, можно использовать косо нормальное семейство или асимметричную версию обобщенного нормального семейства, обсуждаемую ниже. Если основной интерес представляет поведение хвоста, можно использовать семейство Стьюдента , которое аппроксимирует нормальное распределение по мере того, как степени свободы растут до бесконечности. Распределение t, в отличие от этого обобщенного нормального распределения, имеет более тяжелые хвосты, чем нормальное, без образования точки возврата в начале координат. Оно находит применение в физике плазмы под названием «распределение Лэнгдона», возникающее в результате обратного тормозного излучения. [10]
Характеристики
[ редактировать ]Моменты
[ редактировать ]Позволять быть нулевым средним обобщенным гауссовским распределением формы и параметр масштабирования . Моменты существуют и конечны для любого k, большего −1. Для любого неотрицательного целого числа k простые центральные моменты равны [2]
Подключение к стабильному распределению подсчета
[ редактировать ]С точки зрения распределения стабильного количества , можно рассматривать как параметр устойчивости Леви. Это распределение можно разложить до интеграла от плотности ядра, где ядро представляет собой либо распределение Лапласа , либо распределение Гаусса :
где - стабильное распределение количества и это стабильное распределение объемов .
Связь с положительно определенными функциями
[ редактировать ]Функция плотности вероятности симметричного обобщенного нормального распределения является положительно определенной функцией для . [11] [12]
Бесконечная делимость
[ редактировать ]Симметричное обобщенное распределение Гаусса является бесконечно делимым тогда и только тогда, когда . [13]
Обобщения
[ редактировать ]Многомерное обобщенное нормальное распределение, т.е. произведение экспоненциальные распределения мощности с одинаковыми и параметров – единственная плотность вероятности, которую можно записать в виде и имеет независимые маргиналы. [14] Результаты для частного случая многомерного нормального распределения первоначально приписывались Максвеллу . [15]
Асимметричная версия
[ редактировать ]Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Параметры | местоположение ( реальное ) масштаб (положительный, реальный ) форма ( настоящая ) | ||
---|---|---|---|
Поддерживать | |||
, где это стандартный обычный pdf | |||
CDF | , где стандартный нормальный CDF | ||
Иметь в виду | |||
медиана | |||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс |
Асимметричное обобщенное нормальное распределение — это семейство непрерывных распределений вероятностей, в которых параметр формы может использоваться для введения асимметрии или асимметрии. [16] [17] Когда параметр формы равен нулю, получается нормальное распределение. Положительные значения параметра формы дают смещенные влево распределения, ограниченные вправо, а отрицательные значения параметра формы дают смещенные вправо распределения, ограниченные влево. Только когда параметр формы равен нулю, функция плотности для этого распределения положительна по всей действительной линии: в этом случае распределение является нормальным распределением , в противном случае распределения являются смещенными и, возможно, обратными логнормальными распределениями .
Оценка параметров
[ редактировать ]Параметры можно оценить с помощью оценки максимального правдоподобия или метода моментов. Оценки параметров не имеют замкнутого вида, поэтому для расчета оценок необходимо использовать численные расчеты. Поскольку пространство выборки (набор действительных чисел, плотность которых отлична от нуля) зависит от истинного значения параметра, некоторые стандартные результаты о производительности оценок параметров не будут автоматически применяться при работе с этим семейством.
Приложения
[ редактировать ]Асимметричное обобщенное нормальное распределение можно использовать для моделирования значений, которые могут быть нормально распределены или могут быть скошены вправо или влево относительно нормального распределения. Асимметричное нормальное распределение — это еще одно распределение, которое полезно для моделирования отклонений от нормальности из-за асимметрии. Другие распределения, используемые для моделирования асимметричных данных, включают гамма-распределение , логнормальное распределение и распределение Вейбулла , но они не включают нормальное распределение как особые случаи.
Расхождение Кульбака-Лейблера между двумя PDF-файлами
[ редактировать ]Дивергенция Кульбака-Лейблера (KLD) — это метод, используемый для вычисления расхождения или сходства между двумя функциями плотности вероятности. [18]
Позволять и два обобщенных распределения Гаусса с параметрами и с учетом ограничения . [19] Тогда это расхождение определяется выражением:
Другие распределения, относящиеся к нормальному
[ редактировать ]Два описанных здесь обобщенных нормальных семейства, как и семейство косых нормалей , представляют собой параметрические семейства, которые расширяют нормальное распределение путем добавления параметра формы. Из-за центральной роли нормального распределения в вероятности и статистике многие распределения можно охарактеризовать с точки зрения их связи с нормальным распределением. Например, логарифмически нормальное , свернутое нормальное и обратное нормальное распределения определяются как преобразования нормально распределенных значений, но в отличие от обобщенных нормальных и косонормальных семейств они не включают нормальные распределения как особые случаи.
На самом деле все распределения с конечной дисперсией в пределе тесно связаны с нормальным распределением. Распределение Стьюдента, распределение Ирвина-Холла и распределение Бейтса также расширяют нормальное распределение и включают в предел нормальное распределение. Таким образом, нет веской причины отдавать предпочтение «обобщенному» нормальному распределению типа 1, например, комбинации Стьюдента-t и нормализованному расширенному распределению Ирвина-Холла – это могло бы включать, например, треугольное распределение (которое не может быть смоделировано обобщенным гауссовым распределением). тип 1).
Симметричное распределение, которое может моделировать как хвост (длинный и короткий) , так и полностью независимо поведение центра (например, плоское, треугольное или гауссово), например, используя X = IH/chi.
Распределение Тьюки g и h также допускает отклонение от нормальности как из-за асимметрии, так и из-за «жирных хвостов»<ref>Распределение Тьюки g и h Юань Ян, Марк Дж. ДжентонЗначение, том 16, выпуск 3, июнь 2019 г., страницы 12–13, https://doi.org/10.1111/j.1740-9713.2019.01273.x , https://academic.oup.com/jrssig/article/ 03.16.12/7037766?login=false <ref>.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Гриффин, Мэриклер. «Работа с экспоненциальным распределением мощности с использованием gnorm» . Github, пакет gnorm . Проверено 26 июня 2020 г.
- ^ Jump up to: а б Надараджа, Саралис (сентябрь 2005 г.). «Обобщенное нормальное распределение». Журнал прикладной статистики . 32 (7): 685–694. Бибкод : 2005JApSt..32..685N . дои : 10.1080/02664760500079464 . S2CID 121914682 .
- ^ Варанаси, МК; Аажанг, Б. (октябрь 1989 г.). «Параметрическая обобщенная оценка плотности Гаусса». Журнал Акустического общества Америки . 86 (4): 1404–1415. Бибкод : 1989ASAJ...86.1404V . дои : 10.1121/1.398700 .
- ^ Домингес-Молина, Х. Армандо; Гонсалес-Фариас, Грасиела ; Родригес-Даньино, Рамон М. «Практическая процедура оценки параметра формы в обобщенном распределении Гаусса» (PDF) . Архивировано из оригинала (PDF) 2 сентября 2007 г. Проверено 3 марта 2009 г.
- ^ Варанаси, МК; Аажанг Б. (1989). «Параметрическая обобщенная оценка плотности Гаусса». Дж. Акуст. Соц. Являюсь. 86 (4): 1404–1415. Бибкод : 1989ASAJ...86.1404V . дои : 10.1121/1.398700 .
- ^ Делай, Миннесота; Веттерли, М. (февраль 2002 г.). «Извлечение текстуры на основе вейвлетов с использованием обобщенной гауссовой плотности и расстояния Кульбака-Лейблера» . Транзакции IEEE при обработке изображений . 11 (2): 146–158. Бибкод : 2002ИТИП...11..146Д . дои : 10.1109/83.982822 . ПМИД 18244620 .
- ^ Варанаси, Махеш К.; Аажанг, Бехнаам (1 октября 1989 г.). «Параметрическая обобщенная оценка плотности Гаусса». Журнал Акустического общества Америки . 86 (4): 1404–1415. Бибкод : 1989ASAJ...86.1404V . дои : 10.1121/1.398700 . ISSN 0001-4966 .
- ^ Лян, Слава; Лю, Чуанхай; Ван, Найсин (апрель 2007 г.). «Надежный последовательный байесовский метод идентификации дифференциально экспрессируемых генов» . Статистика Синица . 17 (2): 571–597. Архивировано из оригинала 9 октября 2007 г. Проверено 3 марта 2009 г.
- ^ Бокс, Джордж Э.П .; Тяо, Джордж К. (1992). Байесовский вывод в статистическом анализе . Нью-Йорк: Уайли. ISBN 978-0-471-57428-6 .
- ^ Милдер, Аврам Л. (2021). Функции распределения электронов по скоростям и томсоновское рассеяние (кандидатская диссертация). Университет Рочестера. hdl : 1802/36536 .
- ^ Дитсо, Алекс; Бастин, Ронит; Бедный, Х. Винсент; Шамай, Шломо (2018). «Аналитические свойства обобщенных гауссовских распределений» . Журнал статистических распределений и приложений . 5 (1): 6. дои : 10.1186/s40488-018-0088-5 .
- ^ Бохнер, Саломон (1937). «Устойчивые законы вероятности и вполне монотонные функции» . Математический журнал Дьюка . 3 (4): 726–728. дои : 10.1215/s0012-7094-37-00360-0 .
- ^ Дитсо, Алекс; Бастин, Ронит; Бедный, Х. Винсент; Шамай, Шломо (2018). «Аналитические свойства обобщенных гауссовских распределений» . Журнал статистических распределений и приложений . 5 (1): 6. дои : 10.1186/s40488-018-0088-5 .
- ^ Синц, Фабиан; Гервинн, Себастьян; Бетге, Матиас (май 2009 г.). «Характеристика p-обобщенного нормального распределения» . Журнал многомерного анализа . 100 (5): 817–820. дои : 10.1016/j.jmva.2008.07.006 .
- ^ Кац, М. (1939). «О характеристике нормального распределения». Американский журнал математики . 61 (3): 726–728. дои : 10.2307/2371328 . JSTOR 2371328 .
- ^ Хоскинг, Дж. Р. М., Уоллис, Дж. Р. (1997) Региональный частотный анализ: подход, основанный на L-моментах , Cambridge University Press. ISBN 0-521-43045-3 . Раздел А.8
- ^ Документация для пакета lmomco R.
- ^ Кульбак, С.; Лейблер, Р.А. (1951). «Об информации и достаточности» . Анналы математической статистики . 22 (1): 79–86. дои : 10.1214/aoms/1177729694 .
- ^ Кинтеро-Ринкон, А.; Перейра, М.; Д'Джано, К.; Бататия, Х.; Риск, М. (2017). «Визуальный метод обнаружения эпилепсии ЭЭГ, основанный на статистическом представлении вейвлетов и расхождении Кульбака-Лейблера» . Труды IFMBE . 60 :13-16. дои : 10.1007/978-981-10-4086-3_4 . hdl : 11336/77054 .