Распределение Пирсона

Распределение Пирсона представляет собой семейство непрерывных распределений вероятностей . Впервые она была опубликована Карлом Пирсоном в 1895 году и впоследствии расширена им в 1901 и 1916 годах в серии статей по биостатистике .
История [ править ]
Система Пирсона изначально была разработана для моделирования заметно искаженных наблюдений. В то время было хорошо известно, как настроить теоретическую модель так, чтобы она соответствовала первым двум кумулянтам или моментам наблюдаемых данных: любое распределение вероятностей можно напрямую расширить, чтобы сформировать семейство в масштабе местоположения . За исключением патологических случаев, семейство в масштабе местоположения может быть построено так, чтобы оно сколь угодно хорошо соответствовало наблюдаемому среднему значению (первый кумулянт) и дисперсии (второй кумулянт). Однако не было известно, как построить распределения вероятностей, в которых асимметрия (стандартизованный третий кумулянт) и эксцесс (стандартизованный четвертый кумулянт) могли бы регулироваться одинаково свободно. Эта необходимость стала очевидной при попытке подогнать известные теоретические модели к наблюдаемым данным, которые демонстрировали асимметрию. Примеры Пирсона включают данные о выживаемости, которые обычно асимметричны.
В своей оригинальной статье Пирсон (1895, стр. 360) выделил четыре типа распределений (с номерами от I до IV) в дополнение к нормальному распределению (которое первоначально было известно как тип V). Классификация зависела от того, поддерживались ли распределения на ограниченном интервале, на полупрямой или на всей действительной линии ; и были ли они потенциально перекошенными или обязательно симметричными. Вторая статья (Пирсон, 1901) исправила два упущения: она переопределила распределение типа V (первоначально только нормальное распределение , но теперь распределение обратного гамма-распределения ) и ввела распределение типа VI. Вместе первые две статьи охватывают пять основных типов системы Пирсона (I, III, IV, V и VI). В третьей статье Пирсон (1916) представил дополнительные частные случаи и подтипы (с VII по XII).
Ринд (1909, стр. 430–432) разработал простой способ визуализации пространства параметров системы Пирсона, который впоследствии был принят Пирсоном (1916, табл. 1 и стр. 430 и след., 448 и далее). Типы Пирсона характеризуются двумя величинами, обычно называемыми β 1 и β 2 . Первый — это квадрат асимметрии : β 1 = γ 1 , где γ 1 — асимметрия, или третий стандартизированный момент . Второй — традиционный эксцесс , или четвертый стандартизированный момент: β 2 = γ 2 + 3. (Современные методы определяют эксцесс γ 2 в терминах кумулянтов, а не моментов, так что для нормального распределения мы имеем γ 2 = 0 и β 2 = 3. Здесь мы следуем историческому прецеденту и используем β 2 .) Диаграмма справа показывает, какому типу Пирсона данное конкретное распределение (обозначаемое точкой (β 1 , β 2 принадлежит )).
Многие из асимметричных и/или немезокуртических распределений , знакомых нам сегодня, были еще неизвестны в начале 1890-х годов. То, что сейчас известно как бета-распределение, использовалось Томасом Байесом в качестве апостериорного распределения параметра распределения Бернулли в его работе 1763 года по обратной вероятности . Бета-распределение получило известность благодаря своему членству в системе Пирсона и до 1940-х годов было известно как распределение Пирсона типа I. [1] (Распределение Пирсона типа II является частным случаем типа I, но обычно больше не выделяется.) Гамма-распределение возникло из работ Пирсона (Пирсон 1893, стр. 331; Пирсон 1895, стр. 357, 360, 373–376). и было известно как распределение Пирсона типа III, прежде чем оно получило свое современное название в 1930-х и 1940-х годах. [2] В статье Пирсона 1895 года было представлено распределение типа IV, которое содержит Стьюдента t -распределение как особый случай, Уильямом Сили Госсетом на несколько лет предшествовавшее последующему использованию . В его статье 1901 года были представлены обратное гамма-распределение (тип V) и бета-распределение простых чисел (тип VI).
Определение [ править ]
Пирсона Плотность p определяется как любое допустимое решение дифференциального уравнения (ср. Pearson 1895, стр. 381).
с:
По мнению Орда, [3] Пирсон разработал основную форму уравнения (1) на основе, во-первых, формулы для производной логарифма функции плотности нормального распределения (которая дает линейную функцию) и, во-вторых, рекуррентного соотношения для значений в функции массы вероятности гипергеометрического распределения (которая дает линейно-квадратическую структуру).
В уравнении (1) параметр a определяет стационарную точку и, следовательно, при некоторых условиях режим распределения, поскольку
следует непосредственно из дифференциального уравнения.
Поскольку мы имеем дело с линейным дифференциальным уравнением первого порядка с переменными коэффициентами , то его решение несложно:
Интеграл в этом решении значительно упрощается, если рассматривать некоторые частные случаи подынтегрального выражения. Пирсон (1895, с. 367) выделил два основных случая, определяемых знаком дискриминанта ( а значит, и числом вещественных корней ) квадратичной функции
Отдельные виды распространения [ править ]
1, отрицательный дискриминант Случай
Пирсона Распределение IV типа
Если дискриминант квадратичной функции (2) отрицателен ( ), оно не имеет настоящих корней. Затем определите
Заметим, что α — вполне определенное действительное число и α ≠ 0 , поскольку по предположению и, следовательно, b 2 ≠ 0 . Применяя эти замены, квадратичная функция (2) преобразуется в
Отсутствие действительных корней очевидно из этой формулировки, поскольку α 2 обязательно положительный.
Теперь выразим решение дифференциального уравнения (1) как функцию y :
Пирсон (1895, стр. 362) назвал это «тригонометрическим случаем», потому что интеграл
включает обратную тригонометрическую функцию арктана. Затем
Наконец, позвольте
Применяя эти замены, получаем параметрическую функцию:
Эта ненормированная плотность имеет поддержку на всей вещественной прямой . Это зависит от параметра масштаба α > 0 и параметров формы m > 1/2 и ν . Один параметр был потерян, когда мы решили найти решение дифференциального уравнения (1) как функцию y, а не x . Поэтому мы вновь вводим четвертый параметр, а именно параметр местоположения λ . Таким образом, мы получили плотность распределения Пирсона типа IV :
Нормализующая константа включает в себя комплексную гамма-функцию (Γ) и бета-функцию (B).Обратите внимание, что параметр местоположения λ здесь не совпадает с исходным параметром местоположения, введенным в общую формулировку, а связан через
Пирсона Распределение VII типа

Параметр формы ν распределения Пирсона типа IV контролирует его асимметрию . Если мы зафиксируем его значение равным нулю, мы получим симметричное трехпараметрическое семейство. Этот особый случай известен как распределение Пирсона типа VII (ср. Pearson 1916, стр. 450). Его плотность
где B — бета-функция .
Альтернативная параметризация (и небольшая специализация) распределения типа VII получается, если положить
для чего требуется m > 3/2. Это влечет за собой незначительную потерю общности, но гарантирует, что дисперсия распределения существует и равна σ. 2 . Теперь параметр m контролирует только эксцесс распределения. Если m приближается к бесконечности, поскольку λ и σ остаются постоянными, нормальное распределение возникает как особый случай:
Это плотность нормального распределения со средним значением λ и стандартным отклонением σ .
Удобно потребовать, чтобы m > 5/2, и положить
Это еще одна специализация, и она гарантирует существование первых четырех моментов распределения. Более конкретно, распределение Пирсона типа VII, параметризованное в терминах (λ, σ, γ 2 ), имеет среднее значение λ , стандартное отклонение σ , равную асимметрию, нулю, и положительный избыточный эксцесс γ 2 .
Стьюдента t -распределение [ править ]
Распределение Пирсона типа VII эквивалентно нестандартизованному Стьюдента t -распределению с параметрами ν > 0, µ, σ. 2 путем применения следующих замен к исходной параметризации:
Обратите внимание, что ограничение m > 1/2 выполнено.
Результирующая плотность
-распределения Стьюдента которую легко узнать как плотность t .
Это означает, что распределение Пирсона типа VII включает в себя стандартное Стьюдента t -распределение , а также стандартное распределение Коши . -распределение Стьюдента В частности, стандартное t возникает как подслучай, когда µ = 0 и σ 2 = 1, что эквивалентно следующим заменам:
Плотность этого ограниченного однопараметрического семейства представляет собой стандартный t Стьюдента :
неотрицательный дискриминант Случай 2 ,
Если квадратичная функция (2) имеет неотрицательный дискриминант ( , он имеет действительные корни 1 : и 2 ) (не обязательно разные)
При наличии действительных корней квадратичная функция (2) может быть записана в виде
и поэтому решение дифференциального уравнения есть
Пирсон (1895, стр. 362) назвал это «логарифмическим случаем», потому что интеграл
включает только функцию логарифма , а не функцию арктанса, как в предыдущем случае.
Используя замену
получим следующее решение дифференциального уравнения (1):
Поскольку эта плотность известна только с точностью до скрытой константы пропорциональности, эту константу можно изменить и записать плотность следующим образом:
Пирсона I Распределение типа
Распределение Пирсона типа I (обобщение бета-распределения ) возникает, когда корни квадратного уравнения (2) имеют противоположные знаки, т. е. . Тогда решение p поддерживается на интервале . Примените замену
где , что дает решение в терминах y , поддерживаемое на интервале (0, 1):
Можно определить:
Перегруппировав константы и параметры, это упрощается до:
Таким образом следует за с . Оказывается, что m 1 , m 2 > −1 необходимо и достаточно для того, чтобы p была правильной функцией плотности вероятности.
Пирсона Распределение II типа
Распределение Пирсона типа II является частным случаем семейства Пирсона типа I, ограниченным симметричными распределениями.
Для кривой Пирсона II типа: [4]
где
По оси ординат y находится частота . Распределение Пирсона типа II используется при расчете таблицы значимых коэффициентов корреляции для коэффициента ранговой корреляции Спирмена , когда количество элементов в серии меньше 100 (или 30, в зависимости от некоторых источников). После этого распределение имитирует стандартное t-распределение Стьюдента . В таблице значений определенные значения используются в качестве констант в предыдущем уравнении:
Используемые моменты x равны
Пирсона Распределение III типа
Определение
является . Распределение Пирсона типа III представляет собой гамма-распределение или распределение хи-квадрат .
Пирсона Распределение V типа
Определение новых параметров:
следует за . Распределение Пирсона типа V является обратным гамма-распределением .
Пирсона Распределение VI типа
Определение
следует за . Распределение Пирсона типа VI представляет собой бета-распределение простых чисел или F -распределение .
Связь с другими дистрибутивами [ править ]
Семейство Пирсонов включает, среди прочего, следующие распределения:
- Бета-распределение (тип I)
- Бета-простое распределение (тип VI)
- Распределение Коши (тип IV)
- Распределение хи-квадрат (тип III)
- Непрерывное равномерное распределение (предел типа I)
- Экспоненциальное распределение (тип III)
- Гамма-распределение (тип III)
- F -распределение (тип VI)
- Распределение обратного хи-квадрата (тип V)
- Inverse-gamma distribution (type V)
- Нормальное распределение (предел типа I, III, IV, V или VI)
- Стьюдента t -распределение (тип VII, который является неасимметричным подтипом типа IV)
Альтернативой системе распределений Пирсона с целью подбора распределений к данным являются распределения с параметрами квантилей (QPD) и металогические распределения . QPD и металоги могут обеспечить большую гибкость формы и границ, чем система Пирсона. Вместо подбора моментов QPD обычно соответствуют эмпирическим CDF или другим данным с помощью линейного метода наименьших квадратов .
Примерами современных альтернатив диаграмме Пирсона-асимметрия-экскурсия являются: (i) https://github.com/SchildCode/PearsonPlot и (ii) «график Каллена и Фрея» в статистическом приложении R.
Приложения [ править ]
Эти модели используются на финансовых рынках, поскольку их можно параметризовать таким образом, чтобы это имело интуитивное значение для рыночных трейдеров. В настоящее время используется ряд моделей, которые отражают стохастический характер волатильности ставок, акций и т. д. [ который? ] [ нужна ссылка ] и это семейство распределений может оказаться одним из наиболее важных.
В Соединенных Штатах Log-Pearson III является распределением по умолчанию для анализа частоты наводнений. [5]
Недавно были разработаны альтернативы распределениям Пирсона, которые более гибкие и их легче адаптировать к данным. См. дистрибутивы металогов .
Примечания [ править ]
- ^ Миллер, Джефф; и др. (9 июля 2006 г.). «Бета-распределение» . Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
- ^ Миллер, Джефф; и др. (07.12.2006). «Гамма-распределение» . Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
- ^ Орд Дж.К. (1972) с. 2
- ^ Рэмси, Филип Х. (1 сентября 1989 г.). «Критические значения для корреляции рангов Спирмена». Журнал образовательной статистики . 14 (3): 245–253. JSTOR 1165017 .
- ^ «Руководство по определению частоты паводковых потоков» (PDF) . Вода Геологической службы США . Март 1982 года . Проверено 14 июня 2019 г.
Источники [ править ]
Первоисточники [ править ]
- Пирсон, Карл (1893). «Вклад в математическую теорию эволюции [аннотация]» . Труды Королевского общества . 54 (326–330): 329–333. дои : 10.1098/rspl.1893.0079 . JSTOR 115538 .
- Пирсон, Карл (1895). «Вклад в математическую теорию эволюции, II: Асимметрия в однородном материале» (PDF) . Философские труды Королевского общества . 186 : 343–414. Бибкод : 1895RSPTA.186..343P . дои : 10.1098/rsta.1895.0010 . JSTOR 90649 .
- Пирсон, Карл (1901). «Математический вклад в теорию эволюции, X: Дополнение к мемуарам о асимметрии» . Философские труды Королевского общества А. 197 (287–299): 443–459. Бибкод : 1901RSPTA.197..443P . дои : 10.1098/rsta.1901.0023 . JSTOR 90841 .
- Пирсон, Карл (1916). «Математический вклад в теорию эволюции, XIX: Второе приложение к мемуарам о асимметрии» . Философские труды Королевского общества А. 216 (538–548): 429–457. Бибкод : 1916RSPTA.216..429P . дои : 10.1098/rsta.1916.0009 . JSTOR 91092 .
- Ринд, А. (июль – октябрь 1909 г.). «Таблицы для облегчения расчета вероятных ошибок главных констант асимметричных распределений частот» . Биометрика . 7 (1/2): 127–147. дои : 10.1093/biomet/7.1-2.127 . JSTOR 2345367 .
Вторичные источники [ править ]
- Милтон Абрамовиц и Ирен А. Стегун (1964). Справочник по математическим функциям с формулами, графиками и математическими таблицами . Национальное бюро стандартов .
- Эрик В. Вайсштейн и др. Распределение Пирсона III типа . Из МатМира .
Ссылки [ править ]
- Элдертон, сэр В.П., Джонсон, Н.Л. (1969) Системы частотных кривых . Издательство Кембриджского университета.
- Орд Дж.К. (1972) Семейства частотных распределений . Гриффин, Лондон.