Jump to content

Распределение Пирсона

Диаграмма системы Пирсона, показывающая распределения типов I, III, VI, V и IV с точки зрения β 1 (квадратичная асимметрия) и β 2 (традиционный эксцесс)

Распределение Пирсона представляет собой семейство непрерывных распределений вероятностей . Впервые она была опубликована Карлом Пирсоном в 1895 году и впоследствии расширена им в 1901 и 1916 годах в серии статей по биостатистике .

История [ править ]

Система Пирсона изначально была разработана для моделирования заметно искаженных наблюдений. В то время было хорошо известно, как настроить теоретическую модель так, чтобы она соответствовала первым двум кумулянтам или моментам наблюдаемых данных: любое распределение вероятностей можно напрямую расширить, чтобы сформировать семейство в масштабе местоположения . За исключением патологических случаев, семейство в масштабе местоположения может быть построено так, чтобы оно сколь угодно хорошо соответствовало наблюдаемому среднему значению (первый кумулянт) и дисперсии (второй кумулянт). Однако не было известно, как построить распределения вероятностей, в которых асимметрия (стандартизованный третий кумулянт) и эксцесс (стандартизованный четвертый кумулянт) могли бы регулироваться одинаково свободно. Эта необходимость стала очевидной при попытке подогнать известные теоретические модели к наблюдаемым данным, которые демонстрировали асимметрию. Примеры Пирсона включают данные о выживаемости, которые обычно асимметричны.

В своей оригинальной статье Пирсон (1895, стр. 360) выделил четыре типа распределений (с номерами от I до IV) в дополнение к нормальному распределению (которое первоначально было известно как тип V). Классификация зависела от того, поддерживались ли распределения на ограниченном интервале, на полупрямой или на всей действительной линии ; и были ли они потенциально перекошенными или обязательно симметричными. Вторая статья (Пирсон, 1901) исправила два упущения: она переопределила распределение типа V (первоначально только нормальное распределение , но теперь распределение обратного гамма-распределения ) и ввела распределение типа VI. Вместе первые две статьи охватывают пять основных типов системы Пирсона (I, III, IV, V и VI). В третьей статье Пирсон (1916) представил дополнительные частные случаи и подтипы (с VII по XII).

Ринд (1909, стр. 430–432) разработал простой способ визуализации пространства параметров системы Пирсона, который впоследствии был принят Пирсоном (1916, табл. 1 и стр. 430 и след., 448 и далее). Типы Пирсона характеризуются двумя величинами, обычно называемыми β 1 и β 2 . Первый — это квадрат асимметрии : β 1 = γ 1 , где γ 1 — асимметрия, или третий стандартизированный момент . Второй — традиционный эксцесс , или четвертый стандартизированный момент: β 2 = γ 2 + 3. (Современные методы определяют эксцесс γ 2 в терминах кумулянтов, а не моментов, так что для нормального распределения мы имеем γ 2 = 0 и β 2 = 3. Здесь мы следуем историческому прецеденту и используем β 2 .) Диаграмма справа показывает, какому типу Пирсона данное конкретное распределение (обозначаемое точкой (β 1 , β 2 принадлежит )).

Многие из асимметричных и/или немезокуртических распределений , знакомых нам сегодня, были еще неизвестны в начале 1890-х годов. То, что сейчас известно как бета-распределение, использовалось Томасом Байесом в качестве апостериорного распределения параметра распределения Бернулли в его работе 1763 года по обратной вероятности . Бета-распределение получило известность благодаря своему членству в системе Пирсона и до 1940-х годов было известно как распределение Пирсона типа I. [1] (Распределение Пирсона типа II является частным случаем типа I, но обычно больше не выделяется.) Гамма-распределение возникло из работ Пирсона (Пирсон 1893, стр. 331; Пирсон 1895, стр. 357, 360, 373–376). и было известно как распределение Пирсона типа III, прежде чем оно получило свое современное название в 1930-х и 1940-х годах. [2] В статье Пирсона 1895 года было представлено распределение типа IV, которое содержит Стьюдента t -распределение как особый случай, Уильямом Сили Госсетом на несколько лет предшествовавшее последующему использованию . В его статье 1901 года были представлены обратное гамма-распределение (тип V) и бета-распределение простых чисел (тип VI).

Определение [ править ]

Пирсона Плотность p определяется как любое допустимое решение дифференциального уравнения (ср. Pearson 1895, стр. 381).

с:

По мнению Орда, [3] Пирсон разработал основную форму уравнения (1) на основе, во-первых, формулы для производной логарифма функции плотности нормального распределения (которая дает линейную функцию) и, во-вторых, рекуррентного соотношения для значений в функции массы вероятности гипергеометрического распределения (которая дает линейно-квадратическую структуру).

В уравнении (1) параметр a определяет стационарную точку и, следовательно, при некоторых условиях режим распределения, поскольку

следует непосредственно из дифференциального уравнения.

Поскольку мы имеем дело с линейным дифференциальным уравнением первого порядка с переменными коэффициентами , то его решение несложно:

Интеграл в этом решении значительно упрощается, если рассматривать некоторые частные случаи подынтегрального выражения. Пирсон (1895, с. 367) выделил два основных случая, определяемых знаком дискриминанта ( а значит, и числом вещественных корней ) квадратичной функции

Отдельные виды распространения [ править ]

1, отрицательный дискриминант Случай

Пирсона Распределение IV типа

Если дискриминант квадратичной функции (2) отрицателен ( ), оно не имеет настоящих корней. Затем определите

Заметим, что α — вполне определенное действительное число и α ≠ 0 , поскольку по предположению и, следовательно, b 2 ≠ 0 . Применяя эти замены, квадратичная функция (2) преобразуется в

Отсутствие действительных корней очевидно из этой формулировки, поскольку α 2 обязательно положительный.

Теперь выразим решение дифференциального уравнения (1) как функцию y :

Пирсон (1895, стр. 362) назвал это «тригонометрическим случаем», потому что интеграл

включает обратную тригонометрическую функцию арктана. Затем

Наконец, позвольте

Применяя эти замены, получаем параметрическую функцию:

Эта ненормированная плотность имеет поддержку на всей вещественной прямой . Это зависит от параметра масштаба α > 0 и параметров формы m > 1/2 и ν . Один параметр был потерян, когда мы решили найти решение дифференциального уравнения (1) как функцию y, а не x . Поэтому мы вновь вводим четвертый параметр, а именно параметр местоположения λ . Таким образом, мы получили плотность распределения Пирсона типа IV :

Нормализующая константа включает в себя комплексную гамма-функцию (Γ) и бета-функцию (B).Обратите внимание, что параметр местоположения λ здесь не совпадает с исходным параметром местоположения, введенным в общую формулировку, а связан через

Пирсона Распределение VII типа

График плотности Пирсона типа VII с λ = 0, σ = 1 и: γ 2 = ∞ (красный); γ 2 = 4 (синий); и γ 2 = 0 (черный)

Параметр формы ν распределения Пирсона типа IV контролирует его асимметрию . Если мы зафиксируем его значение равным нулю, мы получим симметричное трехпараметрическое семейство. Этот особый случай известен как распределение Пирсона типа VII (ср. Pearson 1916, стр. 450). Его плотность

где B — бета-функция .

Альтернативная параметризация (и небольшая специализация) распределения типа VII получается, если положить

для чего требуется m > 3/2. Это влечет за собой незначительную потерю общности, но гарантирует, что дисперсия распределения существует и равна σ. 2 . Теперь параметр m контролирует только эксцесс распределения. Если m приближается к бесконечности, поскольку λ и σ остаются постоянными, нормальное распределение возникает как особый случай:

Это плотность нормального распределения со средним значением λ и стандартным отклонением σ .

Удобно потребовать, чтобы m > 5/2, и положить

Это еще одна специализация, и она гарантирует существование первых четырех моментов распределения. Более конкретно, распределение Пирсона типа VII, параметризованное в терминах (λ, σ, γ 2 ), имеет среднее значение λ , стандартное отклонение σ , равную асимметрию, нулю, и положительный избыточный эксцесс γ 2 .

Стьюдента t -распределение [ править ]

Распределение Пирсона типа VII эквивалентно нестандартизованному Стьюдента t -распределению с параметрами ν > 0, µ, σ. 2 путем применения следующих замен к исходной параметризации:

Обратите внимание, что ограничение m > 1/2 выполнено.

Результирующая плотность

-распределения Стьюдента которую легко узнать как плотность t .

Это означает, что распределение Пирсона типа VII включает в себя стандартное Стьюдента t -распределение , а также стандартное распределение Коши . -распределение Стьюдента В частности, стандартное t возникает как подслучай, когда µ = 0 и σ 2 = 1, что эквивалентно следующим заменам:

Плотность этого ограниченного однопараметрического семейства представляет собой стандартный t Стьюдента :

неотрицательный дискриминант Случай 2 ,

Если квадратичная функция (2) имеет неотрицательный дискриминант ( , он имеет действительные корни 1 : и 2 ) (не обязательно разные)

При наличии действительных корней квадратичная функция (2) может быть записана в виде

и поэтому решение дифференциального уравнения есть

Пирсон (1895, стр. 362) назвал это «логарифмическим случаем», потому что интеграл

включает только функцию логарифма , а не функцию арктанса, как в предыдущем случае.

Используя замену

получим следующее решение дифференциального уравнения (1):

Поскольку эта плотность известна только с точностью до скрытой константы пропорциональности, эту константу можно изменить и записать плотность следующим образом:

Пирсона I Распределение типа

Распределение Пирсона типа I (обобщение бета-распределения ) возникает, когда корни квадратного уравнения (2) имеют противоположные знаки, т. е. . Тогда решение p поддерживается на интервале . Примените замену

где , что дает решение в терминах y , поддерживаемое на интервале (0, 1):

Можно определить:

Перегруппировав константы и параметры, это упрощается до:

Таким образом следует за с . Оказывается, что m 1 , m 2 > −1 необходимо и достаточно для того, чтобы p была правильной функцией плотности вероятности.

Пирсона Распределение II типа

Распределение Пирсона типа II является частным случаем семейства Пирсона типа I, ограниченным симметричными распределениями.

Для кривой Пирсона II типа: [4]

где

По оси ординат y находится частота . Распределение Пирсона типа II используется при расчете таблицы значимых коэффициентов корреляции для коэффициента ранговой корреляции Спирмена , когда количество элементов в серии меньше 100 (или 30, в зависимости от некоторых источников). После этого распределение имитирует стандартное t-распределение Стьюдента . В таблице значений определенные значения используются в качестве констант в предыдущем уравнении:

Используемые моменты x равны

Пирсона Распределение III типа

Определение

является . Распределение Пирсона типа III представляет собой гамма-распределение или распределение хи-квадрат .

Пирсона Распределение V типа

Определение новых параметров:

следует за . Распределение Пирсона типа V является обратным гамма-распределением .

Пирсона Распределение VI типа

Определение

следует за . Распределение Пирсона типа VI представляет собой бета-распределение простых чисел или F -распределение .

Связь с другими дистрибутивами [ править ]

Семейство Пирсонов включает, среди прочего, следующие распределения:

Альтернативой системе распределений Пирсона с целью подбора распределений к данным являются распределения с параметрами квантилей (QPD) и металогические распределения . QPD и металоги могут обеспечить большую гибкость формы и границ, чем система Пирсона. Вместо подбора моментов QPD обычно соответствуют эмпирическим CDF или другим данным с помощью линейного метода наименьших квадратов .

Примерами современных альтернатив диаграмме Пирсона-асимметрия-экскурсия являются: (i) https://github.com/SchildCode/PearsonPlot и (ii) «график Каллена и Фрея» в статистическом приложении R.

Приложения [ править ]

Эти модели используются на финансовых рынках, поскольку их можно параметризовать таким образом, чтобы это имело интуитивное значение для рыночных трейдеров. В настоящее время используется ряд моделей, которые отражают стохастический характер волатильности ставок, акций и т. д. [ который? ] [ нужна ссылка ] и это семейство распределений может оказаться одним из наиболее важных.

В Соединенных Штатах Log-Pearson III является распределением по умолчанию для анализа частоты наводнений. [5]

Недавно были разработаны альтернативы распределениям Пирсона, которые более гибкие и их легче адаптировать к данным. См. дистрибутивы металогов .

Примечания [ править ]

  1. ^ Миллер, Джефф; и др. (9 июля 2006 г.). «Бета-распределение» . Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
  2. ^ Миллер, Джефф; и др. (07.12.2006). «Гамма-распределение» . Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
  3. ^ Орд Дж.К. (1972) с. 2
  4. ^ Рэмси, Филип Х. (1 сентября 1989 г.). «Критические значения для корреляции рангов Спирмена». Журнал образовательной статистики . 14 (3): 245–253. JSTOR   1165017 .
  5. ^ «Руководство по определению частоты паводковых потоков» (PDF) . Вода Геологической службы США . Март 1982 года . Проверено 14 июня 2019 г.

Источники [ править ]

Первоисточники [ править ]

Вторичные источники [ править ]

Ссылки [ править ]

  • Элдертон, сэр В.П., Джонсон, Н.Л. (1969) Системы частотных кривых . Издательство Кембриджского университета.
  • Орд Дж.К. (1972) Семейства частотных распределений . Гриффин, Лондон.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f09d34636ced670952ff39616a7b92ba__1717857660
URL1:https://arc.ask3.ru/arc/aa/f0/ba/f09d34636ced670952ff39616a7b92ba.html
Заголовок, (Title) документа по адресу, URL1:
Pearson distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)