Отношения между распределениями вероятностей
В теории вероятностей и статистике существует несколько взаимосвязей между распределениями вероятностей . Эти отношения можно разделить на следующие группы:
- Одно распределение является частным случаем другого с более широким пространством параметров.
- Преобразования (функция случайной величины);
- Комбинации (функция нескольких переменных);
- Аппроксимационные (предельные) отношения;
- Сложные отношения (полезны для байесовского вывода);
- Двойственность [ нужны разъяснения ] ;
- Сопряженные априоры .
Особый случай параметризации распределения
[ редактировать ]- Биномиальное распределение с параметрами n = 1 и p является распределением Бернулли с параметром p .
- Отрицательное биномиальное распределение с параметрами n = 1 и p является геометрическим распределением с параметром p .
- Гамма -распределение с параметром формы α = 1 и параметром скорости β представляет собой экспоненциальное распределение с параметром скорости β .
- Гамма -распределение с параметром формы α = v /2 и параметром скорости β = 1/2 представляет собой распределение хи-квадрат с ν степенями свободы .
- Распределение хи-квадрат с 2 степенями свободы ( k = 2) представляет собой экспоненциальное распределение со средним значением 2 (скорость λ = 1/2).
- Распределение Вейбулла с параметром формы k = 1 и параметром скорости β представляет собой экспоненциальное распределение с параметром скорости β .
- Бета -распределение с параметрами формы α = β = 1 представляет собой непрерывное равномерное распределение по действительным числам от 0 до 1.
- Бета -биномиальное распределение с параметром n и параметрами формы α = β = 1 представляет собой дискретное равномерное распределение по целым числам от 0 до n .
- с t-распределение Стьюдента одной степенью свободы ( v = 1) представляет собой распределение Коши с параметром местоположения x = 0 и параметром масштаба γ = 1.
- Распределение Берра с параметрами c = 1 и k (и масштабом λ ) представляет собой распределение Ломакса с формой k (и масштабом λ ).
Преобразование переменной
[ редактировать ]кратное случайной величине
[ редактировать ]Умножение переменной на любую положительную действительную константу дает масштабирование исходного распределения.Некоторые из них являются самовоспроизводящимися, что означает, что масштабирование дает одно и то же семейство распределений, хотя и с другим параметром: нормальное распределение , гамма-распределение , распределение Коши , экспоненциальное распределение , распределение Эрланга , распределение Вейбулла , логистическое распределение , распределение ошибок , степенное распределение , распределение Рэлея .
Пример:
- Если X — гамма-случайная величина с параметрами формы и скорости ( α , β ), то Y = aX — гамма-случайная величина с параметрами ( α , β / a ).
- Если X — гамма-случайная величина с параметрами формы и масштаба ( k , θ ), то Y = aX — гамма-случайная величина с параметрами ( k , aθ ).
Линейная функция случайной величины
[ редактировать ]Аффинное преобразование ax + b приводит к перемещению и масштабированию исходного распределения. Самовоспроизводящимися являются: Нормальное распределение , Распределение Коши , Логистическое распределение , Распределение ошибок , Распределение степени , Распределение Рэлея .
Пример:
- Если Z — нормальная случайная величина с параметрами ( µ = m , σ 2 = с 2 ), то X = aZ + b — нормальная случайная величина с параметрами ( µ = am + b , σ 2 = а 2 с 2 ).
Обратная случайная величина
[ редактировать ]Обратная величина 1/ X случайной величины X является членом того же семейства распределений, что и X , в следующих случаях: Распределение Коши , распределение F , логлогистическое распределение .
Примеры:
- Если X — случайная величина Коши ( μ , σ ), то 1/ X — случайная величина Коши ( μ / C , σ / C ), где C = μ 2 + р 2 .
- Если X является случайной величиной F ( ν 1 , ν 2 ), то 1/ X является случайной величиной F ( ν 2 , ν 1 ).
Другие случаи
[ редактировать ]Некоторые распределения инвариантны относительно определенного преобразования.
Пример:
- Если X является бета- ( α , β ) случайной величиной, то (1 - X ) является бета- ( β , α ) случайной величиной.
- Если X является биномиальной ( n , p ) случайной величиной, то ( n - X ) является биномиальной ( n , 1 - p ) случайной величиной.
- Если X имеет кумулятивную функцию распределения F X , то обратная кумулятивному распределению F
X ( X ) — стандартная равномерная (0,1) случайная величина. - Если X является нормальным ( µ , p 2 ) случайная величина, тогда e Х является логнормальным ( µ , σ 2 ) случайная величина.
- И наоборот, если X является логнормальным ( µ , σ 2 ) случайная величина, то log X является нормальной ( µ , σ 2 ) случайная величина.
- Если X — экспоненциальная случайная величина со средним значением β , то X 1/ с — случайная величина Вейбулла ( γ , β ).
- Квадрат стандартной нормальной случайной величины имеет распределение хи-квадрат с одной степенью свободы.
- Если X — Стьюдента t случайная величина ν со степенью свободы , то X 2 является случайной величиной F (1, ν ).
- Если X — двойная экспоненциальная случайная величина со средним значением 0 и масштабом λ , то | Х | — экспоненциальная случайная величина со средним значением λ .
- Геометрическая величины случайная величина — это нижняя граница случайной экспоненциальной .
- Прямоугольная случайная величина — это нижняя граница равномерной случайной величины.
- Обратная случайная величина — это экспонента равномерной случайной величины.
Функции нескольких переменных
[ редактировать ]Сумма переменных
[ редактировать ]Распределение суммы независимых случайных величин представляет собой свертку их распределений. Предполагать это сумма независимые случайные величины каждый с функциями вероятностной массы . Затем
Если оно имеет распределение из того же семейства распределений, что и исходные переменные, то это семейство распределений называется замкнутым при свертке . Часто (всегда?) эти распределения также являются стабильными распределениями (см. также Дискретно-стабильное распределение ).
Примерами таких одномерных распределений являются: нормальные распределения , распределения Пуассона , биномиальные распределения (с общей вероятностью успеха), отрицательные биномиальные распределения (с общей вероятностью успеха), гамма-распределения (с общим параметром скорости ), распределения хи-квадрат , распределения Коши , гиперэкспоненциальные распределения . распределения .
- Если X 1 и X 2 являются Пуассона случайными величинами со средними значениями µ 1 и µ 2 соответственно, то X 1 + X 2 является Пуассона случайной величиной со средним значением µ 1 + µ 2 .
- Сумма гамма- ( αi β , β случайных величин имеет гамма- ( Σαi , ) распределение ).
- Если X 1 является Коши ( µ 1 , σ 1 случайной величиной ) и X 2 является случайной величиной Коши ( µ 2 , σ 2 ), то X 1 + X 2 является случайной величиной Коши ( µ 1 + µ 2 , σ 1 + σ 2 ). ) случайная величина.
- Если X 1 и X 2 являются хи-квадрат случайными величинами ν 1 и ν 2 со степенями свободы соответственно, то X 1 + X 2 является случайной величиной хи-квадрат ν 1 + ν 2 . со степенями свободы
- Если X 1 является нормальным ( µ 1 , σ 2
1 ) случайная величина, а X 2 — нормальная ( µ 2 , σ 2
2 ) случайная величина, то X 1 + X 2 является нормальной ( µ 1 + µ 2 , σ 2
1 + п 2
2 ) случайная величина. - Сумма N случайных величин хи-квадрат (1) имеет распределение хи-квадрат с N степенями свободы.
Остальные распределения не замкнуты относительно свертки, но их сумма имеет известное распределение:
- Сумма n случайных величин Бернулли (p) является биномиальной ( n , p ) случайной величиной.
- Сумма n геометрических случайных величин с вероятностью успеха p представляет собой отрицательную биномиальную случайную величину с параметрами n и p .
- Сумма n экспоненциальных ( β ) случайных величин представляет собой гамма ( n , β ) случайную величину. Поскольку n — целое число, гамма-распределение также является распределением Эрланга .
- Сумма квадратов N стандартных нормальных случайных величин имеет распределение хи-квадрат с N степенями свободы.
Произведение переменных
[ редактировать ]Произведение независимых случайных величин X и Y может принадлежать к тому же семейству распределений, что и X и Y : распределению Бернулли и логнормальному распределению .
Пример:
- Если X 1 и X 2 — независимые логнормальные случайные величины с параметрами ( µ 1 , σ 2
1 ) и ( м 2 , п 2
2 ) соответственно, то X 1 X 2 — логнормальная случайная величина с параметрами ( µ 1 + µ 2 , σ 2
1 + п 2
2 ).
Минимум и максимум независимых случайных величин
[ редактировать ]Для некоторых распределений минимальное значение нескольких независимых случайных величин является членом одного семейства с разными параметрами: Распределение Бернулли , Геометрическое распределение , Экспоненциальное распределение , Распределение экстремальных значений , Распределение Парето , Распределение Рэлея , Распределение Вейбулла .
Примеры:
- Если X 1 и X 2 являются независимыми геометрическими случайными величинами с вероятностью успеха p 1 и p 2 соответственно, то min( X 1 , X 2 ) является геометрической случайной величиной с вероятностью успеха p = p 1 + p 2 − p 1. п 2 . Зависимость будет проще, если ее выразить через вероятность отказа: q = q 1 q 2 .
- Если X 1 и X 2 являются независимыми экспоненциальными случайными величинами со скоростью µ 1 и µ 2 соответственно, то min( X 1 , X 2 ) является экспоненциальной случайной величиной со скоростью µ = µ 1 + µ 2 .
Аналогичным образом, распределения, для которых максимальное значение нескольких независимых случайных величин является членом одного и того же семейства распределений, включают: Распределение Бернулли , Степенное распределение.
Другой
[ редактировать ]- Если X и Y являются независимыми стандартными нормальными случайными величинами, X / Y является случайной величиной Коши (0,1).
- Если X 1 и X 2 являются независимыми хи-квадрат случайными величинами ν 1 и ν 2 со степенями свободы соответственно, то ( X 1 / ν 1 )/( X 2 / ν 2 ) является F ( ν 1 , ν 2 ) случайная величина.
- Если X — стандартная нормальная случайная величина, а U — независимая случайная величина хи-квадрат с ν степенями свободы, то — случайная величина Стьюдента t ( ν ).
- Если X 1 является гамма- ( α 1 , 1) случайной величиной, а X 2 является независимой гамма- (α 2 , 1) случайной величиной, то X 1 /( X 1 + X 2 ) является бета ( α 1 , α 2 ) случайная величина. В более общем смысле, если X 1 является гамма-( α 1 , β 1 ) случайной величиной, а X 2 является независимой гамма-( α 2 , β 2 ) случайной величиной, то β 2 X 1 /( β 2 X 1 + β 1 X 2 ) является бета( α 1 , α 2 ) случайной величиной.
- Если X и Y — независимые экспоненциальные случайные величины со средним значением µ, то X — Y — двойная экспоненциальная случайная величина со средним значением 0 и масштабом µ.
- Если X i являются независимыми Бернулли случайными величинами , то их четность (XOR) является переменной Бернулли, описываемой леммой о нагромождении .
Приблизительные (предельные) отношения
[ редактировать ]Приблизительные или предельные отношения означают
- либо комбинация бесконечного числа случайных величин iid стремится к некоторому распределению,
- или что предел, когда параметр стремится к некоторому значению, приближается к другому распределению.
Комбинация случайных величин iid :
- При определенных условиях сумма (следовательно, среднее) достаточно большого числа случайных величин iid, каждая из которых имеет конечное среднее значение и дисперсию, будет примерно нормально распределена. Это центральная предельная теорема (ЦПТ).
Частный случай параметризации распределения:
- X — гипергеометрическая ( m , N , n ) случайная величина. Если n и m велики по сравнению с N , а p = m / N не близко к 0 или 1, то X приблизительно имеет биномиальное ( n , p ) распределение.
- X — бета-биномиальная случайная величина с параметрами ( n , α , β ). Пусть p = α /( α + β ) и предположим, что α + β велико, тогда X приблизительно имеет биномиальное ( n , p ) распределение.
- Если X является биномиальной ( n , p ) случайной величиной и если n велико, а np мало, то X приблизительно имеет распределение Пуассона ( np ).
- Если X — отрицательная биномиальная случайная величина с большим r , P около 1 и r (1 − P ) = λ , то X приблизительно имеет распределение Пуассона со средним значением λ .
Последствия CLT:
- Если X — случайная величина Пуассона с большим средним значением, то для целых чисел j и k P( j ≤ X ≤ k ) примерно равно P ( j − 1/2 ≤ Y ≤ k + 1/2), где Y — нормальный распределение с тем же средним значением и дисперсией, что X. и
- Если X — биномиальная ( n , p ) случайная величина с большими np и n (1 − p ), то для целых чисел j и k P ( j ≤ X ≤ k ) примерно равно P ( j − 1/2 ≤ Y ≤ k + 1/2), где Y — нормальная случайная величина с тем же средним значением и дисперсией, что и X , т. е. np и np (1 − p ).
- Если X является бета- случайной величиной с параметрами α и β равными и большими, то X приблизительно имеет нормальное распределение с одинаковым средним значением и дисперсией, т.е. средним значением α /( α + β ) и дисперсией αβ /(( α + β ) 2 ( а + б + 1)).
- Если X является случайной величиной гамма ( α , β ) и параметр формы α велик по сравнению с параметром масштаба β , то X примерно имеет нормальную случайную величину с тем же средним значением и дисперсией.
- Если X — случайная величина Стьюдента t с большим числом степеней свободы ν , то X приблизительно имеет стандартное нормальное распределение.
- Если X является случайной величиной F ( ν , ω ) с большим ω , то νX приблизительно распределяется как случайная величина хи-квадрат с ν степенями свободы.
Сложные (или байесовские) отношения
[ редактировать ]Когда один или несколько параметров распределения являются случайными величинами, сложное распределение представляет собой предельное распределение переменной.
Примеры:
- Если Х | N — биномиальная ( N , p ) случайная величина, где параметр N — случайная величина с отрицательно-биномиальным ( m , r ) распределением, тогда X распределяется как отрицательно-биномиальное ( m , r /( p + qr )) .
- Если Х | N — биномиальная ( N , p ) случайная величина, где параметр N — случайная величина с распределением Пуассона ( µ ), тогда X распределяется как Пуассон ( µp ).
- Если Х | μ — Пуассона ( μ случайная величина ), а параметр μ — случайная величина с гамма-распределением ( m , θ ) (где θ — параметр масштаба), тогда X распределяется как отрицательно-биномиальное ( m , θ /(1 + θ) )), иногда называемое гамма-распределением Пуассона .
Некоторые дистрибутивы были специально названы составными: бета-биномиальное распределение , бета-отрицательное биномиальное распределение , гамма-нормальное распределение .
Примеры:
- Если X является биномиальной ( n , p ) случайной величиной, а параметр p является случайной величиной с бета-распределением ( α , β ), то X распределяется как бета-биномиальное ( α , β , n ).
- Если X является отрицательно-биномиальной ( r , p ) случайной величиной, а параметр p является случайной величиной с бета-распределением ( α , β ), то X распределяется как бета-отрицательное биномиальное распределение ( r , α , β ).
См. также
[ редактировать ]- Центральная предельная теорема
- Сложное распределение вероятностей
- Список сверток вероятностных распределений
Ссылки
[ редактировать ]- ^ ЛИМИС, Лоуренс М.; Жаклин Т. МАККЕСТОН (февраль 2008 г.). «Одномерные отношения распределения» (PDF) . Американский статистик . 62 (1): 45–53. дои : 10.1198/000313008x270448 . S2CID 9367367 .
- ^ Сват, MJ; Гренон, П; Вималаратне, С (2016). «ProbOnto: онтология и база знаний вероятностных распределений» . Биоинформатика . 32 (17): 2719–21. doi : 10.1093/биоинформатика/btw170 . ПМК 5013898 . ПМИД 27153608 .
- ^ Кук, Джон Д. «Диаграмма распределительных отношений» .
- ^ Динов, Иво Д.; Зигрист, Кайл; Перл, Деннис; Калинин, Алексей; Кристу, Николя (2015). «Распределение вероятностей: вычислительная веб-инфраструктура для изучения свойств, взаимосвязей и приложений вероятностных распределений» . Вычислительная статистика . 594 (2): 249–271. дои : 10.1007/s00180-015-0594-6 . ПМЦ 4856044 . ПМИД 27158191 .
Внешние ссылки
[ редактировать ]- Интерактивная графика: одномерные отношения распределения
- ProbOnto — Онтология и база знаний вероятностных распределений: ProbOnto
- Проект Probability Distributome включает в себя калькуляторы, симуляторы, эксперименты и навигаторы для междистрибутивной модификации и метаданных распределения .