Гамма-распределение
Функция плотности вероятности | |||
Кумулятивная функция распределения | |||
Параметры | |||
---|---|---|---|
Поддерживать | |||
CDF | |||
Иметь в виду | |||
медиана | Нет простой закрытой формы | Нет простой закрытой формы | |
Режим | , | ||
Дисперсия | |||
асимметрия | |||
Избыточный эксцесс | |||
Энтропия | |||
МГФ | |||
CF | |||
Информация о Фишере | |||
Метод моментов |
В теории вероятностей и статистике гамма -распределение представляет собой универсальное двухпараметрическое семейство непрерывных распределений вероятностей . Экспоненциальное распределение , распределение Эрланга и распределение хи-квадрат являются частными случаями гамма-распределения. Обычно используются две эквивалентные параметризации:
- С параметром формы k и параметром масштаба θ
- С параметром формы и обратный масштабный параметр , называемый параметром скорости .
В каждой из этих форм оба параметра являются положительными действительными числами.
Распределение имеет важные приложения в различных областях, включая эконометрику , байесовскую статистику , тестирование жизни. В эконометрике параметризация (k, θ) распространена для моделирования времени ожидания, например времени до смерти, где она часто принимает форму распределения Эрланга для целочисленных значений k. Байесовская статистика предпочитает параметризацию (α, β), используя гамма-распределение в качестве сопряженного априорного значения для нескольких параметров обратного масштаба, что облегчает аналитическую управляемость в вычислениях апостериорного распределения. Плотность вероятности и кумулятивные функции распределения гамма-распределения варьируются в зависимости от выбранной параметризации, что дает представление о поведении гамма-распределенных случайных величин. Гамма-распределение является неотъемлемой частью моделирования ряда явлений благодаря своей гибкой форме, которая может отражать различные статистические распределения, включая экспоненциальное распределение и распределение хи-квадрат при определенных условиях. Его математические свойства, такие как среднее значение, дисперсия, асимметрия и более высокие моменты, предоставляют набор инструментов для статистического анализа и выводов. Практическое применение распределения охватывает несколько дисциплин, что подчеркивает его важность в теоретической и прикладной статистике.
Гамма-распределение — это распределение вероятностей максимальной энтропии (как по отношению к единой базовой мере, так и по отношению к базовая мера) для случайной величины , для которой E [ X ] = kθ = α / β фиксировано и больше нуля, а E [ln X ] = ψ ( k ) + ln θ = ψ ( α ) − ln β X фиксированный ( ψ — дигамма-функция ). [1]
Определения
[ редактировать ]Параметризация с помощью k и θ , по-видимому, более распространена в эконометрике и других прикладных областях, где гамма-распределение часто используется для моделирования времени ожидания. Например, при тестировании жизни время ожидания до смерти является случайной величиной , которую часто моделируют с помощью гамма-распределения. Увидеть Хогга и Крейга. [2] для явной мотивации.
Параметризация с помощью α и β более распространена в байесовской статистике , где гамма-распределение используется в качестве сопряженного априорного распределения для различных типов параметров обратного масштаба (скорости), таких как λ экспоненциального распределения или распределения Пуассона. [3] – или, если уж на то пошло, β самого гамма-распределения. Тесно связанное обратное гамма-распределение используется в качестве априорного сопряжения для параметров масштаба, таких как дисперсия нормального распределения .
Если k — положительное целое число , то распределение представляет собой распределение Эрланга ; т.е. сумма k независимых экспоненциально распределенных случайных величин , каждая из которых имеет среднее значение θ .
Характеристика с использованием формы α и скорости β
[ редактировать ]Гамма-распределение можно параметризовать с помощью параметра формы α = k и обратного параметра масштаба β = 1/ θ , называемого параметром скорости . Случайная величина X , которая имеет гамма-распределение с формой α и скоростью β, обозначается
Соответствующая функция плотности вероятности в параметризации скорости формирования равна
где это гамма-функция .Для всех положительных целых чисел .
Кумулятивная функция распределения представляет собой регуляризованную гамма-функцию:
где — нижняя неполная гамма-функция .
Если α — положительное целое число (т. е. распределение является распределением Эрланга ), кумулятивная функция распределения имеет следующее разложение в ряд: [4]
Примечание о GAMMA.DIST( , альфа , бета ,...) функция в Microsoft Excel: Параметры в Microsoft Excel на самом деле являются параметрами формы и скорости соответственно, т. е. правильной интерпретацией функции Microsoft Excel является ГАММА.РАСП( ,...).
Характеристика с использованием формы k и масштаба θ
[ редактировать ]Случайная величина X , гамма-распределенная с формой k и масштабом θ, обозначается через
Функция плотности вероятности с использованием параметризации масштаба формы равна
Здесь Γ( k ) — гамма-функция , оцененная при k .
Кумулятивная функция распределения представляет собой регуляризованную гамма-функцию:
где — нижняя неполная гамма-функция .
Это также можно выразить следующим образом, если k — положительное целое число (т. е. распределение является распределением Эрланга ): [4]
Обе параметризации являются общими, поскольку любая из них может быть более удобной в зависимости от ситуации.
Характеристики
[ редактировать ]Среднее и дисперсия
[ редактировать ]Среднее значение гамма-распределения определяется как произведение его формы и масштабных параметров:
Разница составляет:
Квадратный корень из обратного параметра формы дает коэффициент вариации :
асимметрия
[ редактировать ]Асимметрия гамма - распределения зависит только от его параметра формы k и равна
Высшие моменты
[ редактировать ]n -ый необработанный момент определяется выражением:
Медианные приближения и границы
[ редактировать ]В отличие от моды и среднего значения, формулы которых легко вычисляются на основе параметров, медиана не имеет уравнения в замкнутой форме. Медианой для этого распределения является значение ν такое, что
Строгой трактовкой проблемы определения асимптотического разложения и границ медианы гамма-распределения впервые занимались Чен и Рубин, доказавшие, что (при )
где это среднее и является медианой распределение. [5] Для других значений параметра масштаба среднее значение масштабируется до , а медианные границы и аппроксимации будут аналогичным образом масштабироваться по θ .
К. П. Чой нашел первые пять членов в асимптотической аппроксимации медианы рядом Лорана , сравнив медиану с формулой Рамануджана. функция . [6] Берг и Педерсен нашли еще термины: [7]
Частичные суммы этих рядов являются хорошими приближениями для достаточно высоких k ; они не показаны на рисунке, который сосредоточен на области low -k , которая менее хорошо аппроксимирована.
Берг и Педерсен также доказали многие свойства медианы, показав, что она является выпуклой функцией от k : [8] и что асимптотическое поведение вблизи является (где γ — постоянная Эйлера–Машерони ), и что для всех медиана ограничена . [7]
Более близкая линейная верхняя граница для только было предоставлено в 2021 году Гонтом и Меркле, [9] полагаясь на результат Берга и Педерсена, наклон везде меньше 1:
- для (с равенством при )
которое можно расширить до границы для всех взяв максимум с хордой, показанной на рисунке, поскольку медиана оказалась выпуклой. [8]
Аппроксимация медианы, асимптотически точная при высоких k и разумная вплоть до или немного ниже следует из преобразования Вильсона–Хилферти :
что становится отрицательным для .
В 2021 году Лион предложил несколько аппроксимаций вида . Он выдвинул гипотезу о значениях A и B, для которых это приближение является асимптотически точной верхней или нижней границей для всех . [10] В частности, он предложил эти оценки в замкнутой форме, которые доказал в 2023 году: [11]
- является нижней границей, асимптотически точной, поскольку
- является верхней границей, асимптотически точной, поскольку
Лион также показал (неформально в 2021 году, строго в 2023 году) две другие нижние границы, которые не являются выражениями в замкнутой форме , включая эту, включающую гамма-функцию , основанную на решении интегрального выражения, заменяющего 1 вместо :
- (приближаясь к равенству как )
и касательная линия в где была найдена производная :
- (с равенством при )
где Ei – экспоненциальный интеграл . [10] [11]
Кроме того, он показал, что интерполяция между границами может обеспечить превосходные аппроксимации или более точные границы медианы, включая аппроксимацию с точностью до (где ) и имеет максимальную относительную погрешность менее 0,6%. Интерполированные приближения и границы имеют вид
где — это интерполирующая функция, монотонно работающая от 0 при низком k до 1 при высоком k , аппроксимирующая идеальный или точный интерполятор. :
Для простейшей рассматриваемой интерполяционной функции — рациональная функция первого порядка
самая точная нижняя граница имеет
и самая точная верхняя граница имеет
Интерполированные границы нанесены (в основном внутри желтой области) на показанном логарифмическом графике . Еще более точные границы доступны с использованием различных интерполирующих функций, но обычно не с такими параметрами закрытой формы. [10]
Суммирование
[ редактировать ]Если X i имеет распределение Gamma( k i , θ ) для i = 1, 2, ..., N (т. е. все распределения имеют одинаковый масштабный параметр θ ), то
все X i независимы при условии, что .
Для случаев, когда X i независимы , но имеют разные параметры масштаба, см. Mathai. [12] или Мосхопулос. [13]
Гамма-распределение демонстрирует бесконечную делимость .
Масштабирование
[ редактировать ]Если
тогда для любого c > 0
- по моментным производящим функциям,
или эквивалентно, если
- (параметризация скорости формы)
Действительно, мы знаем, что если X — экспоненциальная с.в. со скоростью λ , то cX — экспоненциальная с.в. со скоростью λ / c ; то же самое справедливо и с переменными Гаммы (и это можно проверить с помощью производящей момент функции , см., например, эти примечания , 10.4-(ii)): умножение на положительную константу c делит скорость (или, что то же самое, умножает масштаб).
Экспоненциальное семейство
[ редактировать ]Гамма-распределение представляет собой двухпараметрическое экспоненциальное семейство с натуральными параметрами k − 1 и −1/ θ (эквивалентно α − 1 и − β ) и натуральной статистикой X и ln X .
Если параметр формы k остается фиксированным, результирующее однопараметрическое семейство распределений представляет собой естественное экспоненциальное семейство .
Логарифмическое ожидание и дисперсия
[ редактировать ]Можно показать, что
или эквивалентно,
где ψ – дигамма-функция . Так же,
где это тригамма-функция .
Это можно получить, используя формулу экспоненциального семейства для производящей функции момента достаточной статистики , поскольку одной из достаточных статистик гамма-распределения является ln x .
Информационная энтропия
[ редактировать ]Информационная энтропия – это
В k , θ параметризации информационная энтропия определяется выражением
Расхождение Кульбака – Лейблера
[ редактировать ]Дивергенция Кульбака-Лейблера (KL-дивергенция) Gamma( α p , β p ) («истинное» распределение) от Gamma ( α q , β q ) («аппроксимирующее» распределение) определяется выражением [14]
Записанное с использованием параметризации k , θ , KL-расхождение Gamma( k p , θ p ) от Gamma ( k q , θ q ) определяется выражением
Преобразование Лапласа
[ редактировать ]Преобразование Лапласа гамма-PDF:
Связанные дистрибутивы
[ редактировать ]Общий
[ редактировать ]- Позволять быть независимые и одинаково распределенные случайные величины, следующие экспоненциальному распределению с параметром скорости λ, тогда ~ Gamma(n, λ), где n — параметр формы, λ — скорость, и .
- Если X ~ Gamma(1, λ ) (в параметризации скорости формы), то X имеет экспоненциальное распределение с параметром скорости λ . В параметризации масштаба формы X ~ Gamma(1, λ ) имеет экспоненциальное распределение с параметром скорости 1/ λ .
- Если X ~ Gamma( ν /2, 2) (в формомасштабной параметризации), то X тождественен χ 2 ( ν ) , распределение хи-квадрат с ν степенями свободы. Обратно, если Q ~ х 2 ( ν ) и c — положительная константа, то cQ ~ Gamma( ν /2, 2 c ) .
- Если θ = 1/ k , получается распределение Шульца-Цимма , которое наиболее часто используется для моделирования длин полимерных цепей.
- Если k целое число , гамма-распределение является распределением Эрланга и представляет собой распределение вероятностей времени ожидания до k -го «прихода» в одномерном пуассоновском процессе с интенсивностью 1/ θ . Если
- затем
- Если X имеет распределение Максвелла – Больцмана с параметром a , то
- Если X ~ Gamma( k , θ ) , то следует экспоненциальному гамма-распределению (сокращенно экспоненциальное гамма). [15] Его иногда называют логарифмическим гамма-распределением. [16] Формулы для его среднего и дисперсии находятся в разделе #Логарифмическое ожидание и дисперсия .
- Если X ~ Gamma( k , θ ) , то следует обобщенному гамма-распределению с параметрами p = 2 , d = 2 k и [ нужна ссылка ] .
- В более общем смысле, если X ~ Gamma( k , θ ) , то для следует обобщенному гамма-распределению с параметрами p = 1/ q , d = k / q и .
- Если X ~ Gamma( k , θ ) с формой k и масштабом θ , то 1/ X ~ Inv-Gamma( k , θ −1 ) (см. вывод обратного гамма-распределения ).
- Параметризация 1: Если независимы, то или, что то же самое,
- Параметризация 2: Если независимы, то или, что то же самое,
- Если X ~ Gamma( α , θ ) и Y ~ Gamma( β , θ ) независимо распределены, то X /( X + Y ) имеет бета-распределение с параметрами α и β , а X /( X + Y ) является независимым X + + Y , который является Gamma( α θ β , -распределенным ) .
- Если X i ~ Gamma( α i , 1) независимо распределены, то вектор ( X 1 / S , ..., X n / S ) , где S = X 1 + ... + X n , следует правилу Дирихле. распределение с параметрами α 1 , ..., α n .
- При больших k гамма-распределение сходится к нормальному распределению со средним значением µ = kθ и дисперсией σ. 2 = к-й 2 .
- Гамма-распределение является априорным для точности нормального распределения с известным средним значением .
- Матричное гамма-распределение и распределение Уишарта представляют собой многомерное обобщение гамма-распределения (выборки представляют собой положительно определенные матрицы, а не положительные действительные числа).
- Гамма-распределение является частным случаем обобщенного гамма-распределения , обобщенного целочисленного гамма-распределения и обобщенного обратного распределения Гаусса .
- Среди дискретных распределений отрицательное биномиальное распределение иногда считают дискретным аналогом гамма-распределения.
- Распределения Твиди – гамма-распределение является членом семейства моделей экспоненциальной дисперсии Твиди .
- Модифицированное полунормальное распределение . Гамма-распределение является членом семейства модифицированного полунормального распределения . [17] Соответствующая плотность равна , где обозначает Пси-функцию Фокса–Райта .
- Для параметризации масштаба формы , если параметр масштаба где обозначает обратное гамма-распределение , затем предельное распределение где обозначает бета-распределение простых чисел .
Сложная гамма
[ редактировать ]Если параметр формы гамма-распределения известен, но параметр обратного масштаба неизвестен, то гамма-распределение для обратного масштаба образует сопряженное априорное значение. Составное распределение , полученное в результате интегрирования обратной шкалы, имеет решение в замкнутой форме, известное как составное гамма-распределение . [18]
Если вместо этого параметр формы известен, но среднее значение неизвестно, а априорное значение среднего значения задается другим гамма-распределением, то это приводит к K-распределению .
Вейбулл и стабильный счет
[ редактировать ]Гамма-распределение может быть выражено как распределение продуктов распределения Вейбулла и вариантная форма распределения стабильного количества .Его параметр формы можно рассматривать как обратную величину параметра устойчивости Леви в стабильном распределении количества: где представляет собой стандартное стабильное распределение чисел формы , и представляет собой стандартное распределение Вейбулла формы .
Статистический вывод
[ редактировать ]Оценка параметров
[ редактировать ]Оценка максимального правдоподобия
[ редактировать ]Функция правдоподобия для N iid наблюдений ( x 1 , ..., x N ) равна
из которого мы вычисляем функцию логарифмического правдоподобия
Нахождение максимума по θ путем взятия производной и установки ее равной нулю дает максимального правдоподобия оценку параметра θ , которая равна выборочному среднему значению. разделенное на параметр формы k :
Подстановка этого в функцию логарифмического правдоподобия дает
Нам нужно как минимум два образца: , потому что для , функция неограниченно возрастает, так как . Для , можно убедиться, что является строго вогнутой , используя свойства неравенства полигамма-функции . Нахождение максимума по k, взяв производную и приравняв ее нулю, дает
где ψ — дигамма-функция и — выборочное среднее ln x . не существует решения в замкнутой форме Для k . В численном отношении функция очень хорошо себя ведет, поэтому, если требуется численное решение, его можно найти, например, с помощью метода Ньютона . Начальное значение k можно найти либо методом моментов , либо с помощью приближения
Если мы позволим
тогда k примерно
что находится в пределах 1,5% от правильного значения. [19] Явная форма обновления Ньютона-Рафсона этого первоначального предположения такова: [20]
По оценке максимального правдоподобия , ожидаемые значения x и согласен с эмпирическими средними значениями:
Предостережение относительно небольшого параметра формы
[ редактировать ]Для данных, , представленный в формате с плавающей запятой , который принимает значение 0 для значений, меньших, чем , логарифмы, необходимые для оценки максимального правдоподобия, приведут к сбою, если возникнут какие-либо потери. Если предположить, что данные были сгенерированы гамма-распределением с помощью cdf , то вероятность того, что произойдет хотя бы одно опустошение, равна:
Эта вероятность будет приближаться к 1 для малых и больших N. k Например, в , и , . Обходной путь — вместо этого иметь данные в логарифмическом формате.
Чтобы протестировать реализацию средства оценки максимального правдоподобия, которое принимает логарифмические данные в качестве входных данных, полезно иметь возможность генерировать не выпадающие логарифмы случайных гамма-переменных, когда . После внедрения в scipy.stats.loggamma
, это можно сделать следующим образом: [21] образец и независимо. Тогда требуемая логарифмическая выборка равна , так что .
Оценщики закрытой формы
[ редактировать ]Существуют непротиворечивые оценки k и θ в замкнутой форме , которые получены на основе вероятности обобщенного гамма-распределения . [22]
Оценка формы k равна
а оценка масштаба θ равна
Использование выборочного среднего значения x , выборочного среднего ln x и выборочного среднего произведения x ·ln x упрощает выражения до:
Если используется параметризация скорости, оценка .
Эти оценки не являются строго оценками максимального правдоподобия, а вместо этого называются оценками логарифмического момента смешанного типа. Однако они имеют такую же эффективность, как и оценки максимального правдоподобия.
Хотя эти оценки последовательны, они имеют небольшую погрешность. Вариант оценки шкалы θ с коррекцией смещения :
Поправка смещения для параметра формы k определяется как [23]
Байесовская минимальная среднеквадратическая ошибка
[ редактировать ]При известном k и неизвестном θ апостериорная функция плотности для теты (с использованием стандартного масштабно-инвариантного априора для θ ) равна
Обозначая
Интегрирование по θ можно выполнить с помощью замены переменных, обнаруживая, что 1/ θ имеет гамма-распределение с параметрами α = Nk , β = y .
Моменты можно вычислить, взяв соотношение ( m на m = 0 )
который показывает, что оценка среднего ± стандартного отклонения апостериорного распределения для θ равна
Байесовский вывод
[ редактировать ]Сопряжение до
[ редактировать ]В байесовском выводе является гамма-распределение сопряженным перед многими распределениями правдоподобия: Пуассона , экспоненциальное , нормальное (с известным средним), Парето , гамма с известной формой σ , обратная гамма с известным параметром формы и Гомпертца с известным параметром масштаба.
гамма-распределения Сопряженный априор : [24]
где Z — нормировочная константа, не имеющая решения в замкнутой форме.Апостериорное распределение можно найти, обновив параметры следующим образом:
где n — количество наблюдений, а x i — i -е наблюдение.
Возникновение и применение
[ редактировать ]Рассмотрим последовательность событий, где время ожидания каждого события представляет собой экспоненциальное распределение со скоростью β . Тогда время ожидания возникновения n -го события представляет собой гамма-распределение целочисленной формы. . Такая конструкция гамма-распределения позволяет моделировать широкий спектр явлений, при которых несколько дополнительных событий, каждое из которых занимает время с экспоненциальным распределением, должны произойти последовательно, чтобы произошло главное событие. [25] Примеры включают время ожидания событий деления клеток , [26] количество компенсаторных мутаций для данной мутации, [27] время ожидания ремонта гидросистемы, [28] и так далее.
В биофизике время пребывания между этапами молекулярного мотора, такого как АТФ-синтаза , почти экспоненциально при постоянной концентрации АТФ, показывая, что каждый этап мотора требует одного гидролиза АТФ. Если бы было n событий гидролиза АТФ, то это было бы гамма-распределение со степенью n. [29]
Гамма-распределение использовалось для моделирования размера страховых выплат. [30] и дожди. [31] Это означает, что совокупные страховые выплаты и количество осадков, накопленных в водохранилище, моделируются гамма-процессом – так же, как экспоненциальное распределение генерирует процесс Пуассона .
Гамма-распределение также используется для моделирования ошибок в многоуровневых регрессии Пуассона, моделях поскольку смесь распределений Пуассона с коэффициентами, распределенными по гамма-распределению, имеет известное распределение закрытой формы, называемое отрицательным биномиальным .
В беспроводной связи гамма-распределение используется для моделирования многолучевого замирания мощности сигнала; [ нужна ссылка ] см. также распределение Рэлея и распределение Райса .
В онкологии возрастное распределение раком заболеваемости часто повторяет гамма-распределение, при этом параметры формы и масштаба предсказывают соответственно количество драйверных событий и временной интервал между ними. [32] [33]
В нейробиологии гамма-распределение часто используется для описания распределения интервалов между спайками . [34] [35]
При экспрессии бактериальных генов число копий конститутивно экспрессируемого белка часто соответствует гамма-распределению, где параметр масштаба и формы представляют собой соответственно среднее количество всплесков за клеточный цикл и среднее количество молекул белка, продуцируемых одной мРНК в течение срок его службы. [36]
В геномике гамма-распределение применялось на этапе вызова пика (т. е. при распознавании сигнала) в ChIP-чипе. [37] и ЧИП-сек. [38] анализ данных.
В байесовской статистике гамма-распределение широко используется как сопряженное априорное значение . Это априорное значение точности ( т.е. обратной дисперсии) нормального распределения . Это также сопряженное априорное значение для экспоненциального распределения .
В филогенетике гамма-распределение является наиболее часто используемым подходом для моделирования вариаций скорости между участками. [39] когда методы максимального правдоподобия , байесовского метода или матрицы расстояний для оценки филогенетических деревьев используются . Филогенетический анализ, который использует гамма-распределение для моделирования изменения скорости, оценивает один параметр на основе данных, поскольку ограничивает рассмотрение распределениями, где α = β . Эта параметризация означает, что среднее значение этого распределения равно 1, а дисперсия равна 1/ α . Методы максимального правдоподобия и байесовские методы обычно используют дискретную аппроксимацию непрерывного гамма-распределения. [40] [41]
Генерация случайной переменной
[ редактировать ]Учитывая указанное выше свойство масштабирования, достаточно сгенерировать гамма-переменные с θ = 1 , поскольку позже мы сможем преобразовать их в любое значение β с помощью простого деления.
Предположим, мы хотим сгенерировать случайные величины из Gamma( n + δ , 1) , где n — неотрицательное целое число и 0 < δ < 1 . Используя тот факт, что распределение Gamma(1, 1) совпадает с распределением Exp(1) , и учитывая метод генерации экспоненциальных переменных , мы заключаем, что если U на равномерно распределено (0, 1], то −ln U — это распределенная гамма(1, 1) (т.е. выборка с обратным преобразованием ). Теперь, используя свойство « α -сложения» гамма-распределения, мы расширяем этот результат:
где все U k равномерно распределены на (0, 1] и независимы . Все, что теперь осталось, — это сгенерировать переменную, распределенную как Gamma( δ , 1) для 0 < δ < 1 , и один раз применить свойство « α -сложения» больше. Это самая сложная часть.
Случайная генерация гамма-вариантов подробно обсуждается Деврой. [42] : 401–428 отметив, что ни один из них не является одинаково быстрым для всех параметров формы. Для малых значений параметра формы алгоритмы часто не работают. [42] : 406 Для произвольных значений параметра формы можно применить формулы Аренса и Дитера. [43] модифицированный метод принятия-брака Алгоритм GD (форма k ≥ 1 ), или метод преобразования [44] когда 0 < к <1 . См. также Алгоритм Ченга и Пира GKM 3. [45] или метод сжатия Марсальи. [46]
Ниже приводится версия метода принятия-отвержения Аренса-Дитера : [43]
- Сгенерируйте U , V и W как iid (0, 1). переменные
- Если затем и . В противном случае, и .
- Если затем перейдите к шагу 1.
- ξ распределяется как Γ( δ , 1) .
Краткое изложение этого
где — целая часть k , ξ генерируется с помощью описанного выше алгоритма с δ = { k } (дробная часть k ), и все U k независимы.
Хотя описанный выше подход технически верен, Деврой отмечает, что он линеен по значению k и в целом не является хорошим выбором. Вместо этого он рекомендует использовать либо методы, основанные на отклонении, либо табличные методы, в зависимости от контекста. [42] : 401–428
Например, простой метод преобразования-отклонения Марсальи, основанный на одной нормальной переменной X и одной однородной переменной U : [21]
- Набор и .
- Набор .
- Если и возвращаться , иначе вернитесь к шагу 2.
С генерирует гамма-распределенное случайное число во времени, которое приблизительно постоянно с k . Скорость принятия зависит от k : скорость принятия составляет 0,95, 0,98 и 0,99 для k=1, 2 и 4. Для k < 1 можно использовать чтобы повысить k , чтобы его можно было использовать с этим методом.
Ссылки
[ редактировать ]- ^ Пак, Сон Ю.; Бера, Анил К. (2009). «Модель условной гетероскедастичности авторегрессии с максимальной энтропией» (PDF) . Журнал эконометрики . 150 (2): 219–230. CiteSeerX 10.1.1.511.9750 . doi : 10.1016/j.jeconom.2008.12.014 . Архивировано из оригинала (PDF) 7 марта 2016 г. Проверено 2 июня 2011 г.
- ^ Хогг, Р.В. ; Крейг, AT (1978). Введение в математическую статистику (4-е изд.). Нью-Йорк: Макмиллан. стр. Замечание 3.3.1. ISBN 0023557109 .
- ^ Гопалан, Прем; Хофман, Джейк М.; Блей, Дэвид М. (2013). «Масштабируемая рекомендация с факторизацией Пуассона». arXiv : 1311.1704 [ cs.IR ].
- ^ Jump up to: а б Папулис, Пиллаи, Вероятность, случайные величины и случайные процессы , четвертое издание
- ^ Джисен Чен, Герман Рубин , Границы разницы между медианой и средним значением гамма-распределений и распределений Пуассона, Письма о статистике и вероятности, том 4, выпуск 6, октябрь 1986 г., страницы 281–283, ISSN 0167-7152 , [1] .
- ^ Чой, К.П. «О медианах гамма-распределений и уравнении Рамануджана» , Труды Американского математического общества, Vol. 121, № 1 (май 1994 г.), стр. 245–251.
- ^ Jump up to: а б Берг, Кристиан и Педерсен, Хенрик Л. (март 2006 г.). «Гипотеза Чена – Рубина в непрерывной ситуации» (PDF) . Методы и приложения анализа . 13 (1): 63–88. дои : 10.4310/MAA.2006.v13.n1.a4 . S2CID 6704865 . Проверено 1 апреля 2020 г.
- ^ Jump up to: а б Берг, Кристиан и Педерсен, Хенрик Л. «Выпуклость медианы в гамма-распределении» .
- ^ Гонт, Роберт Э. и Милан Меркл (2021). «Об границах моды и медианы обобщенных гиперболических и родственных им распределений». Журнал математического анализа и приложений . 493 (1): 124508. arXiv : 2002.01884 . дои : 10.1016/j.jmaa.2020.124508 . S2CID 221103640 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Jump up to: а б с Лион, Ричард Ф. (13 мая 2021 г.). «О точных границах и приближениях в замкнутой форме для медианы гамма-распределения» . ПЛОС Один . 16 (5): e0251626. arXiv : 2011.04060 . Бибкод : 2021PLoSO..1651626L . дои : 10.1371/journal.pone.0251626 . ПМЦ 8118309 . ПМИД 33984053 .
- ^ Jump up to: а б Лион, Ричард Ф. (13 мая 2021 г.). «Жесткие границы медианы гамма-распределения» . ПЛОС Один . 18 (9): e0288601. дои : 10.1371/journal.pone.0288601 . ПМЦ 10490949 . ПМИД 37682854 .
- ^ Матай, AM (1982). «Емкость плотины с вводами гамма-типа». Летопись Института статистической математики . 34 (3): 591–597. дои : 10.1007/BF02481056 . ISSN 0020-3157 . S2CID 122537756 .
- ^ Мосхопулос, П.Г. (1985). «Распределение суммы независимых гамма-случайных величин». Летопись Института статистической математики . 37 (3): 541–544. дои : 10.1007/BF02481123 . S2CID 120066454 .
- ^ Пенни, В.Д. «KL-расхождения нормальных, гамма-плотностей, плотностей Дирихле и Уишарта» .
- ^ «ExpGammaDistribution — Документация по языку Wolfram» .
- ^ «scipy.stats.loggamma — Руководство по SciPy v1.8.0» . docs.scipy.org .
- ^ Сунь, Цзинчао; Конг, Майинг; Пал, Субхадип (22 июня 2021 г.). «Модифицированное полунормальное распределение: свойства и эффективная схема выборки» . Коммуникации в статистике - теория и методы . 52 (5): 1591–1613. дои : 10.1080/03610926.2021.1934700 . ISSN 0361-0926 . S2CID 237919587 .
- ^ Дубей, Сатья Д. (декабрь 1970 г.). «Соединенные гамма-, бета- и F-распределения». Метрика . 16 : 27–31. дои : 10.1007/BF02613934 . S2CID 123366328 .
- ^ Минка, Томас П. (2002). «Оценка гамма-распределения» (PDF) .
- ^ Чой, Южная Каролина; Ветт, Р. (1969). «Оценка максимального правдоподобия параметров гамма-распределения и их смещения». Технометрика . 11 (4): 683–690. дои : 10.1080/00401706.1969.10490731 .
- ^ Jump up to: а б Марсалья, Г.; Цанг, WW (2000). «Простой метод генерации гамма-переменных». Транзакции ACM в математическом программном обеспечении . 26 (3): 363–372. дои : 10.1145/358407.358414 . S2CID 2634158 .
- ^ Е, Чжи-Шэн; Чен, Нан (2017). «Оценщики в закрытой форме гамма-распределения, полученные на основе уравнений правдоподобия» . Американский статистик . 71 (2): 177–181. дои : 10.1080/00031305.2016.1209129 . S2CID 124682698 .
- ^ Лузада, Франциско; Рамос, Педро Л.; Рамос, Эдуардо (2019). «Заметка о смещении оценок в закрытой форме для гамма-распределения, полученных на основе уравнений правдоподобия» . Американский статистик . 73 (2): 195–199. дои : 10.1080/00031305.2018.1513376 . S2CID 126086375 .
- ^ Финк, Д. 1995 Сборник сопряженных априорных значений . Отчет в стадии выполнения: Расширение и совершенствование методов установления целевых показателей качества данных. (Контракт Министерства энергетики 95-831).
- ^ Джессика., Шайнер, Сэмюэл М., 1956- Гуревич (2001). «13. Анализ наработки на отказ» . Планирование и анализ экологических экспериментов . Издательство Оксфордского университета. ISBN 0-19-513187-8 . OCLC 43694448 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Голубев А. (март 2016 г.). «Применение и значение экспоненциально модифицированного гамма-распределения как модели временных изменений, связанных с пролиферацией клеток и экспрессией генов» . Журнал теоретической биологии . 393 : 203–217. Бибкод : 2016JThBi.393..203G . дои : 10.1016/j.jtbi.2015.12.027 . ISSN 0022-5193 . ПМИД 26780652 .
- ^ Пун, Арт; Дэвис, Брэдли Х; Чао, Линь (01 июля 2005 г.). «Сборщик купонов и мутация-супрессор» . Генетика . 170 (3): 1323–1332. дои : 10.1534/генетика.104.037259 . ISSN 1943-2631 . ПМЦ 1451182 . ПМИД 15879511 .
- ^ Виноградник, Майкл; Амоако-Гьямпах, Кваси; Мередит, Джек Р. (июль 1999 г.). «Распределение частоты отказов гибких производственных систем: эмпирическое исследование» . Европейский журнал операционных исследований . 116 (1): 139–155. дои : 10.1016/s0377-2217(98)00096-4 . ISSN 0377-2217 .
- ^ Риф, Матиас; Рок, Рональд С.; Мехта, Амит Д.; Мусекер, Марк С.; Чейни, Ричард Э.; Спудич, Джеймс А. (15 августа 2000 г.). «Ступенчатая кинетика миозина-V: молекулярная модель процессивности» . Труды Национальной академии наук . 97 (17): 9482–9486. дои : 10.1073/pnas.97.17.9482 . ISSN 0027-8424 . ПМК 16890 . ПМИД 10944217 .
- ^ с. 43, Филип Дж. Боланд, Статистические и вероятностные методы в актуарной науке, Chapman & Hall CRC 2007.
- ^ Уилкс, Дэниел С. (1990). «Оценка максимального правдоподобия гамма-распределения с использованием данных, содержащих нули» . Журнал климата . 3 (12): 1495–1501. Бибкод : 1990JCli....3.1495W . doi : 10.1175/1520-0442(1990)003<1495:MLEFTG>2.0.CO;2 . ISSN 0894-8755 . JSTOR 26196366 .
- ^ Беликов, Алексей В. (22 сентября 2017 г.). «Количество ключевых канцерогенных событий можно предсказать по заболеваемости раком» . Научные отчеты . 7 (1): 12170. Бибкод : 2017NatSR...712170B . дои : 10.1038/s41598-017-12448-7 . ПМК 5610194 . ПМИД 28939880 .
- ^ Беликов Алексей В.; Вяткин, Алексей; Леонов, Сергей В. (06 августа 2021 г.). «Распределение Эрланга приблизительно соответствует возрастному распределению заболеваемости раком у детей и молодых людей» . ПерДж . 9 : е11976. дои : 10.7717/peerj.11976 . ISSN 2167-8359 . ПМЦ 8351573 . ПМИД 34434669 .
- ^ Дж. Г. Робсон и Дж. Б. Трой, «Природа поддерживаемого выделения ганглиозных клеток сетчатки Q, X и Y кошки», J. Opt. Соц. Являюсь. А 4, 2301–2307 (1987)
- ^ MCM Райт, И.М. Винтер, Дж. Дж. Форстер, С. Блик «Реакция на тоновые импульсы наилучшей частоты в вентральном ядре улитки регулируется упорядоченной статистикой интервалов между спайками», Hearing Research 317 (2014)
- ^ Н. Фридман, Л. Цай и XS Се (2006) «Связь стохастической динамики с распределением населения: аналитическая основа экспрессии генов», Phys. Преподобный Летт. 97, 168302.
- ^ DJ Reiss, MT Facciotti и NS Baliga (2008) «На основе модели деконволюция связывания ДНК по всему геному» , Биоинформатика , 24, 396–403
- ^ М. А. Мендоса-Парра, М. Новицка, В. Ван Гул, Х. Гронемейер (2013) «Характеристика паттернов связывания ChIP-seq с помощью деконволюции формы пика на основе модели» , BMC Genomics , 14:834
- ^ Ян, Цзыхэн (сентябрь 1996 г.). «Изменение скорости между сайтами и его влияние на филогенетический анализ» . Тенденции в экологии и эволюции . 11 (9): 367–372. дои : 10.1016/0169-5347(96)10041-0 . ПМИД 21237881 .
- ^ Ян, Цзыхэн (сентябрь 1994 г.). «Филогенетическая оценка максимального правдоподобия по последовательностям ДНК с переменной скоростью в разных сайтах: приближенные методы» . Журнал молекулярной эволюции . 39 (3): 306–314. Бибкод : 1994JMolE..39..306Y . дои : 10.1007/BF00160154 . ISSN 0022-2844 . ПМИД 7932792 . S2CID 17911050 .
- ^ Фельзенштейн, Джозеф (1 октября 2001 г.). «Учет различий в скорости эволюции между участками при выводе о филогениях» . Журнал молекулярной эволюции . 53 (4–5): 447–455. Бибкод : 2001JMolE..53..447F . дои : 10.1007/s002390010234 . ISSN 0022-2844 . ПМИД 11675604 . S2CID 9791493 .
- ^ Jump up to: а б с Деврой, Люк (1986). Генерация неоднородной случайной переменной . Нью-Йорк: Springer-Verlag. ISBN 978-0-387-96305-1 . См. главу 9, раздел 3.
- ^ Jump up to: а б Аренс, Дж. Х.; Дитер, У (январь 1982 г.). «Генерация гамма-вариантов с помощью модифицированной техники отклонения» . Коммуникации АКМ . 25 (1): 47–54. дои : 10.1145/358315.358390 . S2CID 15128188 . . См. Алгоритм GD, с. 53.
- ^ Аренс, Дж. Х.; Дитер, У. (1974). «Компьютерные методы выборки из гамма-, бета-, пуассоновского и биномиального распределений». Вычисление . 12 (3): 223–246. CiteSeerX 10.1.1.93.3828 . дои : 10.1007/BF02293108 . S2CID 37484126 .
- ^ Ченг, RCH; Праздник, GM (1979). «Некоторые простые генераторы гамма-переменных» . Журнал Королевского статистического общества. Серия C (Прикладная статистика) . 28 (3): 290–295. дои : 10.2307/2347200 . JSTOR 2347200 .
- ^ Марсалья, Г. Метод сжатия для генерации гамма-вариантов. Вычислить, Матем. Прил. 3 (1977), 321–325.
Внешние ссылки
[ редактировать ]- «Гамма-распределение» , Математическая энциклопедия , EMS Press , 2001 [1994]
- Вайсштейн, Эрик В. «Гамма-распределение» . Математический мир .
- ModelAssist (2017). Использование гамма-распределения в моделировании рисков, включая прикладные примеры в Excel. Архивировано 9 мая 2017 г. на Wayback Machine .
- Справочник по инженерной статистике