Распределение Юла – Саймона
Функция массы вероятности PMF Юла – Саймона в логарифмическом масштабе. (Обратите внимание, что функция определяется только при целочисленных значениях k. Соединительные линии не указывают на непрерывность.) | |||
Кумулятивная функция распределения Юл – Саймон CMF. (Обратите внимание, что функция определяется только при целочисленных значениях k. Соединительные линии не указывают на непрерывность.) | |||
Параметры | форма ( настоящая ) | ||
---|---|---|---|
Поддерживать | |||
ПМФ | |||
CDF | |||
Иметь в виду | для | ||
Режим | |||
Дисперсия | для | ||
асимметрия | для | ||
Избыточный эксцесс | для | ||
МГФ | не существует | ||
CF |
В теории вероятности и статистике распределение Юла-Саймона представляет собой дискретное распределение вероятностей, названное в честь Удного Юла и Герберта А. Саймона . Первоначально Саймон назвал это распределением Йоля . [ 1 ]
Функция массы вероятности (pmf) распределения Юла – Саймона ( ρ ) равна
для целого числа и настоящий , где это бета-функция . Эквивалентно, PMF можно записать в терминах возрастающего факториала как
где это гамма-функция . Таким образом, если целое число,
Параметр можно оценить с помощью алгоритма с фиксированной точкой. [ 2 ]
Функция массы вероятности f обладает тем свойством, что для достаточно больших k мы имеем
Это означает, что хвост распределения Юла – Саймона является реализацией закона Ципфа : можно использовать, например, для моделирования относительной частоты самое частое слово в большом наборе текста, которое, согласно закону Ципфа, обратно пропорционально (обычно небольшой) степени .
возникновение
[ редактировать ]Распределение Юла-Саймона возникло первоначально как предельное распространение конкретной модели, изученной Удным Юлом в 1925 году для анализа роста числа видов на род в некоторых высших таксонах биотических организмов. [ 3 ] Модель Юла использует два связанных процесса Юла, где процесс Юла определяется как непрерывный процесс рождения , который начинается с одного или нескольких человек. Юл доказал, что когда время стремится к бесконечности, предельное распределение числа видов в роде, выбранном равномерно случайным образом, имеет специфическую форму и демонстрирует степенное поведение в своем хвосте. Тридцать лет спустя нобелевский лауреат Герберт А. Саймон предложил дискретную по времени модель предпочтительной привязанности, чтобы описать появление новых слов в большом фрагменте текста. Интересно, что предельное распределение числа вхождений каждого слова при расхождении числа слов совпадает с распределением числа видов, принадлежащих к случайно выбранному роду в модели Юла, при конкретном выборе параметров . Этот факт объясняет обозначение распределения Юла – Саймона, которое обычно присваивается этому предельному распределению. В контексте случайных графов модель Барабаши-Альберта также демонстрирует асимптотическое распределение степеней, которое равно распределению Юла-Саймона в соответствии с конкретным выбором параметров, и при этом представляет степенные характеристики для более общего выбора параметров. То же самое происходит и с другими предпочтительного прикрепления . модели случайного графа [ 4 ]
Процесс предпочтительного прикрепления также можно изучать как процесс в урне, в котором шары добавляются к растущему числу урн, при этом каждый шар распределяется по урне с вероятностью, линейной по количеству (шаров), которые уже содержатся в урне.
Распределение также возникает как составное распределение , в котором параметр геометрического распределения рассматривается как функция случайной величины, имеющей экспоненциальное распределение . [ нужна ссылка ] В частности, предположим, что следует экспоненциальному распределению с масштабом или оцените :
с плотностью
Тогда распределенная переменная Юла–Саймона K имеет следующее геометрическое распределение, зависящее от W :
PMF геометрического распределения равна
для . Тогда PMF Юла – Саймона представляет собой следующее экспоненциально-геометрическое составное распределение:
Оценка максимального правдоподобия для параметра учитывая наблюдения является решением уравнения неподвижной точки
где – параметры скорости и формы гамма-распределения до начала .
Этот алгоритм разработан Гарсиа [ 2 ] путем прямой оптимизации вероятности. Робертс и Робертс [ 5 ]
обобщить алгоритм на байесовские настройки с помощью сложной геометрической формулировки, описанной выше. Кроме того, Робертс и Робертс [ 5 ] могут использовать структуру максимизации ожиданий (EM), чтобы показать сходимость алгоритма с фиксированной точкой. Более того, Робертс и Робертс [ 5 ] вывести сублинейность скорости сходимости для алгоритма с фиксированной точкой. Кроме того, они используют формулировку EM, чтобы получить два альтернативных вывода стандартной ошибки средства оценки из уравнения с фиксированной точкой. Дисперсия оценщик
стандартная ошибка — это квадратный корень из величины этой оценки, разделенный на N.
Обобщения
[ редактировать ]Двухпараметрическое обобщение исходного распределения Юла заменяет бета-функцию неполной бета-функцией . Массовая функция вероятности обобщенного распределения Юла – Саймона ( ρ , α ) определяется как
с . Для обычное распределение Юла–Саймона( ρ ) получается как частный случай. Использование неполной бета-функции приводит к введению экспоненциального среза в верхнем хвосте.
См. также
[ редактировать ]Библиография
[ редактировать ]- Колин Роуз и Мюррей Д. Смит, Математическая статистика в системе Mathematica . Нью-Йорк: Спрингер, 2002, ISBN 0-387-95234-9 . ( См. стр. 107, где это называется «Святочная раздача». )
Ссылки
[ редактировать ]- ^ Саймон, ХА (1955). «Об одном классе функций перекоса распределения». Биометрика . 42 (3–4): 425–440. дои : 10.1093/biomet/42.3-4.425 .
- ^ Перейти обратно: а б Гарсиа Гарсия, Хуан Мануэль (2011). «Алгоритм с фиксированной точкой для оценки параметра распределения Юла-Саймона» . Прикладная математика и вычислительная техника . 217 (21): 8560–8566. дои : 10.1016/j.amc.2011.03.092 .
- ^ Юле, ГУ (1924). «Математическая теория эволюции, основанная на выводах доктора Дж. К. Уиллиса, ФРС» . Философские труды Королевского общества Б. 213 (402–410): 21–87. дои : 10.1098/rstb.1925.0002 .
- ^ Пашон, Анжелика; Полито, Федерико; Сасердот, Лаура (2015). «Случайные графики, связанные с некоторыми моделями предпочтительного прикрепления в дискретном и непрерывном времени». Журнал статистической физики . 162 (6): 1608–1638. arXiv : 1503.06150 . дои : 10.1007/s10955-016-1462-7 . S2CID 119168040 .
- ^ Перейти обратно: а б с Робертс, Лукас; Робертс, Дениса (2017). «Система максимизации ожиданий для моделей предпочтительной привязанности». arXiv : 1710.08511 [ stat.CO ].