Jump to content

Распределение Юла – Саймона

(Перенаправлено из раздачи Yule )
Юл – Саймон
Функция массы вероятности
Сюжет PMF Йоля – Саймона
PMF Юла – Саймона в логарифмическом масштабе. (Обратите внимание, что функция определяется только при целочисленных значениях k. Соединительные линии не указывают на непрерывность.)
Кумулятивная функция распределения
Сюжет CMF Йоля – Саймона
Юл – Саймон CMF. (Обратите внимание, что функция определяется только при целочисленных значениях k. Соединительные линии не указывают на непрерывность.)
Параметры форма ( настоящая )
Поддерживать
ПМФ
CDF
Иметь в виду для
Режим
Дисперсия для
асимметрия для
Избыточный эксцесс для
МГФ не существует
CF

В теории вероятности и статистике распределение Юла-Саймона представляет собой дискретное распределение вероятностей, названное в честь Удного Юла и Герберта А. Саймона . Первоначально Саймон назвал это распределением Йоля . [ 1 ]

Функция массы вероятности (pmf) распределения Юла – Саймона ( ρ ) равна

для целого числа и настоящий , где это бета-функция . Эквивалентно, PMF можно записать в терминах возрастающего факториала как

где это гамма-функция . Таким образом, если целое число,

Параметр можно оценить с помощью алгоритма с фиксированной точкой. [ 2 ]

Функция массы вероятности f обладает тем свойством, что для достаточно больших k мы имеем

График распределения Юла – Саймона (1) (красный) и его асимптотический закон Ципфа (синий)

Это означает, что хвост распределения Юла – Саймона является реализацией закона Ципфа : можно использовать, например, для моделирования относительной частоты самое частое слово в большом наборе текста, которое, согласно закону Ципфа, обратно пропорционально (обычно небольшой) степени .

возникновение

[ редактировать ]

Распределение Юла-Саймона возникло первоначально как предельное распространение конкретной модели, изученной Удным Юлом в 1925 году для анализа роста числа видов на род в некоторых высших таксонах биотических организмов. [ 3 ] Модель Юла использует два связанных процесса Юла, где процесс Юла определяется как непрерывный процесс рождения , который начинается с одного или нескольких человек. Юл доказал, что когда время стремится к бесконечности, предельное распределение числа видов в роде, выбранном равномерно случайным образом, имеет специфическую форму и демонстрирует степенное поведение в своем хвосте. Тридцать лет спустя нобелевский лауреат Герберт А. Саймон предложил дискретную по времени модель предпочтительной привязанности, чтобы описать появление новых слов в большом фрагменте текста. Интересно, что предельное распределение числа вхождений каждого слова при расхождении числа слов совпадает с распределением числа видов, принадлежащих к случайно выбранному роду в модели Юла, при конкретном выборе параметров . Этот факт объясняет обозначение распределения Юла – Саймона, которое обычно присваивается этому предельному распределению. В контексте случайных графов модель Барабаши-Альберта также демонстрирует асимптотическое распределение степеней, которое равно распределению Юла-Саймона в соответствии с конкретным выбором параметров, и при этом представляет степенные характеристики для более общего выбора параметров. То же самое происходит и с другими предпочтительного прикрепления . модели случайного графа [ 4 ]

Процесс предпочтительного прикрепления также можно изучать как процесс в урне, в котором шары добавляются к растущему числу урн, при этом каждый шар распределяется по урне с вероятностью, линейной по количеству (шаров), которые уже содержатся в урне.

Распределение также возникает как составное распределение , в котором параметр геометрического распределения рассматривается как функция случайной величины, имеющей экспоненциальное распределение . [ нужна ссылка ] В частности, предположим, что следует экспоненциальному распределению с масштабом или оцените :

с плотностью

Тогда распределенная переменная Юла–Саймона K имеет следующее геометрическое распределение, зависящее от W :

PMF геометрического распределения равна

для . Тогда PMF Юла – Саймона представляет собой следующее экспоненциально-геометрическое составное распределение:

Оценка максимального правдоподобия для параметра учитывая наблюдения является решением уравнения неподвижной точки

где – параметры скорости и формы гамма-распределения до начала .

Этот алгоритм разработан Гарсиа [ 2 ] путем прямой оптимизации вероятности. Робертс и Робертс [ 5 ]

обобщить алгоритм на байесовские настройки с помощью сложной геометрической формулировки, описанной выше. Кроме того, Робертс и Робертс [ 5 ] могут использовать структуру максимизации ожиданий (EM), чтобы показать сходимость алгоритма с фиксированной точкой. Более того, Робертс и Робертс [ 5 ] вывести сублинейность скорости сходимости для алгоритма с фиксированной точкой. Кроме того, они используют формулировку EM, чтобы получить два альтернативных вывода стандартной ошибки средства оценки из уравнения с фиксированной точкой. Дисперсия оценщик

стандартная ошибка — это квадратный корень из величины этой оценки, разделенный на N.

Обобщения

[ редактировать ]

Двухпараметрическое обобщение исходного распределения Юла заменяет бета-функцию неполной бета-функцией . Массовая функция вероятности обобщенного распределения Юла – Саймона ( ρ , α ) определяется как

с . Для обычное распределение Юла–Саймона( ρ ) получается как частный случай. Использование неполной бета-функции приводит к введению экспоненциального среза в верхнем хвосте.

См. также

[ редактировать ]

Библиография

[ редактировать ]
  • Колин Роуз и Мюррей Д. Смит, Математическая статистика в системе Mathematica . Нью-Йорк: Спрингер, 2002, ISBN   0-387-95234-9 . ( См. стр. 107, где это называется «Святочная раздача». )
  1. ^ Саймон, ХА (1955). «Об одном классе функций перекоса распределения». Биометрика . 42 (3–4): 425–440. дои : 10.1093/biomet/42.3-4.425 .
  2. ^ Перейти обратно: а б Гарсиа Гарсия, Хуан Мануэль (2011). «Алгоритм с фиксированной точкой для оценки параметра распределения Юла-Саймона» . Прикладная математика и вычислительная техника . 217 (21): 8560–8566. дои : 10.1016/j.amc.2011.03.092 .
  3. ^ Юле, ГУ (1924). «Математическая теория эволюции, основанная на выводах доктора Дж. К. Уиллиса, ФРС» . Философские труды Королевского общества Б. 213 (402–410): 21–87. дои : 10.1098/rstb.1925.0002 .
  4. ^ Пашон, Анжелика; Полито, Федерико; Сасердот, Лаура (2015). «Случайные графики, связанные с некоторыми моделями предпочтительного прикрепления в дискретном и непрерывном времени». Журнал статистической физики . 162 (6): 1608–1638. arXiv : 1503.06150 . дои : 10.1007/s10955-016-1462-7 . S2CID   119168040 .
  5. ^ Перейти обратно: а б с Робертс, Лукас; Робертс, Дениса (2017). «Система максимизации ожиданий для моделей предпочтительной привязанности». arXiv : 1710.08511 [ stat.CO ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f1d7ef150643fe23a5367817c183e55a__1686444480
URL1:https://arc.ask3.ru/arc/aa/f1/5a/f1d7ef150643fe23a5367817c183e55a.html
Заголовок, (Title) документа по адресу, URL1:
Yule–Simon distribution - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)