Процесс Питмана-Йора
В теории вероятностей процесс Питмана – Йора [ 1 ] [ 2 ] [ 3 ] [ 4 ] Обозначаемый PY( d , θ , G 0 ), представляет собой случайный процесс , путь выборки которого представляет собой распределение вероятностей . Случайная выборка из этого процесса представляет собой бесконечное дискретное распределение вероятностей, состоящее из бесконечного набора атомов, взятых из G 0 , с весами, взятыми из двухпараметрического распределения Пуассона-Дирихле . Процесс назван в честь Джима Питмана и Марка Йора .
Параметрами, управляющими процессом Питмана-Йора, являются: 0 ≤ < 1, параметр дисконтирования, параметр силы θ > − d и базовое распределение G 0 в вероятностном пространстве X. d Когда d = 0, это становится процессом Дирихле . Параметр дисконтирования дает процессу Питмана-Йора большую гибкость в отношении поведения хвоста, чем процесс Дирихле, который имеет экспоненциальные хвосты. Это делает процесс Питмана-Йора полезным для моделирования данных со степенными хвостами (например, частоты слов в естественном языке).
Сменное случайное разбиение, индуцированное процессом Питмана-Йора, является примером процесса китайского ресторана , перегородки Пуассона-Кингмана и случайного разбиения типа Гиббса .
Соглашения об именах
[ редактировать ]Название «процесс Питмана-Йора» было придумано Ишвараном и Джеймсом. [ 5 ] после обзора Питмана и Йора по этому поводу. [ 2 ] Однако первоначально этот процесс изучался Perman et al. [ 6 ] [ 7 ]
Его также иногда называют двухпараметрическим процессом Пуассона-Дирихле в честь двухпараметрического обобщения распределения Пуассона-Дирихле, которое описывает совместное распределение размеров атомов в случайной мере , отсортированное по строго убывающему порядку.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Ишваран, Х; Джеймс, LF (2003). «Обобщенные взвешенные процессы китайского ресторана для моделей смесей выборки видов». Статистика Синица . 13 : 1211–1235.
- ^ Jump up to: а б Питман, Джим; Йор, Марк (1997). «Двухпараметрическое распределение Пуассона – Дирихле, полученное из стабильного подчиненного». Анналы вероятности . 25 (2): 855–900. CiteSeerX 10.1.1.69.1273 . дои : 10.1214/aop/1024404422 . МР 1434129 . Збл 0880.60076 .
- ^ Питман, Джим (2006). Комбинаторные случайные процессы . Том. 1875. Берлин: Springer-Verlag. ISBN 9783540309901 .
- ^ Да, Йи Почему (2006). «Иерархическая модель байесовского языка, основанная на процессах Питмана – Йора». Материалы 21-й Международной конференции по компьютерной лингвистике и 44-го ежегодного собрания Ассоциации компьютерной лингвистики .
- ^ Ишваран, Х.; Джеймс, Л. (2001). «Методы отбора проб Гиббса для априорных исследований». Журнал Американской статистической ассоциации . 96 (453): 161–173. CiteSeerX 10.1.1.36.2559 . дои : 10.1198/016214501750332758 .
- ^ Перман, М.; Питман, Дж.; Йор, М. (1992). «Выборка точечных процессов и отклонений Пуассона по размеру» . Теория вероятностей и смежные области . 92 : 21–39. дои : 10.1007/BF01205234 .
- ^ Перман, М. (1990). Случайные дискретные распределения, полученные от подчиненных (Диссертация). Департамент статистики Калифорнийского университета в Беркли.