Jump to content

Иерархический процесс Дирихле

В статистике и машинном обучении иерархический процесс Дирихле ( HDP ) представляет собой непараметрический байесовский подход к кластеризации сгруппированных данных . [1] [2] Он использует процесс Дирихле для каждой группы данных, причем процессы Дирихле для всех групп имеют общее базовое распределение, которое само по себе получено из процесса Дирихле. Этот метод позволяет группам делиться статистической силой посредством совместного использования кластеров между группами. Базовое распределение, полученное из процесса Дирихле, важно, потому что результаты процесса Дирихле являются атомарными вероятностными мерами, и атомы будут появляться во всех процессах Дирихле на групповом уровне. Поскольку каждый атом соответствует кластеру, кластеры являются общими для всех групп. Он был разработан Йи Уайе Тех , Майклом И. Джорданом , Мэтью Дж. Билом и Дэвидом Блей и опубликован в Журнале Американской статистической ассоциации в 2006 году. [1] как формализация и обобщение бесконечной скрытой модели Маркова, опубликованной в 2002 году. [3]

Описание модели взято с сайта. [1] HDP — это модель сгруппированных данных. Это означает, что элементы данных входят в несколько отдельных групп. Например, в тематической модели слова организованы в документы, причем каждый документ состоит из пакета (группы) слов (элементов данных). Индексация групп по , предположим, что каждая группа состоит из элементов данных .

HDP параметризуется базовым распределением который управляет априорным распределением элементов данных, а также рядом параметров концентрации, которые определяют априорное количество кластеров и степень совместного использования между группами. эта группа связана со случайной вероятностной мерой который имеет распределение, заданное процессом Дирихле:

где - параметр концентрации, связанный с группой, и — это базовое распределение, общее для всех групп. В свою очередь, общее базовое распределение представляет собой распределение процесса Дирихле:

с параметром концентрации и базовое распределение . Наконец, чтобы связать процессы Дирихле с наблюдаемыми данными, каждый элемент данных связан со скрытым параметром :

В первой строке указано, что каждый параметр имеет априорное распределение, определяемое формулой , а во второй строке указано, что каждый элемент данных имеет распределение параметризуется связанным с ним параметром. Полученная выше модель называется смешанной моделью HDP, где HDP относится к иерархически связанному набору процессов Дирихле, а смешанная модель относится к тому, как процессы Дирихле связаны с элементами данных.

Чтобы понять, как HDP реализует модель кластеризации и как кластеры становятся общими для групп, вспомните, что процесс Дирихле основан на атомарных вероятностных мерах с вероятностью единица. Это означает, что общее базовое распределение имеет форму, которую можно записать как:

где имеется бесконечное число атомов, , предполагая, что общее базовое распределение имеет бесконечную поддержку. Каждому атому соответствует масса . Массы должны в сумме равняться единице, так как является вероятностной мерой. С само по себе является базовым распределением для конкретных групп процессов Дирихле, каждый из которых будут иметь атомы, заданные атомами , и сам может быть записан в виде:

Таким образом, набор атомов является общим для всех групп, причем каждая группа имеет свою собственную атомную массу, специфичную для группы. Связывая это представление с наблюдаемыми данными, мы видим, что каждый элемент данных описывается смешанной моделью:

где атомы играют роль параметров компонентов смеси, а массы играют роль пропорции смешивания. В заключение отметим, что каждая группа данных моделируется с использованием модели смеси, при этом компоненты смеси являются общими для всех групп, но пропорции смешивания зависят от группы. С точки зрения кластеризации мы можем интерпретировать каждый компонент смеси как модель кластера элементов данных, причем кластеры являются общими для всех групп, и каждая группа имеет свои собственные пропорции смешивания, состоящие из различных комбинаций кластеров.

Приложения

[ редактировать ]

Модель смеси HDP — это естественное непараметрическое обобщение скрытого распределения Дирихле , в котором количество тем может быть неограниченным и изучаться на основе данных. [1] Здесь каждая группа — это документ, состоящий из пакета слов, каждый кластер — это тема, а каждый документ — это смесь тем. HDP также является основным компонентом бесконечной скрытой марковской модели . [3] которая представляет собой непараметрическое обобщение скрытой модели Маркова, позволяющее неограниченное количество состояний и изучение их на основе данных. [1] [4]

Обобщения

[ редактировать ]

HDP можно обобщить в нескольких направлениях. Процессы Дирихле можно заменить процессами Питмана-Йора и Гамма-процессами , в результате чего образуются иерархический процесс Питмана-Йора и иерархический гамма-процесс. Иерархия может быть более глубокой, с несколькими уровнями групп, организованными в иерархию. Такое расположение было использовано в мемоайзере последовательностей , байесовской непараметрической модели последовательностей, которая имеет многоуровневую иерархию процессов Питмана-Йора. Кроме того, модель байесовского многодоменного обучения (BMDL) выводит доменно-зависимые скрытые представления данных сверхдисперсного подсчета на основе иерархической отрицательной биномиальной факторизации для точного определения подтипа рака, даже если количество образцов для конкретного типа рака невелико. [5]

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с д и Да, Ю.В.; Джордан, Мичиган; Бил, MJ; Блей, ДМ (2006). «Иерархические процессы Дирихле» (PDF) . Журнал Американской статистической ассоциации . 101 (476): стр. 1566–1581. CiteSeerX   10.1.1.5.9094 . дои : 10.1198/016214506000000302 . S2CID   7934949 .
  2. ^ Да, Ю.В.; Джордан, Мичиган (2010). Иерархические байесовские непараметрические модели с приложениями (PDF) . Издательство Кембриджского университета . стр. 158–207. CiteSeerX   10.1.1.157.9451 . дои : 10.1017/CBO9780511802478.006 . ISBN  9780511802478 . {{cite book}}: |journal= игнорируется ( помогите )
  3. ^ Перейти обратно: а б Бил, М.Дж., Гахрамани, З. и Расмуссен, CE (2002). «Бесконечная скрытая марковская модель» (PDF) . Достижения в области нейронных систем обработки информации 14: 577–585. Кембридж, Массачусетс: MIT Press.
  4. ^ Фокс, Эмили Б. и др. «Прикрепленный HDP-HMM с приложением для ведения дневника говорящих». Анналы прикладной статистики (2011): 1020–1056.
  5. ^ Хаджирамезанали, Э., Дадане, С.З., Карбалайгаре, А., Чжоу, З. и Цянь, X. «Байесовское многодоменное обучение для обнаружения подтипов рака на основе данных подсчета секвенирования следующего поколения» (PDF). 32-я конференция по нейронным системам обработки информации (NIPS 2018), Монреаль, Канада.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: bddc8a444d54bee4fa47dc6965918d10__1718214780
URL1:https://arc.ask3.ru/arc/aa/bd/10/bddc8a444d54bee4fa47dc6965918d10.html
Заголовок, (Title) документа по адресу, URL1:
Hierarchical Dirichlet process - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)