Марковское случайное поле

В домене физики и вероятности ( случайное поле Маркова MRF ) , сеть Маркова или неправомерная графическая модель представляет собой набор случайных величин, имеющих свойство Маркова, описанную неориентированным графом . Другими словами, случайное поле говорится, что является случайным полем Маркова, если оно удовлетворяет свойствам Маркова. Концепция происходит из модели Шеррингтон -Киркпатрика . [ 1 ]
Сеть Маркова или MRF аналогична байесовской сети в своей представлении зависимостей; Различия заключаются в том, что байесовские сети направлены и ациклическими , тогда как марковские сети не обращаются и могут быть циклическими. Таким образом, сеть Маркова может представлять определенные зависимости, которые не может байесовская сеть (например, циклические зависимости [ необходимо дальнейшее объяснение ] ); С другой стороны, он не может представлять определенные зависимости, которые байесовская сеть может (например, индуцированные зависимости [ необходимо дальнейшее объяснение ] ) Базовый график случайного поля Маркова может быть конечным или бесконечным.
Когда плотность вероятности сустава случайных величин строго положительной, она также называется случайным полем Гиббса , поскольку, согласно теореме Хаммерсли -Клиффорда , она может быть представлена мерой Гиббса для соответствующего (локально определенного). энергетическая функция. Прототипическое случайное поле Маркова является моделью ISING ; Действительно, случайное поле Марков было введено в качестве общего настройки для модели Ising. [ 2 ] В области искусственного интеллекта используется случайное поле Маркова для моделирования различных задач низкого и среднего уровня при обработке изображений и компьютерном зрении . [ 3 ]
Определение
[ редактировать ]Учитывая неправомерный график , набор случайных переменных Индексируется сформировать случайное поле Марков по отношению к Если они удовлетворяют местные свойства Маркова:
- Свойство парного Марка: любые две не примечательные переменные являются условно независимыми, учитывая все другие переменные:
- Местное свойство Маркова: переменная не зависит от всех других переменных, учитывая его соседей:
- где это набор соседей , и это закрытый район .
- Глобальное свойство Маркова: любые два подмножества переменных являются условно независимыми, учитывая разделение подмножества:
- Где каждый путь от узла в к узлу в проходит через .
Глобальное свойство Маркова сильнее, чем местное свойство Маркова, которое, в свою очередь, сильнее парного. [ 4 ] Тем не менее, три вышеуказанные свойства Маркова эквивалентны для положительных распределений [ 5 ] (Те, которые присваивают только ненулевые вероятности связанным переменным).
Связь между тремя свойствами Маркова особенно ясна в следующей формулировке:
- Пара: для любого не равен или прилегает, .
- Местный: для любого и не содержит или прилегает к , .
- Global: для любого не пересекающийся или прилегающий, .
Клика факторизация
[ редактировать ]Поскольку свойство марковского распределения вероятности может быть трудно установить, широко используемый класс случайных полей Маркова - это те, которые могут быть факторизированы в соответствии с кликами графика.
Учитывая набор случайных переменных , позволять быть вероятностью определенной конфигурации поля в -то есть, вероятность обнаружения того, что случайные переменные взять на себя особую ценность Полем Потому что это набор, вероятность следует понимать, чтобы быть взятым в отношении совместного распределения .
Если эта плотность сустава может быть факторирована над кликами как
затем образует случайное поле Марков по отношению к Полем Здесь, это набор клик Полем Определение эквивалентно, если используются только максимальные клики. Функции иногда называют факторными потенциалами или кликами потенциалов . Обратите внимание, однако, конфликтующая терминология используется: слово потенциал часто применяется к логарифму Полем Это потому, что в статистической механике , прямую интерпретацию как потенциальную энергию конфигурации имеет .
Некоторые MRF не факторируют: простой пример может быть построен на цикле из 4 узлов с некоторыми бесконечными энергиями, то есть конфигурации нулевых вероятностей, [ 6 ] Даже если один, более уместно, позволяет бесконечным энергиям действовать на полный график на . [ 7 ]
Факторизируется MRF, если выполняется хотя бы одно из следующих условий:
- Плотность положительная ( теоремой Хаммерсли -Клиффорда )
- График хордовый (эквивалентностью байесовской сети )
Когда такая факторизация существует, можно построить график фактора для сети.
Экспоненциальная семья
[ редактировать ]Любое положительное случайное поле Маркова может быть написано в качестве экспоненциального семейства в канонической форме с функциями функций так, чтобы распределение полного сустава было написано как
где нотация
это просто точечный продукт над конфигурациями поля, а z - функция разделения :
Здесь, Обозначает набор всех возможных назначений значений ко всем случайным переменным сети. Обычно функции функции определены так, что они являются показателями конфигурации клики, т.е. если соответствует возможной конфигурации клики K -Th и 0 в противном случае. Эта модель эквивалентна модели факторизации клики, приведенной выше, если это кардинальность клики и вес функции соответствует логарифму соответствующего фактора клики, т.е. , где Является ли -т i . .
Вероятность p часто называют мерой Гиббса. Это выражение поля Маркова как логистической модели возможно только в том случае, если все факторы клики ненулевые, то есть , если ни один из элементов Присваивается вероятность 0. Это позволяет применять методы из матричной алгебры, например , что трасса матрицы является журналом определяющей , с матрицей представления графика, возникающего из матрицы заболеваемости графа .
Важность функции разделения Z заключается в том, что многие концепции из статистической механики , такие как энтропия , непосредственно обобщают случай сетей Маркова, и, интуитивное таким образом, может быть получено понимание. Кроме того, функция разделения позволяет применять вариационные методы к решению проблемы: можно прикрепить движущую силу к одной или нескольким случайным величинам и изучить реакцию сети в ответ на это возмущение . Таким образом, например, можно добавить термин для вождения J V для каждой вершины V графика, к функции разделения, чтобы получить:
Формально дифференцирование по отношению к J V дает значение ожидания случайной величины x V, связанную с вершиной V :
Функции корреляции вычисляются также; Корреляция с двумя пунктами:
К сожалению, хотя вероятность логистической сети Маркова является выпуклой, оценивая вероятность или градиент вероятности модели, требует вывода в модели, что, как правило, вычислительно невозможно (см. «Вывод» ниже).
Примеры
[ редактировать ]Гаусса
[ редактировать ]Многомерное нормальное распределение образует случайное поле Маркова по графику Если отсутствующие края соответствуют нулям на точной матрице (матрица обратной ковариации ):
так что
Вывод
[ редактировать ]Как и в байесовской сети , можно рассчитать условное распределение набора узлов заданные значения другому набору узлов В случайном поле Маркова, суммируя все возможные назначения ; Это называется точным выводом . Тем не менее, точный вывод является проблемой #P-полного , и, следовательно, вычислительно неразрешимы в общем случае. Методы приближения, такие как марковская цепь Монте -Карло и размножение веры, часто более осуществимы на практике. Некоторые конкретные подклассы MRF, такие как деревья (см. Дерево Chow-Liu ), имеют алгоритмы вывода полиномиального времени; Обнаружение таких подклассов является активной темой исследования. Существуют также подклассы MRF, которые разрешают эффективную карту или наиболее вероятное назначение, вывод; Примеры их включают ассоциативные сети. [ 9 ] [ 10 ] Другим интересным подкладом является разловная модели (когда график является хордовым ): наличие закрытой формы для MLE , можно обнаружить постоянную структуру для сотен переменных. [ 11 ]
Условные случайные поля
[ редактировать ]Одним из заметных вариантов случайного поля Маркова является условное случайное поле , в котором каждая случайная переменная также может быть обусловлена на наборе глобальных наблюдений Полем В этой модели каждая функция это отображение от всех заданий как к клике K, так и на наблюдениях к неотрицательным реальным числам. Эта форма сети Маркова может быть более подходящей для создания дискриминационных классификаторов , которые не моделируют распределение по наблюдениям. CRF были предложены Джоном Д. Лафферти , Эндрю МакКаллумом и Фернандо CN Pereira в 2001 году. [ 12 ]
Различные приложения
[ редактировать ]Марковские случайные поля находят применение в различных областях, от компьютерной графики до компьютерного зрения, машинного обучения или вычислительной биологии , [ 13 ] [ 14 ] и поиск информации . [ 15 ] MRF используются в обработке изображений для генерации текстур, так как их можно использовать для генерации гибких и стохастических моделей изображений. В моделировании изображения задача состоит в том, чтобы найти подходящее распределение интенсивности данного изображения, где пригодность зависит от вида задачи, а MRF достаточно гибки, чтобы их можно было использовать для синтеза изображения и текстуры, сжатия и восстановления изображения, сегментации изображения , трехмерного изображения Вывод из 2D-изображений, регистрации изображений , синтеза текстуры , супер-разрешения , сопоставления стерео и поиска информации . Их можно использовать для решения различных задач компьютерного зрения, которые могут быть представлены как проблемы с минимизацией энергии или проблемы, когда различные области необходимо различать с помощью набора различающих функций в рамках случайных полевых средств Маркова для прогнозирования категории региона. [ 16 ] Случайные поля Маркова были обобщением по сравнению с моделью ISING и с тех пор широко использовались в комбинаторных оптимизациях и сетях.
Смотрите также
[ редактировать ]- Ограничение составного графика
- Графическая модель
- Сеть зависимости (графическая модель)
- Хаммерсли - Клиффорд Теорема
- Hopfield Network
- Взаимодействующая система частиц
- Изинская модель
- Лог-линейный анализ
- Марковский цепь
- Логическая сеть Маркова
- Максимальный метод энтропии
- Стохастический сотовой автомат
Ссылки
[ редактировать ]- ^ Шеррингтон, Дэвид; Kirkpatrick, Scott (1975), «Решаемая модель спинового стекла», «Письма с физическим обзором » , 35 (35): 1792–1796, Bibcode : 1975phrvl..35.1792s , doi : 10.1103/physrevlett.35.1792
- ^ Киндерманн, Росс; Снелл, Дж. Лори (1980). Маркова случайные поля и их приложения (PDF) . Американское математическое общество. ISBN 978-0-8218-5001-5 Полем MR 0620955 . Архивировано из оригинала (PDF) 2017-08-10 . Получено 2012-04-09 .
- ^ Li, SZ (2009). Марковское моделирование случайного поля в анализе изображений . Спрингер. ISBN 9781848002791 .
- ^ Лаурицен, Штеффен (1996). Графические модели . Оксфорд: Clarendon Press. п. 33. ISBN 978-0198522195 .
- ^ Воротники, Дафна; Фридман, Нир (2009). Вероятностные графические модели . MIT Press. п. 114-122. ISBN 9780262013192 .
- ^ Муссурис, Джон (1974). «Случайные системы Гиббса и Маркова с ограничениями». Журнал статистической физики . 10 (1): 11–33. Bibcode : 1974JSP .... 10 ... 11m . doi : 10.1007/bf01011714 . HDL : 10338.dmlcz/135184 . MR 0432132 . S2CID 121299906 .
- ^ Гандольфи, Альберто; Ленарда, Пьетро (2016). «Примечание о случайных полях Гиббса и Маркова с ограничениями и их моментами» . Математика и механика сложных систем . 4 (3–4): 407–422. doi : 10.2140/memocs.2016.4.407 .
- ^ Рю, Håvard; Held, Leonhard (2005). Гауссовые марковские случайные поля: теория и приложения . CRC Press. ISBN 978-1-58488-432-3 .
- ^ Taskar, Benjamin; Чаталбашев, Вассил; Koller, Daphne (2004), «Учебная ассоциативная марковская сети», в Бродли, Карла Э. (ред.), Труды двадцать первой Международной конференции по машинному обучению (ICML 2004), Banff, Alberta, Канада, 4 июля. 8, 2004 , ACM International Conference Series, Vol. 69, Ассоциация по компьютерному оборудованию , с. 102, Citeseerx 10.1.1.157.329 , doi : 10.1145/1015330.1015444 , ISBN 978-1581138283 , S2CID 11312524 .
- ^ Дучи, Джон С.; Тарлоу, Даниэль; Элидан, Гал; Коллер, Дафни (2006), «Использование комбинаторной оптимизации в рамках распространения убеждений максимального продукта» , в Schölkopf, Bernhard; Платт, Джон С.; Хоффман, Томас (ред.), Труды двадцатой ежегодной конференции по системам обработки нейронной информации, Ванкувер, Британская Колумбия, Канада, 4-7 декабря 2006 г. , Достижения в области нейронных систем обработки информации , вып. 19, MIT Press , с. 369–376 .
- ^ Petitjean, F.; Уэбб, Ги; Николсон, AE (2013). Масштабирование логарифмического анализа до высоких данных (PDF) . Международная конференция по добыче данных. Даллас, Техас, США: IEEE.
- ^ «Два классических бумажных приза для бумаг, которые появились на ICML 2013» . ICML . 2013 . Получено 15 декабря 2014 года .
- ^ Kindermann & Snell, Ross & Laurie (1980). Марковские случайные поля и их приложения . Род -Айленд: Американское математическое общество. ISBN 978-0-8218-5001-5 .
- ^ Банф, Майкл; Rhee, Seung Y. (2017-02-01). «Улучшение вывода регуляторной сети генов посредством интеграции данных со случайными полями Маркова» . Научные отчеты . 7 (1): 41174. BIBCODE : 2017NATSR ... 741174B . doi : 10.1038/srep41174 . ISSN 2045-2322 . PMC 5286517 . PMID 28145456 .
- ^ Метцлер, Дональд; Croft, W.Bruce (2005). Модель случайного поля Маркова для терминов зависимостей . Материалы 28 -й конференции ACM Sigir. Сальвадор, Бразилия: ACM. С. 472–479. doi : 10.1145/1076034.1076115 .
- ^ Zhang & Zahor, Richard & Avideh (2014). «Автоматическая идентификация оконных областей на помещенных точечных облаках с использованием лидара и камер». VIP -лабораторные публикации . Citeseerx 10.1.1.649.303 .