Марковское случайное поле
В области физики и вероятностей марковское случайное поле ( MRF ), марковская сеть или неориентированная графическая модель представляет собой набор случайных величин, имеющих марковское свойство, описываемое неориентированным графом . Другими словами, случайное поле называется марковским случайным полем, если оно удовлетворяет марковским свойствам. Концепция берет свое начало из модели Шеррингтона-Киркпатрика . [1]
Марковская сеть или MRF похожа на байесовскую сеть в представлении зависимостей; разница в том, что байесовские сети являются направленными и ациклическими , тогда как марковские сети ненаправлены и могут быть циклическими. Таким образом, сеть Маркова может представлять определенные зависимости, которые не могут быть представлены байесовской сетью (например, циклические зависимости [ нужны дальнейшие объяснения ] ); с другой стороны, она не может представлять определенные зависимости, которые может представлять байесовская сеть (например, индуцированные зависимости [ нужны дальнейшие объяснения ] ). Основной граф марковского случайного поля может быть конечным или бесконечным.
Когда совместная плотность вероятности случайных величин строго положительна, ее также называют случайным полем Гиббса , потому что, согласно теореме Хаммерсли-Клиффорда , оно может быть тогда представлено мерой Гиббса для подходящего (локально определенного) поля. энергетическая функция. Прототипом марковского случайного поля является модель Изинга ; действительно, марковское случайное поле было введено в качестве общего условия для модели Изинга. [2] В области искусственного интеллекта марковское случайное поле используется для моделирования различных задач низкого и среднего уровня в области обработки изображений и компьютерного зрения . [3]
Определение
[ редактировать ]Учитывая неориентированный граф , набор случайных величин индексируется образуют марковское случайное поле относительно если они удовлетворяют локальным марковским свойствам:
- Попарное марковское свойство: любые две несмежные переменные условно независимы при условии, что все остальные переменные:
- Локальное марковское свойство: переменная условно независима от всех других переменных с учетом ее соседей:
- где множество соседей , и это закрытый район .
- Глобальное марковское свойство: любые два подмножества переменных условно независимы с учетом разделяющего подмножества:
- где каждый путь от узла в к узлу в проходит через .
Глобальное марковское свойство сильнее локального марковского свойства, которое, в свою очередь, сильнее парного. [4] Однако указанные выше три марковских свойства эквивалентны для положительных распределений. [5] (те, которые присваивают ассоциированным переменным только ненулевые вероятности).
Связь между тремя марковскими свойствами особенно ясна в следующей формулировке:
- Попарно: Для любого не равные и не соседние, .
- Локальный: Для любого и не содержащий или примыкающий к , .
- Глобально: для любого не пересекающиеся и не соседние, .
Факторизация клики
[ редактировать ]Поскольку марковское свойство произвольного распределения вероятностей может быть трудно установить, обычно используемым классом марковских случайных полей являются те, которые можно факторизовать в соответствии с кликами графа.
Учитывая набор случайных величин , позволять быть вероятностью определенной конфигурации поля в -то есть, - вероятность обнаружить, что случайные величины приобретать особое значение . Потому что множество, вероятность следует понимать в отношении совместного распределения .
Если эту плотность соединений можно разложить по кликам как
затем образует марковское случайное поле относительно . Здесь, представляет собой множество клик . Определение эквивалентно, если используются только максимальные клики. Функции иногда называют факторными потенциалами или кликовыми потенциалами . Обратите внимание, однако, что используется противоречивая терминология: слово потенциал часто применяется к логарифму . Это связано с тем, что в статистической механике прямую интерпретацию как потенциальную энергию конфигурации имеет .
Некоторые MRF не факторизуются: простой пример можно построить на цикле из 4 узлов с некоторыми бесконечными энергиями, то есть конфигурациями нулевых вероятностей, [6] даже если, что более уместно, позволить бесконечным энергиям действовать на полный граф на . [7]
Факторизация MRF, если выполнено хотя бы одно из следующих условий:
- плотность положительна (по теореме Хаммерсли – Клиффорда )
- граф хордальный (по эквивалентности байесовской сети )
Когда такая факторизация существует, можно построить факторный граф для сети.
Экспоненциальное семейство
[ редактировать ]Любое положительное марковское случайное поле можно записать как семейство экспонент в канонической форме с характерными функциями. так что полное совместное распределение можно записать как
где обозначение
— это просто скалярное произведение конфигураций полей, а Z — это функция статистического распределения :
Здесь, обозначает набор всех возможных присвоений значений всем случайным переменным сети. Обычно функции функции определяются так, что они являются индикаторами конфигурации клики, т.е. если соответствует i -й возможной конфигурации k -й клики и 0 в противном случае. Эта модель эквивалентна модели факторизации клики, приведенной выше, если - мощность клики и вес функции соответствует логарифму соответствующего фактора клики, т.е. , где — i -я возможная конфигурация k -й клики, т.е. -е значение i в области определения клики .
Вероятность P часто называют мерой Гиббса. Такое выражение марковского поля как логистической модели возможно только в том случае, если все факторы клики отличны от нуля, т.е. если ни один из элементов присваивается вероятность 0. Это позволяет применять методы матричной алгебры, например , что след матрицы является логарифмом определителя , с матричным представлением графа, возникающим из матрицы инцидентности графа .
Важность статистической суммы Z заключается в том, что многие понятия статистической механики , такие как энтропия , напрямую обобщаются на случай сетей Маркова, и интуитивное таким образом можно получить понимание. Кроме того, функция распределения позволяет применять вариационные методы к решению задачи: можно привязать движущую силу к одной или нескольким случайным переменным и исследовать реакцию сети в ответ на это возмущение . Так, например, можно добавить управляющий член J v для каждой вершины v графа к статистической сумме, чтобы получить:
Формальное дифференцирование по J v дает математическое ожидание случайной величины X v, связанной с вершиной v :
корреляционные функции Аналогично вычисляются ; двухточечная корреляция:
К сожалению, хотя правдоподобие логистической сети Маркова выпукло, оценка правдоподобия или градиента правдоподобия модели требует вывода в модели, что обычно невозможно с вычислительной точки зрения (см. «Вывод» ниже).
Примеры
[ редактировать ]Гауссовский
[ редактировать ]Многомерное нормальное распределение образует марковское случайное поле относительно графа. если недостающие ребра соответствуют нулям в матрице точности (обратной ковариационной матрице ):
такой, что
Вывод
[ редактировать ]Как и в байесовской сети , можно вычислить условное распределение набора узлов. данные значения другому набору узлов в марковском случайном поле путем суммирования всех возможных присвоений ; это называется точным выводом . Однако точный вывод является #P-полной проблемой и, следовательно, в общем случае вычислительно неразрешим. Такие методы аппроксимации, как цепь Маркова Монте-Карло и циклическое распространение убеждений, часто более осуществимы на практике. Некоторые конкретные подклассы MRF, такие как деревья (см. Дерево Чоу – Лю ), имеют алгоритмы вывода с полиномиальным временем; обнаружение таких подклассов является активной темой исследований. Существуют также подклассы MRF, которые допускают эффективный вывод MAP или, скорее всего, присваивание; примеры из них включают ассоциативные сети. [9] [10] Еще одним интересным подклассом являются модели разложимых моделей (когда граф хордальный ): имея замкнутую форму для MLE , можно обнаружить непротиворечивую структуру для сотен переменных. [11]
Условные случайные поля
[ редактировать ]Одним из примечательных вариантов марковского случайного поля является условное случайное поле , в котором каждая случайная величина также может быть обусловлена набором глобальных наблюдений. . В этой модели каждая функция является отображением всех присвоений как клике k , так и наблюдениям к неотрицательным действительным числам. Эта форма сети Маркова может быть более подходящей для создания дискриминационных классификаторов , которые не моделируют распределение по наблюдениям. CRF были предложены Джоном Д. Лафферти , Эндрю МакКаллумом и Фернандо К. Н. Перейрой в 2001 году. [12]
Разнообразные приложения
[ редактировать ]Марковские случайные поля находят применение в самых разных областях: от компьютерной графики до компьютерного зрения, машинного обучения или вычислительной биологии . [13] [14] и поиск информации . [15] MRF используются при обработке изображений для создания текстур, поскольку их можно использовать для создания гибких и стохастических моделей изображений. При моделировании изображений задача состоит в том, чтобы найти подходящее распределение интенсивности данного изображения, где пригодность зависит от типа задачи, а MRF достаточно гибки, чтобы их можно было использовать для синтеза изображений и текстур, сжатия и восстановления изображений, сегментации изображений , трехмерных изображений. вывод из 2D-изображений, регистрация изображений , синтез текстур , сверхвысокое разрешение , сопоставление стереоизображений и поиск информации . Их можно использовать для решения различных задач компьютерного зрения, которые могут быть сформулированы как проблемы минимизации энергии или проблемы, в которых различные регионы необходимо различать с использованием набора различающих признаков в рамках структуры марковского случайного поля, чтобы предсказать категорию региона. [16] Марковские случайные поля были обобщением модели Изинга и с тех пор широко использовались в комбинаторных оптимизациях и сетях.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Шеррингтон, Дэвид; Киркпатрик, Скотт (1975), «Разрешимая модель спинового стекла», Physical Review Letters , 35 (35): 1792–1796, Бибкод : 1975PhRvL..35.1792S , doi : 10.1103/PhysRevLett.35.1792
- ^ Киндерманн, Росс; Снелл, Дж. Лори (1980). Марковские случайные поля и их приложения (PDF) . Американское математическое общество. ISBN 978-0-8218-5001-5 . МР 0620955 . Архивировано из оригинала (PDF) 10 августа 2017 г. Проверено 9 апреля 2012 г.
- ^ Ли, СЗ (2009). Моделирование марковских случайных полей в анализе изображений . Спрингер. ISBN 9781848002791 .
- ^ Лауритцен, Штеффен (1996). Графические модели . Оксфорд: Кларендон Пресс. п. 33. ISBN 978-0198522195 .
- ^ Коллер, Дафна; Фридман, Нир (2009). Вероятностные графические модели . МТИ Пресс. п. 114-122. ISBN 9780262013192 .
- ^ Муссурис, Джон (1974). «Случайные системы Гиббса и Маркова с ограничениями». Журнал статистической физики . 10 (1): 11–33. Бибкод : 1974JSP....10...11M . дои : 10.1007/BF01011714 . hdl : 10338.dmlcz/135184 . МР 0432132 . S2CID 121299906 .
- ^ Гандольфи, Альберто; Ленарда, Пьетро (2016). «Заметка о случайных полях Гиббса и Маркова с ограничениями и их моментами» . Математика и механика сложных систем . 4 (3–4): 407–422. дои : 10.2140/memocs.2016.4.407 .
- ^ Рю, Ховард; Хелд, Леонард (2005). Гауссовы марковские случайные поля: теория и приложения . ЦРК Пресс. ISBN 978-1-58488-432-3 .
- ^ Таскар, Бенджамин; Чаталбашев, Василий; Коллер, Дафна (2004), «Обучение ассоциативным марковским сетям», в Бродли, Карла Э. (редактор), Материалы двадцать первой международной конференции по машинному обучению (ICML 2004), Банф, Альберта, Канада, 4 июля. 8, 2004 г. , Серия материалов Международной конференции ACM, том. 69, Ассоциация вычислительной техники , с. 102, CiteSeerX 10.1.1.157.329 , doi : 10.1145/1015330.1015444 , ISBN 978-1581138283 , S2CID 11312524 .
- ^ Дучи, Джон К.; Тарлоу, Дэниел; Элидан, Гал; Коллер, Дафна (2006), «Использование комбинаторной оптимизации в рамках распространения убеждений о максимальном произведении» , в Шёлкопфе, Бернхард; Платт, Джон К.; Хоффман, Томас (ред.), Труды двадцатой ежегодной конференции по нейронным системам обработки информации, Ванкувер, Британская Колумбия, Канада, 4–7 декабря 2006 г. , Достижения в области нейронных систем обработки информации , том. 19, MIT Press , стр. 369–376 .
- ^ Петижан, Ф.; Уэбб, Дж.И.; Николсон, А.Е. (2013). Масштабирование лог-линейного анализа для многомерных данных (PDF) . Международная конференция по интеллектуальному анализу данных. Даллас, Техас, США: IEEE.
- ^ «Два классических приза за статьи, представленные на ICML 2013» . ИКМЛ . 2013 . Проверено 15 декабря 2014 г.
- ^ Киндерманн и Снелл, Росс и Лори (1980). Марковские случайные поля и их приложения . Род-Айленд: Американское математическое общество. ISBN 978-0-8218-5001-5 .
- ^ Банф, Майкл; Ри, Сын Ю. (01 февраля 2017 г.). «Улучшение вывода регуляторной сети генов за счет интеграции данных с марковскими случайными полями» . Научные отчеты . 7 (1): 41174. Бибкод : 2017NatSR...741174B . дои : 10.1038/srep41174 . ISSN 2045-2322 . ПМЦ 5286517 . ПМИД 28145456 .
- ^ Мецлер, Дональд; Крофт, В.Брюс (2005). Марковская модель случайного поля для временных зависимостей . Материалы 28-й конференции ACM SIGIR. Сальвадор, Бразилия: ACM. стр. 472–479. дои : 10.1145/1076034.1076115 .
- ^ Чжан и Захор, Ричард и Авиде (2014). «Автоматическая идентификация областей окон в облаках точек внутри помещений с использованием LiDAR и камер». Публикации VIP Lab . CiteSeerX 10.1.1.649.303 .