Jump to content

Марковское случайное поле

(Перенаправлено из марковских случайных полей )
Пример марковского случайного поля.
Пример марковского случайного поля. Каждое ребро представляет зависимость. В этом примере: A зависит от B и D. B зависит от A и D. D зависит от A, B и E. E зависит от D и C. C зависит от E.

В области физики и вероятностей марковское случайное поле ( MRF ), марковская сеть или неориентированная графическая модель представляет собой набор случайных величин , имеющих марковское свойство, описываемое неориентированным графом . Другими словами, случайное поле называется марковским случайным полем, если оно удовлетворяет марковским свойствам. Концепция берет свое начало из модели Шеррингтона-Киркпатрика . [1]

Марковская сеть или MRF похожа на байесовскую сеть в представлении зависимостей; различия заключаются в том, что байесовские сети являются направленными и ациклическими , тогда как марковские сети ненаправлены и могут быть циклическими. Таким образом, сеть Маркова может представлять определенные зависимости, которые не может представлять байесовская сеть (например, циклические зависимости [ нужны дальнейшие объяснения ] ); с другой стороны, она не может представлять определенные зависимости, которые может представлять байесовская сеть (например, индуцированные зависимости [ нужны дальнейшие объяснения ] ). Основной граф марковского случайного поля может быть конечным или бесконечным.

Когда совместная плотность вероятности случайных величин строго положительна, ее также называют случайным полем Гиббса , потому что, согласно теореме Хаммерсли-Клиффорда , оно может быть тогда представлено мерой Гиббса для подходящего (локально определенного) поля. энергетическая функция. Прототипом марковского случайного поля является модель Изинга ; действительно, марковское случайное поле было введено в качестве общей предпосылки для модели Изинга. [2] В области искусственного интеллекта марковское случайное поле используется для моделирования различных задач низкого и среднего уровня в области обработки изображений и компьютерного зрения . [3]

Определение

[ редактировать ]

Учитывая неориентированный граф , набор случайных величин индексируется образуют марковское случайное поле относительно если они удовлетворяют локальным марковским свойствам:

Попарное марковское свойство: любые две несмежные переменные условно независимы при условии, что все остальные переменные:
Локальное марковское свойство: переменная условно независима от всех других переменных с учетом ее соседей:
где множество соседей , и это закрытый район .
Глобальное марковское свойство: любые два подмножества переменных условно независимы с учетом разделяющего подмножества:
где каждый путь от узла в к узлу в проходит через .

Глобальное марковское свойство сильнее локального марковского свойства, которое, в свою очередь, сильнее парного. [4] Однако указанные выше три марковских свойства эквивалентны для положительных распределений. [5] (те, которые присваивают ассоциированным переменным только ненулевые вероятности).

Связь между тремя марковскими свойствами особенно ясна в следующей формулировке:

  • Попарно: Для любого не равные и не соседние, .
  • Локальный: Для любого и не содержащий или примыкающий к , .
  • Глобально: для любого не пересекающиеся и не соседние, .

Факторизация клики

[ редактировать ]

Поскольку марковское свойство произвольного распределения вероятностей может быть трудно установить, обычно используемым классом марковских случайных полей являются те, которые можно факторизовать в соответствии с кликами графа.

Учитывая набор случайных величин , позволять быть вероятностью конкретной конфигурации поля в -то есть, - вероятность обнаружить, что случайные величины приобретать особое значение . Потому что множество, вероятность следует понимать в отношении совместного распределения .

Если эту плотность соединений можно разложить по кликам как

затем образует марковское случайное поле относительно . Здесь, представляет собой множество клик . Определение эквивалентно, если используются только максимальные клики. Функции иногда называют факторными потенциалами или кликовыми потенциалами . Обратите внимание, однако, что используется противоречивая терминология: слово потенциал часто применяется к логарифму . Это связано с тем, что в статистической механике прямую интерпретацию как потенциальную энергию конфигурации имеет  .

Некоторые MRF не факторизуются: простой пример можно построить на цикле из 4 узлов с некоторыми бесконечными энергиями, то есть конфигурациями нулевых вероятностей, [6] даже если, что более правильно, позволить бесконечным энергиям действовать на полный граф на . [7]

Факторизация MRF, если выполнено хотя бы одно из следующих условий:

Когда такая факторизация существует, можно построить факторный граф для сети.

Экспоненциальное семейство

[ редактировать ]

Любое положительное марковское случайное поле можно записать как семейство экспонент в канонической форме с характерными функциями. так что полное совместное распределение можно записать как

где обозначение

— это просто скалярное произведение конфигураций полей, а Z — это функция статистического распределения :

Здесь, обозначает набор всех возможных присвоений значений всем случайным переменным сети. Обычно функции функции определяются так, что они являются индикаторами конфигурации клики, т.е. если соответствует i -й возможной конфигурации k -й клики и 0 в противном случае. Эта модель эквивалентна модели факторизации клики, приведенной выше, если - мощность клики и вес функции соответствует логарифму соответствующего фактора клики, т.е. , где i -я возможная конфигурация k -й клики, т.е. -е значение i в области определения клики .

Вероятность P часто называют мерой Гиббса. Такое выражение марковского поля как логистической модели возможно только в том случае, если все факторы клики отличны от нуля, т.е. если ни один из элементов присваивается вероятность 0. Это позволяет применять методы матричной алгебры, например , что след матрицы является логарифмом определителя , с матричным представлением графа, возникающим из матрицы инцидентности графа .

Важность статистической суммы Z заключается в том, что многие понятия статистической механики , такие как энтропия , напрямую обобщаются на случай сетей Маркова, и интуитивное таким образом можно получить понимание. Кроме того, функция распределения позволяет применять вариационные методы к решению задачи: можно привязать движущую силу к одной или нескольким случайным переменным и исследовать реакцию сети в ответ на это возмущение . Так, например, можно добавить управляющий член J v для каждой вершины v графа к статистической сумме, чтобы получить:

Формальное дифференцирование по J v дает математическое ожидание случайной величины X v, связанной с вершиной v :

корреляционные функции Аналогично вычисляются ; двухточечная корреляция:

К сожалению, хотя вероятность логистической сети Маркова является выпуклой, оценка вероятности или градиента вероятности модели требует вывода в модели, что обычно невозможно с вычислительной точки зрения (см. «Вывод» ниже).

Гауссовский

[ редактировать ]

Многомерное нормальное распределение образует марковское случайное поле относительно графа. если недостающие ребра соответствуют нулям в матрице точности (обратной ковариационной матрице ):

такой, что

[8]

Как и в байесовской сети , можно вычислить условное распределение набора узлов. данные значения другому набору узлов в марковском случайном поле путем суммирования всех возможных присвоений ; это называется точным выводом . Однако точный вывод является #P-полной проблемой и, следовательно, в общем случае вычислительно неразрешим. Такие методы аппроксимации, как цепь Маркова Монте-Карло и циклическое распространение убеждений, часто более осуществимы на практике. Некоторые конкретные подклассы MRF, такие как деревья (см. Дерево Чоу – Лю ), имеют алгоритмы вывода с полиномиальным временем; обнаружение таких подклассов является активной темой исследований. Существуют также подклассы MRF, которые обеспечивают эффективный вывод MAP или, скорее всего, присваивание; примеры из них включают ассоциативные сети. [9] [10] Еще одним интересным подклассом являются модели разложимых моделей (когда граф хордальный ): имея замкнутую форму для MLE , можно обнаружить непротиворечивую структуру для сотен переменных. [11]

Условные случайные поля

[ редактировать ]

Одним из примечательных вариантов марковского случайного поля является условное случайное поле , в котором каждая случайная величина также может быть обусловлена ​​набором глобальных наблюдений. . В этой модели каждая функция является отображением всех присвоений как клике k , так и наблюдениям к неотрицательным действительным числам. Эта форма сети Маркова может быть более подходящей для создания дискриминационных классификаторов , которые не моделируют распределение по наблюдениям. CRF были предложены Джоном Д. Лафферти , Эндрю МакКаллумом и Фернандо К. Н. Перейрой в 2001 году. [12]

Разнообразные приложения

[ редактировать ]

Марковские случайные поля находят применение в самых разных областях: от компьютерной графики до компьютерного зрения, машинного обучения или вычислительной биологии . [13] [14] и поиск информации . [15] MRF используются при обработке изображений для создания текстур, поскольку их можно использовать для создания гибких и стохастических моделей изображений. При моделировании изображений задача состоит в том, чтобы найти подходящее распределение интенсивности данного изображения, где пригодность зависит от типа задачи, а MRF достаточно гибки, чтобы их можно было использовать для синтеза изображений и текстур, сжатия и восстановления изображений, сегментации изображений , трехмерных изображений. вывод из 2D-изображений, регистрация изображений , синтез текстур , сверхвысокое разрешение , сопоставление стереоизображений и поиск информации . Их можно использовать для решения различных задач компьютерного зрения, которые могут быть сформулированы как проблемы минимизации энергии или проблемы, в которых различные регионы необходимо различать с использованием набора различающих признаков в рамках структуры марковского случайного поля, чтобы предсказать категорию региона. [16] Марковские случайные поля были обобщением модели Изинга и с тех пор широко использовались в комбинаторных оптимизациях и сетях.

См. также

[ редактировать ]
  1. ^ Шеррингтон, Дэвид; Киркпатрик, Скотт (1975), «Разрешимая модель спинового стекла», Physical Review Letters , 35 (35): 1792–1796, Бибкод : 1975PhRvL..35.1792S , doi : 10.1103/PhysRevLett.35.1792
  2. ^ Киндерманн, Росс; Снелл, Дж. Лори (1980). Марковские случайные поля и их приложения (PDF) . Американское математическое общество. ISBN  978-0-8218-5001-5 . МР   0620955 . Архивировано из оригинала (PDF) 10 августа 2017 г. Проверено 9 апреля 2012 г.
  3. ^ Ли, СЗ (2009). Моделирование марковских случайных полей в анализе изображений . Спрингер. ISBN  9781848002791 .
  4. ^ Лауритцен, Штеффен (1996). Графические модели . Оксфорд: Кларендон Пресс. п. 33. ISBN  978-0198522195 .
  5. ^ Коллер, Дафна; Фридман, Нир (2009). Вероятностные графические модели . МТИ Пресс. стр. 114-122. ISBN  9780262013192 .
  6. ^ Муссурис, Джон (1974). «Случайные системы Гиббса и Маркова с ограничениями». Журнал статистической физики . 10 (1): 11–33. Бибкод : 1974JSP....10...11M . дои : 10.1007/BF01011714 . hdl : 10338.dmlcz/135184 . МР   0432132 . S2CID   121299906 .
  7. ^ Гандольфи, Альберто; Ленарда, Пьетро (2016). «Заметка о случайных полях Гиббса и Маркова с ограничениями и их моментами» . Математика и механика сложных систем . 4 (3–4): 407–422. дои : 10.2140/memocs.2016.4.407 .
  8. ^ Рю, Ховард; Хелд, Леонард (2005). Гауссовы марковские случайные поля: теория и приложения . ЦРК Пресс. ISBN  978-1-58488-432-3 .
  9. ^ Таскар, Бенджамин; Чаталбашев, Василий; Коллер, Дафна (2004), «Обучение ассоциативным марковским сетям», в Бродли, Карла Э. (редактор), Труды двадцать первой международной конференции по машинному обучению (ICML 2004), Банф, Альберта, Канада, 4 июля. 8, 2004 г. , Серия материалов Международной конференции ACM, том. 69, Ассоциация вычислительной техники , с. 102, CiteSeerX   10.1.1.157.329 , doi : 10.1145/1015330.1015444 , ISBN  978-1581138283 , S2CID   11312524 .
  10. ^ Дучи, Джон К.; Тарлоу, Дэниел; Элидан, Гал; Коллер, Дафна (2006), «Использование комбинаторной оптимизации в рамках распространения убеждений о максимальном произведении» , в Шёлкопфе, Бернхард; Платт, Джон К.; Хоффман, Томас (ред.), Труды двадцатой ежегодной конференции по нейронным системам обработки информации, Ванкувер, Британская Колумбия, Канада, 4-7 декабря 2006 г. , Достижения в области нейронных систем обработки информации , том. 19, MIT Press , стр. 369–376 .
  11. ^ Петижан, Ф.; Уэбб, Дж.И.; Николсон, А.Е. (2013). Масштабирование лог-линейного анализа для многомерных данных (PDF) . Международная конференция по интеллектуальному анализу данных. Даллас, Техас, США: IEEE.
  12. ^ «Два классических приза за статьи, представленные на ICML 2013» . ИКМЛ . 2013 . Проверено 15 декабря 2014 г.
  13. ^ Киндерманн и Снелл, Росс и Лори (1980). Марковские случайные поля и их приложения . Род-Айленд: Американское математическое общество. ISBN  978-0-8218-5001-5 .
  14. ^ Банф, Майкл; Ри, Сын Ю. (01 февраля 2017 г.). «Улучшение вывода регуляторной сети генов за счет интеграции данных с марковскими случайными полями» . Научные отчеты . 7 (1): 41174. Бибкод : 2017NatSR...741174B . дои : 10.1038/srep41174 . ISSN   2045-2322 . ПМЦ   5286517 . ПМИД   28145456 .
  15. ^ Мецлер, Дональд; Крофт, В.Брюс (2005). Марковская модель случайного поля для временных зависимостей . Материалы 28-й конференции ACM SIGIR. Сальвадор, Бразилия: ACM. стр. 472–479. дои : 10.1145/1076034.1076115 .
  16. ^ Чжан и Захор, Ричард и Авиде (2014). «Автоматическая идентификация областей окон в облаках точек внутри помещений с использованием LiDAR и камер». Публикации VIP Lab . CiteSeerX   10.1.1.649.303 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 08407cc83d9dfba155b7f56d03ccb63a__1714367280
URL1:https://arc.ask3.ru/arc/aa/08/3a/08407cc83d9dfba155b7f56d03ccb63a.html
Заголовок, (Title) документа по адресу, URL1:
Markov random field - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)