Jump to content

Распространение убеждений

Распространение убеждений , также известное как передача сообщений суммы-произведения передачи сообщений , представляет собой алгоритм для выполнения вывода на графических моделях , таких как байесовские сети и марковские случайные поля . Он вычисляет предельное распределение для каждого ненаблюдаемого узла (или переменной) в зависимости от любых наблюдаемых узлов (или переменных). Распространение убеждений обычно используется в искусственном интеллекте и теории информации и продемонстрировало эмпирический успех во многих приложениях, включая коды с низкой плотностью проверки на четность , турбокоды , аппроксимацию свободной энергии и выполнимость . [1]

Алгоритм был впервые предложен Джудеей Перл в 1982 году. [2] который сформулировал его как точный алгоритм вывода на деревьях , позже расширенный до полидеревьев . [3] Хотя алгоритм не является точным на общих графах, было показано, что он является полезным приближенным алгоритмом. [4]

Мотивация

[ редактировать ]

Учитывая конечный набор дискретных случайных величин с совместной функцией вероятностной массы , общей задачей является вычисление маргинальных распределений . Маргинал одного определяется как

где представляет собой вектор возможных значений для , и обозначение означает, что сумма берется по тем чей -я координата равна .

Вычисление маргинальных распределений с использованием этой формулы быстро становится вычислительно непомерно трудным по мере роста числа переменных. Например, дано 100 двоичных переменных , вычисляя один предел с использованием и приведенная выше формула будет включать суммирование по возможные значения для . Если известно, что функция массы вероятности факторы в удобном виде, распространение убеждений позволяет вычислять маргинальные значения гораздо более эффективно.

Описание алгоритма суммирования произведений

[ редактировать ]

Варианты алгоритма распространения доверия существуют для нескольких типов графических моделей ( байесовские сети и марковские случайные поля). [5] в частности). Здесь мы описываем вариант, который работает с факторным графом . Факторный граф — это двудольный граф, содержащий узлы, соответствующие переменным. и факторы , с границами между переменными и факторами, в которых они появляются. Мы можем написать совместную массовую функцию:

где - вектор соседних узлов переменных с узлом фактора . Любую байесовскую сеть или марковское случайное поле можно представить в виде графа факторов, используя фактор для каждого узла с его родителями или фактор для каждого узла с его окрестностями соответственно. [6]

Алгоритм работает путем передачи действительных функций, называемых сообщениями, по краям между скрытыми узлами. Точнее, если является переменным узлом и является фактором-узлом, связанным с в графе коэффициентов, то сообщения от к и сообщения от к являются действительными функциями , областью действия которого является набор значений, которые может принимать случайная величина, связанная с , обозначенный . Эти сообщения содержат «влияние», которое одна переменная оказывает на другую. Сообщения вычисляются по-разному в зависимости от того, является ли узел, получающий сообщение, узлом переменной или узлом фактора. Сохраняя те же обозначения:

  • Сообщение из переменного узла к факторному узлу определяется для , где - это набор соседних факторных узлов . Если тогда пусто установлено равномерное распределение по .
  • Сообщение из факторного узла к переменному узлу определяется как произведение коэффициента с сообщениями от всех других узлов, маргинализированное по всем переменным, кроме той, которая связана с , для , где - это набор соседних (переменных) узлов для . Если пусто, то , поскольку в этом случае .

Как показывает предыдущая формула: полная маргинализация сводится к сумме продуктов более простых условий, чем те, которые появляются при полном совместном распределении. По этой причине распространение убеждений иногда называют передачей сообщений суммы произведений или алгоритмом суммы произведения .

При типичном запуске каждое сообщение будет итеративно обновляться от предыдущего значения соседних сообщений. Для обновления сообщений можно использовать различное планирование. В случае, когда графическая модель представляет собой дерево, оптимальное планирование сходится после вычисления каждого сообщения ровно один раз (см. следующий подраздел). Когда граф факторов имеет циклы, такого оптимального планирования не существует, и типичным выбором является обновление всех сообщений одновременно на каждой итерации.

После сходимости (если сходимость произошла) предполагаемое предельное распределение каждого узла пропорционально произведению всех сообщений от соседних факторов (без константы нормализации):

Аналогично, предполагаемое совместное предельное распределение набора переменных, принадлежащих одному фактору, пропорционально произведению фактора и сообщений от переменных:

В случае, когда граф факторов является ациклическим (т. е. представляет собой дерево или лес), эти оцененные маргинальные значения фактически сходятся к истинным маргинальным значениям за конечное число итераций. Это можно показать с помощью математической индукции .

Точный алгоритм для деревьев

[ редактировать ]

В случае, когда граф фактора представляет собой дерево , алгоритм распространения доверия вычисляет точные маргинальные значения. Более того, при правильном планировании обновлений сообщений они прекратятся после двух полных проходов по дереву. Оптимальное планирование можно описать следующим образом:

Прежде чем начать, граф ориентируется, назначая один узел корнем ; любой некорневой узел, который соединен только с одним другим узлом, называется листом .

На первом этапе сообщения передаются внутрь: начиная с листьев, каждый узел передает сообщение вдоль (уникального) края к корневому узлу. Древовидная структура гарантирует, что можно получить сообщения от всех других соседних узлов перед передачей сообщения дальше. Это продолжается до тех пор, пока корень не получит сообщения от всех соседних узлов.

Второй шаг включает передачу сообщений обратно: начиная с корня, сообщения передаются в обратном направлении. Алгоритм завершается, когда все листья получили свои сообщения.

Примерный алгоритм для общих графов

[ редактировать ]

Хотя алгоритм Belief Propagation изначально был разработан для ациклических графических моделей, его можно использовать и в общих графах . Алгоритм иногда называют циклическим распространением убеждений , поскольку графы обычно содержат циклы или циклы. Инициализацию и планирование обновлений сообщений необходимо немного скорректировать (по сравнению с ранее описанным расписанием для ациклических графов), поскольку графы могут не содержать листьев. Вместо этого все переменные сообщения инициализируются значением 1 и используются те же определения сообщений, что и выше, обновляя все сообщения на каждой итерации (хотя сообщения, поступающие из известных листьев или подграфов с древовидной структурой, могут больше не нуждаться в обновлении после достаточного количества итераций). Легко показать, что в дереве определения сообщений этой модифицированной процедуры будут сходиться к множеству определений сообщений, приведенному выше, за количество итераций, равное диаметру дерева .

Точные условия, при которых будет сходиться запутанное распространение убеждений, до сих пор не совсем понятны; известно, что на графах, содержащих одну петлю, она в большинстве случаев сходится, однако полученные вероятности могут быть неверными. [7] Существует несколько достаточных (но не необходимых) условий сходимости циклического распространения убеждений к единственной фиксированной точке. [8] Существуют графы, которые не могут сходиться или которые будут колебаться между несколькими состояниями при повторяющихся итерациях. Такие методы, как диаграммы EXIT, могут обеспечить приблизительную визуализацию хода распространения убеждений и приблизительный тест на сходимость.

Существуют и другие приближенные методы маргинализации, включая вариационные методы и методы Монте-Карло .

Один из методов точной маргинализации в общих графах называется алгоритмом дерева соединений , который представляет собой просто распространение убеждений на модифицированном графе, который гарантированно является деревом. Основная предпосылка заключается в устранении циклов путем их кластеризации в отдельные узлы.

[ редактировать ]

Подобный алгоритм обычно называют алгоритмом Витерби , но он также известен как частный случай алгоритма максимального произведения или минимальной суммы, который решает соответствующую проблему максимизации или наиболее вероятного объяснения. Вместо того, чтобы пытаться решить маргинальную задачу, цель здесь состоит в том, чтобы найти значения который максимизирует глобальную функцию (т.е. наиболее вероятные значения в вероятностных условиях), и его можно определить с помощью arg max :

Алгоритм, решающий эту проблему, почти идентичен алгоритму распространения убеждений, с заменой сумм в определениях на максимумы. [9]

Стоит отметить, что задачи вывода, такие как маргинализация и максимизация, NP-трудно решить точно и приблизительно (по крайней мере, для относительной ошибки ) в графической модели. Точнее, определенная выше проблема маргинализации является #P-полной , а максимизация — NP-полной .

Использование памяти для распространения убеждений можно уменьшить за счет использования алгоритма острова (при небольших затратах по времени).

Отношение к свободной энергии

[ редактировать ]

Алгоритм суммы произведений связан с расчетом свободной энергии в термодинамике . Пусть Z статистическая сумма . Распределение вероятностей

(согласно представлению факторного графа) можно рассматривать как меру внутренней энергии, присутствующей в системе, вычисляемую как

Тогда свободная энергия системы равна

Затем можно показать, что точки сходимости алгоритма суммы произведения представляют собой точки, в которых свободная энергия в такой системе минимизирована. Аналогично можно показать, что фиксированная точка итеративного алгоритма распространения доверия в графах с циклами является стационарной точкой аппроксимации свободной энергии. [10]

Обобщенное распространение убеждений (GBP)

[ редактировать ]

Алгоритмы распространения убеждений обычно представляются как уравнения обновления сообщений на графе факторов, включающие сообщения между узлами переменных и соседними узлами факторов и наоборот. Рассмотрение сообщений между регионами в графе — это один из способов обобщения алгоритма распространения доверия. [10] Существует несколько способов определения набора регионов в графе, которые могут обмениваться сообщениями. Один из методов использует идеи, представленные Кикучи в физической литературе. [11] [12] [13] Кикучи и известен как метод кластерных вариаций . [14]

Улучшения производительности алгоритмов распространения убеждений также можно достичь за счет нарушения симметрии реплик в распределениях полей (сообщений). Это обобщение приводит к новому виду алгоритма, называемому распространением опроса (SP), который оказался очень эффективным в NP-полных задачах, таких как выполнимость. [1] и раскраска графа .

Кластерный вариационный метод и алгоритмы распространения опросов — это два разных улучшения распространения убеждений. Имя «Распространение обобщенного опроса» (GSP) ожидает присвоения алгоритму, который объединяет оба обобщения.

Распространение убеждений по Гауссу (GaBP)

[ редактировать ]

Распространение убеждений по Гауссу — это вариант алгоритма распространения убеждений, когда базовые распределения являются гауссовскими . Первой работой, анализирующей эту специальную модель, была плодотворная работа Вайса и Фримена. [15]

Алгоритм GaBP решает следующую проблему маргинализации:

где Z — константа нормализации, A — симметричная положительно определенная матрица (обратная ковариационная матрица, также известная как матрица точности ), а b — вектор сдвига.

Эквивалентно можно показать, что с использованием модели Гаусса решение проблемы маргинализации эквивалентно задаче назначения MAP :

Эта задача также эквивалентна следующей задаче минимизации квадратичной формы:

Что также эквивалентно линейной системе уравнений

Сходимость алгоритма GaBP легче анализировать (по сравнению с общим случаем BP), и существуют два известных достаточных условия сходимости. Первый из них был сформулирован Weiss et al. в 2000 году, когда информационная матрица A доминирует по диагонали . Второе условие сходимости было сформулировано Джонсоном и др. [16] в 2006 г., когда спектральный радиус матрицы

где D = диаг( А ). Позже Су и Ву установили необходимые и достаточные условия сходимости для синхронного GaBP и затухающего GaBP, а также еще одно достаточное условие сходимости для асинхронного GaBP. Для каждого случая условие сходимости включает в себя проверку 1) непустости множества (определяемого A), 2) того, что спектральный радиус определенной матрицы меньше единицы, и 3) проблемы сингулярности (при преобразовании сообщения BP в доверие). ) не происходит. [17]

Алгоритм GaBP был связан с областью линейной алгебры, [18] и было показано, что алгоритм GaBP можно рассматривать как итерационный алгоритм решения линейной системы уравнений Ax = b , где A – информационная матрица, b – вектор сдвига. Эмпирически показано, что алгоритм GaBP сходится быстрее, чем классические итеративные методы, такие как метод Якоби, метод Гаусса-Зейделя , последовательная чрезмерная релаксация и другие. [19] Кроме того, показано, что алгоритм GaBP невосприимчив к численным проблемам метода предварительно обусловленных сопряженных градиентов. [20]

Декодирование АД по синдромам

[ редактировать ]

Предыдущее описание алгоритма BP называется декодированием на основе кодовых слов, которое вычисляет приблизительную предельную вероятность. , учитывая полученное кодовое слово . Существует эквивалентная форма, [21] которые вычисляют , где это синдром полученного кодового слова и это декодированная ошибка. Декодированный входной вектор . Это изменение лишь меняет интерпретацию функции масс . Явно сообщения

где - априорная вероятность ошибки для переменной

Этот синдромный декодер не требует информации о полученных битах, поэтому его можно адаптировать к квантовым кодам, где единственной информацией является синдром измерения.

В двоичном случае , эти сообщения можно упростить, чтобы вызвать экспоненциальное сокращение в сложности [22] [23]

Определите логарифмическое отношение правдоподобия , , затем

где

Апостериорное логарифмическое отношение правдоподобия можно оценить как

  1. ^ Перейти обратно: а б Браунштейн, А.; Мезар, М.; Зекчина, Р. (2005). «Распространение опроса: алгоритм выполнимости». Случайные структуры и алгоритмы . 27 (2): 201–226. arXiv : cs/0212002 . дои : 10.1002/rsa.20057 . S2CID   6601396 .
  2. ^ Перл, Иудея (1982). «Преподобный Байес о машинах вывода: распределенный иерархический подход» (PDF) . Материалы Второй национальной конференции по искусственному интеллекту . AAAI-82: Питтсбург, Пенсильвания . Менло-Парк, Калифорния: AAAI Press. стр. 133–136 . Проверено 28 марта 2009 г.
  3. ^ Ким, Джин Х.; Перл, Иудея (1983). «Вычислительная модель для комбинированных причинных и диагностических рассуждений в системах вывода» (PDF) . Материалы восьмой международной совместной конференции по искусственному интеллекту . IJCAI-83: ​​Карлсруэ, Германия . Том. 1. С. 190–193 . Проверено 20 марта 2016 г.
  4. ^ Перл, Иудея (1988). Вероятностные рассуждения в интеллектуальных системах: сети правдоподобного вывода (2-е изд.). Сан-Франциско, Калифорния: Морган Кауфманн. ISBN  978-1-55860-479-7 .
  5. ^ Едидия, Дж.С.; Фриман, WT; Ю. (январь 2003 г.). «Понимание распространения убеждений и его обобщений» . В Лакмейере, Герхард; Небель, Бернхард (ред.). Исследование искусственного интеллекта в новом тысячелетии . Морган Кауфманн. стр. 239–236. ISBN  978-1-55860-811-5 . Проверено 30 марта 2009 г.
  6. ^ Уэйнрайт, MJ; Джордан, Мичиган (2007). «2.1 Распределение вероятностей на графиках». Графические модели, экспоненциальные семейства и вариационный вывод . Основы и тенденции в машинном обучении. Том. 1. С. 5–9. дои : 10.1561/2200000001 .
  7. ^ Вайс, Яир (2000). «Корректность распространения локальной вероятности в графических моделях с циклами». Нейронные вычисления . 12 (1): 1–41. дои : 10.1162/089976600300015880 . ПМИД   10636932 . S2CID   15402308 .
  8. ^ Муидж, Дж; Каппен, Х (2007). «Достаточные условия сходимости алгоритма суммы – произведения». Транзакции IEEE по теории информации . 53 (12): 4422–4437. arXiv : cs/0504030 . дои : 10.1109/TIT.2007.909166 . S2CID   57228 .
  9. ^ Лёлигер, Ханс-Андреа (2004). «Введение в факторные графы». Журнал обработки сигналов IEEE . 21 (1): 28–41. Бибкод : 2004ISPM...21...28L . дои : 10.1109/msp.2004.1267047 . S2CID   7722934 .
  10. ^ Перейти обратно: а б Едидия, Дж.С.; Фриман, WT; Вайс, Ю.; Ю. (июль 2005 г.). «Построение аппроксимаций свободной энергии и обобщенных алгоритмов распространения убеждений» . Транзакции IEEE по теории информации . 51 (7): 2282–2312. CiteSeerX   10.1.1.3.5650 . дои : 10.1109/TIT.2005.850085 . S2CID   52835993 . Проверено 28 марта 2009 г.
  11. ^ Кикучи, Рёичи (15 марта 1951 г.). «Теория кооперативных явлений». Физический обзор . 81 (6): 988–1003. Бибкод : 1951PhRv...81..988K . дои : 10.1103/PhysRev.81.988 .
  12. ^ Курата, Мичио; Кикучи, Рёичи; Ватари, Тацуро (1953). «Теория кооперативных явлений. III. Подробное обсуждение метода кластерной вариации» . Журнал химической физики . 21 (3): 434–448. Бибкод : 1953ЖЧФ..21..434К . дои : 10.1063/1.1698926 .
  13. ^ Кикучи, Рёичи; Браш, Стивен Г. (1967). «Усовершенствование метода кластерной вариации». Журнал химической физики . 47 (1): 195–203. Бибкод : 1967ЖЧФ..47..195К . дои : 10.1063/1.1711845 .
  14. ^ Пелиццола, Алессандро (2005). «Кластерный вариационный метод в статистической физике и вероятностных графических моделях». Журнал физики A: Математический и общий . 38 (33): Р309–Р339. arXiv : cond-mat/0508216 . Бибкод : 2005JPhA...38R.309P . дои : 10.1088/0305-4470/38/33/R01 . ISSN   0305-4470 . S2CID   942 .
  15. ^ Вайс, Яир; Фриман, Уильям Т. (октябрь 2001 г.). «Правильность распространения убеждений в гауссовских графических моделях произвольной топологии». Нейронные вычисления . 13 (10): 2173–2200. CiteSeerX   10.1.1.44.794 . дои : 10.1162/089976601750541769 . ПМИД   11570995 . S2CID   10624764 .
  16. ^ Малютов Дмитрий М.; Джонсон, Джейсон К.; Уиллски, Алан С. (октябрь 2006 г.). «Прогулочные суммы и распространение убеждений в гауссовских графических моделях» . Журнал исследований машинного обучения . 7 : 2031–2064 . Проверено 28 марта 2009 г.
  17. ^ Су, Циньлян; Ву, Йик-Чунг (март 2015 г.). «Об условиях сходимости гауссовского распространения убеждений». IEEE Транс. Сигнальный процесс. 63 (5): 1144–1155. Бибкод : 2015ITSP...63.1144S . дои : 10.1109/TSP.2015.2389755 . S2CID   12055229 .
  18. ^ Решатель гауссовского распространения доверия для систем линейных уравнений. О. Шентал, Д. Биксон, П. Х. Сигел, Дж. К. Вольф и Д. Долев, IEEE Int. Симп. на Информ. Theory (ISIT), Торонто, Канада, июль 2008 г. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/. Архивировано 14 июня 2011 г. в Wayback Machine.
  19. ^ Линейное обнаружение посредством распространения убеждений. Дэнни Биксон, Дэнни Долев, Ори Шентал, Пол Х. Сигел и Джек К. Вольф. На 45-й ежегодной Аллертонской конференции по коммуникациям, управлению и вычислениям, Аллертон-Хаус, Иллинойс, 7 сентября. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/ Архивировано 14 июня 2011 г. на сайте машина обратного пути
  20. ^ Максимизация возможностей распределенной крупномасштабной сети. Д. Биксон, Ю. Ток, А. Зимнис, С. Бойд и Д. Долев. На Международном симпозиуме по теории информации (ISIT), июль 2009 г. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/. Архивировано 14 июня 2011 г. в Wayback Machine.
  21. ^ Дэйв, Маулик А. (1 декабря 2006 г.). «Обзор книги Дэвида Дж. Маккея «Теория информации, вывода и алгоритмов обучения», Cambridge University Press, 2003». Новости ACM SIGACT . 37 (4): 34–36. дои : 10.1145/1189056.1189063 . ISSN   0163-5700 . S2CID   10570465 .
  22. ^ Филлер, Томас (17 ноября 2009 г.). «Упрощение алгоритма распространения убеждений» (PDF) .
  23. ^ Лю, Е-Хуа; Пулен, Давид (22 мая 2019 г.). «Нейронные декодеры распространения убеждений для квантовых кодов, исправляющих ошибки». Письма о физических отзывах . 122 (20): 200501. arXiv : 1811.07835 . doi : 10.1103/physrevlett.122.200501 . ISSN   0031-9007 . ПМИД   31172756 . S2CID   53959182 .

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a2418629a6d5fc506c1ccd3ca432d61b__1721278200
URL1:https://arc.ask3.ru/arc/aa/a2/1b/a2418629a6d5fc506c1ccd3ca432d61b.html
Заголовок, (Title) документа по адресу, URL1:
Belief propagation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)