Случайное блуждание с максимальной энтропией
Случайное блуждание с максимальной энтропией ( MERW ) — популярный тип смещенного случайного блуждания по графу , в котором вероятности перехода выбираются в соответствии с принципом максимальной энтропии , который гласит, что распределение вероятностей , которое лучше всего представляет текущее состояние знаний, является тем, которое с наибольшей энтропией. В то время как стандартное случайное блуждание выбирает для каждой вершины равномерное распределение вероятностей среди ее исходящих ребер, локально максимизируя уровень энтропии , MERW максимизирует его глобально (среднее производство энтропии ), предполагая равномерное распределение вероятностей среди всех путей в данном графе.
MERW используется в различных областях науки. Прямое применение — это выбор вероятностей для максимизации скорости передачи через ограниченный канал, аналогично кодированию Фибоначчи . Его свойства также сделали его полезным, например, при анализе сложных сетей. [1] например, прогнозирование ссылок , [2] обнаружение сообщества, [3] надежная транспортировка по сетям [4] и меры центральности . [5] Также при анализе изображений , например, для обнаружения областей визуальной значимости, [6] локализация объекта, [7] обнаружение взлома [8] или проблема с трактографией . [9]
Кроме того, он воссоздает некоторые свойства квантовой механики , предлагая способ исправить несоответствие между моделями диффузии и квантовыми предсказаниями, например, локализацию Андерсона . [10]
Базовая модель
[ редактировать ]Рассмотрим график с вершины, определяемые матрицей смежности : если есть ребро из вершины к , 0 в противном случае. Для простоты предположим, что это неориентированный граф , соответствующий симметричному ; однако MERW также можно обобщить для ориентированных и взвешенных графов (например, распределение Больцмана по путям вместо равномерного).
на этом графе мы хотели бы выбрать случайное блуждание В качестве марковского процесса : для каждой вершины и его исходящий край , выберите вероятность ходока, случайно воспользовавшегося этим краем после посещения . Формально, найдите стохастическую матрицу (содержащий вероятности перехода цепи Маркова) такие, что
- для всех и
- для всех .
Предполагая, что этот граф связен, а не периодичен , эргодическая теория утверждает, что эволюция этого случайного процесса приводит к некоторому стационарному распределению вероятностей. такой, что .
Используя энтропию Шеннона для каждой вершины и усредняя вероятность посещения этой вершины (чтобы иметь возможность использовать ее энтропию), мы получаем следующую формулу для среднего производства энтропии ( скорости энтропии ) случайного процесса:
Это определение оказывается эквивалентным асимптотической средней энтропии (на длину) распределения вероятностей в пространстве путей для этого случайного процесса.
В стандартном случайном блуждании, называемом здесь общим случайным блужданием (GRW), мы естественным образом выбираем, чтобы каждое исходящее ребро было равновероятным:
- .
Для симметричного это приводит к стационарному распределению вероятностей с
- .
Он локально максимизирует производство энтропии (неопределенность) для каждой вершины, но обычно приводит к неоптимальному среднему глобальному уровню энтропии. .
MERW выбирает стохастическую матрицу, которая максимизирует или, что то же самое, предполагает равномерное распределение вероятностей среди всех путей в данном графе. Его формула получается путем предварительного вычисления доминирующего собственного значения. и соответствующий собственный вектор матрицы смежности, т.е. наибольшая с соответствующими такой, что . Тогда стохастическая матрица и стационарное распределение вероятностей имеют вид
для которого каждый возможный путь длины из -th к -я вершина имеет вероятность
- .
Его уровень энтропии и стационарное распределение вероятностей является
- .
В отличие от GRW, вероятности перехода MERW обычно зависят от структуры всего графа (являются нелокальными). Следовательно, не следует представлять, что их непосредственно применяет ходок — если решения принимаются случайным образом, исходя из местной ситуации, как это сделал бы человек, подход GRW более уместен. MERW основан на принципе максимальной энтропии, что делает его самым безопасным предположением, когда у нас нет каких-либо дополнительных знаний о системе. Например, это было бы уместно для моделирования наших знаний об объекте, выполняющем некоторую сложную динамику – не обязательно случайную, как частица.
Эскиз вывода
[ редактировать ]Предположим для простоты, что рассматриваемый граф является ненаправленным, связным и апериодическим, что позволяет из теоремы Перрона–Фробениуса сделать вывод о единственности доминирующего собственного вектора. Следовательно может быть асимптотически ( ) аппроксимируется (или в обозначениях бра-кет ).
MERW требует равномерного распределения по путям. Число путей длиной и вершина в центре есть
- ,
следовательно, для всех ,
- .
Аналогично вычисляя распределение вероятностей для двух последовательных вершин, получаем, что вероятность оказаться в вершине -я вершина и следующая за ней -я вершина
- .
Разделив на вероятность оказаться на -я вершина, т.е. , дает условную вероятность принадлежащий -я вершина, следующая после -я вершина
- .
Взвешенный MERW: ансамбль путей Больцмана
[ редактировать ]Мы предположили, что для MERW, соответствующего однородному ансамблю путей. Однако приведенный выше вывод работает для действительных неотрицательных . Параметризация и запрашиваем вероятность длины путь , мы получаем:
Как и в распределении путей Больцмана для энергии, определяемом как сумма по заданному пути. Например, это позволяет рассчитать распределение вероятностей закономерностей в модели Изинга .
Примеры
[ редактировать ]Давайте сначала рассмотрим простую нетривиальную ситуацию: кодирование Фибоначчи, когда мы хотим передать сообщение в виде последовательности 0 и 1, но не используя две последовательные единицы: после 1 должен быть 0. Чтобы максимизировать количество информации, передаваемой в такой последовательности, следует предположить равномерное распределение вероятностей в пространстве всех возможных последовательностей, удовлетворяющих этому ограничению. Чтобы практически использовать такие длинные последовательности, после 1 приходится использовать 0, но остается свобода выбора вероятности 0 после 0. Обозначим эту вероятность через , то энтропийное кодирование позволит закодировать сообщение, используя выбранное распределение вероятностей. Стационарное распределение вероятностей символов для заданного оказывается . Следовательно, производство энтропии , который максимизируется для , известное как золотое сечение . Напротив, стандартное случайное блуждание выберет неоптимальный вариант. . Выбирая больший уменьшает количество информации, производимой после 0, а также уменьшает частоту 1, после чего мы не можем записать какую-либо информацию.
Более сложным примером является дефектная одномерная циклическая решетка: скажем, 1000 узлов соединены в кольцо, для которого все узлы, кроме дефектов, имеют петлю (ребро к себе). В стандартном случайном блуждании (GRW) стационарное распределение вероятностей будет иметь вероятность дефекта, составляющую 2/3 от вероятности вершин без дефектов - локализация почти отсутствует, также аналогично стандартной диффузии, которая является бесконечно малым пределом GRW. Для MERW нам нужно сначала найти доминирующий собственный вектор матрицы смежности – максимизируя в:
на все позиции , где за дефекты, 0 в противном случае. Замена и умножив уравнение на −1, получим:
где теперь минимизируется, становясь аналогом энергии. Формула внутри скобок представляет собой дискретный оператор Лапласа , что делает это уравнение дискретным аналогом стационарного уравнения Шредингера . Как и в квантовой механике, MERW предсказывает, что распределение вероятностей должно приводить точно к основному квантовому состоянию : с его сильно локализованной плотностью (в отличие от стандартной диффузии). Принимая бесконечно малый предел, мы можем получить стандартное непрерывное стационарное (независимое от времени) уравнение Шредингера ( для ) здесь. [11]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Синатра, Роберта; Гомес-Гарденьес, Хесус; Ламбьотт, Рено; Никосия, Винченцо; Латора, Вито (2011). «Случайные блуждания с максимальной энтропией в сложных сетях с ограниченной информацией» (PDF) . Физический обзор E . 83 (3): 030103. arXiv : 1007.4936 . Бибкод : 2011PhRvE..83c0103S . дои : 10.1103/PhysRevE.83.030103 . ISSN 1539-3755 . ПМИД 21517435 . S2CID 6984660 .
- ^ Ли, Ронг-Хуа; Ю, Джеффри Сюй; Лю, Цзяньцюань (2011). Прогнозирование ссылок: мощность случайного блуждания с максимальной энтропией (PDF) . Конференция Ассоциации вычислительной техники по управлению информацией и знаниями . п. 1147. дои : 10.1145/2063576.2063741 . S2CID 15309519 . Архивировано из оригинала (PDF) 12 февраля 2017 года.
- ^ Охаб, Дж. К.; Бурда, З. (2013). «Случайное блуждание с максимальной энтропией при обнаружении сообществ». Специальные темы Европейского физического журнала . 216 (1): 73–81. arXiv : 1208.3688 . Бибкод : 2013EPJST.216...73O . doi : 10.1140/epjst/e2013-01730-6 . ISSN 1951-6355 . S2CID 56409069 .
- ^ Чен, Ю.; Георгиу, ТТ; Павон, М.; Танненбаум, А. (2016). «Надежная транспортировка по сетям» . Транзакции IEEE при автоматическом управлении . 62 (9): 4675–4682. arXiv : 1603.08129 . Бибкод : 2016arXiv160308129C . дои : 10.1109/TAC.2016.2626796 . ПМК 5600536 . ПМИД 28924302 .
- ^ Дельвенн, Жан-Шарль; Либерт, Анн-Софи (2011). «Меры центральности и термодинамический формализм для сложных сетей». Физический обзор E . 83 (4): 046117. arXiv : 0710.3972 . Бибкод : 2011PhRvE..83d6117D . дои : 10.1103/PhysRevE.83.046117 . ISSN 1539-3755 . ПМИД 21599250 . S2CID 25816198 .
- ^ Джин-Ганг Ю; Цзи Чжао; Цзиньвэнь Тянь; Ихуа Тан (2014). «Случайное блуждание с максимальной энтропией для визуальной значимости на основе регионов». Транзакции IEEE по кибернетике . 44 (9). Институт инженеров по электротехнике и электронике (IEEE): 1661–1672. дои : 10.1109/tcyb.2013.2292054 . ISSN 2168-2267 . ПМИД 25137693 . S2CID 20962642 .
- ^ Л. Ван, Дж. Чжао, С. Ху, Дж. Лу, Локализация объектов со слабым контролем посредством случайного блуждания с максимальной энтропией , ICIP, 2014.
- ^ Корус, Павел; Хуан, Цзиу (2016). «Улучшенная локализация взлома в криминалистике цифровых изображений на основе случайного блуждания с максимальной энтропией». Письма об обработке сигналов IEEE . 23 (1). Институт инженеров по электротехнике и электронике (IEEE): 169–173. Бибкод : 2016ISPL...23..169K . дои : 10.1109/lsp.2015.2507598 . ISSN 1070-9908 . S2CID 16305991 .
- ^ Галинский Виталий Леонидович; Фрэнк, Лоуренс Р. (2015). «Одновременная многомасштабная оценка диффузии и трактография, управляемая путями энтропийного спектра» . Транзакции IEEE по медицинской визуализации . 34 (5). Институт инженеров по электротехнике и электронике (IEEE): 1177–1193. дои : 10.1109/tmi.2014.2380812 . ISSN 0278-0062 . ПМЦ 4417445 . ПМИД 25532167 .
- ^ Бурда, З.; Дуда, Дж.; Удача, Дж. М.; Вацлав, Б. (23 апреля 2009 г.). «Локализация случайного блуждания с максимальной энтропией». Письма о физических отзывах . 102 (16): 160602. arXiv : 0810.4113 . Бибкод : 2009PhRvL.102p0602B . дои : 10.1103/physrevlett.102.160602 . ISSN 0031-9007 . ПМИД 19518691 . S2CID 32134048 .
- ^ Дж. Дуда, Случайное блуждание с расширенной максимальной энтропией , докторская диссертация, 2012.
Внешние ссылки
[ редактировать ]- Габор Симони, Ю. Линь, З. Чжан, «Среднее время первого прохождения для случайных блужданий с максимальной энтропией в сложных сетях» . Научные отчеты, 2014.
- Модели электронной проводимости с использованием случайных блужданий с максимальной энтропией. Демонстрационный проект Wolfram