Jump to content

Модульность (сети)

Пример измерения и раскраски модульности на безмасштабной сети .

Модульность — это мера структуры сетей или графов , которая измеряет силу разделения сети на модули (также называемые группами, кластерами или сообществами). Сети с высокой модульностью имеют плотные связи между узлами внутри модулей, но разреженные связи между узлами в разных модулях. Модульность часто используется в методах оптимизации для определения структуры сообщества в сетях. Биологические сети, включая мозг животных, демонстрируют высокую степень модульности. Однако максимизация модульности не является статистически последовательной и находит сообщества в своей собственной нулевой модели, то есть в полностью случайных графах, и поэтому ее нельзя использовать для поиска статистически значимых структур сообществ в эмпирических сетях. Более того, было показано, что модульность имеет ограничение по разрешению и, следовательно, не может обнаруживать небольшие сообщества.

Мотивация [ править ]

Многие важные с научной точки зрения проблемы можно представить и эмпирически изучить с помощью сетей. Например, биологические и социальные закономерности, Всемирная паутина, метаболические сети, пищевые сети, нейронные сети и патологические сети — это проблемы реального мира, которые можно математически представить и топологически изучить, чтобы выявить некоторые неожиданные структурные особенности. [1] Большинство этих сетей обладают определенной структурой сообщества, которая имеет существенное значение для понимания динамики сети. Например, тесно связанное социальное сообщество будет подразумевать более высокую скорость передачи информации или слухов между ними, чем слабо связанное сообщество. Таким образом, если сеть представлена ​​множеством отдельных узлов, соединенных связями, обозначающими определенную степень взаимодействия между узлами, сообщества определяются как группы тесно связанных между собой узлов, которые лишь редко связаны с остальной частью сети. Следовательно, может оказаться необходимым идентифицировать сообщества в сетях, поскольку сообщества могут иметь совершенно разные свойства, такие как степень узла, коэффициент кластеризации, взаимосвязь, центральность и т. д. [2] и т. д., от средней сети. Модульность — одна из таких мер, максимизация которой приводит к появлению сообществ в данной сети.

Определение [ править ]

Модульность — это доля ребер, попадающих в заданные группы, за вычетом ожидаемой доли, если ребра были распределены случайным образом. Значение модульности для невзвешенных и неориентированных графов лежит в пределах . [3] Положительно, если количество ребер внутри групп превышает количество, ожидаемое на основе случайности. При заданном разделении вершин сети на несколько модулей модульность отражает концентрацию ребер внутри модулей по сравнению со случайным распределением связей между всеми узлами независимо от модулей.

Существуют разные методы расчета модульности. [1] В наиболее распространенной версии концепции рандомизация ребер выполняется так, чтобы сохранить степень каждой вершины. Рассмотрим график с узлы и ссылки ( ребра ) такие, что граф можно разделить на два сообщества с помощью переменной членства . Если узел принадлежит к сообществу 1, , или если принадлежит к сообществу 2, . Пусть матрица смежности сети представлена ​​в виде , где означает, что между узлами нет края (нет взаимодействия) и и означает, что между ними есть грань. Также для простоты мы рассматриваем ненаправленную сеть. Таким образом . (Важно отметить, что между двумя узлами может существовать несколько ребер, но здесь мы рассматриваем простейший случай).

Модульность затем определяется как доля ребер, попадающих в группу 1 или 2, минус ожидаемое количество ребер в группах 1 и 2 для случайного графа с тем же распределением степеней узлов, что и в данной сети.

Ожидаемое количество ребер должно рассчитываться с использованием концепции модели конфигурации . [4] Модель конфигурации представляет собой рандомизированную реализацию конкретной сети. Учитывая сеть с узлы, где каждый узел имеет степень узла модель конфигурации разрезает каждое ребро на две половины, а затем каждое полуребро, называемое шлейфом , случайным образом переподключается к любому другому шлейфу в сети, даже допуская самозацикливания (которые возникают, когда шлейф переподключается к другому шлейфу из сети). тот же узел) и кратные ребра между одними и теми же двумя узлами. Таким образом, даже несмотря на то, что распределение степеней узлов графа остается неизменным, модель конфигурации приводит к полностью случайной сети.

Ожидаемое количество ребер между узлами [ править ]

Теперь рассмотрим два узла и , со степенями узла и соответственно, из случайно перемонтированной сети, как описано выше. Мы вычисляем ожидаемое количество полных ребер между этими узлами.

Рассмотрим каждый из заглушки узла и создадим связанные переменные индикатора для них, , с если -th заглушка подключается к одному из заглушки узла в этом конкретном случайном графе. Если это не так, то . Поскольку -я заглушка узла можно подключиться к любому из оставшиеся заглушки с равной вероятностью (при этом — количество ребер в исходном графе), и поскольку существуют заглушки, к которым он может подключиться, связанные с узлом , очевидно

Общее количество полных ребер между и это просто , поэтому ожидаемое значение этой величины равно

Во многих текстах затем делаются следующие приближения для случайных сетей с большим количеством ребер. Когда велико, они опускают вычитание в знаменателе выше и просто используйте приближенное выражение для ожидаемого количества ребер между двумя узлами. Кроме того, в большой случайной сети количество петель и мультиребер исчезающе мало. [5] Игнорирование петель и мультиребер позволяет предположить, что между любыми двумя узлами существует не более одного ребра. В этом случае становится бинарной индикаторной переменной, поэтому ее ожидаемое значение также является вероятностью того, что она равна , что означает, что можно аппроксимировать вероятность существования ребра между узлами и как .

Модульность [ править ]

Следовательно, разница между фактическим количеством ребер между узлами и и ожидаемое количество ребер между ними равно

Суммирование по всем парам узлов дает уравнение модульности: . [1]

( 3 )

Важно отметить, что уравнение. 3 справедлив только для разделения на два сообщества. Иерархическое разделение (т.е. разделение на два сообщества, затем два подсообщества дополнительно разделяются на два меньших подсообщества только для максимизации Q ) является возможным подходом для идентификации нескольких сообществ в сети. Кроме того, (3) можно обобщить для разделения сети на c- сообщества. [6]

( 4 )

где eij сообществе — доля ребер, у которых одна концевая вершина находится в сообществе i , а другая — в j :

и a i — это доля концов ребер, прикрепленных к вершинам в сообществе i :

Пример обнаружения нескольких сообществ [ править ]

Мы рассматриваем неориентированную сеть с 10 узлами и 12 ребрами и следующей матрицей смежности.

Рис. 1. Пример сети, соответствующей матрице смежности с 10 узлами и 12 ребрами.
Рис. 2. Разделы сети, максимизирующие Q. Максимум Q=0,4896
Идентификатор узла 1 2 3 4 5 6 7 8 9 10
1 0 1 1 0 0 0 0 0 0 1
2 1 0 1 0 0 0 0 0 0 0
3 1 1 0 0 0 0 0 0 0 0
4 0 0 0 0 1 1 0 0 0 1
5 0 0 0 1 0 1 0 0 0 0
6 0 0 0 1 1 0 0 0 0 0
7 0 0 0 0 0 0 0 1 1 1
8 0 0 0 0 0 0 1 0 1 0
9 0 0 0 0 0 0 1 1 0 0
10 1 0 0 1 0 0 1 0 0 0

Сообщества на графике представлены красными, зелеными и синими кластерами узлов на рис. 1. Оптимальные разделы сообществ изображены на рис. 2.

Формулировка матрицы [ править ]

Альтернативная формулировка модульности, особенно полезная в алгоритмах спектральной оптимизации, заключается в следующем. [1] Определять быть если вершина принадлежит к группе и в противном случае. Затем

и, следовательно,

где это (неквадратная) матрица, имеющая элементы и – это так называемая матрица модульности, состоящая из элементов

Сумма всех строк и столбцов матрицы модульности равна нулю, что означает, что модульность неразделенной сети также всегда равна нулю. .

Для сетей, разделенных всего на два сообщества, можно альтернативно определить чтобы указать сообщество, к какому узлу принадлежит, что затем приводит к

где вектор-столбец с элементами . [1]

Эта функция имеет ту же форму, что и гамильтониан Изинга спинового стекла , связь, которая использовалась для создания простых компьютерных алгоритмов, например, с использованием моделирования отжига , чтобы максимизировать модульность. Общая форма модулярности для произвольного числа сообществ эквивалентна спиновому стеклу Поттса, и аналогичные алгоритмы могут быть разработаны и для этого случая. [7]

Переоснащение [ править ]

Хотя метод максимизации модульности основан на вычислении отклонения от нулевой модели, это отклонение не вычисляется статистически последовательным образом. [8] Из-за этого метод, как известно, находит сообщества с высокими оценками в своей собственной нулевой модели. [9] (модель конфигурации), которая по определению не может быть статистически значимой. Из-за этого метод не может быть использован для достоверного получения статистически значимой структуры сообщества в эмпирических сетях.

Предел разрешения [ править ]

Модульность сравнивает количество ребер внутри кластера с ожидаемым количеством ребер, которыеможно было бы найти в кластере, если бы сеть была случайной сетью с одинаковым количеством узлов и гдекаждый узел сохраняет свою степень, но в противном случае ребра присоединяются случайным образом. Эта случайная нулевая модель неявно предполагает, что каждый узел может быть присоединен к любому другому узлу сети. Однако это предположение необоснованно, если сеть очень велика, поскольку горизонт узла включает небольшую часть сети, игнорируя большую ее часть.Более того, это означает, что ожидаемое количество ребер между двумя группами узлов уменьшается, если размер сети увеличивается. Таким образом, если сеть достаточно велика, ожидаемое количество ребер между двумя группами узлов в нулевой модели модульности может быть меньше одного. Если это произойдет, единственное ребро между двумя кластерами будет интерпретировано модульностью как признак сильной корреляции между двумя кластерами, а оптимизация модульности приведет к слиянию двух кластеров независимо от их особенностей. Таким образом, даже слабосвязанные полные графы, которые имеют максимально возможную плотность внутренних ребер и представляют собой наиболее идентифицируемые сообщества, были бы объединены посредством оптимизации модульности, если бы сеть была достаточно большой. [10] По этой причине оптимизация модульности в больших сетях не сможет решить проблему небольших сообществ, даже если они четко определены. Эта предвзятостьнеизбежно для таких методов, как оптимизация модульности, которые полагаются на глобальную нулевую модель. [11]

Методы мультиразрешения [ править ]

Существует два основных подхода, которые пытаются решить предел разрешения в контексте модульности: добавление сопротивления r к каждому узлу в форме замкнутого контура , которое увеличивается ( r>0 ) или уменьшается ( r<0 ). неприятие узлов для формирования сообществ; [12] или добавление параметра γ>0 перед нулевым термином в определении модульности, который контролирует относительную важность между внутренними связями сообществ и нулевой моделью. [7] Оптимизируя модульность значений этих параметров в соответствующих диапазонах, можно восстановить весь мезоуровень сети: от макроуровня, в котором все узлы принадлежат одному и тому же сообществу, до микроуровня, в котором каждый узел образует свое собственное сообщество. отсюда и название «методы мультиразрешения» . Однако было показано, что эти методы имеют ограничения, когда сообщества очень неоднородны по размеру. [13]

Программные инструменты [ править ]

Существует несколько программных инструментов, которые способны вычислять кластеризацию в графах с хорошей модульностью.

Оригинальная реализация многоуровневого метода Лувена . [14]

Алгоритм Лейдена , который дополнительно позволяет избежать несвязанных сообществ. [15]

Алгоритм кластеризации венских графов (VieClus), параллельный меметический алгоритм. [16]

См. также [ править ]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б с д и Ньюман, МЕДЖ (2006). «Модульность и структура сообщества в сетях» . Труды Национальной академии наук Соединенных Штатов Америки . 103 (23): 8577–8696. arXiv : физика/0602124 . Бибкод : 2006PNAS..103.8577N . дои : 10.1073/pnas.0601602103 . ПМЦ   1482622 . ПМИД   16723398 .
  2. ^ Ньюман, МЭД (2007). Пэлгрейв Макмиллан, Бейзингсток (ред.). «Математика сетей». Экономическая энциклопедия Нью-Пэлгрейва (2-е изд.).
  3. ^ Брандес, Ю. ; Деллинг, Д.; Гертлер, М.; Горке, Р.; Хофер, М.; Николоски, З.; Вагнер, Д. (февраль 2008 г.). «О модульной кластеризации» . Транзакции IEEE по знаниям и инженерии данных . 20 (2): 172–188. дои : 10.1109/TKDE.2007.190689 . S2CID   150684 .
  4. ^ ван дер Хофстад, Ремко (2013). «Глава 7» (PDF) . Случайные графы и сложные сети . Архивировано (PDF) из оригинала 18 декабря 2013 г. Проверено 8 декабря 2013 г.
  5. ^ «Сетевая наука» . Альберт-Ласло Барабаши. Архивировано из оригинала 5 марта 2020 г. Проверено 20 марта 2020 г.
  6. ^ Клаузе, Аарон и Ньюман, МЭЖ и Мур, Кристофер (2004). «Нахождение структуры сообщества в очень больших сетях». Физ. Преподобный Е. 70 (6): 066111. arXiv : cond-mat/0408187 . Бибкод : 2004PhRvE..70f6111C . дои : 10.1103/PhysRevE.70.066111 . ПМИД   15697438 . S2CID   8977721 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  7. Перейти обратно: Перейти обратно: а б Йорг Райхардт и Стефан Борнхольдт (2006). «Статистическая механика обнаружения сообществ». Физический обзор E . 74 (1): 016110. arXiv : cond-mat/0603718 . Бибкод : 2006PhRvE..74a6110R . дои : 10.1103/PhysRevE.74.016110 . ПМИД   16907154 . S2CID   792965 .
  8. ^ Пейшото, Тьяго П. (2021). «Описательное и интеллектуальное обнаружение сообщества: ловушки, мифы и полуправда». arXiv : 2112.00183 .
  9. ^ Гимера, Роджер; Салес-Пардо, Марта (19 августа 2004 г.), «Модульность от флуктуаций в случайных графах и сложных сетях», Physical Review , 70 (2): 025101, arXiv : cond-mat/0403660 , Bibcode : 2004PhRvE..70b5101G , doi : 10.1103/PhysRevE.70.025101 , PMC   2441765 , PMID   15447530
  10. ^ Санто Фортунато и Марк Бартелеми (2007). «Предел разрешения при обнаружении сообщества» . Труды Национальной академии наук Соединенных Штатов Америки . 104 (1): 36–41. arXiv : физика/0607100 . Бибкод : 2007PNAS..104...36F . дои : 10.1073/pnas.0605965104 . ПМЦ   1765466 . ПМИД   17190818 .
  11. ^ Дж. М. Кумпула; Дж. Сарамяки; К. Каски и Дж. Кертес (2007). «Ограниченное разрешение при обнаружении сложных сетевых сообществ с использованием подхода модели Поттса». Европейский физический журнал Б. 56 (1): 41–45. arXiv : cond-mat/0610370 . Бибкод : 2007EPJB...56...41K . дои : 10.1140/epjb/e2007-00088-4 . S2CID   4411525 .
  12. ^ Алекс Аренас, Альберто Фернандес и Серхио Гомес (2008). «Анализ структуры сложных сетей на разных уровнях разрешения». Новый журнал физики . 10 (5): 053039. arXiv : физика/0703218 . Бибкод : 2008NJPh...10e3039A . дои : 10.1088/1367-2630/10/5/053039 . S2CID   11544197 .
  13. ^ Андреа Ланчикинетти и Санто Фортунато (2011). «Пределы максимизации модульности при обнаружении сообществ». Физический обзор E . 84 (6): 066122. arXiv : 1107.1155 . Бибкод : 2011PhRvE..84f6122L . дои : 10.1103/PhysRevE.84.066122 . ПМИД   22304170 . S2CID   16180375 .
  14. ^ Первая реализация алгоритма Лувена , заархивировано из оригинала 17 марта 2021 г. , получено 30 ноября 2020 г.
  15. ^ Репозиторий лейденских алгоритмов , 15 декабря 2021 г., заархивировано из оригинала 26 ноября 2020 г. , получено 30 ноября 2020 г.
  16. ^ Репозиторий кластеризации графов Вены , 13 апреля 2021 г., заархивировано из оригинала 21 октября 2020 г. , получено 30 ноября 2020 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 02d17c302475fc75288957fc199e361b__1717243080
URL1:https://arc.ask3.ru/arc/aa/02/1b/02d17c302475fc75288957fc199e361b.html
Заголовок, (Title) документа по адресу, URL1:
Modularity (networks) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)