Структура сообщества
Часть серии о | ||||
Сетевая наука | ||||
---|---|---|---|---|
Типы сетей | ||||
Графики | ||||
| ||||
Модели | ||||
| ||||
| ||||
При изучении сложных сетей говорят, что сеть имеет структуру сообщества , если узлы сети можно легко сгруппировать в (потенциально перекрывающиеся) наборы узлов так, что каждый набор узлов внутренне плотно связан. В частном случае поиска непересекающихся сообществ это означает, что сеть естественным образом делится на группы узлов с плотными внутренними связями и более редкими связями между группами. Но перекрывающиеся допускаются и сообщества. Более общее определение основано на том принципе, что пары узлов с большей вероятностью будут соединены, если они оба являются членами одного и того же сообщества (сообществ), и с меньшей вероятностью будут связаны, если они не имеют общих сообществ. Связанная, но другая проблема — это поиск сообществ , цель которого — найти сообщество, которому принадлежит определенная вершина.
Свойства [ править ]

При изучении сетей , таких как компьютерные и информационные сети, социальные сети и биологические сети, было обнаружено, что обычно встречается ряд различных характеристик, в том числе свойство маленького мира , с тяжелым хвостом распределения степеней и кластеризация , среди других. Еще одной общей характеристикой является структура сообщества. [1] [2] [3] [4] [5] В контексте сетей структура сообщества относится к появлению в сети групп узлов, которые более тесно связаны внутри, чем с остальной частью сети, как показано на примере изображения справа. Эта неоднородность связей предполагает, что сеть имеет определенные естественные подразделения внутри нее.
Сообщества часто определяются с точки зрения разделения множества вершин, то есть каждый узел помещается в одно и только одно сообщество, как показано на рисунке. Это полезное упрощение, и большинство методов обнаружения сообществ обнаруживают именно такой тип структуры сообщества. Однако в некоторых случаях лучшим представлением может быть такое, когда вершины принадлежат более чем одному сообществу. Это может произойти в социальной сети, где каждая вершина представляет человека, а сообщества представляют разные группы друзей: одно сообщество для семьи, другое для коллег, третье для друзей в одном спортивном клубе и так далее. Использование клик для обнаружения сообществ , обсуждаемое ниже, является лишь одним из примеров того, как можно найти такую перекрывающуюся структуру сообщества.
Некоторые сети могут не иметь значимой структуры сообщества. Многие базовые сетевые модели, например, такие как случайный граф и модель Барабаши-Альберта , не отображают структуру сообщества.
Важность [ править ]
Структуры сообществ довольно распространены в реальных сетях. Социальные сети включают группы сообществ (фактически, происхождение этого термина), основанные на общем местонахождении, интересах, роде деятельности и т. д. [5] [6]
Поиск базовой структуры сообщества в сети, если она существует, важен по ряду причин. Сообщества позволяют нам создавать крупномасштабную карту сети, поскольку отдельные сообщества действуют как метаузлы в сети, что облегчает ее изучение. [7]
Отдельные сообщества также проливают свет на функции системы, представленной сетью, поскольку сообщества часто соответствуют функциональным единицам системы. В метаболических сетях такие функциональные группы соответствуют циклам или путям, тогда как в сети взаимодействия белков сообщества соответствуют белкам со схожей функциональностью внутри биологической клетки. Аналогичным образом сети цитирования формируют сообщества по темам исследований. [1] Возможность идентифицировать эти подструктуры внутри сети может дать представление о том, как сетевые функции и топология влияют друг на друга. Такое понимание может быть полезно для улучшения некоторых алгоритмов работы с графами, таких как спектральная кластеризация . [8]
Важно отметить, что свойства сообществ часто сильно отличаются от средних свойств сетей. Таким образом, концентрируясь только на средних свойствах, обычно упускаются из виду многие важные и интересные особенности внутри сетей. Например, в данной социальной сети одновременно могут существовать как общительные, так и сдержанные группы. [7]
Существование сообществ также обычно влияет на различные процессы, такие как распространение слухов или распространение эпидемий, происходящих в сети. Следовательно, чтобы правильно понять такие процессы, важно обнаружить сообщества, а также изучить, как они влияют на процессы распространения в различных условиях.
Наконец, важное применение, которое обнаружение сообществ нашло в сетевой науке, — это прогнозирование недостающих звеньев и идентификация ложных звеньев в сети. В процессе измерения некоторые ссылки могут не наблюдаться по ряду причин. Аналогичным образом, некоторые ссылки могут ошибочно попасть в данные из-за ошибок измерения. Оба этих случая хорошо обрабатываются алгоритмом обнаружения сообществ, поскольку он позволяет назначить вероятность существования ребра между данной парой узлов. [9]
Алгоритмы поиска сообществ [ править ]
Поиск сообществ в произвольной сети может оказаться сложной вычислительной задачей. Количество сообществ в сети, если таковые имеются, обычно неизвестно, и сообщества часто имеют неодинаковый размер и/или плотность. Однако, несмотря на эти трудности, было разработано несколько методов поиска сообществ, которые применяются с разной степенью успеха. [4]
Метод минимального разреза [ править ]
Одним из старейших алгоритмов разделения сетей на части является метод минимального разреза (и такие варианты, как пропорциональный разрез и нормализованный разрез). Этот метод находит применение, например, при балансировке нагрузки при параллельных вычислениях , чтобы минимизировать обмен данными между процессорными узлами.
В методе минимального разреза сеть делится на заранее определенное количество частей, обычно примерно одинакового размера, выбранных так, чтобы количество ребер между группами было минимальным. Этот метод хорошо работает во многих приложениях, для которых он изначально предназначался, но он далеко не идеален для поиска структуры сообщества в общих сетях, поскольку он находит сообщества независимо от того, являются ли они неявными в структуре, и находит только фиксированное количество из них. [10]
Иерархическая кластеризация [ править ]
Еще одним методом поиска структур сообществ в сетях является иерархическая кластеризация . В этом методе определяется мера сходства, количественно определяющая некоторый (обычно топологический) тип сходства между парами узлов. Обычно используемые меры включают косинусное сходство , индекс Жаккара и расстояние Хэмминга между строками матрицы смежности . Затем сходные узлы группируются в сообщества в соответствии с этой мерой. Существует несколько распространенных схем выполнения группировки, две из самых простых — это кластеризация с одной связью , в которой две группы считаются отдельными сообществами тогда и только тогда, когда все пары узлов в разных группах имеют сходство ниже заданного порога, и полная кластеризация со связями. , при котором все узлы внутри каждой группы имеют сходство, превышающее пороговое значение. Важным шагом является определение порога остановки агломеративной кластеризации, указывающего на структуру сообщества, близкую к оптимальной. Общая стратегия состоит в построении одной или нескольких метрик, отслеживающих глобальные свойства сети, которые достигают пика на данном этапе кластеризации. Интересным подходом в этом направлении является использование различных мер сходства или несходства, объединенных посредством выпуклые суммы ,. [11] Другое приближение - это вычисление величины, контролирующей плотность ребер внутри кластеров по отношению к плотности между кластерами, например, плотность разделения, которая была предложена, когда метрика сходства определяется между ребрами (что позволяет определять перекрывающиеся сообщества). , [12] и расширяется, когда между узлами определяется сходство, что позволяет рассматривать альтернативные определения сообществ, таких как гильдии (т. е. группы узлов, имеющие одинаковое количество связей по отношению к одним и тем же соседям, но не обязательно связанные сами по себе). [13] Эти методы могут быть расширены для рассмотрения многомерных сетей, например, когда мы имеем дело с сетями, имеющими узлы с разными типами связей. [13]
Алгоритм [ править] Гирвана- Ньюмана
Другим часто используемым алгоритмом поиска сообществ является алгоритм Гирвана-Ньюмана . [1] Этот алгоритм идентифицирует ребра в сети, которые лежат между сообществами, а затем удаляет их, оставляя после себя только сами сообщества. Идентификация выполняется с использованием теоретико-графовой меры централизации посредничества , которая присваивает номер каждому ребру, который является большим, если ребро лежит «между» многими парами узлов.
Алгоритм Гирвана-Ньюмана возвращает результаты приемлемого качества и популярен, поскольку реализован в ряде стандартных пакетов программного обеспечения. Но он также выполняется медленно, занимая время O( m 2 n ) в сети из n вершин и m ребер, что делает его непрактичным для сетей с числом узлов более нескольких тысяч. [14]
Максимизация модульности [ править ]
Несмотря на известные недостатки, одним из наиболее широко используемых методов обнаружения сообществ является максимизация модульности. [14] Модульность — это функция выгоды, которая измеряет качество конкретного разделения сети на сообщества. Метод максимизации модульности обнаруживает сообщества путем поиска в возможных разделах сети одного или нескольких сообществ с особенно высокой модульностью. Поскольку исчерпывающий поиск по всем возможным разделам обычно невозможен, практические алгоритмы основаны на методах приближенной оптимизации, таких как жадные алгоритмы, имитация отжига или спектральная оптимизация, при этом разные подходы предлагают разные балансы между скоростью и точностью. [15] [16] Популярным подходом к максимизации модульности является метод Лувена , который итеративно оптимизирует местные сообщества до тех пор, пока глобальную модульность больше нельзя будет улучшить, учитывая возмущения в текущем состоянии сообщества. [17] [18] Алгоритм, использующий схему RenEEL, которая является примером парадигмы экстремального ансамблевого обучения (EEL), в настоящее время является лучшим алгоритмом максимизации модульности. [19] [20]
Полезность оптимизации модульности сомнительна, поскольку было показано, что оптимизация модульности часто не позволяет обнаружить кластеры меньше некоторого масштаба, в зависимости от размера сети ( предел разрешения [21] ); с другой стороны, ландшафт значений модульности характеризуется огромным вырождением разделов с высокой модульностью, близкими к абсолютному максимуму, которые могут сильно отличаться друг от друга. [22]
Статистический вывод
Методы, основанные на статистических выводах, пытаются подогнать генеративную модель к сетевым данным , которая кодирует структуру сообщества. Общим преимуществом этого подхода по сравнению с альтернативами является его более принципиальный характер и способность решать вопросы, имеющие статистическую значимость . Большинство методов в литературе основаны на стохастической блочной модели. [23] а также варианты, включая смешанное членство, [24] [25] степень-коррекция, [26] и иерархические структуры. [27] Выбор модели может осуществляться с использованием принципиальных подходов, таких как минимальная длина описания. [28] [29] (или, что то же самое, выбор байесовской модели [30] ) и тест отношения правдоподобия . [31] В настоящее время существует множество алгоритмов для эффективного вывода стохастических блочных моделей, включая распространение убеждений. [32] [33] и агломерационный Монте-Карло . [34]
В отличие от подходов, пытающихся кластеризовать сеть по заданной целевой функции, этот класс методов основан на генеративных моделях, которые не только служат описанием крупномасштабной структуры сети, но и могут использоваться обобщения для данные и прогнозировать появление отсутствующих или ложных ссылок в сети. [35] [36]
Кликовые методы [ править ]
Клики — это подграфы, в которых каждый узел соединен с каждым другим узлом клики. Поскольку узлы не могут быть более тесно связаны, неудивительно, что существует множество подходов к обнаружению сообществ в сетях, основанных на обнаружении клик в графе и анализе того, как они перекрываются. Обратите внимание, что, поскольку узел может быть членом более чем одной клики, в этих методах узел может быть членом более чем одного сообщества, что дает « перекрывающуюся структуру сообщества ».
Один из подходов — найти « максимальные клики ». То есть найти клики, которые не являются подграфами какой-либо другой клики. Классическим алгоритмом их поиска является алгоритм Брона-Кербоша . Их перекрытие можно использовать для определения сообществ несколькими способами. Самый простой — рассматривать только максимальные клики, размер которых превышает минимальный размер (количество узлов). Объединение этих клик затем определяет подграф, компоненты которого (несвязные части) затем определяют сообщества. [37] Такие подходы часто реализуются в программном обеспечении для анализа социальных сетей, таком как UCInet.
Альтернативный подход — использовать клики фиксированного размера. . Их перекрытие можно использовать для определения типа -регулярный гиперграф или структура, являющаяся обобщением линейного графа (случай, когда ), известный как « граф клики ». [38] Графы клик имеют вершины, которые представляют клики в исходном графе, а ребра графа клик фиксируют перекрытие клик в исходном графе. Применение любого из предыдущих методов обнаружения сообществ (которые присваивают каждый узел сообществу) к графу клик затем присваивает каждую клику сообществу. Затем это можно использовать для определения членства узлов в кликах в сообществе. Опять же, поскольку узел может состоять в нескольких кликах, он может быть членом нескольких сообществ.Например, метод кликовой перколяции [39] определяет сообщества как перколяционные кластеры -клики . Для этого этонаходит все -клики в сети, то есть все полные подграфы -узлы.Затем он определяет два -клики будут соседними, если они разделяют узлы, то есть это используется для определения ребер в графе клик. Сообщество тогда определяется как максимальное объединение -клики, в которых мы можем достичь любого -клика от любого другого -клика через серию -кликовые примыкания. То есть сообщества — это всего лишь связные компоненты графа клик. Поскольку узел может принадлежать нескольким различным -кликовые перколяционные кластеры, в то же время сообщества могут перекрываться друг с другом.
Обнаружение сообществ в пространствах скрытых функций [ править ]
Сеть может быть представлена или спроецирована на скрытое пространство с помощью методов обучения представлению, чтобы эффективно представлять систему. Затем кластеризации для обнаружения структур сообщества можно использовать различные методы . Для евклидовых пространств такие методы, как обнаружение сообщества Silhouette на основе встраивания. [40] можно использовать. Для гипергеометрических скрытых пространств можно использовать метод критического разрыва или модифицированные методы кластеризации на основе плотности, иерархии или разделения. [41]
Тестирование методов поиска алгоритмов сообществ [ править ]
Оценка алгоритмов, позволяющих определить, какие из них лучше определяют структуру сообщества, все еще остается открытым вопросом. Он должен быть основан на анализе сетей известной структуры. Типичным примером является тест «четырех групп», в котором сеть делится на четыре группы одинакового размера (обычно по 32 узла в каждой), а вероятности соединения внутри и между группами варьируются для создания более или менее сложных структур для обнаружения. алгоритм. Такие контрольные графики являются частным случаем модели с установленными l-разделами. [42] Кондона . и Карпа , или, в более общем смысле, « стохастических блочных моделей », общего класса моделей случайных сетей, содержащих структуру сообщества Были предложены другие, более гибкие тесты, которые позволяют варьировать размеры групп и нетривиальные распределения степеней, такие как тест LFR. [43] [44] который является расширением теста четырех групп, который включает гетерогенное распределение степени узла и размера сообщества, что делает его более серьезным испытанием методов обнаружения сообществ. [45] [46]
Обычно используемые компьютерные тесты начинаются с сети четко определенных сообществ. Затем эта структура ухудшается из-за перемонтажа или удаления ссылок, и алгоритмам становится все труднее и труднее обнаружить исходный раздел. В конце концов, сеть достигает точки, в которой она становится по существу случайной. Этот вид бенчмарка можно назвать «открытым». Результаты этих тестов оцениваются такими показателями, как нормализованная взаимная информация или вариация информации . Они сравнивают решение, полученное по алгоритму [44] с исходной структурой сообщества, оценив сходство обоих разделов.
Обнаруживаемость [ править ]
В последние годы различными группами был получен довольно неожиданный результат, который показывает, что в проблеме обнаружения сообществ существует фазовый переход, показывающий, что по мере того, как плотность связей внутри сообществ и между сообществами становится все более одинаковой или обе становятся меньшими (эквивалентно (когда структура сообщества становится слишком слабой или сеть становится слишком разреженной), сообщества внезапно становятся незаметными. В каком-то смысле сами сообщества все еще существуют, поскольку наличие и отсутствие ребер по-прежнему коррелирует с членством в сообществе их конечных точек; но становится теоретически невозможным пометить узлы лучше, чем случайно, или даже отличить граф от графа, созданного с помощью нулевой модели, такой как модель Эрдеша-Реньи, без структуры сообщества. Этот переход не зависит от типа алгоритма, используемого для обнаружения сообществ, а это означает, что существует фундаментальное ограничение на нашу способность обнаруживать сообщества в сетях даже при оптимальном байесовском выводе (т. е. независимо от наших вычислительных ресурсов). [47] [48] [49]
Рассмотрим стохастическую блочную модель с общим количеством узлы, группы одинакового размера, и пусть и — вероятности соединения внутри и между группами соответственно. Если , сеть будет иметь структуру сообщества, поскольку плотность связей внутри групп будет больше, чем плотность связей между группами. В редком случае и масштабировать как так что средняя степень постоянна:
- и
Тогда обнаружение сообществ становится невозможным, когда: [48]
См. также [ править ]
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б с М. Гирван ; МЭД Ньюман (2002). «Структура сообщества в социальных и биологических сетях» . Учеб. Натл. акад. наук. США . 99 (12): 7821–7826. arXiv : cond-mat/0112110 . Бибкод : 2002PNAS...99.7821G . дои : 10.1073/pnas.122653799 . ПМК 122977 . ПМИД 12060727 .
- ^ С. Фортунато (2010). «Обнаружение сообществ в графиках». Физ. Представитель . 486 (3–5): 75–174. arXiv : 0906.0612 . Бибкод : 2010PhR...486...75F . дои : 10.1016/j.physrep.2009.11.002 . S2CID 10211629 .
- ^ Ф.Д. Маллиарос; М. Вазиргианнис (2013). «Кластеризация и обнаружение сообществ в направленных сетях: опрос». Физ. Представитель . 533 (4): 95–142. arXiv : 1308.0971 . Бибкод : 2013ФР...533...95М . doi : 10.1016/j.physrep.2013.08.002 . S2CID 15006738 .
- ^ Jump up to: Перейти обратно: а б М. А. Портер; Ж.-П. Оннела; П. Дж. Муха (2009). «Сообщества в сетях» (PDF) . Уведомления Американского математического общества . 56 : 1082–1097, 1164–1166. Архивировано (PDF) из оригинала 13 июня 2021 г. Проверено 28 апреля 2021 г.
- ^ Jump up to: Перейти обратно: а б Фани, Хосейн; Багери, Эбрагим (2017). «Обнаружение сообществ в социальных сетях». Энциклопедия семантических вычислений и роботизированного интеллекта . Том. 1. С. 1630001 [8]. дои : 10.1142/S2425038416300019 . S2CID 52471002 .
- ^ Хамдака, Мохаммед; Тахвилдари, Ладан; ЛаШапель, Нил; Кэмпбелл, Брайан (2014). «Обнаружение культурных сцен с использованием обратной оптимизации Лувена» . Наука компьютерного программирования . 95 : 44–72. дои : 10.1016/j.scico.2014.01.006 . Архивировано из оригинала 07 августа 2020 г. Проверено 29 августа 2019 г.
- ^ Jump up to: Перейти обратно: а б МЕЙНеман (2006). «Нахождение структуры сообщества в сетях с использованием собственных векторов матриц». Физ. Преподобный Е. 74 (3): 1–19. arXiv : физика/0605087 . Бибкод : 2006PhRvE..74c6104N . дои : 10.1103/PhysRevE.74.036104 . ПМИД 17025705 . S2CID 138996 .
- ^ Заре, Хабиль; П. Шуштари; А. Гупта; Р. Бринкман (2010). «Сокращение данных для спектральной кластеризации для анализа данных высокопроизводительной проточной цитометрии» . БМК Биоинформатика . 11 (1): 403. дои : 10.1186/1471-2105-11-403 . ПМЦ 2923634 . ПМИД 20667133 .
- ^ Аарон Клаузет; Кристофер Мур; МЭД Ньюман (2008). «Иерархическая структура и прогнозирование недостающих звеньев в сетях». Природа . 453 (7191): 98–101. arXiv : 0811.0484 . Бибкод : 2008Natur.453...98C . дои : 10.1038/nature06830 . ПМИД 18451861 . S2CID 278058 .
- ^ МЭД Ньюман (2004). «Обнаружение структуры сообщества в сетях». Евро. Физ. Дж . Б. 38 (2): 321–330. Бибкод : 2004EPJB...38..321N . дои : 10.1140/epjb/e2004-00124-y . hdl : 2027.42/43867 . S2CID 15412738 .
- ^ Альварес, Алехандро Х.; Санс-Родригес, Карлос Э.; Кабрера, Хуан Луис (13 декабря 2015 г.). «Взвешивание различий для обнаружения сообществ в сетях» . Фил. Пер. Р. Сок. А. 373 (2056): 20150108. Бибкод : 2015RSPTA.37350108A . дои : 10.1098/rsta.2015.0108 . ISSN 1364-503X . ПМИД 26527808 .
- ^ Ан, Ю.-Ю.; Багроу, JP; Леманн, С. (2010). «Сообщества ссылок раскрывают многомасштабную сложность сетей». Природа . 466 (7307): 761–764. arXiv : 0903.3178 . Бибкод : 2010Natur.466..761A . дои : 10.1038/nature09182 . ПМИД 20562860 . S2CID 4404822 .
- ^ Jump up to: Перейти обратно: а б Паскуаль-Гарсия, Альберто; Белл, Томас (2020). «functionInk: эффективный метод обнаружения функциональных групп в многомерных сетях, раскрывающий скрытую структуру экологических сообществ». Методы Эколь Эвол . 11 (7): 804–817. дои : 10.1111/2041-210X.13377 . S2CID 214033410 .
- ^ Jump up to: Перейти обратно: а б МЭД Ньюман (2004). «Быстрый алгоритм определения структуры сообщества в сетях». Физ. Преподобный Е. 69 (6): 066133. arXiv : cond-mat/0309508 . Бибкод : 2004PhRvE..69f6133N . дои : 10.1103/PhysRevE.69.066133 . ПМИД 15244693 . S2CID 301750 .
- ^ Л. Данон; Дж. Дуч; А. Диас-Гилера; А. Аренас (2005). «Сравнение идентификации структуры сообщества». Дж. Стат. Мех . 2005 (9): P09008. arXiv : cond-mat/0505245 . Бибкод : 2005JSMTE..09..008D . дои : 10.1088/1742-5468/2005/09/P09008 . S2CID 14798969 .
- ^ Р. Гимера; ЛАН Амарал (2005). «Функциональная картография сложных метаболических сетей» . Природа . 433 (7028): 895–900. arXiv : q-bio/0502035 . Бибкод : 2005Natur.433..895G . дои : 10.1038/nature03288 . ПМК 2175124 . ПМИД 15729348 .
- ^ В.Д. Блондель; Ж.-Л. Гийом; Р. Ламбьотт; Э. Лефевр (2008). «Быстрое развертывание иерархии сообществ в крупных сетях». Дж. Стат. Мех . 2008 (10): P10008. arXiv : 0803.0476 . Бибкод : 2008JSMTE..10..008B . дои : 10.1088/1742-5468/2008/10/P10008 . S2CID 334423 .
- ^ «Молниеносное обнаружение сообществ в социальных сетях: масштабируемая реализация алгоритма Лувена» (PDF) . Обернский университет . 2013. S2CID 16164925 . [ мертвая ссылка ]
- ^ Цзюй Го; П. Сингх; К.Э. Басслер (2019). «Схема сокращенного сетевого экстремального ансамблевого обучения (RenEEL) для обнаружения сообществ в сложных сетях» . Научные отчеты . 9 (14234): 14234. arXiv : 1909.10491 . Бибкод : 2019НатСР...914234Г . дои : 10.1038/s41598-019-50739-3 . ПМЦ 6775136 . ПМИД 31578406 .
- ^ «РенЭЭЛ-Модульность» . Гитхаб . 31 октября 2019 года. Архивировано из оригинала 1 января 2021 года . Проверено 4 ноября 2019 г.
- ^ С. Фортунато; М. Бартелеми (2007). «Предел разрешения при обнаружении сообщества» . Труды Национальной академии наук Соединенных Штатов Америки . 104 (1): 36–41. arXiv : физика/0607100 . Бибкод : 2007PNAS..104...36F . дои : 10.1073/pnas.0605965104 . ПМЦ 1765466 . ПМИД 17190818 .
- ^ Б.Х. Хорошо; Ю.-А. де Монжуа; А. Клаузе (2010). «Максимизация модульности в практическом контексте». Физ. Преподобный Е. 81 (4): 046106. arXiv : 0910.0165 . Бибкод : 2010PhRvE..81d6106G . дои : 10.1103/PhysRevE.81.046106 . ПМИД 20481785 . S2CID 16564204 .
- ^ Холланд, Пол В.; Кэтрин Блэкмонд Ласки; Сэмюэл Лейнхардт (июнь 1983 г.). «Стохастические блок-модели: первые шаги». Социальные сети . 5 (2): 109–137. дои : 10.1016/0378-8733(83)90021-7 . ISSN 0378-8733 . S2CID 34098453 .
- ^ Айролди, Эдоардо М .; Дэвид М. Блей; Стивен Э. Файнберг; Эрик П. Син (июнь 2008 г.). «Стохастические блок-модели со смешанным членством» . Дж. Мах. Учиться. Рез . 9 : 1981–2014. ISSN 1532-4435 . ПМК 3119541 . ПМИД 21701698 . Архивировано из оригинала 21 ноября 2018 г. Проверено 9 октября 2013 г.
- ^ Болл, Брайан; Брайан Каррер; МЭД Ньюман (2011). «Эффективный и принципиальный метод обнаружения сообществ в сетях». Физический обзор E . 84 (3): 036103. arXiv : 1104.3590 . Бибкод : 2011PhRvE..84c6103B . дои : 10.1103/PhysRevE.84.036103 . ПМИД 22060452 . S2CID 14204351 .
- ^ Каррер, Брайан; МЭД Ньюман (21 января 2011 г.). «Стохастические блок-модели и структура сообщества в сетях». Физический обзор E . 83 (1): 016107.arXiv : 1008.3926 . Бибкод : 2011PhRvE..83a6107K . дои : 10.1103/PhysRevE.83.016107 . ПМИД 21405744 . S2CID 9068097 .
- ^ Пейшото, Тьяго П. (24 марта 2014 г.). «Иерархические блочные структуры и выбор модели высокого разрешения в больших сетях». Физический обзор X . 4 (1): 011047. arXiv : 1310.4377 . Бибкод : 2014PhRvX...4a1047P . дои : 10.1103/PhysRevX.4.011047 . S2CID 5841379 .
- ^ Мартин Росвалл; Карл Т. Бергстром (2007). «Теоретико-информационная основа для решения структуры сообщества в сложных сетях» . Труды Национальной академии наук Соединенных Штатов Америки . 104 (18): 7327–7331. arXiv : физика/0612035 . Бибкод : 2007PNAS..104.7327R . дои : 10.1073/pnas.0611034104 . ПМК 1855072 . ПМИД 17452639 .
- ^ П. Пейшото, Т. (2013). «Экономный вывод модулей в больших сетях». Физ. Преподобный Летт . 110 (14): 148701. arXiv : 1212.4794 . Бибкод : 2013PhRvL.110n8701P . doi : 10.1103/PhysRevLett.110.148701 . ПМИД 25167049 . S2CID 2668815 .
- ^ П. Пейшото, Т. (2019). «Байесовское стохастическое блочное моделирование». Достижения в области сетевой кластеризации и блочного моделирования . стр. 289–332. arXiv : 1705.10225 . дои : 10.1002/9781119483298.ch11 . ISBN 978-1-119-22470-9 . S2CID 62900189 .
- ^ Ян, Сяорань; Джейкоб Э. Дженсен; Флоран Крзакала; Кристофер Мур; Косма Рохилла Шализи; Ленка Здеборова ; Пан Чжан; Яоцзя Чжу (17 июля 2012 г.). «Выбор модели для блочных моделей с коррекцией степени» . Журнал статистической механики: теория и эксперимент . 2014 (5): P05007. arXiv : 1207.3994 . Бибкод : 2014JSMTE..05..007Y . дои : 10.1088/1742-5468/2014/05/P05007 . ПМЦ 4498413 . ПМИД 26167197 .
- ^ Гопалан, Прем К.; Дэвид М. Блей (3 сентября 2013 г.). «Эффективное обнаружение перекрывающихся сообществ в массивных сетях» . Труды Национальной академии наук . 110 (36): 14534–14539. Бибкод : 2013PNAS..11014534G . дои : 10.1073/pnas.1221839110 . ISSN 0027-8424 . ПМЦ 3767539 . ПМИД 23950224 .
- ^ Десель, Орельен; Флоран Крзакала; Кристофер Мур; Ленка Здеборова (12 декабря 2011 г.). «Асимптотический анализ стохастической блочной модели модульных сетей и ее алгоритмических приложений». Физический обзор E . 84 (6): 066106. arXiv : 1109.3041 . Бибкод : 2011PhRvE..84f6106D . дои : 10.1103/PhysRevE.84.066106 . ПМИД 22304154 . S2CID 15788070 .
- ^ Пейшото, Тьяго П. (13 января 2014 г.). «Эффективный метод Монте-Карло и жадная эвристика для вывода стохастических блочных моделей». Физический обзор E . 89 (1): 012804. arXiv : 1310.4378 . Бибкод : 2014PhRvE..89a2804P . дои : 10.1103/PhysRevE.89.012804 . ПМИД 24580278 . S2CID 2674083 .
- ^ Гимера, Роджер; Марта Салес-Пардо (29 декабря 2009 г.). «Отсутствующие и ложные взаимодействия и реконструкция сложных сетей» . Труды Национальной академии наук . 106 (52): 22073–22078. arXiv : 1004.4791 . Бибкод : 2009PNAS..10622073G . дои : 10.1073/pnas.0908366106 . ПМЦ 2799723 . ПМИД 20018705 .
- ^ Клосет, Аарон; Кристофер Мур; МЭДж Ньюман (01 мая 2008 г.). «Иерархическая структура и прогнозирование недостающих звеньев в сетях». Природа . 453 (7191): 98–101. arXiv : 0811.0484 . Бибкод : 2008Natur.453...98C . дои : 10.1038/nature06830 . ISSN 0028-0836 . ПМИД 18451861 . S2CID 278058 .
- ^ М.Г. Эверетт; СП Боргатти (1998). «Анализ перекрывающихся связей клик». Соединения . 21:49 .
- ^ Т. С. Эванс (2010). «Графы клик и перекрывающиеся сообщества». Дж. Стат. Мех . 2010 (12): P12037. arXiv : 1009.0638 . Бибкод : 2010JSMTE..12..037E . дои : 10.1088/1742-5468/2010/12/P12037 . S2CID 2783670 .
- ^ Г. Палла; И. Дереньи; И. Фаркас; Т. Вичек (2005). «Раскрытие перекрывающейся структуры сообщества сложных сетей в природе и обществе». Природа . 435 (7043): 814–818. arXiv : физика/0506133 . Бибкод : 2005Natur.435..814P . дои : 10.1038/nature03607 . ПМИД 15944704 . S2CID 3250746 .
- ^ Шкрль, Блаж; Краль, Ян; Лаврач, Нада (01.11.2020). «Обнаружение сообщества Silhouette на основе встраивания» . Машинное обучение . 109 (11): 2161–2193. дои : 10.1007/s10994-020-05882-8 . ISSN 1573-0565 . ПМЦ 7652809 . ПМИД 33191975 .
- ^ Бруно, Маттео (21 июня 2019 г.). «Обнаружение сообществ в гиперболическом пространстве». arXiv : 1906.09082 [ physical.soc-ph ].
- ^ Кондон, А .; Карп, Р.М. (2001). «Алгоритмы разделения графа на модели установленных разделов». Случайная структура. Алгор . 18 (2): 116–140. CiteSeerX 10.1.1.22.4340 . doi : 10.1002/1098-2418(200103)18:2<116::AID-RSA1001>3.0.CO;2-2 .
- ^ А. Ланчикинетти; С. Фортунато; Ф. Радикки (2008). «Эталонные графики для тестирования алгоритмов обнаружения сообществ». Физ. Преподобный Е. 78 (4): 046110. arXiv : 0805.4770 . Бибкод : 2008PhRvE..78d6110L . дои : 10.1103/PhysRevE.78.046110 . ПМИД 18999496 . S2CID 18481617 .
- ^ Jump up to: Перейти обратно: а б Фатхи, Реза (апрель 2019 г.). «Эффективное обнаружение распределенных сообществ в стохастической блочной модели». arXiv : 1904.07494 [ cs.DC ].
- ^ MQ макароны; Ф. Заиди (2017). «Использование динамики эволюции для создания эталонных сложных сетей со структурами сообществ». arXiv : 1606.01169 [ cs.SI ].
- ^ Паста, MQ; Заиди, Ф. (2017). «Топология сложных сетей и ограничения производительности алгоритмов обнаружения сообществ» . Доступ IEEE . 5 : 10901–10914. дои : 10.1109/ACCESS.2017.2714018 .
- ^ Райхардт, Дж.; Леоне, М. (2008). «(Не)обнаружимая кластерная структура в разреженных сетях». Физ. Преподобный Летт . 101 (78701): 1–4. arXiv : 0711.1452 . Бибкод : 2008PhRvL.101g8701R . doi : 10.1103/PhysRevLett.101.078701 . ПМИД 18764586 . S2CID 41197281 .
- ^ Jump up to: Перейти обратно: а б Десель, А.; Крзакала, Ф.; Мур, К.; Здеборова, Л. (2011). «Вывод и фазовые переходы при обнаружении модулей в разреженных сетях». Физ. Преподобный Летт . 107 (65701): 1–5. arXiv : 1102.1182 . Бибкод : 2011PhRvL.107f5701D . doi : 10.1103/PhysRevLett.107.065701 . ПМИД 21902340 . S2CID 18399723 .
- ^ Надакудити, РР; Ньюман, МЭД (2012). «Спектры графов и обнаруживаемость структуры сообщества в сетях». Физ. Преподобный Летт . 108 (188701): 1–5. arXiv : 1205.1813 . Бибкод : 2012PhRvL.108r8701N . doi : 10.1103/PhysRevLett.108.188701 . ПМИД 22681123 . S2CID 11820036 .