Модель конфигурации

В сетевой науке модель конфигурации — это метод генерации случайных сетей из заданной последовательности степеней . Она широко используется в качестве эталонной модели для реальных социальных сетей , поскольку позволяет разработчикам модели включать произвольные распределения степеней.
Часть серии о | ||||
Сетевая наука | ||||
---|---|---|---|---|
Типы сетей | ||||
Графики | ||||
| ||||
Модели | ||||
| ||||
| ||||
Обоснование модели
[ редактировать ]В модели конфигурации степень каждой вершины заранее определена, а не имеет распределение вероятностей, из которого выбирается данная степень. [2] В отличие от модели Эрдеша-Реньи , последовательность степеней модели конфигурации не ограничена распределением Пуассона , модель позволяет пользователю задать сети любое желаемое распределение степеней.
Алгоритм
[ редактировать ]Следующий алгоритм описывает генерацию модели:
- Возьмите последовательность степеней, т.е. присвойте степень к каждой вершине. Степени вершин представлены в виде полузвеньев или заглушек. Сумма заглушек должна быть четной, чтобы можно было построить граф ( ). Последовательность степеней может быть получена из теоретического распределения или может представлять собой реальную сеть (определяемую из матрицы смежности сети).
- Выберите наугад два заглушки и соедините их, образуя край. Выберите другую пару из оставшихся заглушки и соедините их. Продолжайте, пока не закончатся заглушки. В результате получается сеть с заранее определенной последовательностью степеней. Реализация сети меняется в зависимости от порядка выбора заглушек: они могут включать циклы (б), самоциклы (в) или многозвенья (г) (рис. 1).
Самоциклы, многоребра и последствия
[ редактировать ]Описанный выше алгоритм находит любые заглушки с одинаковой вероятностью. Равномерное распределение совпадений является важным свойством с точки зрения расчета других характеристик сгенерированных сетей. Процесс формирования сети не исключает события формирования замкнутой или многоканальной сети. Если бы мы разработали процесс, в котором не допускаются самоциклы и множественные ребра, сопоставление заглушек не будет следовать равномерному распределению.
Ожидаемое общее количество многоканальных каналов в сети модели конфигурации будет следующим:
где – n-й момент распределения степеней. Следовательно, среднее количество петель и многозвеньев является константой для некоторых крупных сетей, а плотность петель и многозвеньев, то есть количество на узел, стремится к нулю при пока является постоянным и конечным. Для некоторых степенных распределений степеней, где второй момент расходится, плотность многозвеньев может не исчезать или исчезать медленнее, чем . [2]
Еще одним следствием самоциклов и мультиребер является то, что не все возможные сети генерируются с одинаковой вероятностью. В общем, все возможные реализации можно сгенерировать, переставляя всевозможными способами заглушки всех вершин. Количество перестановок заглушек узла является , поэтому число реализаций последовательности степеней равно . Это означало бы, что каждая реализация происходит с одинаковой вероятностью. Однако самоциклы и мультиребра могут изменить количество реализаций, поскольку перестановка саморебер может привести к неизмененной реализации. Учитывая, что количество самопетлей и многозвеньев исчезает как , изменение вероятностей различных реализаций будет небольшим, но присутствует. [2]
Характеристики
[ редактировать ]Краевая вероятность
[ редактировать ]Заглушка узла можно подключить к другие заглушки (есть заглушки вообще, и нам приходится исключить ту, которую мы сейчас наблюдаем). Вершина имеет заглушки к какому узлу могут быть связаны с одинаковой вероятностью (из-за равномерного распределения). Вероятность заглушки узла быть подключенным к одному из этих заглушки есть . Поскольку узел имеет заглушки, вероятность быть подключенным к является ( для достаточно большого ). Обратите внимание, что эту формулу можно рассматривать как вероятность только в том случае, если , а точнее описывает ожидаемое количество ребер между узлами и . Обратите внимание, что эта формула не применима к случаю саморезов. [2]
Дана модель конфигурации с распределением степеней , вероятность случайно выбранного узла имеющий степень является . Но если мы взяли одну из вершин, в которую мы можем прийти по одному из ребер i, вероятность иметь степень k равна . (Вероятность достижения узла степени k равна , и есть таких узлов.) Эта дробь зависит от в отличие от степени типичного узла с . Таким образом, ожидается, что сосед типичного узла будет иметь более высокий уровень, чем сам типичный узел. Эта особенность модели конфигурации хорошо описывает феномен «у моих друзей больше друзей, чем у меня».
Коэффициент кластеризации
[ редактировать ]Коэффициент кластеризации (средняя вероятность того, что соседи узла связаны) вычисляется примерно следующим образом:
где обозначает вероятность того, что случайное ребро достигнет степени вершина, и факторы формы" " скорее, чем " " появляются потому, что одна заглушка была учтена тем, что это соседи общей вершины. Оценка вышеприведенного результата дает
С использованием и , с обозначая распределение степеней, обозначающий среднюю степень, и обозначая количество вершин, приведенное выше становится
с обозначающий второй момент распределения степеней. Предполагая, что и постоянны, приведенное выше ведет себя как
где константа зависит от . [2] Таким образом, коэффициент кластеризации становится маленьким в предел.
Гигантский компонент
[ редактировать ]В модели конфигурации гигантский компонент (GC) существует, если
где и – первый и второй моменты распределения степеней . Это означает, что критический порог зависит исключительно от величин, которые однозначно определяются распределением степеней .
Модель конфигурации генерирует локально древовидные сети, то есть любое локальное соседство в такой сети принимает форму дерева. Точнее, если начать с любого узла сети и сформировать набор всех узлов на расстоянии или меньше от этого начального узла, набор с вероятностью, стремящейся к 1 при n → ∞, примет форму дерева. [3] В древовидных структурах число вторых соседей усреднено по всей сети, , является:
Тогда вообще среднее число на расстоянии можно записать как:
Это означает, что если соотношение больше единицы, то сеть может иметь гигантскую составляющую. Это известно как критерий Моллоя-Рида. [4] Интуиция, лежащая в основе этого критерия, заключается в том, что если гигантский компонент (GC) существует, то средняя степень случайно выбранной вершины в компоненте связности должно быть не менее 2. Критерий Моллоя-Рида также можно выразить как: из чего следует, что хотя размер GC может зависеть от и , количество узлов степени 0 и 2 не вносит вклада в существование гигантской компоненты. [3]
Диаметр
[ редактировать ]Модель конфигурации может предполагать любое распределение степеней и демонстрирует эффект тесного мира , поскольку в ведущем порядке диаметр модели конфигурации составляет всего лишь . [5]
Компоненты конечного размера
[ редактировать ]Как общее количество вершин стремится к бесконечности, вероятность найти две гигантские компоненты исчезает. Это означает, что в разреженном режиме модель состоит из одного гигантского компонента (если таковой имеется) и множества связных компонентов конечного размера. Размеры соединяемых компонентов характеризуются их распределением по размерам. - вероятность того, что случайно выбранная вершина принадлежит компоненту связности размера Существует соответствие между распределением степеней и распределение размеров Когда общее количество вершин стремится к бесконечности, , имеет место следующее соотношение: [6]
где и обозначает -кратная мощность свертки . Более того, явные асимптоты для известны, когда и близко к нулю. [6] Аналитические выражения для этих асимптот зависят от конечности моментов показатель хвоста распределения степеней (когда имеет тяжелый хвост) и знак критерия Моллоя-Рида. В следующей таблице суммированы эти отношения (константы приведены в разделе [6] ).
Моменты | Хвост | ||
---|---|---|---|
легкий хвост | -1 или 1 | ||
0 | |||
тяжелый хвост, | -1 | ||
0 | |||
1 | |||
тяжелый хвост, | -1 | ||
0 | |||
1 | |||
тяжелый хвост, | -1 | ||
0 | |||
1 | |||
тяжелый хвост, | 1 | ||
тяжелый хвост, | 1 |
Моделирование
[ редактировать ]Сравнение с реальными сетями
[ редактировать ]Тремя общими свойствами сложных сетей являются неоднородное распределение степеней, короткая средняя длина пути и высокая кластеризация. [1] [7] [8] Имея возможность определять любую произвольную последовательность степеней, первое условие может быть удовлетворено замыслом, но, как показано выше, глобальный коэффициент кластеризации является обратной функцией размера сети, поэтому для сетей с большой конфигурацией кластеризация имеет тенденцию быть небольшой. Эта особенность базовой модели противоречит известным свойствам эмпирических сетей, но расширения модели могут решить эту проблему (см. [9] ). Все сети, созданные этой моделью, являются локально древовидными при условии, что среднее значение распределения избыточной степени либо постоянно, либо растет медленнее, чем квадратный корень из числа связей. . Другими словами, эта модель предотвращает образование подструктур, таких как петли, в пределе большого размера. Исчезновение коэффициента кластеризации является частным случаем этого более общего результата. Хотя свойство древовидности делает модель не очень реалистичной, очень много вычислений, таких как методы производящей функции . благодаря этой особенности для модели конфигурации возможно [3]
Применение: расчет модульности
[ редактировать ]Модель конфигурации применяется в качестве эталона при расчете модульности сети . Модульность измеряет степень разделения сети на модули. Он рассчитывается следующим образом:
в котором матрица смежности сети сравнивается с вероятностью наличия ребра между узлами и (в зависимости от их степеней) в модели конфигурации ( см. на странице модульность подробнее ).
Модель направленной конфигурации
[ редактировать ]В DCM (модель направленной конфигурации) [11] каждому узлу дается несколько полуребер, называемых хвостами и головами. Затем хвосты и головы совмещаются случайным образом, образуя направленные ребра. Размер гигантского компонента, [11] [12] типичное расстояние, [13] и диаметр [14] DCM были изучены математически. Также было проведено обширное исследование случайных блужданий в DCM. [15] [16] [17] Некоторые сложные сети реального мира были смоделированы с помощью DCM, например, нейронные сети. [18] финансы [19] и социальные сети. [20]

Ссылки
[ редактировать ]- ^ Jump up to: а б Сетевая наука Альберта-Ласло Барабаши .
- ^ Jump up to: а б с д и Ньюман, Марк (25 марта 2010 г.). Сети: Введение – Оксфордская стипендия . Издательство Оксфордского университета. doi : 10.1093/acprof:oso/9780199206650.001.0001 . ISBN 9780191594175 .
- ^ Jump up to: а б с Ньюман, Марк (18 октября 2018 г.). Сети . Том. 1. Издательство Оксфордского университета. дои : 10.1093/oso/9780198805090.001.0001 . ISBN 978-0-19-880509-0 .
- ^ Моллой, Майкл; Рид, Брюс (1 марта 1995 г.). «Критическая точка для случайных графов с заданной последовательностью степеней». Случайные структуры и алгоритмы . 6 (2–3): 161–180. CiteSeerX 10.1.1.24.6195 . дои : 10.1002/rsa.3240060204 . ISSN 1098-2418 .
- ^ Чанг, Фан; Лу, Линьюань (10 декабря 2002 г.). «Средние расстояния в случайных графах с заданными ожидаемыми степенями» . Труды Национальной академии наук . 99 (25): 15879–15882. Бибкод : 2002PNAS...9915879C . дои : 10.1073/pnas.252631999 . ISSN 0027-8424 . ПМЦ 138532 . ПМИД 12466502 .
- ^ Jump up to: а б с Кривень, И (2017). «Общее выражение распределения размеров компонентов в сетях бесконечной конфигурации» . Физический обзор E . 95 (5): 052303. arXiv : 1703.05413 . Бибкод : 2017PhRvE..95e2303K . дои : 10.1103/PhysRevE.95.052303 . hdl : 11245.1/fa1b270b-61a5-4f20-b496-ddf446fdfe80 . ПМИД 28618550 . S2CID 8421307 .
- ^ Барабаши, Альберт-Ласло; Альберт, Река (15 октября 1999 г.). «Появление масштабирования в случайных сетях». Наука . 286 (5439): 509–512. arXiv : cond-mat/9910332 . Бибкод : 1999Sci...286..509B . дои : 10.1126/science.286.5439.509 . ISSN 0036-8075 . ПМИД 10521342 . S2CID 524106 .
- ^ Уоттс, Дункан Дж.; Строгац, Стивен Х. (1998). «Коллективная динамика сетей «маленького мира». Природа . 393 (6684): 440–442. Бибкод : 1998Natur.393..440W . дои : 10.1038/30918 . ISSN 1476-4687 . ПМИД 9623998 . S2CID 4429113 .
- ^ Ньюман, МЭД (2009). «Случайные графы с кластеризацией». Письма о физических отзывах . 103 (5): 058701. arXiv : 0903.4009 . Бибкод : 2009PhRvL.103e8701N . doi : 10.1103/physrevlett.103.058701 . ПМИД 19792540 . S2CID 28214709 .
- ^ Ньюман, МЭД (2004). «Нахождение и оценка структуры сообщества в сетях». Физический обзор E . 69 (2): 026113. arXiv : cond-mat/0308217 . Бибкод : 2004PhRvE..69b6113N . дои : 10.1103/physreve.69.026113 . ПМИД 14995526 . S2CID 197314 .
- ^ Jump up to: а б КУПЕР, КОЛИН; ФРИЗ, АЛАН (май 2004 г.). «Размер наибольшего сильно связного компонента случайного орграфа с заданной последовательностью степеней» . Комбинаторика, теория вероятностей и вычисления . 13 (3): 319–337. дои : 10.1017/S096354830400611X . ISSN 1469-2163 . S2CID 27511938 .
- ^ Цай, Син Ши; Перарнау, Гиллем (10 апреля 2020 г.). «Еще раз о гигантском компоненте модели направленной конфигурации». arXiv : 2004.04998 [ мат.PR ].
- ^ ван дер Хорн, Пим; Ольвера-Кравиото, Мариана (июнь 2018 г.). «Типичные расстояния в модели направленной конфигурации». Анналы прикладной теории вероятности . 28 (3): 1739–1792. arXiv : 1511.04553 . дои : 10.1214/17-AAP1342 . S2CID 13683470 .
- ^ Цай, Син Ши; Перарнау, Гиллем (10 марта 2020 г.). «Диаметр модели направленной конфигурации». arXiv : 2003.04965 [ мат.PR ].
- ^ Борденейв, Чарльз; Капуто, Пьетро; Салез, Джастин (1 апреля 2018 г.). «Случайное блуждание по разреженным случайным орграфам» . Теория вероятностей и смежные области . 170 (3): 933–960. arXiv : 1508.06600 . дои : 10.1007/s00440-017-0796-7 . ISSN 1432-2064 . S2CID 55211047 .
- ^ Капуто, Пьетро; Кваттропани, Маттео (1 декабря 2020 г.). «Стационарное распределение и время покрытия моделей разреженной направленной конфигурации» . Теория вероятностей и смежные области . 178 (3): 1011–1066. дои : 10.1007/s00440-020-00995-6 . hdl : 11385/196435 . ISSN 1432-2064 . S2CID 202565916 .
- ^ Цай, Син Ши; Перарнау, Гиллем (14 октября 2020 г.). «Минимальные стационарные значения разреженных случайных ориентированных графов». arXiv : 2010.07246 [ мат.PR ].
- ^ Амини, Хамед (1 ноября 2010 г.). «Бутстреп-перколяция в живых нейронных сетях». Журнал статистической физики . 141 (3): 459–475. arXiv : 0910.0627 . Бибкод : 2010JSP...141..459A . дои : 10.1007/s10955-010-0056-z . ISSN 1572-9613 . S2CID 7601022 .
- ^ Амини, Хамед; Минка, Андреа (2013). «Математическое моделирование системного риска». Достижения в области сетевого анализа и его приложений . Математика в промышленности. Том. 18. Спрингер. стр. 3–26. дои : 10.1007/978-3-642-30904-5_1 . ISBN 978-3-642-30903-8 . S2CID 166867930 .
- ^ Ли, Хуэй (июль 2018 г.). «Уязвимость социальных сетей к атакам». 2018 37-я Китайская конференция по контролю (CCC) . стр. 1051–1056. дои : 10.23919/ChiCC.2018.8482277 . ISBN 978-988-15639-5-8 . S2CID 52933445 .