Jump to content

Коэффициент кластеризации

В теории графов коэффициент кластеризации — это мера степени, в которой узлы графа имеют тенденцию группироваться вместе. Имеющиеся данные свидетельствуют о том, что в большинстве реальных сетей, и в частности в социальных сетях , узлы имеют тенденцию создавать тесно связанные группы, характеризующиеся относительно высокой плотностью связей; эта вероятность обычно превышает среднюю вероятность связи, случайно установленной между двумя узлами (Holland and Leinhardt, 1971; [1] Уоттс и Строгац, 1998 г. [2] ).

Существуют две версии этой меры: глобальная и локальная. Глобальная версия была разработана, чтобы дать общее представление о кластеризации в сети , тогда как локальная версия дает представление о степени «кластеризации» одного узла .

локальной кластеризации Коэффициент

Пример коэффициента локальной кластеризации на неориентированном графе. Коэффициент локальной кластеризации синего узла вычисляется как доля фактически реализованных соединений между его соседями по сравнению с количеством всех возможных соединений. На рисунке синий узел имеет трех соседей, между которыми может быть максимум 3 соединения. В верхней части рисунка реализованы все три возможных соединения (толстые черные сегменты), что дает коэффициент локальной кластеризации, равный 1. В средней части рисунка реализуется только одно соединение (толстая черная линия), а 2 соединения отсутствуют ( пунктирные красные линии), что дает коэффициент локальной кластерности 1/3. Наконец, ни одно из возможных соединений между соседями синего узла не реализуется, что приводит к значению локального коэффициента кластеризации, равному 0.

Коэффициент локальной кластеризации вершины соседи (узла) в графе определяет, насколько близки ее к клике ( полному графу). Дункан Дж. Уоттс и Стивен Строгац ввели эту меру в 1998 году, чтобы определить, является ли граф сетью маленького мира .

График формально состоит из множества вершин и набор ребер между ними. Край соединяет вершину с вершиной .

Район для вершины определяется как его непосредственно подключенные соседи следующим образом:

Мы определяем как количество вершин, , по соседству, , вершины .

Коэффициент локальной кластеризации для вершины тогда определяется как доля количества связей между вершинами в ее окрестности, деленная на количество связей, которые могут существовать между ними. Для ориентированного графа отличается от , и, следовательно, для каждой окрестности есть связи, которые могут существовать между вершинами в окрестности ( — число соседей вершины). Таким образом, коэффициент локальной кластеризации для ориентированных графов задается как [2]

Неориентированный граф обладает тем свойством, что и считаются идентичными. Следовательно, если вершина имеет соседи, ребра могут существовать среди вершин внутри окрестности. Таким образом, коэффициент локальной кластеризации для неориентированных графов можно определить как

Позволять - количество треугольников на для неориентированного графа . То есть, это количество подграфов с 3 ребрами и 3 вершинами, одна из которых . Позволять быть числом троек на . То есть, — количество подграфов (не обязательно индуцированных) с 2 ребрами и 3 вершинами, одна из которых и такое, что инцидентен обоим ребрам. Тогда мы также можем определить коэффициент кластеризации как

Легко показать, что два предыдущих определения одинаковы, поскольку

Эти меры равны 1, если каждый сосед, подключенный к также соединена с любой другой вершиной в окрестности, и 0, если ни одна вершина не связана с соединяется с любой другой вершиной, которая соединена с .

Поскольку любой граф полностью определяется своей матрицей смежности A , коэффициент локальной кластеризации для простого неориентированного графа можно выразить через A как: [3]

где:

и C i =0, когда k i равно нулю или единице. В приведенном выше выражении числитель подсчитывает удвоенное количество полных треугольников, в которых участвует вершина i . В знаменателе k i 2 подсчитывает количество пар ребер, в которых участвует вершина i, плюс количество одиночных ребер, пройденных дважды. k i — количество ребер, соединенных с вершиной i, и вычитание k i затем удаляет последнюю, оставляя только набор пар ребер, которые предположительно можно соединить в треугольники. Для каждой такой пары ребер найдется еще одна пара ребер, которая может образовать тот же треугольник, поэтому знаменатель учитывает в два раза больше мыслимых треугольников, вершина i в которые может входить .

Глобальный кластеризации коэффициент

Глобальный коэффициент кластеризации основан на тройках узлов. Тройка — это три узла, соединенные либо двумя (открытая тройка), либо тремя (закрытая тройка) ненаправленными связями. Таким образом, треугольный граф включает в себя три замкнутых тройки, по одной в центре каждого из узлов ( это означает, что три тройки в треугольнике возникают в результате перекрывающихся выборок узлов). Глобальный коэффициент кластеризации — это количество закрытых троек (или 3 треугольников) по отношению к общему количеству троек (как открытых, так и закрытых). Первую попытку измерить его сделали Люси и Перри (1949). [4] Эта мера дает представление о кластеризации во всей сети (глобальной) и может применяться как к ненаправленным, так и к направленным сетям (часто называемая транзитивностью, см. Wasserman and Faust, 1994, стр. 243). [5] ).

Глобальный коэффициент кластеризации определяется как:

.

Число замкнутых троек в литературе также называют треугольниками 3 ×, поэтому:

.

Обобщение на взвешенные сети было предложено Опсалом и Панзарасой (2009): [6] и переопределение двухрежимных сетей (как двоичных, так и взвешенных) Опсалом (2009). [7]

Поскольку любой простой граф полностью определяется своей матрицей смежности A , глобальный коэффициент кластеризации для неориентированного графа может быть выражен через A как:

где:

и C = 0, когда знаменатель равен нулю.

сети коэффициент Средний кластеризации

В качестве альтернативы глобальному коэффициенту кластеризации общий уровень кластеризации в сети измеряется Уоттсом и Строгацем. [2] как среднее значение локальных коэффициентов кластеризации всех вершин  : [8]

Стоит отметить, что эта метрика придает больший вес узлам низкой степени, в то время как коэффициент транзитивности придает больший вес узлам высокой степени.

Обобщение на взвешенные сети было предложено Барратом и др. (2004), [9] и переопределение двудольных графов (также называемых двухрежимными сетями) Латапи и др. (2008) [10] и Опсал (2009). [7]

Альтернативные обобщения взвешенных и ориентированных графов были предложены Фаджиоло (2007). [11] и Клементе и Грасси (2018). [12]

Эта формула по умолчанию не определена для графов с изолированными вершинами; см. Кайзер (2008) [13] и Бармпутис и др. [14] Установлено, что сети с максимально возможным средним коэффициентом кластеризации имеют модульную структуру и в то же время имеют минимально возможное среднее расстояние между различными узлами. [14]

Проникновение кластерных сетей [ править ]

Для случайной древовидной сети без степени корреляции можно показать, что такая сеть может иметь гигантскую компоненту , а порог перколяции (вероятность передачи) определяется выражением , где производящая функция, соответствующая распределению избыточной степени .

В сетях с низкой кластеризацией , критическая точка масштабируется на такой, что:

[15]

Это указывает на то, что для данного распределения степеней кластеризация приводит к большему порогу перколяции, главным образом потому, что для фиксированного числа связей структура кластеризации усиливает ядро ​​сети ценой размывания глобальных связей. Для сетей с высокой степенью кластеризации сильная кластеризация может вызвать структуру ядро-периферия, в которой ядро ​​и периферия могут находиться в разных критических точках, и приведенная выше приблизительная трактовка неприменима. [16]

Для исследования устойчивости кластерных сетей разработан перколяционный подход. [17] [18]

См. также [ править ]

Ссылки [ править ]

  1. ^ П.В. Холланд и С. Лейнхардт (1971). «Транзитивность в структурных моделях малых групп». Сравнительные групповые исследования . 2 (2): 107–124. дои : 10.1177/104649647100200201 . S2CID   145544488 .
  2. Перейти обратно: Перейти обратно: а б с DJ Уоттс и Стивен Строгац (июнь 1998 г.). «Коллективная динамика сетей «маленького мира». Природа . 393 (6684): 440–442. Бибкод : 1998Natur.393..440W . дои : 10.1038/30918 . ПМИД   9623998 . S2CID   4429113 .
  3. ^ Ван, Ю; Гумаре, Эшвар; Ванденберге, Рик; Дюпон, Патрик (2017). «Сравнение различных обобщений коэффициента кластеризации и локальной эффективности для взвешенных неориентированных графов» . Нейронные вычисления . 29 (2): 313–331. дои : 10.1162/NECO_a_00914 . ПМИД   27870616 . S2CID   11000115 . Архивировано из оригинала 10 августа 2020 года . Проверено 8 августа 2020 г.
  4. ^ Р.Д. Люс и А.Д. Перри (1949). «Метод матричного анализа групповой структуры». Психометрика . 14 (1): 95–116. дои : 10.1007/BF02289146 . hdl : 10.1007/BF02289146 . ПМИД   18152948 . S2CID   16186758 .
  5. ^ Стэнли Вассерман , Кэтрин Фауст, 1994. Анализ социальных сетей: методы и приложения. Кембридж: Издательство Кембриджского университета.
  6. ^ Торе Опсал и Пьетро Панзараса (2009). «Кластеризация во взвешенных сетях» . Социальные сети . 31 (2): 155–163. дои : 10.1016/j.socnet.2009.02.002 . Архивировано из оригинала 1 июля 2019 г. Проверено 11 июня 2009 г.
  7. Перейти обратно: Перейти обратно: а б Торе Опсал (2009). «Кластеризация в двухрежимных сетях» . Конференция и семинар по двухрежимному социальному анализу (30 сентября – 2 октября 2009 г.) . Архивировано из оригинала 21 марта 2016 года . Проверено 11 сентября 2009 г.
  8. ^ Кемпер, Андреас (2009). Оценка сетевых эффектов на рынках программного обеспечения: комплексный сетевой подход . Спрингер. п. 142. ИСБН  9783790823660 .
  9. ^ Баррат, А.; Бартелеми, М.; Пастор-Саторрас Р.; Веспиньяни, А. (2004). «Архитектура комплексно-взвешенных сетей» . Труды Национальной академии наук . 101 (11): 3747–3752. arXiv : cond-mat/0311416 . Бибкод : 2004PNAS..101.3747B . дои : 10.1073/pnas.0400087101 . ПМЦ   374315 . ПМИД   15007165 .
  10. ^ Латапи, М.; Маньен, К.; Дель Веккио, Н. (2008). «Основные понятия анализа больших двухрежимных сетей» (PDF) . Социальные сети . 30 (1): 31–48. дои : 10.1016/j.socnet.2007.04.006 .
  11. ^ Фаджиоло, Г. (2007). «Кластеризация в сложных направленных сетях». Физический обзор E . 76 (2 Pt 2): 026107. arXiv : физика/0612169 . CiteSeerX   10.1.1.262.1006 . дои : 10.1103/PhysRevE.76.026107 . ПМИД   17930104 . S2CID   2317676 .
  12. ^ Клементе, врач общей практики; Грасси, Р. (2018). «Направленная кластеризация во взвешенных сетях: новая перспектива». Хаос, солитоны и фракталы . 107 : 26–38. arXiv : 1706.07322 . Бибкод : 2018CSF...107...26C . дои : 10.1016/j.chaos.2017.12.007 . S2CID   21919524 .
  13. ^ Кайзер, Маркус (2008). «Средние коэффициенты кластеризации: роль изолированных узлов и листьев в мерах кластеризации для сетей маленького мира». Новый журнал физики . 10 (8): 083042. arXiv : 0802.2512 . Бибкод : 2008NJPh...10h3042K . дои : 10.1088/1367-2630/10/8/083042 . S2CID   16480565 .
  14. Перейти обратно: Перейти обратно: а б Бармпутис, Д.; Мюррей, РМ (2010). «Сети с наименьшим средним расстоянием и наибольшей средней кластеризацией». arXiv : 1007.4031 [ q-bio.MN ].
  15. ^ Берченко, Якир; Артзи-Рандруп, Яэль; Тейчер, Мина; Стоун, Леви (30 марта 2009 г.). «Появление и размер гигантской компоненты в кластерных случайных графах с заданным распределением степеней» . Письма о физических отзывах . 102 (13): 138701. doi : 10.1103/PhysRevLett.102.138701 . ISSN   0031-9007 . ПМИД   19392410 . Архивировано из оригинала 4 февраля 2023 г. Проверено 24 февраля 2022 г.
  16. ^ Берченко, Якир; Артзи-Рандруп, Яэль; Тейчер, Мина; Стоун, Леви (30 марта 2009 г.). «Появление и размер гигантской компоненты в кластерных случайных графах с заданным распределением степеней» . Письма о физических отзывах . 102 (13): 138701. doi : 10.1103/PhysRevLett.102.138701 . ISSN   0031-9007 . ПМИД   19392410 . Архивировано из оригинала 4 февраля 2023 г. Проверено 24 февраля 2022 г.
  17. ^ МЭД Ньюман (2009). «Случайные графы с кластеризацией». Физ. Преподобный Летт . 103 (5): 058701. arXiv : 0903.4009 . doi : 10.1103/PhysRevLett.103.058701 . ПМИД   19792540 . S2CID   28214709 .
  18. ^ А. Хакетт; С. Мельник и Дж. П. Глисон (2011). «Каскады в классе кластеризованных случайных сетей». Физ. Преподобный Е. 83 (5, часть 2): 056107. arXiv : 1012.3651 . дои : 10.1103/PhysRevE.83.056107 . ПМИД   21728605 . S2CID   18071422 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: fb4af01411694378818d3319e21297f4__1712449020
URL1:https://arc.ask3.ru/arc/aa/fb/f4/fb4af01411694378818d3319e21297f4.html
Заголовок, (Title) документа по адресу, URL1:
Clustering coefficient - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)