Jump to content

Рандомизация с сохранением степени

Рандомизация с сохранением степени — это метод, используемый в сетевых науках , целью которого является оценка того, могут ли вариации, наблюдаемые в данном графе, быть просто артефактом присущих структурных свойств графа, а не свойств, уникальных для узлов в наблюдаемой сети.

Внесен в каталог еще в 1996 году. [1] простейшая реализация рандомизации с сохранением степени основана на алгоритме Монте-Карло , который случайным образом перестраивает или «перемонтирует» сеть, так что при достаточном количестве переподключений распределение степеней сети идентично начальному распределению степеней сети, хотя топологическая структура сети стала полностью отличной от исходной сети.

Демонстрация одной итерации алгоритма рандомизации с сохранением степени.

Рандомизация, сохраняющая степень, хотя и имеет множество различных форм, обычно принимает форму относительно простого подхода: для любой сети, состоящей из узлы с ребра, выберите два попарно связанных узла. Для каждой из этих диадических пар поменяйте местами ребра так, чтобы новые диадические пары не совпадали. После достаточного количества этих несоответствий сеть все больше теряет свою первоначальную наблюдаемую топографию.

Как это обычно бывает с алгоритмами, основанными на цепях Маркова , количество итераций или отдельных переназначений, которые должны произойти на данном графе, чтобы граф был достаточно случайным и отличался от исходного графа, неизвестно, хотя Эспиноза [2] утверждает, что безопасный минимальный порог равен , где «не менее 100» (Эспиноза). Другие внесли свой вклад в решение этой проблемы, в том числе один автор, который утверждает, что вместо этого безопасный минимум может составлять не менее , где эпсилон находится в диапазоне между и , хотя точное число в настоящее время неизвестно. [3] [4]

Использование

[ редактировать ]

Есть несколько случаев, когда опубликованные исследования явно использовали рандомизацию с сохранением степени для анализа свойств сети. Деккер [5] использовал перепрограммирование, чтобы более точно смоделировать наблюдаемые социальные сети, добавив вторичную переменную, , что приводит к высокой степени предвзятости привязанности. Лю и др. [6] дополнительно использовали рандомизацию с сохранением степени, чтобы утверждать, что контрольная центральность , метрика, которую они идентифицируют, мало меняется по сравнению с контрольной центральностью модели Эрдеша-Реньи, содержащей такое же количество узлы в своих симуляциях - Лю и др. также использовали модели рандомизации, сохраняющие степень, в последующей работе по изучению управляемости сети . [7]

Кроме того, была проделана некоторая работа по исследованию того, как рандомизация с сохранением степени может использоваться для решения вопросов анонимности в исследованиях сетевых данных, что, как было показано, является причиной беспокойства в анализе социальных сетей , как в случае с исследованием Льюиса. и др. [8] [9] В конечном итоге работа, проведенная Инь и Ву, начиная с создания рандомизации с сохранением степени, а затем внося несколько модификаций, продемонстрировала умеренный прогресс в защите анонимности без ущерба для целостности базовой полезности наблюдаемой сети. [10]

Кроме того, этот метод по своей природе аналогичен широко используемым моделям экспоненциальных случайных графов, популяризированным в социальных науках. [11] [12] и действительно, различные формы моделирования сетей по сравнению с наблюдаемыми сетями с целью выявления и теоретизирования о различиях, выраженных в реальных сетях. Важно отметить, что рандомизация с сохранением степени обеспечивает простой алгоритмический дизайн для тех, кто знаком с программированием, позволяющий применить модель к доступной наблюдаемой сети.

Далее следует небольшой пример, показывающий, как можно применить рандомизацию с сохранением степени к наблюдаемой сети, чтобы понять работу сети в отношении случайных изменений, сохраняя при этом аспект распределения степени в сети. У Ассоциации интернет-исследователей есть рассылка , которая составляет большинство тем дискуссий, касающихся их работы. На нем участники публикуют обновления о своих собственных исследованиях, предстоящих конференциях, приглашениях на подготовку докладов, а также вовлекают друг друга в предметные дискуссии в своей области. Эти электронные письма, в свою очередь, могут образовывать направленный временной сетевой граф, где узлы — это отдельные учетные записи электронной почты, принадлежащие Listserv, а края — это случаи, когда один адрес электронной почты отвечает на другой адрес электронной почты в Listserv.

Результаты рандомизированных исследований с сохранением степени.

В этой наблюдаемой сети свойства Listserv относительно легко вычислить - для сети из 3235 отдельных учетных записей электронной почты и 9824 обменов в общей сложности наблюдаемая взаимность сети составляет около 0,074, а [Средняя длина пути|среднее значение длина пути] составляет около 4,46. Могут ли эти ценности быть достигнуты просто за счет природы внутренней структуры сети?

Применение Как правило, этой сети потребуется около 67 861 отдельных перемонтажей ребер, чтобы построить, вероятно, достаточно случайный граф с сохранением степени. Если мы построим множество случайных графов, сохраняющих степень, на основе реального графа, мы сможем затем создать вероятностное пространство для таких характеристик, как взаимность и средняя длина пути, и оценить степень, в которой сеть могла бы выразить эти характеристики случайным образом. 534 сети были созданы с использованием рандомизации с сохранением степени. Поскольку и взаимность, и средняя длина пути на этом графике нормально распределены, а стандартное отклонение как для взаимности, так и для средней длины пути слишком узкое, чтобы включить наблюдаемый случай, мы можем обоснованно предположить, что эта сеть выражает характеристики, которые не являются случайным (и, таким образом, открытым для дальнейшей теории и моделирования).

  1. ^ Рао, Рамачандра; Яна, Рабиндранат; Бандиопадхьяй, Сурадж (1996). «Метод Монте-Карло для цепи Маркова для генерации случайных (0, 1)-матриц с заданными маргинальными значениями» (PDF) . Индийский статистический журнал, серия A. Проверено 5 ноября 2014 г.
  2. ^ Эспиноза, Макс. «О методах сетевой рандомизации: исследование отрицательного контроля» (PDF) . Архивировано из оригинала (PDF) 4 марта 2016 г. Проверено 6 ноября 2014 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  3. ^ Re: [igraph] Перемонтирование большого графа с сохранением степени
  4. ^ Пинар, Али; Рэй, Джайдип; Сешадри, С. (2012), Мы уже приехали? Когда останавливать цепь Маркова при создании случайных графов (PDF) , arXiv : 1202.3473 , Bibcode : 2012arXiv1202.3473R
  5. ^ Деккер, А.Х. (2007), «Реалистичные социальные сети для моделирования с использованием перемонтажа сети» (PDF) , Proceedings MODSIM, 2007 г.
  6. ^ Лю, Ю.Г.; Слотин, Джей-Джей; Барабаши, AL (2012), «Центральность управления и иерархическая структура в сложных сетях», PLOS ONE , 7 (9): e44459, arXiv : 1203.2655 , Bibcode : 2012PLoSO...744459L , doi : 10.1371/journal.pone.0044459 , ПМК   3459977 , ПМИД   23028542
  7. ^ Лю, Ян-Ю; Слотин, Жан-Жак; Барабаши, Альберт-Ласло (2013), «Влияние корреляций на управляемость сети», Sci. Rep. , 3 : 1067, arXiv : 1203.5161 , Bibcode : 2013NatSR...3E1067P , doi : 10.1038/srep01067 , PMC   3545232 , PMID   23323210
  8. ^ Парри, Марк (10 июля 2011 г.), «Исследователей Гарварда обвиняют в нарушении конфиденциальности студентов» , The Chronicle of Higher Education , получено 5 ноября 2014 г.
  9. ^ Льюис, Кевин; Кауфман, Джейсон; Гонсалес, Марко; Виммер, Андреас; Кристакис, Николас (2008), «Вкусы, связи и время: новый набор данных социальных сетей с использованием Facebook.com» (PDF) , Social Networks , 30 (4): 330–342, CiteSeerX   10.1.1.158.9087 , doi : 10.1016/j.socnet.2008.07.002
  10. ^ Инь, Сяовэй; Ву, Синьтао (2008), «Рандомизация социальных сетей: подход, сохраняющий спектр», SDM : 739–750, CiteSeerX   10.1.1.140.6647 , doi : 10.1137/1.9781611972788.67 , ISBN  978-0-89871-654-2
  11. ^ Снейдерс, Том А.Б. (2002), «Оценка методом Монте-Карло экспоненциальных моделей случайных графов марковской цепью» , Журнал социальной структуры , 3 (2): 1–40
  12. ^ Робинс, Гарри; Паттерсон, Пип; Калиш, Юваль; Люшер, Дин (2007), «Введение в модели экспоненциального случайного графа для социальных сетей», Social Networks , 29 (2): 173–191, doi : 10.1016/j.socnet.2006.08.002 , hdl : 1959.3/216571
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a5ac00b971d54b03fb24ae38f7b9aa97__1706081880
URL1:https://arc.ask3.ru/arc/aa/a5/97/a5ac00b971d54b03fb24ae38f7b9aa97.html
Заголовок, (Title) документа по адресу, URL1:
Degree-preserving randomization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)