Jump to content

ЧейРанк

Узлы со ссылками в плоскости PageRank и CheiRank

CheiRank . — это собственный вектор с максимальным действительным собственным значением матрицы Google построен для направленной сети с инвертированными направлениями связей. Он аналогичен вектору PageRank , который ранжирует узлы сети в среднем пропорционально количеству входящих ссылок, являющемуся максимальным собственным вектором матрицы Google. с заданным начальным направлением ссылок. За счет инверсии направлений каналов CheiRank ранжирует узлы сети в среднем пропорционально количеству исходящих каналов. Поскольку каждый узел принадлежит как векторам CheiRank, так и векторам PageRank , ранжирование информационного потока в направленной сети становится двумерным .

Определение

[ редактировать ]
Рис1. Распределение вызовов процедур сети ядра Linux в плоскости вероятности PageRank и вероятность CheiRank для Linux версии 2.6.32 с размером матрицы в , цвет показывает плотность узлов: белый — максимум, синий — минимум, в чёрном пространстве узлов нет (из Чепелянского)

Для заданной направленной сети матрица Google строится способом, описанным в статье Матрица Google . Вектор PageRank — это собственный вектор с максимальным действительным собственным значением. . Оно было введено в [1] и обсуждается в статье PageRank . Аналогичным образом CheiRank — это собственный вектор с максимальным действительным собственным значением матрицы построен так же, как но с использованием инвертированного направления связей в изначально заданной матрице смежности . Обе матрицы и принадлежат классу операторов Перрона–Фробениуса и согласно теореме Перрона–Фробениуса CheiRank и PageRank собственные векторы имеют неотрицательные компоненты, которые можно интерпретировать как вероятности. [2] [3] Таким образом, все узлы сети можно упорядочить в порядке убывания вероятности с рангами для CheiRank и PageRank соответственно. В среднем вероятность PageRank пропорциональна количеству входящих ссылок с . [4] [5] [6] Для сети World Wide Web (WWW) показатель степени где — показатель распределения входящих ссылок. [4] [5] Аналогичным образом вероятность CheiRank в среднем пропорциональна количеству исходящих ссылок с с где — показатель распределения исходящих ссылок WWW. [4] [5] CheiRank был введен для сети вызова процедур программного обеспечения ядра Linux в: [7] сам термин использовался у Жирова. [8] В то время как PageRank выделяет очень известные и популярные узлы, CheiRank выделяет очень коммуникативные узлы. Узлы Top PageRank и CheiRank имеют определенную аналогию с авторитетными источниками и хабами, появляющимися в алгоритме HITS. [9] но HITS зависит от запроса, а вероятности ранга и классифицировать все узлы сети. Поскольку каждый узел принадлежит как CheiRank, так и PageRank, мы получаем двумерный рейтинг узлов сети. Ранние исследования PageRank в сетях с перевернутым направлением ссылок проводились. [10] [11] но свойства двумерного ранжирования подробно не анализировались.

Рис2. Зависимость вероятности PageRank (красная кривая) и CheiRank (синяя кривая) на соответствующих индексах ранга и . Прямые пунктирные линии показывают степенную зависимость с наклоном соответственно, что соответствует (from Zhirov)

Пример распределения узлов в плоскости PageRank и CheiRank показан на рис.1 для сети вызова процедур программного обеспечения Linux Kernel. [7]

Рис3. Распределение плотности англоязычных статей Википедии (2009 г.) в плоскости индексов PageRank и CheiRank показано цветом: синий — минимум, белый — максимум (черный — ноль); зеленые/красные точки обозначают 100 лучших личностей по данным PageRank/CheiRank, желтые плюсы показывают 100 лучших личностей из книги Харта, количество статей. (from Zhirov)

Зависимость на Для сети гиперссылок сети Википедии англоязычные статьи показаны на рис.2 от Жирова. Распределение этих статей в плоскости PageRank и CheiRank показано на рис.3 от Жирова. Разницу между PageRank и CheiRank хорошо видно по названиям статей Википедии (2009 г.) с самым высоким рейтингом. На вершине PageRank у нас есть 1.Соединенные Штаты, 2.Великобритания, 3.Франция, а для CheiRank мы находим 1.Портал: Содержание/Описание знаний/География и места, 2.Список лидеров государств по годам, 3. Портал: Содержание/Указатель/География и места. Очевидно, что PageRank выбирает первые статьи на широко известную тему с большим количеством входящих ссылок, тогда как CheiRank выбирает первые очень коммуникативные статьи с большим количеством исходящих ссылок. Поскольку статьи распределены в 2D, их можно ранжировать различными способами в соответствии с проекцией 2D-набора на линию. Горизонтальные и вертикальные линии соответствуют PageRank и CheiRank, 2DRank сочетает в себе свойства CheiRank и PageRank, как это обсуждается у Жирова. [8] Он дает лучшие статьи Википедии 1.Индия, 2.Сингапур, 3.Пакистан.

2D-рейтинг выделяет свойства статей Википедии новым, богатым и плодотворным способом. Согласно PageRank, 100 лучших личностей, описанных в статьях Википедии, относятся к 5 основным категориям деятельности: 58 ​​(политика), 10 (религия), 17 (искусство), 15 (наука), 0 (спорт), и, таким образом, важность политиков возрастает. сильно переоценена. CheiRank дает соответственно 15, 1, 52, 16, 16, тогда как для 2DRank можно найти 24, 5, 62, 7, 2. Такой тип 2D-ранжирования может найти полезные приложения для различных сложных направленных сетей, включая WWW.

CheiRank и PageRank, естественно, появляются для мировой торговой сети или международной торговли , где они связаны с потоками экспорта и импорта для данной страны соответственно. [12]

Рассмотрены возможности разработки двумерных поисковых систем на основе PageRank и CheiRank. [13] Направленные сети можно охарактеризовать коррелятором между векторами PageRank и CheiRank: в некоторых сетях этот коррелятор близок к нулю (например, сеть ядра Linux), в то время как другие сети имеют большие значения коррелятора (например, Arc.Ask3.Ru или университетские сети). [7] [13]

Простой пример сети

[ редактировать ]
Рис4. Пример направленной сети
Рис5. Связанная матрица
Рис6. Связанная матрица

Простой пример построения матриц Google и , используемый для определения связанных векторов PageRank и CheiRank, приведен ниже. Пример направленной сети с 7 узлами показан на рис.4. Матрица , построенный по описанным правиламв статье Матрица Google показана на рис.5;соответствующая матрица Google: а вектор PageRank — это правый собственный вектор с единичным собственным значением ( ). Аналогичным образом для определения собственного вектора CheiRank все направления связей на рис.4 инвертируются,тогда матрица построен,по тем же правилам, что и для сети с инвертированной связьюнаправлениях, как показано на фиг.6. Соответствующая матрица Google: и вектор CheiRankявляется правым собственным вектором с единичным собственным значением ( ). Здесь – коэффициент демпфирования, принимаемый в его обычном значении.

См. также

[ редактировать ]
  1. ^ Брин С.; Пейдж Л. (1998), «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете», Computer Networks and ISDN Systems , 30 (1–7): 107, doi : 10.1016/S0169-7552(98)00110-X , S2CID   7587743
  2. ^ Лэнгвилл, Эми Н .; Карл Мейер (2006). PageRank Google и не только . Издательство Принстонского университета . ISBN  0-691-12202-4 .
  3. ^ Остин, Дэвид (2008). «Как Google находит вашу иголку в стоге сена в Интернете» . Столбцы функций AMS.
  4. ^ Jump up to: а б с Донато Д.; Лаура Л.; Леонарди С.; Миллоцци С. (2004), «Крупномасштабные свойства веб-графа», European Physical Journal B , 38 (2): 239, Bibcode : 2004EPJB...38..239D , doi : 10.1140/epjb/e2004-00056-6 , S2CID   10640375
  5. ^ Jump up to: а б с Пандуранган Г.; Рангаван П.; Упфал Э. (2005), «Использование PageRank для характеристики веб-структуры», Internet Math. , 3 :1, дои : 10.1080/15427951.2006.10129114
  6. ^ Литвак, Н. ; Шейнхардт, WRW; Волкович, Ю. (2008), Вероятностная связь между степенью и PageRank , Конспект лекций по информатике, том. 4936, с. 72
  7. ^ Jump up to: а б с Чепелянский, Алексей Д. (2010). «К физическим законам архитектуры программного обеспечения». arXiv : 1003.5455 [ cs.SE ].
  8. ^ Jump up to: а б Zhirov A.O.; Zhirov O.V.; Shepelyansky D.L. (2010), "Two-dimensional ranking of Wikipedia articles", European Physical Journal B , 77 (4): 523, arXiv : 1006.4270 , Bibcode : 2010EPJB...77..523Z , doi : 10.1140/epjb/e2010-10500-7 , S2CID  18014470
  9. ^ Кляйнберг, Джон (1999). «Авторитетные источники в гиперссылочной среде» . Журнал АКМ . 46 (5): 604–632. дои : 10.1145/324133.324140 . S2CID   221584113 .
  10. ^ Фогарас, Д. (2003), С чего начать просмотр веб-страниц? , Конспекты лекций по информатике, вып. 2877, с. 65
  11. ^ Хриситидис В.; Хван Х.; Папаконстантину Ю. (2008), «Поиск по ключевым словам в базах данных на основе авторитетных источников», ACM Trans. Система баз данных. , 33 : 1, doi : 10.1145/1331904.1331905 , S2CID   11978441
  12. ^ Эрманн Л.; Шепелянский Д.Л. (2011). «Google-матрица всемирной торговой сети». Acta Physica Polonica А. 120 (6А): А. arXiv : 1103,5027 . Бибкод : 2011AcPPA.120..158E . doi : 10.12693/APhysPolA.120.A-158 . S2CID   18315654 .
  13. ^ Jump up to: а б Эрманн Л.; Чепелянский А.Д.; Шепелянский Д.Л. (2011). «На пути к двумерным поисковым системам». Физический журнал A: Математический и теоретический . 45 (27): 275101. arXiv : 1106.6215 . Бибкод : 2012JPhA...45A5101E . дои : 10.1088/1751-8113/45/27/275101 . S2CID   14827486 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 73af0781c79e1c1661807b0f66fd6459__1700016060
URL1:https://arc.ask3.ru/arc/aa/73/59/73af0781c79e1c1661807b0f66fd6459.html
Заголовок, (Title) документа по адресу, URL1:
CheiRank - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)