ЧейРанк
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|

CheiRank . — это собственный вектор с максимальным действительным собственным значением матрицы Google построен для направленной сети с инвертированными направлениями связей. Он аналогичен вектору PageRank , который ранжирует узлы сети в среднем пропорционально количеству входящих ссылок, являющемуся максимальным собственным вектором матрицы Google. с заданным начальным направлением ссылок. За счет инверсии направлений каналов CheiRank ранжирует узлы сети в среднем пропорционально количеству исходящих каналов. Поскольку каждый узел принадлежит как векторам CheiRank, так и векторам PageRank , ранжирование информационного потока в направленной сети становится двумерным .
Определение
[ редактировать ]
Для заданной направленной сети матрица Google строится способом, описанным в статье Матрица Google . Вектор PageRank — это собственный вектор с максимальным действительным собственным значением. . Оно было введено в [1] и обсуждается в статье PageRank . Аналогичным образом CheiRank — это собственный вектор с максимальным действительным собственным значением матрицы построен так же, как но с использованием инвертированного направления связей в изначально заданной матрице смежности . Обе матрицы и принадлежат классу операторов Перрона–Фробениуса и согласно теореме Перрона–Фробениуса CheiRank и PageRank собственные векторы имеют неотрицательные компоненты, которые можно интерпретировать как вероятности. [2] [3] Таким образом, все узлы сети можно упорядочить в порядке убывания вероятности с рангами для CheiRank и PageRank соответственно. В среднем вероятность PageRank пропорциональна количеству входящих ссылок с . [4] [5] [6] Для сети World Wide Web (WWW) показатель степени где — показатель распределения входящих ссылок. [4] [5] Аналогичным образом вероятность CheiRank в среднем пропорциональна количеству исходящих ссылок с с где — показатель распределения исходящих ссылок WWW. [4] [5] CheiRank был введен для сети вызова процедур программного обеспечения ядра Linux в: [7] сам термин использовался у Жирова. [8] В то время как PageRank выделяет очень известные и популярные узлы, CheiRank выделяет очень коммуникативные узлы. Узлы Top PageRank и CheiRank имеют определенную аналогию с авторитетными источниками и хабами, появляющимися в алгоритме HITS. [9] но HITS зависит от запроса, а вероятности ранга и классифицировать все узлы сети. Поскольку каждый узел принадлежит как CheiRank, так и PageRank, мы получаем двумерный рейтинг узлов сети. Ранние исследования PageRank в сетях с перевернутым направлением ссылок проводились. [10] [11] но свойства двумерного ранжирования подробно не анализировались.

Примеры
[ редактировать ]Пример распределения узлов в плоскости PageRank и CheiRank показан на рис.1 для сети вызова процедур программного обеспечения Linux Kernel. [7]

Зависимость на Для сети гиперссылок сети Википедии англоязычные статьи показаны на рис.2 от Жирова. Распределение этих статей в плоскости PageRank и CheiRank показано на рис.3 от Жирова. Разницу между PageRank и CheiRank хорошо видно по названиям статей Википедии (2009 г.) с самым высоким рейтингом. На вершине PageRank у нас есть 1.Соединенные Штаты, 2.Великобритания, 3.Франция, а для CheiRank мы находим 1.Портал: Содержание/Описание знаний/География и места, 2.Список лидеров государств по годам, 3. Портал: Содержание/Указатель/География и места. Очевидно, что PageRank выбирает первые статьи на широко известную тему с большим количеством входящих ссылок, тогда как CheiRank выбирает первые очень коммуникативные статьи с большим количеством исходящих ссылок. Поскольку статьи распределены в 2D, их можно ранжировать различными способами в соответствии с проекцией 2D-набора на линию. Горизонтальные и вертикальные линии соответствуют PageRank и CheiRank, 2DRank сочетает в себе свойства CheiRank и PageRank, как это обсуждается у Жирова. [8] Он дает лучшие статьи Википедии 1.Индия, 2.Сингапур, 3.Пакистан.
2D-рейтинг выделяет свойства статей Википедии новым, богатым и плодотворным способом. Согласно PageRank, 100 лучших личностей, описанных в статьях Википедии, относятся к 5 основным категориям деятельности: 58 (политика), 10 (религия), 17 (искусство), 15 (наука), 0 (спорт), и, таким образом, важность политиков возрастает. сильно переоценена. CheiRank дает соответственно 15, 1, 52, 16, 16, тогда как для 2DRank можно найти 24, 5, 62, 7, 2. Такой тип 2D-ранжирования может найти полезные приложения для различных сложных направленных сетей, включая WWW.
CheiRank и PageRank, естественно, появляются для мировой торговой сети или международной торговли , где они связаны с потоками экспорта и импорта для данной страны соответственно. [12]
Рассмотрены возможности разработки двумерных поисковых систем на основе PageRank и CheiRank. [13] Направленные сети можно охарактеризовать коррелятором между векторами PageRank и CheiRank: в некоторых сетях этот коррелятор близок к нулю (например, сеть ядра Linux), в то время как другие сети имеют большие значения коррелятора (например, Arc.Ask3.Ru или университетские сети). [7] [13]
Простой пример сети
[ редактировать ]


Простой пример построения матриц Google и , используемый для определения связанных векторов PageRank и CheiRank, приведен ниже. Пример направленной сети с 7 узлами показан на рис.4. Матрица , построенный по описанным правиламв статье Матрица Google показана на рис.5;соответствующая матрица Google: а вектор PageRank — это правый собственный вектор с единичным собственным значением ( ). Аналогичным образом для определения собственного вектора CheiRank все направления связей на рис.4 инвертируются,тогда матрица построен,по тем же правилам, что и для сети с инвертированной связьюнаправлениях, как показано на фиг.6. Соответствующая матрица Google: и вектор CheiRankявляется правым собственным вектором с единичным собственным значением ( ). Здесь – коэффициент демпфирования, принимаемый в его обычном значении.
См. также
[ редактировать ]- PageRank , алгоритм HITS , матрица Google
- Цепи Маркова , Оператор Трансфера , Теорема Перрона–Фробениуса
- Поиск информации
- Поисковые системы в Интернете
Ссылки
[ редактировать ]- ^ Брин С.; Пейдж Л. (1998), «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете», Computer Networks and ISDN Systems , 30 (1–7): 107, doi : 10.1016/S0169-7552(98)00110-X , S2CID 7587743
- ^ Лэнгвилл, Эми Н .; Карл Мейер (2006). PageRank Google и не только . Издательство Принстонского университета . ISBN 0-691-12202-4 .
- ^ Остин, Дэвид (2008). «Как Google находит вашу иголку в стоге сена в Интернете» . Столбцы функций AMS.
- ^ Jump up to: а б с Донато Д.; Лаура Л.; Леонарди С.; Миллоцци С. (2004), «Крупномасштабные свойства веб-графа», European Physical Journal B , 38 (2): 239, Bibcode : 2004EPJB...38..239D , doi : 10.1140/epjb/e2004-00056-6 , S2CID 10640375
- ^ Jump up to: а б с Пандуранган Г.; Рангаван П.; Упфал Э. (2005), «Использование PageRank для характеристики веб-структуры», Internet Math. , 3 :1, дои : 10.1080/15427951.2006.10129114
- ^ Литвак, Н. ; Шейнхардт, WRW; Волкович, Ю. (2008), Вероятностная связь между степенью и PageRank , Конспект лекций по информатике, том. 4936, с. 72
- ^ Jump up to: а б с Чепелянский, Алексей Д. (2010). «К физическим законам архитектуры программного обеспечения». arXiv : 1003.5455 [ cs.SE ].
- ^ Jump up to: а б Zhirov A.O.; Zhirov O.V.; Shepelyansky D.L. (2010), "Two-dimensional ranking of Wikipedia articles", European Physical Journal B , 77 (4): 523, arXiv : 1006.4270 , Bibcode : 2010EPJB...77..523Z , doi : 10.1140/epjb/e2010-10500-7 , S2CID 18014470
- ^ Кляйнберг, Джон (1999). «Авторитетные источники в гиперссылочной среде» . Журнал АКМ . 46 (5): 604–632. дои : 10.1145/324133.324140 . S2CID 221584113 .
- ^ Фогарас, Д. (2003), С чего начать просмотр веб-страниц? , Конспекты лекций по информатике, вып. 2877, с. 65
- ^ Хриситидис В.; Хван Х.; Папаконстантину Ю. (2008), «Поиск по ключевым словам в базах данных на основе авторитетных источников», ACM Trans. Система баз данных. , 33 : 1, doi : 10.1145/1331904.1331905 , S2CID 11978441
- ^ Эрманн Л.; Шепелянский Д.Л. (2011). «Google-матрица всемирной торговой сети». Acta Physica Polonica А. 120 (6А): А. arXiv : 1103,5027 . Бибкод : 2011AcPPA.120..158E . doi : 10.12693/APhysPolA.120.A-158 . S2CID 18315654 .
- ^ Jump up to: а б Эрманн Л.; Чепелянский А.Д.; Шепелянский Д.Л. (2011). «На пути к двумерным поисковым системам». Физический журнал A: Математический и теоретический . 45 (27): 275101. arXiv : 1106.6215 . Бибкод : 2012JPhA...45A5101E . дои : 10.1088/1751-8113/45/27/275101 . S2CID 14827486 .