Рейтинг страницы
PageRank ( PR ) — это алгоритм , используемый поиском Google для ранжирования веб-страниц в результатах поисковых систем . Он назван в честь термина «веб-страница» и соучредителя Ларри Пейджа . PageRank — это способ измерения важности страниц веб-сайта. По данным Google:
PageRank подсчитывает количество и качество ссылок на страницу, чтобы приблизительно оценить важность веб-сайта. Основное предположение заключается в том, что более важные веб-сайты, скорее всего, получат больше ссылок с других веб-сайтов. [1]
В настоящее время PageRank — не единственный алгоритм, используемый Google для упорядочивания результатов поиска, но это первый алгоритм, использованный компанией, и он наиболее известен. [2] [3] По состоянию на 24 сентября 2019 г. срок действия всех патентов, связанных с PageRank, истек. [4]
Описание
[ редактировать ]PageRank — это алгоритм анализа ссылок , который присваивает числовой вес каждому элементу документов, связанных гиперссылками набора , например, во Всемирной паутине , с целью «измерения» его относительной важности в наборе. Алгоритм может быть применен к любому набору сущностей с взаимными кавычками и ссылками. Числовой вес, который он присваивает любому данному элементу E, называется PageRank E и обозначается как
PageRank является результатом математического алгоритма, основанного на веб-графе , созданном всеми страницами Всемирной паутины в качестве узлов и гиперссылками в качестве ребер, с учетом таких авторитетных центров, как cnn.com или mayoclinic.org . Значение ранга указывает на важность конкретной страницы. Гиперссылка на страницу считается голосом в поддержку. PageRank страницы определяется рекурсивно и зависит от количества и показателя PageRank всех страниц, которые ссылаются на нее (« входящие ссылки »). Страница, на которую ссылается множество страниц с высоким PageRank, сама получает высокий рейтинг.
После выхода оригинальной статьи Пейджа и Брина было опубликовано множество научных статей, касающихся PageRank. [5] На практике концепция PageRank может быть уязвима для манипуляций. Было проведено исследование по выявлению ложно влияющих на рейтинг PageRank. Цель состоит в том, чтобы найти эффективные средства игнорирования ссылок из документов с ложным влиянием PageRank. [6]
Другие алгоритмы ранжирования веб-страниц на основе ссылок включают алгоритм HITS, изобретенный Джоном Кляйнбергом (используемый Teoma , а теперь Ask.com ), проект IBM CLEVER , алгоритм TrustRank , алгоритм Hummingbird , [7] и алгоритм SALSA . [8]
История
[ редактировать ]Проблема собственных значений , лежащая в основе алгоритма PageRank, была независимо переоткрыта и повторно использована во многих задачах оценки. В 1895 году Эдмунд Ландау предложил использовать его для определения победителя шахматного турнира. [9] [10] Проблема собственных значений была также предложена в 1976 году Габриэлем Пински и Фрэнсисом Нарином, которые работали над наукометрическим рейтингом научных журналов. [11] в 1977 году Томас Саати в своей концепции процесса аналитической иерархии , которая взвешивала альтернативные варианты, [12] а в 1995 году Брэдли Лавом и Стивеном Сломаном в качестве когнитивной модели концепций — алгоритм центральности. [13] [14]
Поисковая система RankDex от IDD Information Services, разработанная Робином Ли в 1996 году, разработала стратегию оценки сайта и ранжирования страниц. [15] Ли назвал свой механизм поиска «анализом ссылок», который включает в себя ранжирование популярности веб-сайта на основе количества других сайтов, ссылающихся на него. [16] RankDex, первая поисковая система с алгоритмами ранжирования страниц и сайтов, была запущена в 1996 году. [17] Ли подал патент на эту технологию в RankDex в 1997 году; он был предоставлен в 1999 году. [18] Позже он использовал его, когда основал Baidu в Китае в 2000 году. [19] [20] Основатель Google Ларри Пейдж упомянул работу Ли как цитату в некоторых своих патентах на PageRank в США. [21] [17] [22]
Ларри Пейдж и Сергей Брин разработали PageRank в Стэнфордском университете в 1996 году в рамках исследовательского проекта нового типа поисковой системы. Интервью с Эктором Гарсиа-Молиной , профессором Стэнфордской информатики и советником Сергея, [23] предоставляет информацию о разработке алгоритма ранга страницы. [24] У Сергея Брина возникла идея, что информацию в сети можно упорядочить в иерархии по «популярности ссылок»: страница занимает более высокий рейтинг, чем больше ссылок на нее. [25] Система была разработана с помощью Скотта Хассана и Алана Стеремберга, которые, по словам Пейджа и Брина, сыграли решающую роль в развитии Google. [5] Раджив Мотвани и Терри Виноград вместе с Пейджем и Брином написали в соавторстве с Пейджем и Брином первую статью о проекте, описывающую PageRank и первоначальный прототип поисковой системы Google , опубликованную в 1998 году. [5] Вскоре после этого Пейдж и Брин основали Google Inc. , компанию, создавшую поисковую систему Google. Хотя PageRank является лишь одним из многих факторов, определяющих рейтинг результатов поиска Google, он продолжает обеспечивать основу для всех инструментов веб-поиска Google. [26]
Название «PageRank» связано с именем разработчика Ларри Пейджа, а также с концепцией веб-страницы . [27] [28] Это слово является товарным знаком Google, а процесс PageRank запатентован ( патент США № 6 285 999 ). Однако патент принадлежит Стэнфордскому университету, а не Google. Google обладает эксклюзивными лицензионными правами на патент Стэнфордского университета. Университет получил 1,8 миллиона акций Google в обмен на использование патента; в 2005 году она продала акции за 336 миллионов долларов США . [29] [30]
PageRank находился под влиянием анализа цитирования , ранее разработанного Юджином Гарфилдом в 1950-х годах в Университете Пенсильвании, и Hyper Search , разработанного Массимо Маркиори в Университете Падуи . В том же году, когда был введен PageRank (1998), Джон Кляйнберг опубликовал свою работу о HITS . Основатели Google цитируют Гарфилда, Маркиори и Кляйнберга в своих оригинальных статьях. [5] [31]
Алгоритм
[ редактировать ]Алгоритм PageRank выводит распределение вероятностей, используемое для представления вероятности того, что человек, случайно нажимающий на ссылки, попадет на какую-либо конкретную страницу. PageRank можно рассчитать для коллекций документов любого размера. В нескольких исследовательских работах предполагается, что распределение равномерно разделено между всеми документами в коллекции в начале вычислительного процесса. Вычисления PageRank требуют нескольких проходов, называемых «итерациями», через коллекцию для корректировки приблизительных значений PageRank, чтобы они более точно отражали теоретическое истинное значение.
Вероятность выражается в виде числового значения от 0 до 1. Вероятность 0,5 обычно выражается как «вероятность 50%» того, что что-то произойдет. Следовательно, документ с PageRank 0,5 означает, что существует 50% вероятность того, что человек, нажавший на случайную ссылку, будет перенаправлен на указанный документ.
Упрощенный алгоритм
[ редактировать ]что это небольшая вселенная из четырех веб-страниц: A , B , C и D. Предположим , Ссылки со страницы на себя игнорируются. Несколько исходящих ссылок с одной страницы на другую рассматриваются как одна ссылка. PageRank инициализируется одинаковым значением для всех страниц. В исходной форме PageRank сумма PageRank по всем страницам представляла собой общее количество страниц в сети на тот момент, поэтому каждая страница в этом примере имела бы начальное значение 1. Однако более поздние версии PageRank и В оставшейся части этого раздела предположим, что распределение вероятностей находится между 0 и 1. Следовательно, начальное значение для каждой страницы в этом примере равно 0,25.
PageRank, передаваемый от данной страницы к целям ее исходящих ссылок на следующей итерации, делится поровну между всеми исходящими ссылками.
Если бы единственные ссылки в системе были со страниц B , C и D на A , каждая ссылка передала бы 0,25 PageRank на A при следующей итерации, что в сумме составит 0,75.
Предположим, что вместо этого страница B имеет ссылку на страницы C и A , страница C имеет ссылку на страницу A , а страница D содержит ссылки на все три страницы. Таким образом, при первой итерации страница B перенесет половину существующего значения (0,125) на страницу A а другую половину (0,125) на страницу C. , Страница C перенесет все свое существующее значение (0,25) на единственную страницу, на которую она ссылается, A . Поскольку у D своей существующей стоимости, или примерно 0,083, в A. было три исходящих канала, он перенес бы одну треть По завершении этой итерации страница А будет иметь PageRank примерно 0,458.
Другими словами, PageRank, присвоенный исходящей ссылкой, равен собственному рейтингу PageRank документа, деленному на количество исходящих ссылок L( ) .
В общем случае значение PageRank для любой страницы u можно выразить как:
- ,
т.е. значение PageRank для страницы u зависит от значений PageRank для каждой страницы v, содержащихся в наборе B u (набор, содержащий все страницы, ссылающиеся на страницу u ), разделенных на количество L ( v ) ссылок со страницы v .
Коэффициент демпфирования
[ редактировать ]Теория PageRank утверждает, что воображаемый пользователь, случайно нажимающий на ссылки, в конечном итоге перестанет нажимать на них. Вероятность на любом этапе того, что человек продолжит переходить по ссылкам, является демпфирующим фактором d . Вероятность того, что вместо этого они перейдут на любую случайную страницу, равна 1 - d . В различных исследованиях проверялись разные коэффициенты демпфирования, но обычно предполагается, что коэффициент демпфирования будет установлен на уровне 0,85. [5]
Коэффициент демпфирования вычитается из 1 (а в некоторых вариантах алгоритма результат делится на количество документов ( N ) в коллекции), а затем этот член прибавляется к произведению коэффициента демпфирования и суммы входящие оценки PageRank. То есть,
Таким образом, PageRank любой страницы в значительной степени зависит от PageRank других страниц. Коэффициент демпфирования корректирует полученное значение в сторону уменьшения. Однако в оригинальной статье была приведена следующая формула, которая привела к некоторой путанице:
Разница между ними в том, что значения PageRank в первой формуле в сумме равны единице, а во второй формуле каждый PageRank умножается на N и сумма становится N. , Утверждение в статье Пейджа и Брина о том, что «сумма всех PageRank равна единице». [5] и претензии других сотрудников Google [32] поддержите первый вариант приведенной выше формулы.
Пейдж и Брин перепутали две формулы в своей самой популярной статье «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете», где они ошибочно заявили, что последняя формула формирует распределение вероятностей по веб-страницам. [5]
Google пересчитывает баллы PageRank каждый раз, когда сканирует Интернет и перестраивает свой индекс. По мере того как Google увеличивает количество документов в своей коллекции, начальное приближение PageRank уменьшается для всех документов.
В формуле используется модель случайного пользователя , который попадает на целевой сайт после нескольких кликов, а затем переключается на случайную страницу. Значение PageRank страницы отражает вероятность того, что случайный пользователь попадет на эту страницу, щелкнув ссылку. Ее можно понимать как цепь Маркова , в которой состояния являются страницами, а переходы — связями между страницами, причем все они равновероятны.
Если страница не имеет ссылок на другие страницы, она становится приемником и, следовательно, прекращает процесс случайного просмотра. Если случайный пользователь попадает на страницу приемника, он выбирает другой URL-адрес случайным образом и продолжает просмотр снова.
При расчете PageRank предполагается, что страницы без исходящих ссылок ссылаются на все остальные страницы в коллекции. Таким образом, их рейтинг PageRank делится поровну между всеми остальными страницами. Другими словами, чтобы быть честным со страницами, которые не являются приемниками, эти случайные переходы добавляются ко всем узлам в сети. Эта остаточная вероятность d обычно устанавливается равной 0,85 и оценивается на основе частоты, с которой средний пользователь использует функцию закладок своего браузера. Итак, уравнение выглядит следующим образом:
где какие страницы находятся на рассмотрении, это набор страниц, которые ссылаются на , количество исходящих ссылок на странице , и это общее количество страниц.
Значения PageRank — это элементы доминирующего правого собственного вектора модифицированной матрицы смежности, масштаб которых изменен так, что сумма каждого столбца равна единице. Это делает PageRank особенно элегантным показателем: собственный вектор
где R — решение уравнения
где функция смежности — это отношение количества ссылок, исходящих со страницы j на страницу i, к общему количеству исходящих ссылок на странице j. Функция смежности равна 0, если страница не ссылается на , и нормирован так, что для каждого j
- ,
т.е. сумма элементов каждого столбца равна 1, поэтому матрица является стохастической матрицей (более подробную информацию см. в разделе вычислений ниже). Таким образом, это вариант меры центральности собственного вектора , обычно используемой в сетевом анализе .
Из-за большого собственного разрыва модифицированной матрицы смежности, приведенной выше, [33] значения собственного вектора PageRank могут быть аппроксимированы с высокой степенью точности всего за несколько итераций.
Основатели Google в своей оригинальной статье [31] сообщили, что алгоритм PageRank для сети, состоящей из 322 миллионов ссылок (входящих и исходящих), сходится в пределах допустимого предела за 52 итерации. Сходимость в сети вдвое меньшего размера заняла примерно 45 итераций. На основе этих данных они пришли к выводу, что алгоритм можно очень хорошо масштабировать и что коэффициент масштабирования для чрезвычайно больших сетей будет примерно линейным по величине. , где n — размер сети.
В результате теории Маркова можно показать, что PageRank страницы — это вероятность перехода на эту страницу после большого количества кликов. Это бывает равно где — это ожидание количества кликов (или случайных переходов), необходимых для перехода со страницы обратно на себя.
Одним из основных недостатков PageRank является то, что он отдает предпочтение старым страницам. На новой странице, даже очень хорошей, не будет много ссылок, если она не является частью существующего сайта (сайт представляет собой плотно связанный набор страниц, например, Arc.Ask3.Ru ).
Было предложено несколько стратегий для ускорения расчета PageRank. [34]
Различные стратегии манипулирования PageRank использовались в согласованных усилиях по улучшению рейтинга в результатах поиска и монетизации рекламных ссылок. Эти стратегии серьезно повлияли на надежность концепции PageRank. [ нужна ссылка ] целью которого является определение того, какие документы на самом деле высоко ценятся веб-сообществом.
С декабря 2007 года, когда Google начал активно наказывать сайты, продающие платные текстовые ссылки, Google боролся с фермами ссылок и другими схемами, предназначенными для искусственного завышения PageRank. Google То, как Google определяет фермы ссылок и другие инструменты манипулирования PageRank, является коммерческой тайной .
Вычисление
[ редактировать ]PageRank можно вычислять итеративно или алгебраически. Итерационный метод можно рассматривать как степенной итерации. метод [35] [36] или силовой метод. Основные выполняемые математические операции идентичны.
Итеративный
[ редактировать ]В , предполагается начальное распределение вероятностей, обычно
- .
где N — общее количество страниц, а это страница i в момент времени 0.
На каждом временном шаге вычисление, как подробно описано выше, дает
где d — коэффициент демпфирования,
или в матричной записи
, | ( 1 ) |
где и вектор-столбец длины содержащие только единицы.
Матрица определяется как
то есть
- ,
где обозначает матрицу смежности графа и — диагональная матрица с исходящими степенями на диагонали.
Расчет вероятности производится для каждой страницы в определенный момент времени, а затем повторяется для следующего момента времени. Вычисление заканчивается, когда для некоторого малого
- ,
т.е. когда предполагается сходимость.
Силовой метод
[ редактировать ]Если матрица — вероятность перехода, т. е. стохастическая по столбцу и представляет собой распределение вероятностей (т. е. , где является матрицей всех единиц), то уравнение ( 2 ) эквивалентно
. | ( 3 ) |
Отсюда PageRank является главным собственным вектором . Быстрый и простой способ вычислить это — использовать степенной метод : начиная с произвольного вектора. , оператор применяется последовательно, т.е.
- ,
до
- .
Обратите внимание, что в уравнении ( 3 ) матрицу в правой части скобок можно интерпретировать как
- ,
где — начальное распределение вероятностей. в текущем случае
- .
Наконец, если имеет столбцы только с нулевыми значениями, их следует заменить исходным вектором вероятности . Другими словами,
- ,
где матрица определяется как
- ,
с
В этом случае два приведенных выше вычисления с использованием дают одинаковый PageRank только в том случае, если их результаты нормализованы:
- .
Выполнение
[ редактировать ]Питон
[ редактировать ]import numpy as np
def pagerank(M, d: float = 0.85):
"""PageRank algorithm with explicit number of iterations. Returns ranking of nodes (pages) in the adjacency matrix.
Parameters
----------
M : numpy array
adjacency matrix where M_i,j represents the link from 'j' to 'i', such that for all 'j'
sum(i, M_i,j) = 1
d : float, optional
damping factor, by default 0.85
Returns
-------
numpy array
a vector of ranks such that v_i is the i-th rank from [0, 1],
"""
N = M.shape[1]
w = np.ones(N) / N
M_hat = d * M
v = M_hat @ w + (1 - d)
while(np.linalg.norm(w - v) >= 1e-10):
w = v
v = M_hat @ w + (1 - d)
return v
M = np.array([[0, 0, 0, 0],
[0, 0, 0, 0],
[1, 0.5, 0, 0],
[0, 0.5, 1, 0]])
v = pagerank(M, 0.85)
Вариации
[ редактировать ]PageRank неориентированного графа
[ редактировать ]PageRank неориентированного графа статистически близко к распределению степеней графика , [37] но они, как правило, не идентичны: если — вектор PageRank, определенный выше, и вектор распределения степеней
где обозначает степень вершины , и является множеством ребер графа, тогда при , [38] показывает, что:
то есть PageRank неориентированного графа равен вектору распределения степеней тогда и только тогда, когда граф регулярен, т. е. каждая вершина имеет одинаковую степень.
Ранжирование объектов двух видов
[ редактировать ]Обобщение PageRank на случай ранжирования двух взаимодействующих групп объектов было описано Даугулисом. [39] В приложениях может возникнуть необходимость моделировать системы, имеющие объекты двух типов, где взвешенное отношение определяется для пар объектов. Это приводит к рассмотрению двудольных графов . Для таких графов можно определить две связанные положительные или неотрицательные неприводимые матрицы, соответствующие множествам разбиений вершин. Ранги объектов в обеих группах можно вычислить как собственные векторы, соответствующие максимальным положительным собственным значениям этих матриц. Нормированные собственные векторы существуют и уникальны по теореме Перрона или Перрона – Фробениуса. Пример: потребители и продукты. Вес отношения – это норма потребления продукта.
Распределенный алгоритм расчета PageRank
[ редактировать ]Сарма и др. описать два случайного блуждания на основе распределенных алгоритма для вычисления PageRank узлов в сети. [40] Один алгоритм принимает раунды с высокой вероятностью на любом графе (ориентированном или неориентированном), где n — размер сети и — вероятность сброса ( , который называется коэффициентом демпфирования), используемый при вычислении PageRank. Они также представляют более быстрый алгоритм, который требует раунды в неориентированных графах. В обоих алгоритмах каждый узел обрабатывает и отправляет за раунд определенное количество битов, полилогарифмическое от n — размера сети.
Панель инструментов Google
[ редактировать ]На панели инструментов Google уже давно имеется функция PageRank, которая отображает PageRank посещенной страницы в виде целого числа от 0 (наименее популярный) до 10 (наиболее популярный). Google не раскрыл конкретный метод определения значения PageRank панели инструментов, которое следует рассматривать лишь как приблизительный показатель ценности веб-сайта. «Рейтинг панели инструментов» был доступен проверенным администраторам сайта через интерфейс Инструментов Google для веб-мастеров. Однако 15 октября 2009 г. сотрудник Google подтвердил, что компания удалила PageRank из раздела «Инструменты для веб-мастеров» , заявив: «Мы уже давно говорим людям, что им не следует так сильно зацикливаться на PageRank. Многие сайты владельцы, кажется, думают, что это самый важный показатель , который им нужно отслеживать, но это неправда». [41]
«Рейтинг панели инструментов» обновлялся очень редко. Последний раз он обновлялся в ноябре 2013 года. В октябре 2014 года Мэтт Каттс объявил, что еще одного заметного обновления рейтинга страниц не будет. [42] В марте 2016 года Google объявил, что больше не будет поддерживать эту функцию, и базовый API вскоре перестанет работать. [43] 15 апреля 2016 г. Google отключил отображение данных PageRank на панели инструментов Google. [44] хотя PageRank продолжал использоваться внутри компании для ранжирования контента в результатах поиска. [45]
Рейтинг в поисковой выдаче
[ редактировать ]Страница результатов поисковой системы (SERP) — это фактический результат, возвращаемый поисковой системой в ответ на запрос по ключевому слову. SERP состоит из списка ссылок на веб-страницы с соответствующими текстовыми фрагментами, платными объявлениями, избранными фрагментами и вопросами и ответами. Рейтинг веб-страницы в поисковой выдаче относится к размещению соответствующей ссылки в поисковой выдаче, где более высокое размещение означает более высокий рейтинг в поисковой выдаче. Рейтинг веб-страницы в поисковой выдаче является функцией не только ее PageRank, но и относительно большого и постоянно корректируемого набора факторов (более 200). [46] [ ненадежный источник? ] Поисковая оптимизация (SEO) направлена на повышение рейтинга веб-сайта или набора веб-страниц в поисковой выдаче.
Позиционирование веб-страницы в поисковой выдаче Google по ключевому слову зависит от релевантности и репутации, также известных как авторитет и популярность. PageRank — это показатель Google оценки репутации веб-страницы: он не зависит от ключевого слова. Google использует комбинацию авторитетности веб-страницы и веб-сайта, чтобы определить общий авторитет веб-страницы, конкурирующей за ключевое слово. [47] PageRank домашней страницы веб-сайта является лучшим индикатором авторитетности веб-сайта, предлагаемым Google. [48]
После появления Google Адресов в основной органической поисковой выдаче на рейтинг компании в результатах местного бизнеса влияет множество других факторов, помимо PageRank. [49] Когда Google подробно рассказал о причинах снижения рейтинга PageRank на конференции Q&A #март 2016 г., они объявили ссылки и контент главными факторами ранжирования. Ранее, в октябре 2015 года, RankBrain был объявлен фактором ранжирования №3, поэтому Google официально подтвердил три главных фактора. [50]
PageRank в каталоге Google
[ редактировать ]PageRank каталога Google измерялся 8 единицами. В отличие от панели инструментов Google, которая показывает числовое значение PageRank при наведении курсора мыши на зеленую полосу, в Каталоге Google отображается только полоса, а не числовые значения. Каталог Google был закрыт 20 июля 2011 г. [51]
Ложный или поддельный PageRank
[ редактировать ]Было известно, что PageRank, отображаемый на панели инструментов, можно было легко подделать . Перенаправление с одной страницы на другую либо через ответ HTTP 302 «Обновить» , либо через метатег приводило к тому, что исходная страница получала PageRank целевой страницы. Следовательно, новая страница с PR 0 и отсутствием входящих ссылок могла бы получить PR 10 при перенаправлении на домашнюю страницу Google. Подделку обычно можно обнаружить, выполнив поиск в Google исходного URL-адреса; если в результатах отображается URL-адрес совершенно другого сайта, последний URL-адрес может представлять собой пункт назначения перенаправления.
Манипулирование PageRank
[ редактировать ]В целях поисковой оптимизации некоторые компании предлагают продавать ссылки с высоким PageRank веб-мастерам. [52] Поскольку ссылки со страниц с более высоким PR считаются более ценными, они, как правило, стоят дороже. Покупка рекламных ссылок на качественных страницах контента и соответствующих сайтах может быть эффективной и жизнеспособной маркетинговой стратегией для привлечения трафика и повышения популярности ссылок веб-мастера. Однако Google публично предупредил веб-мастеров, что если они продают ссылки с целью повышения PageRank и репутации, их ссылки будут обесценены (игнорируются при расчете PageRank других страниц). Практика покупки и продажи [53] активно обсуждается в сообществе веб-мастеров. Google посоветовал веб-мастерам использовать nofollow значение HTML-атрибута в платных ссылках. По словам Мэтта Каттса , Google обеспокоен веб-мастерами, которые пытаются обмануть систему и тем самым снизить качество и релевантность результатов поиска Google. [52]
В 2019 году Google предложил новый тип тегов, которые не передают PageRank и, следовательно, не имеют значения для манипулирования ссылками SEO: rel="ugc" в качестве тега для пользовательского контента, такого как комментарии; и тег rel="sponsored" для рекламы или других типов спонсируемого контента. [54]
Несмотря на то, что PageRank стал менее важным для целей SEO, наличие обратных ссылок с более популярных веб-сайтов продолжает поднимать веб-страницу выше в поисковых рейтингах. [55]
Модель направленного серфера
[ редактировать ]Более умный пользователь, который вероятностно перескакивает со страницы на страницу в зависимости от содержания страниц и условий запроса, которые ищет пользователь. Эта модель основана на зависящем от запроса рейтинге PageRank страницы, который, как следует из названия, также является функцией запроса. Если задан запрос с несколькими терминами, , серфер выбирает согласно некоторому распределению вероятностей, и использует этот термин для определения своего поведения на большом количестве шагов. Затем он выбирает другой термин в соответствии с распределением, чтобы определить свое поведение, и так далее. Результирующее распределение по посещенным веб-страницам представляет собой QD-PageRank. [56]
Другое использование
[ редактировать ]Было предложено этот раздел алгоритм PageRank по биохимии объединить в . ( Обсудить ) Предлагается с июня 2024 г. |
Математика PageRank полностью общая и применима к любому графу или сети в любой области. Таким образом, PageRank теперь регулярно используется в библиометрии, анализе социальных и информационных сетей, а также для прогнозирования и рекомендации ссылок. Он используется для системного анализа дорожных сетей, а также в биологии, химии, нейробиологии и физике. [57]
Научные исследования и академические круги
[ редактировать ]PageRank использовался для количественной оценки научного вклада исследователей. Базовые сети цитирования и сотрудничества используются в сочетании с алгоритмом рейтинга страниц, чтобы создать систему ранжирования отдельных публикаций, которая распространяется на отдельных авторов. Новый индекс, известный как индекс PageRank (Pi), оказался более справедливым по сравнению с индексом Хирша в контексте многих недостатков, присущих индексу Хирша. [58]
PageRank также является полезным инструментом для анализа белковых сетей в биологии. [59] [60]
В любой экосистеме модифицированная версия PageRank может использоваться для определения видов, которые необходимы для постоянного поддержания здоровья окружающей среды. [61]
Аналогичное новое использование PageRank заключается в ранжировании академических докторских программ на основе данных о размещении их выпускников на преподавательских должностях. С точки зрения PageRank академические факультеты связываются друг с другом, нанимая преподавателей друг у друга (и у самих себя). [62]
Версия PageRank недавно была предложена в качестве замены традиционного Института научной информации (ISI) импакт-фактора . [63] и реализован в Eigenfactor, а также в SCImago . Вместо простого подсчета общего количества цитирований в журнале «важность» каждой цитаты определяется с помощью PageRank.
В нейробиологии PageRank нейрона в нейронной сети коррелирует с его относительной скоростью срабатывания. было обнаружено, что [64]
Использование Интернета
[ редактировать ]Персонализированный PageRank используется Twitter для предоставления пользователям других учетных записей, на которые они, возможно, захотят подписаться. [65]
Продукт поиска по сайту Swiftype создает «PageRank, специфичный для отдельных веб-сайтов», анализируя сигналы важности каждого веб-сайта и расставляя приоритеты контента на основе таких факторов, как количество ссылок с главной страницы. [66]
может Поисковый робот использовать PageRank как один из ряда важных показателей, которые он использует для определения того, какой URL-адрес посетить во время сканирования Интернета. Один из первых рабочих документов [67] которые использовались при создании Google. Эффективное сканирование посредством упорядочения URL-адресов . [68] в котором обсуждается использование ряда различных показателей важности для определения того, насколько глубоко и какую часть сайта будет сканировать Google. PageRank представлен как один из многих таких показателей важности, хотя есть и другие, такие как количество входящих и исходящих ссылок для URL-адреса и расстояние от корневого каталога сайта до URL-адреса.
PageRank также может использоваться в качестве методологии измерения очевидного влияния такого сообщества, как блогосфера, на саму сеть в целом. Таким образом, этот подход использует PageRank для измерения распределения внимания, что отражает парадигму безмасштабной сети . [ нужна ссылка ]
Другие приложения
[ редактировать ]В 2005 году в пилотном исследовании «Структурная глубокая демократия» в Пакистане, SD2. [69] [70] использовался для отбора лидеров в группе устойчивого сельского хозяйства под названием «Контактная молодежь». SD2 использует PageRank для обработки транзитивных голосов по доверенности с дополнительными ограничениями, требующими наличия как минимум двух первоначальных доверенных лиц на каждого избирателя, и все избиратели являются доверенными кандидатами. На основе SD2 могут быть построены более сложные варианты, такие как добавление специализированных доверенных лиц и прямое голосование по конкретным вопросам, но SD2, как базовая зонтичная система, требует всегда использовать универсальные доверенные лица.
В спорте алгоритм PageRank использовался для ранжирования результатов: команд Национальной футбольной лиги (НФЛ) в США; [71] отдельные футболисты; [72] и спортсмены Бриллиантовой лиги. [73]
PageRank использовался для ранжирования пространств или улиц, чтобы предсказать, сколько людей (пешеходов или транспортных средств) приходит в отдельные места или улицы. [74] [75] В лексической семантике он использовался для устранения неоднозначности смысла слова . [76] Семантическое сходство , [77] а также автоматически ранжировать WordNet синсеты в зависимости от того, насколько сильно они обладают данным семантическим свойством, например позитивностью или негативностью. [78]
Изменение режима работы транспортной системы можно описать переходами между квазистационарными состояниями в корреляционных структурах транспортных потоков. PageRank использовался для выявления и изучения доминирующих состояний среди этих квазистационарных состояний в дорожных системах. [79]
nofollow
[ редактировать ]В начале 2005 года Google ввел новое значение nofollow . [80] для атрибута rel HTML-ссылок и элементов привязки, чтобы разработчики веб-сайтов и блоггеры могли создавать ссылки, которые Google не будет учитывать для целей PageRank — это ссылки, которые больше не представляют собой «голосование» в системе PageRank. Отношение nofollow было добавлено в попытке помочь в борьбе со спамдексом .
Например, раньше люди могли создавать множество сообщений на досках объявлений со ссылками на свой веб-сайт, чтобы искусственно повысить свой PageRank. Используя значение nofollow, администраторы досок объявлений могут изменить свой код, чтобы автоматически вставлять «rel='nofollow'» во все гиперссылки в сообщениях, тем самым предотвращая влияние этих конкретных сообщений на PageRank. Однако этот метод уклонения также имеет различные недостатки, такие как снижение ценности ссылок на законные комментарии. (См.: Спам в блогах#nofollow )
Стремясь вручную контролировать поток PageRank между страницами веб-сайта, многие веб-мастера практикуют так называемое скульптурирование PageRank. [81] — это стратегическое размещение атрибута nofollow на определенных внутренних ссылках веб-сайта с целью направить PageRank на те страницы, которые веб-мастер считает наиболее важными. Эта тактика использовалась с момента появления атрибута nofollow, но, возможно, больше не будет эффективной, поскольку Google объявил, что блокировка передачи PageRank с помощью nofollow не перенаправляет этот PageRank на другие ссылки. [82]
См. также
[ редактировать ]- Неравенство внимания
- ЧейРанк
- Авторитет домена
- EigenTrust — децентрализованный алгоритм PageRank
- Google бомбит
- Гугл Колибри
- Матрица Google
- Гугл Панда
- Гугл Пингвин
- Поиск Google
- Алгоритм вершины холма
- Центральность Каца - схема 1953 года, тесно связанная с рейтингом страниц.
- Создание ссылок
- Поисковая оптимизация
- SimRank — мера сходства объектов, основанная на модели случайного пользователя.
- ТрастРанк
- VisualRank — приложение Google PageRank для поиска изображений.
- Вебграф
Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ «Факты о Google и конкуренции» . Архивировано из оригинала 4 ноября 2011 года . Проверено 12 июля 2014 г.
- ^ Салливан, Дэнни (26 апреля 2007 г.). «Что такое Google PageRank? Руководство для поисковиков и веб-мастеров» . Земля поисковых систем . Архивировано из оригинала 3 июля 2016 г.
- ^ Каттс, Мэтт. «Алгоритмы ранжируют релевантные результаты выше» . Архивировано из оригинала 2 июля 2013 года . Проверено 19 октября 2015 г.
- ^ «US7058628B1 — Метод ранжирования узлов в связанной базе данных — Google Patents» . Гугл Патенты . Архивировано из оригинала 16 января 2020 года . Проверено 14 сентября 2019 г.
- ^ Jump up to: а б с д и ж г Брин, С .; Пейдж, Л. (1998). «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете» (PDF) . Компьютерные сети и системы ISDN . 30 (1–7): 107–117. CiteSeerX 10.1.1.115.5930 . дои : 10.1016/S0169-7552(98)00110-X . ISSN 0169-7552 . S2CID 7587743 . Архивировано (PDF) из оригинала 27 сентября 2015 г.
- ^ Дьёндьи, Золтан; Берхин Павел; Гарсиа-Молина, Гектор; Педерсен, январь (2006 г.), «Обнаружение ссылочного спама на основе массовой оценки», Материалы 32-й Международной конференции по очень большим базам данных (VLDB '06, Сеул, Корея) (PDF) , стр. 439–450, в архиве (PDF) ) из оригинала от 3 декабря 2014 г.
- ^ «Часто задаваемые вопросы: все о новом алгоритме Google «Колибри»» . Земля поисковых систем . 26 сентября 2013 г. Архивировано из оригинала 23 декабря 2018 г. Проверено 18 декабря 2018 г.
- ^ Ван, Цзыян. «Улучшенные алгоритмы ранжирования веб-страниц на основе ссылок» (PDF) . cs.nyu.edu . Нью-Йоркский университет, факультет компьютерных наук . Проверено 7 августа 2023 г.
- ^ Ландау, Эдмунд (1895). «Об относительной стоимостной оценке результатов турниров». Немецкие еженедельные шахматы . 11 (42): 51–54.
- ^ Синн, Райнер; Циглер, Гюнтер М. (31 октября 2022 г.). «Ландау о шахматных турнирах и PageRank Google». arXiv : 2210.17300 [ math.HO ].
- ^ Габриэль Пински и Фрэнсис Нарин (1976). «Влияние цитируемости на журнальные совокупности научных публикаций: Теория с применением к физической литературе». Обработка информации и управление . 12 (5): 297–312. дои : 10.1016/0306-4573(76)90048-0 .
- ^ Томас Саати (1977). «Метод масштабирования приоритетов в иерархических структурах». Журнал математической психологии . 15 (3): 234–281. дои : 10.1016/0022-2496(77)90033-5 . hdl : 10338.dmlcz/101787 .
- ^ Брэдли С. Лав и Стивен А. Сломан. «Изменчивость и детерминанты концептуальной трансформируемости» (PDF) . Труды семнадцатой ежегодной конференции Общества когнитивных наук . стр. 654–659. Архивировано (PDF) из оригинала 23 декабря 2017 г. Проверено 23 декабря 2017 г.
- ^ «Как студент CogSci изобрел PageRank за три года до Google» . сайт bradlove.org. Архивировано из оригинала 11 декабря 2017 г. Проверено 23 декабря 2017 г.
- ^ Ли, Яньхун (6 августа 2002 г.). «На пути к качественной поисковой системе». IEEE Интернет-вычисления . 2 (4): 24–29. дои : 10.1109/4236.707687 .
- ^ «Расцвет Baidu (это по-китайски для Google)» . Нью-Йорк Таймс . 17 сентября 2006 г. Архивировано из оригинала 27 июня 2019 г. Проверено 16 июня 2019 г.
- ^ Jump up to: а б «О: RankDex». Архивировано 25 мая 2015 г. в Wayback Machine , RankDex ; по состоянию на 3 мая 2014 г.
- ^ USPTO, «Система и метод поиска гипертекстовых документов». Архивировано 5 декабря 2011 г. в Wayback Machine , Номер патента США: 5920859, Изобретатель: Яньхун Ли, Дата подачи: 5 февраля 1997 г., Дата выдачи: 6 июля 1999 г.
- ↑ Гринберг, Энди, «Человек, который побеждает Google». Архивировано 8 марта 2013 г. в Wayback Machine , журнал Forbes , 5 октября 2009 г.
- ^ «О: RankDex». Архивировано 20 января 2012 г. на Wayback Machine , Rankdex.com.
- ^ «Метод ранжирования узлов в связанной базе данных» . Патенты Google. Архивировано из оригинала 15 октября 2015 года . Проверено 19 октября 2015 г.
- ^ Альтушер, Джеймс (18 марта 2011 г.). «10 необычных вещей о Google» . Форбс . Архивировано из оригинала 16 июня 2019 года . Проверено 16 июня 2019 г.
- ^ Грег Вьентджес. «Гектор Гарсиа-Молина: Стэнфордский профессор информатики и советник Сергея» . стр. минут 25.45-32.50, 34.00–38.20 . Проверено 6 декабря 2019 г.
- ^ Пейдж, Ларри, «PageRank: наведение порядка в Интернете» (PDF) . Архивировано (PDF) из оригинала 26 января 2009 г. Проверено 6 октября 2022 г. , Стэнфордский проект цифровой библиотеки, разговор. 18 августа 1997 г. (архив 2002 г.)
- ↑ 187-страничное исследование Университета Граца, Австрия. Архивировано 16 января 2014 г. в Wayback Machine . Включает примечание о том, что при определении рейтинга страниц в Google также используется человеческий мозг.
- ^ «Наши продукты и услуги» . Архивировано из оригинала 23 июня 2008 г. Проверено 27 мая 2011 г.
- ^ Дэвид Вайс и Марк Мэлсид (2005). История Google . Делакорт Пресс. п. 37 . ISBN 978-0-553-80457-7 .
- ^ «Пресс-центр Google: интересные факты» . Архивировано из оригинала 15 июля 2001 г.
- ^ Лиза М. Кригер (1 декабря 2005 г.). «Стэнфорд заработал 336 миллионов долларов на акциях Google» . Сан-Хосе Меркьюри Ньюс . Архивировано из оригинала 8 апреля 2009 года . Проверено 25 февраля 2009 г. , цитируется по redOrbit.
- ^ Ричард Брандт. «Начинаем. Как Google добился успеха» . Стэнфордский журнал. Архивировано из оригинала 10 марта 2009 г. Проверено 25 февраля 2009 г.
- ^ Jump up to: а б Пейдж, Лоуренс ; Брин, Сергей ; Мотвани, Раджив ; Виноград, Терри (1999). Рейтинг цитируемости PageRank: Наведение порядка в Интернете (Отчет). Архивировано из оригинала 27 апреля 2006 г. , опубликовано в виде технического отчета 29 января 1998 г. PDF-файл. Архивировано 18 августа 2011 г. на Wayback Machine.
- ^ Мэтта Каттса Блог : Прямо из Google: что вам нужно знать. Архивировано 7 февраля 2010 г. в Wayback Machine , см. стр. 15 его слайдов.
- ^ Тахер Хавеливала и Сепандар Камвар (март 2003 г.). «Второе собственное значение матрицы Google» (PDF) . Технический отчет Стэнфордского университета : 7056. arXiv : math/0307056 . Бибкод : 2003math......7056N . Архивировано (PDF) из оригинала 17 декабря 2008 г.
- ^ Джанна М. Дель Корсо; Антонио Гулли; Франческо Романи (2004). «Быстрое вычисление PageRank с помощью разреженной линейной системы (расширенное резюме)». В Стефано Леонарди (ред.). Алгоритмы и модели веб-графа: Третий международный семинар, WAW 2004, Рим, Италия, 16 октября 2004 г. Труды . стр. 118–130. CiteSeerX 10.1.1.58.9060 . дои : 10.1007/978-3-540-30216-2_10 . ISBN 978-3-540-23427-2 .
- ^ Арасу, А.; Новак Дж.; Томкинс, А.; Томлин, Дж. (2002). «Вычисление PageRank и структура сети: эксперименты и алгоритмы». Материалы одиннадцатой Международной конференции по всемирной паутине, постерный трек . Брисбен, Австралия. стр. 107–117. CiteSeerX 10.1.1.18.5264 .
- ^ Массимо Франческо (2010). «PageRank: стоим на плечах гигантов». arXiv : 1002.2858 [ cs.IR ].
- ^ Никола Перра и Санто Фортунато; Фортунато (сентябрь 2008 г.). «Меры спектральной центральности в сложных сетях». Физ. Преподобный Е. 78 (3): 36107. arXiv : 0805.3322 . Бибкод : 2008PhRvE..78c6107P . дои : 10.1103/PhysRevE.78.036107 . ПМИД 18851105 . S2CID 1755112 .
- ^ Винс Гролмуш (2015). «Примечание о PageRank неориентированных графов». Письма об обработке информации . 115 (6–8): 633–634. arXiv : 1205.1960 . дои : 10.1016/j.ipl.2015.02.015 . S2CID 9855132 .
- ^ Петерис Даугулис; Даугулис (2012). «Заметка об обобщении централизации собственных векторов для двудольных графов и приложений». Сети . 59 (2): 261–264. arXiv : 1610.01544 . дои : 10.1002/net.20442 . S2CID 1436859 .
- ^ Атиш Дас Сарма; Анисур Рахаман Молла; Гопал Пандуранган; Эли Упфал (2015). «Быстрый распределенный расчет PageRank». Теоретическая информатика . 561 : 113–121. arXiv : 1208.3071 . дои : 10.1016/j.tcs.2014.04.003 . S2CID 10284718 .
- ^ Сьюзен Москва. «Распределение PageRank удалено из WMT» . Архивировано из оригинала 17 октября 2009 года . Проверено 16 октября 2009 г.
- ^ Бартлеман, Уил (12 октября 2014 г.). «Обновление рейтинга страницы Google не произойдет» . Управляемый администратор. Архивировано из оригинала 02 апреля 2015 г. Проверено 12 октября 2014 г.
- ^ Шварц, Барри (8 марта 2016 г.). «Google подтвердил, что удаляет PageRank панели инструментов» . Земля поисковых систем . Архивировано из оригинала 10 марта 2016 года.
- ^ Шварц, Барри (18 апреля 2016 г.). «Рейк страницы панели инструментов Google официально снижается» . Земля поисковых систем . Архивировано из оригинала 21 апреля 2016 г.
- ^ Саузерн, Мэтт (19 апреля 2016 г.). «Google PageRank официально закрывает свои двери для публики» . Журнал поисковых систем . Архивировано из оригинала 13 апреля 2017 г.
- ^ Фишкин, Рэнд ; Джефф Поллард (2 апреля 2007 г.). «Факторы ранжирования в поисковых системах — версия 2» . seomoz.org. Архивировано из оригинала 7 мая 2009 года . Проверено 11 мая 2009 г.
- ^ Довер, Д. Секреты поисковой оптимизации Индианаполиса. Уайли. 2011.
- ^ Виникер, Д. Важность проверки сложности ключевых слов для SEO . Эд. Шварц, М. Цифровой путеводитель, том 5. News Press. стр. 160–164.
- ^ «Рейтинг объявлений: Рейтинг – Cправка - Google Адреса» . Архивировано из оригинала 26 мая 2012 г. Проверено 27 мая 2011 г.
- ^ Кларк, Джек. «Google передает свой прибыльный веб-поиск машинам с искусственным интеллектом» . Блумберг. Архивировано из оригинала 25 марта 2016 года . Проверено 26 марта 2016 г.
- ^ Обзор поисковой системы: каталог Google закрыт 25 июля 2011 г.
- ^ Jump up to: а б «Как сообщить о платных ссылках» . mattcutts.com/блог. 14 апреля 2007 года. Архивировано из оригинала 28 мая 2007 года . Проверено 28 мая 2007 г.
- ^ «Схемы ссылок Google». Архивировано 21 мая 2020 г. по Wayback Machine. ссылкам
- ^ «Развивающийся» . Разработчики Google . Проверено 08 февраля 2022 г.
- ^ «Итак... вы думаете, что SEO изменилось» . 19 марта 2014 г. Архивировано из оригинала 31 марта 2014 г.
- ^ Мэтью Ричардсон и Педро Домингос, А. (2001). Интеллектуальный серфер: вероятностное сочетание информации о ссылках и контенте в PageRank (PDF) . стр. 1441–1448. Архивировано (PDF) из оригинала 4 марта 2016 г.
- ^ Гляйх, Дэвид Ф. (январь 2015 г.). «Ранг страницы за пределами Интернета». Обзор СИАМ . 57 (3): 321–363. arXiv : 1407.5107 . дои : 10.1137/140976649 . S2CID 8375649 .
- ^ Сенанаяке, Упул; Пиравинан, Махендра; Зомайя, Альберт (2015). «Индекс Pagerank: выходя за рамки подсчета цитирования при количественной оценке научного воздействия исследователей» . ПЛОС ОДИН . 10 (8): e0134794. Бибкод : 2015PLoSO..1034794S . дои : 10.1371/journal.pone.0134794 . ISSN 1932-6203 . ПМЦ 4545754 . ПМИД 26288312 .
- ^ Г. Иван и В. Гролмуш (2011). «Когда Интернет встречается с клеткой: использование персонализированного PageRank для анализа сетей взаимодействия белков» . Биоинформатика . 27 (3): 405–7. doi : 10.1093/биоинформатика/btq680 . ПМИД 21149343 .
- ^ Д. Банки, Г. Иван и В. Гролмуш (2013). «Равные возможности для сетевых узлов низкой степени: метод PageRank для идентификации белковых целей в метаболических графах» . ПЛОС ОДИН . 8 (1): 405–7. Бибкод : 2013PLoSO...854204B . дои : 10.1371/journal.pone.0054204 . ПМЦ 3558500 . ПМИД 23382878 .
- ^ Бернс, Джудит (4 сентября 2009 г.). «Трюк Google отслеживает вымирания» . Новости Би-би-си . Архивировано из оригинала 12 мая 2011 г. Проверено 27 мая 2011 г.
- ^ Бенджамин М. Шмидт и Мэтью М. Чингос (2007). «Рейтинг докторских программ по месту размещения: новый метод» (PDF) . PS: Политология и политика . 40 (июль): 523–529. CiteSeerX 10.1.1.582.9402 . дои : 10.1017/s1049096507070771 . S2CID 6012229 . Архивировано (PDF) из оригинала 13 февраля 2015 г.
- ^ Йохан Боллен; Марко А. Родригес; Герберт Ван де Сомпель (декабрь 2006 г.). «MESUR: Показатели научного воздействия, основанные на использовании». Материалы 7-й совместной конференции ACM/IEEE-CS по электронным библиотекам . Нью-Йорк: Ассоциация вычислительной техники. arXiv : cs.GL/0601030 . Бибкод : 2006cs........1030B . дои : 10.1145/1255175.1255273 . ISBN 978-1-59593-644-8 . S2CID 3115544 .
- ^ Флетчер, Джек Маккей; Веннекерс, Томас (2017). «От структуры к активности: использование показателей центральности для прогнозирования активности нейронов» . Международный журнал нейронных систем . 28 (2): 1750013. doi : 10.1142/S0129065717500137 . hdl : 10026.1/9713 . ПМИД 28076982 .
- ^ Гупта, Панкадж; Гоэль, Ашиш; Лин, Джимми; Шарма, Аниш; Ван, Донг; Заде, Реза (2013). «WTF: Сервис «За кем следить» в Твиттере» . Материалы 22-й Международной конференции по Всемирной паутине . АКМ. стр. 505–514. дои : 10.1145/2488388.2488433 . ISBN 978-1-4503-2035-1 . S2CID 207205045 . Проверено 11 декабря 2018 г.
- ^ Ха, Энтони (08 мая 2012 г.). «Swiftype на базе Y Combinator создает отличный поиск по сайту» . ТехКранч . Архивировано из оригинала 6 июля 2014 г. Проверено 8 июля 2014 г.
- ^ «Рабочие документы по созданию Google» . Google . Архивировано из оригинала 28 ноября 2006 года . Проверено 29 ноября 2006 г.
- ^ Чо, Дж.; Гарсиа-Молина, Х.; Пейдж, Л. (1998). «Эффективное сканирование за счет упорядочения URL-адресов» . Материалы седьмой конференции по Всемирной паутине . Архивировано из оригинала 3 июня 2008 г.
- ^ «Yahoo! Группы» . Группы.yahoo.com. Архивировано из оригинала 4 октября 2013 г. Проверено 2 октября 2013 г.
- ^ «Аутопоэтические информационные системы в современных организациях». CiteSeerX 10.1.1.148.9274 .
- ^ Зак, Лори; Лэмб, Рон; Болл, Сара (31 декабря 2012 г.). «Применение PageRank Google к рейтингам НФЛ» . Включите: Математический журнал . 5 (4): 463–471. дои : 10.2140/involve.2012.5.463 . ISSN 1944-4184 .
- ^ Пенья, Хавьер Лопес; Тушетт, Хьюго (28 июня 2012 г.). «Анализ сетевой теории футбольных стратегий». arXiv : 1206.6904 [ math.CO ].
- ^ Беггс, Клайв Б.; Шеперд, Саймон Дж.; Эммондс, Стейси; Джонс, Бен (2 июня 2017 г.). Чжоу, Вэй-Син (ред.). «Новое применение алгоритмов PageRank и пользовательских предпочтений для оценки относительных результатов легкоатлетов на соревнованиях» . ПЛОС ОДИН . 12 (6): e0178458. Бибкод : 2017PLoSO..1278458B . дои : 10.1371/journal.pone.0178458 . ISSN 1932-6203 . ПМК 5456068 . ПМИД 28575009 .
- ^ Б. Цзян (2006). «Рейтинг пространств для прогнозирования движения человека в городской среде». Международный журнал географической информатики . 23 (7): 823–837. arXiv : физика/0612011 . Бибкод : 2009IJGIS..23..823J . дои : 10.1080/13658810802022822 . S2CID 26880621 .
- ^ Цзян Б.; Чжао С. и Инь Дж. (2008). «Самоорганизующиеся естественные дороги для прогнозирования транспортных потоков: исследование чувствительности». Журнал статистической механики: теория и эксперимент . P07008 (7): 008. arXiv : 0804.1630 . Бибкод : 2008JSMTE..07..008J . дои : 10.1088/1742-5468/2008/07/P07008 . S2CID 118605727 .
- ^ Роберто Навильи, Мирелла Лапата. «Экспериментальное исследование связности графов для неконтролируемого устранения неоднозначности смысла слов». Архивировано 14 декабря 2010 г. в Wayback Machine . Транзакции IEEE по анализу шаблонов и машинному интеллекту (TPAMI), 32 (4), IEEE Press, 2010, стр. 678–692.
- ^ М.Т. Пилевар, Д. Юргенс и Р. Навильи. Выравнивание, устранение неоднозначности и обход: унифицированный подход к измерению семантического сходства. Архивировано 1 октября 2013 г. в Wayback Machine . Учеб. 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), София, Болгария, 4–9 августа 2013 г., стр. 1341–1351.
- ^ Андреа Эсули и Фабрицио Себастьяни. «Синсеты WordNet для ранжирования страниц: приложение к свойствам, связанным с мнениями» (PDF) . В протоколах 35-го собрания Ассоциации компьютерной лингвистики, Прага, Чехия, 2007 г., стр. 424–431 . Архивировано (PDF) из оригинала 28 июня 2007 г. Проверено 30 июня 2007 г.
- ^ Ван С.; Шрекенберг М.; Гур Т (2023). «Переходы между квазистационарными состояниями в транспортных системах: на примере кельнских орбитальных автомагистралей» . Журнал статистической механики: теория и эксперимент . 2023 (9): 093401. arXiv : 2302.14596 . Бибкод : 2023JSMTE2023i3401W . дои : 10.1088/1742-5468/acf210 . S2CID 257232659 .
- ^ «Предотвращение спама в комментариях» . Google . Архивировано из оригинала 12 июня 2005 года . Проверено 1 января 2005 г.
- ^ «Формирование PageRank: анализ ценности и потенциальных преимуществ формирования PR с помощью Nofollow» . SEOмоз. 14 октября 2008 г. Архивировано из оригинала 14 мая 2011 г. Проверено 27 мая 2011 г.
- ^ «Формирование PageRank» . Mattcutts.com. 15 июня 2009 г. Архивировано из оригинала 11 мая 2011 г. Проверено 27 мая 2011 г.
Источники
[ редактировать ]- Альтман, Алон; Моше Тенненхольц (2005). «Системы ранжирования: аксиомы PageRank» (PDF) . Материалы 6-й конференции ACM по электронной коммерции (EC-05) . Ванкувер, Британская Колумбия . Проверено 29 сентября 2014 г.
- Ченг, Алиса; Эрик Дж. Фридман (11 июня 2006 г.). «Управление PageRank в рамках стратегий Сивиллы» (PDF) . Материалы первого семинара по экономике сетевых систем (NetEcon06) . Энн-Арбор, Мичиган. Архивировано (PDF) из оригинала 21 августа 2010 г. Проверено 22 января 2008 г.
- Фарахат, Айман; ЛоФаро, Томас; Миллер, Джоэл К.; Рэй, Грегори; Уорд, Лесли А. (2006). «Рейтинги авторитетности на основе HITS, PageRank и SALSA: существование, уникальность и эффект инициализации». SIAM Журнал по научным вычислениям . 27 (4): 1181–1201. Бибкод : 2006ГАК...27.1181Ф . CiteSeerX 10.1.1.99.3942 . дои : 10.1137/S1064827502412875 .
- Хаваливала, Тахер; Эх, Глен; Камвар, Сепандар (2003). «Аналитическое сравнение подходов к персонализации PageRank» (PDF) . Технический отчет Стэнфордского университета . Архивировано (PDF) из оригинала 16 декабря 2010 г. Проверено 13 ноября 2008 г.
- Лэнгвилл, Эми Н .; Мейер, Карл Д. (2003). «Опрос: глубже внутри PageRank». Интернет-математика . 1 (3).
- Лэнгвилл, Эми Н .; Мейер, Карл Д. (2006). PageRank Google и не только: наука о ранжировании в поисковых системах . Издательство Принстонского университета. ISBN 978-0-691-12202-1 .
- Ричардсон, Мэтью; Домингос, Педро (2002). «Интеллектуальный серфер: вероятностное сочетание информации о ссылках и контенте в PageRank» (PDF) . Труды о достижениях в области нейронных систем обработки информации . Том. 14. Архивировано (PDF) из оригинала 28 июня 2010 г. Проверено 18 сентября 2004 г.
Соответствующие патенты
[ редактировать ]- Оригинальный патент США PageRank — метод ранжирования узлов в связанной базе данных. Архивировано 29 августа 2014 г. в Wayback Machine — патент № 6 285 999 — 4 сентября 2001 г.
- Патент США PageRank — Метод оценки документов в связанной базе данных — Патент номер 6,799,176 — 28 сентября 2004 г.
- Патент США PageRank — метод ранжирования узлов в связанной базе данных. Архивировано 28 августа 2019 г. на Wayback Machine — патент № 7 058 628 — 6 июня 2006 г.
- Патент США PageRank — Оценка документов в связанной базе данных. Архивировано 31 марта 2018 г. на Wayback Machine — Патент номер 7 269 587 — 11 сентября 2007 г.
Внешние ссылки
[ редактировать ]- Алгоритмы от Google
- Наши продукты и услуги от Google
- Как Google находит вашу иголку в стоге сена в Интернете, Американское математическое общество