~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 823C171A2699F4AB407CA95087EFD5EF__1718298240 ✰
Заголовок документа оригинал.:
✰ Google matrix - Wikipedia ✰
Заголовок документа перевод.:
✰ Матрица Google — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Google_matrix ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/82/ef/823c171a2699f4ab407ca95087efd5ef.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/82/ef/823c171a2699f4ab407ca95087efd5ef__translat.html ✰
Дата и время сохранения документа:
✰ 18.06.2024 09:51:11 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 13 June 2024, at 20:04 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Матрица Google — Википедия Jump to content

Матрица Google

Из Википедии, бесплатной энциклопедии
Рисунок 1. Матрица Google сети статей Википедии, записанная на основе индекса PageRank; показан фрагмент верхних элементов матрицы размером 200 X 200, общий размер N=3282257 (из [1] )

Матрица Google — это особая стохастическая матрица которая используется Google , алгоритмом PageRank . Матрица представляет собой граф, ребра которого представляют связи между страницами. PageRank каждой страницы затем может быть сгенерирован итеративно из матрицы Google с использованием метода мощности . Однако для того, чтобы степенной метод сходился, матрица должна быть стохастической, неприводимой и апериодической .

Матрица смежности A и матрица Маркова S [ править ]

Чтобы сгенерировать матрицу Google G , мы должны сначала сгенерировать матрицу смежности A , которая представляет отношения между страницами или узлами.

Предполагая, что страниц N , мы можем заполнить A , выполнив следующие действия:

  1. Матричный элемент заполняется 1, если узел имеет ссылку на узел и 0 в противном случае; это матрица смежности ссылок.
  2. Связанная матрица S , соответствующая переходам в цепи Маркова. [ сломанный якорь ] данной сети строится из A путем деления элементов столбца «j» на количество где — общее количество исходящих ссылок от узла j ко всем остальным узлам. Столбцы, имеющие нулевые элементы матрицы, соответствующие висячим узлам, заменяются постоянным значением 1/N . Такая процедура добавляет ссылку из каждого стока, висячее состояние к каждому другому узлу.
  3. Теперь по построению сумма всех элементов в любом столбце матрицы S равна единице. Таким образом, матрица S математически корректно определена и принадлежит классу цепей Маркова и классу операторов Перрона-Фробениуса. Это делает S подходящим для алгоритма PageRank .

Построение матрицы Google G [ править ]

Рис.2. Матрица Google сети Кембриджского университета (2006 г.), крупнозернистые элементы матрицы записаны в базисах индекса PageRank, показан общий размер N=212710 (из [1] )

Тогда окончательная матрица Google G может быть выражена через S как:

По построению сумма всех неотрицательных элементов внутри каждого столбца матрицы равна единице. Числовой коэффициент известен как коэффициент демпфирования.

Обычно S представляет собой разреженную матрицу, и для современных направленных сетей она имеет всего около десяти ненулевых элементов в строке или столбце, поэтому всего около 10 N требуется для умножения вектора на матрицу G умножений . [2] [3]

Примеры матрицы Google [ править ]

Пример матрицы построение по уравнению (1) в простой сети приведено в статье CheiRank .

Для фактической матрицы Google использует коэффициент затухания. около 0,85. [2] [3] [4] Термин дает пользователю вероятность случайного перехода на любую страницу. Матрица принадлежит классу операторов Перрона-Фробениуса Маркова цепей . [2] Примеры матричной структуры Google показаны на рис. 1 для сети гиперссылок статей Википедии в 2009 г. в мелком масштабе и на рис. 2 для сети Кембриджского университета в 2006 г. в крупном масштабе.

состояния G матрицы - собственные Спектр и

Рис3. Спектр собственных значений матрицы Google Кембриджского университета из рис.2 при , синие точки показывают собственные значения изолированных подпространств, красные точки показывают собственные значения основного компонента (из [5] )

Для существует только одно максимальное собственное значение с соответствующим правым собственным вектором, имеющим неотрицательные элементы которое можно рассматривать как стационарное распределение вероятностей. [2] Эти вероятности, упорядоченные по убыванию значений, дают вектор PageRank. с PageRank используется поиском Google для ранжирования веб-страниц. Обычно для Всемирной паутины имеется такое с . Количество узлов с заданным значением PageRank масштабируется как с показателем . [6] [7] Левый собственный вектор в имеет постоянные матричные элементы. С все собственные значения движутся как кроме максимального собственного значения , который остается неизменным. [2] Вектор PageRank варьируется в зависимости от но другие собственные векторы с остаются неизменными из-за их ортогональности постоянному левому вектору при . Разрыв между и другое собственное значение дает быструю сходимость случайного начального вектора к PageRank примерно после 50 умножений на матрица.

Рис4. Распределение собственных значений матриц Google в комплексной плоскости при для словарных сетей: Roget (A, N=1022), ODLIS (B, N=2909) и FOLDOC (C, N=13356); WWW-сети университетов Великобритании: Университет Уэльса (Кардифф) (D, N=2778), Городской университет Бирмингема (E, N=10631), Университет Кила (Стаффордшир) (F, N=11437), Университет Ноттингем Трент (G, N) =12660), Ливерпульский университет Джона Мурса (H, N=13578) (данные по университетам приведены за 2002 г.) (из [8] )

В матрица обычно имеет много вырожденных собственных значений (см., например, [6] [8] ). Примеры спектра собственных значений матрицы Google различных направленных сетей показаны на рис.3 из [5] и фиг.4 с. [8]

Матрицу Google можно построить и для сетей Улама, созданных методом Улама [8] для динамических карт. Спектральные свойства таких матриц обсуждаются в [9,10,11,12,13,15]. [5] [9] В ряде случаев спектр описывается фрактальным законом Вейля [10,12].

Рис5. Распределение собственных значений в комплексной плоскости для матрицы Google ядра Linux версии 2.6.32 с размером матрицы в , единичный круг показан сплошной кривой (от [9] )
Рис.6. Грубое распределение вероятностей собственных состояний матрицы Google для ядра Linux версии 2.6.32. Горизонтальные линии показывают первые 64 собственных вектора, упорядоченных по вертикали по формуле (от [9] )

Матрица Google может быть построена и для других направленных сетей, например, для сети вызова процедур программного обеспечения ядра Linux, представленной в [15]. В этом случае спектр описывается фрактальным законом Вейля с фрактальной размерностью (см. рис.5 из [9] ). Численный анализ показывает, что собственные состояния матрицы локализованы (см. рис.6 с [9] ). Итерационный метод Арнольди позволяет вычислять множество собственных значений и собственных векторов для матриц достаточно большого размера [13]. [5] [9]

Другие примеры матрица включает матрицу Google мозга [17] и управление бизнес-процессами [18], см. также. [1] Применение матричного анализа Google для Последовательности ДНК описаны в [20]. Такой матричный подход Google позволяет также анализировать переплетение культур посредством ранжирования многоязычных статей Википедии о людях [21].

Исторические заметки [ править ]

Матрица Google с коэффициентом затухания была описана Сергеем Брином и Ларри Пейджем в 1998 году [22], см. также статьи по истории PageRank [23],[24].

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с Эрманн, Л.; Чепелянский А.Д.; Шепелянский, Д.Л. (2011). «На пути к двумерным поисковым системам». Журнал физики А. 45 (27): 275101. arXiv : 1106.6215 . Бибкод : 2012JPhA...45A5101E . дои : 10.1088/1751-8113/45/27/275101 . S2CID   14827486 .
  2. ^ Перейти обратно: а б с д Это Лэнгвилл, Эми Н .; Мейер, Карл (2006). PageRank Google и не только . Издательство Принстонского университета . ISBN  978-0-691-12202-1 .
  3. ^ Перейти обратно: а б Остин, Дэвид (2008). «Как Google находит вашу иголку в стоге сена в Интернете» . Столбцы функций AMS.
  4. ^ Ло, Эдит (9 октября 2008 г.). «Лекция 12 о PageRank» (PDF) .
  5. ^ Перейти обратно: а б с д Фрам, К.М.; Джорджо, Б.; Шепелянский, Д.Л. (01.11.2011). «Всеобщее появление PageRank». Журнал физики А. 44 (46): 465101. arXiv : 1105.1062 . Бибкод : 2011JPhA...44T5101F . дои : 10.1088/1751-8113/44/46/465101 . S2CID   16292743 .
  6. ^ Донато, Дебора; Лаура, Луиджи; Леонарди, Стефано; Миллоцци, Стефано (30 марта 2004 г.). «Крупномасштабные свойства веб-графа» (PDF) . Европейский физический журнал Б. 38 (2): 239–243. Бибкод : 2004EPJB...38..239D . CiteSeerX   10.1.1.104.2136 . дои : 10.1140/epjb/e2004-00056-6 . S2CID   10640375 .
  7. ^ Пандуранган, Гопал; Рангхаван, Прабхакар; Упфал, Эли (2005). «Использование PageRank для характеристики веб-структуры» (PDF) . Интернет-математика . 3 (1): 1–20. дои : 10.1080/15427951.2006.10129114 . S2CID   101281 .
  8. ^ Перейти обратно: а б с Жоржо, Бертран; Жиро, Оливье; Шепелянский, Дима Л. (25 мая 2010 г.). «Спектральные свойства матрицы Google Всемирной паутины и других направленных сетей». Физический обзор E . 81 (5): 056109. arXiv : 1002.3342 . Бибкод : 2010PhRvE..81e6109G . дои : 10.1103/PhysRevE.81.056109 . ПМИД   20866299 . S2CID   14490804 .
  9. ^ Перейти обратно: а б с д Это ж Эрманн, Л.; Чепелянский А.Д.; Шепелянский, Д.Л. (2011). «Фрактальный закон Вейля для архитектуры ядра Linux». Европейский физический журнал Б. 79 (1): 115–120. arXiv : 1005.1395 . Бибкод : 2011EPJB...79..115E . дои : 10.1140/epjb/e2010-10774-7 . S2CID   445348 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 823C171A2699F4AB407CA95087EFD5EF__1718298240
URL1:https://en.wikipedia.org/wiki/Google_matrix
Заголовок, (Title) документа по адресу, URL1:
Google matrix - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)