Jump to content

ТрастРанк

TrustRank — это алгоритм , который проводит анализ ссылок , чтобы отделить полезные веб-страницы от спама и помогает поисковым системам ранжировать страницы в результатах поиска (страницах результатов поисковых систем). Это полуавтоматический процесс, а это означает, что для его правильного функционирования требуется определенная помощь человека. Поисковые системы имеют множество различных алгоритмов и факторов ранжирования, которые они используют при измерении качества веб-страниц. TrustRank — один из них.

Поскольку ручная проверка Интернета непрактична и очень дорога, был введен TrustRank, чтобы помочь решить эту задачу гораздо быстрее и дешевле. Впервые его представили исследователи Золтан Дьонгьи и Гектор Гарсиа-Молина из Стэнфордского университета и Ян Педерсен из Yahoo! в своей статье «Борьба с веб-спамом с помощью TrustRank» в 2004 году. [1] Сегодня этот алгоритм является частью основных поисковых систем, таких как Yahoo! и Гугл. [2]

Одним из наиболее важных факторов, которые помогают поисковой системе определить качество веб-страницы при возврате результатов, являются обратные ссылки . Поисковые системы учитывают количество и качество обратных ссылок при назначении места определенной веб-странице в результатах поиска. Многие страницы со спамом создаются только с целью ввести в заблуждение поисковые системы . Эти страницы, созданные в основном по коммерческим причинам, используют различные методы для достижения более высокого, чем заслуженного, рейтинга на страницах результатов поисковых систем . Хотя эксперты-люди могут легко идентифицировать спам, поисковые системы по-прежнему ежедневно совершенствуются, чтобы делать это без помощи людей.

Одним из популярных методов улучшения рейтинга является повышение воспринимаемой важности документа с помощью сложных схем ссылок. Google PageRank и другие алгоритмы поискового ранжирования подверглись таким манипуляциям.

TrustRank стремится бороться со спамом, фильтруя Интернет на основе надежности. Метод предполагает выбор небольшого набора исходных страниц для оценки экспертом. После того как авторитетные исходные страницы идентифицируются вручную, сканирование, выходящее за пределы исходного набора, ищет столь же надежные и заслуживающие доверия страницы. Надежность TrustRank снижается с увеличением расстояния между документами и исходным набором.

Логика работает и противоположным способом, который называется антимонопольным рейтингом. Чем ближе сайт к спам-ресурсам, тем больше вероятность, что он тоже является спамом. [3]

Исследователи, предложившие методологию TrustRank, продолжили совершенствовать свою работу, оценивая смежные темы, такие как измерение массы спама .

См. также

[ редактировать ]
  1. ^ Дьёньи, Золтан; Гарсиа-Молина, Гектор (2004). Борьба с веб-спамом с помощью TrustRank (PDF) . Материалы 30-й конференции ВЛДБ. Торонто, Канада . Проверено 26 мая 2022 г.
  2. ^ 7603350 , Гуха, Раманатан, «Патент США: 7603350 — Рейтинг результатов поиска на основе доверия», выдан 13 октября 2009 г.  
  3. ^ Кришнан, Виджай; Радж, Рашми. «Обнаружение веб-спама с использованием антимонопольного рейтинга» (PDF) . Стэнфордский университет . Проверено 11 января 2015 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ba34cbfce90ba91439a424d4433a12d0__1704827040
URL1:https://arc.ask3.ru/arc/aa/ba/d0/ba34cbfce90ba91439a424d4433a12d0.html
Заголовок, (Title) документа по адресу, URL1:
TrustRank - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)