ТрастРанк
Эта статья нуждается в дополнительных цитатах для проверки . ( февраль 2018 г. ) |
TrustRank — это алгоритм , который проводит анализ ссылок , чтобы отделить полезные веб-страницы от спама и помогает поисковым системам ранжировать страницы в результатах поиска (страницах результатов поисковых систем). Это полуавтоматический процесс, а это означает, что для его правильного функционирования требуется определенная помощь человека. Поисковые системы имеют множество различных алгоритмов и факторов ранжирования, которые они используют при измерении качества веб-страниц. TrustRank — один из них.
Поскольку ручная проверка Интернета непрактична и очень дорога, был введен TrustRank, чтобы помочь решить эту задачу гораздо быстрее и дешевле. Впервые его представили исследователи Золтан Дьонгьи и Гектор Гарсиа-Молина из Стэнфордского университета и Ян Педерсен из Yahoo! в своей статье «Борьба с веб-спамом с помощью TrustRank» в 2004 году. [1] Сегодня этот алгоритм является частью основных поисковых систем, таких как Yahoo! и Гугл. [2]
Одним из наиболее важных факторов, которые помогают поисковой системе определить качество веб-страницы при возврате результатов, являются обратные ссылки . Поисковые системы учитывают количество и качество обратных ссылок при назначении места определенной веб-странице в результатах поиска. Многие страницы со спамом создаются только с целью ввести в заблуждение поисковые системы . Эти страницы, созданные в основном по коммерческим причинам, используют различные методы для достижения более высокого, чем заслуженного, рейтинга на страницах результатов поисковых систем . Хотя эксперты-люди могут легко идентифицировать спам, поисковые системы по-прежнему ежедневно совершенствуются, чтобы делать это без помощи людей.
Одним из популярных методов улучшения рейтинга является повышение воспринимаемой важности документа с помощью сложных схем ссылок. Google PageRank и другие алгоритмы поискового ранжирования подверглись таким манипуляциям.
TrustRank стремится бороться со спамом, фильтруя Интернет на основе надежности. Метод предполагает выбор небольшого набора исходных страниц для оценки экспертом. После того как авторитетные исходные страницы идентифицируются вручную, сканирование, выходящее за пределы исходного набора, ищет столь же надежные и заслуживающие доверия страницы. Надежность TrustRank снижается с увеличением расстояния между документами и исходным набором.
Логика работает и противоположным способом, который называется антимонопольным рейтингом. Чем ближе сайт к спам-ресурсам, тем больше вероятность, что он тоже является спамом. [3]
Исследователи, предложившие методологию TrustRank, продолжили совершенствовать свою работу, оценивая смежные темы, такие как измерение массы спама .
См. также
[ редактировать ]- Рейтинг страницы
- ЧейРанк
- Поиск состязательной информации
- Алгоритм вершины холма
- ХИТ-алгоритм
- Спамдексинг
Ссылки
[ редактировать ]- ^ Дьёньи, Золтан; Гарсиа-Молина, Гектор (2004). Борьба с веб-спамом с помощью TrustRank (PDF) . Материалы 30-й конференции ВЛДБ. Торонто, Канада . Проверено 26 мая 2022 г.
- ^ 7603350 , Гуха, Раманатан, «Патент США: 7603350 — Рейтинг результатов поиска на основе доверия», выдан 13 октября 2009 г.
- ^ Кришнан, Виджай; Радж, Рашми. «Обнаружение веб-спама с использованием антимонопольного рейтинга» (PDF) . Стэнфордский университет . Проверено 11 января 2015 г.
Внешние ссылки
[ редактировать ]- З. Дьёндьи, Х. Гарсиа-Молина, Дж. Педерсен: борьба со спамом с помощью TrustRank
- Обнаружение спама на основе ссылок Yahoo! присвоенная заявка на патент с использованием TrustRank