Поиск состязательной информации
Состязательный поиск информации ( adversarial IR ) — это тема поиска информации , связанная со стратегиями работы с источником данных, некоторая часть которого подверглась злонамеренному манипулированию. Задачи могут включать сбор, индексацию, фильтрацию, извлечение и ранжирование информации из такого источника данных. Состязательное IR включает изучение методов обнаружения, изоляции и противодействия таким манипуляциям.
В Интернете преобладающей формой таких манипуляций является спам в поисковых системах (также известный как спамдексинг), который предполагает использование различных методов для нарушения деятельности поисковых систем , обычно ради финансовой выгоды. Примерами спамдексинга являются ссылочные бомбардировки , в комментариях или спам реферерах , спам-блоги (сплоги), вредоносные теги. Реверс-инжиниринг , алгоритмов ранжирования мошенничество с кликами , [1] фильтрация веб -контента также может рассматриваться как форма состязательного манипулирования данными . [2]
Темы [ править ]
Темы, связанные с веб-спамом (спамдексингом):
- Ссылочный спам
- Спам по ключевым словам
- Маскировка
- Вредоносная пометка
- Спам, связанный с блогами, включая спам в комментариях , спамы и пинг-спам.
Другие темы:
- Нажмите Обнаружение мошенничества
- Реверс-инжиниринг поисковой системы ранжирования алгоритма
- веб- контента Фильтрация
- Блокировка рекламы
- Скрытное ползание
- Тролль (Интернет)
- Злонамеренная пометка или голосование в социальных сетях
- Астротурфинг
- Носоккукольный театр
История [ править ]
Термин «состязательный поиск информации» впервые был придуман в 2000 году Андреем Бродером (тогдашним главным научным сотрудником Alta Vista ) во время веб-пленарного заседания на конференции TREC -9. [3]
См. также [ править ]
Ссылки [ править ]
- ^ Янсен, Б.Дж. (2007) Мошенничество с кликами . IEEE-компьютер. 40(7), 85-86.
- ^ Б. Дэвисон, М. Наджорк и Т. Конверс (2006), Отчет рабочего листа SIGIR: Поиск состязательной информации в Интернете (AIRWeb 2006)
- ^ Д. Хокинг и Н. Красвелл (2004), Очень крупномасштабный поиск и веб-поиск (препринтная версия). Архивировано 29 августа 2007 г. в Wayback Machine.
Внешние ссылки [ править ]
- AIRWeb : серия семинаров по состязательному поиску информации в Интернете.
- Web Spam Challenge : конкурс исследователей по обнаружению веб-спама
- Наборы данных веб-спама : наборы данных для исследования обнаружения веб-спама.