Jump to content

Обратная связь по актуальности

Обратная связь по релевантности является особенностью некоторых систем поиска информации . Идея обратной связи по релевантности состоит в том, чтобы взять результаты, которые изначально возвращаются по заданному запросу, собрать отзывы пользователей и использовать информацию о том, релевантны ли эти результаты для выполнения нового запроса. Мы можем с пользой различать три типа обратной связи: явную обратную связь, неявную обратную связь и слепую или «псевдо» обратную связь.

Явная обратная связь [ править ]

От оценщиков релевантности получается явная обратная связь, указывающая на релевантность документа, полученного для запроса. Этот тип обратной связи определяется как явный только тогда, когда эксперты (или другие пользователи системы) знают, что предоставленная обратная связь интерпретируется как релевантное суждение.

Пользователи могут явно указывать релевантность, используя двоичную или градуированную систему релевантности. Обратная связь по двоичной релевантности указывает, что документ либо релевантный, либо нерелевантный для данного запроса. Обратная связь по градуированной релевантности указывает на релевантность документа запросу по шкале с использованием цифр, букв или описаний (например, «не релевантно», «в некоторой степени релевантно», «релевантно» или «очень релевантно»). Степень релевантности может также принимать форму кардинального упорядочения документов, созданных оценщиком; то есть оценщик размещает документы результирующего набора в порядке релевантности (обычно по убыванию). Примером этого может быть функция SearchWiki , реализованная Google на их поисковом веб-сайте.

Информацию обратной связи по релевантности необходимо интерполировать с исходным запросом для повышения производительности поиска, например, с помощью известного алгоритма Роккио .

Метрикой производительности , ставшей популярной примерно в 2005 году для измерения полезности алгоритма ранжирования , основанного на явной обратной связи по релевантности, является нормализованный дисконтированный совокупный выигрыш . Другие меры включают точность при k и среднюю среднюю точность .

Неявная обратная связь [ править ]

Неявная обратная связь выводится из поведения пользователей, например, из наблюдения за тем, какие документы они выбирают, а какие нет, продолжительности времени, затраченного на просмотр документа, а также действий по просмотру страниц или прокрутке. [1] В процессе поиска существует множество сигналов, которые можно использовать для неявной обратной связи и типов информации, которую можно предоставить в ответ. [2] [3]

Ключевые отличия неявной обратной связи по релевантности от явной включают в себя: [4]

  1. Пользователь не оценивает актуальность для пользы ИК-системы, а лишь удовлетворяет собственные потребности и
  2. Пользователь не обязательно информируется о том, что его поведение (выбранные документы) будет использовано в качестве обратной связи.

Примером этого является время пребывания , которое является показателем того, как долго пользователь проводит просмотр страницы, на которую есть ссылка в результатах поиска. Это показатель того, насколько хорошо результат поиска соответствует намерению пользователя, и используется в качестве механизма обратной связи для улучшения результатов поиска.

Псевдорелевантная обратная связь [ править ]

Псевдообратная связь по релевантности, также известная как «слепая обратная связь по релевантности», обеспечивает метод автоматического локального анализа. Он автоматизирует ручную часть обратной связи по релевантности, так что пользователь получает улучшенную производительность поиска без расширенного взаимодействия. Метод состоит в том, чтобы выполнить обычный поиск, чтобы найти начальный набор наиболее релевантных документов, затем предположить, что документы с самым высоким рейтингом «k» релевантны, и, наконец, сделать обратную связь по релевантности, как и раньше, при этом предположении. Процедура такова:

  1. Примите результаты, полученные первоначальным запросом, в качестве релевантных результатов (в большинстве экспериментов только верхний k, где k находится в диапазоне от 10 до 50).
  2. Выберите 20–30 наиболее популярных (ориентировочное число) терминов из этих документов, используя, например, веса tf-idf .
  3. Выполните расширение запроса, добавьте эти термины в запрос, а затем сопоставьте возвращенные документы с этим запросом и, наконец, верните наиболее релевантные документы.

Некоторые эксперименты, такие как результаты системы Cornell SMART, опубликованные в (Buckley et al.1995), показывают улучшение производительности поисковых систем с использованием обратной связи псевдорелевантности в контексте экспериментов TREC 4.

Этот автоматический метод в основном работает. Имеющиеся данные свидетельствуют о том, что он, как правило, работает лучше, чем глобальный анализ. [5] Благодаря расширению запроса некоторые важные документы, пропущенные в первом раунде, можно затем получить, чтобы повысить общую производительность. Очевидно, что эффект этого метода во многом зависит от качества выбранных членов разложения. Было обнаружено, что это улучшает производительность при выполнении специальной задачи TREC. [ нужна ссылка ] . Но это не лишено опасностей автоматического процесса. Например, если запрос касается медных рудников, а несколько верхних документов посвящены рудникам в Чили, то запрос может смещаться в сторону документов по Чили. Кроме того, если слова, добавленные в исходный запрос, не связаны с темой запроса, качество поиска может ухудшиться, особенно при веб-поиске, где веб-документы часто охватывают несколько разных тем. Для улучшения качества слов расширения в обратной связи по псевдорелевантности предложена обратная связь по позиционной релевантности для обратной связи по псевдорелевантности, позволяющая выбирать из документов обратной связи те слова, которые ориентированы на тему запроса, на основе позиций слов в документах обратной связи. [6] В частности, модель позиционной релевантности присваивает больший вес словам, встречающимся ближе к словам запроса, основываясь на интуитивном предположении, что слова, расположенные ближе к словам запроса, с большей вероятностью будут связаны с темой запроса.

Слепая обратная связь автоматизирует ручную часть обратной связи по релевантности и имеет то преимущество, что оценщики не требуются.

Использование релевантной информации [ править ]

Информация о релевантности используется путем использования содержимого соответствующих документов для корректировки веса терминов в исходном запросе или путем использования этого содержимого для добавления слов в запрос. Обратная связь по релевантности часто реализуется с помощью алгоритма Роккио .

Ссылки [ править ]

  1. ^ «Архивная копия» (PDF) . www.scils.rutgers.edu . Архивировано из оригинала (PDF) 16 марта 2004 года . Проверено 12 января 2022 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  2. ^ Янсен, Б.Дж. и Макнис, доктор медицинских наук, 2005. Оценка эффективности и моделей взаимодействия с автоматизированной помощью в ИК-системах . Журнал Американского общества информатики и технологий. 56(14), 1480-1503
  3. ^ Келли, Дайан и Джейми Тиван. « Неявная обратная связь для определения предпочтений пользователя: библиография ». Форум ACM SIGIR. Том. 37. № 2. АКМ, 2003.
  4. ^ «Архивная копия» (PDF) . haystack.lcs.mit.edu . Архивировано из оригинала (PDF) 11 июня 2007 года . Проверено 12 января 2022 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  5. ^ Цзиньси Сюй и В. Брюс Крофт, Расширение запросов с использованием локального и глобального анализа документов , в материалах 19-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области поиска информации (SIGIR), 1996.
  6. ^ Юаньхуа Л.в. и Ченгсян Чжай, Модель позиционной релевантности для обратной связи о псевдорелевантности , в материалах 33-й международной конференции ACM SIGIR по исследованиям и разработкам в области поиска информации (SIGIR), 2010.

Дальнейшее чтение [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d6b144fa578a4d744ab63379b8cc88e7__1695379260
URL1:https://arc.ask3.ru/arc/aa/d6/e7/d6b144fa578a4d744ab63379b8cc88e7.html
Заголовок, (Title) документа по адресу, URL1:
Relevance feedback - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)