Jump to content

Вероятностная модель релевантности

Вероятностная модель релевантности [1] [2] была разработана Стивеном Э. Робертсоном и Карен Сперк Джонс как основа для вероятностных моделей будущих . Это формализм поиска информации, полезный для получения функций ранжирования, используемых поисковыми системами и поисковыми системами в Интернете для ранжирования совпадающих документов в соответствии с их релевантностью данному поисковому запросу.

Это теоретическая модель, оценивающая вероятность того, что документ d j соответствует запросу q . Модель предполагает, что эта вероятность релевантности зависит от представления запроса и документа. Более того, предполагается, что существует часть всех документов, которую пользователь предпочитает в качестве набора ответов для запроса q . Такой идеальный набор ответов называется R и должен максимизировать общую вероятность релевантности этому пользователю. Прогнозируется, что документы в этом наборе R релевантны запросу, а документы, отсутствующие в наборе, нерелевантны.

Сопутствующие модели [ править ]

У этой структуры есть некоторые ограничения, которые необходимо устранить при дальнейшей разработке:

  • Точная оценка вероятности первого запуска не существует.
  • Индексные термины не взвешиваются
  • Термины предполагаются взаимонезависимыми.

Для решения этих и других проблем на основе теории вероятностной релевантности были разработаны другие модели, в том числе модель двоичной независимости того же автора. Наиболее известной производной этой схемы является схема взвешивания Окапи (BM25) , а также ее модификация BM25F.

Ссылки [ править ]

  1. ^ Робертсон, SE; Джонс, К. Сперк (май 1976 г.). «Релевантность поисковых запросов». Журнал Американского общества информатики . 27 (3): 129–146. дои : 10.1002/asi.4630270302 .
  2. ^ Робертсон, Стивен; Сарагоса, Уго (2009). «Структура вероятностной релевантности: BM25 и далее». Основы и тенденции в области информационного поиска . 3 (4): 333–389. CiteSeerX   10.1.1.156.5282 . дои : 10.1561/1500000019 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d4c5b4ec37eac94c2a3f91d8ed9f394c__1624723200
URL1:https://arc.ask3.ru/arc/aa/d4/4c/d4c5b4ec37eac94c2a3f91d8ed9f394c.html
Заголовок, (Title) документа по адресу, URL1:
Probabilistic relevance model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)