Jump to content

Универсальная ИК-оценка

В информатике . универсальная IR Evaluation ( оценка поиска информации ) направлена ​​на разработку показателей производительности поиска из базы данных, которые должны быть сопоставимы для всех задач поиска информации

Меры «релевантности»

[ редактировать ]

Оценка IR (поиска информации) начинается каждый раз, когда пользователь отправляет запрос (условие поиска) в базу данных . Если пользователь может определить релевантность каждого документа в базе данных (релевантный или нерелевантный), то для каждого запроса полный набор документов естественным образом разделяется на четыре отдельных (взаимоисключающих) подмножества: релевантные документы, которые извлекаются, не соответствующие документы, которые извлекаются, соответствующие документы, которые не извлекаются, и не соответствующие документы, которые не извлекаются. Эти четыре подмножества (документов) обозначаются буквами a, b, c, d соответственно и называются переменными Swets, названными в честь их изобретателя. [1]

В дополнение к определениям Светса также были определены четыре показателя релевантности: «Напоминание» относится к доле извлеченных релевантных документов (a/(a+b)), а «Точность» относится к доле релевантных извлеченных документов (a /(a+b)). /(а+с)). Это наиболее часто используемые и известные показатели релевантности, встречающиеся в литературе по оценке IR. Два менее часто используемых показателя включают Fallout, т. е. долю нерелевантных документов, которые были извлечены (b/(b+d)), и Miss, который относится к доле нерелевантных документов, которые не были извлечены (c/( c+d)) во время любого поиска.

Универсальные методы оценки IR

[ редактировать ]

Универсальная оценка IR рассматривает математические возможности и взаимосвязи между четырьмя метриками релевантности Precision, Recall, Fallout и Miss, обозначаемыми P, R, F и M соответственно. Один из аспектов проблемы заключается в нахождении математического вывода полного набора универсальных точек оценки IR. [2] Полный набор из 16 пунктов, каждый из которых представляет собой четверку формы (P,R,F,M), описывает все возможные универсальные исходы IR. Например, многие из нас имели опыт запроса к базе данных и вообще не получения каких-либо документов. В этом случае Точность примет неопределенную форму 0/0, Отзыв и Осадки будут равны нулю, а Промах будет любым значением больше нуля и меньше единицы (при условии, что было сочетание релевантных и нерелевантных документов). в базе данных, ни один из которых не был получен). Таким образом, эта универсальная точка оценки IR будет обозначаться (0/0, 0, 0, M), что представляет собой только один из 16 возможных универсальных результатов IR.

Математика универсальной оценки IR — довольно новый предмет, поскольку метрики релевантности P,R,F,M не анализировались коллективно до недавнего времени (в течение последнего десятилетия). Многие теоретические основы уже сформулированы, но новые идеи в этой области еще ждут своего открытия. Для детального математического анализа запрос в базе данных ScienceDirect по запросу «универсальная оценка IR» позволяет получить несколько соответствующих рецензируемых статей.

См. также

[ редактировать ]
  1. ^ Светс, JA (1969). Эффективность методов поиска информации. Американская документация, 20 (1), 72–89.
  2. ^ Шаткун, М. (2010). Второй взгляд на универсальную ИК-поверхность Эгге и простой вывод полного набора универсальных оценочных точек ИК. Обработка информации и управление, 46 (1), 110-114.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2b58607a2c57a4219e57f5f0478e871b__1669967760
URL1:https://arc.ask3.ru/arc/aa/2b/1b/2b58607a2c57a4219e57f5f0478e871b.html
Заголовок, (Title) документа по адресу, URL1:
Universal IR Evaluation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)