Jump to content

Расширенная логическая модель

Расширенная логическая модель была описана в статье Communications of the ACM, опубликованной в 1983 году, Джерардом Солтоном, Эдвардом А. Фоксом и Гарри Ву. Целью расширенной логической модели является преодоление недостатков булевой модели, которая использовалась при поиске информации . Булева модель не учитывает веса терминов в запросах, а набор результатов логического запроса часто либо слишком мал, либо слишком велик. Идея расширенной модели состоит в том, чтобы использовать частичное сопоставление и веса термов, как в модели векторного пространства. Он сочетает в себе характеристики модели векторного пространства со свойствами булевой алгебры и ранжирует сходство между запросами и документами. Таким образом, документ может быть в некоторой степени релевантным, если он соответствует некоторым запрошенным условиям и будет возвращен в результате, тогда как в стандартной логической модели это не так. [1]

Таким образом, расширенную булеву модель можно рассматривать как обобщение как булевой модели, так и модели векторного пространства; эти два случая являются особыми случаями, если используются подходящие настройки и определения. Кроме того, исследования показали, что эффективность повышается по сравнению с обработкой логических запросов. Другое исследование показало, что обратная связь по релевантности и расширение запроса могут быть интегрированы с расширенной обработкой логических запросов.

Определения [ править ]

В расширенной логической модели документ представляется в виде вектора (аналогично в векторной модели). Каждое i измерение соответствует отдельному термину, связанному с документом.

Вес термина K x, связанного с документом d j, измеряется его нормализованной частотой термина и может быть определен как:

где Idf x обратная частота документов , а f x,j — частота терминов для термина x в документе j.

Вектор весов, связанный с документом d j, можно представить как:

Пример двух измерений [ править ]

Рисунок 1
Рисунок 1: Сходство q = ( K x K y ) с документами d j и d j +1 .
Рисунок 2
Рисунок 2: Сходство q = ( K x K y ) с документами d j и d j +1 .

Если рассматривать пространство, состоящее только из двух термов K x и K y , соответствующие веса термов равны w 1 и w 2 . [2] Таким образом, для запроса q или = ( K x K y ) мы можем вычислить сходство по следующей формуле:

Для запроса q и = ( K x K y ) мы можем использовать:

идеи и P Обобщение - нормы

Мы можем обобщить предыдущий пример расширенной двумерной логической модели на более t-мерное пространство, используя евклидовы расстояния.

Это можно сделать с помощью P-норм , которые расширяют понятие расстояния, включив в него p-расстояния, где 1 ≤ p ≤ ∞ — новый параметр. [3]

  • Обобщенный конъюнктивный запрос задается следующим образом:
  • Сходство и можно определить как:

:

  • Обобщенный дизъюнктивный запрос задается следующим образом:
  • Сходство и можно определить как:

Примеры [ править ]

Рассмотрим запрос q знак равно ( K 1 K 2 ) ∨ K 3 . Сходство между запросом q и документом d можно вычислить по формуле:

со стандартной логической моделью сравнению по Улучшения

Ли и Фокс [4] сравнили стандартную и расширенную логические модели с тремя наборами тестов: CISI, CACM и INSPEC.Используя P-нормы, они получили среднее улучшение точности на 79%, 106% и 210% по сравнению со стандартной моделью для коллекций CISI, CACM и INSPEC соответственно.
Модель P-нормы требует больших вычислительных затрат из-за количества операций возведения в степень, но она дает гораздо лучшие результаты, чем стандартная модель и даже методы нечеткого поиска . Стандартная булева модель по-прежнему остается наиболее эффективной.

Дальнейшее чтение [ править ]

  • Методы адаптивной обратной связи в расширенной логической модели доктора Джонгпилла Чоя
  • Интерполяция расширенной модели логического поиска
  • Фокс, Э.; Бетрабет, С.; Кошик, М.; Ли, В. (1992), Информационный поиск: алгоритмы и структуры данных; Расширенная логическая модель , Prentice-Hall, Inc., заархивировано из оригинала 28 сентября 2013 г. , получено 9 сентября 2017 г.
  • Скорковска, Люси; Ирсинг, Павел (2009), «Эксперименты с автоматической формулировкой запроса в расширенной логической модели», Текст, речь и диалог , Конспекты лекций по информатике, том. 5729, Springer Berlin/Heidelberg, стр. 371–378, doi : 10.1007/978-3-642-04208-9_51 , hdl : 11025/16985 , ISBN  978-3-642-04207-2

См. также [ править ]

Ссылки [ править ]

  1. ^ Солтон, Джерард; Фокс, Эдвард А.; Ву, Гарри (1983), «Расширенный поиск логической информации», Communications of ACM , 26 (11), Communications of ACM, Volume 26, Issue 11: 1022–1036, doi : 10.1145/182.358466 , hdl : 1813/6351 , S2CID   207180535
  2. ^ «Лушэн Ван» . Архивировано из оригинала 27 сентября 2011 г. Проверено 1 декабря 2009 г.
  3. ^ Гарсия, доктор Э., Расширенная логическая модель — взвешенные запросы: веса терминов, запросы p-нормы и мультиконцептуальные типы. Логическое или расширенное? И это запрос
  4. ^ Ли, туалет; Фокс, Э.А. (1988), Экспериментальное сравнение схем интерпретации логических запросов (PDF)
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2f784dd91ce0cfd93419a8353a14da3c__1711236660
URL1:https://arc.ask3.ru/arc/aa/2f/3c/2f784dd91ce0cfd93419a8353a14da3c.html
Заголовок, (Title) документа по адресу, URL1:
Extended Boolean model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)