Неопределенный вывод

Неопределенный вывод был впервые описан К. Дж. ван Рейсбергеном. ^[1] как способ формального определения отношений запроса и документа при поиске информации . Эта формализация является логическим следствием с приложенной мерой неопределенности.

Определения [ править ]

Рейсберген предлагает, чтобы мерой неопределенности документа d к запросу q была вероятность его логического следствия, т.е.:

P(d\to q)

Запрос пользователя можно интерпретировать как набор утверждений о желаемом документе. Задача системы — сделать вывод по конкретному документу, верны ли утверждения запроса. Если они есть, документ извлекается.Во многих случаях содержимого документов недостаточно для подтверждения запросов. Необходима база знаний фактов и правил, но некоторые из них могут быть неопределенными, поскольку может существовать вероятность, связанная с их использованием для вывода. Поэтому мы также можем называть это правдоподобным выводом . Правдоподобность вывода $d\to q$ является функцией правдоподобия каждого утверждения запроса. Вместо того, чтобы извлекать документ, который точно соответствует запросу, мы должны ранжировать документы на основе их правдоподобия в отношении этого запроса.Поскольку d и q генерируются пользователями, они подвержены ошибкам; таким образом $d\to q$ является неопределенным. Это повлияет на достоверность данного запроса.

Делая это, он достигает двух целей:

Отделите процессы пересмотра вероятностей от логики.
Отделите обработку релевантности от обработки запросов.

Мультимедийные документы, такие как изображения или видео, имеют разные свойства вывода для каждого типа данных. Они также отличаются от свойств текстового документа. Структура правдоподобного вывода позволяет нам измерять и комбинировать вероятности, исходящие из этих различных свойств.

Неопределенный вывод обобщает понятия автоэпистемической логики , где истинностные значения либо известны, либо неизвестны, а когда они известны, они истинны или ложны.

Пример [ править ]

Если у нас есть запрос вида:

q=A\wedge B\wedge C

где A, B и C — утверждения запроса, тогда для документа D нам нужна вероятность:

P(D\to (A\wedge B\wedge C))

Если мы преобразуем это в условную вероятность $P((A\wedge B\wedge C)|D)$ и если утверждения запроса независимы, мы можем вычислить общую вероятность импликации как произведение вероятностей отдельных утверждений.

Дальнейшая работа [ править ]

Крофт и Кровец ^[2] применили неопределенный вывод к системе поиска информации по офисным документам, которую они назвали OFFICER . В офисных документах предположение о независимости справедливо, поскольку запрос будет сосредоточен на их индивидуальных атрибутах. Помимо анализа содержания документов, можно также узнать, например, об авторе, размере, теме или коллекции. Они разработали методы сравнения атрибутов документов и запросов, определения их правдоподобности и объединения этих результатов в общую оценку для каждого документа. Кроме того, необходимо было решить проблему неопределенности содержания документов и запросов.

Вероятностно-логические сети — это система выполнения неопределенного вывода; четкие значения истинности/ложности заменяются не только вероятностью, но и уровнем достоверности, указывающим достоверность вероятности.

Марковские логические сети позволяют делать неопределенные выводы; неопределенности вычисляются с использованием принципа максимальной энтропии по аналогии с тем, как цепи Маркова описывают неопределенность конечных автоматов .

См. также [ править ]

Ссылки [ править ]

^ К. Дж. ван Рейсберген (1986), Неклассическая логика поиска информации (PDF) , The Computer Journal, стр. 481–485.
^ ВБ Крофт; Р. Кровец (1988), «Интерактивный поиск офисных документов», конференция, спонсируемая ACM SIGOIS и IEEECS TC-OA, по офисным информационным системам - , стр. 228–235, doi : 10.1145/45410.45435 , ISBN 0897912616 , S2CID 16840138

[1] К. Дж. ван Рейсберген (1986), Неклассическая логика поиска информации (PDF) , The Computer Journal, стр. 481–485.

[2] ВБ Крофт; Р. Кровец (1988), «Интерактивный поиск офисных документов», конференция, спонсируемая ACM SIGOIS и IEEECS TC-OA, по офисным информационным системам - , стр. 228–235, doi : 10.1145/45410.45435 , ISBN 0897912616 , S2CID 16840138

[1]

[2]