Минимальные сопоставления
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Минимальные сопоставления являются результатом передовой техники семантического сопоставления — техники, используемой в информатике для идентификации семантически связанной информации. [1]
Семантическое сопоставление было предложено как действенное решение проблемы семантической неоднородности, а именно, поддержка разнообразия в знаниях. [2] Для любых двух графоподобных структур, например классификаций, баз данных или XML-схем и онтологий , сопоставление — это оператор , который идентифицирует те узлы в двух структурах, которые семантически соответствуют друг другу. Например, применительно к файловым системам он может определить, что папка с надписью «автомобиль» семантически эквивалентна другой папке «автомобиль», поскольку они являются синонимами на английском языке.
Предлагаемый метод работает с облегченными онтологиями, а именно с древовидными структурами, в которых каждый узел помечен предложением на естественном языке, например на английском. [3] Эти предложения переводятся в формальную логическую формулу (по однозначному искусственному языку ). Формула кодифицирует значение узла, учитывая его положение в графе. Например, если папка «автомобиль» находится в другой папке «красный», мы можем сказать, что в этом случае значение папки «автомобиль» — «красный автомобиль». Это переводится в логическую формулу «красный И автомобиль».
Результатом сопоставления является отображение, а именно набор семантических соответствий между двумя графами. Каждый элемент отображения связан семантическим отношением , например эквивалентностью . Среди всех возможных отображений минимальное отображение такое, что все остальные элементы отображения могут быть вычислены из минимального набора за время, пропорциональное размеру входных графов (линейное время), и ни один из элементов минимального набора не может быть вычислен. отброшен, не предотвращая такого вычисления.
Основное преимущество минимальных отображений состоит в том, что они минимизируют количество узлов для последующей обработки. Обратите внимание, что это довольно важная особенность, поскольку количество возможных отображений может достигать n × m , где n и m — размер двух входных онтологий. В частности, минимальные отображения становятся критически важными для больших онтологий, например DMOZ , где даже относительно небольшие (неминимальные) подмножества числа возможных элементов отображения, потенциально миллионы из них, являются неуправляемыми.
Минимальные сопоставления обеспечивают преимущества удобства использования. Для управления сопоставлениями предусмотрено множество систем и соответствующих интерфейсов, в основном графических, но все они плохо масштабируются в зависимости от количества узлов. Визуализация больших графиков довольно беспорядочна. [4] Обслуживание небольших отображений происходит намного проще, быстрее и менее подвержено ошибкам.
См. также
[ редактировать ]- Облегченные онтологии
- Выравнивание онтологии
- Семантическое соответствие
- Семантическая эквивалентность
- Семантическая интеграция
Ссылки
[ редактировать ]- ^ «Вычисление минимальных отображений» (PDF) .
- ^ «Семантическое соответствие» (PDF) .
- ^ «облегченные онтологии» (PDF) .
- ^ «Десять проблем сопоставления онтологий» (PDF) .