Семантическая интеграция

Семантическая интеграция — это процесс взаимодействия информации из различных источников, например, календарей и списков дел, архивов электронной почты, информации о присутствии (физическом, психологическом и социальном), документов всех видов, контактов (включая социальные графики ), результатов поиска и т. д. рекламная и маркетинговая значимость, вытекающая из них. В этом отношении семантика фокусируется на организации информации и воздействии на нее , выступая в качестве посредника между разнородными источниками данных, которые могут конфликтовать не только по структуре, но также по контексту или значению.

Приложения и методы

При интеграции корпоративных приложений (EAI) семантическая интеграция может облегчить или даже автоматизировать связь между компьютерными системами с помощью публикации метаданных . Публикация метаданных потенциально дает возможность автоматически связывать онтологии . Один из подходов к (полу)автоматическому отображению онтологий требует определения семантического расстояния или его обратного семантического подобия и соответствующих правил. Другие подходы включают так называемые лексические методы , а также методологии, основанные на использовании структур онтологий. Для явного указания сходства/равенства в большинстве языков онтологий существуют специальные свойства или отношения. OWL , например, имеет «owl:equiваленткласс», «owl:equiвалентProperty» и «owl: SameAs ».

В конечном итоге в конструкции систем могут появиться составные архитектуры, в которых опубликованные семантические интерфейсы объединяются вместе, чтобы обеспечить новые и значимые возможности. ^{[ нужна ссылка ]}. Преимущественно они могут быть описаны с помощью декларативных спецификаций времени разработки, которые в конечном итоге могут быть отображены и выполнены во время выполнения. ^{[ нужна ссылка ]}.

Семантическая интеграция также может использоваться для облегчения действий по проектированию и отображению интерфейса во время разработки. В этой модели семантика явно применяется только к проектированию, а системы времени выполнения работают на синтаксиса. уровне ^{[ нужна ссылка ]}. Этот подход «ранней семантической привязки» может улучшить общую производительность системы, сохраняя при этом преимущества семантического проектирования. ^{[ нужна ссылка ]}.

Ситуации семантической интеграции

В отраслевом варианте использования было замечено, что семантические сопоставления выполнялись только в пределах класса онтологии или свойства типа данных . Эти идентифицированные семантические интеграции представляют собой (1) интеграцию экземпляров класса онтологии в другой класс онтологии без каких-либо ограничений, (2) интеграцию выбранных экземпляров одного класса онтологии в другой класс онтологии посредством ограничения диапазона значения свойства и (3) интеграцию экземпляры класса онтологии в другой класс онтологии с преобразованием значения свойства экземпляра. Для каждого из них требуется определенное отношение отображения, которое соответственно является: (1) отношением эквивалентного отображения или отношения включения, (2) отношением условного отображения, которое ограничивает значение свойства (диапазон данных) и (3) отношением преобразования преобразования, которое преобразует значение свойство (преобразование единицы). Каждое идентифицированное отношение отображения может быть определено либо как (1) тип прямого отображения, (2) тип отображения диапазона данных или (3) тип отображения преобразования единицы.

Подходы KG и RDB

В случае интеграции дополнительного источника данных,

KG ( график знаний ) формально представляет значение, заключенное в информации, путем описания концепций, отношений между вещами и категорий вещей. Эта встроенная семантика данных дает значительные преимущества, такие как анализ данных и работа с разнородными источниками данных. Правила можно более эффективно применять к KG с помощью запроса графа. Например, запрос к графу выполняет вывод данных через связанные отношения вместо повторного полного поиска таблиц в реляционной базе данных. KG облегчает интеграцию новых разнородных данных, просто добавляя новые связи между существующей информацией и новыми объектами. Это упрощение подчеркивается необходимостью интеграции с существующими популярными связанными источниками открытых данных, такими как Wikidata.org.
SQL- запрос тесно связан и жестко ограничен типом данных в конкретной базе данных и может объединять таблицы и извлекать данные из таблиц, а результатом обычно является таблица, а запрос может объединять таблицы по любым столбцам, совпадающим по типу данных. Запрос SPARQL — это стандартный язык запросов и протокол для связанных открытых данных в Интернете, он слабо связан с базой данных, что облегчает повторное использование и позволяет извлекать данные через отношения, свободные от типа данных, и не только извлекать, но и генерировать дополнительный граф знаний. с более сложными операциями (логика: транзитивная/симметричная/инверсная/функциональная). Запрос на основе вывода (запрос существующих утвержденных фактов без генерации новых фактов с помощью логики) может быть быстрым по сравнению с запросом на основе рассуждений (запрос существующих плюс сгенерированных/обнаруженных фактов на основе логики).
Информационная интеграция разнородных источников данных в традиционной базе данных сложна, что требует перепроектирования таблицы базы данных, например, изменения структуры и/или добавления новых данных. В случае семантического запроса запрос SPARQL отражает отношения между сущностями таким образом, который соответствует пониманию человеком предметной области, поэтому семантическое намерение запроса можно увидеть в самом запросе. В отличие от SPARQL, SQL-запрос, который отражает конкретную структуру базы данных и получен в результате сопоставления соответствующих первичных и внешних ключей таблиц, теряет семантику запроса из-за отсутствия связей между сущностями. Ниже приведен пример сравнения запросов SPARQL и SQL для лекарств, лечащих «туберкулез позвоночника».

ВЫБЕРИТЕ ?лекарство
ГДЕ {
Пример диагностики: Диагностика.
?Пример диагноза: наименование «ТБ позвонка».
?Пример лекарства:canTreat ?диагноз.
}

ВЫБЕРИТЕ DRUG.medID
ИЗ ДИАГНОЗА, ПРЕПАРАТ, НАРКОТИК_ДИАГНОЗ
ГДЕ DIAGNOSIS.diagnosisID=DRUG_DIAGNOSIS.diagnosisID
И DRUG.medID=DRUG_DIAGNOSIS.medID
AND DIAGNOSIS.name="ТБ позвонка"

Примеры

Тихоокеанский симпозиум по биокомпьютингу стал местом популяризации задачи картирования онтологий в биомедицинской области, и в его материалах можно найти ряд статей по этой теме.

См. также

Ссылки

Внешние ссылки