Интеграция данных на основе онтологий
Интеграция данных на основе онтологий предполагает использование одной или нескольких онтологий для эффективного объединения данных или информации из нескольких разнородных источников. [1] Это один из многочисленных подходов к интеграции данных , который можно классифицировать как Global-As-View (GAV). [2] Эффективность интеграции данных на основе онтологий тесно связана с согласованностью и выразительностью онтологии, используемой в процессе интеграции.
Фон
[ редактировать ]Данные из нескольких источников характеризуются множеством типов неоднородности. Часто используется следующая иерархия: [3] [4] [5]
- Синтаксическая неоднородность : является результатом различий в формате представления данных.
- Схематическая или структурная неоднородность : собственная модель или структура для хранения данных различаются источниками данных, что приводит к структурной неоднородности. Схематическая неоднородность, которая особенно проявляется в структурированных базах данных, также является аспектом структурной неоднородности. [3]
- Семантическая неоднородность : различия в интерпретации «значения» данных являются источником семантической неоднородности.
- Неоднородность системы : использование разных операционных систем и аппаратных платформ приводит к неоднородности системы.
Онтологии как формальные модели представления с явно определенными понятиями и связывающими их именованными отношениями используются для решения проблемы семантической неоднородности в источниках данных. В таких областях, как биоинформатика и биомедицина , быстрое развитие, внедрение и общедоступность онтологий [1] позволило сообществу интеграции данных использовать их для семантической интеграции данных и информации.
Роль онтологий
[ редактировать ]Онтологии позволяют однозначно идентифицировать объекты в гетерогенных информационных системах и устанавливать применимые именованные отношения, которые соединяют эти объекты вместе. В частности, онтологии играют следующие роли:
- Экспликация контента
- [1] Онтология обеспечивает точную интерпретацию данных из нескольких источников посредством явного определения терминов и отношений в онтологии.
- Модель запроса
- [1] В некоторых системах, таких как SIMS, [6] запрос формулируется с использованием онтологии как глобальной схемы запроса.
- Проверка
- [1] Онтология проверяет сопоставления, используемые для интеграции данных из нескольких источников. Эти сопоставления могут быть либо заданы пользователем, либо созданы системой.
Подходы с использованием онтологий для интеграции данных
[ редактировать ]Существует три основные архитектуры, которые реализуются в приложениях интеграции данных на основе онтологий: [1] а именно,
- Подход с использованием единой онтологии
- В качестве глобальной эталонной модели в системе используется единая онтология. Это самый простой подход, поскольку его можно моделировать другими подходами. [1] ВИМС [6] яркий пример такого подхода. Компонент интеграции структурированных источников знаний в Research Cyc является еще одним ярким примером этого подхода. [7] [8] (Название = Использование Cyc для ответа на специальные запросы клинических исследователей). Таксономический словарь-онтология Геллша также следует этому подходу. [9]
- Множественные онтологии
- Для интеграции используются комбинации нескольких онтологий, каждая из которых моделирует отдельный источник данных. Хотя этот подход более гибок, чем подход с использованием одной онтологии, он требует создания сопоставлений между несколькими онтологиями. Отображение онтологий является сложной проблемой и находится в центре внимания большого количества исследований в области информатики [2] . Система ОБСЕРВЕР [10] является примером такого подхода.
- Гибридные подходы
- Гибридный подход предполагает использование нескольких онтологий, которые используют общий словарь верхнего уровня. [11] Словарь верхнего уровня определяет основные термины предметной области. Таким образом, гибридный подход упрощает использование нескольких онтологий для интеграции при наличии общего словаря.
См. также
[ редактировать ]- Сопоставление данных
- Интеграция корпоративных приложений
- Интеграция корпоративной информации
- Отображение онтологий
- Соответствие схемы
Дальнейшее чтение
[ редактировать ]- Чикко, Д; Массероли, М (2016). «Прогнозирование на основе онтологий и приоритезация функциональных аннотаций генов» . Транзакции IEEE/ACM по вычислительной биологии и биоинформатике . 13 (2): 248–260. дои : 10.1109/TCBB.2015.2459694 . ПМИД 27045825 . S2CID 2795344 .
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж Х. Гвардия; Т. Фогеле; У. Виссер; Х. Штукеншмидт; Г. Шустер; Х. Нойман; С. Хюбнер (2001). Интеграция информации на основе онтологий. Обзор существующих подходов . CiteSeerX 10.1.1.142.4390 .
- ^ Маурицио Лензерини (2002). Интеграция данных: теоретическая перспектива (PDF) . стр. 243–246.
- ^ Перейти обратно: а б АП Шет (1999). «Изменение акцента на функциональную совместимость в информационных системах: от системы, синтаксиса, структуры к семантике». Взаимодействующие географические информационные системы. М. Ф. Гудчайлд, М. Дж. Эгенхофер, Р. Фегеас и К. А. Коттман (ред.), Kluwer Academic Publishers (PDF) . стр. 5–30.
- ^ AHM02 Учебное пособие 5: Интеграция и посредничество данных; Авторы: Б. Людаешер, И. Алтинтас, А. Гупта, М. Мартоне, Р. Марчиано, Х. Цянь.
- ^ «Урок 5 AHM02: Интеграция и посредничество данных» . user.sdsc.edu . Проверено 23 ноября 2017 г.
- ^ Перейти обратно: а б Ю. Аренс; К. Сюй; К. А. Ноблок (1996). Обработка запросов в информационном посреднике Sims (PDF) .
- ^ «Интеграция семантических источников знаний | Cycorp» . www.cyc.com . Архивировано из оригинала 17 мая 2014 г.
- ^ «Использование Cyc для ответа на специальные запросы клинических исследователей | Ленат | Журнал AI» . Архивировано из оригинала 31 декабря 2010 г. Проверено 15 мая 2014 г.
- ^ "Дом" . сайт gellish.net .
- ^ Э. Мена; В. Кашьяп; А. Шет; А. Илларраменди (1996). НАБЛЮДАТЕЛЬ: Подход к обработке запросов в глобальных информационных системах на основе взаимодействия уже существующих онтологий (PDF) .
- ^ Ченг Хиан Го (1997). Представление и рассуждение о семантических конфликтах в гетерогенных информационных системах (PDF) .