Гетерогенная система баз данных
Гетерогенная система баз данных — это автоматизированная (или полуавтоматическая) система для интеграции разнородных, разрозненных систем управления базами данных , чтобы предоставить пользователю единый унифицированный интерфейс запросов.
Гетерогенные системы баз данных (HDB) — это вычислительные модели и программные реализации, которые обеспечивают интеграцию гетерогенных баз данных. [1] [2]
Проблемы интеграции гетерогенных баз данных [ править ]
Эта статья не содержит подробностей о системах управления распределенными базами данных (иногда называемых системами федеративных баз данных ).
Техническая неоднородность
Различные форматы файлов , протоколы доступа , языки запросов и т. д. Часто называют синтаксической неоднородностью с точки зрения данных.
модели данных Неоднородность
Различные способы представления и хранения одних и тех же данных. Декомпозиция таблиц может различаться, имена столбцов (метки данных) могут быть разными (но иметь одинаковую семантику), схемы кодирования данных могут различаться (т. е. должна ли шкала измерения быть явно включена в поле или должна подразумеваться где-то еще). Также называется схематической неоднородностью.
Семантическая неоднородность [ править ]
Данные в составных базах данных могут быть связаны, но различаться. Возможно, система баз данных должна быть способна интегрировать геномные и протеомные данные. Они родственны — ген может иметь несколько белковых продуктов, — но данные различны ( нуклеотидные последовательности и аминокислотные последовательности, гидрофильная или -фобная аминокислотная последовательность и положительно или отрицательно заряженные аминокислоты). Может быть много способов взглянуть на семантически похожие, но разные наборы данных.
Системе также может потребоваться предоставить пользователю «новые» знания. Отношения между данными могут быть выведены в соответствии с правилами, указанными в онтологиях предметной области .
См. также [ править ]
Ссылки [ править ]
- ^ Суджански, Уолтер (август 2001 г.). «Интеграция гетерогенных баз данных в биомедицине» . Журнал биомедицинской информатики . 34 (4): 285–298. дои : 10.1006/jbin.2001.1024 . ПМИД 11977810 .
- ^ Шет, Амит П.; Джеймс А. Ларсон (сентябрь 1990 г.). «Федеративные системы баз данных для управления распределенными, гетерогенными и автономными базами данных» (PDF) . Обзоры вычислительной техники ACM . 22 (3): 183–236. CiteSeerX 10.1.1.381.9176 . дои : 10.1145/96602.96604 .