Jump to content

Базы данных, не зависящие от схемы

Базы данных, не зависящие от схемы, или базы данных, независимые от словаря, направлены на то, чтобы помочь пользователям абстрагироваться от представления данных, поддерживая автоматическое семантическое сопоставление между запросами и базами данных . Схемо-агностицизм — это свойство базы данных отображать запрос, выданный с пользовательской терминологией и структурой, автоматически сопоставляя его со словарем набора данных.

Увеличение размера и семантической неоднородности схем баз данных предъявляют новые требования к пользователям, осуществляющим запросы и поиск структурированных данных . В таком масштабе потребителям данных может оказаться невозможным ознакомиться с представлением данных, чтобы делать запросы к ним. В центре этой дискуссии находится семантический разрыв между пользователями и базами данных, который становится все более важным по мере роста масштаба и сложности данных.

Описание

[ редактировать ]

Эволюция сред данных в сторону потребления данных из нескольких источников данных и роста размера , сложности , динамичности и децентрализации ( SCoDD) схем. [1] [2] [3] увеличивает сложность современного управления данными. Тенденция SCoDD возникает как центральная проблема управления данными в сценариях больших данных , где пользователи и приложения нуждаются в более полных данных, полученных из независимых источников данных, при различных семантических предположениях и контекстах использования, что является типичным сценарием для семантической сети. Приложения данных.

Эволюция баз данных в направлении гетерогенных сред данных сильно влияет на удобство использования, семиотику и семантические предположения, лежащие в основе существующих методов доступа к данным, таких как структурированные запросы, поиск по ключевым словам и системы визуальных запросов. Поскольку базы данных без схемы содержат потенциально миллионы динамически изменяющихся атрибутов, для некоторых пользователей становится невозможным узнать о «схеме» или словаре, чтобы выполнить запрос к базе данных. В этом масштабе усилия по пониманию схемы для построения структурированного запроса могут оказаться непомерно высокими.

Независимые от схемы запросы

[ редактировать ]

Запросы, не зависящие от схемы, можно определить как подходы к запросам к структурированным базам данных, которые позволяют пользователям удовлетворять сложные информационные потребности без понимания представления (схемы) базы данных. Аналогичным образом, Тран и др. [4] определяет его как «подходы поиска, которые не требуют от пользователей знания схемы, лежащей в основе данных». Такие подходы, как поиск по ключевым словам в базах данных, позволяют пользователям выполнять запросы к базам данных без использования структурированных запросов. Однако, как обсуждали Тран и др.: «Однако с этих точек зрения пользователям приходится осуществлять дальнейшую навигацию и исследование для удовлетворения сложных информационных потребностей. В отличие от поиска по ключевым словам, используемого в Интернете, который фокусируется на простых потребностях, поиск по ключевым словам, разработанный здесь, является используется для получения более сложных результатов. Вместо одного набора ресурсов цель состоит в том, чтобы вычислить сложные наборы ресурсов и их отношения».

Разработка подходов к поддержке интерфейсов естественного языка (NLI) в базах данных была направлена ​​на создание запросов, не зависящих от схемы. Кроме того, некоторые подходы, основанные на поиске по ключевым словам, ориентированы на запросы на основе ключевых слов, которые выражают более сложные информационные потребности. Другие подходы исследовали построение структурированных запросов к базам данных, в которых ограничения схемы можно ослабить. Все эти подходы (естественный язык, поиск по ключевым словам и структурированные запросы) нацелены на различную степень сложности решения проблемы поддержки гибкого семантического соответствия между запросами и данными, которые варьируются от полного отсутствия семантического интереса до более принципиального семантического подхода. модели. Хотя требование схемо-агностицизма было неявным требованием для систем семантического поиска и запросов на естественном языке к структурированным данным, оно недостаточно индивидуализировано как концепция и как необходимое требование для современных систем управления базами данных. Недавние работы начали определять и моделировать семантические аспекты, связанные с запросами, не зависящими от схемы. [1] [5] [6]

Структурированные запросы, не зависящие от схемы

[ редактировать ]

Состоят из независимых от схемы запросов, следующих синтаксису структурированного стандарта (например, SQL , SPARQL ). Синтаксис и семантика операторов сохраняются, но используется другая терминология.

SELECT ?y {
  BillClinton hasDaughter ?x .
  ?x marriedTo ?y .
}

который соответствует следующему запросу SPARQL в словаре набора данных:

PREFIX : <http://dbpedia.org/resource/>
PREFIX dbpedia2: <http://dbpedia.org/property/>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT   ?y  {
 :Bill_Clinton dbpedia:child ?x .
 ?x dbpedia2:spouse ?y .
 }
SELECT   ?x {
         ?x isA book .
         ?x by William_Goldman .
         ?x has_pages ?p .
         FILTER (?p > 300)
  }

который соответствует следующему запросу SPARQL в словаре набора данных:

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX : <http://dbpedia.org/resource/>
PREFIX dbpedia2: <http://dbpedia.org/property/>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
SELECT ?x {
         ?x rdf:type dbpedia:Book .
         ?x dbpedia2:author :William_Goldman . 
         ?x dbpedia:numberOfPages ?p .
FILTER(?p > 300)
}

Запросы по ключевым словам, не зависящие от схемы

[ редактировать ]

Состоят из запросов, не зависящих от схемы, с использованием запросов по ключевым словам. В этом случае синтаксис и семантика операторов отличаются от синтаксиса структурированного запроса.

"Bill Clinton daughter married to"
"Books by William Goldman with more than 300 pages"

Семантическая сложность

[ редактировать ]

По состоянию на 2016 год концепция схемонезависимых запросов разрабатывалась в основном в научных кругах. Большинство систем запросов, не зависящих от схемы, были исследованы в контексте интерфейсов естественного языка в базах данных или в семантической сети . [7] В этих работах исследуется применение методов семантического анализа в больших, гетерогенных и бессхемных базах данных. Совсем недавно в литературе более явно появилась индивидуализация концепции схемно-независимых запросных систем и баз данных. [1] [5] [6] Фрейтас и др. [8] предоставить вероятностную модель семантической сложности отображения запросов, не зависящих от схемы.

  1. ^ Перейти обратно: а б с А. Фрейтас, «Независимые от схемы запросы к базам данных с большой схемой: подход семантики распределения», докторская диссертация, 2015 г.
  2. ^ Пэт Хелланд, ["Если у вас слишком много данных, то «достаточно хорошо» — это достаточно хорошо»], Commun. ACM 54(6): 40–47, 2011.
  3. ^ М.Л. Броди и Дж.Т. Лю, [«Мощь и ограничения реляционных технологий в эпоху информационных экосистем»], Основной доклад, Федеративные конференции On The Move, Ираклион, Греция, 25–29 октября 2010 г.
  4. ^ Т. Тран, Т. Матэсс, П. Хаазе, [«Удобство использования схемы-агностического поиска по ключевым словам - сравнительное исследование поиска по ключевым словам, фасетного поиска, завершения запроса и завершения результатов»], в материалах 7th Extended Semantic Web Конференция (ESWC'10). Ираклион, Греция, июнь 2010 г.
  5. ^ Перейти обратно: а б А. Фрейтас, Х. К. Перейра да Силва, Э. Карри, «О семантическом отображении схемонезависимых запросов: предварительное исследование» , Семинар по интерфейсам естественного языка для сети данных (NLIWoD), 13-я Международная семантическая веб-конференция ( ISWC), Соперник дель Гарда, 2014.
  6. ^ Перейти обратно: а б С. Бишоф, М. Кречш, А. Поллерес, С. Рудольф, [«Переписывание схемно-агностических запросов в SPARQL 1.1»], В материалах 13-й Международной конференции по семантической сети. Спрингер 2014.
  7. ^ Унгер и др., [«Введение в ответы на вопросы по связанным данным»], в материалах летней школы Reasoning Web 2014 г., 2014 г.
  8. ^ А. Фрейтас, Дж. Э. Сэйлс, С. Хандшу, Э. Карри, «Насколько сложен запрос? Измерение семантической сложности схемонезависимых запросов» , В материалах 11-й Международной конференции по вычислительной семантике (IWCS), Лондон, 2015.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dd187f58d1c73ce71b0513993ace3902__1621106520
URL1:https://arc.ask3.ru/arc/aa/dd/02/dd187f58d1c73ce71b0513993ace3902.html
Заголовок, (Title) документа по адресу, URL1:
Schema-agnostic databases - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)