Семантическая тройка
, Семантическая тройка или тройка RDF или просто тройка , — это атомарный объект данных в Resource Description Framework (RDF) модели данных . [ 1 ] Как следует из названия, тройка представляет собой последовательность трех сущностей , которая кодифицирует утверждение о семантических данных в форме выражений субъект-предикат-объект (например, «Бобу 35 лет» или «Боб знает Джона»).
Субъект, предикат и объект
[ редактировать ]Этот формат позволяет представлять знания в машиночитаемом виде. В частности, каждая часть тройки RDF индивидуально адресуется через уникальные URI — например, утверждение «Боб знает Джона» может быть представлено в RDF как:
http://example.name#BobSmith12 http://xmlns.com/foaf/0.1/knows http://example.name#JohnDoe34
.
При таком точном представлении семантические данные можно однозначно запрашивать и анализировать .
Компоненты тройки, такие как высказывание «Небо имеет синий цвет», состоят из подлежащего («небо»), сказуемого («имеет цвет») и объекта («синий»). Это похоже на классическое обозначение модели «сущность-атрибут-значение» в рамках объектно-ориентированного проектирования , где этот пример может быть выражен как сущность (небо), атрибут (цвет) и значение (синий).
Из этой базовой структуры тройки могут быть составлены в более сложные модели , используя тройки в качестве объектов или субъектов других троек, например: Mike → said → (triples → can be → objects)
.
Учитывая их особую, согласованную структуру, коллекция троек часто хранится в специально созданных базах данных, называемых тройными хранилищами .
Отличие от реляционных баз данных
[ редактировать ]Реляционная база данных — это классическая форма хранения информации, работающая с различными таблицами, состоящими из строк. Язык запросов SQL способен извлекать информацию из такой базы данных. Напротив, тройное хранилище RDF работает с логическими предикатами. Ни таблицы, ни строки не нужны, информация хранится в текстовом файле. Тройное хранилище RDF можно преобразовать в базу данных SQL и наоборот. [ 2 ] Если знания сильно неструктурированы и специальные таблицы недостаточно гибки, вместо классического реляционного хранилища используются семантические тройки.
В отличие от традиционной базы данных SQL, тройное хранилище RDF не создается с помощью редактора таблиц. Предпочтительным инструментом является редактор знаний , например Protégé . [ 3 ] Protégé похож на приложение объектно-ориентированного моделирования, используемое для разработки программного обеспечения , но оно ориентировано на информацию на естественном языке. Тройки RDF агрегируются в базу знаний , что позволяет внешним парсерам выполнять запросы. Возможные применения включают создание неигровых персонажей в видеоиграх. [ 4 ]
Ограничения
[ редактировать ]Одной из проблем, связанных с тройным хранилищем, является отсутствие масштабируемости базы данных . [ 5 ] Эта проблема особенно актуальна, если в базе данных хранятся и извлекаются миллионы троек. Время поиска больше, чем для классических баз данных на основе SQL .
Более сложная проблема — неспособность модели знаний предсказывать будущие состояния. Даже если все знания предметной области доступны в виде логических предикатов , модель не может ответить на вопросы «что, если» . Например, предположим, в формате RDF описана комната с роботом и столом. Робот знает, где находится стол, знает расстояние до него, а также знает, что стол — это разновидность мебели. Прежде чем робот сможет спланировать свое следующее действие, ему необходимы способности временного мышления . [ 6 ] Таким образом, модель знаний должна заранее отвечать на гипотетические вопросы, прежде чем будут предприняты действия.
См. также
[ редактировать ]- Именованные графы и четырехугольники — расширение семантических троек, включающее также узел контекста в качестве четвертого элемента.
- База данных графов
- Отношение ссылки
Ссылки
[ редактировать ]- ^ http://www.w3.org/TR/PR-rdf-syntax/ «Модель и синтаксис структуры описания ресурсов (RDF)»
- ^ Каддихи, Пол и МакХью, Джастин и Уильямс, Дженни Вайзенберг и Малвад, Вариш и Аггур, Карим С. (2017). «SemTK: ориентированный на онтологии семантический инструментарий с открытым исходным кодом для управления графами знаний и запроса их». arXiv : 1710.11531 [ cs.AI ].
{{cite arXiv}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Катис, Евангелос (2018). Семантическое моделирование образовательной программы и программы (PhD). Технологический образовательный институт Крита.
- ^ Клювер, Тина и Адольфс, Питер и Сюй, Фейю и Ушкорейт, Ханс и Ченг, Сивэнь (2010). Говорящие NPC в виртуальном игровом мире . Материалы демонстраций системы ACL 2010. стр. 36–41.
{{cite conference}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Ярослав Покорный (2015). «Базы данных графов: их возможности и ограничения» (PDF) . Компьютерные информационные системы и промышленный менеджмент . Компьютерные информационные системы и промышленный менеджмент. Конспекты лекций по информатике. Том. 9339. Международное издательство Springer. стр. 58–69. дои : 10.1007/978-3-319-24369-6_5 . ISBN 978-3-319-24368-9 .
- ^ Клаудио Гутьеррес, Карлос Уртадо и Алехандро Вайсман (2007). «Введение времени в RDF». Транзакции IEEE по знаниям и инженерии данных . 19 (2). Институт инженеров по электротехнике и электронике (IEEE): 207–218. дои : 10.1109/tkde.2007.34 . S2CID 9749119 .
Внешние ссылки
[ редактировать ]- ^ XiWeb https://www.xiweb.it/