Jump to content

Связанные данные

(Перенаправлено из Связанных открытых данных )
Сеть из более чем тысячи кругов, сгруппированных в группы и связанных линиями в паутину.
Викиданные в связанном облаке открытых данных. Базы данных обозначены кружками (викиданные обозначены буквой «WD»), а серые линии соединяют базы данных в сети, если их данные выровнены. Создано по адресу https://lod-cloud.net/datasets .
DBpedia как наиболее взаимосвязанный набор данных LOD и точка кристаллизации связанного облака открытых данных с 2008 года.
DBpedia как наиболее взаимосвязанный набор данных LOD и точка кристаллизации связанного облака открытых данных с 2008 года, изображение 2021 года, созданное с https://lod-cloud.net .

В вычислениях семантических связанные данные — это структурированные данные, которые взаимосвязаны с другими данными, поэтому они становятся более полезными посредством запросов . Он основан на стандартных веб- технологиях, таких как HTTP , RDF и URI , но вместо того, чтобы использовать их для обслуживания веб-страниц только для читателей-людей, он расширяет их возможности для обмена информацией таким образом, чтобы ее могли автоматически читать компьютеры. Частью концепции связанных данных является превращение Интернета в глобальную базу данных . [1]

Тим Бернерс-Ли , директор Консорциума Всемирной паутины (W3C), ввёл этот термин в заметку о дизайне проекта Semantic Web в 2006 году . [2]

Связанные данные также могут быть открытыми данными , и в этом случае их обычно называют связанными открытыми данными. [3]

Принципы

[ редактировать ]

В своей заметке «Связанные данные» 2006 года Тим Бернерс-Ли изложил четыре принципа связанных данных, перефразировав их следующим образом: [2]

  1. Единые идентификаторы ресурсов (URI) следует использовать для именования и идентификации отдельных объектов.
  2. HTTP URI должны использоваться для того, чтобы эти вещи можно было искать, интерпретировать и впоследствии «разыменовывать».
  3. Полезная информация о том, что идентифицирует имя, должна предоставляться через открытые стандарты, такие как RDF , SPARQL и т. д.
  4. При публикации данных в Интернете следует ссылаться на другие объекты, используя их имена на основе HTTP URI.

Тим Бернерс-Ли позже подтвердил эти принципы на конференции TED 2009 года , снова перефразировав их следующим образом: [4]

  1. Все концептуальные вещи должны иметь имя, начинающееся с HTTP .
  2. Поиск по имени HTTP должен возвращать полезные данные о рассматриваемом объекте в стандартном формате.
  3. Все остальное, с чем эта же вещь связана через свои данные, также должно иметь имя, начинающееся с HTTP.

Компоненты

[ редактировать ]

Таким образом, мы можем определить следующие компоненты как важные для глобальной системы связанных данных, как это предполагалось, и для любого фактического подмножества связанных данных в ней:

Связанные открытые данные

[ редактировать ]

Связанные открытые данные — это связанные данные, которые являются открытыми данными . [5] [6] [7] Тим Бернерс-Ли дает самое четкое определение связанных открытых данных в отличие от связанных данных.

Связанные открытые данные (LOD) — это связанные данные, которые выпускаются по открытой лицензии, что не препятствует их бесплатному повторному использованию.

Тим Бернерс-Ли, Связанные данные [2] [8]

Большие связанные наборы открытых данных включают DBpedia , Wikibase , Wikidata и Open ICEcat [ uk ; нл ] .

5-звездочные связанные открытые данные

[ редактировать ]
Схема развертывания связанных открытых данных [9]

В 2010 году Тим Бернерс-Ли предложил пятизвездочную схему оценки качества открытых данных в сети, по которой наивысший рейтинг имеет «Связанные открытые данные»: [10]

  • 1 звезда: данные в каком-то формате находятся в открытом доступе.
  • 2 звезды: данные доступны в структурированном формате, например в формате файла Microsoft Excel (.xls).
  • 3 звезды: данные доступны в непатентованном структурированном формате, например значениях, разделенных запятыми (.csv).
  • 4 звезды: данные соответствуют стандартам W3C , например, с использованием RDF и URI .
  • 5 звезд: все остальные, а также ссылки на другие источники связанных открытых данных.

Термин «связанные открытые данные» используется по крайней мере с февраля 2007 года, когда в списке рассылки «Связывание открытых данных» [11] был создан. [12] Список рассылки изначально был организован проектом . SIMILE [13] в Массачусетском технологическом институте .

Связывание проекта сообщества открытых данных

[ редактировать ]
На приведенной выше диаграмме показано, какие наборы данных Linking Open Data связаны между собой по состоянию на август 2014 года. Она была создана в рамках проекта Linked Open Data Cloud, который был начат в 2007 году. Некоторые наборы могут включать в себя данные, защищенные авторским правом, которые находятся в свободном доступе. [14]
Та же диаграмма, что и выше, но за февраль 2017 года, показывающая рост всего за два с половиной года.

Целью проекта сообщества Linking Open Data группы W3C Semantic Web Education and Outreach является расширение Интернета за счет общего доступа к данным путем публикации различных открытых наборов данных в формате RDF в Интернете и установки RDF связей между элементами данных из разных источников данных. В октябре 2007 года наборы данных состояли из более чем двух миллиардов троек RDF , которые были связаны между собой более чем двумя миллионами ссылок RDF. [15] [16] К сентябрю 2011 года это число выросло до 31 миллиарда троек RDF, связанных между собой примерно 504 миллионами ссылок RDF. Подробная статистическая разбивка была опубликована в 2014 году. [17]

Проекты Европейского Союза

[ редактировать ]

Существует ряд проектов Европейского Союза, в которых используются связанные данные. К ним относятся проект связанных открытых данных круглосуточно (LATC), [18] проект AKN4EU для машиночитаемых законодательных данных, [19] проект PlanetData, [20] проект DaPaaS (данные и платформа как услуга), [21] и проект Linked Open Data 2 (LOD2). [22] [23] [24] Объединение данных является одной из основных целей Портала открытых данных ЕС , который делает доступными тысячи наборов данных, которые каждый может повторно использовать и связывать.

Онтологии

[ редактировать ]

Онтологии — это формальные описания структур данных. Некоторые из наиболее известных онтологий:

  • FOAF – онтология, описывающая людей, их свойства и отношения.
  • UMBEL — облегченная справочная структура из 20 000 классов предметных концепций и их отношений, полученных из OpenCyc , которые могут выступать в качестве классов привязки к внешним данным; также имеет ссылки на 1,5 миллиона именованных объектов из DBpedia и YAGO.

Наборы данных

[ редактировать ]

Экземпляр набора данных и отношения классов

[ редактировать ]

Доступны кликабельные диаграммы, показывающие отдельные наборы данных и их взаимосвязи в облаке LOD, созданном DBpedia (как показано на рисунках справа). [29] [30]

См. также

[ редактировать ]
  1. ^ «Связанные данные в формате JSON» . Связанные данные в формате JSON . Проверено 4 декабря 2020 г.
  2. ^ Перейти обратно: а б с Тим Бернерс-Ли (27 июля 2006 г.). «Связанные данные» . Проблемы дизайна . W3C . Проверено 18 декабря 2010 г.
  3. ^ «Что такое связанные данные и связанные открытые данные?» . Онтотекст . Проверено 8 мая 2019 г.
  4. ^ «Тим Бернерс-Ли в следующей сети» . Архивировано из оригинала 10 апреля 2011 г. Проверено 15 марта 2009 г.
  5. ^ «Часто задаваемые вопросы (FAQ) — Связанные данные — Подключение распределенных данных через Интернет» . Архивировано из оригинала 18 ноября 2015 г. Проверено 29 декабря 2014 г.
  6. ^ «COAR »7 вещей, которые вам следует знать о… связанных данных» . Архивировано из оригинала 18 ноября 2015 г. Проверено 29 декабря 2015 г.
  7. ^ «Основы связанных данных для технических специалистов» . Архивировано из оригинала 5 мая 2021 г. Проверено 29 декабря 2015 г.
  8. ^ «5 звезд открытых данных» .
  9. ^ «5-звездочные открытые данные» . 5stardata.info . Проверено 7 марта 2021 г.
  10. ^ «Что такое 5-звездочные связанные данные? | Группа сообщества Webize Everything» . www.w3.org . Проверено 7 марта 2021 г.
  11. ^ « [электронная почта защищена] Почтовые архивы» .
  12. ^ «SweoIG/TaskForces/CommunityProjects/LinkingOpenData/NewsArchive» .
  13. ^ «Проект SIMILE — Списки рассылки» .
  14. ^ Связывание диаграммы облака открытых данных 2014 года, авторы Макс Шмахтенберг, Кристиан Бизер, Аня Йенч и Ричард Циганиак. http://lod-cloud.net/
  15. ^ «SweoIG/TaskForces/CommunityProjects/LinkingOpenData — W3C Wiki» . esw.w3.org . Проверено 22 марта 2018 г.
  16. ^ Фензель, Дитер; Факка, Федерико Микеле; Симперл, Елена; Иоан, Том (2011). Семантические веб-службы . Спрингер. п. 99. ИСБН  978-3642191923 .
  17. ^ Макс. «Состояние LOD-облака» . linkeddatacatalog.dws.informatik.uni-mannheim.de . Проверено 22 марта 2018 г.
  18. ^ «Связанные открытые данные круглосуточно (LATC)» . latc-project.eu . Архивировано из оригинала 19 сентября 2018 года . Проверено 22 марта 2018 г.
  19. ^ Флэтт, Амели; Лангнер, Арне; Лепс, Олоф (2022), «Разработка профилей приложений AKN на основе моделей: предыстория и требования» , Разработка профилей приложений Akoma Ntoso на основе моделей , Cham: Springer International Publishing, стр. 5–12, doi : 10.1007/978- 3-031-14132-4_2 , ISBN  978-3-031-14131-7 , получено 7 января 2023 г.
  20. ^ «Добро пожаловать в PlanetData! — PlanetData» . Planet-data.eu . Архивировано из оригинала 21 апреля 2021 года . Проверено 22 марта 2018 г.
  21. ^ «ДаПааС» . project.dapaas.eu . Архивировано из оригинала 18 декабря 2020 года . Проверено 22 марта 2018 г.
  22. ^ Связывание открытых данных 2 (LOD2)
  23. ^ «Проекты ИКТ CORDIS FP7 – LOD2» . Европейская комиссия. 20 апреля 2010 г.
  24. ^ «Информационный бюллетень о проекте LOD2 – Краткое описание проекта» (PDF) . 01 сентября 2010 г. Архивировано из оригинала (PDF) 20 июля 2011 г. Проверено 18 декабря 2010 г.
  25. ^ «ГРИД-статистика» . Grid.ac/stats . Проверено 26 октября 2018 г.
  26. ^ «ГРИД-политика» . сетка.ac . Проверено 26 октября 2018 г.
  27. ^ «ЗнайГдеГраф» . Knowwheregraph.org . Проверено 16 мая 2022 г.
  28. ^ Кшиштоф Янович; Паскаль Хитцлер ; Венвен Ли; Дин Ребергер; Марк Шильдхауэр; Руй Чжу; Коган Симидзу; Колби К. Фишер; Лин Цай; Генгчен Май; Джозеф Залевски; Лу Чжоу; Ширли Стивен; Сейла Гонсалес Эстреча; Брайс Д. Мекам; Анна Лопес-Карр; Эндрю Шредер; Дэйв Смит; Дон Дж. Райт; Сыже Ван; Юаньюань Тянь; Цзилун Лю; Мэйлин Ши; Энтони Д'Онофрио; Жинин Г; Китти Карриер (2022). «Знать, знать где, знать, где граф: плотно связанный междоменный граф знаний и стек сервисов географического обогащения для приложений в области экологической разведки» . Журнал ИИ . 43 (1): 30–39. дои : 10.1609/aimag.v43i1.19120 . hdl : 1983/be176aba-9dec-456c-9615-01a0e8556b7b .
  29. ^ «Отношения экземпляров между наборами данных» . fu-berlin.de . Архивировано из оригинала 17 октября 2012 г. Проверено 22 марта 2018 г.
  30. ^ «Классовые отношения между наборами данных» . Архивировано из оригинала 28 августа 2011 года . Проверено 22 марта 2018 г.

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c5750cf86db4b8f28d8a099ff7479f2c__1717694880
URL1:https://arc.ask3.ru/arc/aa/c5/2c/c5750cf86db4b8f28d8a099ff7479f2c.html
Заголовок, (Title) документа по адресу, URL1:
Linked data - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)