Семантическая публикация
Семантическая публикация в Интернете , или семантическая веб- публикация , относится к публикации информации в сети в виде документов, сопровождаемых семантической разметкой . Семантическая публикация позволяет компьютерам понять структуру и даже значение опубликованной информации, что делает поиск информации и интеграцию данных более эффективными. [1] [2] [3] [4] [5] [6] [7]
Хотя семантическая публикация не является специфичной для Интернета, она была вызвана развитием семантической сети. В семантической сети опубликованная информация сопровождается метаданными, описывающими информацию, обеспечивая «семантический» контекст. [8] [9] [10]
Хотя семантическая публикация потенциально может изменить облик веб-публикаций , ее признание зависит от появления привлекательных приложений. Веб-сайты уже могут быть созданы со всем содержимым как в формате HTML , так и в семантическом формате. [11] RSS 1.0 использует формат RDF (стандарт семантической сети), хотя он стал менее популярным, чем RSS2.0 и Atom . [12]
Семантическая публикация может произвести революцию в научной публикации . Тим Бернерс-Ли предсказал в 2001 году, что семантическая сеть «вероятно, глубоко изменит саму природу того, как производятся и распространяются научные знания , способами, которые мы сейчас едва можем себе представить». [13] Возвращаясь к семантической сети в 2006 году, он и его коллеги полагали, что семантическая сеть «может совершить революцию в том, как, например, управляется научный контент на протяжении всего его жизненного цикла». [8] Исследователи могли самостоятельно публиковать данные своих экспериментов в «семантическом» формате в Интернете. Семантические поисковые системы могли бы затем сделать эти данные широко доступными. Группа интересов W3C в области здравоохранения и наук о жизни изучает эту идею. [14]
Два подхода [ править ]
- Публикуйте информацию в виде объектов данных, используя семантические веб-языки, такие как RDF и OWL . Онтология обычно разрабатывается для конкретной информационной области, которая может формально представлять данные в своей области. Семантическая публикация более общей информации, такой как информация о продуктах, новости и вакансии, использует так называемую поверхностную онтологию . [12] Проект SWEO Linking Open Data [15] ведет список источников данных [16] которые следуют этому подходу, а также список инструментов семантической публикации. [17]
- Выражайте структурированные данные на языках разметки с помощью RDFa , внедряйте или публикуйте информацию, используя JSON-LD , Turtle , TriG . синтаксисы
Примеры [ править ]
Примеры онтологий и словарей для публикации | Примеры контейнеров «семантического контента» для публикации |
Примеры бесплатных инструментов и услуг с открытым исходным кодом [ править ]
- Ambra Project — это программное обеспечение с открытым исходным кодом, предназначенное для публикации открытого доступа журналов с помощью RDF . Используется PLoS .
- Semantic MediaWiki : расширение вики-приложения MediaWiki , которое позволяет пользователям семантически аннотировать данные в вики, а затем публиковать их в таких форматах, как RDF XML.
- Сервер D2R : инструмент для публикации реляционных баз данных в семантической сети в качестве связанных данных и конечных точек SPARQL .
- Документы Utopia Интерактивные документы [18]
- dokieli — клиентский редактор для децентрализованной публикации статей в HTML+RDFa (и встраиваемых TriG, Turtle, JSON-LD), аннотаций и социального взаимодействия. Он реализует спецификации W3C: Web Annotation , Linked Data Notifications , Activity Streams 2.0 , ActivityPub . Использует WebID + TLS и WebID + OIDC для аутентификации, список управления веб-доступом и совместимость с платформой связанных данных . Статьям и аннотациям можно индивидуально назначить лицензию Creative Commons , а также язык . В его исходном коде используется лицензия Apache версии 2.0.
См. также [ править ]
- JSON-LD
- Метаданные
- Публикация метаданных
- Открытая семантическая структура
- Семантическая технология
- RDF-канал
- Фид данных
Ссылки [ править ]
- ^ Эттвуд, Теннесси ; Келл, Д.Б .; Макдермотт, П.; Марш, Дж.; Петтифер, СР ; Торн, Д. (2009). «Призыв к международной помощи: знания потеряны в литературе и обвале данных!» . Биохимический журнал . 424 (3): 317–333. дои : 10.1042/BJ20091474 . ПМК 2805925 . ПМИД 19929850 .
- ^ Бэтчелор, CR, и Корбетт, PT (2007) Семантическое обогащение журнальных статей с использованием распознавания химических названных объектов. Материалы демонстрационных и стендовых сессий ACL 2007, страницы 45–48, Прага, июнь 2007 г.
- ^ Петтифер, С .; Макдермотт, П.; Марш, Дж.; Торн, Д.; Виллегер, А.; Эттвуд, ТК (2011). «Ceci n'est pas un hamburger: моделирование и представление научной статьи» . Изучал издательское дело . 24 (3): 207. дои : 10.1087/20110309 .
- ^ Шоттон, Д. (2009). «Семантическая публикация: грядущая революция в издании научных журналов» . Изучал издательское дело . 22 (2): 85–94. дои : 10.1087/2009202 .
- ^ Шоттон, Д.; Портвин, К.; Клайн, Г.; Майлз, А. (2009). Борн, Филип Э. (ред.). «Приключения в семантической публикации: образцовые семантические улучшения исследовательской статьи» . PLOS Вычислительная биология . 5 (4). е1000361. Бибкод : 2009PLSCB...5E0361S . дои : 10.1371/journal.pcbi.1000361 . ПМЦ 2663789 . ПМИД 19381256 .
- ^ Шедболт, Найджел ; Бернерс-Ли, Тим ; Холл, Венди (май – июнь 2006 г.). «Возвращение к семантической сети» (PDF) . Интеллектуальные системы IEEE . 21 (3): 96–101. дои : 10.1109/MIS.2006.62 . S2CID 7719423 .
- ^ Бернерс-Ли, Т.; Хендлер, Дж. (2001). «Публикация в семантической сети». Природа . 410 (6832): 1023–1024. дои : 10.1038/35074206 . ПМИД 11323639 . S2CID 32243333 .
- ^ Перейти обратно: а б Шедболт, Бернерс-Ли и Холл, 2006 .
- ^ Стефан Градманн: От каталогов к графикам: изменение терминов для меняющейся профессии
- ^ Халл, Д.; Петтифер, С .; Келл, Д. (октябрь 2008 г.). Макинтайр, Джоанна (ред.). «Разморозка цифровой библиотеки: библиографические инструменты для сети следующего поколения» . PLOS Вычислительная биология . 4 (10). е1000204. Бибкод : 2008PLSCB...4E0204H . дои : 10.1371/journal.pcbi.1000204 . ISSN 1553-734X . ПМК 2568856 . ПМИД 18974831 .
- ^
Примеры:
• обмен мыслями [ нужна проверка ]
• UMBC равноправный капитал
• «Зачем публиковать [sic] необработанные данные экспериментов?» . web2express.org. 5 декабря 2006 г. Архивировано из оригинала 6 января 2007 г. - ^ Перейти обратно: а б Web2express.org применяет RDF к различным потокам данных. Воспользоваться их услугами может каждый: «Единый поток данных» . web2express.org. Архивировано из оригинала 11 октября 2007 г., для создания и предоставления ресурсов данных RDF и каналов данных для продуктов, новостей, событий, вакансий и исследований.
- ^ Бернерс-Ли и Хендлер, 2001 г.
- ^ «HCLS/ScientificPublishingTaskForce» . W2C. «О демо» . Архивировано из оригинала 4 января 2007 г.
- ^ «SweoIG/TaskForces/CommunityProjects/LinkingOpenData» . W2C.
- ^ список источников данных
- ^ Инструменты семантической публикации
- ^ Эттвуд, Теннесси ; Келл, Д.Б .; Макдермотт, П.; Марш, Дж.; Петтифер, СР ; Торн, Д. (2010). «Документы утопии: связь научной литературы с данными исследований» . Биоинформатика . 26 (18): i568–i574. doi : 10.1093/биоинформатика/btq383 . ПМЦ 2935404 . ПМИД 20823323 .