Семантическая совместимость
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( февраль 2011 г. ) |
Семантическая совместимость — это способность компьютерных систем обмениваться данными с недвусмысленным общим значением. Семантическая совместимость является требованием для обеспечения машинно-вычислимой логики , вывода, обнаружения знаний и объединения данных между информационными системами . [1]
Таким образом, семантическая совместимость связана не только с упаковкой данных ( синтаксис ), но и с одновременной передачей значения с данными ( семантика ). Это достигается путем добавления данных о данных ( метаданных ), связывая каждый элемент данных с управляемым общим словарем . Значение данных передается вместе с самими данными в одном самоописывающемся « информационном пакете », независимом от какой-либо информационной системы. Именно этот общий словарь и связанные с ним связи с онтологией обеспечивают основу и возможности машинной интерпретации, вывода и логики.
Синтаксическая совместимость (см. ниже ) является предпосылкой семантической совместимости. Синтаксическая совместимость относится к механизмам упаковки и передачи данных. В здравоохранении HL7 используется уже более тридцати лет (до появления Интернета и веб-технологий) и использует символ вертикальной черты (|) в качестве разделителя данных. Текущим интернет-стандартом разметки документов является XML , в котором в качестве разделителя данных используется «< >». Разделители данных не придают данным никакого значения, кроме структурирования данных. Без словаря данных для перевода содержимого разделителей данные остаются бессмысленными. Хотя существует множество попыток создания словарей данных и информационных моделей для связи с этими механизмами упаковки данных, ни одна из них не оказалась практичной в реализации. Это лишь увековечило продолжающуюся «вавилонизацию» данных и неспособность обмениваться ими осмысленно.
С момента появления семантической сети концепции Тимом Бернерсом-Ли в 1999 г. [2] растет интерес и растет применение стандартов W3C (Консорциума Всемирной паутины) для обеспечения возможности обмена семантическими данными в масштабе сети, их объединения и вывода.
как функция синтаксической совместимости Семантика
Синтаксическая совместимость, обеспечиваемая, например, стандартами XML или SQL , является предпосылкой семантики. Он включает в себя общий формат данных и общий протокол для структурирования любых данных, чтобы способ обработки информации можно было интерпретировать из структуры. Это также позволяет обнаруживать синтаксические ошибки, что позволяет принимающим системам запрашивать повторную отправку любого сообщения, которое кажется искаженным или неполным. Никакая семантическая связь невозможна, если синтаксис искажен или неспособен представить данные. Однако информация, представленная в одном синтаксисе, в некоторых случаях может быть точно переведена в другой синтаксис. Там, где возможен точный перевод синтаксисов, системы, использующие разные синтаксисы, также могут точно взаимодействовать. В некоторых случаях возможность точного перевода информации между системами, использующими разные синтаксисы, может быть ограничена одним направлением, когда используемые формализмы имеют разные уровни выразительности (способности выражать информацию).
Единая онтология, содержащая представления каждого термина, используемого в каждом приложении, обычно считается невозможной из-за быстрого создания новых терминов или присвоения новых значений старым терминам. Однако, хотя невозможно предугадать каждую концепцию, которую пользователь может пожелать представить в компьютере, существует возможность найти некоторый конечный набор «примитивных» представлений концепций, которые можно объединить для создания любой из более конкретных концепций, которые пользователи могут объединить. может потребоваться для любого заданного набора приложений или онтологий. Наличие базовой онтологии (также называемой верхней онтологией ), которая содержит все эти примитивные элементы, обеспечит прочную основу для общей семантической совместимости и позволит пользователям определять любые новые термины, которые им нужны, используя базовый перечень элементов онтологии, и при этом иметь эти новые элементы. определенные термины, правильно интерпретируемые любой другой компьютерной системой, которая может интерпретировать базовую онтологию основы. Является ли число таких примитивных представлений понятий на самом деле конечным или будет расширяться бесконечно, это вопрос, находящийся в стадии активного исследования. Если она конечна, то стабильная базовая онтология, подходящая для поддержки точной и общей семантической совместимости, может развиваться после того, как некоторая начальная базовая онтология будет протестирована и использована широким кругом пользователей. В настоящее время ни одна онтология фундамента не была принята широким сообществом, поэтому создание такой стабильной онтологии фундамента еще предстоит.
Слова и значения [ править ]
При обсуждении семантики постоянно возникает одно постоянное недоразумение — это «путаница слов и значений». Значения слов меняются, иногда быстро. Но формальный язык , например, используемый в онтологии, может кодировать значения (семантику) понятий в неизменяемой форме. Чтобы определить значение конкретного слова (или термина в базе данных , например), необходимо пометить каждое фиксированное представление понятия в онтологии словом(ями) или термином(ами), которые могут относиться к этому слову. концепция. Когда несколько слов относятся к одному и тому же (фиксированному) понятию в языке, это называется синонимией ; Когда одно слово используется для обозначения более чем одного понятия, это называется двусмысленностью .
Двусмысленность и синонимия относятся к числу факторов, которые очень затрудняют компьютерное понимание языка. Использование слов для обозначения понятий (значений используемых слов) очень чувствительно к контексту и цели любого использования многих удобочитаемых терминов. Использование онтологий для поддержки семантической совместимости заключается в предоставлении фиксированного набора понятий, значения и отношения которых стабильны и могут быть согласованы пользователями. Задача определения того, какие термины и в каких контекстах (каждая база данных представляет собой отдельный контекст) затем отделяется от задачи создания онтологии и должна быть принята на себя разработчиком базы данных или разработчиком формы для ввода данных . или разработчик программы для понимания языка. Когда значение слова, используемого в некотором интероперабельном контексте, изменяется, то для сохранения интероперабельности необходимо изменить указатель на элемент(ы) онтологии, который определяет значение этого слова.
Требования и знаний представления языки
Язык представления знаний может быть достаточно выразительным, чтобы описывать нюансы значений в хорошо понятных областях. Существует как минимум пять уровней сложности. [ указать ] .
Для общих полуструктурированных данных можно использовать язык общего назначения, такой как XML. [3]
языки с полной логикой предикатов первого порядка Для многих задач могут потребоваться .
Человеческие языки очень выразительны, но считаются слишком неоднозначными, чтобы обеспечить желаемую точную интерпретацию, учитывая текущий уровень технологии человеческого языка. Семантическая совместимость систем здравоохранения использует данные стандартизированным образом, поскольку они разбивают информацию и обмениваются ею. Например, две системы теперь могут распознавать терминологию и символы лекарств. Семантическая совместимость систем здравоохранения использует данные стандартизированным образом, поскольку они разбивают информацию и обмениваются ею. Например, две системы теперь могут распознавать терминологию, символы лекарств и другие нюансы, обмениваясь данными автоматически, без вмешательства человека.
Предварительное соглашение не требуется [ править ]
Этот раздел может сбивать с толку или быть неясным для читателей . ( февраль 2016 г. ) |
Семантическое взаимодействие можно отличить от других форм взаимодействия, рассматривая, имеет ли передаваемая информация в переданной форме все значение, необходимое принимающей системе для ее правильной интерпретации, даже если алгоритмы, используемые принимающей системой, неизвестны система отправки. Рассмотрите возможность отправки одного номера:
Если эта цифра представляет собой сумму денег, которую одна компания должна другой, это подразумевает какое-то действие или бездействие как со стороны тех, кто ее отправляет, так и со стороны тех, кто ее получает.
Оно может быть правильно интерпретировано, если отправлено в ответ на конкретный запрос и получено в ожидаемое время и в ожидаемой форме. Эта правильная интерпретация зависит не только от самого числа, которое может представлять почти любой из миллионов типов количественного измерения, но строго зависит от обстоятельств передачи. То есть интерпретация зависит от обеих систем, ожидающих, что алгоритмы в другой системе используют число точно в том же смысле, и, кроме того, она зависит от всего пакета передач, которые предшествовали фактической передаче чистого числа.
Напротив, если передающая система не знает, как информация будет использоваться другими системами, необходимо иметь общее соглашение о том, как информация с некоторым конкретным значением (из множества возможных значений) будет появляться в сообщении. Для конкретной задачи одним из решений является стандартизация формы, например запроса на оплату; этот запрос должен будет стандартизированным образом закодировать всю информацию, необходимую для его оценки, например: агент, задолжавший деньги, агент, задолжавший деньги, характер действия, приводящего к возникновению долга, агенты, товары , сервисы и другие участники этого действия; время действия; сумма задолженности и валюта, в которой рассчитывается задолженность; время, отведенное для оплаты; требуемая форма оплаты; и другая информация. Когда две или более системы договорились о том, как интерпретировать информацию в таком запросе, они могут достичь семантической совместимости для этого конкретного типа транзакции . Для семантической совместимости в целом необходимо предоставить стандартизированные способы описания значений гораздо большего числа вещей, чем просто коммерческие транзакции, а количество концепций, представление которых необходимо согласовать, составляет как минимум несколько тысяч.
Исследование онтологий [ править ]
Как достичь семантической совместимости для более чем нескольких ограниченных сценариев, в настоящее время является предметом исследований и дискуссий. Для проблемы общей семантической совместимости требуется некоторая форма базовой онтологии (« верхняя онтология »), которая является достаточно полной, чтобы обеспечить определение концепций для более специализированных онтологий в нескольких областях. За последнее десятилетие было разработано более десяти базовых онтологий, но ни одна из них до сих пор не была принята широкой базой пользователей.
Потребности в единой всеобъемлющей онтологии для поддержки семантического взаимодействия можно избежать, разработав общую базовую онтологию как набор базовых («примитивных») концепций, которые можно комбинировать для создания логических описаний значений терминов, используемых в онтологии локального домена или локальные базы данных. Эта тактика основана на следующем принципе:
Если:
(1) the meanings and usage of the primitive ontology elements in the foundation ontology are agreed on, and (2) the ontology elements in the domain ontologies are constructed as logical combinations of the elements in the foundation ontology,
Затем:
The intended meanings of the domain ontology elements can be computed automatically using an FOL (first-order logic) reasoner, by any system that accepts the meanings of the elements in the foundation ontology, and has both the foundation ontology and the logical specifications of the elements in the domain ontology.
Поэтому:
Any system wishing to interoperate accurately with another system need transmit only the data to be communicated, plus any logical descriptions of terms used in that data that were created locally and are not already in the common foundation ontology.
Эта тактика затем ограничивает необходимость предварительного согласования значений только теми элементами онтологии в общей онтологии основания (FO). По ряду соображений для этого может потребоваться менее 10 000 элементов (типов и отношений). Однако для простоты понимания и использования большее количество элементов онтологии с дополнительной детализацией и спецификой может помочь найти точное место в FO, где можно найти или добавить конкретные концепции предметной области.
На практике, наряду с ФО, ориентированным на представления примитивных понятий, вероятно, также будет использоваться набор онтологий расширения предметной области для ФО с элементами, заданными с помощью элементов ФО. Такие ранее существовавшие расширения упростят затраты на создание онтологий предметной области, придавая существующим элементам предполагаемое значение, и уменьшат вероятность ошибки за счет использования уже протестированных элементов. Онтологии расширений предметной области могут быть логически несовместимы друг с другом, и это необходимо определить, используются ли в каком-либо общении разные расширения предметной области.
Также исследуется вопрос о том, можно ли избежать использования такой единой базовой онтологии с помощью сложных методов сопоставления между независимо разработанными онтологиями.
Важность [ править ]
Практическая значимость семантической совместимости была измерена в нескольких исследованиях, в которых оценивалась стоимость (потеря эффективности) из-за отсутствия семантической совместимости. Одно исследование, [4] сосредоточив внимание на утрате эффективности передачи медицинской информации, подсчитали, что за счет внедрения эффективного стандарта совместимости в этой области можно сэкономить 77,8 миллиардов долларов США в год. Другие исследования строительной отрасли [5] и цепочки поставок автомобильной промышленности, [6] оценочные затраты составляют более 10 миллиардов долларов США в год из-за отсутствия семантической совместимости в этих отраслях. В целом эти цифры можно экстраполировать, чтобы указать, что более 100 миллиардов долларов США теряются в год из-за отсутствия широко используемого стандарта семантической совместимости только в США.
Еще не было проведено исследование по каждой области политики, которое могло бы обеспечить значительную экономию средств при применении стандартов семантической совместимости. Но чтобы увидеть, какие области политики могут извлечь выгоду из семантической совместимости, см. « Взаимодействие » в целом. К таким областям политики относятся электронное правительство , здравоохранение, безопасность и многие другие. В июне 2007 года ЕС также создал Европейский центр семантической совместимости .
Интернета вещей Семантическая совместимость для
Цифровая трансформация имеет огромные преимущества, позволяя организациям быть более эффективными, более гибкими и более маневренными в реагировании на изменения в бизнесе и условиях работы. Это предполагает необходимость интеграции разнородных данных и услуг во всех организациях. Семантическая совместимость учитывает необходимость общего понимания значения и контекста.
Чтобы поддержать это, межорганизационная экспертная группа, включающая ISO/IEC JTC1, ETSI, oneM2M и W3C, сотрудничает с AIOTI в ускорении внедрения семантических технологий в IoT. Совсем недавно группа опубликовала два совместных официальных документа по семантической совместимости, названных соответственно «Семантические решения IoT – взгляд разработчика» и «На пути к стандартам семантической совместимости на основе онтологий». Это следует из успеха более раннего официального документа «Семантическая совместимость для Интернета вещей».
Источник:
«Семантические решения Интернета вещей – взгляд разработчика»
«На пути к стандартам семантической совместимости, основанным на онтологиях».
Это следует из успеха более раннего официального документа «Семантическая совместимость для Интернета вещей».
См. также [ править ]
- Интеграция данных
- Управление бизнес-семантикой
- Интероперабельность , более общая концепция.
- Выравнивание онтологии
- Семантические вычисления
- UDEF , универсальная структура элементов данных
Ссылки [ править ]
- ^ NCOIC, "SCOPE" , Промышленный консорциум сетецентрических операций , 2008 г.
- ^ Бернерс-Ли, Тим ; Фишетти, Марк (1999). Плетение паутины . ХарперСанФранциско . глава 12 . ISBN 978-0-06-251587-2 .
- ^ XML как инструмент для семантического взаимодействия. Семантическое взаимодействие в Интернете, Джефф Хефлин и Джеймс Хендлер.
- ^ Ян Уокер, Эрик Пэн, Дуглас Джонстон, Джулия Адлер-Мильштейн, Дэвид В. Бейтс и Блэкфорд Миддлтон, Ценность обмена медицинской информацией и функциональная совместимость по вопросам здравоохранения, 19 января 2005 г.
- ^ Microsoft Word - 08657 Final Rpt_8-2-04.doc
- ^ «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 16 июня 2012 г. Проверено 13 июля 2017 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка )