Определение элемента данных
В метаданных — определение элемента данных это удобочитаемая фраза или предложение, связанное с элементом данных в словаре данных , которое описывает значение или семантику элемента данных.
Определения элементов данных имеют решающее значение для внешних пользователей любой системы данных. Хорошие определения могут значительно упростить процесс сопоставления одного набора данных с другим набором данных. Это основная особенность распределенных вычислений и разработки интеллектуальных агентов.
Существует несколько рекомендаций, которых следует придерживаться при создании высококачественных определений элементов данных.
Свойства четких определений
[ редактировать ]Хорошее определение:
- Точность . В определении должны использоваться слова, имеющие точное значение. Старайтесь избегать слов, которые имеют несколько значений или смыслов. В определении следует использовать кратчайшее описание. В определении не должен использоваться термин, который вы пытаетесь определить в самом определении. Это известно как циклическое определение.
- Отличительный . Определение должно отличать элемент данных от других элементов данных. Этот процесс называется устранением неоднозначности . Определение должно быть свободно от встроенного обоснования, функционального использования и юридической регистрации метаданных.
Определения не должны относиться к терминам или понятиям, которые могут быть неправильно истолкованы другими или которые имеют разные значения в зависимости от контекста ситуации. Определения не должны содержать аббревиатуры, которые не имеют четкого определения или не связаны с другими точными определениями.
Если создается большое количество элементов данных, все определения должны соответствовать соответствующим понятиям.
Критический элемент данных. Не все элементы данных имеют одинаковую важность или ценность для организации. Ключевым свойством метаданных элемента является отнесение данных к категории критических элементов данных ( CDE ). Эта категоризация обеспечивает фокус на управлении данными и их качестве. В организации часто имеются различные подкатегории CDE в зависимости от использования данных. например:
- Обеспечение безопасности – элементы данных, которые классифицируются как личная медицинская карта, личная медицинская информация или закрытая медицинская информация, требуют особого внимания с точки зрения безопасности и доступа.
- Использование отдела маркетинга. Отдел маркетинга может иметь определенный набор CDE, предназначенный для идентификации уникального клиента или для управления кампанией.
- Использование финансового отдела. Финансовый отдел может иметь другой набор CDE, чем отдел маркетинга. Они сосредоточены на элементах данных, которые предоставляют показатели и показатели для финансовой отчетности.
Такие стандарты, как спецификация реестра метаданных ISO/IEC 11179, содержат рекомендации по созданию точных определений элементов данных. В частности, четвертая глава стандарта реестра метаданных ISO/IEC 11179.
Использование точных слов
[ редактировать ]Общие слова, такие как play или run, документируют в базе данных более 57 различных значений слова «игра», но только одно определение термина «драматическая пьеса » . Предпочтительно иметь меньше определений в словарной статье выбранного слова. Это сводит к минимуму неправильное толкование, связанное с контекстом и прошлым читателя. Процесс нахождения хорошего значения слова называется устранением смысловой неоднозначности слова.
Примеры определений, которые можно улучшить
[ редактировать ]Вот определение элемента данных «person», как оно определено в спецификации www.w3c.org «Друг друга» * :
Person: A person.
Хотя большинство людей интуитивно понимают, что такое человек, это определение имеет большие возможности для совершенствования. Первая проблема заключается в том, что это определение носит замкнутый характер. Обратите внимание, что это определение действительно не помогает большинству читателей и требует разъяснения.
Вот определение элемента данных «Лицо» в модели данных XML Global Justice 3.0 * :
person: Describes inherent and frequently associated characteristics of a person.
Обратите внимание, что определение по-прежнему остается круговым. Человек не должен ссылаться на себя. В определении следует использовать термины, отличные от личности, для описания того, что такое личность.
Вот более точное, но краткое определение человека:
Person: An individual human being.
Обратите внимание, что здесь используется слово «индивидуальный», чтобы указать, что это экземпляр класса вещей, называемого человеком. Технически вы можете использовать в своем определении «человек разумный», но термин «человек» знаком большему количеству людей, чем «человек разумный», поэтому обычно используемые термины, если они еще точны, всегда предпочтительнее.
Иногда в определениях вашей системы могут присутствовать культурные нормы и предположения. Например, если ваш элемент данных «Человек» отслеживает персонажей научно-фантастического сериала, включающего инопланетян, вам может понадобиться более общий термин, отличный от «человек» .
Person: An individual of a sentient species.
См. также
[ редактировать ]- Словарь данных
- Элемент данных
- XML-модель данных глобального правосудия
- НЕМЕЦКИЙ
- ИСО/МЭК 11179
- Метаданные
- Реестр метаданных
Ссылки
[ редактировать ]Источники
[ редактировать ]- ISO/IEC 11179-4:2004 Реестры метаданных (MDR). Часть 4.
- Технический отчет ISO/IEC 20943-1, первое издание, 01 августа 2003 г. Информационные технологии. Процедуры достижения согласованности реестра метаданных