Срок представительства
Термин представления — это слово или комбинация слов, которые семантически представляют тип данных (область значений) элемента данных. Термин представления обычно называется словом класса теми, кто знаком со словарями данных . ISO/IEC 11179-5:2005 определяет термин представления как обозначение экземпляра класса представления. Как используется в ISO/IEC 11179 , термин представления — это та часть имени элемента данных , которая предоставляет семантический указатель на базовый тип данных. . Класс представлений — это класс представлений. Этот класс представления предоставляет возможность классифицировать или группировать элементы данных .
Термин представления можно рассматривать как атрибут элемента данных в реестре метаданных , который классифицирует элемент данных в соответствии с типом данных, хранящихся в элементе данных. [1]
Условия представительства обычно «одобряются» использующей их организацией или органом по стандартизации. Например, ООН публикует свой утвержденный список как часть Технической спецификации основных компонентов СЕФАКТ ООН. Универсальная структура элементов данных использует подмножество терминов представления CCTS и присваивает им числовые коды.
Варианты использования термина представления
[ редактировать ]Управление областями ценности
[ редактировать ]Домен значений выражает набор разрешенных значений для элемента данных. Термин представления (и обычно соответствующий термин типа данных) включает таксономию для областей значений в наборе данных. Эта таксономия является классом представления. Таким образом, термин представления можно использовать для контроля увеличения количества областей значений, гарантируя, что эквивалентные области значений используют один и тот же термин представления.
Поиск эквивалентных свойств
[ редактировать ]Когда человек или программный агент анализирует два отдельных реестра метаданных, чтобы найти эквивалентность свойств , Термин представления может использоваться в качестве руководства. Например, если система A имеет элемент данных, такой как PersonGenderCode, а система B имеет такой элемент данных, как PersonSexCode, суффикс кода может помочь двум системам сопоставлять только те элементы данных, которые имеют суффикс «Код». Однако таксономия имущественных терминов (например, «Пол» или «Гендер») в этом отношении гораздо более эффективна.
Вывод
[ редактировать ]Термин представления можно использовать разными способами для получения выводов о наборах данных. Условия представления сообщают наблюдателю любого потока данных о типах данных и указывают, как можно использовать элемент данных. Это имеет решающее значение при сопоставлении реестров метаданных с внешними элементами данных. Например, если вам отправлена запись о человеке, вы можете поискать любой суффикс «ID», чтобы понять, как удаленная система может различать две разные записи.
Обязательные поля
[ редактировать ]Условия представительства также используются для того, чтобы сделать выводы о требованиях к объекту недвижимости. Например, если бы в потоке данных был элемент данных PersonBirthDateAndTime, вы бы знали, что ОБА дата И время доступны и актуальны, а не только дата. Если время рождения было необязательным, следует использовать отдельные элементы данных, такие как PersonBirthDate и PersonBirthTime.
Поиск измерений и показателей хранилища данных
[ редактировать ]При создании хранилища данных бизнес-аналитик просматривает Условия представления, чтобы быстро найти измерения и меры предмета для построения кубов OLAP. Например:
- Индикатор или код используются для создания измерений хранилища данных.
- Date или DateTime используются для связи с измерением времени, которое часто используется кубами с согласованными измерениями.
- Термины «Сумма» , «Число» , «Мера» или «Значение » (которые можно суммировать) являются кандидатами на измерение.
- Имя и текст используются для меток экрана или других описательных элементов.
- Проценты необходимо анализировать, поскольку их невозможно сложить с четким смыслом.
- Идентификатор используется для удаления повторяющихся записей.
Технические характеристики основных компонентов
[ редактировать ]Совместная техническая спецификация основных компонентов ISO/UN формально определяет как разрешенный набор терминов представления, так и соответствующий набор типов данных. ISO 15000-5 является уровнем реализации ISO 11179 и нормативно выражает набор правил для семантического определения концептуальных и физических/логических моделей данных для широкого спектра применений. В ISO 15000-5 термин представления обеспечивает механизм гармонизации областей значений потенциальных элементов данных перед их добавлением в общую модель(и) данных. ISO 15000-5 используется рядом правительств, организациями по разработке стандартов и частным сектором в качестве основы для моделирования данных.
Универсальная структура элементов данных
[ редактировать ]Некоторые неформальные стандарты, такие как Универсальная структура элементов данных (в которых термин представления называется «словом свойства»), присваивают каждому термину представления уникальные целочисленные идентификаторы. Это позволяет инструментам сопоставления метаданных сопоставлять один набор элементов данных с другими словарями метаданных. Пример этих сопоставлений можно найти в разделе «Идентификатор слова свойства» . Обратите внимание, что по состоянию на ноябрь 2005 г. концепции UDEF не получили широкого распространения.
Пример терминов представления в виде суффикса XML
[ редактировать ]Например, если фрагмент данных XML имел следующее:
<Person> <PersonID>123-45-6789</PersonID> <PersonGivenName>John</PersonGivenName> <PersonFamilyName>Smith</PersonFamilyName> <PersonBirthDate>1990-08-14</PersonBirthDate> </Person>
В приведенном выше примере терминами представления являются «ID» для <PersonID>, суффикс «Имя» для имени и фамилии и «Дата» для <PersonBirthDate>.
Примерные условия представительства
[ редактировать ]Ниже приведены образцы Условий представительства, которые использовались для обмена электронными сообщениями в таких системах, как NIEM или GJXDM 3.0: [примечание: изложенные здесь ограничения ограничиваются этими спецификациями и не представляют собой универсальный консенсус]
Срок | Использование |
---|---|
Количество | Денежная стоимость с единицами валюты. |
БинарныйОбъект | Набор последовательностей двоичных октетов конечной длины, используемых для представления звука, изображений и других структур. |
Код | Нумерованный список всех допустимых значений. Каждое перечисляемое значение представляет собой строку, которая для краткости представляет определенное значение. Например, для PersonGenderCode допустимыми значениями могут быть «мужской», «женский» или «неизвестный». |
Дата | Дата ISO 8601 обычно имеет формат ГГГГ-ММ-ДД. |
ДатаВремя | Дата ISO 8601 (в формате ГГГГ-ММ-ДД) И структура времени. Примечание. Не используйте, если ОБА дата И время не являются ОБЯЗАТЕЛЬНЫМИ полями. Если одно ИЛИ другое не является обязательным, всегда указывайте элементы данных как отдельные элементы даты и времени. |
Графика | Используется для хранения изображений. Вторичный по отношению к двоичному объекту. |
ИДЕНТИФИКАТОР | Аббревиатура идентификатора |
Идентификатор | Независимая от языка метка, знак или токен, используемые для установления идентичности и уникального различения одного экземпляра объекта в схеме идентификации . |
Индикатор | Логическое значение, ровно два взаимоисключающих значения (истина или ложь). Необходимо дать точное определение значения истинной ценности. |
Мера | Числовое значение, определяемое путем измерения в единицах. Обычно используется с такими параметрами, как рост или вес. если единица измерения не ясна, ее следует указать. |
Имя | Текстовая метка, используемая для идентификации объекта. Имя обычно имеет смысл на каком-то языке и является основным средством идентификации объектов для людей. В отличие от идентификатора , имя не обязательно уникально. |
Число | Назначается или определяется расчетным путем. |
Текст | Строка символов обычно имеет форму слов. |
Время | Временная структура ISO 8601 . |
Ценить | Тип числового. |
Процент | Тип числового значения, которое традиционно представляет собой результат расчета соотношения в диапазоне от значений от 0 до 1 для значений от 0 % до 100 %. |
Количество | Неденежное числовое значение или количество единиц. |
Ставка | Тип числового значения |
Год | Год 8601 ISO |
Плюсы условий представительства
[ редактировать ]- Использование терминов представления в имени элемента данных — это соглашение, широко принятое в нескольких крупных системах, таких как NIEM , GJXDM и ebXML .
- Многие архитекторы данных, отвечающие за сопоставление XML из иностранных источников, находят термины представления очень полезными.
- Такие стандарты, как UDEF, зависят от точного кодирования Условий представительства.
- Инструменты, проверяющие списки перечисления, могут быстро различать закодированные значения, ища суффикс «Код».
- Размерный анализ данных может использовать термины представления для создания хранилищ данных. Термины представления, такие как «Код» и «Индикатор», можно преобразовать в измерения, а «Суммы и меры» можно преобразовать в меры в таблице фактов.
Минусы условий представительства
[ редактировать ]- Не существует универсального соглашения относительно окончательного набора условий представления.
- Между термином представления и областью значений, которую он представляет, не всегда существует прямая связь. Это вызвано дальнейшей уточнением термина соответствующего типа данных.
Стандарты, в которых используются термины представления
[ редактировать ]- Электронный бизнес с использованием расширяемого языка разметки
- правительства США Национальная модель обмена информацией требует использования терминов представления для элементов данных XML.
- Стандарты обмена данными Министерства юстиции США «Глобальная модель данных XML правосудия» требуют использования терминов представления для элементов данных XML.
[Примечание] Это чрезвычайно ограниченный набор широкого спектра стандартов, определяющих использование терминов представления.
См. также
[ редактировать ]- ИСО/МЭК 11179
- ИСО/МЭК 11404
- Метаданные
- Элемент данных
- Класс представления
- Универсальная структура элементов данных
- XML
- XML-схема
Примечания
[ редактировать ]- ^ ISO/IEC 11179-5 3.11 (zip-файл 238 КБ)
- ^ В ISO/IEC 11179-3:2003 5.4 (zip-файл 546 КБ) на самом деле это класс представления , который указывается как атрибут элемента данных .
Внешние ссылки
[ редактировать ]- ISO/TS 15000-5:2005 Расширяемый язык разметки для электронного бизнеса (ebXML). Часть 5. Техническая спецификация основных компонентов ebXML, версия 2.01 (ebCCTS) (файл в формате PDF, 1 МБ)
- ISO/IEC 11179-3:2003 Реестры метаданных (MDR). Часть 3. Метамодель реестра и основные атрибуты (zip-файл 546 КБ)
- ISO/IEC 11179-5:2005 Реестры метаданных (MDR). Часть 5. Принципы именования и идентификации (zip-файл 238 КБ)
- ISO/IEC TR 20943-1:2003(E) Процедуры достижения согласованности содержимого реестра метаданных. Часть 1. Элементы данных. См. стр. 84. (zip-файл 700 КБ)
- Учебные слайды Министерства юстиции и GJXDM по присвоению имен
- Метаданные ISO/IEC JTC 1/SC 32/WG 2
- НЕВЕРНАЯ ССЫЛКА: http://ashcomp.com/DOI_Representation_terms.html Условия представительства Министерства внутренних дел США.
- Обучение NIEM см. на слайде на стр. 8, где описаны термины, охватываемые курсом обучения.
- Условия предоставления бета-версии NIEM 3.0