Словарь данных

Словарь данных или репозиторий метаданных , как определено в IBM Dictionary of Computing , представляет собой «централизованное хранилище информации о данных, такой как значение, отношения к другим данным, происхождение, использование и формат». [ 1 ] Oracle определяет его как набор таблиц с метаданными. Этот термин может иметь одно из нескольких тесно связанных значений, относящихся к базам данных и системам управления базами данных (СУБД):
- Документ , описывающий базу данных или набор баз данных.
- Неотъемлемый компонент СУБД , необходимый для определения ее структуры.
- Часть промежуточного программного обеспечения , расширяющая или заменяющая собственный словарь данных СУБД.
Документация
[ редактировать ]Термины словарь данных и хранилище данных обозначают более общую программную утилиту, чем каталог. Каталог . тесно связан с программным обеспечением СУБД Он предоставляет хранящуюся в нем информацию пользователю и администратору базы данных, но в основном к нему обращаются различные программные модули самой СУБД, такие как компиляторы DDL и DML , оптимизатор запросов, процессор транзакций, генераторы отчетов и ограничения. исполнитель. С другой стороны, словарь данных — это структура данных, в которой хранятся метаданные , т. е. (структурированные) данные об информации. Программный комплекс автономного словаря данных или хранилища данных может взаимодействовать с программными модулями СУБД, но в основном используется проектировщиками, пользователями и администраторами компьютерной системы управления информационными ресурсами. Эти системы хранят информацию о конфигурации системного оборудования и программного обеспечения, документации, приложениях и пользователях, а также другую информацию, имеющую отношение к системному администрированию. [ 2 ]
Если система словаря данных используется только проектировщиками, пользователями и администраторами, а не программным обеспечением СУБД, она называется пассивным словарем данных. В противном случае он называется активным словарем данных или словарем данных. Обновление пассивного словаря данных происходит вручную и независимо от каких-либо изменений в структуре СУБД (базы данных). При активном словаре данных сначала обновляется словарь, в результате чего изменения в СУБД происходят автоматически.
баз данных Пользователи и разработчики приложений могут извлечь выгоду из авторитетного документа словаря данных, в котором каталогизирована организация, содержимое и соглашения одной или нескольких баз данных. [ 3 ] Обычно это включает имена и описания различных таблиц ( записей или сущностей ) и их содержимого ( полей ), а также дополнительные сведения, такие как тип и длина каждого элемента данных . Еще одна важная информация, которую может предоставить словарь данных, — это отношения между таблицами. Это иногда упоминается в диаграммах связей сущностей (ERD) или при использовании дескрипторов наборов, определяющих, в каких наборах участвуют таблицы базы данных.
В словаре активных данных могут быть наложены ограничения на базовые данные. Например, диапазон может быть установлен для значения числовых данных в элементе данных (поле), или запись в таблице может быть принудительно включена в установленную связь с другим типом записи. Кроме того, распределенная СУБД может иметь определенные особенности местоположения, описанные в ее словаре активных данных (например, где физически расположены таблицы).
Словарь данных состоит из типов записей (таблиц), созданных в базе данных с помощью системных командных файлов, адаптированных для каждой поддерживаемой серверной СУБД. Oracle имеет список конкретных представлений для пользователя «sys». Это позволяет пользователям искать именно ту информацию, которая необходима. Командные файлы содержат инструкции SQL для CREATE TABLE
, CREATE UNIQUE INDEX
, ALTER TABLE
(для ссылочной целостности) и т. д., используя специальный оператор, необходимый для этого типа базы данных.
Не существует универсального стандарта относительно уровня детализации такого документа.
Промежуточное ПО
[ редактировать ]При создании приложений баз данных может быть полезно ввести дополнительный уровень программного обеспечения словаря данных, т.е. промежуточное программное обеспечение , которое взаимодействует с базовым словарем данных СУБД. Такой словарь данных «высокого уровня» может предлагать дополнительные функции и степень гибкости, выходящую за пределы ограничений собственного словаря данных «низкого уровня», основной целью которого является поддержка основных функций СУБД, а не требований. типичного приложения. Например, словарь данных высокого уровня может предоставлять альтернативные модели отношений сущностей , адаптированные для различных приложений, использующих общую базу данных. [ 4 ] Расширения словаря данных также могут помочь в оптимизации запросов к распределенным базам данных . [ 5 ] Кроме того, функции администратора базы данных часто автоматизируются с помощью инструментов реструктуризации, тесно связанных с активным словарем данных.
Программные платформы, предназначенные для быстрой разработки приложений, иногда включают средства словаря данных высокого уровня, которые могут существенно сократить объем программирования, необходимого для создания меню , форм , отчетов и других компонентов приложения базы данных, включая саму базу данных. Например, PHPLens включает PHP библиотеку классов для автоматизации создания таблиц, индексов и внешнего ключа, ограничений переносимых для нескольких баз данных. [ 6 ] Другой словарь данных на основе PHP, входящий в набор инструментов RADICORE, автоматически генерирует программные объекты , сценарии и код SQL для меню и форм с проверкой данных и сложными соединениями . [ 7 ] Для ASP.NET среды словарь данных Base One предоставляет межСУБД возможности для автоматического создания базы данных, проверки данных, повышения производительности ( кэширование и использование индексов), безопасности приложений и расширенных типов данных . [ 8 ] Visual DataFlex Возможности [ 9 ] предоставляет возможность использовать DataDictionaries в качестве файлов классов для формирования промежуточного уровня между пользовательским интерфейсом и базовой базой данных. Цель состоит в том, чтобы создать стандартизированные правила для поддержания целостности данных и обеспечения соблюдения бизнес-правил в одном или нескольких связанных приложениях.
В некоторых отраслях обобщенные словари данных используются в качестве технических стандартов для обеспечения совместимости между системами. Например, сфера недвижимости придерживается Словаря данных RESO , которого Национальная ассоциация РИЭЛТОРОВ. требует [ 10 ] ее MLS соблюдают требования своего руководства по политике. [ 11 ] Этот промежуточный уровень сопоставления для собственных баз данных MLS поддерживается компаниями-разработчиками программного обеспечения, которые предоставляют услуги API организациям MLS.
Примеры для конкретной платформы
[ редактировать ]Разработчики используют спецификацию описания данных (DDS) для описания атрибутов данных в описаниях файлов, которые являются внешними по отношению к прикладной программе, обрабатывающей данные, в контексте IBM i . [ 12 ] Таблица sys.ts$ в Oracle хранит информацию о каждой таблице в базе данных. Это часть словаря данных, который создается при базы данных Oracle . создании [ 13 ] Разработчики также могут использовать контекст DDS из бесплатного программного обеспечения с открытым исходным кодом (FOSS) для структурированных и транзакционных запросов в открытых средах.
Типичные атрибуты
[ редактировать ]Вот неисчерпывающий список типичных элементов, найденных в словаре данных для столбцов или полей:
- Имя сущности или формы или их идентификатор (EntityID или FormID). Группа, к которой принадлежит это поле.
- Имя поля, например РСУБД. имя поля
- Отображаемый заголовок поля. По умолчанию может использоваться имя поля, если оно пустое.
- поля Тип (строка, целое число, дата и т. д.)
- Такие меры , как минимальное и максимальное значения, ширина дисплея или количество десятичных знаков. Различные типы полей могут интерпретировать это по-разному. Альтернативой является использование разных атрибутов в зависимости от типа поля.
- Порядок отображения полей или порядок табуляции
- Координаты на экране (если пользовательский интерфейс позиционирован или основан на сетке)
- Значение по умолчанию
- Тип запроса, например раскрывающийся список, поле со списком, флажки, диапазон и т. д.
- Требуется (логическое значение) — если «истина», значение не может быть пустым, нулевым или состоять только из пробелов.
- Только для чтения (логическое значение)
- Имя ссылочной таблицы, если это внешний ключ. Может использоваться для списков проверки или выбора.
- Различные обработчики событий или ссылки на них. Пример: «по щелчку», «по проверке» и т. д. См. « Программирование, управляемое событиями» .
- Код формата, например регулярное выражение или операторы PIC в стиле COBOL.
- Описание или краткий обзор
- индекса базы данных Характеристики или спецификация
См. также
[ редактировать ]- Иерархия данных
- Моделирование данных
- Схема базы данных
- ИСО/МЭК 11179
- Реестр метаданных
- Семантический спектр
- Словарь OneSource
- Репозиторий метаданных
Ссылки
[ редактировать ]- ^ ACM, Компьютерный словарь IBM , 10-е издание, 1993 г.
- ^ Рамез Эльмасри, Шамкант Б. Навате: Основы систем баз данных , 3-е. ред. секта. 17.5, с. 582
- ^ TechTarget, SearchSOA , Что такое словарь данных? Архивировано 12 февраля 2009 г. в Wayback Machine.
- ^ Патент США 4774661, Система управления базой данных с активным словарем данных , 19 ноября 1985 г., AT&T.
- ^ Патент США 4769772, Метод автоматизированной оптимизации запросов с использованием как глобальной, так и параллельной локальной оптимизации для планирования доступа к материализации для распределенных баз данных , 28 февраля 1985 г., Honeywell Bull
- ^ PHPLens, Библиотека словаря данных ADOdb для PHP. Архивировано 7 ноября 2007 г. на Wayback Machine.
- ^ RADICORE, Что такое словарь данных?
- ^ Base One International Corp., Словарь данных Base One
- ^ VISUAL DATAFLEX, функции. Архивировано 5 апреля 2018 г. на Wayback Machine.
- ^ «Веб-API стандартов транзакций с недвижимостью (RETS)» . нар.риэлтор . 23 января 2015 года . Проверено 11 октября 2020 г.
- ^ «Руководство по политике множественного листинга» . нар.риэлтор . Январь 2015 года . Проверено 11 октября 2020 г.
- ^ «Документация DDS для IBM System i V5R3» .
- ^ «Концепции Oracle — словарь данных» . dba-oracle.com . Проверено 13 февраля 2017 г.
Внешние ссылки
[ редактировать ]
- Юрдон, Wiki по структурированному анализу , Словари данных (Веб-архив)
- Octopai, словарь данных и бизнес-глоссарий