Архитектура данных
Эта статья нуждается в дополнительных цитатах для проверки . ( ноябрь 2008 г. ) |
Архитектура данных состоит из моделей, политик, правил и стандартов, которые определяют, какие данные собираются и как они хранятся, упорядочиваются, интегрируются и используются в системах данных и в организациях. [ 1 ] Данные обычно представляют собой одну из нескольких архитектурных областей , которые составляют основу архитектуры предприятия или архитектуры решения . [ 2 ]
Обзор
[ редактировать ]Архитектура данных направлена на установление стандартов данных для всех своих систем данных как видение или модель возможных взаимодействий между этими системами данных. интеграция данных Например, должна зависеть от стандартов архитектуры данных, поскольку интеграция данных требует взаимодействия данных между двумя или более системами данных. Архитектура данных, в частности, описывает структуры данных , используемые предприятием и его программным обеспечением . Архитектуры данных касаются данных в хранилище, данных в использовании и данных в движении; описания хранилищ данных, групп данных и элементов данных; и сопоставление этих артефактов данных с качеством данных, приложениями, местоположениями и т. д.
Архитектура данных, необходимая для реализации целевого состояния, описывает, как данные обрабатываются, хранятся и используются в информационной системе . Он предоставляет критерии для операций обработки данных , позволяющие проектировать потоки данных , а также управлять потоками данных в системе.
Архитектор данных обычно отвечает за определение целевого состояния, его согласование во время разработки, а затем последующие действия, чтобы гарантировать, что улучшения выполняются в духе исходного проекта.
Во время определения целевого состояния архитектура данных разбивает объект на атомарный уровень, а затем восстанавливает его до желаемой формы. Архитектор данных разбивает предмет на три традиционных архитектурных этапа:
- Концептуальный – представляет все хозяйствующие субъекты .
- Логический — представляет логику связи сущностей.
- Физический — реализация механизмов данных для конкретного типа функциональности.
Столбец «данные» Zachman Framework для архитектуры предприятия –
Слой | Вид | Данные (что) | Заинтересованная сторона |
1 | Область применения/контекстуальность | Список вещей и архитектурных норм [ 3 ] важно для бизнеса | Планировщик |
2 | Бизнес-модель/концептуальная модель | Семантическая модель или концептуальная / корпоративная модель данных | Владелец |
3 | Модель системы/логическая | Предприятие/ Логическая модель данных | Дизайнер |
4 | Технологическая модель/Физическая | Физическая модель данных | Строитель |
5 | Подробные представления | Реальные базы данных | Разработчик |
В этом втором, более широком смысле, архитектура данных включает в себя полный анализ взаимосвязей между функциями организации, доступными технологиями и типами данных .
Архитектура данных должна быть определена на этапе планирования новой системы обработки и хранения данных. Основные типы и источники данных, необходимые для поддержки предприятия, должны быть определены в полной, последовательной и понятной форме. Основным требованием на этом этапе является определение всех соответствующих объектов данных, а не указание элементов компьютерного оборудования . Сущность данных — это любая реальная или абстрактная вещь, о которой организация или физическое лицо желает хранить данные.
Физическая архитектура данных
[ редактировать ]Архитектура физических данных информационной системы является частью технологического плана . Технологический план ориентирован на реальные материальные элементы , которые будут использоваться при реализации проекта архитектуры данных . Архитектура физических данных включает в себя архитектуру базы данных. Архитектура базы данных — это схема реальной технологии базы данных, которая будет поддерживать спроектированную архитектуру данных.
Элементы архитектуры данных
[ редактировать ]Определенные элементы должны быть определены на этапе проектирования схемы архитектуры данных. Например, должна быть описана административная структура, которая должна быть создана для управления ресурсами данных. Кроме того, необходимо определить методологии, которые будут использоваться для хранения данных. Кроме того, необходимо создать описание технологии базы данных, которая будет использоваться, а также описание процессов, которые будут манипулировать данными. Также важно спроектировать интерфейсы для данных других систем, а также проект инфраструктуры , которая будет поддерживать общие операции с данными (т. е. аварийные процедуры, импорт данных , резервное копирование данных , внешнюю передачу данных ).
Без руководства по правильно реализованному проектированию архитектуры данных общие операции с данными могут быть реализованы по-разному, что затрудняет понимание и контроль потока данных в таких системах. Такая фрагментация нежелательна из-за потенциального увеличения стоимости и отключения данных. С такого рода трудностями можно столкнуться на быстро растущих предприятиях, а также на предприятиях, обслуживающих различные направления бизнеса .
При правильном выполнении этап архитектуры данных планирования информационной системы заставляет организацию определять и описывать как внутренние, так и внешние информационные потоки. Это модели, на концептуализацию которых организация, возможно, раньше не уделяла времени. Таким образом, на этом этапе можно выявить дорогостоящую нехватку информации, разрывы между отделами и разрывы между организационными системами, которые могли не быть очевидными до анализа архитектуры данных. [ 4 ]
Ограничения и влияния
[ редактировать ]Различные ограничения и влияния будут влиять на проектирование архитектуры данных. К ним относятся требования предприятия, технологические факторы, экономика, бизнес-политика и потребности в обработке данных.
- Требования предприятия
- Обычно они включают такие элементы, как экономичное и эффективное расширение системы, приемлемый уровень производительности (особенно скорость доступа к системе), надежность транзакций и прозрачное управление данными . Кроме того, преобразование необработанных данных, таких как записи транзакций и файлы изображений, в более полезные информационные формы с помощью таких функций, как хранилища данных, также является общим организационным требованием , поскольку это позволяет принимать управленческие решения и другие организационные процессы. Одним из приемов архитектуры является разделение между управлением данными транзакций и (основными) справочными данными . Другой вариант — отделение систем сбора данных от систем поиска данных (как это делается в хранилище данных).
- Технологические драйверы
- Обычно они предлагаются на основе готовых проектов архитектуры данных и архитектуры базы данных. Кроме того, некоторые технологические драйверы будут вытекать из существующих структур и стандартов организационной интеграции, экономики организации и существующих ресурсов сайта (например, ранее приобретенных лицензий на программное обеспечение ). Во многих случаях интеграция нескольких устаревших систем требует использования технологий виртуализации данных .
- Экономика
- Это также важные факторы, которые необходимо учитывать на этапе архитектуры данных. Вполне возможно, что некоторые решения, хотя и оптимальны в принципе, могут оказаться не потенциальными кандидатами из-за своей стоимости. Внешние факторы, такие как деловой цикл , процентные ставки, рыночные условия и юридические соображения, могут повлиять на решения, относящиеся к архитектуре данных.
- Деловая политика
- Бизнес-политика , которая также определяет проектирование архитектуры данных, включает внутреннюю политику организации, правила регулирующих органов , профессиональные стандарты и применимые государственные законы , которые могут различаться в зависимости от соответствующего агентства . Эти политики и правила описывают способ, которым предприятие желает обрабатывать свои данные.
- Потребности в обработке данных
- К ним относятся точные и воспроизводимые транзакции, выполняемые в больших объемах, хранилище данных для поддержки информационных систем управления (и потенциальный интеллектуальный анализ данных ), повторяющаяся периодическая отчетность , разовая отчетность и поддержка различных организационных инициатив по мере необходимости (например, годовые бюджеты, новые продукты). разработка).
См. также
[ редактировать ]- Контролируемый словарный запас
- Сетка данных — предметно-ориентированная архитектура данных.
- Разнородная система
- Архитектура информационной безопасности предприятия (EISA) позиционирует безопасность данных в информационной системе предприятия.
- Структура архитектуры предприятия Федеральной корпорации по страхованию вкладов (FDIC)
- Информационный бункер
- ТОГАФ
Ссылки
[ редактировать ]- ^ Бизнес-словарь — Архитектура данных. Архивировано 30 марта 2013 г. в Wayback Machine ; TOGAF 9.1 — Фаза C: Архитектура информационных систем — Архитектура данных
- ^ Что такое архитектура данных GeekInterview, 28 января 2008 г., по состоянию на 28 апреля 2011 г.
- ^ Стандарты архитектуры данных
- ^ Миттал, Прашант (2009). Автор . стр. 256: Глобальные публикации Индии. п. 314. ИСБН 978-93-8022-820-4 .
{{cite book}}
: CS1 maint: местоположение ( ссылка )
Дальнейшее чтение
[ редактировать ]- Басс, Л.; Джон, Б.; И Кейтс, Дж. (2001). Достижение удобства использования с помощью архитектуры программного обеспечения , Университет Карнеги-Меллон.
- Льюис, Г.; Комелла-Дорда, С.; Плейс, П.; Плакош, Д.; и Сикорд, Р. (2001). Руководство по архитектуре данных информационной системы предприятия Университет Карнеги-Меллон.
- Адлеман, С.; Мосс, Л.; Абай, М. (2005). Стратегия данных Addison-Wesley Professional.
Внешние ссылки
[ редактировать ]
- Достижение удобства использования посредством архитектуры программного обеспечения , sei.cmu.edu, 2001 г.
- Логическая архитектура данных , Нирмал Бэйд
- Построение современной архитектуры данных и аналитики
- Архитектура данных «Право на восстановление» с DataOps , блог DataOps
- TOGAF 9: Процесс подготовки