Витрина данных

Витрина данных — это структура/шаблон доступа, специфичный для сред хранилищ данных , используемый для извлечения клиентских данных. Витрина данных представляет собой часть хранилища данных и обычно ориентирована на конкретное направление бизнеса или команду. В то время как хранилища данных имеют глубину всего предприятия, информация в витринах данных относится к одному отделу. В некоторых случаях каждый отдел или бизнес-подразделение считается владельцем витрины данных, включая все оборудование , программное обеспечение и данные . [ 1 ] Это позволяет каждому отделу изолировать использование, манипулирование и развитие своих данных. В других развертываниях, где используются согласованные измерения, этот владелец бизнес-подразделения не будет действовать для общих измерений, таких как клиент, продукт и т. д.
Хранилища и витрины данных создаются потому, что информация в базе данных не организована таким образом, чтобы сделать ее легкодоступной. Этой организации требуются слишком сложные, труднодоступные или ресурсоемкие запросы.
В то время как транзакционные базы данных предназначены для обновления, хранилища данных или витрины доступны только для чтения . Хранилища данных предназначены для доступа к большим группам связанных записей. Витрины данных улучшают время отклика конечных пользователей, предоставляя пользователям доступ к конкретному типу данных, которые им необходимо просматривать чаще всего, предоставляя данные таким образом, чтобы поддерживать коллективное представление группы пользователей.
Витрина данных — это, по сути, сокращенная и более целенаправленная версия хранилища данных, которая отражает правила и спецификации процессов каждого бизнес-подразделения внутри организации. [ 2 ] Каждая витрина данных посвящена определенной бизнес-функции или региону. Этот подмножество данных может охватывать многие или все функциональные предметные области предприятия. Обычно для удовлетворения потребностей каждого отдельного бизнес-подразделения используется несколько витрин данных (различные витрины данных могут использоваться для получения конкретной информации для различных отделов предприятия, таких как бухгалтерский учет, маркетинг, продажи и т. д.).
Сопутствующий термин «таблица» — это уничижительное слово, описывающее ситуацию, которая возникает, когда один или несколько бизнес-аналитиков разрабатывают систему связанных электронных таблиц для выполнения бизнес-анализа, а затем увеличивают ее до размера и степени сложности, которые делают ее практически невозможной для обслуживания. Термин для этого состояния — «Excel Hell». [ 3 ]
Витрина данных против хранилища данных
[ редактировать ]Хранилище данных:
- Вмещает несколько предметных областей
- Содержит очень подробную информацию
- Работает над интеграцией всех источников данных
- Не обязательно использует многомерную модель , но использует многомерные модели.
Витрина данных:
- Часто содержит только одну предметную область, например, финансы или продажи.
- Может содержать более обобщенные данные (хотя может содержать полную информацию)
- Концентрируется на интеграции информации из заданной предметной области или набора исходных систем.
- Построен на основе размерной модели с использованием звездообразной схемы.
Схемы проектирования
[ редактировать ]- Схема «звезда» — довольно популярный выбор дизайна; позволяет реляционной базе данных имитировать аналитические функции многомерной базы данных.
- Схема снежинки
- Схема действий — временных рядов. схема на основе
Причины создания витрины данных
[ редактировать ]- Легкий доступ к часто необходимым данным
- Создает коллективное представление группой пользователей.
- конечного пользователя Улучшает время отклика
- Простота создания
- Более низкая стоимость, чем реализация полного хранилища данных
- Потенциальные пользователи определены более четко, чем в полном хранилище данных.
- Содержит только важные для бизнеса данные и менее загромождён.
- Он содержит ключевую информацию о данных
Зависимая витрина данных
[ редактировать ]Согласно Inmon школе хранилищ данных , зависимая витрина данных — это логическое подмножество ( представление ) или физическое подмножество (извлечение) более крупного хранилища данных , изолированное по одной из следующих причин:
- Необходимость обновления специальной данных модели или схемы : например, для реструктуризации для OLAP .
- Производительность: перенести витрину данных на отдельный компьютер для большей эффективности или исключить необходимость управления этой рабочей нагрузкой в централизованном хранилище данных.
- Безопасность: выборочное разделение авторизованного подмножества данных.
- Целесообразность: обойти управление данными и авторизацию, необходимые для включения нового приложения в хранилище корпоративных данных.
- Испытательный полигон: продемонстрировать жизнеспособность и потенциал рентабельности инвестиций (окупаемости) приложения перед его переносом в хранилище корпоративных данных.
- Политика: стратегия выживания для ИТ (информационных технологий) в ситуациях, когда группа пользователей имеет больше влияния, чем финансирование, или не является добросовестным гражданином в централизованном хранилище данных.
- Политика: стратегия выживания для потребителей данных в ситуациях, когда команда хранилища данных не может создать пригодное для использования хранилище данных.
Согласно школе хранилищ данных Inmon, компромиссы, присущие витринам данных, включают ограниченную масштабируемость , дублирование данных , несогласованность данных с другими хранилищами информации и неспособность использовать корпоративные источники данных.
Альтернативная школа хранилищ данных принадлежит Ральфу Кимбаллу . По его мнению, хранилище данных — это не что иное, как объединение всех витрин данных. Такое представление помогает сократить расходы и обеспечивает быструю разработку, но может создать несогласованное хранилище данных, особенно в крупных организациях. Таким образом, подход Кимбалла больше подходит для малых и средних корпораций. [ 4 ]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Инмон, Уильям (18 июля 2000 г.). «Витрина данных не равно хранилище данных» . DMReview.com . Архивировано из оригинала 20 апреля 2011 года.
- ^ Сильверс, Фон (2008). Создание и обслуживание хранилища данных . Бока-Ратон, Флорида: CRC Press . п. 128. ИСБН 978-1-4200-6462-9 .
- ^ Кодилл, Херб (1 апреля 2018 г.). «Ад Excel: поучительная история» . Середина . Проверено 19 октября 2021 г.
- ^ Понния, Паульраж (2010). Основы хранения данных для ИТ-специалистов . Хобокен, Нью-Джерси: Уайли . стр. 29–32. ISBN 978-0470462072 .