Jump to content

Звездный график

В вычислительной технике звездообразная схема или звездообразная модель — это самый простой стиль витрины данных схемы и подход, наиболее широко используемый для разработки хранилищ данных и многомерных витрин данных. [1] Звездообразная схема состоит из одной или нескольких таблиц фактов, ссылающихся на любое количество таблиц измерений . Схема «звезда» является важным частным случаем схемы «снежинка» и более эффективна для обработки более простых запросов. [2]

Звездная схема получила свое название от физической модели. [3] сходство с формой звезды с таблицей фактов в центре и окружающими ее таблицами измерений, представляющими точки звезды.

Модель [ править ]

Звездообразная схема разделяет данные бизнес-процессов на факты, которые содержат измеримые количественные данные о бизнесе, и измерения, которые являются описательными атрибутами, связанными с фактическими данными. Примеры фактических данных включают цену продажи, объем продажи, а также измерения времени, расстояния, скорости и веса. Примеры атрибутов связанных измерений включают модели продуктов, цвета продуктов, размеры продуктов, географические местоположения и имена продавцов.

Звездчатую схему, имеющую много измерений, иногда называют схемой-сороконожкой . [4] Наличие измерений всего лишь с несколькими атрибутами, хотя и более простое в обслуживании, приводит к запросам со многими соединениями таблиц и делает звездообразную схему менее простой в использовании.

Таблицы фактов [ править ]

Таблицы фактов записывают измерения или показатели для конкретного события. Таблицы фактов обычно состоят из числовых значений и внешних ключей к многомерным данным, в которых хранится описательная информация. [4] Таблицы фактов разработаны с низким уровнем однородной детализации (называемой «детализацией» или « зернистостью »), что означает, что факты могут записывать события на очень атомарном уровне. Это может привести к накоплению большого количества записей в таблице фактов с течением времени. Таблицы фактов относятся к одному из трех типов:

  • Таблицы фактов транзакций записывают факты о конкретном событии (например, о продажах).
  • Таблицы фактов моментальных снимков записывают факты на определенный момент времени (например, сведения об учетной записи на конец месяца).
  • Таблицы с накопительными моментальными снимками записывают совокупные факты в определенный момент времени (например, общий объем продаж продукта за месяц с начала года).

Таблицам фактов обычно присваивается суррогатный ключ , чтобы обеспечить уникальную идентификацию каждой строки.Этот ключ является простым первичным ключом.

Таблицы размеров [ править ]

Таблицы измерений обычно содержат относительно небольшое количество записей по сравнению с таблицами фактов, но каждая запись может иметь очень большое количество атрибутов для описания данных фактов. Измерения могут определять самые разные характеристики, но некоторые из наиболее распространенных атрибутов, определяемых таблицами измерений, включают:

  • Таблицы измерений времени описывают время на самом низком уровне детализации времени, для которого события записываются в звездообразной схеме.
  • Таблицы географических измерений описывают данные о местоположении, например страну, штат или город.
  • Таблицы размеров продукта описывают продукты
  • Таблицы измерений сотрудников описывают сотрудников, например продавцов.
  • Таблицы измерений диапазона описывают диапазоны времени, долларовые значения или другие измеримые величины для упрощения отчетности.

Таблицам измерений обычно назначается суррогатный первичный ключ , обычно это целочисленный тип данных с одним столбцом, сопоставленный с комбинацией атрибутов измерения, которые образуют естественный ключ.

Преимущества [ править ]

Звездообразные схемы денормализованы , что означает, что типичные правила нормализации, применяемые к транзакционным реляционным базам данных, смягчаются во время проектирования и реализации звездообразной схемы. Преимущества денормализации звездообразной схемы:

  • Более простые запросы — логика соединения звездообразной схемы обычно проще, чем логика соединения, необходимая для получения данных из высоконормализованной транзакционной схемы.
  • Упрощенная логика бизнес-отчетности. По сравнению со схемами с высокой степенью нормализации звездообразная схема упрощает общую логику бизнес-отчетности, такую ​​как отчетность за период и отчетность по состоянию.
  • Повышение производительности запросов — звездообразные схемы могут обеспечить повышение производительности для приложений отчетности только для чтения по сравнению со схемами с высокой степенью нормализации .
  • Быстрая агрегация. Более простые запросы к звездообразной схеме могут привести к повышению производительности операций агрегации.
  • Питающие кубы — звездообразные схемы используются всеми системами OLAP создания собственных кубов OLAP для эффективного ; Фактически, большинство основных OLAP-систем предоставляют режим работы ROLAP , который может использовать звездообразную схему непосредственно в качестве источника без создания собственной структуры куба.

Пример [ править ]

Схема «звезда», используемая в примере запроса

Рассмотрим базу данных продаж, возможно, из сети магазинов, классифицированную по дате, магазину и продукту. Изображение схемы справа — это версия схемы «звезда» образца схемы, представленного в статье о схеме «снежинка» .

Fact_Sales это таблица фактов и есть три таблицы измерений Dim_Date, Dim_Store и Dim_Product.

Каждая таблица измерений имеет первичный ключ. Id столбец, относящийся к одному из столбцов (в примере схемы представленных как строки) Fact_Sales трехстолбцовый (составной) первичный ключ таблицы ( Date_Id, Store_Id, Product_Id). Непервичный ключ Units_Sold Столбец таблицы фактов в этом примере представляет собой меру или показатель, который можно использовать в вычислениях и анализе. Столбцы непервичных ключей таблиц измерений представляют дополнительные атрибуты измерений (например, Year принадлежащий Dim_Date измерение).

Например, следующий запрос дает ответ на то, сколько телевизоров было продано по каждой марке и в каждой стране в 1997 году:

ВЫБЕРИТЕ 	 П  .  Бранд  , 	 С.  Страна   AS   Страны  , 	 СУММА  (  F  .  Units_Sold  )  FROM   Fact_Sales   F  INNER   JOIN   Dim_Date   D      ON   (  F  .  Date_Id   =   D  .  Id  )  INNER   JOIN   Dim_Store   S     ON   (  F  .  Store_Id   =   S  .  Id  )  INNER   JOIN   Dim_Product   P   ON   (  F  .  Product_Id   ) =   P  )  Id  ГДЕ   D  .  Год   =   1997   И    П  .  Product_Category   =   'tv'  ГРУППА   ПО 	 P  .  Бранд  , 	 С.  Страна 

См. также [ править ]

Ссылки [ править ]

  1. ^ Дедич Н. и Станьер К., 2016 г., «Оценка проблем многоязычия при разработке хранилищ данных» на 18-й Международной конференции по корпоративным информационным системам - ICEIS 2016, стр. 196.
  2. ^ Схемы DWH , 2009 г., заархивировано из оригинала 16 июля 2010 г.
  3. ^ », стр. 708
  4. Перейти обратно: Перейти обратно: а б Ральф Кимбалл и Марджи Росс, Набор инструментов для хранилищ данных: Полное руководство по многомерному моделированию (второе издание) , стр. 393

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e8ec5046c9380a0c97e0cb3586cabcde__1717477560
URL1:https://arc.ask3.ru/arc/aa/e8/de/e8ec5046c9380a0c97e0cb3586cabcde.html
Заголовок, (Title) документа по адресу, URL1:
Star schema - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)