Ранний факт
В хранилища данных практике извлечения, преобразования и загрузки (ETL) ранний факт или ранний факт [1] также известное как измерение с поздним поступлением или данные с поздним поступлением . [2] обозначает обнаружение естественного ключа измерения во время загрузки источника таблицы фактов до назначения соответствующего первичного ключа или суррогатного ключа в таблице измерений . Следовательно, факт, который ссылается на измерение, появляется раньше по сравнению с определением значения измерения. Примером может быть датировка задним числом или внесение исправлений в данные. [3]
Обработка [ править ]
С процедурной точки зрения ранний факт можно трактовать несколькими способами:
- Как ошибка: предполагается, что значения атрибутов измерения должны были быть собраны до загрузки источника фактов.
- Действительно, приостановите загрузку: сбор приостанавливается, пока не будет собрано отсутствующее значение атрибута измерения.
- В качестве действительного факта загрузите фиктивные ключи: значение первичного ключа генерируется в измерении без атрибутов (заглушка/фиктивная строка), факт завершает обработку, а атрибуты измерения заполняются (перезаписываются) позже при обработке загрузки на новая строка
- Классифицировать как запись приостановки: если предположить, что связанный атрибут измерения ожидался процессом, переместите эту запись факта в таблицу приостановки и активируйте оповещения/СОПы (сообщение о несоответствии [сумма/количество/агрегирование], управление бизнесом/данными, ручное исправление и т. д.). ) В редких случаях записи ожидания также могут быть объединены (UNION) с таблицей фактов, чтобы обеспечить правильный расчет показателей.
Ссылки [ править ]
- ^ «Кимбалл, Ральф. Совет по дизайну № 57: первые факты. Август 2004 г.» (PDF) . Архивировано из оригинала (PDF) 12 октября 2007 г. Проверено 25 апреля 2008 г.
- ^ Ранние факты / Поздние измерения - LeapFrogBI
- ^ Нежное введение в проблемы с битемпоральными данными - Роелант Вос.