Управление основными данными
Эта статья содержит формулировки, которые продвигают эту тему в субъективной манере, не передавая реальной информации . ( февраль 2024 г. ) |
Управление основными данными ( MDM ) — это дисциплина, в которой бизнес и информационные технологии предприятия работают вместе, чтобы обеспечить единообразие, точность, управление, семантическую согласованность и подотчетность официальных общих активов основных данных . [1] [2]
Драйверы для управления основными данными [ править ]
Организации или группы организаций могут установить необходимость управления основными данными, если они владеют более чем одной копией данных о коммерческом предприятии. Хранение более одной копии этих основных данных по своей сути означает неэффективность поддержания « единой версии истины » для всех копий. Если не будут созданы люди, процессы и технологии, обеспечивающие согласованность значений данных во всех копиях, практически неизбежно будут храниться разные версии информации о коммерческом предприятии. Это приводит к неэффективности использования операционных данных и затрудняет способность организаций составлять отчеты и анализировать. На базовом уровне управление основными данными направлено на то, чтобы организация не использовала несколько (потенциально противоречивых ) версий одних и тех же основных данных в разных частях своей деятельности, что может произойти в крупных организациях.
Другие проблемы включают (например) проблемы с качеством данных , последовательной классификацией и идентификацией данных, а также проблемы сверки данных . Управление основными данными разнородных систем данных требует преобразований данных , поскольку данные, извлеченные из разрозненной исходной системы данных, преобразуются и загружаются в центр управления основными данными. Для синхронизации несопоставимых исходных основных данных управляемые основные данные, извлеченные из концентратора управления основными данными, снова преобразуются и загружаются в несопоставимую систему исходных данных по мере обновления основных данных. Как и в случае с другими перемещениями данных на основе извлечения, преобразования и загрузки , эти процессы являются дорогостоящими и неэффективными в разработке и обслуживании, что значительно снижает окупаемость инвестиций в продукт управления основными данными.
Существует ряд основных причин проблем с основными данными в организациях. К ним относятся:
- Сегментация бизнес-подразделений и продуктовой линейки
- Слияния и поглощения
Сегментация бизнес-единиц и продуктовой линейки [ править ]
В результате сегментации бизнес-подразделений и продуктовых линеек одна и та же бизнес-единица (например, Клиент, Поставщик, Продукт) будет обслуживаться разными линейками продуктов; для обработки транзакции будут введены избыточные данные о субъекте хозяйствования. Избыточность данных субъектов хозяйствования усугубляется в жизненном цикле от фронт-офиса до бэк-офиса, где необходим авторитетный единый источник данных о сторонах, счетах и продуктах, но он часто снова избыточно вводится или дополняется.
Типичным примером является сценарий банка, в котором клиент взял ипотечный кредит , и банк начинает отправлять предложения по ипотеке этому клиенту, игнорируя тот факт, что у этого человека уже есть отношения с ипотечным счетом в банке. Это происходит потому, что информация о клиентах, используемая отделом маркетинга банка, не интегрирована с информацией о клиентах, используемой отделом обслуживания клиентов банка. Таким образом, обе группы не знают, что существующий клиент также считается лидером продаж. Процесс связывания записей используется для связывания разных записей, соответствующих одному и тому же объекту, в данном случае одному и тому же человеку.
Слияния и поглощения [ править ]
Одной из наиболее распространенных причин, по которой некоторые крупные корпорации сталкиваются с серьезными проблемами при управлении основными данными, является рост за счет слияний и поглощений . Любые организации, которые объединяются, обычно создают организацию с повторяющимися основными данными (поскольку каждая из них, вероятно, имела по крайней мере одну собственную основную базу данных до слияния). В идеале администраторы баз данных решают эту проблему путем дедупликации основных данных в рамках слияния. Однако на практике согласование нескольких систем основных данных может представлять трудности из-за зависимостей существующих приложений от основных баз данных. В результате чаще всего две системы не сливаются полностью, а остаются отдельными, при этом определяется специальный процесс согласования, обеспечивающий согласованность данных, хранящихся в двух системах. Однако со временем, по мере дальнейших слияний и поглощений, проблема усугубляется, появляется все больше и больше главных баз данных, а процессы сверки данных становятся чрезвычайно сложными и, следовательно, неуправляемыми и ненадежными. Из-за этой тенденции можно найти организации с 10, 15 или даже 100 отдельными, плохо интегрированными основными базами данных, что может вызвать серьезные операционные проблемы в областях удовлетворенность клиентов , операционная эффективность, поддержка принятия решений и соответствие нормативным требованиям.
Другая проблема связана с определением должной степени детализации и нормализации для включения в схему основных данных. Например, в федеративной среде управления персоналом предприятие может сосредоточиться на хранении данных о людях в виде текущего статуса, добавив несколько полей для определения даты приема на работу, даты последнего повышения по службе и т. д. Однако это упрощение может привести к возникновению ошибок, влияющих на бизнес, в зависимых системах. для планирования и прогнозирования. Заинтересованные стороны таких систем могут быть вынуждены создавать параллельную сеть новых интерфейсов для отслеживания приема на работу новых сотрудников, запланированного выхода на пенсию и продажи активов, что противоречит одной из целей управления основными данными.
Люди, процессы и технологии [ править ]
Управление основными данными обеспечивается технологией, но это больше, чем просто технологии, которые его обеспечивают. Возможности управления основными данными организации будут включать в себя также людей и процессы.
Люди [ править ]
В MDM должны быть задействованы несколько должностей. В первую очередь это владелец данных и распорядитель данных. Вероятно, на каждую роль будет назначено несколько человек, каждый из которых будет отвечать за подмножество основных данных (например, один владелец данных будет отвечать за основные данные сотрудников, другой — за основные данные клиентов).
Владелец данных несет ответственность за требования к качеству данных, безопасности данных и т. д., а также за соблюдение процедур управления данными и управления данными. Владелец данных также должен финансировать проекты по улучшению в случае отклонений от требований.
Распорядитель данных осуществляет управление основными данными от имени владельца данных и, вероятно, также является консультантом владельца данных.
Процесс [ править ]
Управление мастер-данными можно рассматривать как «дисциплину специализированного улучшения качества». [3] определяется политиками и процедурами, установленными организацией по управлению данными . Его цель — обеспечить процессы сбора , агрегирования , сопоставления, консолидации, обеспечения качества , сохранения и распределения основных данных по всей организации для обеспечения общего понимания, последовательности , точности и контроля. [4] в постоянном обслуживании и использовании этих данных.
Процессы, обычно наблюдаемые при управлении основными данными, включают идентификацию источника, сбор данных, преобразование данных , нормализацию , администрирование правил, обнаружение и исправление ошибок , консолидацию данных, хранение данных , распределение данных, классификацию данных, службы таксономии, создание основных элементов, сопоставление схемы , продукт. кодификация, обогащение данных, управление иерархией, управление бизнес-семантикой и управление данными .
Технология [ править ]
Инструмент управления основными данными можно использовать для поддержки управления основными данными путем удаления дубликатов , стандартизации данных (массовое ведение), [5] и введение правил, исключающих попадание неверных данных в систему, чтобы создать авторитетный источник основных данных. Основные данные — это продукты, счета и стороны, для которых бизнес-операции выполняются .
Там, где технологический подход создает « золотую запись » или опирается на «источник записи» или «систему записи», обычно говорят о том, где данные «осваиваются». Это общепринятая терминология в отрасли информационных технологий, но следует проявлять осторожность как со специалистами, так и с более широким сообществом заинтересованных сторон, чтобы не путать концепцию «основных данных» с концепцией «основных данных».
Модели реализации [ править ]
Существует ряд моделей реализации технологического решения по управлению основными данными. Они зависят от основного бизнеса организации, ее корпоративной структуры и ее целей. К ним относятся:
- Источник записи
- Реестр
- Консолидация
- Сосуществование
- Транзакция/централизовано
Источник записи [ править ]
Эта модель определяет одно приложение, базу данных или более простой источник (например, электронную таблицу) как «источник записей» (или « систему записей », где используются исключительно базы данных приложений). Преимущество этой модели заключается в ее концептуальной простоте, однако она может не соответствовать реалиям сложного распределения основных данных в крупных организациях.
Источник записи может быть объединен, например, по группам атрибутов (чтобы разные атрибуты объекта основных данных могли иметь разные источники записи) или географически (чтобы разные части организации могли иметь разные основные источники). Федерация применима только в определенных случаях использования, когда существует четкое разграничение того, какие подмножества записей в каких источниках будут найдены.
Модель источника записи может применяться более широко, чем просто к основным данным, например, к справочным данным .
Передача основных данных [ править ]
Существует несколько способов сопоставления основных данных и их распространения в другие системы. [6] Сюда входят:
- Консолидация данных — процесс сбора основных данных из нескольких источников и интеграции в единый концентратор ( хранилище операционных данных ) для репликации в другие системы назначения.
- Объединение данных — процесс предоставления единого виртуального представления основных данных из одного или нескольких источников в одну или несколько целевых систем.
- Распространение данных – процесс копирования основных данных из одной системы в другую, обычно через двухточечные интерфейсы в устаревших системах.
Управление изменениями при внедрении [ править ]
Управление основными данными может пострадать при его внедрении в крупной организации, если концепция « единой версии истины » не будет подтверждена заинтересованными сторонами, которые считают, что их локальное определение основных данных необходимо. Например, иерархия продуктов, используемая для управления запасами, может полностью отличаться от иерархий продуктов, используемых для поддержки маркетинговых усилий или оплаты труда торговых представителей. Прежде всего необходимо определить, действительно ли требуются другие основные данные. Если это необходимо, то реализованное решение (технология и процесс) должно позволять существовать нескольким версиям истины, но обеспечивать простые и прозрачные способы согласования необходимых различий. Если этого не требуется, процессы необходимо скорректировать. Без такого активного управления пользователи, которым нужны альтернативные версии, будут просто «обходить» официальные процессы, тем самым снижая эффективность общей программы управления основными данными компании.
См. также [ править ]
- Управление бизнес-семантикой
- Интеграция данных клиентов
- Управление данными
- Интеграция данных
- Распорядитель данных
- Визуализация данных
- Интеграция корпоративной информации
- Управление информацией
- Связанные данные
- Основные данные
- Оперативное хранилище данных
- Управление информацией о продукте
- Связь с записью
- Справочные данные
- Семантическая сеть
- Представление одного клиента
- Интеграция веб-данных
Ссылки [ править ]
- ^ «Глоссарий Gartner: Управление основными данными» . Гартнер . Проверено 6 июня 2020 г.
- ^ Роуз, Маргарет (9 апреля 2018 г.). «Определение с сайта WhatIs.com» . Управление данными поиска . Проверено 9 апреля 2018 г.
- ^ Руководство DAMA-DMBOK, DAMA International , 2010 г.
- ^ «Узнайте, как создать запрос на изменение MDM – LightsOnData» . LightsOnData . 09 мая 2018 г. Проверено 17 августа 2018 г.
- ^ Юргенсен, Кнут (16 мая 2016 г.). «Управление основными данными (MDM): помощь или помеха?» . Простой разговор . Проверено 9 апреля 2018 г.
- ^ «Создание золотой пластинки: лучшие данные с помощью химии» , DAMA, слайд 26, Дональд Дж. Соулсби, 22 октября 2009 г.