Jump to content

Сетка данных

Сетка данных — это социотехнический подход к построению децентрализованной архитектуры данных путем использования предметно-ориентированного самообслуживающегося дизайна (с точки зрения разработки программного обеспечения), который заимствует теорию Эрика Эванса о проектировании, ориентированном на предметную область. [1] и теория командных топологий Мануэля Паиса и Мэтью Скелтона. [2] Сетка данных в основном касается самих данных, а озеро данных и конвейеры являются второстепенной задачей. [3] Основное предложение — масштабирование аналитических данных за счет предметно-ориентированной децентрализации. [4] При использовании сетки данных ответственность за аналитические данные переносится с центральной группы данных на группы предметной области, поддерживаемые командой платформы данных , которая обеспечивает платформу данных, независимую от предметной области. [5] Это позволяет уменьшить беспорядочность данных или существование изолированных хранилищ данных благодаря наличию централизованной системы, которая обеспечивает согласованное использование фундаментальных принципов между различными узлами в ячейке данных и позволяет совместно использовать данные в разных областях. [6]

История [ править ]

Термин «сетка данных» был впервые определен Жамаком Дегани в 2019 году. [7] когда она работала главным консультантом в технологической компании Thoughtworks . [8] [9] Дегани представил этот термин в 2019 году, а затем более подробно рассказал о его принципах и логической архитектуре на протяжении 2020 года. Прогнозировалось, что этот процесс станет «большим претендентом» для компаний в 2022 году. [10] [11] Сети данных были реализованы такими компаниями, как Zalando , [12] Нетфликс , [13] Интуиция , [14] ВистаПринт , PayPal [15] и другие.

В 2022 году Дегани покинул Thoughtworks и основал Nextdata Technologies, чтобы сосредоточиться на децентрализованных данных. [16]

Принципы [ править ]

Сетка данных основана на четырех основных принципах: [17]

В дополнение к этим принципам Дегани пишет, что продукты данных, созданные каждой командой предметной области, должны быть обнаруживаемыми, адресуемыми, заслуживающими доверия, обладать самоописываемой семантикой и синтаксисом, быть совместимыми, безопасными и регулироваться глобальными стандартами и контролем доступа. [19] Другими словами, к данным следует относиться как к готовому к использованию и надежному продукту. [20]

На практике [ править ]

После введения в 2019 г. [7] несколько компаний начали внедрять сетку данных [12] [14] [15] и поделиться своим опытом. Проблемы (C) и лучшие практики (BP) для практиков включают:

С1. Управление федеративными данными
Компании сообщают о трудностях с внедрением федеративной структуры управления для деятельности и процессов, которые ранее находились в централизованном владении и обеспечении соблюдения. Это особенно актуально для вопросов безопасности, конфиденциальности и регулирования. [21] [22] [23]
С2. Смена ответственности
В сетке данных отдельные лица в доменах несут полную ответственность за продукты данных. Эта новая ответственность может оказаться сложной, поскольку она редко компенсируется и обычно приносит пользу другим областям. [21] [22]
С3. Понимание
Исследования показали серьезное непонимание парадигмы сетки данных среди сотрудников компаний, реализующих сетку данных. [21]
БП1. Междоменный блок
Что касается C1, организациям следует создать междоменное управляющее подразделение, отвечающее за стратегическое планирование, определение приоритетов вариантов использования и соблюдение конкретных правил управления, особенно в отношении вопросов безопасности, регулирования и конфиденциальности. Тем не менее, блок междоменного управления может лишь дополнять и поддерживать структуру федеративного управления и может устареть по мере роста зрелости сети данных. [21] [24]
БП2. Отслеживайте и наблюдайте
Обращаясь к C2., организации должны наблюдать и оценивать качество продуктов данных, поскольку отслеживание и ранжирование ключевых продуктов данных может стимулировать высококачественные предложения, мотивировать владельцев доменов и поддерживать переговоры по бюджету. [21]
БП3. Сознательное усыновление
Организации должны тщательно оценить свои существующие системы данных, рассмотреть организационные факторы и взвесить потенциальные выгоды, прежде чем внедрять сетку данных. При внедрении сетки данных рекомендуется осторожно и сознательно вводить терминологию сетки данных, чтобы обеспечить четкое понимание концепции (C3). [21]

Сообщество [ править ]

Скотт Хирлеман основал сообщество Data Mesh, в котором на его канале Slack насчитывается более 7500 человек. [25]

См. также [ править ]

Ссылки [ править ]

  1. ^ Эванс, Эрик (2004). Проектирование, ориентированное на предметную область: решение проблем, лежащих в основе программного обеспечения . Бостон: Аддисон-Уэсли. ISBN  0-321-12521-5 . OCLC   52134890 .
  2. ^ Скелтон, Мэтью (2019). Топологии команд: организация бизнес- и технологических команд для быстрого потока . Мануэль Паис. Портленд, Орегон. ISBN  978-1-942788-84-3 . OCLC   1108538721 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  3. ^ Мачадо, Инес Араужо; Коста, Карлос; Сантос, Марибель Ясмина (1 января 2022 г.). «Сетка данных: концепции и принципы смены парадигмы в архитектурах данных» . Procedia Информатика . Международная конференция по информационным системам предприятия / ProjMAN - Международная конференция по управлению проектами / HCist - Международная конференция по информационным системам и технологиям здравоохранения и социальной защиты 2021. 196 : 263–271. дои : 10.1016/j.procs.2021.12.013 . hdl : 1822/78127 . ISSN   1877-0509 . S2CID   245864612 .
  4. ^ «Архитектура сетки данных» . datamesh-architecture.com . Проверено 13 июня 2022 г.
  5. ^ Дехгани, Жамак (2022). Сетка данных . Севастополь, Калифорния. ISBN  978-1-4920-9236-0 . OCLC   1260236796 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  6. ^ Мачадо, Инес Араужо; Коста, Карлос; Сантос, Марибель Ясмина (1 января 2022 г.). «Сетка данных: концепции и принципы смены парадигмы в архитектурах данных» . Procedia Информатика . Международная конференция по информационным системам предприятия / ProjMAN - Международная конференция по управлению проектами / HCist - Международная конференция по информационным системам и технологиям здравоохранения и социальной защиты 2021. 196 : 263–271. дои : 10.1016/j.procs.2021.12.013 . hdl : 1822/78127 . ISSN   1877-0509 .
  7. Перейти обратно: Перейти обратно: а б «Как перейти от монолитного озера данных к распределенной сетке данных» . martinfowler.com . Проверено 28 января 2022 г.
  8. ^ Баер (dbInsight), Тони. «Data Mesh: Стоит ли попробовать это дома?» . ЗДНет . Проверено 10 февраля 2022 г.
  9. ^ Энди Мотт (12 января 2022 г.). «Ускорение получения аналитических данных с помощью сетки данных» . RTInsights . Проверено 01 марта 2022 г.
  10. ^ «Разработки, которые будут определять управление данными и операционную безопасность в 2022 году» . Помогите Net Security . 28 декабря 2021 г. Проверено 01 марта 2022 г.
  11. ^ Бэйн, Энди. «Сообщение совета: куда движется промышленная трансформация в 2022 году?» . Форбс . Проверено 01 марта 2022 г.
  12. Перейти обратно: Перейти обратно: а б Шульц, Макс; Видер, Ариф (2021). Сетка данных на практике . ISBN  978-1-09-810849-6 .
  13. ^ Сетка данных Netflix: составная обработка данных - Джастин Каннингем , получено 29 апреля 2022 г.
  14. Перейти обратно: Перейти обратно: а б Бейкер, Тристан (22 февраля 2021 г.). «Стратегия сетки данных Intuit» . Интуитивная инженерия . Проверено 29 апреля 2022 г.
  15. Перейти обратно: Перейти обратно: а б «Следующее поколение платформ данных — это Data Mesh» . 03.08.2022 . Проверено 8 февраля 2023 г.
  16. ^ «Почему мы запустили Nextdata» . 16 января 2022 г. Проверено 8 февраля 2023 г.
  17. ^ Дехгани, Жамак (2022). Сетка данных . Севастополь, Калифорния. ISBN  978-1-4920-9236-0 . OCLC   1260236796 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  18. ^ «Определение сетки данных | Блог Джеймса Серры» . 16 февраля 2021 г. Проверено 28 января 2022 г.
  19. ^ «Аналитика в 2022 году означает овладение политикой распределенных данных» . Новый стек . 29 декабря 2021 г. Проверено 3 марта 2022 г.
  20. ^ «Разработки, которые будут определять управление данными и операционную безопасность в 2022 году» . Помогите Net Security . 28 декабря 2021 г. Проверено 01 марта 2022 г.
  21. Перейти обратно: Перейти обратно: а б с д и ж Боде, Ян; Круто, Никлас; Кройцбергер, Доминик; Хиршль, Себастьян; Холтманн, Карстен (04 мая 2023 г.). «Сетка данных: мотивационные факторы, проблемы и лучшие практики». arXiv : 2302.01713v2 [ cs.AI ].
  22. Перейти обратно: Перейти обратно: а б Вестюс, Кэтрин; Ханссен, Гейр Кьетил; Микалсен, Мариус; Буан, Тор Александр; Конбой, Киран (2022). «Гибкое управление данными в NAV: практический пример». Гибкие процессы в программной инженерии и экстремальном программировании . Конспекты лекций по обработке деловой информации 445 LNBIP. Том. 445. Спрингер. стр. 220–235. дои : 10.1007/978-3-031-08169-9_14 . ISBN  978-3-031-08168-2 .
  23. ^ Джоши, Дивья; Пратик, Шитал; Рао, Мадху Подила (2021). «Управление данными в ячеистой инфраструктуре данных: пример банка Saxo». Материалы Международной конференции по электронному бизнесу (ICEB) . Том. 21. С. 599–604.
  24. ^ Уайт, Мартин; Оденкирхен, Андреас; Баутц, Стефан; Херингер, Агнес; Круков, Оливер (2022). «Data Mesh — просто еще одно модное словечко или платформа данных следующего поколения?» . Исследование PwC 2022: Изменение платформ данных .
  25. ^ «Глобальный дом для сетки данных» . Глобальный дом для Data Mesh . Проверено 24 апреля 2022 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5597070a6a71ebbc6613b2cb4687ddfd__1717233540
URL1:https://arc.ask3.ru/arc/aa/55/fd/5597070a6a71ebbc6613b2cb4687ddfd.html
Заголовок, (Title) документа по адресу, URL1:
Data mesh - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)