Jump to content

Экосистема данных

Экосистема данных — это сложная среда взаимозависимых сетей и участников, которые способствуют сбору, передаче и использованию данных. [1] Он может охватывать несколько секторов, таких как здравоохранение или финансы, чтобы информировать друг друга о практике. [2] Экосистема данных часто состоит из многочисленных совокупностей данных. [3] Исследования экосистем данных развивались в ответ на быстрое распространение и доступность информации через Интернет, что способствовало превращению данных в товар. [1]

Типы данных

Данные представляют собой оцифрованную информацию, которая сжимается для эффективной передачи. [4] Данные состоят из двоичных значений, выраженных как 1 или 0, что позволяет абстрагировать сложные мысли, изображения, видео и многое другое. [4] Уровень производства данных и обмена ими резко возрос за последние десятилетия: правительство и государственные учреждения свободно публикуют огромные объемы данных, особенно в экологической, культурной, научной и статистической областях. [1] Это также привело к созданию высокодоходной отрасли для компаний, которые собирают, классифицируют и распространяют данные в качестве торгуемого ресурса и работают в рамках недавно определенных экосистем данных. [1]

Экосистемы данных

[ редактировать ]

Природа экосистемы означает симбиотические отношения между элементами. Таким образом, описывая среду данных как экосистему, она описывает сопутствующие отношения. Их основная цель — создавать, управлять и поддерживать обмен данными между платформами и дисциплинами. [1] Ключом к этой инициативе являются посредники данных, которые облегчают доступ к данным и подразделяются на семь типов, включая доверительные фонды данных, обмен данными и платформы данных . [2] [5] Экосистема данных также включает поставщиков и потребителей данных, которые, как следует из их названий, обозначают, предоставляют и потребляют данные через посредников. [3]

Типичный пример экосистемы данных существует в сфере веб-браузера. Стороннее приложение для отслеживания на веб-сайте (называемое файлами cookie ) выступает в качестве посредника, собирая и систематизируя данные. Веб-браузер становится поставщиком данных, поскольку он передает информацию пользователя при навигации по различным веб-сайтам. Сами веб-сайты становятся потребителями, поскольку они используют информацию отслеживания для адаптации контента в зависимости от поведения пользователей. [6]

Как уже упоминалось, экосистемы данных могут охватывать несколько секторов, например, медицинские данные клиента передаются страховой компании для расчета премии. Суть экосистемы заключается в том, что все участники общей среды вносят свой вклад в общий ресурс или базу знаний. [1]

Картирование

[ редактировать ]

Экосистемы данных обладают тремя основными характеристиками: сетью, платформой и совместной эволюцией. [1] Сеть в широком смысле относится к группам разработчиков данных и технологий, поставщиков и реселлеров. [1] Таким образом, платформа — это услуга, инструмент или платформа, которая совместно используется сетью участников. [1] Платформа предоставляет участникам интерфейс для создания общего продукта или услуги. [1] Последняя характеристика относится к тому, как различные участники и платформы позволяют друг другу развиваться или совершенствоваться. [1] Метафорическое использование термина «экосистема» по своей сути требует, чтобы все участвующие стороны получали взаимную выгоду от своего участия. Это будет улучшение или эволюция их собственного функционирования, что приведет к положительным результатам для более широкой экосистемы. Опять же, если использовать пример веб-браузера: стороннее приложение для отслеживания собирает данные, чтобы помочь веб-сайтам развивать свои контент-стратегии, которые затем предоставляют более точные пользовательские данные сторонним трекерам в бесконечном цикле обратной связи. [6]

Сборки данных

[ редактировать ]
Диаграмма, демонстрирующая элементы совокупности данных [7]

В широком ландшафте экосистемы данных существуют многочисленные сборки данных. Сборка описывается как взаимосвязанные социотехнические системы, которые работают в тандеме друг с другом для достижения общей цели. [3] Эти системы охватывают технологические, политические, финансовые и передовые методы, обеспечивающие сбор, передачу и распространение данных. [8] В таблице ниже показаны общие элементы сборки данных, которые облегчают и управляют датификацией .

Экосистема данных содержит многочисленные совокупности данных, поскольку каждый участник системы имеет свои собственные наборы материальных и нематериальных элементов для своей работы. Веб-браузеры как поставщики данных имеют свои собственные наборы оборудования, программного обеспечения, серверов, финансов, инфраструктуры, методов и т. д. Каждый веб-сайт, который потребляет данные, и более широкие компании, которые они представляют, аналогичным образом представляют набор систем. А промежуточные сайты отслеживания, которые собирают и продают данные, работают в рамках своей собственной группы. Вполне возможно, что разные сборки могут иметь общие элементы в рамках более широкой экосистемы или иметь отдельные элементы, такие как противоположное оборудование или платформы, которые вступают в конфликт. [9] Например, веб-браузер может включать в себя блокировщики рекламы, которые конфликтуют со сторонними трекерами, которые пытаются очистить данные пользователя.

Большие данные

[ редактировать ]

Рост экосистем данных является неотъемлемой частью развития больших данных. Большие данные — это новая тенденция в науке и технологиях, которая отслеживает и определяет практически все действия человека. [10] Оно определяется следующими пятью свойствами:

Большие данные состоят из огромных объемов информации, которые могут составлять терабайты или петабайты . [8]

Скорость

[ редактировать ]

Большие данные создаются быстро и обмениваются ими в режиме реального времени. [8]

Разнообразие

[ редактировать ]

Большие данные чрезвычайно разнообразны, представляют собой многочисленные области исследования и имеют обширное практическое применение. [8]

Большие данные имеют неотъемлемую ценность благодаря потенциальному применению данных и политической экономии, в которой они работают. [11]

Правдивость

[ редактировать ]

Большие данные должны считаться точными и качественными. Это может быть сложно, поскольку информация может быть неполной или неверной, но должен быть определенный уровень доверия к тому, что сбор данных проводился с намерением быть правдивым. [11]

Обеспокоенность

[ редактировать ]

Основная проблема или критика экосистем данных связана с конфиденциальностью. Кто имеет доступ к данным, явный или неявный? Как эти данные защищены? Как он используется и, возможно, монетизируется? Некоммерческая организация Cloud Secure Alliance (CSA) делит проблемы безопасности экосистем больших данных на четыре группы: безопасность инфраструктуры, конфиденциальность данных, управление данными, а также целостность и относительная безопасность. [ нужна ссылка ]

В случае веб-браузера, веб-сайта и сторонней операции отслеживания существует явный финансовый стимул в отношении того, почему данные собираются и как они используются. Но в этом сценарии также существует определенный уровень наблюдения, который, возможно, остается незамеченным. Роб Китчин называет это «информационным наблюдением» — результатом обработки данных повседневной жизни, который позволяет очень точно и непрерывно отслеживать наше местоположение и деятельность. [3] Кто еще, кроме этих трекеров и веб-сайтов, имеет доступ к собираемым данным и используются ли они в более гнусных целях? В случае штатов США, которые запретили доступ к абортам, есть опасения, что эти экосистемы данных могут быть использованы для наказания граждан, которые обращаются за услугами за пределами штата. [12]

  1. ^ Jump up to: а б с д и ж г час я дж к Оливейра, Марсело Юрий С.; Лоссио, Бернадетт Фариас (30 мая 2018 г.). «Что такое экосистема данных?». Материалы 19-й ежегодной международной конференции по исследованиям цифрового правительства: управление в эпоху данных . Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 1–9. дои : 10.1145/3209281.3209335 . ISBN  978-1-4503-6526-0 . S2CID   195348898 .
  2. ^ Jump up to: а б Абдулла, Ахмед (8 марта 2021 г.). «Экосистемы данных стали проще» . МакКинси Диджитал .
  3. ^ Jump up to: а б с д Китчин, Роб (2022). Революция данных: критический анализ больших данных, открытых данных и инфраструктур данных (2-е изд.). Sage Publications Ltd. Лос-Анджелес, Калифорния: ISBN  978-1-5297-3375-4 . OCLC   1285687714 .
  4. ^ Jump up to: а б Воган, Джек (июль 2019 г.). "данные" . ТехТаржет .
  5. ^ Мэсси, Джо (18 августа 2022 г.). «Институты данных» . Институт открытых данных . Проверено 20 ноября 2022 г.
  6. ^ Jump up to: а б Фридман, Макс (21 ноября 2022 г.). «Компании собирают данные. Как они их используют?» . Деловые новости ежедневно . Проверено 29 ноября 2022 г.
  7. ^ Китчин, Роб (2022). Революция данных: критический анализ больших данных, открытых данных и инфраструктур данных (2-е изд.). Лос-Анджелес, Калифорния. ISBN  978-1-5297-3375-4 . OCLC   1285687714 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  8. ^ Jump up to: а б с д П., Китчин, Роб Лорио, Трейси (27 июля 2014 г.). На пути к изучению критических данных: составление диаграмм и распаковка совокупностей данных и их работы. Рабочий документ «Программируемый город» 2 . Программируемый город. OCLC   1291151213 . {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  9. ^ Цуй, Ешэн; Кара, Сами; Чан, Ка С. (апрель 2020 г.). «Производственная экосистема больших данных: систематический обзор литературы» (PDF) . Робототехника и компьютерно-интегрированное производство . 62 : 101861. doi : 10.1016/j.rcim.2019.101861 . ISSN   0736-5845 . S2CID   208832261 .
  10. ^ Демченко Юрий; де Лаат, Сеес; Мембри, Питер (май 2014 г.). «Определение компонентов архитектуры экосистемы больших данных» . 2014 Международная конференция по технологиям и системам совместной работы (CTS) . Миннеаполис, Миннесота, США: IEEE. стр. 104–112. дои : 10.1109/CTS.2014.6867550 . ISBN  978-1-4799-5158-1 . S2CID   2920274 .
  11. ^ Jump up to: а б Гиллис, Александр (март 2021 г.). «5 В больших данных» . ТехТаржет .
  12. ^ Нг, Альфред (18 июля 2022 г.). « 'Исключительно опасный инструмент': как данные Google могут помочь государствам отслеживать аборты» . Политик .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 413d77f5cc8723f47ca9e5c51439b831__1721318400
URL1:https://arc.ask3.ru/arc/aa/41/31/413d77f5cc8723f47ca9e5c51439b831.html
Заголовок, (Title) документа по адресу, URL1:
Data ecosystem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)