Экосистема данных
Экосистема данных — это сложная среда взаимозависимых сетей и участников, которые способствуют сбору, передаче и использованию данных. [1] Он может охватывать несколько секторов, таких как здравоохранение или финансы, чтобы информировать друг друга о практике. [2] Экосистема данных часто состоит из многочисленных совокупностей данных. [3] Исследования экосистем данных развивались в ответ на быстрое распространение и доступность информации через Интернет, что способствовало превращению данных в товар. [1]
Данные
[ редактировать ]Данные представляют собой оцифрованную информацию, которая сжимается для эффективной передачи. [4] Данные состоят из двоичных значений, выраженных как 1 или 0, что позволяет абстрагировать сложные мысли, изображения, видео и многое другое. [4] Уровень производства данных и обмена ими резко возрос за последние десятилетия: правительство и государственные учреждения свободно публикуют огромные объемы данных, особенно в экологической, культурной, научной и статистической областях. [1] Это также привело к созданию высокодоходной отрасли для компаний, которые собирают, классифицируют и распространяют данные в качестве торгуемого ресурса и работают в рамках недавно определенных экосистем данных. [1]
Экосистемы данных
[ редактировать ]Природа экосистемы означает симбиотические отношения между элементами. Таким образом, описывая среду данных как экосистему, она описывает сопутствующие отношения. Их основная цель — создавать, управлять и поддерживать обмен данными между платформами и дисциплинами. [1] Ключом к этой инициативе являются посредники данных, которые облегчают доступ к данным и подразделяются на семь типов, включая доверительные фонды данных, обмен данными и платформы данных . [2] [5] Экосистема данных также включает поставщиков и потребителей данных, которые, как следует из их названий, обозначают, предоставляют и потребляют данные через посредников. [3]
Типичный пример экосистемы данных существует в сфере веб-браузера. Стороннее приложение для отслеживания на веб-сайте (называемое файлами cookie ) выступает в качестве посредника, собирая и систематизируя данные. Веб-браузер становится поставщиком данных, поскольку он передает информацию пользователя при навигации по различным веб-сайтам. Сами веб-сайты становятся потребителями, поскольку они используют информацию отслеживания для адаптации контента в зависимости от поведения пользователей. [6]
Как уже упоминалось, экосистемы данных могут охватывать несколько секторов, например, медицинские данные клиента передаются страховой компании для расчета премии. Суть экосистемы заключается в том, что все участники общей среды вносят свой вклад в общий ресурс или базу знаний. [1]
Картирование
[ редактировать ]Экосистемы данных обладают тремя основными характеристиками: сетью, платформой и совместной эволюцией. [1] Сеть в широком смысле относится к группам разработчиков данных и технологий, поставщиков и реселлеров. [1] Таким образом, платформа — это услуга, инструмент или платформа, которая совместно используется сетью участников. [1] Платформа предоставляет участникам интерфейс для создания общего продукта или услуги. [1] Последняя характеристика относится к тому, как различные участники и платформы позволяют друг другу развиваться или совершенствоваться. [1] Метафорическое использование термина «экосистема» по своей сути требует, чтобы все участвующие стороны получали взаимную выгоду от своего участия. Это будет улучшение или эволюция их собственного функционирования, что приведет к положительным результатам для более широкой экосистемы. Опять же, если использовать пример веб-браузера: стороннее приложение для отслеживания собирает данные, чтобы помочь веб-сайтам развивать свои контент-стратегии, которые затем предоставляют более точные пользовательские данные сторонним трекерам в бесконечном цикле обратной связи. [6]
Сборки данных
[ редактировать ]В широком ландшафте экосистемы данных существуют многочисленные сборки данных. Сборка описывается как взаимосвязанные социотехнические системы, которые работают в тандеме друг с другом для достижения общей цели. [3] Эти системы охватывают технологические, политические, финансовые и передовые методы, обеспечивающие сбор, передачу и распространение данных. [8] В таблице ниже показаны общие элементы сборки данных, которые облегчают и управляют датификацией .
Экосистема данных содержит многочисленные совокупности данных, поскольку каждый участник системы имеет свои собственные наборы материальных и нематериальных элементов для своей работы. Веб-браузеры как поставщики данных имеют свои собственные наборы оборудования, программного обеспечения, серверов, финансов, инфраструктуры, методов и т. д. Каждый веб-сайт, который потребляет данные, и более широкие компании, которые они представляют, аналогичным образом представляют набор систем. А промежуточные сайты отслеживания, которые собирают и продают данные, работают в рамках своей собственной группы. Вполне возможно, что разные сборки могут иметь общие элементы в рамках более широкой экосистемы или иметь отдельные элементы, такие как противоположное оборудование или платформы, которые вступают в конфликт. [9] Например, веб-браузер может включать в себя блокировщики рекламы, которые конфликтуют со сторонними трекерами, которые пытаются очистить данные пользователя.
Большие данные
[ редактировать ]Рост экосистем данных является неотъемлемой частью развития больших данных. Большие данные — это новая тенденция в науке и технологиях, которая отслеживает и определяет практически все действия человека. [10] Оно определяется следующими пятью свойствами:
Объем
[ редактировать ]Большие данные состоят из огромных объемов информации, которые могут составлять терабайты или петабайты . [8]
Скорость
[ редактировать ]Большие данные создаются быстро и обмениваются ими в режиме реального времени. [8]
Разнообразие
[ редактировать ]Большие данные чрезвычайно разнообразны, представляют собой многочисленные области исследования и имеют обширное практическое применение. [8]
Ценить
[ редактировать ]Большие данные имеют неотъемлемую ценность благодаря потенциальному применению данных и политической экономии, в которой они работают. [11]
Правдивость
[ редактировать ]Большие данные должны считаться точными и качественными. Это может быть сложно, поскольку информация может быть неполной или неверной, но должен быть определенный уровень доверия к тому, что сбор данных проводился с намерением быть правдивым. [11]
Обеспокоенность
[ редактировать ]Основная проблема или критика экосистем данных связана с конфиденциальностью. Кто имеет доступ к данным, явный или неявный? Как эти данные защищены? Как он используется и, возможно, монетизируется? Некоммерческая организация Cloud Secure Alliance (CSA) делит проблемы безопасности экосистем больших данных на четыре группы: безопасность инфраструктуры, конфиденциальность данных, управление данными, а также целостность и относительная безопасность. [ нужна ссылка ]
В случае веб-браузера, веб-сайта и сторонней операции отслеживания существует явный финансовый стимул в отношении того, почему данные собираются и как они используются. Но в этом сценарии также существует определенный уровень наблюдения, который, возможно, остается незамеченным. Роб Китчин называет это «информационным наблюдением» — результатом обработки данных повседневной жизни, который позволяет очень точно и непрерывно отслеживать наше местоположение и деятельность. [3] Кто еще, кроме этих трекеров и веб-сайтов, имеет доступ к собираемым данным и используются ли они в более гнусных целях? В случае штатов США, которые запретили доступ к абортам, есть опасения, что эти экосистемы данных могут быть использованы для наказания граждан, которые обращаются за услугами за пределами штата. [12]
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж г час я дж к Оливейра, Марсело Юрий С.; Лоссио, Бернадетт Фариас (30 мая 2018 г.). «Что такое экосистема данных?». Материалы 19-й ежегодной международной конференции по исследованиям цифрового правительства: управление в эпоху данных . Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 1–9. дои : 10.1145/3209281.3209335 . ISBN 978-1-4503-6526-0 . S2CID 195348898 .
- ^ Jump up to: а б Абдулла, Ахмед (8 марта 2021 г.). «Экосистемы данных стали проще» . МакКинси Диджитал .
- ^ Jump up to: а б с д Китчин, Роб (2022). Революция данных: критический анализ больших данных, открытых данных и инфраструктур данных (2-е изд.). Sage Publications Ltd. Лос-Анджелес, Калифорния: ISBN 978-1-5297-3375-4 . OCLC 1285687714 .
- ^ Jump up to: а б Воган, Джек (июль 2019 г.). "данные" . ТехТаржет .
- ^ Мэсси, Джо (18 августа 2022 г.). «Институты данных» . Институт открытых данных . Проверено 20 ноября 2022 г.
- ^ Jump up to: а б Фридман, Макс (21 ноября 2022 г.). «Компании собирают данные. Как они их используют?» . Деловые новости ежедневно . Проверено 29 ноября 2022 г.
- ^ Китчин, Роб (2022). Революция данных: критический анализ больших данных, открытых данных и инфраструктур данных (2-е изд.). Лос-Анджелес, Калифорния. ISBN 978-1-5297-3375-4 . OCLC 1285687714 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Jump up to: а б с д П., Китчин, Роб Лорио, Трейси (27 июля 2014 г.). На пути к изучению критических данных: составление диаграмм и распаковка совокупностей данных и их работы. Рабочий документ «Программируемый город» 2 . Программируемый город. OCLC 1291151213 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Цуй, Ешэн; Кара, Сами; Чан, Ка С. (апрель 2020 г.). «Производственная экосистема больших данных: систематический обзор литературы» (PDF) . Робототехника и компьютерно-интегрированное производство . 62 : 101861. doi : 10.1016/j.rcim.2019.101861 . ISSN 0736-5845 . S2CID 208832261 .
- ^ Демченко Юрий; де Лаат, Сеес; Мембри, Питер (май 2014 г.). «Определение компонентов архитектуры экосистемы больших данных» . 2014 Международная конференция по технологиям и системам совместной работы (CTS) . Миннеаполис, Миннесота, США: IEEE. стр. 104–112. дои : 10.1109/CTS.2014.6867550 . ISBN 978-1-4799-5158-1 . S2CID 2920274 .
- ^ Jump up to: а б Гиллис, Александр (март 2021 г.). «5 В больших данных» . ТехТаржет .
- ^ Нг, Альфред (18 июля 2022 г.). « 'Исключительно опасный инструмент': как данные Google могут помочь государствам отслеживать аборты» . Политик .