Совместные данные
Сотрудничество в области данных (иногда называемое «филантропией корпоративных данных») [1] представляют собой форму сотрудничества, в которой участники из разных секторов, включая частные компании, исследовательские институты и правительственные учреждения, могут обмениваться данными и опытом работы с данными, чтобы помочь решить общественные проблемы. [2] [3]
Типы
[ редактировать ]Совместная работа с данными может принимать разные формы. Они могут быть организованы как: [4]
- Публичные интерфейсы . Частные фирмы публикуют избранные активы данных, которые становятся общедоступными для использования внешними сторонами. Фирмы обычно представляют эту информацию в виде интерфейсов прикладного программирования (API) или платформ данных. [5]
- Надежный посредник : фирмы частного сектора обмениваются данными с партнерами из числа представителей общественности, гражданского общества и научных кругов. Данные могут передаваться третьими лицами, которые предоставляют ценные данные на фиксированных условиях и в определенные сроки неправительственным организациям. Его также можно запустить с помощью сторонней аналитики, которая передает данные управляющим данными для проведения анализа и обмена этими результатами с внешними субъектами, предоставляя результаты данных, не раскрывая конфиденциальную информацию. [6]
- Объединение данных : многоотраслевые заинтересованные стороны объединяются в «пулы данных» для совместного использования ресурсов данных. Публичные пулы данных позволяют партнерам открыто получать доступ к данным и самостоятельно использовать их, тогда как частные пулы данных ограничивают доступ и вклад в информацию. [6]
- Партнерство в области исследований и анализа : организации обмениваются данными и «собственными информационными ресурсами» с государственными и академическими учреждениями для анализа и достижения общественных целей. Благодаря такой передаче данных и обмену данными доступ к данным и условия их использования строго контролируются. [6]
- Призы и конкурсы : организации предоставляют данные квалифицированным кандидатам посредством конкурса на инновационное использование или дизайн платформы, чтобы повысить ценность фирмы. [6] Конкурсы открытых инноваций, такие как Economic Graph Challenge от LinkedIn, позволяют открыто и более широко использовать данные многим независимым пользователям, в то время как конкурсы выборочных инноваций дают ограниченный доступ к данным, сужая сферу их применения до конкретной ситуации. Зачастую участники соревнований обязаны соблюдать правила ответственности за данные. [7] [5]
- Генерация разведывательной информации : компании используют данные для создания общих инструментов и выпускают их для публичного использования. Хотя формального прямого межсекторального обмена не происходит, он закладывает основу для передачи знаний и культуры открытого анализа, основанного на данных. [6]
Причины для совместной работы над данными
[ редактировать ]Бум больших данных продемонстрировал способность данных информировать и разрабатывать государственные проекты на ответственной и итеративной основе. [8] Однако неравный доступ к определенным данным в разных секторах ограничивает возможности групп находить, получать доступ к ценной информации или узнавать ее, что препятствует социальным инновациям. [9] Сотрудничество в области данных создает сети, которые устраняют пробелы в доступе и знаниях, объединяя различные сектора для обмена данными для решения социальных проблем. [6]
GovLab утверждает, что сотрудничество в области обработки данных, при котором владелец данных из частного сектора делится данными с другими группами, как правило, мотивировано желанием: [4]
- Взаимность : обмен данными с другими может помочь принять взаимовыгодные деловые решения.
- Исследования и идеи . Обмен данными может стимулировать появление новых и инновационных подходов к решению проблем.
- Репутация и связи с общественностью . Обмен данными, особенно для решения общественных проблем, может укрепить имидж и репутацию фирмы, привлекая новых социально сознательных клиентов, талантов и последователей.
- Генерация дохода . Корпоративные данные можно продавать организациям, занимающимся сбором данных, создавая новые потоки доходов.
- Соответствие нормативным требованиям . Совместная работа с данными может помочь корпорациям повысить прозрачность и доверие путем установления и соблюдения протоколов обмена данными .
- Ответственность и корпоративная филантропия . Совместная работа с данными позволяет предприятиям реализовывать значимые программы корпоративной социальной ответственности.
Сотрудничество в области обработки данных может помочь в реагировании на проблемы предоставления услуг, готовности к чрезвычайным ситуациям и реагирования на стихийные бедствия. Роберт Киркпатрик, директор UN Global Pulse, отметил, что «отсутствие инноваций [в этих секторах] привело к неспособности защитить общественность от того, что оказывается предотвратимым вредом». [10]
Стимулы для участия частного сектора
[ редактировать ]По данным GovLab, совместная работа с данными может обеспечить пять основных преимуществ в решении общественных проблем: [4]
- Ситуационная осведомленность и реагирование : последние, надежные и качественные данные из частного или государственного секторов могут помочь правительствам и гражданскому обществу лучше мобилизоваться в кризисных и чрезвычайных ситуациях. Например, проект «Мобильные данные, экстремальные условия окружающей среды и население» (MDEEP) представляет собой сотрудничество между международными организациями и телекоммуникационными компаниями в Бангладеш с целью создания «крупномасштабных моделей перемещения населения для понимания перемещения населения, связанного со стихийными бедствиями». [11]
- Проектирование и предоставление государственных услуг . Доступ к ранее недоступным наборам данных может обеспечить более точное моделирование проектирования государственных услуг и целенаправленное и научно обоснованное руководство предоставлением услуг. Например, совместное использование наборов данных правительствами, международными организациями, группами помощи и частными операторами связи во время вспышки Эболы в 2014 году помогло отслеживать вирус. [12]
- Создание и передача знаний . Использование большего количества и более разнообразных наборов данных может заполнить пробелы в знаниях и лучше реагировать на возникающую проблему. Исследовательская программа «Все мы», созданная администрацией Обамы в 2015 году, позволяет участникам передавать данные о своем здоровье в безопасную систему, которая затем агрегируется и анонимизируется, чтобы исследователи могли изучать и продвигать медицинскую науку. [13]
- Прогнозирование и прогнозирование . Данные из прошлого позволяют делать обоснованные прогнозы на будущее, позволяя группам выявлять проблемы и быстрее реагировать. Используя данные поисковых запросов, исследователи определили поисковые запросы, время и демографические данные, которые коррелировали с суицидальными мыслями среди индийской молодежи. [14]
- Оценка и оценка воздействия : доступ к дополнительным наборам данных может помочь организациям отслеживать и оценивать эффективность политик и итеративно адаптировать программы для улучшения предоставления услуг. [3] Например, инициатива Sentinel Управления по контролю за продуктами и лекарствами США использовала анонимную информацию о пациентах, полученную через сеть TriNetX Live USA Network, чтобы оценить, сколько взрослых, госпитализированных из-за COVID-19, пережили или умерли от осложнений, связанных с тромбозом. [15]
Примеры
[ редактировать ]С 2017 по 2019 год доля компаний, вступающих в партнерства, связанные с данными, выросла с 21% до 40%. [16] Растущая доля бизнес-конкурентов также решает подключить свои данные — их доля выросла с 7% до 17%. [6] В отчете 2019 года Всемирный экономический форум и McKinsey подсчитали, что объединение данных через институциональные и географические границы может принести к 2020 году экономическую ценность примерно в 3 триллиона долларов в год. [6]
Ниже приводится иллюстративный (но не исчерпывающий) список некоторых совместных проектов по обработке данных:
- AI4BetterHearts: глобальный кооператив данных, созданный Novartis Foundation и Microsoft для улучшения здоровья сердечно-сосудистой системы с целью использования искусственного интеллекта и анализа данных для борьбы с сердечно-сосудистыми заболеваниями. [17]
- The Chicago Data Collaborative: усилия редакций новостей, ученых и некоммерческих организаций по получению данных от государственных учреждений, систематизации и документирования данных, а также их связывания для лучшего и всестороннего понимания системы уголовного правосудия. [18]
- Совместная организация по борьбе с торговлей людьми: совместная организация по сбору данных, работающая над сдерживанием торговли людьми с помощью данных, предоставленных различными странами и поддерживаемая Международной организацией по миграции (МОМ) и Polaris. [19]
- CubeIQ: компания по анализу и измерению офлайн-информации, помогающая маркетологам понять истинное влияние их многоканальной рекламы в офлайн-мире. [20] Их программа «Данные во благо» предоставляет доступ к анонимным, конфиденциальным данным о местоположении для академических исследований и гуманитарных инициатив, связанных с мобильностью людей. [21]
- Совместная работа с данными для правосудия: проект Колледжа Джона Джея, который использует данные сообщества для исследования работы системы уголовного правосудия и создания информированных и прозрачных рамок для реформы уголовного правосудия. [22]
- Совместная работа по данным здравоохранения: межведомственная, многосторонняя инициатива, действующая в пяти африканских странах, которая обеспечивает совместную платформу для использования технических и финансовых ресурсов на всех уровнях наряду с национальными стратегиями и планами по сбору, хранению, анализу и использованию данных для улучшения результаты в области здравоохранения, уделяя особое внимание целям ООН в области устойчивого развития и сообществам, которые остались позади. [23]
- Международная сеть данных о влиянии и результатах деятельности правительства (INDIGO): Инициатива Лаборатории результатов деятельности правительства (GO Lab) Школы государственного управления Блаватника Оксфордского университета, которая создает междисциплинарную сеть распорядителей данных для совместного решения социальных проблем. [24]
- InfoSum: британская компания, которая создает децентрализованную и надежную экосистему данных, позволяющую компаниям делать больше с данными клиентов без фактического обмена данными. [25]
- Совместная работа в области мобильных данных: партнерство между операторами мобильной связи, агрегаторами данных, государственными учреждениями, научными кругами и другими организациями для предоставления решений и общей структуры для обеспечения безопасных, справедливых и пригодных для жизни улиц для всех. [26] [27]
- Совместная работа по данным о водных ресурсах: Работает над выполнением своей миссии по развитию и поддержанию инклюзивного сообщества ученых-водников, создающих данные, чтобы предоставлять данные, которые позволяют защищать и восстанавливать водные пути нашей страны. [28]
Риски, проблемы и этические соображения
[ редактировать ]Совместная работа с данными сталкивается с серьезными проблемами, связанными с безопасностью данных, конфиденциальностью данных, коммерческими рисками, репутационными проблемами и неопределенностью регулирования. [29] Кроме того, существуют опасения по поводу отсутствия доверия между отдельными людьми, учреждениями и правительствами. [6]
Риски
[ редактировать ]- Коммерческие риски : «Корпорации обеспокоены репутацией бренда, правами на данные и раскрытием служебной или коммерчески конфиденциальной информации». [6]
- Риски безопасности . Уязвимые структуры данных, отсутствие опыта и процессов в области безопасности могут подвергнуть риску всех участников совместной работы с данными. [6]
- Регуляторные риски : Фрагментированная правовая и нормативная база препятствует обмену данными между секторами и суверенными границами. Различные определения конфиденциальности и прав держателей данных подвергают владельцев данных значительным рискам и обязательствам, связанным с соблюдением требований. [6]
- Конфиденциальность и этические риски : совместное использование данных может раскрыть личность человека, нарушая конфиденциальность и безопасность. Кроме того, защита уязвимых групп населения от дискриминации и нарушений прав человека посредством обмена неличными, но демографически идентифицируемыми данными часто является серьезной проблемой. [6]
Устранение проблем с защитой конфиденциальности
[ редактировать ]Вычисления с сохранением конфиденциальности (PPC) представляют данные в формах, которые могут использоваться совместно, анализироваться и использоваться многими заинтересованными сторонами без исходной информации. Для этого PPC стремится контролировать среду, в которой обрабатываются данные (доверенная среда выполнения), и лишает данные идентифицирующих признаков (дифференциальная конфиденциальность). [30] Защищая данные с помощью методов гомоморфного шифрования, PPC позволяет пользователям выполнять операции и видеть их результаты, не раскрывая исходные данные. [6] Благодаря безопасным многосторонним вычислениям различные группы могут объединять данные для работы децентрализованно и совместно. [6]
Методы PPC уже используются правительствами и крупными корпорациями. В 2015 году правительство Эстонии работало с частной фирмой Sharemind над анализом налоговых и образовательных отчетов с помощью многосторонних вычислений для проекта частной статистики. Внешний аудит проекта Европейской комиссии PRACTICE показал, что проект частной статистики не раскрывает никаких личных данных. [6]
В 2019 году Google выпустила свой протокол Private Join and Compute с открытым исходным кодом, что позволяет пользователям использовать гомоморфное шифрование и многосторонние вычисления. [6] В том же году десять фармацевтических компаний сформировали консорциум Melloddy, чтобы использовать технологию блокчейна для обучения алгоритму поиска лекарств с помощью общих данных. [6]
Смягчение асимметрии власти
[ редактировать ]Дисбаланс сил может возникнуть, когда более сильные стороны манипулируют, исключают или оказывают давление на более слабых участников совместной работы над данными. С классической точки зрения власть относится к влиянию человека или группы на других. [31] Исследуя совместное управление, Дэйв Иган, Эван Э. Хьерпе и Джесси Абрамс предлагают трехэтапный подход к власти: власть над относится к способности контролировать поведение других, власть смотрит на способность разрешать участие заинтересованных сторон, и способность рассматривать способность измерять способность другой организации реализовывать свои цели. [32]
Дисбаланс сил может возникнуть из-за неравенства во власти, ресурсах, легитимности или доверии между партиями. [6] Чем больше участников совместно обрабатывают данные или больше стимулов к их использованию, тем выше вероятность конфликта интересов. Часто данные рассматриваются как организационный актив, и открытие их для нового использования другими означает отказ от контроля над данными и передачу этой автономии участникам совместной работы, что приводит к «проблеме контроля и генеративности». [33] Распорядители данных могут помочь уменьшить дисбаланс власти за счет уменьшения влияния предвзятости, соблюдения операционных процедур и обеспечения разрешения и устранения проблем. [34]
См. также
[ редактировать ]- Большие данные
- Обмен данными
- Открытое сотрудничество
- Рассредоточенное знание
- Цифровое сотрудничество
- Массовое сотрудничество
- Открытые инновации
Ссылки
[ редактировать ]- ^ Таддео, Мариаросария (2017). «Данные филантропии и права личности» . Разум и машины . 27 (1): 1–5. дои : 10.1007/s11023-017-9429-2 . S2CID 38297827 .
- ^ Ферхюльст, Стефан; Сангокойя, Дэвид (22 апреля 2015 г.). «Совместная работа с данными: обмен данными для улучшения жизни людей» . Лаборатория управления.
- ^ Перейти обратно: а б Янг, Эндрю; Ферхюльст, Стефан (2020). «Сотрудничество с данными». В Харрисе, Фил; Битонти, Альберто; Флейшер, Крейг С.; Скоркьер Биндеркранц, Энн (ред.). Энциклопедия групп интересов, лоббирования и связей с общественностью Пэлгрейва . Пэлгрейв Макмиллан, Чам.
- ^ Перейти обратно: а б с Ферхюльст, Стефан; Янг, Эндрю; Шринивасан, Прианка. «Введение в совместную работу с данными: создание общественной ценности путем обмена данными» (PDF) .
- ^ Перейти обратно: а б Ферхюльст, Стефан Г.; Янг, Эндрю; Виноватан, Мишель; Захуранец, Эндрю Дж. (октябрь 2019 г.). «Использование данных для общественного блага: описательный анализ и типология существующей практики» (PDF) . Лаборатория управления.
- ^ Перейти обратно: а б с д и ж г час я дж к л м н тот п д р с Там же.
- ^ «Экономическое графическое исследование» . ЛинкедИн .
- ^ ОЭСР (2019). Путь к тому, чтобы стать государственным сектором, управляемым данными . Париж: Исследования ОЭСР по цифровому правительству, Издательство ОЭСР.
- ^ Суша, Ирина; Янссен, Марин; Верхюльст, Стефан (2017). «Сотрудничество в области данных как «базары»? Обзор проблем координации и механизмов согласования спроса на данные с предложением» . Трансформация правительства: люди, процесс и политика . 11 (1): 157–172. дои : 10.1108/TG-01-2017-0007 . S2CID 195968470 .
- ^ Киркпатрик, Роберт (18 марта 2019 г.). «Раскрытие проблемы неправильного использования и неправильного использования данных» . Глобальный пульс ООН .
- ^ Гольдман, Хантер (30 декабря 2014 г.). «Большие данные открывают новые возможности для устойчивости сообщества» . Фонд Рокфеллера .
- ^ Янг, Эндрю; Ферхюльст, Стефан (январь 2016 г.). «Борьба с Эболой в Сьерра-Леоне: обмен данными для улучшения реагирования на кризисы» . Влияние ОДИ .
- ^ «Все мы» . Все США.
- ^ Адлер, Наталья; Каттуто, Чиро; Калимери, Кириаки; Паолотти, Даниэла; Тиццони, Микеле; Ферхюльст, Стефан; Йом-Тов, Элад; Янг, Эндрю (2019). «Как данные поисковых систем улучшают понимание факторов, определяющих самоубийство в Индии, и служат основой для профилактики: наблюдательное исследование» . Журнал медицинских интернет-исследований . 21 (1): e10179. дои : 10.2196/10179 . ПМК 6682304 . ПМИД 30609976 .
- ^ «Тромботические явления и смерть при выявленном в стационаре COVID-19» (PDF) . Страж. 14 декабря 2020 г.
- ^ Хоффман, Уильям; Бик, Рафаэль; Борал, Остин; Хенке, Николаус; Олукойя, Дидунолува; Рифаи, Халед; Рот, Маркус; Юлдон, Том (30 мая 2019 г.). «Сотрудничество ради общего блага: развитие государственно-частного партнерства в области данных» . МакКинси и компания .
- ^ «AI4BetterHearts — совместная программа по сбору данных о сердечно-сосудистых заболеваниях» . Новартис.
- ^ «Чикагское объединение данных» . Чикагское объединение данных .
- ^ «Совместная организация по сбору данных по борьбе с торговлей людьми (CTDC)» . www.ctdatacollaborative.org .
- ^ «Офлайн-аналитика и измерение: повышение рентабельности инвестиций в рекламу» . Куебик .
- ^ «Данные во благо» . Кубайкью .
- ^ «Сотрудничество в области данных ради правосудия» . Совместная работа с данными ради правосудия .
- ^ «Данные для здоровья и устойчивого развития» . Совместная работа по данным здравоохранения .
- ^ «Что такое ИНДИГО?» . Лаборатория результатов управления .
- ^ «Восстановите судьбу своих данных | InfoSum» . www.infosum.com .
- ^ «Совместная работа над мобильными данными» .
- ^ «Mobility Data Collaborative публикует передовой опыт в области терминологии и управления данными» . САЭ Интернешнл . 5 мая 2020 г.
- ^ "Дом" . Совместная работа по данным о водных ресурсах .
- ^ «Сотрудничество в области данных ради общего блага: обеспечение доверия и инноваций посредством государственно-частного партнерства» (PDF) . Всемирный экономический форум. Апрель 2019.
- ^ «Максимизация сотрудничества посредством безопасного обмена данными» (PDF) . Аксенчер. 2019.
- ^ Вебер, Макс (1947). Хендерсон, AM; Парсонс, Т. (ред.). Теория социальной и экономической организации . Нью-Йорк: Издательство Оксфордского университета.
- ^ Орт, Патрисия Б.; Ченг, Энтони С. (2018). «Кто главный? Роль власти в совместном управлении и управлении лесами» . Гумбольдтский журнал социальных отношений . 1 (40): 191–210. дои : 10.55671/0160-4341.1068 . S2CID 55822373 .
- ^ Кливинк, Брэм; ван дер Вурт, Хайко; Винеман, Вейнанд (2018). «Создание ценности посредством совместной работы с данными: баланс инноваций и контроля» . Информационная политика . 23 (4): 379–397. дои : 10.3233/IP-180070 . S2CID 58005713 .
- ^ Даунинг, Кэти (26 мая 2016 г.). «Важность распорядителей данных в управлении информацией» . Журнал веб-сайта AHIMA .