Jump to content

Открытые данные

Карта открытых данных
Связанное облако открытых данных в августе 2014 г.
Четкое обозначение условий лицензирования является ключевым компонентом открытых данных, и для этой цели используются значки, подобные изображенному здесь.

Открытые данные — это данные , которые открыто доступны, могут использоваться, редактироваться и использоваться кем угодно для любых целей. Открытые данные лицензируются по открытой лицензии . [ 1 ] [ 2 ] [ 3 ]

Цели движения открытых данных аналогичны целям других движений «открытого исходного кода», таких как программное обеспечение с открытым исходным кодом, аппаратное обеспечение с открытым исходным кодом , открытый контент , открытые спецификации , открытое образование , открытые образовательные ресурсы , открытое правительство , открытое знания , открытый доступ , открытая наука и открытая сеть. Рост движения открытых данных сопровождается ростом прав интеллектуальной собственности. [ 4 ] Философия открытых данных давно устоялась (например, в мертоновской традиции науки ), но сам термин «открытые данные» появился недавно и приобрел популярность с появлением Интернета и Всемирной паутины и, особенно, с запуском данным Data.gov , Data.gov.uk и Data.gov.in. правительственных инициатив по открытым

Открытые данные могут быть связанными данными , называемыми связанными открытыми данными .

Одной из наиболее важных форм открытых данных являются открытые правительственные данные (ОГД), которые представляют собой форму открытых данных, создаваемых правящими государственными учреждениями. Важность открытых правительственных данных проистекает из того, что они являются частью повседневной жизни граждан, вплоть до самых рутинных/повседневных задач, которые, казалось бы, далеки от правительства.

Аббревиатура « данные FAIR/O» иногда используется для обозначения того, что рассматриваемый набор данных или база данных соответствует принципам данных FAIR и имеет явную открытую лицензию на передачу данных .

Концепция открытых данных не нова, но формализованное определение является относительно новым. Открытые данные как явление означают, что правительственные данные должны быть доступны каждому с возможностью их распространения в любой форме без каких-либо ограничений авторских прав. [ 5 ] Еще одним определением является «Открытое определение», которое можно резюмировать следующим образом: «Часть данных является открытой, если кто-либо может свободно использовать, повторно использовать и распространять ее – при условии соблюдения, в лучшем случае, требования атрибутирования и/или совместного использования. " [ 6 ] Другие определения, в том числе формулировка Института открытых данных «открытые данные — это данные, к которым каждый может получить доступ, использовать или поделиться», имеют доступную краткую версию определения, но относятся к формальному определению. [ 7 ] Открытые данные могут включать нетекстовый материал, такой как карты , геномы , коннектомы , химические соединения , математические и научные формулы, медицинские данные, а также практические данные, биологические науки и биоразнообразие.

Основным барьером на пути движения открытых данных является коммерческая ценность данных. Доступ к данным или их повторное использование часто контролируются государственными или частными организациями. Контроль может осуществляться посредством ограничений доступа, лицензий , авторских прав , патентов и платы за доступ или повторное использование. Сторонники открытых данных утверждают, что эти ограничения умаляют общее благо и что данные должны быть доступны без ограничений и платы.

Создатели данных не считают необходимым указывать условия владения, лицензирования и повторного использования; вместо этого предполагается, что отсутствие защиты авторских прав делает данные общедоступными . Например, многие учёные не считают, что данные, опубликованные вместе с их работами, находятся под их контролем, и считают акт публикации в журнале неявным выпуском данных в общественное достояние . Отсутствие лицензии затрудняет определение статуса набора данных и может ограничить использование данных, предлагаемых в «открытом» духе. Из-за этой неопределенности государственные или частные организации могут объединить указанные данные, заявить, что они защищены авторским правом, а затем перепродать их.

Основные источники

[ редактировать ]
Состояние открытых данных , книга African Minds , 2019 г.

Открытые данные могут поступать из любого источника. В этом разделе перечислены некоторые области, в которых публикуется (или, по крайней мере, обсуждается публикация) большое количество открытых данных.

Концепция открытого доступа к научным данным была создана с образованием системы Мирового центра данных в рамках подготовки к Международному геофизическому году 1957–1958 годов. [ 8 ] Международный совет научных союзов (ныне Международный совет по науке ) курирует несколько мировых центров данных, его миссия — минимизировать риск потери данных и максимизировать доступность данных. [ 9 ]

Хотя движение за открытые научные данные зародилось задолго до появления Интернета, наличие быстрых и легкодоступных сетей значительно изменило контекст данных открытой науки , поскольку публикация или получение данных стали намного менее дорогостоящими и отнимающими много времени. [ 10 ]

Проект «Геном человека» стал крупной инициативой, продемонстрировавшей силу открытых данных. Он был основан на так называемых Бермудских принципах , которые предусматривают, что: «Вся информация о последовательностях генома человека… должна быть свободно доступна и находиться в общественном достоянии, чтобы стимулировать исследования и разработки и максимизировать ее пользу для общества». [ 11 ] Более поздние инициативы, такие как Консорциум структурной геномики, продемонстрировали, что подход открытых данных может быть продуктивно использован в контексте промышленных исследований и разработок. [ 12 ]

В 2004 году министры науки всех стран Организации экономического сотрудничества и развития (ОЭСР), в которую входят большинство развитых стран мира, подписали декларацию, в которой говорится, что все финансируемые государством архивные данные должны быть общедоступными. [ 13 ] По запросу и интенсивному обсуждению с учреждениями, производящими данные в государствах-членах, ОЭСР опубликовала в 2007 году Принципы и рекомендации ОЭСР по доступу к исследовательским данным из государственного финансирования в качестве рекомендации мягкого права . [ 14 ]

Примеры открытых данных в науке:

  • data.uni-muenster.de — открытые данные о научных артефактах из Мюнстерского университета, Германия. Запущен в 2011 году.
  • Dataverse Network Project — программное обеспечение для архивных репозиториев, способствующее обмену данными , постоянному цитированию данных и воспроизводимым исследованиям. [ 15 ]
  • linkedscience.org/data — открытые наборы научных данных, закодированные как связанные данные . Запущен в 2011 году, закончился в 2018 году. [ 16 ] [ 17 ]
  • systemanaturae.org – открытые наборы научных данных, касающихся дикой природы, классифицированные по видам животных. Запущен в 2015 году. [ 18 ]

В правительстве

[ редактировать ]

Существует ряд различных аргументов в пользу открытых данных правительства. [ 19 ] [ 20 ] Некоторые сторонники говорят, что предоставление общественности правительственной информации в виде машиночитаемых открытых данных может способствовать прозрачности, подотчетности и участию общественности в правительстве. «Открытые данные могут стать мощной силой для подотчетности перед обществом — они могут сделать существующую информацию более простой для анализа, обработки и объединения, чем когда-либо прежде, обеспечивая новый уровень общественного контроля». [ 21 ] Правительства, которые обеспечивают публичный просмотр данных, могут помочь гражданам участвовать в работе государственного сектора и «повысить ценность этих данных». [ 22 ] Эксперты по открытым данным уточнили, какое влияние открытие правительственных данных может оказать на прозрачность и подотчетность правительства. В широко цитируемой статье ученые Дэвид Робинсон и Харлан Ю утверждают, что правительства могут создавать видимость прозрачности, публикуя машиночитаемые данные, которые на самом деле не делают правительство более прозрачным или подотчетным. [ 23 ] Опираясь на более ранние исследования по вопросам прозрачности и борьбы с коррупцией, [ 24 ] Политолог Всемирного банка Тьяго К. Пейшото расширил аргументы Ю и Робинсона, выделив минимальную цепочку событий, необходимых для того, чтобы открытые данные привели к ответственности:

  1. раскрываются соответствующие данные;
  2. данные широко распространяются и понятны общественности;
  3. общественность реагирует на содержание данных; и
  4. государственные должностные лица либо реагируют на реакцию общественности, либо подвергаются санкциям со стороны общественности институциональными средствами. [ 25 ]

Некоторые утверждают, что открытие официальной информации может способствовать технологическим инновациям и экономическому росту, позволяя третьим сторонам разрабатывать новые виды цифровых приложений и услуг. [ 26 ]

Правительства нескольких стран создали веб-сайты для распространения части собираемых ими данных. Это концепция совместного проекта муниципального правительства по созданию и организации культуры открытых данных или данных открытого правительства.

Кроме того, другие уровни правительства создали веб-сайты открытых данных. В Канаде существует множество государственных организаций, занимающихся открытыми данными . Data.gov перечисляет сайты в общей сложности 40 штатов США и 46 городов и округов США, веб-сайты которых предоставляют открытые данные, например, штат Мэриленд , штат Калифорния, США. [ 27 ] и Нью-Йорк . [ 28 ]

На международном уровне у Организации Объединенных Наций есть веб-сайт открытых данных, на котором публикуются статистические данные государств-членов и агентств ООН. [ 29 ] и Всемирный банк опубликовал ряд статистических данных, касающихся развивающихся стран. [ 30 ] Европейская комиссия создала два портала для Европейского Союза : Портал открытых данных ЕС , который предоставляет доступ к открытым данным институтов, агентств и других органов ЕС. [ 31 ] и Европейский портал данных, который предоставляет наборы данных от местных, региональных и национальных государственных органов по всей Европе. [ 32 ] Два портала были объединены в data.europa.eu 21 апреля 2021 года.

Италия является первой страной, которая выпустила стандартные процессы и рекомендации под лицензией Creative Commons для распространения в сфере государственного управления. Открытая модель называется циклом управления открытыми данными и была принята в нескольких регионах, таких как Венето и Умбрия . [ 33 ] [ 34 ] [ 35 ] Крупные города, такие как Реджо-ди-Калабрия и Генуя, также приняли эту модель. [ нужна ссылка ] [ 36 ]

В октябре 2015 года Партнерство «Открытое правительство» запустило Международную хартию открытых данных — набор принципов и передового опыта по выпуску государственных открытых данных, официально принятый семнадцатью правительствами стран, штатов и городов во время Глобального саммита OGP в Мексике . [ 37 ]

В июле 2024 года ОЭСР приняла лицензию Creative Commons CC-BY-4.0 для публикуемых данных и отчетов. [ 38 ]

В некоммерческих организациях

[ редактировать ]

Многие некоммерческие организации предлагают открытый доступ к своим данным, если это не нарушает права их пользователей, членов или третьих лиц на конфиденциальность . По сравнению с коммерческими корпорациями , они не стремятся монетизировать свои данные. OpenNWT запустил сайт, предлагающий открытые данные выборов. [ 39 ] CIAT предлагает открытые данные всем, кто желает проводить анализ больших данных, чтобы повысить эффективность международных сельскохозяйственных исследований. [ 40 ] DBLP , принадлежащая некоммерческой организации Dagstuhl , предлагает свою базу данных научных публикаций по информатике в качестве открытых данных. [ 41 ]

Службы обмена гостеприимством , в том числе Bewelcome, Warm Showers и CouchSurfing (до того, как они стали коммерческими), предоставили ученым доступ к своим анонимным данным для анализа, публичных исследований и публикаций. [ 42 ] [ 43 ] [ 44 ] [ 45 ] [ 46 ]

Политика и стратегии

[ редактировать ]

На небольшом уровне политика и стратегия бизнеса или исследовательской организации в отношении открытых данных будут различаться, иногда сильно. Одной из распространенных стратегий является использование общего доступа к данным. Data commons — это совместимая программная и аппаратная платформа, которая объединяет (или объединяет) данные, инфраструктуру данных, а также приложения для создания и управления данными, чтобы позволить сообществу пользователей лучше управлять, анализировать и делиться своими данными с другими. как в краткосрочной, так и в долгосрочной перспективе. [ 47 ] [ 48 ] [ 49 ] В идеале эта совместимая киберинфраструктура должна быть достаточно надежной, чтобы «облегчать переходы между этапами жизненного цикла коллекции» данных и информационных ресурсов. [ 47 ] при этом все еще опираясь на общие модели данных и инструменты рабочего пространства, обеспечивающие и поддерживающие надежный анализ данных. [ 49 ] Политика и стратегии, лежащие в основе общего доступа к данным, в идеале должны включать в себя множество заинтересованных сторон, включая поставщика услуг общего доступа к данным, поставщиков данных и пользователей данных. [ 48 ]

Гроссман и др. [ 48 ] предлагает шесть основных соображений для стратегии общего доступа к данным, которая лучше обеспечивает открытые данные в бизнесе и исследовательских организациях. Такая стратегия должна учитывать необходимость:

  • постоянные цифровые идентификаторы, которые позволяют контролировать доступ к наборам данных;
  • постоянные, доступные для обнаружения метаданные, связанные с каждым цифровым идентификатором;
  • доступ на основе интерфейса прикладного программирования (API), привязанный к службе аутентификации и авторизации;
  • переносимость данных;
  • «одноранговый обмен данными» без платы за доступ, исходящий и входящий трафик; и
  • нормированный подход к тому, что пользователи обрабатывают данные, используя общие данные.

Помимо отдельных предприятий и исследовательских центров, а также на более макроуровне, такие страны, как Германия, [ 50 ] запустили свои собственные официальные общенациональные стратегии открытых данных, подробно описывающие, как следует разрабатывать, использовать и поддерживать системы управления данными и общие данные для общего блага.

Аргументы за и против

[ редактировать ]

Открытие правительственных данных — это лишь отправная точка на пути к улучшению образования, совершенствованию управления и созданию инструментов для решения других реальных проблем. Хотя многие аргументы были высказаны категорически [ нужна ссылка ] Следующее обсуждение аргументов за и против открытых данных показывает, что эти аргументы часто сильно зависят от типа данных и их потенциального использования.

Аргументы, выдвигаемые в пользу открытых данных, включают следующее:

  • «Данные принадлежат человечеству » . Типичными примерами являются геномы , данные об организмах, медицинская наука, данные об окружающей среде согласно Орхусской конвенции .
  • Для финансирования этой работы использовались государственные деньги , поэтому они должны быть общедоступными. [ 51 ]
  • Он был создан государственным учреждением или в нем (это распространено в национальных лабораториях США и правительственных учреждениях).
  • Факты не могут быть защищены авторским правом по закону.
  • Спонсоры исследования не получат полной выгоды, если полученные данные не будут доступны в свободном доступе.
  • Ограничения на повторное использование данных создают антиобщность.
  • Данные необходимы для бесперебойного процесса общественной человеческой деятельности и являются важным фактором социально-экономического развития (здравоохранение, образование, экономическая производительность и т. д.). [ 52 ]
  • В научных исследованиях скорость открытий ускоряется за счет лучшего доступа к данным. [ 53 ]
  • Открытость данных помогает бороться с «гниением данных» и обеспечивает сохранность данных научных исследований с течением времени. [ 54 ] [ 55 ]
  • Статистическая грамотность выигрывает от открытых данных. Преподаватели могут использовать наборы данных, актуальные на местном уровне, для преподавания статистических концепций своим студентам. [ 56 ] [ 57 ]
  • Разрешение открытых данных в научном сообществе имеет важное значение для увеличения скорости открытий и распознавания важных закономерностей. [ 58 ]

Обычно считается, что фактические данные не могут быть защищены авторским правом. [ 59 ] Издатели часто добавляют заявления об авторских правах (часто запрещающие повторное использование) к научным данным, сопровождающим публикации. Может быть неясно, являются ли фактические данные, включенные в полный текст, частью авторского права.

Хотя абстракция человеком фактов из бумажных публикаций обычно считается законной, часто подразумевается ограничение на машинное извлечение роботами.

В отличие от открытого доступа , когда группы издателей выражают свою озабоченность, открытые данные обычно оспариваются отдельными учреждениями. [ нужна ссылка ] Их аргументы меньше обсуждались в публичном дискурсе, и в настоящее время существует меньше цитат, на которые можно положиться.

Аргументы против предоставления всех данных в качестве открытых данных включают следующее:

  • Государственное финансирование не может использоваться для дублирования или противодействия деятельности частного сектора (например, PubChem ).
  • Правительства должны нести ответственность за эффективное использование денег налогоплательщиков: если для агрегирования данных используются государственные средства и если данные принесут коммерческую (частную) выгоду лишь небольшому числу пользователей, пользователи должны возмещать правительствам затраты на предоставление данных.
  • Открытые данные могут привести к использованию и быстрой публикации результатов, основанных на данных, касающихся развивающихся стран, богатыми и хорошо оснащенными исследовательскими институтами без какого-либо дальнейшего участия и/или выгоды для местных сообществ ( вертолетные исследования ); аналогично исторический открытый доступ к тропическим лесам, который привел к незаконному присвоению («глобальному грабежу») генетических ресурсов растений из развивающихся стран. [ 60 ]
  • Доход, полученный от публикации данных, может быть использован для покрытия затрат на создание и/или распространение данных, так что распространение может продолжаться бесконечно.
  • Доход, полученный от публикации данных, позволяет некоммерческим организациям финансировать другую деятельность (например, публикации научного общества поддерживают общество).
  • Правительство придает определенным организациям особую легитимность в возмещении затрат ( NIST в США, Ordnance Survey в Великобритании).
  • Из соображений конфиденциальности может потребоваться, чтобы доступ к данным был ограничен конкретными пользователями или подмножествами данных. [ 61 ]
  • Сбор, «очистка», управление и распространение данных обычно являются трудоемкими и/или дорогостоящими процессами – тот, кто предоставляет эти услуги, должен получать справедливое вознаграждение за предоставление этих услуг.
  • Спонсоры не получат полной выгоды, если их данные не будут использоваться надлежащим образом – иногда это требует усилий по управлению качеством, распространению и брендингу, которых лучше всего можно достичь, взимая плату с пользователей.
  • Часто целевые конечные пользователи не могут использовать данные без дополнительной обработки (анализ, приложения и т. д.) – если кто-то имеет доступ к данным, ни у кого не может быть стимула инвестировать в обработку, необходимую для того, чтобы сделать данные полезными (типичные примеры включают биологические, медицинские и экологические данные).
  • Отсутствует контроль вторичного использования (агрегирования) открытых данных. [ 62 ]

Доклад под названием «Оптимизация локализации мягкой мобильности с помощью устойчивой политики и открытых данных». [ 63 ] утверждает, что открытые данные являются ценным инструментом для повышения устойчивости и справедливости мягкой мобильности в городах. Автор утверждает, что открытые данные можно использовать для выявления потребностей различных районов города, разработки справедливых и равноправных алгоритмов и обоснования установки ресурсов мягкой мобильности.

Связь с другой открытой деятельностью

[ редактировать ]

Цели движения «Открытые данные» аналогичны целям других «открытых» движений.

  • Открытый доступ предполагает свободный доступ к научным публикациям в Интернете. В некоторых случаях эти статьи также включают наборы открытых данных.
  • Открытые спецификации — это документы, описывающие типы файлов или протоколы, где документы лицензируются открыто. Эти спецификации в первую очередь предназначены для улучшения различного программного обеспечения, обрабатывающего одни и те же типы файлов или протоколы, но монополисты, вынужденные по закону предоставлять открытые спецификации, могут усложнить задачу.
  • Открытый контент предполагает предоставление свободного доступа к ресурсам, предназначенным для человеческой аудитории (таким как проза, фотографии или видео).
  • Открытые знания . Open Knowledge International выступает за открытость по ряду вопросов, включая, помимо прочего, вопросы открытых данных. Он охватывает (а) научный, исторический, географический или иной контент (б) контент, такой как музыка, фильмы, книги (в) правительственную и другую административную информацию. Открытые данные включены в определение открытых знаний, на которое ссылается протокол Science Commons для реализации данных открытого доступа. [ 64 ]
  • Наука открытых блокнотов означает применение концепции открытых данных к как можно большей части научного процесса, включая неудачные эксперименты и необработанные экспериментальные данные. [ нужна ссылка ]
  • Программное обеспечение с открытым исходным кодом связано с лицензиями с открытым исходным кодом , по которым могут распространяться компьютерные программы, и обычно не касается в первую очередь данных.
  • Открытые образовательные ресурсы — это свободно доступные, открыто лицензируемые документы и средства массовой информации, которые полезны для преподавания, обучения и оценки, а также для исследовательских целей.
  • Открытые исследования / открытая наука / открытые научные данные (связанная открытая наука) означает подход к открытию и взаимосвязи научных активов, таких как данные, методы и инструменты, с технологиями связанных данных, чтобы обеспечить прозрачные, воспроизводимые и междисциплинарные исследования. [ 65 ]
  • Open-GLAM (галереи, библиотеки, архивы и музеи) [ 66 ] — это инициатива и сеть, поддерживающая обмен и сотрудничество между культурными учреждениями, которые поддерживают открытый доступ к своим цифровым коллекциям. Инициатива GLAM-Wiki помогает учреждениям культуры делиться своими открытыми лицензированными ресурсами со всем миром посредством совместных проектов с опытными редакторами Википедии . Открытые данные наследия связаны с Open GLAM, поскольку открыто лицензируемые данные в секторе наследия теперь часто используются в исследованиях, публикациях и программах. [ 67 ] особенно в области цифровых гуманитарных наук .

Открытые данные как достояние

[ редактировать ]

Идеи и определения

[ редактировать ]

Формально и определение открытых данных, и достояния вращаются вокруг концепции общих ресурсов с низким барьером доступа. По сути, цифровое достояние включает в себя открытые данные, поскольку они включают в себя ресурсы, поддерживаемые онлайн, такие как данные. [ 68 ] В целом, глядя на принципы работы открытых данных, можно увидеть на практике совпадение между открытыми данными и (цифровым) достоянием. Принципы открытых данных иногда различаются в зависимости от типа проверяемых данных. [ 69 ] Тем не менее, они в некоторой степени дублируют друг друга, и их ключевым обоснованием является отсутствие препятствий для повторного использования данных (наборов данных). [ 69 ] Независимо от своего происхождения, принципы различных типов открытых данных намекают на ключевые элементы определения общего достояния. Это, например, доступность, повторное использование, возможность обнаружения, непатентованность. [ 69 ] Кроме того, хотя и в меньшей степени, угрозы и возможности, связанные как с открытыми данными, так и с общим достоянием, схожи. Обобщая, они вращаются вокруг (рисков и) выгод, связанных с (неконтролируемым) использованием общих ресурсов большим количеством субъектов.

Как общие ресурсы, так и открытые данные могут быть определены характеристиками ресурсов, подпадающих под эти концепции, но их можно определить и характеристиками систем, которые продвигают их сторонники. Управление находится в центре внимания как исследователей открытых данных, так и исследователей общественного мнения. [ 69 ] [ 68 ] Ключевыми элементами, определяющими общие черты и особенности открытых данных, являются различия (а, возможно, и противостояние) доминирующей рыночной логике, сформированной капитализмом. [ 68 ] Возможно, именно эта особенность проявляется в недавнем всплеске концепции общего достояния, связанной с более социальным взглядом на цифровые технологии в конкретных формах цифровых и, особенно, общих данных.

Реальный случай

[ редактировать ]

Применение открытых данных на благо общества было продемонстрировано в академических исследованиях. [ 70 ] В документе «Оптимизация локализации мягкой мобильности с помощью устойчивой политики и открытых данных» открытые данные используются двумя способами. Во-первых, он использует открытые данные для выявления потребностей различных районов города. Например, он может использовать данные о плотности населения, пробках на дорогах и качестве воздуха, чтобы определить, где больше всего необходимы ресурсы мягкой мобильности, такие как стоянки для велосипедов и зарядные станции для электромобилей. Во-вторых, он использует открытые данные для разработки справедливых и равноправных алгоритмов. Например, он может использовать данные о демографии города, чтобы гарантировать, что ресурсы мягкой мобильности распределяются таким образом, чтобы это было доступно каждому, независимо от возраста, инвалидности или пола. В статье также обсуждаются проблемы использования открытых данных для оптимизации мягкой мобильности. Одна из проблем заключается в том, что открытые данные часто являются неполными или неточными. Другая проблема заключается в том, что может быть сложно интегрировать открытые данные из разных источников. Несмотря на эти проблемы, в документе утверждается, что открытые данные являются ценным инструментом для повышения устойчивости и справедливости мягкой мобильности в городах.

Примером того, как отношения между открытыми данными и общественным достоянием и как их управление может потенциально разрушить рыночную логику, в противном случае доминирующую в больших данных, является проект, реализованный Human Ecosystem Relazioni в Болонье (Италия). См.: https://www.he-r.it/wp-content/uploads/2017/01/HUB-report-impaginato_v1_small.pdf .

Этот проект был направлен на экстраполяцию и выявление социальных отношений в Интернете, связанных с «сотрудничеством» в Болонье. Данные были собраны из социальных сетей и онлайн-платформ для взаимодействия граждан. В конечном итоге данные были проанализированы на предмет содержания, значения, местоположения, временных рамок и других переменных. В целом социальные отношения в Интернете для сотрудничества были проанализированы на основе сетевой теории. Полученный набор данных был доступен в Интернете как открытые данные (агрегированные и анонимизированные); тем не менее, люди могут вернуть все свои данные. Это было сделано с целью сделать данные достоянием общественности. Этот проект иллюстрирует взаимосвязь между открытыми данными и общественным достоянием, а также то, как они могут нарушить рыночную логику, стимулирующую использование больших данных, двумя способами. Во-первых, он показывает, как такие проекты, следуя принципам открытых данных, могут в некоторой степени стимулировать создание эффективных общих данных. Сам проект предлагал различные виды поддержки пользователям платформы социальных сетей в удалении контента. Во-вторых, открытие данных об онлайн-взаимодействиях в социальных сетях может значительно снизить монопольную власть платформ социальных сетей над этими данными.

Мандаты спонсоров

[ редактировать ]

Несколько финансирующих органов, которые требуют открытого доступа, требуют открытых данных. Хорошее выражение требований (местами урезанное) дает Канадский институт медицинских исследований (CIHR): [ 71 ]

  • незамедлительно после публикации результатов исследований внести биоинформатические, атомные и молекулярные координатные данные, экспериментальные данные в соответствующую общедоступную базу данных.
  • сохранять исходные наборы данных в течение как минимум пяти лет после выдачи гранта. Это относится ко всем данным, независимо от того, опубликованы они или нет.

Другие организации, активно содействующие размещению данных, а также полного текста, включают Wellcome Trust . В научной статье, опубликованной в 2013 году, утверждалось, что Horizon 2020 (механизм финансирования науки ЕС) должен обязать финансируемые проекты сдавать свои базы данных в качестве «результатов» в конце проекта, чтобы затем их можно было проверить на предмет удобства использования третьей стороной. поделился. [ 72 ]

См. также

[ редактировать ]
  1. ^ «Что открыто?» . okfn.org . Проверено 22 марта 2022 г.
  2. ^ «Открытое определение 2.1 – Открытое определение – Определение открытого в открытых данных, открытом контенте и открытых знаниях» . opendefinition.org . Проверено 22 марта 2022 г.
  3. ^ Ауэр, СР; Бизер, К.; Кобиларов Г.; Леманн, Дж.; Цыганиак, Р.; Айвз, З. (2007). «DBpedia: ядро ​​сети открытых данных». Семантическая сеть . Конспекты лекций по информатике. Том. 4825. стр. 722–735. дои : 10.1007/978-3-540-76298-0_52 . ISBN  978-3-540-76297-3 . S2CID   7278297 .
  4. ^ Китчин, Роб (2014). Революция данных . Лондон: Сейдж. п. 49. ИСБН  978-1-4462-8748-4 .
  5. ^ Кассен, Максат (1 октября 2013 г.). «Многообещающий феномен открытых данных: пример Чикагского проекта открытых данных». Правительственная информация Ежеквартально . 30 (4): 508–513. дои : 10.1016/j.giq.2013.05.012 . ISSN   0740-624X .
  6. ^ См . домашнюю страницу открытого определения и полную версию открытого определения.
  7. ^ «Что такое «открытые данные» и почему нас это должно волновать? – ODI» . 3 ноября 2017 года . Проверено 1 сентября 2021 г.
  8. ^ Комитет по научным достижениям наблюдений Земли из космоса, Национальный исследовательский совет (2008 г.). Наблюдения Земли из космоса: первые 50 лет научных достижений . Пресса национальных академий. п. 6. дои : 10.17226/11991 . ISBN  978-0-309-11095-2 . Проверено 24 ноября 2010 г.
  9. ^ Мировая система данных (27 сентября 2017 г.). «Принципы обмена данными» . www.icsu-wds.org . ICSU-WDS (Международный совет по науке – Всемирная служба данных) . Проверено 27 сентября 2017 г.
  10. ^ Выонг, Куан-Хоанг (12 декабря 2017 г.). «Открытые данные, открытый обзор и открытый диалог сделают социальные науки правдоподобными» . Природа: Обновления научных данных . arXiv : 1712.04801 . Бибкод : 2017arXiv171204801V . Проверено 30 июня 2018 г.
  11. ^ Проект «Геном человека», 1996. Краткое изложение принципов, согласованных на Первом Интернационале. Стратегическое совещание по секвенированию генома человека (Бермудские острова, 25–28 февраля 1996 г.)
  12. ^ Перкманн, Маркус; Шильдт, Анри (2015). «Партнерство в области открытых данных между фирмами и университетами: роль пограничных организаций» . Исследовательская политика . 44 (5): 1133–1143. дои : 10.1016/j.respol.2014.12.006 . hdl : 10044/1/19450 .
  13. ^ Декларация ОЭСР об открытом доступе к данным, финансируемым государством. Архивировано 20 апреля 2010 г. на Wayback Machine.
  14. ^ Пилат, Д.; Фукасаку (29 июня 2007 г.). «Принципы и рекомендации ОЭСР по доступу к исследовательским данным, полученным из государственного финансирования» . Журнал науки о данных . 6 :4–11. дои : 10.2481/dsj.6.OD4 . Проверено 31 января 2024 г.
  15. ^ «Сетевой проект Dataverse» . Архивировано из оригинала 9 октября 2014 года . Проверено 10 октября 2014 г.
  16. ^ "Данные" . Связанная наука . 17 октября 2012 года. Архивировано из оригинала 17 октября 2012 года . Проверено 1 сентября 2021 г.
  17. ^ Кауппинен, Томи; де Эспиндола, Джованна Мира (2011). Связанная открытая наука: передача, обмен и оценка данных, методов и результатов для исполняемых статей (PDF) . Международная конференция по вычислительной науке, ICCS 2011. Том. 4. Процесс информатики.
  18. ^ "Дом" . Наборы данных о дикой природе, наборы данных о популяциях животных и природоохранные исследовательские проекты, исследования — Systema Naturae . Проверено 1 сентября 2021 г.
  19. ^ Грей, Джонатан (3 сентября 2014 г.). К генеалогии открытых данных . Генеральная конференция Европейского консорциума политических исследований в Глазго. дои : 10.2139/ssrn.2605828 . ОГРН   2605828 – через ОГРН.
  20. ^ Брито, Джерри (21 октября 2007 г.). «Hack, Mash и Peer: краудсорсинг прозрачности правительства». Обзор законодательства Колумбийского университета в области науки и технологий . 9 :119. дои : 10.2139/SSRN.1023485 . S2CID   109457712 . ССНН   1023485 .
  21. ^ Ю, Харлан; Робинсон, Дэвид Г. (28 февраля 2012 г.). «Новая двусмысленность «открытого правительства» ». Дискурс по обзору права Калифорнийского университета в Лос-Анджелесе . 59 . дои : 10.2139/ssrn.2012489 . SSRN   2012489 – через Сеть социальных исследований.
  22. ^ Робинсон, Дэвид Г.; Ю, Харлан; Зеллер, Уильям П.; Фельтен, Эдвард В. (1 января 2009 г.). «Правительственные данные и невидимая рука». Йельский журнал права и технологий . 11 . Рочестер, Нью-Йорк. SSRN   1138083 – через Сеть социальных исследований.
  23. ^ uclaw (8 августа 2012 г.). «Новая двусмысленность «Открытого правительства» » . Обзор права Калифорнийского университета в Лос-Анджелесе . Проверено 12 марта 2022 г.
  24. ^ Линдстедт, Катарина; Наурин, Дэниел (июнь 2010 г.). «Прозрачности недостаточно: сделать прозрачность эффективной для снижения коррупции» . Международный обзор политической науки . 31 (3): 301–322. дои : 10.1177/0192512110377602 . ISSN   0192-5121 . S2CID   154948461 .
  25. ^ uclaw (2 мая 2013 г.). «Неопределенная связь между открытыми данными и подотчетностью: ответ на книгу Ю и Робинсона «Новая двусмысленность «открытого правительства» » . Обзор права Калифорнийского университета в Лос-Анджелесе . Проверено 12 марта 2022 г.
  26. ^ «Экономическое воздействие открытых данных: возможности создания стоимости в Европе» . data.europa.eu . Проверено 12 марта 2022 г.
  27. ^ «Калифорнийский портал открытых данных» . data.ca.gov . Проверено 7 мая 2019 г.
  28. ^ Данные, город Нью-Йорк, NYC Open. «Открытые данные Нью-Йорка» . Открытые данные Нью-Йорка . Проверено 7 мая 2019 г. {{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  29. ^ «ЮНдата» . data.un.org . Проверено 7 мая 2019 г.
  30. ^ «Открытые данные Всемирного банка | Данные» . data.worldbank.org . Проверено 7 мая 2019 г.
  31. ^ «Данные.europa.eu» . Проверено 7 мая 2019 г.
  32. ^ «Главная | Портал открытых данных» . data.europa.eu . Проверено 7 мая 2019 г.
  33. ^ «Цикл управления открытыми данными» (на итальянском языке).
  34. ^ «Руководство для региональной экосистемы открытых данных Венето (Открытые данные)» (на итальянском языке).
  35. ^ «Операционная модель открытых данных (MOOD) Умбрия» (на итальянском языке).
  36. ^ «Программные рекомендации мегаполиса Генуя» (PDF) (на итальянском языке).
  37. ^ «Хартия открытых данных: дорожная карта использования глобального ресурса» . Хаффингтон Пост . 27 октября 2015 г. Проверено 29 октября 2015 г.
  38. ^ ОЭСР (4 июля 2024 г.). «Данные, публикации и анализ ОЭСР становятся свободными — Пресс-релиз» . Организация экономического сотрудничества и развития (ОЭСР) . Париж, Франция . Проверено 10 июля 2024 г.
  39. ^ Грин, Артур К. (17 сентября 2019 г.). «OpenNWT объявляет о запуске нового информационного веб-сайта о выборах» . Мой Йеллоунайф сейчас .
  40. ^ Оюэла, Андреа; Уолмсли, Тея; Уолла, Кэтрин (30 декабря 2019 г.). «120 организаций, создающих новое десятилетие продуктов питания» . Пищевой резервуар . Проверено 21 января 2020 г.
  41. ^ "dblp: Как мне загрузить весь набор данных dblp?" . dblp.uni-trier.de . Дагштуль . Проверено 21 января 2020 г.
  42. ^ Виктор, Патрисия; Корнелис, Крис; Де Кок, Мартина; Эррера-Вьедма, Энрике (2010). «Операторы агрегации на основе Bilattice для постепенного доверия и недоверия» . Серия мировых научных трудов по вычислительной технике и информатике . World Scientific: 505–510. дои : 10.1142/9789814324700_0075 . ISBN  978-981-4324-69-4 . S2CID   5748283 .
  43. ^ Дандекар, Пранав. Анализ и генеративная модель для доверительных сетей (PDF) . Стэнфордский проект сетевого анализа (отчет). Стэнфордский университет.
  44. ^ Овергур, Ян; Вулчин, Эллери; Поттс, Кристофер (20 мая 2012 г.). «Распространение доверия с помощью моделей со смешанными эффектами» . Шестая международная конференция AAAI по блогам и социальным сетям .
  45. ^ Лаутербах, Дебра; Труонг, Хунг; Шах, Танудж; Адамич, Лада (август 2009 г.). «Серфинг в сети доверия: репутация и взаимность на CouchSurfing.com». 2009 Международная конференция по вычислительной науке и инженерии . Том. 4. С. 346–353. дои : 10.1109/CSE.2009.345 . ISBN  978-1-4244-5334-4 . S2CID   12869279 .
  46. ^ Тагиев, Рустам; Игнатов Дмитрий. Я; Делибабу, Радхакришнан (2015). «Услуги обмена гостеприимством как источник пространственных и социальных данных?». Семинар Международной конференции IEEE по интеллектуальному анализу данных (ICDMW) , 2015 г. ИИЭЭ . стр. 1125–1130. дои : 10.1109/ICDMW.2015.239 . ISBN  978-1-4673-8493-3 . S2CID   8196598 .
  47. ^ Перейти обратно: а б Национальный научный фонд (сентябрь 2005 г.). «Долгоживущие коллекции цифровых данных: возможности исследований и образования в 21 веке» (PDF) . Национальный научный фонд. п. 23 . Проверено 4 января 2022 г.
  48. ^ Перейти обратно: а б с Гроссман, Роберт Л.; Хит, Эллисон; Мерфи, Марк; Паттерсон, Мария; Уэллс, Уолт (2016). «Аргументы в пользу Data Commons: к науке о данных как услуге» . Вычисления в науке и технике . 18 (5): 10–20. arXiv : 1604.02608 . Бибкод : 2016CSE....18e..10G . дои : 10.1109/MCSE.2016.92 . ISSN   1521-9615 . ПМК   5636009 . ПМИД   29033693 .
  49. ^ Перейти обратно: а б Гроссман, Р.Л. (23 апреля 2019 г.). «Как Data Commons может поддержать открытую науку» . SageBionetworks . Проверено 4 января 2022 г.
  50. ^ ИМТ (7 июля 2021 г.). Стратегия открытых данных федерального правительства Германии — BMI21030 [ Стратегия открытых данных федерального правительства Германии — BMI21030 ] (PDF) (на немецком языке). Берлин, Германия: Федеральное министерство внутренних дел, строительства и общества (BMI) . Проверено 26 июля 2021 г.
  51. ^ «На пути к открытым данным, Ян Маноча» . Архивировано из оригинала 29 марта 2012 года . Проверено 12 августа 2011 г.
  52. ^ «Большие данные для развития: от информации к обществам знаний» , Мартин Хилберт (2013), Научная статья SSRN № ID 2205145. Рочестер, Нью-Йорк: Сеть исследований социальных наук; https://ssrn.com/abstract=2205145
  53. ^ Как воплотить мечту в реальность [ постоянная мертвая ссылка ] утверждает, что в одной области исследований (астрономия) доступ к открытым данным увеличивает скорость научных открытий.
  54. ^ Ходияр, Варша (19 мая 2014 г.). «Остановить гниение: обеспечить постоянный доступ к научным данным независимо от возраста» . F1000 Исследования . Ф1000 . Проверено 11 марта 2015 г.
  55. ^ Маги А.Ф., Мэй М.Р., Мур Б.Р. (24 октября 2014 г.). «Рассвет открытого доступа к филогенетическим данным» . ПЛОС ОДИН . 9 (10): е110268. arXiv : 1405.6623 . Бибкод : 2014PLoSO...9k0268M . дои : 10.1371/journal.pone.0110268 . ПМК   4208793 . ПМИД   25343725 .
  56. ^ Ривера, Роберто; Марацци, Марио; Торрес, Педро (19 июня 2019 г.). «Включение открытых данных во вводные курсы по статистике» . Журнал статистического образования . 27 (3). Тейлор и Фрэнсис: 198–207. arXiv : 1906.03762 . дои : 10.1080/10691898.2019.1669506 . S2CID   182952595 . Проверено 7 мая 2020 г.
  57. ^ Ривера, Роберто (5 февраля 2020 г.). Принципы управленческой статистики и науки о данных . Уайли. ISBN  978-1119486411 .
  58. ^ Гевин, В. (2016). «Обмен данными: непредвзятость в отношении открытых данных» . Природа . стр. 117–119. дои : 10.1038/NJ7584-117A . Проверено 31 января 2024 г.
  59. ^ На пути к Science Commons. Архивировано 14 июля 2014 г. в Wayback Machine. Включает обзор основ открытости научных данных.
  60. ^ Лоу, А. (2001). Третья революция: генетические ресурсы растений в развивающихся странах и Китае: глобальная деревня или глобальное грабеж? . Ежегодник международного торгового и делового права, том VI. ISBN  9781843140870 . Проверено 31 января 2024 г.
  61. ^ Зейдервейк, Аннеке; Янссен, Марин (18 июня 2014 г.). «Негативные последствия открытых правительственных данных – исследование темной стороны открытых данных» . Материалы 15-й ежегодной международной конференции по исследованиям цифрового правительства . дг.о '14. Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 147–152. дои : 10.1145/2612733.2612761 . ISBN  978-1-4503-2901-9 . S2CID   14440894 .
  62. ^ Шариф, Наубахар; Риттер, Вальтраут; Дэвидсон, Роберт Л.; Эдмундс, Скотт С. (31 декабря 2018 г.). «Состояние открытой науки для Гонконга: предоставление открытых исследовательских данных для поддержки инновационной политики Гонконга» . Журнал современной Восточной Азии . 17 (2): 200–221. дои : 10.17477/JCEA.2018.17.2.200 .
  63. ^ Клейсарчаки, София; Гюрген, Левент; Митике Касса, Йонас; Кристек, Марцин; Гонсалес Видаль, Даниэль (12 июня 2022 г.). «Оптимизация локализации мягкой мобильности с помощью устойчивой политики и открытых данных» . 2022 18-я Международная конференция по интеллектуальной среде (IE) . стр. 1–8. дои : 10.1109/IE54923.2022.9826779 . ISBN  978-1-6654-6934-0 . S2CID   250595935 .
  64. ^ «Протокол реализации данных открытого доступа» . Архивировано из оригинала 30 января 2017 года . Проверено 17 апреля 2009 г.
  65. ^ Кауппинен, Т.; Эспиндола, GMD (2011). «Связанное открытое научное общение, обмен и оценка данных, методов и результатов для исполняемых статей» . Procedia Информатика . 4 : 726–731. дои : 10.1016/j.procs.2011.04.076 .
  66. ^ «Открытый ГЛАМ» . Викимедиа Мета-Вики .
  67. ^ Генриетта Руэ (2020). Открытые данные о наследии: введение в исследования, публикации и программы с использованием открытых данных в секторе наследия . Издательство Фасет. ISBN  978-1-78330-360-1 . ОЛ   29397859М . Викиданные   Q111293389 .
  68. ^ Перейти обратно: а б с Дюлон де Росне, Мелани; Сталдер, Феликс (17 декабря 2020 г.). «Цифровое достояние» . Обзор интернет-политики . 9 (4). дои : 10.14763/2020.4.1530 . ISSN   2197-6775 . S2CID   240800967 .
  69. ^ Перейти обратно: а б с д ван Лоенен, Бастиан; Ванкаувенберге, Гленн; Кромпвоэтс, Джоп; Далла Корте, Лоренцо (2018). OpenDataExpose . Серия «Информационные технологии и право». Том. 30. ТМК Ассер Пресс. стр. 1–10. дои : 10.1007/978-94-6265-261-3_1 . эИССН   2215-1966 . ISBN  978-94-6265-260-6 . ISSN   1570-2782 .
  70. ^ Клейсарчаки, София; Гюрген, Левент; Митике Касса, Йонас; Кристек, Марцин; Гонсалес Видаль, Даниэль (1 июня 2022 г.). «Оптимизация локализации мягкой мобильности с помощью устойчивой политики и открытых данных» . 2022 18-я Международная конференция по интеллектуальной среде (IE) . стр. 1–8. дои : 10.1109/IE54923.2022.9826779 . ISBN  978-1-6654-6934-0 . S2CID   250595935 .
  71. ^ « [электронная почта защищена] Архив списка рассылки» . Архивировано из оригинала 16 июля 2011 года . Проверено 2 ноября 2006 г.
  72. ^ Голсуорси, М.; Макки, М. (2013). «Голсуорси, М.Дж. и Макки, М. (2013). Европейская программа финансирования науки «Горизонт 2020»: как она развивается? Журнал исследований и политики в области здравоохранения. doi: 10.1177/1355819613476017» . Журнал исследований и политики в области здравоохранения . 18 (3): 182–185. дои : 10.1177/1355819613476017 . ПМК   4107840 . ПМИД   23595575 . Архивировано из оригинала 23 апреля 2013 года . Проверено 24 апреля 2013 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0abe5c76c3480d71bdc140fe7d9ce773__1722777960
URL1:https://arc.ask3.ru/arc/aa/0a/73/0abe5c76c3480d71bdc140fe7d9ce773.html
Заголовок, (Title) документа по адресу, URL1:
Open data - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)