План управления данными
План управления данными или DMP — это формальный документ, в котором описывается, как данными следует обращаться с как во время исследовательского проекта, так и после его завершения. [1] Цель плана управления данными — рассмотреть многие аспекты управления данными , создания метаданных , данных сохранения и анализа до начала проекта; [2] это может привести к тому, что данные будут хорошо управляться в настоящее время, [ нужна ссылка ] и подготовлены к сохранению в будущем. [2]
Первоначально DMP использовались в 1966 году для управления сбором и анализом данных в авиационных и инженерных проектах , а в 1970-х и 1980-х годах распространились на инженерные и научные дисциплины. Вплоть до начала 2000-х годов DMP использовались «для проектов большой технической сложности, а также для ограниченного сбора и обработки данных в середине исследования». [3] В 2000-е годы и позднее электронные исследования и экономическая политика способствовали развитию и внедрению DMP. [3]
Важность
[ редактировать ]Утверждается, что подготовка плана управления данными до их сбора гарантирует, что данные находятся в правильном формате, хорошо организованы и лучше аннотированы. [4] Возможно, это может сэкономить время в долгосрочной перспективе, поскольку нет необходимости реорганизовывать, переформатировать или пытаться запомнить детали данных. Утверждается также, что это повысит эффективность исследований, поскольку и сборщик данных, и другие исследователи смогут понимать и использовать хорошо аннотированные данные в будущем. Одним из компонентов плана управления данными является архивирование и сохранение данных. Заранее приняв решение об архиве, сборщик данных может форматировать данные во время сбора, чтобы упростить их последующую отправку в базу данных. Если данные сохраняются, они более актуальны, поскольку могут быть повторно использованы другими исследователями. Это также позволяет сборщику данных направлять запросы данных в базу данных, а не адресовать запросы индивидуально. Частым аргументом в пользу сохранения является то, что сохраняемые данные потенциально могут привести к новым, неожиданным открытиям и предотвращают дублирование уже проведенных научных исследований. Архивирование данных также обеспечивает страховку от потери сборщиком данных.
В 2010-е годы [3] финансирующим агентствам все чаще требуются планы управления данными как часть процесса подачи заявок и оценки, [5] несмотря на малое количество или отсутствие доказательств их эффективности. [3]
Основные компоненты
[ редактировать ]«Не существует общего и четкого списка тем, которые должны быть охвачены в DMP исследовательского проекта», [6] и исследователи часто предоставлены сами себе в вопросе о том, как заполнять DMP. [2]
Информация о данных и формате данных
[ редактировать ]- Описание данных, которые будут получены в рамках проекта. [7] Сюда могут входить (но не ограничиваться) данные, которые:
- Экспериментальный
- наблюдательный
- Сырье или производное
- Физические коллекции
- Модели
- Симуляторы
- Учебные материалы
- Программное обеспечение
- Изображения
- Как будут получены данные? Когда и где они будут приобретены?
- Как будут обрабатываться данные после сбора? Включите информацию о
- Используемое программное обеспечение
- Алгоритмы
- Научные рабочие процессы
- Форматы файлов, которые будут использоваться, обоснуйте эти форматы и опишите используемые соглашения об именах. [8]
- Меры по обеспечению качества и контролю качества, которые будут приняты во время сбора, анализа и обработки проб.
- Если используются существующие данные, каково их происхождение? Как собранные данные будут сочетаться с существующими данными? Какова связь между собранными данными и существующими данными?
- Как будут управляться данные в краткосрочной перспективе? Учтите следующее:
- Контроль версий файлов [9]
- Резервное копирование данных и продуктов данных
- Безопасность и защита данных и продуктов данных
- Кто будет отвечать за управление
Содержание и формат метаданных
[ редактировать ]Метаданные — это контекстные детали, включая любую информацию, важную для использования данных. Сюда могут входить описания временных и пространственных деталей, инструментов, параметров, модулей, файлов и т. д. Метаданные обычно называют «данными о данных». [10] Вопросы, подлежащие рассмотрению, включают:
- Насколько подробными должны быть метаданные, чтобы данные были значимыми?
- Как будут создаваться и/или фиксироваться метаданные? Примеры включают лабораторные ноутбуки , портативные устройства GPS, автоматически сохраняемые файлы на приборах и т. д.
- Какой формат будет использоваться для метаданных? Какие стандарты метаданных обычно используются в соответствующей научной дисциплине? Выбор формата должен быть обоснован.
Политики доступа, совместного использования и повторного использования
[ редактировать ]- Опишите любые обязательства, существующие в отношении обмена собранными данными. Они могут включать обязательства финансирующих агентств, учреждений, других профессиональных организаций, а также юридические требования.
- Включите информацию о том, как данные будут передаваться, в том числе, когда данные будут доступны, как долго данные будут доступны, как можно получить доступ, а также любые права, которые сборщик данных оставляет за собой для использования данных.
- Решите любые этические проблемы или проблемы конфиденциальности при обмене данными.
- Решение интеллектуальной собственности и авторских прав вопросов . Кому принадлежат авторские права? Какова институциональная политика, политика издателей и/или финансирующих агентств в отношении интеллектуальной собственности? Существуют ли эмбарго по политическим, коммерческим или патентным причинам?
- Опишите предполагаемое будущее использование/пользователей данных.
- Укажите, как данные должны цитироваться другими. Как будет решаться проблема постоянного цитирования? Например, если данные будут помещены в общедоступный архив, будет ли набору данных идентификатор цифрового объекта (DOI)? присвоен
Долгосрочное хранение и управление данными
[ редактировать ]- Исследователи должны определить подходящий архив для долгосрочного хранения своих данных. Идентифицировав архив на ранней стадии проекта, данные можно отформатировать, преобразовать и задокументировать соответствующим образом в соответствии с требованиями архива. Исследователи должны проконсультироваться с коллегами и профессиональными сообществами в своей области, чтобы определить наиболее подходящую базу данных, и включить резервный архив в свой план управления данными на случай, если их первый вариант перестанет существовать.
- На раннем этапе проекта основной исследователь должен определить, какие данные будут сохранены в архиве. Обычно желательно сохранять данные в самой необработанной форме, хотя производные данные и продукты также могут быть сохранены.
- Физическое лицо должно быть указано в качестве основного контактного лица для архивированных данных и обеспечивать актуальность контактной информации на случай запросов на данные или информацию о данных.
Бюджет
[ редактировать ]Затраты на управление и сохранение данных могут быть значительными в зависимости от характера проекта. Заранее прогнозируя затраты, исследователи гарантируют, что данные будут правильно управляться и архивироваться. Возможные расходы, которые следует учитывать:
- Время персонала на подготовку, управление, документирование и сохранение данных
- Аппаратное и/или программное обеспечение, необходимое для управления данными, резервного копирования, безопасности, документирования и сохранения.
- Затраты, связанные с отправкой данных в архив
План управления данными должен включать порядок оплаты этих расходов.
План управления данными NSF
[ редактировать ]Все заявки на гранты, подаваемые в Национальный научный фонд (NSF), должны включать План управления данными объемом не более двух страниц. [11] Это дополнение (не часть 15-страничного предложения) и должно описывать, как предложение будет соответствовать политике Руководства по присуждению и администрированию (см. ниже). Оно может включать следующее:
- Типы данных
- Стандарты, которые будут использоваться для формата и содержания данных и метаданных
- Политики доступа и совместного использования
- Политика и положения для повторного использования
- Планы архивирования данных
Политика кратко изложена в Руководстве по премированию и администрированию NSF, раздел 4 (Распространение и обмен результатами исследований): [12]
- Оперативно опубликовать с соответствующим авторством
- Делитесь данными, образцами, физическими коллекциями и вспомогательными материалами с другими в разумные сроки.
- Делитесь программным обеспечением и изобретениями
- Следователи могут сохранять свои законные права на свою интеллектуальную собственность, но им все равно придется предоставлять свои результаты, данные и коллекции другим лицам.
- Политика будет реализовываться через
- Обзор предложения
- Переговоры и условия награждения
- Поддержка/стимулы
План управления данными ESRC
[ редактировать ]Великобритании С 1995 года Совет по экономическим и социальным исследованиям (ESRC) придерживается политики в отношении данных исследований. Текущая политика ESRC в отношении данных исследований гласит, что данные исследований, созданные в результате исследований, финансируемых ESRC, должны быть открыто доступны научному сообществу в максимально возможной степени посредством долгосрочного хранения и высококачественного управления данными. [13]
ESRC требует наличия плана управления данными для всех заявок на получение грантов на исследования, в которых создаются новые данные. Такие планы предназначены для продвижения структурированного подхода к управлению данными на протяжении всего жизненного цикла данных, что приводит к повышению качества данных, готовых к архивированию для совместного использования и повторного использования. Служба данных Великобритании , ведущая служба данных ESRC, предоставляет практические рекомендации по планированию управления исследовательскими данными, подходящие для исследователей социальных наук в Великобритании и во всем мире. [14] [15]
ESRC имеет давнее соглашение с Архивом данных Великобритании , расположенным в Университете Эссекса , в качестве места хранения исследовательских данных, при этом обладатели наград обязаны предоставлять данные, полученные в результате их исследовательских грантов, через Службу данных Великобритании. [16] Архив позволяет повторно использовать данные, сохраняя их и делая их доступными для исследовательских и преподавательских сообществ.
Преимущества
[ редактировать ]В литературе выделяются три основные темы с точки зрения преимуществ DMP: профессиональные выгоды, экономические выгоды и институциональные выгоды. [3] Утверждалось, что DMP могут стать катализатором для исследователей в повышении их грамотности в области данных и методов управления данными, часто при помощи библиотеки. [3]
На практике
[ редактировать ]Однако на практике ПУД часто не достигают заявленных целей. Обзор политики DMP, проведенный в 2012 году спонсорами исследований, показал, что в политике отсутствовали некоторые элементы из Центром цифрового курирования . списка критериев DMP, составленного [17] Исследователи поделились текстом DMP. [18] DMP часто рассматриваются как «административное мероприятие, а не неотъемлемая часть» исследовательского процесса. [19] и было признано, что DMP не гарантируют хорошие методы управления данными . [20] Большинству спонсоров не требуется DMP после присуждения грантов, тем самым лишая заинтересованные стороны мощного инструмента, которым может быть активный DMP. Лучшей практикой было бы «требовать поддержания плана управления данными после выдачи гранта и во время активной фазы исследования». [6] В настоящее время планы обмена данными более важны для спонсоров, чем планы управления данными. [6]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «План управления данными» . Библиотека Университета Вирджинии . Архивировано из оригинала 9 ноября 2012 года.
- ^ Jump up to: а б с Бернетт, Маргарет; Уильямс, Сара; Имкер, Хайди (16 сентября 2016 г.). «От плана к действию: успешная реализация плана управления данными в многопрофильном проекте» . Журнал электронного научного библиотечного дела . 5 (1): e1101. дои : 10.7191/jeslib.2016.1101 .
- ^ Jump up to: а б с д и ж Смейл, Николас; Ансуорт, Кэтрин; Денайер, Гарет; Барр, Дэниел (17 октября 2018 г.). «История, пропаганда и эффективность планов управления данными» . bioRxiv : 443499. doi : 10.1101/443499 . S2CID 91931719 .
- ^ «Зачем управлять своими данными и делиться ими? - Управление данными» . библиотеки.mit.edu .
- ^ «Часто задаваемые вопросы (FAQ) по управлению и обмену данными» . Архивировано из оригинала 11 июля 2017 г. Проверено 6 апреля 2018 г.
- ^ Jump up to: а б с Уильямс, Мэри; Бэгвелл, Жаклин; Нам Зозус, Мередит (июль 2017 г.). «Планы управления данными: недостающая перспектива» . Журнал биомедицинской информатики . 71 : 130–142. дои : 10.1016/j.jbi.2017.05.004 . ПМК 6697079 . ПМИД 28499952 .
- ^ «Элементы плана управления данными» . www.icpsr.umich.edu . Проверено 30 сентября 2015 г.
- ^ «Архивная копия» (PDF) . библиотеки.mit.edu . Архивировано из оригинала (PDF) 4 мая 2018 года . Проверено 12 января 2022 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка ) - ^ Оружие, Раф. «Инструменты для контроля версий исследовательских данных» (PDF) . Университет Антверпена .
- ^ Миченер, В.К. и Дж.В. Брант. 2000. Экологические данные: проектирование, управление и обработка . Блэквелл Сайенс, 180 стр.
- ^ «ГПГ Глава II» . www.nsf.gov .
- ^ «Распространение и обмен результатами исследований – NSF – Национальный научный фонд» . www.nsf.gov .
- ^ Политика ESRC в отношении данных исследований, 2010 г.
- ^ Подготовка данных и управление ими: Руководство Службы данных Великобритании.
- ^ «Управление исследовательскими данными и обмен ими — SAGE Publications Inc» . www.sagepub.com . Архивировано из оригинала 7 апреля 2014 г. Проверено 1 апреля 2014 г.
- ^ «Архив данных Великобритании – КТО МОЖЕТ ДЕПОЗИРОВАТЬ?» . www.data-archive.ac.uk .
- ^ Дитрих, Дайанна; Адамус, Триша; Майнер, Элисон; Стейнхарт, Гейл (2012). «Демистификация требований спонсоров исследований к управлению данными». Проблемы научно-технического библиотечного дела . 70 (70). дои : 10.5062/F44M92G2 .
- ^ Пархэм, Сьюзен Уэллс; Доти, Крис (октябрь 2012 г.). «Анализ контента NSF DMP: что говорят исследователи?». Бюллетень Американского общества информатики и технологий . 39 (1): 37–38. дои : 10.1002/bult.2012.1720390113 . hdl : 1853/44391 .
- ^ Микса, Томаш; Симмс, Стефани; Митчен, Дэниел; Джонс, Сара (28 марта 2019 г.). «Десять принципов машинного планирования управления данными» . PLOS Вычислительная биология . 15 (3): e1006750. Бибкод : 2019PLSCB..15E6750M . дои : 10.1371/journal.pcbi.1006750 . ПМК 6438441 . ПМИД 30921316 . S2CID 85563774 .
- ^ Донелли, Мартин (2012). «Планы и планирование управления данными». В Прайоре, Грэм (ред.). Управление данными исследований . Лондон: Издательство Facet. стр. 83–104. ISBN 9781856048910 .
Дальнейшее чтение
[ редактировать ]Прайор, Грэм (2014). Предоставление услуг по управлению исследовательскими данными . Издательство Фасет. ISBN 9781856049337 .
Внешние ссылки
[ редактировать ]- Мастер управления данными : создание интеллектуальных планов управления данными для FAIR Open Science
- DataONE
- DMPонлайн
- Цифровой Кураторский Центр
- Руководство по подаче грантовых заявок NSF
- Блог LTER: Как написать план управления данными
- Служба данных Великобритании : подготовка и управление данными: руководство и инструменты для исследователей социальных наук
- Plan de Gestión de Datos PaGoDa : Инструментарий DMP Консорциума университетов Мадридского региона и UNED по библиотечному сотрудничеству (Мадроньо, Испания)