~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 288578C030F7FC3C12ACEC7F23488F76__1711517940 ✰
Заголовок документа оригинал.:
✰ Data curation - Wikipedia ✰
Заголовок документа перевод.:
✰ Курирование данных — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Data_curation ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/28/76/288578c030f7fc3c12acec7f23488f76.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/28/76/288578c030f7fc3c12acec7f23488f76__translat.html ✰
Дата и время сохранения документа:
✰ 22.06.2024 02:08:54 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 27 March 2024, at 08:39 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Курирование данных — Википедия Jump to content

Курирование данных

Из Википедии, бесплатной энциклопедии

Курирование данных — это организация и интеграция данных , собранных из различных источников. Он включает в себя аннотирование, публикацию и представление данных таким образом, чтобы ценность данных сохранялась с течением времени, а данные оставались доступными для повторного использования и сохранения. Курирование данных включает в себя «все процессы, необходимые для принципиального и контролируемого создания, обслуживания и управления данными , а также возможность повысить ценность данных». [1] В науке курирование данных может означать процесс извлечения важной информации из научных текстов, таких как исследовательские статьи экспертов, для преобразования в электронный формат, например, запись в биологической базе данных . [2]

В современную эпоху больших данных обработка данных стала более заметной, особенно для программного обеспечения , обрабатывающего большие объемы и сложные системы данных. [3] Этот термин также используется в гуманитарных науках. [4] где увеличение культурных и научных данных в результате цифровых гуманитарных проектов требует опыта и аналитических практик обработки данных. [5] В широком смысле курирование означает ряд действий и процессов, выполняемых для создания, управления, поддержки проверки компонента и . [6] В частности, курирование данных — это попытка определить, какую информацию стоит сохранить и как долго. [7]

История и практика [ править ]

Пользователь поддерживает , а не сама база данных, обычно инициирует обработку данных и метаданные . [8] По данным Высшей школы библиотечного дела и информатики Университета Иллинойса , «курирование данных — это активное и постоянное управление данными на протяжении всего их жизненного цикла, представляющее интерес и полезность для науки, науки и образования; курирование данных позволяет обнаруживать и извлекать данные. , поддерживать качество, повышать ценность и обеспечивать возможность повторного использования с течением времени». [9] Рабочий процесс курирования данных отличается от управления качеством данных , защиты данных , управления жизненным циклом и перемещения данных . [8]

Данные переписи населения доступны в табличной форме на перфокартах с начала 20 века и в электронном виде с 1960-х годов. [10] Веб -сайт Межуниверситетского консорциума политических и социальных исследований (ICPSR) отмечает 1962 год как дату своего первого архива данных опросов. [11]

Подробная информация о библиотеках данных появилась в выпуске журнала Library Trends в Иллинойсе за 1982 год. [12] Историческую справку о движении архивов данных см. в разделе «Потребности в социально-научной информации для числовых данных: эволюция международной инфраструктуры архивов данных». [13] Точный процесс курирования, проводимый в любой организации, зависит от объема данных, количества шума, содержащегося в данных, и того, как ожидаемое будущее использование данных означает их распространение. [3]

Кризис космических данных привел к созданию в 1999 году модели Открытой архивной информационной системы (OAIS) . [14] под руководством Консультативного комитета по системам космических данных (CCSDS) , который был сформирован в 1982 году. [15]

Термин «курирование данных» иногда используется в контексте биологических баз данных , где конкретная биологическая информация сначала получается из ряда исследовательских статей, а затем сохраняется в базе данных определенной категории. Например, информацию об антидепрессантах можно получить из различных источников, и после проверки того, доступны ли они в базе данных или нет, они сохраняются в категории антидепрессивных препаратов базы данных. Предприятия также используют курирование данных в своих операционных и стратегических процессах для обеспечения качества и точности данных. [16] [17]

Проекты и исследования [ править ]

Проект «Пакеты распространения информации» (DIPS) для повторного использования информации (DIPIR) изучает исследовательские данные, полученные и используемые социологами, археологами и зоологами. Целевая аудитория — исследователи, использующие вторичные данные, а также цифровые кураторы, менеджеры цифровых репозиториев, сотрудники центров обработки данных и другие лица, которые собирают, управляют и хранят цифровую информацию. [18]

Банк данных о белках был создан в 1971 году в Брукхейвенской национальной лаборатории и превратился в глобальный проект. [19] База данных трехмерных структурных данных белков и других крупных биологических молекул. PDB содержит более 120 000 структур, все стандартизированы, проверены на основе экспериментальных данных и аннотированы.

FlyBase , основное хранилище генетических и молекулярных данных по семейству насекомых Drosophilaidae , было создано в 1992 году. FlyBase аннотирует весь геном Drosophila melanogaster . [20]

Консорциум лингвистических данных — это хранилище лингвистических данных, созданное в 1992 году. [21]

Sloan Digital Sky Survey начал исследовать ночное небо в 2000 году. [22] Ученый-компьютерщик Джим Грей , работая над архитектурой данных SDSS, отстаивал идею курирования данных в науке. [23]

DataNet — это исследовательская программа Управления киберинфраструктуры Национального научного фонда США, финансирующая проекты по управлению данными в науке. [24] DataONE (Сеть наблюдения за данными для Земли) — это один из проектов, финансируемых через DataNet , который помогает сообществу ученых-экологов сохранять данные и обмениваться ими. [25]

См. также [ править ]

Ссылки [ править ]

  1. ^ Рене Дж. Миллер , «Курирование больших данных» на 20-й Международной конференции по управлению данными (COMAD) 2014 г., Хайдарабад, Индия, 17–19 декабря 2014 г.
  2. ^ Биокреативный глоссарий . Проверено 3 октября 2016 г.
  3. ^ Перейти обратно: а б Фурт, Борко; Армандо Эскаланте (2011). Справочник по вычислениям с интенсивным использованием данных . Springer Science & Business Media. п. 32. ISBN  9781461414155 . Проверено 2 октября 2016 г.
  4. ^ Сабхарвал, Арджун (2015). Цифровое курирование в цифровых гуманитарных науках: сохранение и продвижение архивных и специальных коллекций . Издательство Чандос. п. 60. ИСБН  9780081001783 . Проверено 2 октября 2016 г.
  5. ^ «Введение в курирование гуманитарных данных», Джулия Фландерс и Тревор Муньос http://guide.dhcuration.org/intro/ . Больше недоступно: archive.org
  6. ^ Глоссарий Пилина . Больше недоступно: archive.org
  7. ^ Перейти обратно: а б Боргман, К. (2015). Большие данные, мало данных, нет данных: стипендия в сетевом мире . Кембридж, Массачусетс: MIT Press. стр. 13 . ISBN  978-0-262-02856-1 .
  8. ^ Перейти обратно: а б Чесселл, Мэнди; Найджел Л. Джонс; Джей Лимберн; Дэвид Рэдли; Кевин Шэнк (2015). Проектирование и эксплуатация резервуара данных . Красные книги IBM. стр. 111–113. ISBN  9780837440668 . Проверено 2 октября 2016 г.
  9. ^ Крейгин, Мелисса; Хейдорн, П. Брайан; Палмер, Кэрол Л.; Смит, Линда К. (2007). «Образовательная программа по курированию данных» . Конференция секции науки и технологий ALA . Проверено 7 октября 2013 г.
  10. ^ «Отчет о сохранении цифровой информации (PDI)» (PDF) . 1996 год . Проверено 13 марта 2018 г.
  11. ^ «ИКСПС: История» . www.icpsr.umich.edu . Проверено 15 марта 2018 г.
  12. ^ Хайм, Кэтлин М. (29 ноября 1982 г.). «Тенденции в библиотеках 30 (3) зима 1982 г.: Библиотеки данных для социальных наук» . Тенденции в библиотеках – через www.ideals.illinois.edu.
  13. ^ Кэтлин М. Хайм, «Потребности в социально-научной информации для числовых данных: эволюция международной инфраструктуры архивов данных». в Collection Management 9 (весна 1987 г.): 1-53.
  14. ^ «Эталонная модель OAIS» . 09.12.2015 . Проверено 15 марта 2018 г.
  15. ^ «CCSDS.org — Консультативный комитет по системам космических данных (CCSDS)» . public.ccsds.org . Проверено 14 марта 2018 г.
  16. ^ Э. Карри, А. Фрейтас и С. О'Риайн, «Роль управления данными для предприятий, управляемого сообществом», Архивировано 23 января 2012 г. в Wayback Machine в Linking Enterprise Data, Д. Вуд, под ред. Бостон, Массачусетс: Springer US, 2010, стр. 25–47. ISBN   978-1-4419-7664-2
  17. ^ А. Фрейтас, Э. Карри, «Курирование больших данных», Архивировано 13 сентября 2016 г. в Wayback Machine в «Новых горизонтах для экономики, основанной на данных», Springer (открытый доступ), 2015.
  18. ^ Проект распространения информационных пакетов для повторного использования информации (DIPIR) http://www.oclc.org/research/themes/user-studies/dipir.html
  19. ^ «RCSB PDB: Об архиве PDB и RCSB PDB» . Об Архиве PDB и PDB RCSB . Проверено 15 марта 2018 г.
  20. ^ Граматы, Л.С.; Мэриголд, SJ; дос Сантос, Дж; Урбано, Дж. М.; Антонаццо, Дж; Мэтьюз, BB; Рей, Эй Джей; Табоне, CJ; Кросби, Массачусетс; Эммерт, Д.Б.; Фолс, К; Гудман, Дж.Л.; Ху, Ю; Понтинг, Л; Шредер, AJ; Стрелец В.Б.; Термонд, Дж; Чжоу, П; Консорциум FlyBase (2017). «lyBase в 25 лет: взгляд в будущее» . Нуклеиновые кислоты Рез . 45 (Д1): Д663–Д671. дои : 10.1093/nar/gkw1016 . ПМК   5210523 . ПМИД   27799470 .
  21. ^ «О ЛДС» . Консорциум лингвистических данных . Проверено 15 марта 2018 г.
  22. ^ «Слоановский цифровой обзор неба» . СДСС . Проверено 15 марта 2018 г.
  23. ^ Палмер, Кэрол Л.; Вебер, Николас М.; Муньос, Тревор; Ренер, Аллен Х. (июнь 2013 г.). «Основы курирования данных: педагогика и практика «целенаправленной работы» с исследовательскими данными». Архив журнала . 3 . hdl : 2142/78099 .
  24. ^ «Резюме программы партнеров по устойчивому сохранению цифровых данных и доступу к сети (DataNet)» . Национальный научный фонд. 28 сентября 2007 года . Проверено 15 марта 2018 г.
  25. ^ «Что такое DataONE?» . Что такое DataONE? . Архивировано из оригинала 26 апреля 2019 года . Проверено 15 марта 2018 г.

Внешние ссылки [ править ]

  • Курирование экологических и экологических данных: DataONE
  • Инструменты и услуги управления данными, охватывающие несколько научных дисциплин: DataConservancy
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 288578C030F7FC3C12ACEC7F23488F76__1711517940
URL1:https://en.wikipedia.org/wiki/Data_curation
Заголовок, (Title) документа по адресу, URL1:
Data curation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)