Jump to content

Сохранение данных

Сохранение данных это процесс сохранения и поддержания безопасности и целостности данных . Сохранение осуществляется посредством формальных действий, которые регулируются политикой, правилами и стратегиями, направленными на защиту и продление существования и аутентичности данных и их метаданных . [1] Данные можно описать как элементы или единицы, в которых создаются знания и информация. [2] а метаданные представляют собой суммирующие подмножества элементов данных; или данные о данных. [3] Основная цель сохранения данных — защитить данные от потери или уничтожения, а также способствовать их повторному использованию и развитию.

История [ править ]

Большинство исторических данных, собранных с течением времени, были утеряны или уничтожены. Причиной этого стали войны и стихийные бедствия в сочетании с нехваткой материалов и необходимых методов сохранения и защиты данных. Обычно сохранялись только самые важные наборы данных, такие как правительственные записи и статистика, юридические контракты и экономические операции. Данные научных исследований и докторских диссертаций в основном были уничтожены из-за неправильного хранения и недостаточной осведомленности о сохранении и исполнении данных. [4] Со временем сохранение данных изменилось и приобрело важность и осведомленность. Теперь у нас есть много разных способов сохранения данных и множество различных важных организаций, участвующих в этом.

Первые решения для хранения цифровых данных появились в 1950-х годах и обычно были плоскими или иерархически структурированными. [5] Хотя с этими решениями все еще оставались проблемы, они сделали хранение данных намного дешевле и более доступным. В 1970-е годы появились реляционные базы данных и электронные таблицы. Реляционные базы данных структурируют данные в таблицы с использованием структурированных языков запросов , что делает их более эффективными, чем предыдущие решения для хранения, а электронные таблицы содержат большие объемы числовых данных, которые можно применять к этим реляционным базам данных для создания производных данных. Совсем недавно нереляционные базы данных ( неструктурированный язык запросов ) появились в качестве дополнения к реляционным базам данных, которые содержат большие объемы неструктурированных или полуструктурированных данных . [4]

Важность [ править ]

Объем сохранения данных огромен. Все, от правительственных документов до деловых документов и произведений искусства, по сути, может быть представлено в виде данных и может быть потеряно. Это приводит к потере человеческой истории навечно.

Данные могут быть потеряны в небольшом или независимом масштабе, будь то потеря личных данных или потеря данных внутри предприятий и организаций, а также в более широком, национальном или глобальном масштабе, что может негативно и потенциально навсегда повлиять на такие вещи, как защита окружающей среды, медицинские исследования. , национальная безопасность, общественное здравоохранение и безопасность, экономическое развитие [6] и культура. Механизмы потери данных столь же многочисленны, сколь и разнообразны: от стихийных бедствий, войн, утечек данных, халатности до простого забывания и естественного распада.

Способы использования коллекций данных при их правильном сохранении и хранении можно увидеть в Геологической службе США , которая хранит коллекции данных о стихийных бедствиях, природных ресурсах и ландшафтах. Данные, собранные в ходе исследования, используются федеральными и государственными агентствами по землеустройству для планирования и управления землепользованием, и им постоянно необходим доступ к историческим справочным данным. [6]

Связанные понятия [ править ]

Напротив, хранилища данных представляют собой коллекции собранных данных, которые хранятся неформально и не обязательно подготовлены для долгосрочного хранения. Например, сбор или резервное копирование личных файлов. Хранилища данных обычно представляют собой методы хранения, которые использовались в прошлом, когда данные были потеряны из-за экологических и других исторических катастроф. [4]

Кроме того, сохранение данных отличается от сохранения данных в том смысле, что по определению сохранение объекта (данных) означает владение или сохранение владения или использования объекта. [7] Сохранить объект — значит защитить, поддерживать и сохранять его для будущего использования. [8] Политики хранения часто касаются случаев, когда данные также должны быть намеренно удалены и скрыты от публичного доступа, в то время как сохранение отдает приоритет постоянству и более широкому доступу.

Таким образом, сохранение данных выходит за рамки концепции наличия или владения данными или резервными копиями данных. Сохранение данных обеспечивает надежный доступ к данным за счет включения механизмов резервного копирования и восстановления, которые предшествуют наступлению катастрофы или технологического изменения. [9]

Методы [ править ]

Цифровой [ править ]

Цифровое сохранение похоже на сохранение данных, но в основном касается технологических угроз и исключительно цифровых данных. По сути, цифровые данные — это набор формальных действий, обеспечивающих постоянное или постоянное использование и доступ к цифровым данным, исключая возникновение технологических сбоев или изменений. [10] Цифровое сохранение осознает неизбежные изменения в технологиях и протоколах и готовится к тому, что данные должны быть доступны через новые типы технологий и платформ, сохраняя при этом целостность сохраняемых данных и метаданных. [4]

Технологии, хотя и обеспечивают отличный процесс сохранения данных, который, возможно, был невозможен в прошлом, также меняются такими быстрыми темпами, что цифровые данные могут стать недоступными из-за несовместимости формата с новым программным обеспечением. Без использования средств сохранения данных большая часть существующих цифровых данных окажется под угрозой. [9]

Большинство методов, используемых сегодня для сохранения данных, являются цифровыми методами, которые на сегодняшний день являются наиболее эффективными из существующих методов.

Архивы [ править ]

Архивы – это совокупность исторических документов и записей. Архивы способствуют сохранению данных, собирая хорошо организованные данные и предоставляя соответствующие метаданные для их подтверждения. [11]

Примером важного архива данных является Архив данных изображений LONI, который представляет собой архив, в котором собираются данные о клинических испытаниях и клинических исследованиях. [12]

Каталоги, каталоги и порталы [ править ]

Каталоги, каталоги и порталы представляют собой консолидированные ресурсы, которые хранятся отдельными учреждениями и связаны с архивами и хранилищами данных. [4] Другими словами, данные не представлены на сайте, а вместо этого могут выступать в качестве метаданных и агрегаторов, а также могут проводить тщательные инвентаризации. [13]

Репозитории [ править ]

Репозитории — это места, где можно получить доступ к архивам и хранилищам данных и хранить их. Цель репозиториев — убедиться, что все требования и протоколы архивов и фондов соблюдаются, а данные сертифицируются для обеспечения целостности данных и доверия пользователей. [4]

Односайтовые репозитории

Репозиторий, в котором хранятся все наборы данных на одном сайте. [4]

Пример крупного хранилища с одним сайтом — Службы архивирования данных и сетевых служб, которое представляет собой хранилище, которое обеспечивает постоянный доступ к цифровым исследовательским ресурсам для Нидерландов. [14]

Многосайтовые репозитории

Репозиторий, в котором хранятся наборы данных на нескольких институциональных сайтах. [4]

Примером хорошо известного многосайтового репозитория является OpenAIRE, который представляет собой репозиторий, в котором хранятся данные исследований и публикации, сотрудничающие со всеми странами ЕС и другими странами. OpenAIRE продвигает открытые исследования и стремится улучшить возможности обнаружения и повторного использования данных. [15]

Надежный цифровой репозиторий

Репозиторий, который стремится обеспечить надежный и доверительный доступ в течение длительного периода времени. Репозиторий может быть одно- или многосайтовым, но должен взаимодействовать с эталонной моделью открытой архивной информационной системы. [16] а также придерживаться набора правил или атрибутов, которые способствуют его доверию, таких как постоянная финансовая ответственность, организационная активность, административная ответственность, безопасность и безопасность. [4]

Примером надежного цифрового хранилища является Цифровое хранилище Ирландии (DRI), которое представляет собой многосайтовое хранилище, в котором хранятся наборы данных Ирландии по гуманитарным и социальным наукам. [17]

Киберинфраструктуры [ править ]

Киберинфраструктуры, состоящие из архивных коллекций, которые доступны через систему аппаратного обеспечения, технологий, программного обеспечения, политик, услуг и инструментов. Киберинфраструктуры ориентированы на обмен данными, поддерживая одноранговое сотрудничество и культурное сообщество. [3]

Примером крупной киберинфраструктуры является Канадская инфраструктура геопространственных данных, которая обеспечивает доступ к пространственным данным в Канаде. [18]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Словарные определения» . Терминологическая база данных InterPARES 2 . ИнтерПАРЕС2. 2013 . Проверено 21 октября 2013 г.
  2. ^ Китчин, Р. (2012). «Концептуализация данных». Революция данных . Лондон: Сейдж: 1–26.
  3. Перейти обратно: Перейти обратно: а б Совет киберинфраструктуры (2007 г.). «Видение киберинфраструктуры для открытий 21 века» (PDF) . Вашингтон, округ Колумбия: Национальный научный фонд.
  4. Перейти обратно: Перейти обратно: а б с д и ж г час я Китчин, Р. (2012). «Малые данные, инфраструктуры данных и брокеры данных». Революция данных . Лондон: Сейдж: 27–47.
  5. ^ Дрисколл, К. (2012). «От перфокарт к «большим данным»: социальная история популизма баз данных» . Общение +1 . 1 (4) . Проверено 22 февраля 2013 г.
  6. Перейти обратно: Перейти обратно: а б Пирс, Ф.; Стейнмец, Дж.; Дикинсон, Т.; Макхью, Дж. (2010). «Важность сохранения данных» . Геологическое общество Америки. Архивировано из оригинала 1 декабря 2017 г. Проверено 29 ноября 2017 г. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  7. ^ (2017) Сохраните [Определение]. Марриам-Вебстер. Получено с: https://www.merriam-webster.com/dictionary/retain.
  8. ^ (2107) Сохранить [Определение]. Марриам-Вебстер. Получено с: https://www.merriam-webster.com/dictionary/preserve.
  9. Перейти обратно: Перейти обратно: а б Коррадо, Э.; Сэнди, М. (2014). «Цифровая сохранность для библиотек, архивов и музеев». Глава 1. Издательство Rowman & Littlefield: 3–16. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  10. ^ «Сохранение данных» . Международная федерация организаций данных по социальным наукам . 2012. Архивировано из оригинала 1 декабря 2017 г. Проверено 28 ноября 2017 г.
  11. ^ Лорио, ТП; Хакетт, Ю; Кеннеди, Э. (2013). Учебник по сохранению геопространственных данных . Оттава: Хиклинг, Ауртурс и Лоу.
  12. ^ "О нас" . Архив изображений и данных LONI . 2017.
  13. ^ О'Кэрролл, А.; Коллинз, С.; Галлгер, Д.; Тан, Дж.; Уэбб, С. (2013). Забота о цифровом контенте, отображение международных подходов . Дублин: NUI Maynooth, Тринити-колледж Дублина, Королевская ирландская академия и цифровой репозиторий Ирландии.
  14. ^ «О ДАНС» . Архивирование данных и сетевые услуги. 2016.
  15. ^ «Информационные бюллетени проекта» . ОпенЭЙР. 2017.
  16. ^ «Эталонная модель OAIS» . www.oclc.org . Архивировано из оригинала 13 декабря 2013 г.
  17. ^ «О ДРИ» . Цифровой репозиторий Ирландии. 2014–2015 гг.
  18. ^ «Инфраструктура пространственных данных Канады» . Правительство Канады . 2017.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 94aa9d906323ed0b80febe6b501704a5__1707592380
URL1:https://arc.ask3.ru/arc/aa/94/a5/94aa9d906323ed0b80febe6b501704a5.html
Заголовок, (Title) документа по адресу, URL1:
Data preservation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)