Метаданные сохранения: стратегии реализации
Метаданные PREservation: Стратегии реализации ( PREMIS ) — это фактический стандарт метаданных цифрового сохранения . [ 1 ]
Метаданные цифровой сохранности определяют информацию, необходимую для обеспечения долгосрочного использования цифровых объектов и сохранения их доступности в той или иной форме в будущем. Метаданные цифровой сохранности особенно важны для хранилищ, мест, где информационные объекты хранятся и управляются в течение длительного времени. Простого хранения цифровых объектов на носителе данных недостаточно для обеспечения их пригодности к использованию. Их необходимо хранить в репозитории, чтобы защитить их от случайного или преднамеренного повреждения и чтобы можно было создать полную вычислительную среду, в которой к ним можно было бы получить доступ и понять, когда они понадобятся. [ 2 ]
Информационные объекты имеют описательные метаданные, информацию об объекте, которую можно использовать для обнаружения, доступа и идентификации цифрового объекта. Однако этих метаданных недостаточно для сохранения цифровых объектов в долгосрочной перспективе. цифрового объекта Например, формат файла может устареть и стать непригодным для использования будущими программными приложениями. Для этого потребуется либо преобразовать старый формат в новый (миграция), либо воспроизвести исходный опыт с использованием более новой технологии (эмуляция). Обе стратегии потребуют дополнительной информации, такой как технические метаданные об исходных файлах, информация о старом оборудовании и программном обеспечении, на котором они работали, а также информация о действиях, которые со временем изменили цифровой объект. Все это типы метаданных сохранности. Таким образом, метаданные сохранности поддерживают действия, направленные на обеспечение долгосрочного удобства использования цифрового ресурса. [ 3 ]
В начале 2000-х годов стало ясно, что необходим общий стандарт метаданных сообщества для обеспечения долгосрочного сохранения постоянно растущих цифровых ресурсов. Эксперты из ключевых институтов памяти и разработчики репозиториев объединились, чтобы определить его, в результате чего был создан Словарь данных PREMIS для метаданных сохранности, который стал де-факто стандартом, определяющим основные метаданные, необходимые большинству репозиториев сохранности.
Использование стандартов важно, поскольку оно поддерживает развитие сообщества передового опыта; это помогает специалистам-практикам учиться на идеях других, чтобы они случайно не упустили из виду ключевые метаданные в своей собственной практике; это позволяет разрабатывать инструменты, упрощающие создание метаданных и управление ими; и это позволяет организациям более легко обмениваться информацией друг с другом.
История
[ редактировать ]Рабочая группа PREMIS была создана для продолжения работы более ранней инициативы, спонсируемой Центром онлайн-компьютерных библиотек OCLC и Группой исследовательских библиотек RLG: рабочей группы по системе сохранения метаданных (PMF). В 2001–2002 годах рабочая группа PMF определила типы информации, которая должна быть связана с архивным цифровым объектом. В их отчете «Структура метаданных для поддержки сохранности цифровых объектов» (« Структура ») предложен список прототипов элементов метаданных. На данном этапе предложенные элементы не удалось реализовать, и потребовалась дополнительная работа. В 2003 году рабочую группу PREMIS попросили продолжить выводы группы PMF и разработать словарь основных метаданных для архивных цифровых объектов, а также дать рекомендации и предложить лучшие практики управления : создание, управление и использование метаданных в системы консервации. PREMIS «было поручено определить набор семантических единиц, которые не зависят от реализации, практически ориентированы и, вероятно, будут необходимы большинству хранилищ хранения». [ 4 ]
Рабочая группа состояла из многонационального списка из более чем тридцати представителей культурного, государственного и частного секторов. [ 5 ] Он стремился понять, как хранилища хранения на самом деле реализуют метаданные сохранения. Опрос был проведен среди 70 организаций, которые, как считается, активно занимаются сохранением цифровой информации или заинтересованы в ней. В декабре 2004 года рабочая группа PREMIS опубликовала свой отчет « Внедрение хранилищ цифровых материалов: текущая практика и новые тенденции в сообществе культурного наследия» .
Более ранняя версия Framework и словарь данных PREMIS основаны на эталонной модели Открытой архивной информационной системы (OAIS). Информационная модель OAIS обеспечивает концептуальную основу в виде таксономии информационных объектов и пакетов для архивных объектов, а также структуры связанных с ними метаданных. Структура , благодаря ее глубокому детальному сопоставлению метаданных сохранности с этой концептуальной структурой, может рассматриваться как развитие OAIS. С другой стороны, словарь данных PREMIS можно рассматривать как перевод структуры в набор реализуемых семантических единиц. Словарь данных и OAIS иногда различаются в использовании терминологии, и это отмечено в Глоссарии. Различия обычно отражают тот факт, что семантические единицы PREMIS требуют большей конкретизации, чем обеспечивают определения OAIS, чего и следовало ожидать при переходе от концептуальной структуры к реализации. [ 6 ]
В мае 2005 года PREMIS выпустила «Словарь данных для сохранения метаданных: итоговый отчет рабочей группы PREMIS» . Этот 237-страничный отчет включает в себя: Словарь данных PREMIS 1.0: комплексный практический ресурс для реализации метаданных сохранности в цифровых системах архивирования; сопроводительный отчет (с указанием контекста, модели данных, предположений); специальные темы, глоссарий, примеры использования; набор XML-схем , разработанный для поддержки использования Словаря данных. [ 7 ]
Текущая версия 3.0 PREMIS была выпущена в июне 2015 года. [ 8 ]
Версии
[ редактировать ]ДД Версия | ДД Дата | онтологии Версия | онтологии Дата | Онтология xmlns | Описание |
---|---|---|---|---|---|
1.0. | 17 мая 2005 г. | ||||
1.1. | 27 сентября 2005 г. | ||||
2.2. | июль 2012 г. | 2.2. | 6 июня 2013 г. [ 9 ] | http://www.loc.gov/premis/rdf/v1# | Онтология 2.2, но xmlns — это версия 1. |
2.3. | 4 августа 2014 г. | ||||
3.0. | 18 января 2016 г. [ 10 ] | 3.0. | июль 2013 г. | http://www.loc.gov/premis/rdf/v3/ | |
Старая версия Последняя версия |
Сущности
[ редактировать ]Модель данных PREMIS состоит из четырех взаимосвязанных объектов:
- Объект (разделен на три подтипа)
- Событие
- Агент
- Права
При этом каждая семантическая единица в словаре данных отнесена к одной из этих областей. [ 11 ]
Сущность интеллектуального объекта является типом объекта. Это набор контента, который представляет собой дискретную, связную интеллектуальную единицу, такую как книга или база данных. Это могут быть составные объекты, содержащие другие интеллектуальные объекты и имеющие несколько цифровых представлений. [ 12 ] На этом уровне обычно применяются описательные метаданные; учитывая распространение конкурирующих схем, рабочая группа не определила никаких дополнительных описательных семантических единиц. [ 13 ] и разрешена совместимость через «контейнеры расширения» (контейнеры содержат связанную группу семантических единиц), которые можно использовать для внешних схем. [ 12 ]
Большинство семантических единиц, перечисленных в словаре данных, относятся к сущностям «Объект» и «Событие» , причем первые подразделяются на три подтипа: файл , битовый поток и представление . Файл — это уровень, на котором привыкло работать большинство конечных пользователей, «именованная и упорядоченная последовательность байтов, известная операционной системе». Он включает в себя множество атрибутов файловой системы, что делает его понятным для операционной системы, включая битовые потоки , которые представляют собой «непрерывные или несмежные данные внутри файла, имеющие значимые общие свойства для целей сохранения». Представление в некотором смысле является «высшим уровнем» этой модели, поскольку оно может включать в себя несколько файлов для правильного отображения структуры и содержания интеллектуального объекта. Не все репозитории будут заниматься сохранением представлений. [ 14 ] в зависимости от их цели и необходимости кураторского органа сохранить то, что можно считать цифровой «внутренней ценностью» организации. Более того, интеллектуальные объекты могут иметь несколько представлений в репозитории. События взаимосвязаны с объектами, поскольку они включают в себя действия, оказывающие влияние на них или агентов («человек, организация или программное обеспечение... связанные с Событиями... или с Правами, прикрепленными к объекту»), связанные с объектом. [ 12 ]
Наконец, включение правозащитных организаций является ответом на возросшую осведомленность и озабоченность юридическими требованиями авторского права и лицензирования. Он также включает информацию о конкретных разрешенных действиях; например, семантическая единица 4.1.6.1, act, «действие, которое разрешено выполнить репозиторию сохранения», включает такие предлагаемые значения, как репликация, миграция и удаление. [ 15 ]
Словарь данных
[ редактировать ]Записи словаря данных PREMIS включают двенадцать полей атрибутов, не все из которых применяются к каждой семантической единице (аналогично «элементу» в других схемах метаданных). Помимо названия и определения единицы, в полях записываются такие сведения, как обоснование включения единицы, примечания по использованию и примеры заполнения значения. Четыре атрибута — категория объекта, применимость, повторяемость и обязательство - связаны, поскольку последние три определены для каждого уровня объекта объекта: файла, битового потока и представления. Словарь является иерархическим; одни семантические единицы содержатся внутри других. Например, PreservationLevel 1.3 включает четыре семантических компонента, такие как PreservationLevelValue 1.3.1 и PreservationLevelRole 1.3.2. [ 16 ]
См. также
[ редактировать ]- Цифровое сохранение
- Метаданные сохранения
- Метаданные
- Электронная библиотека
- Протокол сбора метаданных (OAI-PMH)
- Стандарт кодирования и передачи метаданных (METS), поддерживаемый Библиотекой Конгресса.
- Dublin Core — стандарт метаданных ISO.
Ссылки
[ редактировать ]- ^ Словарь данных PREMIS (полный документ), версия 3.0 https://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf
- ^ Дапперт, Анджела; Гюнтер, Ребекка Сквайр; Пейрар, Себастьян (2016). Метаданные цифрового сохранения для практикующих специалистов. doi: 10.1007/978-3-319-43763-7. ISBN 978-3-319-43761-3 .
- ^ Библиотека Конгресса. «PREMIS для цифровой сохранности». http://www.digitalpreservation.gov/series/challenge/premis.html , 2010 г.
- ^ Каплан П. и Гюнтер Р. (2005). Практическая консервация: опыт PREMIS. Библиотечные тенденции, 54, (1), 111–124.
- ^ «Деятельность по сохранению метаданных PREMIS» . Библиотека Конгресса США . Проверено 10 октября 2013 г.
- ^ Библиотека Конгресса. «Словарь данных PREMIS». https://www.loc.gov/standards/premis/v2/premis-2-0.pdf , стр.3
- ^ Деятельность по поддержанию метаданных PREMIS по сохранению (Библиотека Конгресса) https://www.loc.gov/standards/premis/
- ^ Редакционный комитет PREMIS. (2015). Словарь данных PREMIS для метаданных сохранения, версия 3.0. URL-адрес доступен 11 ноября 2015 г.
- ^ «Теперь доступна онтология PREMIS OWL 2.2» . Библиотека Конгресса . 06.06.2013. Архивировано из оригинала 1 апреля 2022 г. Проверено 1 апреля 2022 г.
- ^ Дененберг, Рэй , изд. (18 января 2016 г.). «ПРЕМИС – Схема 3.0» . loc.gov . Библиотека Конгресса . Архивировано из оригинала 02 апреля 2021 г. Проверено 1 апреля 2022 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для метаданных сохранения, версия 2.0. , 5-6. URL-адрес доступен 28 апреля 2008 г.
- ^ Перейти обратно: а б с Редакционный комитет ПРЕМИС. (2008). Словарь данных PREMIS для метаданных сохранения, версия 2.0. , 6. URL-адрес открыт 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для метаданных сохранения, версия 2.0. , 23-4. URL-адрес доступен 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для метаданных сохранения, версия 2.0. , 7-8. URL-адрес доступен 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для метаданных сохранения, версия 2.0. , 6, 181. URL-адрес доступен 28 апреля 2008 г.
- ^ Редакционный комитет PREMIS. (2008). Словарь данных PREMIS для метаданных сохранения, версия 2.0. , 22-194. URL-адрес доступен 28 апреля 2008 г.