МЕСТОИМЕНИЕ
Эта статья может быть слишком технической для понимания большинства читателей . ( сентябрь 2011 г. ) |
ПРОНОМ ( Государственный архив и Ном喃 ) [1] — это веб -технический реестр для поддержки услуг по сохранению цифровых данных , разработанный Национальными архивами Соединенного Королевства . PRONOM был первым и до сих пор остается единственным действующим реестром общедоступных форматов файлов в мире. [2] [3] хотя хранилище «Волшебного файла» File Command выполняло эту роль в менее формальном качестве в течение двух десятилетий. Другие проекты по разработке технических реестров, в том числе Реестр репрезентативной информации Британского цифрового кураторского центра и проект Глобального реестра цифровых форматов в Гарвардском университете , в настоящее время находятся в стадии реализации.
Истоки PRONOM лежат в требовании иметь доступ к достоверной технической информации об электронных записях, хранящихся в Национальном архиве. По определению, электронные записи по своей сути не являются удобочитаемыми для человека: форматы файлов кодируют информацию в форму, которая может быть обработана и сделана понятной только в очень специфических технологических средах. Поэтому доступность этой информации весьма уязвима к технологическому устареванию . Поэтому техническая информация о структуре этих форматов файлов, а также о программных и аппаратных средах, необходимых для их поддержки, является обязательным условием для любого режима цифрового хранения. [4] ПРОНОМ был разработан для обеспечения этой функции, первоначально как внутренний ресурс для сотрудников Национального архива, а затем как общедоступный веб-ресурс.
Разработка
[ редактировать ]Первая версия PRONOM была разработана отделом цифрового хранения Национального архива под руководством Дэвида Райана в марте 2002 года. PRONOM 2 был выпущен в декабре 2002 года и обеспечивал поддержку разработки многоязычных версий реестра. Создание сети PRONOM (PRONOM 3) в феврале 2004 года стало отправной точкой для развития PRONOM как основного онлайн-ресурса для международного сообщества по сохранению цифровой информации. [5] [6]
PRONOM 4, выпущенный в октябре 2005 года, включает в себя значительную переработку базовой модели данных, позволяющую собирать подробную техническую информацию о форматах файлов и поддерживать будущую совместимость с другими запланированными системами реестра, а также выпуск программного обеспечения DROID для автоматической идентификации формата файлов. .
Последняя версия PRONOM 5 представляла собой относительно незначительное обновление для поддержки улучшений DROID и была выпущена в 2006 году. На 2007 год запланировано гораздо более существенное обновление, которое будет включать в себя доступ к основным функциям PRONOM через веб-сервисов интерфейсы . Эта работа является частью программы «Бесшовный поток», призванной дать Национальным архивам возможность получать и управлять будущими правительственными документами в электронных форматах.
Национальный архив выиграл в 2007 году премию Digital Preservation Award, спонсируемую Коалицией Digital Preservation Coalition , за работу над PRONOM и DROID. [7]
Проект «Глобальный реестр цифровых форматов» , начатый в Гарварде в 2005 году, в конечном итоге был преобразован вместе с ПРОНОМ в совместную работу по созданию единого реестра цифровых форматов . Однако в 2012 году UDFR был законсервирован, в результате чего Калифорнийская цифровая библиотека в конечном итоге закрыла доступ к своему узлу в 2016 году и порекомендовала использовать PRONOM.
Услуги
[ редактировать ]Основной технический реестр поддерживает ряд конкретных услуг:
Реестр PRONOM предоставляет доступную для поиска веб-базу данных технической информации о форматах файлов, программных инструментах, необходимых для доступа к ним, и технических средах, необходимых для доступа к ним. Пользователи могут искать форматы и программное обеспечение, используя различные критерии, такие как имя формата или программного обеспечения и расширение файла . PRONOM также содержит информацию о периодах поддержки программных продуктов, и на этой основе ее также можно запрашивать. Помимо просмотра на экране, информацию реестра можно экспортировать в форматы XML , CSV и для печати. Веб-сайт ПРОНОМ позволяет пользователям отправлять новую информацию для включения в ПРОНОМ.
Схема постоянного уникального идентификатора PRONOM (PUID).
[ редактировать ]Постоянный уникальный идентификатор PRONOM (PUID) — это расширяемая схема постоянных, уникальных и однозначных идентификаторов записей в реестре PRONOM. Такие идентификаторы имеют основополагающее значение для обмена цифровыми объектами и управления ими, поскольку позволяют людям или автоматизированным пользовательским агентам однозначно идентифицировать и делиться этой идентификацией информации о представлении, необходимой для поддержки доступа к объекту. Это является достоинством как присущей идентификатору уникальности, так и его привязки к окончательному описанию информации о представлении в реестре, таком как PRONOM.
В настоящее время схема PUID ограничена одним конкретным классом информации представления: форматом , в котором кодируется цифровой объект. Форматы считались особым приоритетом для такой схемы, поскольку ни одна существующая универсально применимая система не обеспечивает этого. Unix Магические числа и Macintosh разветвления данных действительно предоставляют некоторые из этих функций, но этого нельзя сказать о средах DOS или Microsoft Windows . Трехсимвольное расширение файла не является ни стандартизированным, ни уникальным и интерпретируется по-разному в разных средах. Аналогично, -типа IANA схема MIME не обеспечивает достаточной детализации или охвата для удовлетворения требований к уникальным идентификаторам. Схема PUID была разработана с единственной целью предоставления таких идентификаторов.
Эта схема была принята в качестве рекомендуемой схемы кодирования для описания форматов файлов в последней версии стандарта метаданных электронного правительства Великобритании . [8] Схема спроектирована так, чтобы быть расширяемой, и в будущем может быть расширена за счет включения других классов информации представления в PRONOM, таких как методы сжатия , схемы кодирования символов и операционные системы .
PUID можно выразить как унифицированные идентификаторы ресурсов, используя info:pronom/
пространство имен, сведения о котором доступны в реестре info URI . Ни схема PUID, ни ее выражение в виде информационного URI не поддерживают какой-либо встроенный механизм разыменования, т. е. PUID не преобразуется в унифицированный указатель ресурса . Однако Национальный архив планирует разработать ряд сервисов для раскрытия содержимого реестра PRONOM, включая сервис разрешения PUID.
ДРОИД
[ редактировать ]DROID (идентификация объектов цифровых записей) — это программный инструмент, разработанный Национальными архивами для автоматической пакетной идентификации форматов файлов. Это один из запланированных наборов инструментов, использующих PRONOM для предоставления конкретных услуг по сохранению цифровых данных. DROID использует внутренние (последовательность байтов) и внешние (расширение файла) подписи для идентификации и сообщения о версиях цифровых файлов в конкретных форматах. Эти подписи хранятся в файле подписей XML, созданном на основе информации, записанной в техническом реестре PRONOM. В PRONOM регулярно добавляются новые и обновленные подписи, а DROID можно настроить на автоматическую загрузку обновленных файлов подписей с веб-сайта PRONOM через веб-сервисы .
DROID позволяет выбирать файлы и папки из файловой системы для идентификации. После запуска процесса идентификации результаты могут быть выведены в форматах XML , CSV или в формате, удобном для печати.
DROID — это независимый от платформы инструмент Java . Он включает в себя документированный общедоступный API и может вызываться как из графического интерфейса , так и из интерфейса командной строки .
Будущие услуги
[ редактировать ]Предлагаемые будущие услуги включают оценку рисков формата и планирование сохранения, а также автоматическое создание путей миграции для преобразования между форматами. [9]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Комментарий @realadrianbrown о происхождении имени» .
- ^ Расбридж, Крис (2006). «Извините… Некоторые заблуждения о сохранности цифровых данных?» . Ариадна.ac.uk (46).
- ^ Ван Вейнгаарден, Х. (2005) Реестры форматов, Семинар CASHMERE-int по сохранению и инструментам постоянного тока: Стандарты и деятельность по стандартизации, Геттинген : 6
- ^ «Содержание» . clir.org .
- ^ «OCLC: Всемирный библиотечный кооператив, принадлежащий членам - Global» . rlg.org . Архивировано из оригинала 27 сентября 2007 года . Проверено 21 июля 2006 г.
- ^ Янсен, Адам (26 апреля 2019 г.), «Адриан Браун (1969–)» в Дуранти, Лусиана; Фрэнкс, Патрисия К. (ред.), Энциклопедия писателей архивов, 1515–2015 гг. , Rowman & Littlefield Publishers, ISBN 978-1-5381-2580-9 , получено 22 ноября 2020 г.
- ^ «Третья премия за сохранение цифровой информации 2007 г.» . Коалиция по сохранению цифровой информации . Архивировано из оригинала 4 июля 2007 года . Проверено 12 сентября 2022 г.
- ^ Стандарт метаданных электронного правительства Великобритании
- ^ «OCLC: Всемирный библиотечный кооператив, принадлежащий членам - Global» . rlg.org . 12 марта 2018 г.