Зена (программное обеспечение)
Xena — это программное обеспечение с открытым исходным кодом, предназначенное для использования в цифровой сохранности . Зена — сокращение от XML Electronic Normalizing for Archives.
Xena — это Java- приложение, разработанное Национальным архивом Австралии . Он доступен бесплатно по лицензии GNU General Public License .
Версия 6.1.0 была выпущена 31 июля 2013 года. Исходный код и двоичные файлы для Linux, OS X и Windows доступны на SourceForge . Однако с 2018 года он больше не поддерживается и не поддерживается.
Режим работы
[ редактировать ]Зена пытается избежать цифрового устаревания , конвертируя файлы в открыто указанный формат, такой как ODF или PNG . Если формат файла не поддерживается или выбрана опция двоичной нормализации, Xena выполнит кодировку ASCII Base64 для двоичных файлов и обернет вывод метаданными XML. В результате .xena
Файл представляет собой обычный текст, хотя содержимое самих данных не является непосредственно читабельным для человека. Точный исходный файл можно получить, удалив метаданные и изменив кодировку Base64, используя внутреннюю программу просмотра.
Функции
[ редактировать ]Платформы, поддерживаемые Xena, включают Microsoft Windows , Linux и Mac OS X.
Xena использует ряд плагинов для идентификации форматов файлов и преобразования их в соответствующий открыто указанный формат.
Xena имеет интерфейс прикладного программирования , который позволяет любому достаточно опытному разработчику Java разработать плагин для нового типа файлов.
Зена может обрабатывать отдельные файлы или целые каталоги. При обработке всего каталога он может сохранить исходную структуру каталогов преобразованных записей.
Xena может создавать простые текстовые версии файлов таких форматов, как TIFF , Word и PDF , с использованием Tesseract (программного обеспечения) .
Интерфейс Xena или Xena Viewer можно использовать для просмотра или экспорта файла Xena (расширение .xena
) в целевом формате файла. Эти файлы содержат нормализованный файл, а также любую дополнительную информацию, имеющую отношение к процессу нормализации.Xena Viewer поддерживает массовый экспорт файлов Xena в целевые форматы файлов.
Xena можно использовать через графический интерфейс пользователя или через командную строку .
Чтобы Xena была полностью функциональной, требуется локальная установка следующего внешнего программного обеспечения:
- Пакет LibreOffice — для преобразования офисных документов в формат OpenDocument.
- Tesseract — для создания текстовых версий файловых форматов.
- ImageMagick — для преобразования подмножества файлов изображений в PNG.
- Readpst — для преобразования PST-файлов Microsoft Outlook в XML. Readpst является частью бесплатного пакета программного обеспечения libpst с открытым исходным кодом .
- FLAC — для конвертации аудиофайлов в формат FLAC. Это также необходимо для воспроизведения аудиофайлов с помощью Xena.
Поддерживаемые типы файлов
[ редактировать ]Зена распознает и обрабатывает типы файлов, перечисленные ниже, а также некоторые другие, менее важные. Неподдерживаемые типы файлов автоматически подвергаются двоичной нормализации.
Форматы офисных файлов:
- Microsoft Office Файлы (включая MS Office XML , электронные таблицы SYLK и формат Rich Text Format ) преобразуются в соответствующие файлы OpenDocument.
- файлы Microsoft Outlook PST- анализируются на предмет отдельных сообщений, которые преобразуются в файлы XML и создается индексный файл Xena.
- Файлы Microsoft Project MPP преобразуются в XML
- XML-файлы OpenOffice.org (SXC, SXI, SXW) преобразуются в соответствующие форматы OpenDocument.
- Файлы WordPerfect WPD преобразуются в OpenDocument ODT.
- Документы OpenDocument (ODT, ODS, ODB, ODP) сохраняются без изменений.
- Файлы Acrobat PDF хранятся в виде двоичных файлов.
- Файлы почтовых ящиков (MBX) преобразуются в отдельные файлы XML.
Графика:
- BMP , GIF , PSD , PCX , RAS и растровые файлы X Window System XBM и XPM преобразуются в PNG ; Файлы TIFF дополнительно получают встроенные метаданные, хранящиеся в Xena XML. Если установлено программное обеспечение Tesseract OCR , текст будет извлечен из файлов TIFF.
- Рисунки OpenDocument (ODG) и файлы SVG упакованы в Xena XML.
- Файлы JPG и PNG сохраняются без изменений.
Архивные файлы:
- Файлы извлекаются из архивов ( ZIP , GZIP , TAR/TAR.gz , JAR , WAR , двоичные файлы Mac) и нормализуются в отдельный файл Xena. Создается индексный файл Xena, который при открытии во внутренней программе просмотра Xena отобразит файлы в таблице.
Аудио файлы:
- Форматы MP3 , WAV , AIFF и OGG преобразуются в FLAC . файлы
Базы данных:
- Файлы SQL обрабатываются как обычный текст, завернутый в XML.
Другие типы файлов:
- HTML конвертируется в XHTML
- Текстовые файлы TXT хранятся в виде обычного текста, завернутого в XML; Файлы CSS хранятся в виде обычного текста, завернутого в XML.
Отзывы
[ редактировать ]В обзоре журнала Practice e-Records от 22 апреля 2010 года Зена получила оценку 82/100 баллов. В настоящее время у Xena нет целевого формата сохранения видеофайлов. [1]
Ссылки
[ редактировать ]- ^ «Обзор программного обеспечения для нормализации XENA» . 22 апреля 2010 г. Архивировано из оригинала 8 июля 2012 г.