PDF/А
Расширение имени файла | .pdf |
---|---|
Тип интернет-СМИ | приложение/pdf |
Введите код | «PDF» (включая один пробел в конце) |
Единый идентификатор типа (UTI) | com.adobe.pdf |
Магическое число | %PDF |
Разработано | ИСО |
Первоначальный выпуск | 1 октября 2005 г |
Расширено с | |
Стандартный | ИСО 19005 |
PDF/A — это стандартизированная ISO версия формата переносимых документов (PDF), предназначенная для использования при архивировании и долгосрочном хранении электронных документов . PDF/A отличается от PDF тем, что запрещает функции, неподходящие для долгосрочного архивирования, такие как связывание шрифтов (в отличие от встраивания шрифтов ) и шифрование. [1] Требования ISO для программ просмотра файлов PDF/A включают рекомендации по управлению цветом , поддержку встроенных шрифтов и пользовательский интерфейс для чтения встроенных аннотаций .
Стандарты [ править ]
Сокр. | Субтитры | Опубликовано | Стандартный | На основе | Ссылка. |
---|---|---|---|---|---|
PDF/А-1 | Часть 1. Использование PDF 1.4 | 2005-09-28 | ИСО 19005-1 | PDF 1.4 ( Adobe Systems , PDF Reference , третье издание) | [2] |
PDF/A-2 | Часть 2: Использование ISO 32000-1 | 2011-06-20 | ИСО 19005-2 | PDF 1.7 (ИСО 32000-1:2008) | [3] |
PDF/A-3 | Часть 3. Использование ISO 32000-1 с поддержкой встроенных файлов. | 2012-10-15 | ИСО 19005-3 | PDF 1.7 (ИСО 32000-1:2008) | [4] |
PDF/A-4 | Часть 4: Использование ISO 32000-2 | 2020-11 | ИСО 19005-4 | PDF 2.0 (ИСО 32000-2:2020) | [5] |
Предыстория [ править ]
PDF — это стандарт кодирования документов в печатном виде, который можно переносить между системами. Однако пригодность PDF-файла для архивного хранения зависит от параметров, выбранных при создании PDF-файла: в первую очередь, встраивать ли необходимые шрифты для визуализации документа; использовать ли шифрование; и следует ли сохранять дополнительную информацию из исходного документа помимо той, которая необходима для его печати.
PDF/A изначально был новым совместным проектом Ассоциации поставщиков технологий печати, издательского дела и конвертации ( NPES ) и Ассоциации по управлению информацией и изображениями AIIM совместно с Adobe с целью разработки международного стандарта, определяющего использование формата переносимых документов. (PDF) для архивирования документов. [6] Цель состояла в том, чтобы удовлетворить растущую потребность в электронном архивировании документов таким образом, чтобы гарантировать сохранение их содержания в течение длительного периода времени и гарантировать, что эти документы можно будет получить и представить с последовательным и предсказуемым результатом в будущем. . [7] Эта потребность существует в самых разных правительственных, промышленных и академических сферах по всему миру, включая правовые системы, библиотеки, газеты и регулируемые отрасли. [8]
Описание [ править ]
Стандарт PDF/A не определяет стратегию архивирования или цели системы архивирования. Он определяет «профиль» для электронных документов, который гарантирует, что в последующие годы документы можно будет точно так же воспроизводить с использованием различного программного обеспечения. Ключевым элементом этой воспроизводимости является требование к документам PDF/A быть на 100% автономными. Вся информация, необходимая для отображения документа таким же образом, встроена в файл. Сюда входит, помимо прочего, весь контент (текст, растровые изображения и векторная графика), шрифты и информация о цвете. Документ PDF/A не может зависеть от информации из внешних источников (например, программ шрифтов и потоков данных), но может включать аннотации (например, гипертекстовые ссылки), которые ссылаются на внешние документы. [9]
Другие ключевые элементы соответствия PDF/A включают в себя: [10] [11] [12]
- Аудио и видео контент запрещен.
- JavaScript и исполняемых файлов. Запрещен запуск
- Все шрифты должны быть встроены, а также должны быть юридически встраиваемыми для неограниченного и универсального рендеринга. Это также относится к так называемым стандартным шрифтам PostScript, таким как Times или Helvetica .
- Цветовые пространства, заданные независимым от устройства способом.
- Шифрование запрещено.
- Требуется использование метаданных, основанных на стандартах.
- Ссылки на внешний контент запрещены.
- LZW запрещен из-за ограничений интеллектуальной собственности. Модели сжатия изображений JPEG 2000 не допускаются в PDF/A-1 (на основе PDF 1.4), поскольку они были впервые представлены в PDF 1.5. Сжатие JPEG 2000 допускается в PDF/A-2 и PDF/A-3.
- Прозрачные объекты и слои (дополнительные группы контента) запрещены в PDF/A-1, но разрешены в PDF/A-2.
- Положения о цифровых подписях в соответствии со стандартом PAdES ( расширенные электронные подписи PDF ) поддерживаются в PDF/A-2.
- Встроенные файлы запрещены в PDF/A-1, но PDF/A-2 позволяет встраивать файлы PDF/A, облегчая архивирование наборов документов PDF/A в одном файле. PDF/A-3 позволяет встраивать файлы любого формата, например XML, CAD и другие, в документы PDF/A.
- Использование форм XML Forms Architecture (XFA) на основе XML запрещено в PDF/A. (Данные формы XFA можно сохранить в файле PDF/A-2, переместив ключ XFA в дерево имен, которое само по себе является значением ключа XFAResources словаря имен словаря каталога документов.)
- Поля интерактивных PDF-форм должны иметь словарь внешнего вида, связанный с данными поля. Словарь внешнего вида должен использоваться при отрисовке поля.
Уровни соответствия и версии [ править ]
PDF/A-1 [ править ]
Часть 1 стандарта была впервые опубликована 28 сентября 2005 г. [2] и определяет два уровня соответствия для файлов PDF: [13]
- PDF/A-1b – соответствие уровня B (базовый)
- PDF/A-1a – соответствие уровня A (доступный)
Соответствие уровня B требует только соблюдения стандартов, необходимых для надежного воспроизведения внешнего вида документа, тогда как соответствие уровня A включает все требования уровня B в дополнение к функциям, предназначенным для улучшения цифровой доступности документа .
Дополнительные требования уровня А:
- Спецификация языка
- Иерархическая структура документа
- Текстовые фрагменты с тегами и описательный текст для изображений и символов.
- Сопоставление символов с Unicode
Соответствие уровня А было предназначено для повышения доступности соответствующих файлов для пользователей с ограниченными физическими возможностями, позволяя вспомогательному программному обеспечению, такому как программы чтения с экрана , более точно извлекать и интерпретировать содержимое файла. [13] Более поздний стандарт PDF/UA был разработан для устранения того, что считалось некоторыми недостатками PDF/A, заменив многие его общие рекомендации более подробными техническими спецификациями. [14]
PDF/A-2 [ править ]
Часть 2 стандарта, опубликованная 20 июня 2011 г., [3] рассматривает некоторые новые функции, добавленные в версиях 1.5, 1.6 и 1.7 Справочника PDF. Файлы PDF/A-1 не обязательно будут соответствовать PDF/A-2, а файлы, совместимые с PDF/A-2, не обязательно будут соответствовать PDF/A-1.
Часть 2 стандарта PDF/A основана на PDF 1.7 (ISO 32000-1), а не на PDF 1.4, и предлагает несколько новых функций:
- Сжатие изображений JPEG 2000 .
- поддержка эффектов прозрачности и слоев.
- встраивание шрифтов OpenType .
- положения о цифровых подписях в соответствии со стандартом PDF Advanced Electronic Signatures – PAdES .
- возможность встраивания файлов PDF/A для облегчения архивирования наборов документов в одном файле. [11]
Часть 2 определяет три уровня соответствия. PDF/A-2a и PDF/A-2b соответствуют уровням соответствия a и b в PDF/A-1. Новый уровень соответствия PDF/A-2u представляет собой соответствие уровня B (PDF/A-2b) с дополнительным требованием, чтобы весь текст в документе отображался в Юникоде. [13] [15]
PDF/A-3 [ править ]
Часть 3 стандарта, опубликованная 15 октября 2012 г., [4] отличается от PDF/A-2 только в одном отношении: он позволяет встраивать произвольные форматы файлов (такие как XML, CSV, CAD, текстовые документы, документы электронных таблиц и другие) в документы, соответствующие PDF/A. [16]
PDF/A-4 [ править ]
Часть 4 стандарта, основанная на PDF 2.0, была опубликована в конце 2020 года. [17]
Как создать файл PDF/A [ править ]
Архивы иногда просят своих пользователей предоставить файлы PDF/A. Таким образом, они предоставляют своим пользователям информацию о том, как конвертировать их файлы в PDF/A. Существует несколько методов с использованием стандартного программного обеспечения, которые отличаются временем вычислений, а также сохранением ссылок, уравнений, векторных графиков и специальных символов. [18]
Когда документы конвертируются в PDF/A, необходим визуальный осмотр, поскольку ошибки в визуальном содержании являются обычным явлением. В тестовом образце 11 процентов созданных документов PDF/A-1b содержали визуальные артефакты. Эти ошибки воспроизводимости включали проблемы с векторной графикой (прозрачные объекты), потерю ссылок, потерю другого содержимого документа (нечитаемые символы, отсутствующий текст, отсутствие части документа), обновленные поля (отражающие время или папку преобразования) и орфографические ошибки. [19] Таким образом, архивы обычно сами по себе не конвертируются в PDF/A. Вместо этого некоторые архивы просят своих пользователей предоставить документ PDF/A. Типичные компьютерные настройки предусматривают несколько методов преобразования документов в PDF/A с разными плюсами и минусами. [18]
Преобразование простого PDF-файла (до версии 1.4) в PDF/A-2 обычно работает как положено, за исключением проблем с глифами . По данным Ассоциации PDF, «Проблемы могут возникнуть до и/или во время создания PDF-файлов. Файл PDF/A может быть формально правильным, но при этом содержать неправильные глифы. Только тщательная визуальная проверка может выявить эту проблему. Поскольку проблемы с генерацией также влияют Отображение Юникода, проблема обращает на себя внимание при визуальной проверке извлеченного текста. В PDF/A использование текста/шрифта указывается достаточно однозначно, чтобы гарантировать, что оно не может быть неправильным.Если программы просмотра или принтеры не обеспечивают полную поддержку систем кодирования, это может привести к проблемам с PDF/A». [20] Это означает, что для того, чтобы документ полностью соответствовал стандарту, он должен быть правильным внутри, в то время как система, используемая для просмотра или печати документа, может привести к нежелательным результатам.
Документ, созданный с помощью преобразования оптического распознавания символов (OCR) в PDF/A-2 или PDF/A-3, не поддерживает notdefglyph
флаг. Таким образом, этот тип преобразования может привести к получению необработанного контента.
Стандартные документы PDF/A можно создавать с помощью следующего программного обеспечения: SoftMaker Office 2021 , MS Word 2010 и новее, Adobe Acrobat Distiller, PDF Creator, OpenOffice или LibreOffice начиная с версии 3.0, LaTeX с надстройками pdfx или pdfTeX или с помощью виртуального PDF-файла. принтер (Adobe Acrobat Pro, PDF24, FreePDF + Ghostscript). [21]
Идентификация [ править ]
Документ PDF/A можно идентифицировать как таковой по метаданным PDF/A, расположенным в пространстве имен «http://www.aiim.org/pdfa/ns/id/». Эти метаданные представляют собой заявление о соответствии; само по себе оно не гарантирует соответствия:
- PDF-документ может быть совместим с PDF/A, за исключением отсутствия метаданных PDF/A. Это может произойти, например, с документами, которые были созданы до определения стандарта PDF/A, авторами, знающими об особенностях, которые создают проблемы с долгосрочным сохранением.
- документ PDF может быть идентифицирован как PDF/A, но может ошибочно содержать функции PDF, не разрешенные в PDF/A; следовательно, документы, которые утверждают, что они совместимы с PDF/A, должны быть проверены на соответствие PDF/A. [22]
Проверка [ править ]
Проверка документов PDF/A направлена на то, чтобы выявить, действительно ли созданный файл является файлом PDF/A или нет. К сожалению, валидаторы PDF/A довольно часто не соглашаются, поскольку интерпретация стандартов PDF/A не всегда ясна. [19]
Набор тестов Isartor [ править ]
Сотрудничество отрасли в первоначальном Центре компетенции PDF/A привело к разработке пакета тестов Isartor в 2007 и 2008 годах. Набор тестов состоит из 204 файлов PDF, специально созданных для систематического нарушения каждого из требований соответствия PDF/A-1b, что позволяет разработчики должны проверить способность своего программного обеспечения соответствовать самому базовому уровню соответствия стандарту. [23] [24] К середине 2009 года набор тестов уже оказал заметное влияние на общее качество программного обеспечения для проверки PDF/A. [25]
veraPDF [ править ]
Консорциум veraPDF во главе с Open Preservation Foundation. [26] и Ассоциация PDF была создана в ответ на вызов PREFORMA Комиссии ЕС. [27] разработать валидатор с открытым исходным кодом для формата PDF/A. В ноябре 2014 года Ассоциация PDF создала Техническую рабочую группу по валидации PDF, чтобы сформулировать план разработки отраслевого валидатора PDF/A. [28] [ не удалось пройти проверку ]
Впоследствии в апреле 2015 года консорциум veraPDF выиграл второй этап контракта PREFORMA. [29] Разработка продолжалась в течение 2016 года. [30] Фаза 2 будет завершена в соответствии с графиком к декабрю 2016 г. Период тестирования и приемки фазы 3 завершился в июле 2017 г. veraPDF теперь охватывает все части (1, 2 и 3) и уровни соответствия (a, b, u) PDF/A. .
veraPDF доступен для установки в Windows, macOS или Linux с использованием анализатора PDF на основе PDFBox или «Greenfields». [31]
Программы просмотра PDF/A [ править ]
Спецификация PDF/A также устанавливает некоторые требования к соответствующему средству просмотра PDF/A, которое должно
- игнорировать любые данные, не описанные стандартами PDF и PDF/A;
- игнорировать любую информацию о линеаризации, предоставленную файлом;
- используйте только встроенные шрифты (а не любые локально доступные, замененные или имитированные шрифты);
- отображать только с использованием встроенного цветового профиля;
- гарантировать, что поля формы не изменяют отображаемое представление и отображаются без учета данных формы;
- убедитесь, что аннотации отображаются последовательно.
При обнаружении файла, который заявляет о соответствии PDF/A, некоторые средства просмотра PDF по умолчанию переходят в специальный «режим просмотра PDF/A», чтобы удовлетворить соответствующие требования читателя. Возьмем один пример: Adobe Acrobat и Adobe Reader 9 включают предупреждение, информирующее пользователя о том, что режим просмотра PDF/A активирован. Некоторые программы просмотра PDF-файлов позволяют пользователям отключать режим просмотра PDF/A или удалять информацию PDF/A из файла. [32] [33]
Прием [ править ]
Документ PDF/A должен включать все используемые шрифты; соответственно, файл PDF/A часто будет больше, чем эквивалентный файл PDF, не содержащий встроенных шрифтов.
Использование прозрачности запрещено в PDF/A-1. Большинство инструментов создания PDF-файлов, обеспечивающих соответствие документов PDF/A, таких как экспорт PDF в OpenOffice.org или инструмент экспорта PDF в пакетах Microsoft Office 2007, также делают любые прозрачные изображения в данном документе непрозрачными. Это ограничение было снято в PDF/A-2. [10]
Некоторые архивисты выразили обеспокоенность тем, что PDF/A-3, который позволяет встраивать произвольные файлы в документы PDF/A, может привести к обходу процедур учреждения памяти и ограничений на архивные форматы. [34]
Ассоциация PDF рассмотрела различные заблуждения [35] относительно PDF/A в своей публикации «PDF/A в двух словах 2.0». [36]
См. также [ править ]
- Цифровой темный век
- PDF/E – для инженерно-технической документации
- PDF/X — еще одно подмножество стандарта PDF, оптимизированное для печати.
- PDF/VT – для переменной и транзакционной печати
Дальнейшее чтение [ править ]
- PDF/A в двух словах 2.0 – опубликовано PDF Association (2013 г.)
- PDF/A 101: Введение – презентация Первой международной конференции PDF/A (2008 г.)
- Технический документ: PDF/A – Основы – от PDF Tools AG (2009 г.)
- Описание формата PDF/A-1 — на сайте digitalpreservation.gov.
Ссылки [ править ]
- ^ Эттлер, Александра (2013). «Факты в формате PDF / A - введение в стандарт». PDF/A в двух словах 2.0 (PDF) . Архивировано (PDF) из оригинала 29 июля 2021 г. Проверено 29 июля 2021 г.
{{cite book}}
:|website=
игнорируется ( помогите ) - ↑ Перейти обратно: Перейти обратно: а б «ИСО 19005-1:2005» . ИСО . Архивировано из оригинала 18 августа 2016 г. Проверено 27 июля 2016 г.
- ↑ Перейти обратно: Перейти обратно: а б «ИСО 19005-2:2011» . ИСО . Архивировано из оригинала 17 августа 2016 г. Проверено 27 июля 2016 г.
- ↑ Перейти обратно: Перейти обратно: а б «ИСО 19005-3:2012» . ИСО . Архивировано из оригинала 17 августа 2016 г. Проверено 27 июля 2016 г.
- ^ «ИСО 19005-4:2020» . ИСО . Архивировано из оригинала 9 февраля 2021 г. Проверено 4 февраля 2021 г.
- ^ «Краткая история PDF/A» . PDF Ассоциация . 07.02.2013. Архивировано из оригинала 14 июля 2014 г. Проверено 11 июля 2014 г.
- ^ Эттлер, Александра (7 февраля 2013 г.). «Наиболее важные причины использовать PDF/A» . PDF Ассоциация . Архивировано из оригинала 14 июля 2014 г. Проверено 11 июля 2014 г.
- ^ Эттлер, Александра (7 февраля 2013 г.). «Типичное использование PDF/A» . PDF Ассоциация . Архивировано из оригинала 14 июля 2014 г. Проверено 11 июля 2014 г.
- ^ Эттлер, Александра (7 февраля 2013 г.). «Техническая сторона стандарта PDF/A» . PDF Ассоциация . Архивировано из оригинала 02 июля 2015 г. Проверено 7 августа 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б «PDF/A – Взгляд на техническую сторону» . Архивировано из оригинала 26 июля 2011 г. Проверено 6 июля 2011 г.
- ↑ Перейти обратно: Перейти обратно: а б «Стандарт PDF/A-2, опубликованный ISO! Новый стандарт включает значительные технические улучшения» . 01 июля 2011 г. Архивировано из оригинала 11 января 2012 г. Проверено 6 июля 2011 г.
- ^ Часто задаваемые вопросы (FAQ) – ISO 19005-1:2005 – PDF/A-1, Дата: 10 июля 2006 г. (PDF) , 10 июля 2006 г., заархивировано из оригинала (PDF) 18 января 2012 г. , получено 06.07.2011
- ↑ Перейти обратно: Перейти обратно: а б с «Улучшенный PDF/A-1b» . PDF Ассоциация . 05.08.2011. Архивировано из оригинала 15 сентября 2012 г. Проверено 26 сентября 2012 г.
- ^ Эттлер, Александра (7 февраля 2013 г.). «PDF/A и другие стандарты PDF» . PDF Ассоциация . Архивировано из оригинала 14 июля 2014 г. Проверено 12 июля 2014 г.
- ^ PDF/A-2, PDF для долгосрочного хранения, использование ISO 32000-1 (PDF 1.7) , Библиотека Конгресса, заархивировано из оригинала 30 января 2013 г. , получено 26 сентября 2012 г.
- ^ «Ассоциация PDF организует свой первый семинар по PDF/A, включающий стандарты 1–3» . PDF Ассоциация . 2012-03-29. Архивировано из оригинала 15 сентября 2012 г.
- ^ «Новый PDF 2.0 и подмножества стандартов (Ассоциация PDF)» . Архивировано из оригинала 27 января 2021 г. Проверено 4 февраля 2021 г.
- ↑ Перейти обратно: Перейти обратно: а б Сури, Роланд Эрвин (15 февраля 2017 г.). «Как создать файл PDF/A?» . doi : 10.16911/ethz-ib-2722-de . Архивировано из оригинала 25 мая 2022 года . Проверено 30 мая 2022 г.
- ↑ Перейти обратно: Перейти обратно: а б Сури, Роланд Эрвин; Эль-Саад, Мохамед (6 июня 2018 г.). «Потеряно при миграции: качество документа при пакетном преобразовании в PDF/A». Библиотека высоких технологий . 39 (2): LHT–10–2017-0220. дои : 10.1108/LHT-10-2017-0220 . hdl : 20.500.11850/269199 . ISSN 0737-8831 . S2CID 67441801 .
- ^ Дрюммер, Олаф (22 сентября 2007 г.). «PDF/A – Взгляд на техническую сторону» (PDF) . Центр компетенции PDF/A . PDF Ассоциация . п. 5. Архивировано (PDF) из оригинала 19 августа 2022 г. Проверено 15 июня 2022 г.
- ^ «ИНСТРУКЦИЯ ПО СОЗДАНИЮ PDF/A-СОВМЕСТИМЫХ ФАЙЛОВ ДЛЯ ОНЛАЙН-ПУБЛИКАЦИИ В TU BERLIN» (PDF) . Архивировано из оригинала (PDF) 11 июля 2020 г. Проверено 8 июля 2020 г.
- ^ Эттлер, Александра (7 февраля 2013 г.). «Проверка: действительно ли это PDF/A?» . PDF Ассоциация . Архивировано из оригинала 21 сентября 2016 г. Проверено 11 июля 2014 г.
- ^ Тестовый комплект Isartor (PDF) . Центр компетенции PDF/A. 12 августа 2008 г. Архивировано (PDF) из оригинала 22 июня 2015 г. Проверено 23 сентября 2016 г.
- ^ «Тестовый набор Изартора» . PDF Ассоциация . 03 августа 2011 г. Архивировано из оригинала 23 сентября 2016 г. Проверено 23 сентября 2016 г.
- ^ «Баварский репортаж» . PDFlib . 2009. Архивировано из оригинала 21 апреля 2015 г. Проверено 30 апреля 2015 г.
- ^ «Проект open Preservation Foundation veraPDF» . Открытый фонд сохранения . Архивировано из оригинала 28 апреля 2015 г. Проверено 30 апреля 2015 г.
- ^ PREFORMA, проект, финансируемый Комиссией ЕС , заархивировано из оригинала 27 апреля 2015 г. , получено 30 апреля 2015 г.
- ^ «Консорциум, включающий Ассоциацию PDF, выигрывает первый этап тендера Комиссии ЕС на создание валидатора PDF/A с открытым исходным кодом» . PDF Ассоциация . 13 ноября 2014 г. Архивировано из оригинала 21 апреля 2015 г. Проверено 30 апреля 2015 г.
- ^ PREFORMA начинает этап создания прототипа , заархивировано из оригинала 27 апреля 2015 г. , получено 30 апреля 2015 г.
- ^ «Выпущена версия veraPDF 0.22» . 8 сентября 2016 г. Архивировано из оригинала 24 сентября 2016 г. Проверено 23 сентября 2016 г.
- ^ "Программное обеспечение" . ВераPDF . 30 июня 2015 г. Архивировано из оригинала 15 марта 2017 г. Проверено 15 марта 2017 г. Страница для загрузки установщика для конкретной платформы.
- ^ «Как удалить информацию PDF/A из файла» . Архивировано из оригинала 13 апреля 2014 г. Проверено 10 апреля 2014 г.
- ^ «Изменить режим просмотра PDF/A» . Архивировано из оригинала 13 апреля 2014 г. Проверено 10 апреля 2014 г.
- ^ Архивариусы: Цветов нет для PDF/A-3 , заархивировано из оригинала 14 августа 2014 г. , получено 12 июля 2014 г.
- ^ Мифы и легенды, окружающие PDF/A , заархивировано из оригинала 16 февраля 2018 г. , получено 15 февраля 2018 г.
- ^ «PDF/A в двух словах 2.0» . 23 мая 2013 г. Архивировано из оригинала 3 июня 2019 г. . Проверено 3 июня 2019 г.
Внешние ссылки [ править ]
- PDF-ассоциация
- Центр компетенции PDF/A
- veraPDF – программное обеспечение для проверки PDF/A