Расширение имени файла | .pdf |
---|---|
Тип интернет-СМИ |
|
Введите код | PDF [1] (включая один конечный пробел) |
Единый идентификатор типа (UTI) | com.adobe.pdf |
Магическое число | %PDF |
Разработано | Adobe Inc. (1991–2008 гг.) ИСО (2008–) |
Первоначальный выпуск | 15 июня 1993 г |
Последний выпуск | 2.0 |
Распространено на | PDF/A , PDF/E , PDF/UA , PDF/VT , PDF/X |
Стандартный | ИСО 32000-2 |
Открытый формат ? | Да |
Веб-сайт | изо |
Portable Document Format ( PDF ), стандартизированный как ISO 32000 , — это формат файлов, разработанный Adobe в 1992 году для представления документов , включая форматирование текста и изображений, способом, независимым от прикладного программного обеспечения , оборудования и операционных систем . [2] [3] Основанный на языке PostScript , каждый PDF-файл содержит полное описание плоского документа с фиксированным макетом, включая текст, шрифты , векторную графику , растровые изображения и другую информацию, необходимую для его отображения. PDF берет свое начало в «Проекте Камелот», инициированном соучредителем Adobe Джоном Уорноком в 1991 году. [4] PDF был стандартизирован как ISO 32000 в 2008 году. [5] Последняя редакция ISO 32000-2:2020 была опубликована в декабре 2020 года.
PDF-файлы могут содержать различное содержимое, помимо простого текста и графики, включая элементы логического структурирования, интерактивные элементы, такие как аннотации и поля форм, слои, мультимедийные материалы (включая видеоконтент), трехмерные объекты с использованием U3D или PRC и различные другие форматы данных . Спецификация PDF также предусматривает шифрование и цифровые подписи , вложения файлов и метаданные для обеспечения рабочих процессов, требующих этих функций.
История
[ редактировать ]Разработка PDF началась в 1991 году, когда Джон Уорнок написал статью для проекта под кодовым названием Camelot, в которой он предложил создать упрощенную версию PostScript под названием Interchange PostScript (IPS). [6] В отличие от традиционного PostScript, который был сосредоточен на рендеринге заданий печати на устройствах вывода, IPS будет оптимизирован для отображения страниц на любом экране и любой платформе. [6]
Adobe Systems предоставила бесплатную спецификацию PDF в 1993 году. В первые годы PDF был популярен в основном в рабочих процессах настольных издательских систем и конкурировал с несколькими другими форматами, включая DjVu , Envoy , Common Ground Digital Paper, Farallon Replica и даже собственный PostScript Adobe. формат.
PDF был собственным форматом, контролируемым Adobe, пока он не был выпущен в качестве открытого стандарта 1 июля 2008 года и опубликован Международной организацией по стандартизации как ISO 32000-1:2008. [7] [8] после этого контроль над спецификацией перешел к комитету ISO, состоящему из добровольных отраслевых экспертов. В 2008 году Adobe опубликовала публичную патентную лицензию по стандарту ISO 32000-1, предоставляющую безвозмездные права на все патенты, принадлежащие Adobe, необходимые для создания, использования, продажи и распространения реализаций, совместимых с PDF. [9]
PDF 1.7, шестое издание спецификации PDF, ставшей стандартом ISO 32000-1, включает в себя некоторые собственные технологии, определенные только Adobe, такие как Adobe XML Forms Architecture (XFA) и расширение JavaScript для Acrobat, на которые в ISO 32000-1 ссылаются как нормативный и незаменимый для полной реализации спецификации ISO 32000-1. [10] Эти запатентованные технологии не стандартизированы, и их спецификация публикуется только на веб-сайте Adobe. [11] [12] [13] Многие из них не поддерживаются популярными сторонними реализациями PDF.
ISO опубликовала ISO 32000-2 в 2017 году, которую можно приобрести, заменив бесплатную спецификацию, предоставленную Adobe. [14] В декабре 2020 года было опубликовано второе издание PDF 2.0, ISO 32000-2:2020, с разъяснениями, исправлениями и критическими обновлениями нормативных ссылок. [15] (ISO 32000-2 не включает в себя какие-либо запатентованные технологии в качестве нормативных ссылок). [16] В апреле 2023 года Ассоциация PDF сделала ISO 32000-2 доступным для бесплатного скачивания. [14]
Технические детали
[ редактировать ]Файл PDF часто представляет собой комбинацию векторной графики , текста и растровой графики . Основные типы контента в PDF:
- Набранный текст, хранящийся в виде потоков контента (т. е. не кодируемый в виде обычного текста );
- Векторная графика для иллюстраций и дизайнов, состоящих из фигур и линий;
- Растровая графика для фотографий и других видов изображений; и
- Другие мультимедийные объекты.
В более поздних версиях PDF документ PDF также может поддерживать ссылки (внутри документа или веб-страницы), формы, JavaScript (изначально доступен в виде подключаемого модуля для Acrobat 3.0) или любые другие типы встроенного содержимого, с которым можно работать с помощью подключаемых модулей.
PDF сочетает в себе три технологии:
- Эквивалентное подмножество языка программирования описания страниц PostScript, но в декларативной форме, для создания макета и графики.
- Система встраивания/замены шрифтов , позволяющая шрифтам перемещаться вместе с документами.
- Структурированная система хранения для объединения этих элементов и любого связанного с ними содержимого в один файл со сжатием данных , где это необходимо.
Язык PostScript
[ редактировать ]PostScript — это язык описания страниц , запускаемый в интерпретаторе для создания изображения. [6] Он может обрабатывать графику и имеет стандартные функции языков программирования, такие как ветвления и циклы . [6] PDF — это подмножество PostScript, упрощенное для удаления таких функций потока управления , при этом графические команды остаются. [6]
PostScript изначально был разработан для совершенно другого варианта использования : передачи односторонних заданий линейной печати, при которых интерпретатор PostScript собирал серию команд до тех пор, пока не встречал showpage
команду, затем выполните все команды для рендеринга страницы в виде растрового изображения на печатающем устройстве. [17] PostScript не был предназначен для длительного хранения и интерактивного рендеринга электронных документов в реальном времени на мониторы компьютеров , поэтому не было необходимости поддерживать что-либо, кроме последовательного рендеринга страниц. [17] Если в окончательном печатном выводе была ошибка, пользователь исправлял ее на уровне приложения и отправлял новое задание на печать в виде совершенно нового файла PostScript. Таким образом, любая страница в файле PostScript могла быть точно отображена только как совокупный результат выполнения всех предыдущих команд для рисования всех предыдущих страниц (любая из которых могла повлиять на последующие страницы) плюс команд для рисования этой конкретной страницы, и не было никакого простой способ обойти этот процесс и переходить на разные страницы. [17]
Традиционно для перехода от PostScript к PDF исходный файл PostScript (то есть исполняемая программа) используется в качестве основы для генерации PostScript-подобного PDF-кода (см., например, Adobe Distiller ). Это делается путем применения стандартных компилятора, методов таких как развертывание цикла , встраивание и удаление неиспользуемых ветвей, в результате чего код становится чисто декларативным и статическим. [17] Конечный результат затем упаковывается в формат контейнера вместе со всеми необходимыми зависимостями для корректного рендеринга (внешние файлы, графика или шрифты, на которые ссылается документ) и сжимается . Современные приложения записывают данные в драйверы принтеров, которые напрямую генерируют PDF-файл, а не сначала обрабатывают PostScript.
PDF как формат документа имеет ряд преимуществ перед PostScript:
- PDF содержит только статический декларативный код PostScript, который можно обрабатывать как данные, и не требует полноценного программного интерпретатора или компилятора . [17] Это позволяет избежать сложностей и рисков безопасности, присущих движку такого более высокого уровня сложности.
- Как и Display PostScript , PDF поддерживает прозрачную графику, начиная с версии 1.4, тогда как стандартный PostScript этого не делает.
- PDF применяет правило, согласно которому код любой конкретной страницы не может влиять на другие страницы. [17] Это правило настоятельно рекомендуется и для кода PostScript, но оно должно быть реализовано явно (см., например, Соглашения о структурировании документов ), поскольку PostScript — это полноценный язык программирования, обеспечивающий такую большую гибкость и не ограничивающийся концепциями страниц и документы.
- Все данные, необходимые для рендеринга, включены в сам файл, что повышает переносимость. [18]
Его недостатки:
- Потеря гибкости и ограничение одним вариантом использования. [ нужна ссылка ]
- Размер файла (иногда намного) больший. [19]
PDF начиная с версии 1.6 поддерживает встраивание интерактивных 3D-документов: 3D-чертежи можно встраивать с использованием U3D или PRC , а также различных других форматов данных. [20] [21] [22]
Формат файла
[ редактировать ]Файл PDF организован с использованием символов ASCII , за исключением некоторых элементов, которые могут иметь двоичное содержимое.Файл начинается с заголовка, содержащего магическое число (в виде читаемой строки) и версию формата, например %PDF-1.7
. Этот формат является подмножеством формата COS («структура объекта «карусель»). [23] Файл дерева COS состоит в основном из объектов , которых существует девять типов: [16]
- Логические значения, представляющие истину или ложь
- Реальные числа
- Целые числа
- Строки , заключенные в круглые скобки (
(...)
) или представлено в шестнадцатеричном виде в одинарных угловых скобках (<...>
). Строки могут содержать 8-битные символы. - Имена, начинающиеся с косой черты (
/
) - Массивы — упорядоченные коллекции объектов, заключенные в квадратные скобки (
[...]
) - Словари , коллекции объектов, индексированные по именам, заключенным в двойные угловые скобки (
<<...>>
) - Потоки , обычно содержащие большие объемы опционально сжатых двоичных данных, которым предшествует словарь и заключенный между
stream
иendstream
ключевые слова. - Нулевой объект
Комментарии, использующие 8-битные символы с префиксом знака процента ( %
) можно вставить.
Объекты могут быть либо прямыми (встроенными в другой объект), либо косвенными . Косвенные объекты нумеруются номером объекта и номером поколения и определяются между obj
и endobj
ключевые слова, если они находятся в корне документа. Начиная с PDF версии 1.5, косвенные объекты (за исключением других потоков) также могут располагаться в специальных потоках, известных как потоки объектов (с пометкой /Type /ObjStm
). Этот метод позволяет применять к непотоковым объектам стандартные фильтры потока, уменьшает размер файлов, содержащих большое количество небольших косвенных объектов, и особенно полезен для PDF с тегами . объекта Потоки объектов не поддерживают указание номера поколения (отличного от 0).
Индексная таблица, также называемая таблицей перекрестных ссылок, расположена ближе к концу файла и дает смещение в байтах каждого косвенного объекта от начала файла. [24] Такая конструкция обеспечивает эффективный произвольный доступ к объектам в файле, а также позволяет вносить небольшие изменения без перезаписи всего файла ( инкрементное обновление ). До версии PDF 1.5 таблица всегда была в специальном формате ASCII и отмечалась знаком xref
ключевое слово и следовать за основной частью, состоящей из косвенных объектов. В версии 1.5 представлены дополнительные потоки перекрестных ссылок , которые имеют форму стандартного объекта потока, возможно, с примененными фильтрами. Такой поток может использоваться вместо таблицы перекрестных ссылок ASCII и содержит смещения и другую информацию в двоичном формате. Формат является гибким, поскольку позволяет указывать целочисленную ширину (с помощью /W
массив), так что, например, документ не более 64 КиБ размером может выделить только 2 байта для смещений объектов.
В конце PDF-файла находится нижний колонтитул, содержащий
- The
startxref
ключевое слово, за которым следует смещение к началу таблицы перекрестных ссылок (начиная сxref
ключевое слово) или объект потока перекрестных ссылок, за которым следует - The
%%EOF
маркер конца файла .
Если поток перекрестных ссылок не используется, нижнему колонтитулу предшествует trailer
ключевое слово, за которым следует словарь, содержащий информацию, которая в противном случае содержалась бы в словаре объекта потока перекрестных ссылок:
- Ссылка на корневой объект древовидной структуры, также известный как каталог (
/Root
) - Количество косвенных объектов в таблице перекрестных ссылок (
/Size
) - Другая дополнительная информация
На каждой странице имеется один или несколько потоков контента, описывающих текст, вектор и изображения, рисуемые на странице. Поток содержимого основан на стеке , аналогично PostScript. [25]
PDF-файлы имеют два макета: нелинейный (не «оптимизированный») и линеаризованный («оптимизированный»). Нелинеаризованные PDF-файлы могут быть меньше, чем их линейные аналоги, однако доступ к ним медленнее, поскольку части данных, необходимые для сборки страниц документа, разбросаны по всему PDF-файлу. Линеаризованные PDF-файлы (также называемые «оптимизированными» или «веб-оптимизированными» PDF-файлами) создаются таким образом, чтобы их можно было читать в плагине веб-браузера, не дожидаясь загрузки всего файла, поскольку все объекты, необходимые для первой страницы, для отображения оптимально организованы в начале файла. [26] PDF-файлы можно оптимизировать с помощью программного обеспечения Adobe Acrobat или QPDF .
Размеры страницы не ограничены самим форматом. Однако Adobe Acrobat накладывает ограничение в 15 миллионов на 15 миллионов дюймов, или 225 триллионов в 2 (145 161 км 2 ). [2] : 1129
Модель изображения
[ редактировать ]Базовый дизайн представления графики в PDF очень похож на дизайн PostScript, за исключением использования прозрачности, которая была добавлена в PDF 1.4.
Графика PDF использует независимую от устройства декартову систему координат для описания поверхности страницы. В описании страницы PDF можно использовать матрицу для масштабирования , поворота или наклона графических элементов. Ключевой концепцией PDF является состояние графики , которое представляет собой набор графических параметров, которые можно изменять, сохранять и восстанавливать с помощью описания страницы . PDF имеет (начиная с версии 2.0) 25 свойств состояния графики, из которых наиболее важными являются:
- Текущая матрица преобразования (КТМ), определяющая систему координат
- контур Обтравочный
- Цветовое пространство
- Альфа -константа , которая является ключевым компонентом прозрачности.
- Управление компенсацией черной точки (представлено в PDF 2.0)
Векторная графика
[ редактировать ]Как и в PostScript, векторная графика в PDF создается с помощью путей . Контуры обычно состоят из линий и кубических кривых Безье , но также могут быть построены из контуров текста. В отличие от PostScript, PDF не позволяет смешивать контуры текста с линиями и кривыми по одному контуру. Контуры можно обводить, заливать, заполнять, а затем обводить или использовать для обрезки . Обводки и заливки могут использовать любой цвет, установленный в графическом состоянии, включая узоры . PDF поддерживает несколько типов шаблонов. Самый простой — это шаблон мозаики , в котором произведение искусства должно прорисовываться повторно. Это может быть цветной узор мозаики с цветами, указанными в объекте узора, или неокрашенный узор мозаики , в котором указание цвета откладывается до момента рисования узора. Начиная с PDF 1.3, существует также шаблон затенения , который рисует непрерывно меняющиеся цвета. Существует семь типов рисунков штриховки, из которых самыми простыми являются осевая штриховка (Тип 2) и радиальная штриховка (Тип 3).
Растровые изображения
[ редактировать ]Растровые изображения в формате PDF (называемые Image XObjects ) представлены словарями со связанным потоком. Словарь описывает свойства изображения, а поток содержит данные изображения. (Реже небольшие растровые изображения могут быть встроены непосредственно в описание страницы в виде встроенного изображения .) Изображения обычно фильтруются в целях сжатия. Фильтры изображений, поддерживаемые в PDF, включают следующие фильтры общего назначения:
- ASCII85Decode — фильтр, используемый для преобразования потока в 7-битный код ASCII.
- ASCIIHexDecode похож на ASCII85Decode, но менее компактен.
- FlateDecode — широко используемый фильтр, основанный на алгоритме deflate, определенном в RFC 1951 (deflate также используется, среди прочего, в форматах файлов gzip , PNG и zip ); представлено в PDF 1.2; он может использовать одну из двух групп функций-предсказателей для более компактного сжатия zlib/deflate: Predictor 2 из спецификации TIFF 6.0 и предикторы (фильтры) из спецификации PNG ( RFC 2083 ),
- LZWDecode — фильтр, основанный на LZW сжатии ; он может использовать одну из двух групп функций-предсказателей для более компактного сжатия LZW: предиктор 2 из спецификации TIFF 6.0 и предикторы (фильтры) из спецификации PNG,
- RunLengthDecode — простой метод сжатия потоков с повторяющимися данными с использованием алгоритма кодирования длин серий и фильтров, специфичных для изображения.
- DCTDecode — фильтр с потерями , основанный на стандарте JPEG .
- CCITTFaxDecode , двухуровневый группы 3 или группы 4 CCITT (ITU-T) (черный/белый) фильтр без потерь, основанный на стандарте сжатия факсов , определенном в ITU-T T.4 и T.6,
- JBIG2Decode с потерями или без потерь — двухуровневый (черный/белый) фильтр , основанный на стандарте JBIG2 , представленном в PDF 1.4, и
- JPXDecode — фильтр с потерями или без потерь, основанный на стандарте JPEG 2000 , представленный в PDF 1.5.
Обычно все содержимое изображений в PDF-файле встроено в файл. Но PDF позволяет хранить данные изображения во внешних файлах с помощью внешних потоков или альтернативных изображений . Стандартизированные подмножества PDF, включая PDF/A и PDF/X , запрещают эти функции.
Текст
[ редактировать ]Текст в PDF представлен текстовыми элементами в потоках содержимого страницы. Текстовый элемент указывает, что символы должны быть нарисованы в определенных позициях. Символы указываются с использованием кодировки выбранного ресурса шрифта .
Объект шрифта в PDF — это описание цифрового шрифта . Он может либо описывать характеристики шрифта, либо включать встроенный файл шрифта . Последний случай называется встроенным шрифтом , а первый — невстроенным шрифтом . Файлы шрифтов, которые могут быть встроены, основаны на широко используемых стандартных форматах цифровых шрифтов: Type 1 (и его сжатый вариант CFF), TrueType и (начиная с PDF 1.6) OpenType . Кроме того, PDF поддерживает вариант Типа 3, в котором компоненты шрифта описываются графическими операторами PDF.
Четырнадцать шрифтов, известные как 14 стандартных шрифтов , имеют особое значение в документах PDF:
- Время (v3) (обычным шрифтом, курсивом, жирным шрифтом и полужирным курсивом)
- Курьер (обычным, наклонным, жирным и наклонным жирным шрифтом)
- Helvetica (v3) (обычный, наклонный, жирный и наклонный жирный шрифт)
- Символ
- Цапф Дингбатс
Эти шрифты иногда называют базовыми четырнадцати шрифтами . [27] Эти шрифты или подходящие заменяющие шрифты с теми же метриками должны быть доступны в большинстве программ чтения PDF, но их не гарантируется и может отображаться правильно, только если они установлены в системе. доступность в программе чтения [28] Шрифты могут быть заменены, если они не встроены в PDF-файл.
В текстовых строках символы отображаются с использованием кодов символов (целых чисел), которые сопоставляются с глифами текущего шрифта с помощью кодировки . Существует несколько предопределенных кодировок, включая WinAnsi , MacRoman и множество кодировок для восточноазиатских языков, а шрифт может иметь собственную встроенную кодировку. (Хотя кодировки WinAnsi и MacRoman основаны на исторических свойствах операционных систем Windows и Macintosh , шрифты, использующие эти кодировки, одинаково хорошо работают на любой платформе.) В PDF можно указать предопределенную кодировку, встроенную кодировку шрифта или предоставить таблица поиска отличий от предопределенной или встроенной кодировки (не рекомендуется для шрифтов TrueType). [2] Механизмы кодирования в PDF были разработаны для шрифтов Type 1, а правила их применения к шрифтам TrueType сложны.
Для крупных шрифтов или шрифтов с нестандартными глифами специальные кодировки Identity-H (для горизонтального письма) и Identity-V используются (для вертикального). Для таких шрифтов необходимо предоставить таблицу ToUnicode , если необходимо сохранить семантическую информацию о символах.
Текстовый документ, который сканируется в PDF без распознавания текста с помощью оптического распознавания символов (OCR), представляет собой изображение без шрифтов или свойств текста.
Прозрачность
[ редактировать ]Исходная модель изображения PDF была непрозрачной, подобно PostScript, где каждый объект, нарисованный на странице, полностью заменял все, что было ранее отмечено в том же месте. В PDF 1.4 модель изображения была расширена, чтобы обеспечить прозрачность. При использовании прозрачности новые объекты взаимодействуют с ранее отмеченными объектами, создавая эффекты наложения. Добавление прозрачности в PDF было сделано с помощью новых расширений, которые были разработаны так, чтобы их можно было игнорировать в продуктах, написанных в соответствии со спецификациями PDF 1.3 и более ранних версий. В результате файлы, в которых используется небольшая степень прозрачности, могут просматриваться более старыми программами просмотра приемлемо, но файлы, в которых широко используется прозрачность, могут просматриваться старыми программами просмотра неправильно.
Расширения прозрачности основаны на ключевых понятиях групп прозрачности , режимов наложения , формы и альфа-канала . Модель тесно связана с функциями Adobe Illustrator версии 9. Режимы наложения были основаны на тех, которые использовались в Adobe Photoshop в то время. Когда была опубликована спецификация PDF 1.4, формулы для расчета режимов наложения Adobe держала в секрете. С тех пор они были опубликованы. [29]
Концепция группы прозрачности в спецификации PDF не зависит от существующих понятий «группа» или «слой» в таких приложениях, как Adobe Illustrator. Эти группировки отражают логические связи между объектами, которые имеют смысл при редактировании этих объектов, но они не являются частью модели изображения.
Дополнительные возможности
[ редактировать ]Логическая структура и доступность
[ редактировать ]PDF- файл с тегами (см. пункт 14.8 стандарта ISO 32000) включает в себя структуру документа и семантическую информацию, обеспечивающую надежное извлечение текста и доступность . [30] Технически говоря, PDF с тегами — это стилизованное использование формата, основанное на структуре логической структуры, представленной в PDF 1.3. PDF с тегами определяет набор стандартных типов структур и атрибутов, которые позволяют извлекать и повторно использовать содержимое страницы (текст, графику и изображения) для других целей. [31]
PDF с тегами не требуется в ситуациях, когда PDF-файл предназначен только для печати. Поскольку эта функция является необязательной, а правила для PDF с тегами в ISO 32000-1 были относительно расплывчатыми, по состоянию на 2021 год поддержка PDF с тегами среди потребляющих устройств, включая вспомогательные технологии (AT), неравномерна. [32] Однако ISO 32000-2 включает улучшенное описание PDF с тегами, которое, как ожидается, облегчит его дальнейшее внедрение.
Стандартизованное ISO подмножество PDF, специально предназначенное для обеспечения доступности, PDF/UA , было впервые опубликовано в 2012 году.
Дополнительные группы контента (слои)
[ редактировать ]С появлением PDF версии 1.5 (2003 г.) появилась концепция слоев. Слои, более формально известные как группы дополнительного контента (OCG), относятся к разделам контента в PDF-документе, которые могут быть выборочно просмотрены или скрыты авторами или зрителями документа. Эта возможность полезна в чертежах САПР, многослойных изображениях, картах, многоязычных документах и т. д.
По сути, он состоит из словаря необязательных свойств содержимого, добавленного в корень документа. Этот словарь содержит массив групп дополнительного контента (OCG), каждая из которых описывает набор информации и каждая из которых может индивидуально отображаться или подавляться, а также набор словарей конфигурации дополнительного контента, которые определяют статус (отображается или подавляется) учитывая ОПГ.
Шифрование и подписи
[ редактировать ]В целях безопасности PDF-файл может быть зашифрован , и в этом случае для просмотра или редактирования содержимого потребуется пароль. PDF 2.0 определяет 256-битное шифрование AES как стандарт для файлов PDF 2.0. Справочник по PDF также определяет способы, которыми третьи стороны могут определять свои собственные системы шифрования для PDF.
PDF-файлы могут иметь цифровую подпись для обеспечения безопасной аутентификации; Полная информация о реализации цифровых подписей в PDF представлена в ISO 32000-2.
PDF-файлы также могут содержать встроенные ограничения DRM , которые обеспечивают дополнительные элементы управления, ограничивающие копирование, редактирование или печать. Эти ограничения зависят от того, подчиняется ли им программное обеспечение считывателя, поэтому обеспечиваемая ими безопасность ограничена.
Стандартная безопасность, обеспечиваемая PDF, состоит из двух разных методов и двух разных паролей: пароля пользователя , который шифрует файл и предотвращает его открытие, и пароля владельца , который определяет операции, которые следует ограничить даже после расшифровки документа, включая изменение, печать или копирование текста и графики из документа, а также добавление или изменение текстовых примечаний и AcroForm полей . Пароль пользователя шифрует файл, а пароль владельца — нет, вместо этого полагаясь на то, что клиентское программное обеспечение соблюдает эти ограничения. Пароль владельца можно легко удалить с помощью программного обеспечения, в том числе некоторых бесплатных онлайн-сервисов. [33] Таким образом, ограничения на использование, которые автор документа накладывает на документ PDF, не являются безопасными и не могут быть гарантированы после распространения файла; это предупреждение отображается при применении таких ограничений с использованием программного обеспечения Adobe Acrobat для создания или редактирования файлов PDF.
Даже без удаления пароля большинство бесплатных программ или программ для чтения PDF-файлов с открытым исходным кодом игнорируют «защиту» разрешений и позволяют пользователю распечатывать или копировать отрывки текста, как если бы документ не был ограничен защитой паролем. [34] [35] [36]
Начиная с PDF 1.5, подписи прав использования (UR) используются для включения дополнительных интерактивных функций, которые недоступны по умолчанию в конкретном приложении просмотра PDF. Подпись используется для подтверждения того, что разрешения были предоставлены добросовестным органом, предоставляющим разрешения. Например, его можно использовать, чтобы разрешить пользователю: [37]
- Сохранение PDF-документа вместе с измененной формой или данными аннотаций
- Импортируйте файлы данных форм в форматах FDF, XFDF и текстовом (CSV/TSV).
- Экспорт файлов данных форм в форматах FDF и XFDF.
- Отправить данные формы
- Создание экземпляров новых страниц из именованных шаблонов страниц.
- Применение цифровой подписи к существующему полю формы цифровой подписи
- Создание, удаление, изменение, копирование, импорт и экспорт аннотаций.
Например, Adobe Systems предоставляет разрешения на включение дополнительных функций Adobe Reader с использованием шифрования с открытым ключом . Adobe Reader проверяет, что в подписи используется сертификат авторизованного Adobe центра сертификации. Любое PDF-приложение может использовать этот же механизм в своих целях. [37]
При определенных обстоятельствах, включая непропатченные системы получателя, информация, которую видит получатель документа с цифровой подписью , может манипулироваться отправителем после того, как документ был подписан подписывающим лицом. [38]
PAdES ( PDF Advanced Electronic Signatures ) — это набор ограничений и расширений PDF и ISO 32000-1. [39] что делает его пригодным для расширенных электронных подписей . Он опубликован ETSI как TS 102 778. [40]
Вложения файлов
[ редактировать ]PDF-файлы могут иметь вложения, к которым процессоры могут получить доступ и открыть их или сохранить в локальной файловой системе. [41]
Метаданные
[ редактировать ]PDF-файлы могут содержать два типа метаданных. [2] Первый — это словарь информации о документе, набор полей «ключ-значение», таких как автор, название, тема, даты создания и обновления. Это необязательно и на него ссылается Info
ключ в трейлере файла. Определен небольшой набор полей, который при необходимости можно расширить дополнительными текстовыми значениями. Этот метод устарел в PDF 2.0.
В PDF 1.4 была добавлена поддержка потоков метаданных с использованием расширяемой платформы метаданных (XMP) для добавления расширяемых метаданных на основе стандартов XML, используемых в других форматах файлов. PDF 2.0 позволяет прикреплять метаданные к любому объекту в документе, например к информации о встроенных иллюстрациях, шрифтах и изображениях, а также ко всему документу (присоединение к каталогу документов), используя расширяемую схему.
Документы PDF также могут содержать настройки отображения, включая макет страницы и уровень масштабирования в объекте «Настройки средства просмотра». Adobe Reader использует эти настройки для переопределения настроек пользователя по умолчанию при открытии документа. [42] Бесплатная программа Adobe Reader не может удалить эти настройки.
Доступность
[ редактировать ]PDF-файлы могут быть созданы специально для людей с ограниченными возможностями. [43] [44] [45] [46] [47] Форматы PDF-файлов, используемые с 2014 г. [update] может включать теги, текстовые эквиваленты, подписи, аудиоописания и многое другое. Некоторые программы могут автоматически создавать PDF-файлы с тегами , но эта функция не всегда включена по умолчанию. [48] [49] Ведущие программы чтения с экрана , включая JAWS , Window-Eyes , Hal и Kurzweil 1000 и 3000, могут читать PDF-файлы с тегами. [50] [51] Кроме того, PDF-файлы с тегами можно перекомпоновать и увеличить для читателей с нарушениями зрения. Добавление тегов к старым PDF-файлам и файлам, созданным на основе отсканированных документов, может вызвать некоторые проблемы.
Одна из серьезных проблем, связанных с доступностью PDF, заключается в том, что PDF-документы имеют три различных представления, которые, в зависимости от создания документа, могут не согласовываться друг с другом. Три представления: (i) физическое представление, (ii) представление тегов и (iii) представление содержимого. Физический вид отображается и распечатывается (то, что большинство людей считают PDF-документом). Просмотр тегов — это то, что программы чтения с экрана и другие вспомогательные технологии используют для обеспечения высококачественной навигации и чтения для пользователей с ограниченными возможностями. Представление содержимого основано на физическом порядке объектов в потоке содержимого PDF-файла и может отображаться программным обеспечением, которое не полностью поддерживает представление тегов, например функцией перекомпоновки в Adobe Reader.
PDF/UA , международный стандарт доступных PDF-файлов, основанный на ISO 32000-1, был впервые опубликован как ISO 14289-1 в 2012 году и устанавливает нормативный язык для технологии доступных PDF.
Мультимедиа
[ редактировать ]Rich Media PDF – это файл PDF, включающий интерактивный контент, который можно встроить в файл или связать с ним. Он может содержать изображения, аудио, видеоконтент или кнопки. Например, если интерактивный PDF-файл представляет собой цифровой каталог для предприятия электронной коммерции, продукты могут быть перечислены на страницах PDF-файла и дополнены изображениями, ссылками на веб-сайт и кнопками для заказа непосредственно из документа.
Формы
[ редактировать ]Интерактивные формы — это механизм добавления форм в формат файла PDF. В настоящее время PDF поддерживает два разных метода интеграции данных и форм PDF. Оба формата сегодня сосуществуют в спецификации PDF: [37] [52] [53] [54]
- AcroForms (также известные как формы Acrobat), представленные в спецификации формата PDF 1.2 и включенные во все более поздние спецификации PDF.
- Формы XML Forms Architecture (XFA), представленные в спецификации формата PDF 1.5. Формы Adobe XFA несовместимы с AcroForms. [55] Начиная с PDF 2.0 XFA устарел из PDF.
AcroForms были представлены в формате PDF 1.2. AcroForms допускают использование объектов ( например , текстовых полей , переключателей и т. д. ) и некоторого кода ( например, JavaScript). Помимо стандартных типов действий PDF, интерактивные формы (AcroForms) поддерживают отправку, сброс и импорт данных. Действие «отправить» передает имена и значения выбранных полей интерактивной формы в указанный универсальный указатель ресурсов (URL). Имена и значения полей интерактивной формы могут быть отправлены в любом из следующих форматов (в зависимости от настроек флагов ExportFormat, SubmitPDF и XFDF действия): [37]
- Формат HTML-формы
- Спецификация HTML 4.01 начиная с PDF 1.5; HTML 2.0 начиная с версии 1.2
- Формат данных форм (FDF)
- основанный на PDF, использует тот же синтаксис и имеет по существу ту же структуру файла, но он намного проще, чем PDF, поскольку тело документа FDF состоит только из одного обязательного объекта. Формат данных форм определен в спецификации PDF (начиная с PDF 1.2). Формат данных форм можно использовать при отправке данных формы на сервер, получении ответа и включении его в интерактивную форму. Его также можно использовать для экспорта данных формы в отдельные файлы, которые можно импортировать обратно в соответствующую интерактивную форму PDF. Первоначально FDF был определен в 1996 году как часть ISO 32000-2:2017. [ нужна ссылка ]
- Формат данных XML-форм (XFDF)
- (спецификация внешнего формата данных форм XML, версия 2.0; поддерживается с версии PDF 1.5; она заменила формат отправки формы «XML», определенный в PDF 1.4) XML-версия формата данных форм, но XFDF реализует только подмножество FDF, содержащее формы и аннотации. Некоторые записи в словаре FDF не имеют эквивалентов XFDF, например, «Статус», «Кодировка», «JavaScript», «Ключи страницы», «EmbeddedFDF», «Различия» и «Цель». Кроме того, XFDF не позволяет создавать или добавлять новые страницы на основе заданных данных; как это можно сделать при использовании файла FDF. Спецификация XFDF упоминается (но не включена) в спецификацию PDF 1.5 (и в более поздних версиях). Это описано отдельно в Спецификации формата данных XML Forms . [56] Спецификация PDF 1.4 допускала отправку форм в формате XML, но в спецификации PDF 1.5 это было заменено отправкой в формате XFDF. XFDF соответствует стандарту XML. XFDF можно использовать так же, как и FDF; например, данные формы передаются на сервер, вносятся изменения, затем отправляются обратно, и новые данные формы импортируются в интерактивной форме. Его также можно использовать для экспорта данных формы в отдельные файлы, которые можно импортировать обратно в соответствующую интерактивную форму PDF. По состоянию на август 2019 года XFDF 3.0 является стандартом ISO/IEC под официальным названием ISO 19444-1:2019 — Управление документами. Формат данных XML-форм. Часть 1. Использование ISO 32000-2 (XFDF 3.0) . [57] Этот стандарт является нормативной ссылкой на ISO 32000-2.
Можно отправить весь документ, а не отдельные поля и значения, как это определено в PDF 1.4.
AcroForms может хранить значения полей формы во внешних автономных файлах, содержащих пары ключ-значение. Внешние файлы могут использовать файлы формата данных форм (FDF) и формата данных форм XML (XFDF). [58] [56] [59] Подписи прав использования (UR) определяют права на импорт файлов данных форм в форматах FDF, XFDF и текстовых ( CSV / TSV ), а также на экспорт файлов данных форм в форматах FDF и XFDF. [37]
В PDF 1.5 компания Adobe Systems представила собственный формат форм; Архитектура Adobe XML Forms (XFA). Формы Adobe XFA несовместимы с функцией AcroForms стандарта ISO 32000, и большинство процессоров PDF не обрабатывают содержимое XFA. Спецификация XFA упоминается в ISO 32000-1/PDF 1.7 как внешняя проприетарная спецификация и полностью исключена из PDF в ISO 32000-2 (PDF 2.0).
Лицензирование
[ редактировать ]Любой может создавать приложения, которые могут читать и записывать файлы PDF, не платя роялти Adobe Systems; Adobe владеет патентами на PDF, но лицензирует их для бесплатного использования при разработке программного обеспечения, соответствующего спецификации PDF. [60]
Безопасность
[ редактировать ]Изменения в контенте
[ редактировать ]В ноябре 2019 года исследователи из Рурского университета в Бохуме и компании Hackmanit GmbH опубликовали информацию об атаках на PDF-файлы с цифровой подписью. [61] Они показали, как изменить видимый контент в подписанном PDF-файле, не делая подпись недействительной в 21 из 22 настольных программ просмотра PDF и в 6 из 8 онлайн-сервисов проверки, используя недостатки реализации.На той же конференции они дополнительно показали, как извлечь открытый текст зашифрованного контента в PDF-файлах. [62] В 2021 году они продемонстрировали новые так называемые теневые атаки на PDF-файлы, которые злоупотребляют гибкостью функций, предусмотренных в спецификации. [63] Обзор проблем безопасности в PDF-файлах, касающихся отказа в обслуживании , раскрытия информации , манипулирования данными и атак с выполнением произвольного кода , представил Йенс Мюллер. [64] [65]
Уязвимость вредоносного ПО
[ редактировать ]PDF-файлы могут быть заражены вирусами, троянами и другими вредоносными программами. Они могут иметь скрытый код JavaScript, который может использовать уязвимости в PDF-файле, скрытые объекты, выполняемые при открытии скрывающего их файла, и, реже, вредоносный PDF-файл может запускать вредоносное ПО. [66]
PDF-вложения, содержащие вирусы, были впервые обнаружены в 2001 году. Вирус, получивший название OUTLOOK.PDFWorm или Peachy , использует Microsoft Outlook для отправки себя в виде вложенного файла Adobe PDF. Он был активирован с помощью Adobe Acrobat, но не с помощью Acrobat Reader. [67]
Время от времени в различных версиях Adobe Reader обнаруживаются новые уязвимости, [68] побуждая компанию выпускать исправления безопасности. Другие программы для чтения PDF-файлов также уязвимы. Одним из отягчающих факторов является то, что программу чтения PDF-файлов можно настроить на автоматический запуск, если на веб-странице имеется встроенный PDF-файл, что создает вектор для атаки. Если вредоносная веб-страница содержит зараженный PDF-файл, использующий уязвимость в программе чтения PDF-файлов, система может быть скомпрометирована, даже если браузер защищен. Некоторые из этих уязвимостей являются результатом стандарта PDF, позволяющего создавать сценарии PDF-документов с помощью JavaScript. Отключение выполнения JavaScript в программе чтения PDF-файлов может помочь смягчить последствия таких эксплойтов в будущем, хотя оно не защищает от эксплойтов в других частях программного обеспечения для просмотра PDF-файлов. Эксперты по безопасности говорят, что JavaScript не обязателен для чтения PDF-файлов и что польза от отключения JavaScript перевешивает любые возникающие проблемы совместимости. [69] Один из способов избежать эксплойтов PDF-файлов — попросить локальную или веб-службу преобразовать файлы в другой формат перед просмотром.
30 марта 2010 г. исследователь безопасности Дидье Стивенс сообщил об эксплойте Adobe Reader и Foxit Reader, который запускает вредоносный исполняемый файл, если пользователь разрешает его запуск по запросу. [70]
Программное обеспечение
[ редактировать ]Зрители и редакторы
[ редактировать ]Многие программы просмотра PDF предоставляются бесплатно из различных источников. Программы для работы с PDF-файлами и их редактирования доступны, обычно их можно приобрести.
Существует множество вариантов программного обеспечения для создания PDF-файлов, включая возможности печати PDF, встроенные в macOS , iOS , [71] и большинство дистрибутивов Linux . Многие программы для обработки документов, включая LibreOffice , Microsoft Office 2007 (при обновлении до SP2 ) и более поздних версий, [72] WordPerfect 9 и Scribus могут экспортировать документы в формат PDF. Существует множество драйверов печати PDF для Microsoft Windows, система набора текста pdfTeX , инструменты DocBook PDF, приложения, разработанные на основе Ghostscript и самого Adobe Acrobat , а также Adobe InDesign , Adobe FrameMaker , Adobe Illustrator, Adobe Photoshop, которые позволяют использовать «PDF-принтер». необходимо настроить, который при выборе отправляет выходные данные в файл PDF вместо физического принтера. Google Пакет онлайн-офиса Google Docs позволяет загружать и сохранять файлы в формате PDF. Некоторые веб-приложения предлагают бесплатные инструменты редактирования PDF-файлов и аннотирования.
Фонд свободного программного обеспечения «разрабатывал бесплатный, высококачественный и полнофункциональный набор библиотек и программ, которые реализуют формат файлов PDF и связанные с ним технологии в соответствии со стандартом ISO 32000» в качестве одного из своих высокоприоритетных проектов . [73] [74] Однако в 2011 году проект GNU PDF был исключен из списка «высокоприоритетных проектов» из-за развития библиотеки Poppler . [75] который получил более широкое распространение в таких приложениях, как Evince со средой рабочего стола GNOME . Попплер основан на Xpdf. [76] [77] кодовая база. Существуют также библиотеки коммерческих разработок, перечисленные в списке программного обеспечения PDF .
Проект Apache PDFBox Apache Software Foundation — это Java-библиотека с открытым исходным кодом, лицензируемая по лицензии Apache , для работы с PDF-документами. [78]
Печать
[ редактировать ]Процессоры растровых изображений (RIP) используются для преобразования PDF-файлов в растровый формат, подходящий для изображения на бумаге и других носителях в принтерах, цифровых производственных печатных машинах и допечатной подготовке в процессе, известном как растеризация . RIP, способные обрабатывать PDF напрямую, включают в себя Adobe PDF Print Engine. [79] от Adobe Systems и Jaws [80] и RIP Harlequin от Global Graphics .
В 1993 году процессор растровых изображений Jaws от Global Graphics стал первым RIP-процессором для допечатной подготовки, который интерпретировал PDF-файлы в исходном виде без преобразования в другой формат. В 1997 году компания выпустила обновление своего RIP Harlequin с теми же возможностями. [81]
В 1997 году компания Agfa-Gevaert представила и поставила Apogee, первую систему допечатной подготовки на основе PDF.
Многие коммерческие офсетные принтеры принимают в качестве источника печати готовые к печати PDF-файлы, в частности подмножество PDF/X-1a и его варианты. [82] Отправка готовых к печати PDF-файлов заменяет проблемную необходимость получения собранных собственных рабочих файлов.
В 2006 году PDF был широко принят в качестве стандартного формата заданий печати на саммите Open Source Development Labs Printing Summit. Он поддерживается как формат заданий печати в Common Unix Printing System , а проекты настольных приложений, такие как GNOME, KDE , Firefox , Thunderbird , LibreOffice и OpenOffice, переключились на создание заданий печати в формате PDF. [83]
Некоторые настольные принтеры также поддерживают прямую печать PDF, что позволяет интерпретировать данные PDF без посторонней помощи.
Собственная модель дисплея
[ редактировать ]PDF был выбран в качестве «родного» формата метафайлов для macOS (первоначально называвшегося Mac OS X), заменив формат PICT более ранней классической Mac OS . Модель отображения графического слоя Quartz основана на модели, общей для Display PostScript и PDF, что привело к прозвищу Display PDF . Приложение предварительного просмотра может отображать файлы PDF, а также веб-браузер Safari версии 2.0 и более поздних версий . Поддержка PDF на системном уровне позволяет приложениям macOS автоматически создавать PDF-документы при условии, что они поддерживают стандартную архитектуру печати ОС. Затем файлы экспортируются в формат PDF 1.3 в соответствии с заголовком файла. При создании снимка экрана в Mac OS X версий с 10.0 по 10.3 изображение также сохранялось в формате PDF; более поздние версии сохраняют снимки экрана в формате PNG, хотя при желании это поведение можно вернуть обратно в PDF.
Аннотация
[ редактировать ]Adobe Acrobat — один из примеров проприетарного программного обеспечения, которое позволяет пользователю комментировать, выделять и добавлять примечания к уже созданным файлам PDF. Одно из приложений UNIX, доступное как бесплатное программное обеспечение (под лицензией GNU General Public License ), — PDFedit . Бесплатная программа Foxit Reader , доступная для Microsoft Windows, macOS и Linux, позволяет комментировать документы. от Tracker Software PDF-XChange Viewer позволяет без ограничений добавлять аннотации и пометки в своей бесплатной альтернативе. Встроенный просмотрщик PDF-файлов в macOS от Apple , Preview, также поддерживает аннотации, как и программное обеспечение с открытым исходным кодом Skim , причем последнее поддерживает взаимодействие с LaTeX , SyncTeX и PDFSync и интеграцию с программным обеспечением для управления ссылками BibDesk . Бесплатное программное обеспечение Qiqqa может создать отчет об аннотациях, в котором суммируются все аннотации и примечания, сделанные пользователем в их библиотеке PDF-файлов. Инструмент проверки текста экспортирует различия в документах в виде аннотаций и пометок.
Существуют также системы веб-аннотаций , которые поддерживают аннотации в формате PDF и других форматах документов. В тех случаях, когда ожидается, что PDF-файлы будут иметь все функции бумажных документов, необходимы рукописные аннотации.
Преобразование и извлечение информации
[ редактировать ]Акцент PDF на сохранении визуального вида документов на различных программных и аппаратных платформах создает проблемы при преобразовании документов PDF в другие форматы файлов и целевом извлечении информации , такой как текст, изображения, таблицы, библиографическая информация и метаданные документа . Эти задачи поддерживаются многочисленными инструментами и библиотеками исходного кода. Существует несколько помеченных наборов данных для тестирования инструментов преобразования PDF и извлечения информации, которые использовались для сравнительной оценки производительности инструмента. [84]
Альтернативы
[ редактировать ]Спецификация Open XML Paper — это конкурирующий формат, используемый как в качестве языка описания страниц, так и в качестве собственного формата диспетчера очереди печати для Microsoft Windows, начиная с Windows Vista .
Смешанный объект: архитектура содержимого документа — это конкурирующий формат. MO:DCA-P является частью представления расширенных функций .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б Харди, М.; Масинтер, Л.; Маркович, Д.; Джонсон, Д.; Бейли, М. (март 2017 г.). Тип носителя приложения/pdf . IETF . дои : 10.17487/RFC8118 . RFC 8118 .
- ^ Jump up to: а б с д Adobe Systems Incorporated (ноябрь 2006 г.). «Справочник PDF» (PDF) . 1.7 (6-е изд.). Архивировано из оригинала (PDF) 1 октября 2008 г. Проверено 12 января 2023 г.
- ^ Уорнок, Дж. (14 октября 2004 г.) [Первоначальная дата 5 мая 1995 г.]. «Проект Камелот» (PDF) . Архивировано (PDF) из оригинала 18 июля 2011 г.
- ^ «Что такое PDF? Портативный формат документов | Adobe Acrobat DC» . Adobe Systems Inc. Архивировано из оригинала 30 января 2023 года . Проверено 12 января 2023 г.
- ^ «ИСО 32000-1:2008» (PDF) . Архивировано из оригинала (PDF) 26 июля 2018 г.
- ^ Jump up to: а б с д и Пфиффнер, Памела (2003). Внутри издательской революции: история Adobe . Беркли: Peachpit Press. п. 137. ИСБН 0-321-11564-3 .
- ^ «ISO 32000-1:2008 – Управление документами – Переносимый формат документов – Часть 1: PDF 1.7» . ИСО. 1 июля 2008 года. Архивировано из оригинала 6 декабря 2010 года . Проверено 21 февраля 2010 г.
- ^ Орион, Иган (5 декабря 2007 г.). «PDF 1.7 одобрен как ISO 32000» . Спрашивающий . Архивировано из оригинала 13 декабря 2007 года . Проверено 5 декабря 2007 г.
- ^ «Публичная патентная лицензия, ISO 32000-1: 2008 – PDF 1.7» (PDF) . Adobe Systems Inc., 2008 г. Архивировано (PDF) из оригинала 18 июня 2009 г. . Проверено 12 января 2023 г.
- ^ «Руководство по закупкам ИКТ на основе стандартов – Элементы передовой практики, против блокировки: создание открытых систем ИКТ путем более эффективного использования стандартов в государственных закупках» . Европейская комиссия. 25 июня 2013. Архивировано из оригинала 19 сентября 2020 года . Проверено 12 января 2023 г.
Пример: ISO/IEC 29500, ISO/IEC 26300 и ISO 32000 для справочной информации о форматах документов, которая доступна не всем сторонам (ссылки на запатентованные технологии и торговые марки, неполный объем или мертвые веб-ссылки).
- ^ «ISO/TC 171/SC 2/WG 8 N 603 – Отчет о заседании» (PDF) . Отредактируйте меня . 27 июня 2011 г. Архивировано из оригинала (PDF) 26 ноября 2012 г. - через Архив.
XFA пока не станет стандартом ISO. Комитет настоятельно призывает Adobe Systems представить спецификацию XFA, архитектуру XML-форм (XFA), в ISO для стандартизации. Комитет обеспокоен стабильностью спецификации XFA. Часть 2 будет ссылаться на XFA 3.1.
- ^ «Внедрение и публикация интерактивных трехмерных научных рисунков в файлах формата портативных документов (PDF)» . ПЛОС ОДИН . 8 (9). 2013. doi : 10.1371/journal.pone.0069446.s001 .
реализация стандарта U3D не была полной, и использовались собственные расширения.
- ^ Леонард Розентол (2012). «PDF и стандарты» (PDF) . Системы Adobe. Архивировано из оригинала (PDF) 2 сентября 2013 года . Проверено 20 октября 2013 г. - через Parleys.
- ^ Jump up to: а б «Объявляем о бесплатном доступе к новейшему стандарту PDF: ISO 32000-2 (PDF 2.0)» (пресс-релиз). Ассоциация PDF. 16 июня 2023 г. [Обновлено; первоначально опубликовано 5 апреля 2023 г.]. Архивировано из оригинала 23 сентября 2023 года . Проверено 6 октября 2023 г.
- ^ «ISO 32000-2:2020 теперь доступен» . ПДФА. 14 декабря 2020 года. Архивировано из оригинала 4 декабря 2022 года . Проверено 3 февраля 2021 г.
- ^ Jump up to: а б «ISO 32000-2. Управление документами. Портативный формат документов. Часть 2: PDF 2.0» . ИСО. 5 января 2021 года. Архивировано из оригинала 28 января 2021 года . Проверено 3 февраля 2021 г.
- ^ Jump up to: а б с д и ж Пфиффнер, Памела (2003). Внутри издательской революции: история Adobe . Беркли: Peachpit Press. п. 139. ИСБН 0-321-11564-3 .
- ^ «Справочник по языку PostScript]» (PDF) . Архивировано из оригинала (PDF) 24 июля 2021 года.
- ^ Антон Эртль, Мартин. «Чем хорош формат PDF?» . complang.tuwien.ac.at . Венский технологический университет. Архивировано из оригинала 4 апреля 2024 года . Проверено 8 апреля 2024 г.
- ^ «Поддерживаемые форматы 3D» . Adobe Systems Inc., 14 июля 2009 г. Архивировано из оригинала 12 февраля 2010 г. . Проверено 21 февраля 2010 г.
- ^ «Поддерживаемые форматы файлов в Acrobat и Reader» . Adobe Systems Inc., 11 ноября 2022 г. Архивировано из оригинала 21 декабря 2022 г. . Проверено 12 января 2023 г.
- ^ «JavaScript для Acrobat 3D | Центр разработчиков Adobe Acrobat» . Adobe Systems Inc. Архивировано из оригинала 12 ноября 2009 года . Проверено 12 января 2023 г.
- ^ Правец, Джим. «В защиту COS, или Почему я люблю JSON и ненавижу XML» . jimpravetz.com . Архивировано из оригинала 2 мая 2014 года.
{{cite web}}
: CS1 maint: неподходящий URL ( ссылка ) - ^ Adobe Systems, PDF-ссылка, стр. 39–40.
- ^ Документация PikePDF. «Работа с потоками контента» . Архивировано из оригинала 5 июля 2022 года . Проверено 8 мая 2022 г.
- ^ «Adobe Developer Connection: справочник по PDF и расширения Adobe к спецификации PDF» . Adobe Systems Inc. Архивировано из оригинала 15 ноября 2006 года . Проверено 13 декабря 2010 г.
- ^ Ховард, Джаччи. «Настольные издательские системы: шрифты Base 14 – определение» . О.com Технология . Архивировано из оригинала 14 июня 2016 года.
- ^ Мерц, Томас (июнь 2003 г.). «Аквариум шрифтов PDF» (PDF) . Архивировано из оригинала 18 июля 2011 года.
{{cite web}}
: CS1 maint: неподходящий URL ( ссылка ) - ^ «Дополнение к режимам наложения в формате PDF» (PDF) . Архивировано из оригинала (PDF) 14 октября 2011 года . Проверено 12 января 2023 г.
- ^ «Руководство по передовому опыту в формате PDF с тегами: синтаксис» (PDF) . pdfa.org . PDF Ассоциация . Июнь 2019 года . Проверено 24 июня 2024 г.
- ^ Джонсон, Дафф (22 апреля 2004 г.). «Что такое PDF с тегами?» . Архивировано из оригинала 7 августа 2004 года.
- ^ «Доступен ли PDF?» . DO-IT — инвалидность, возможности, работа в сети и технологии . Университет Вашингтона. 4 октября 2022 года. Архивировано из оригинала 10 февраля 2023 года . Проверено 12 января 2023 г.
- ^ «FreeMyPDF.com – удаляет пароли из просматриваемых PDF-файлов» . freemypdf.com . Архивировано из оригинала 20 февраля 2021 года . Проверено 23 июня 2009 г.
- ^ Кирк, Джереми (4 декабря 2008 г.). «Adobe признает, что новая защита PDF-файлов паролем слабее» . Макмир . IDG Communications Inc. Архивировано из оригинала 17 января 2017 года . Проверено 14 сентября 2016 г.
- ^ Гиньяр, Брайан. «Насколько безопасен PDF» (PDF) . Университет Карнеги-Меллон. Архивировано из оригинала (PDF) 24 октября 2005 г.
- ^ Мерц, Томас (ноябрь 2001 г.). PDF-файл «Обзор безопасности: сильные и слабые стороны» (PDF) . Конференция PDF 2001. Скоттсдейл/Аризона. Архивировано из оригинала 11 октября 2010 года.
{{cite conference}}
: CS1 maint: неподходящий URL ( ссылка ) - ^ Jump up to: а б с д и Adobe Systems Inc. (1 июля 2008 г.). «Управление документацией – переносимый формат документов – часть 1: PDF 1.7, первое издание» (PDF) . Архивировано из оригинала (PDF) 3 декабря 2008 г. Проверено 12 января 2023 г.
- ^ «Веб-сайт по вопросам безопасности в формате PDF» . pdf-insecurity.org . Архивировано из оригинала 26 марта 2023 года . Проверено 12 января 2023 г.
- ^ «ISO 32000-1:2008 Управление документами. Переносной формат документов. Часть 1: PDF 1.7» . Международная организация по стандартизации ISO. Архивировано из оригинала 10 февраля 2017 года . Проверено 22 марта 2016 г.
- ^ «ETSI TS 102 778-1 — Электронные подписи и инфраструктуры (ESI); Расширенные профили электронных подписей в формате PDF; Часть 1: Обзор PAdES — рамочный документ для PAdES» (PDF) . 1.1.1. Европейский институт телекоммуникационных стандартов ETSI. Июль 2009 г. Архивировано (PDF) из оригинала 8 марта 2023 г. Проверено 12 января 2023 г.
- ^ «Ссылки и вложения в PDF-файлах» . Архивировано из оригинала 23 апреля 2021 года . Проверено 23 апреля 2021 г.
- ^ «Знакомство с Adobe Reader > Общие сведения о настройках» . Adobe Пресс . Пирсон. 2 сентября 2005 г. Архивировано из оригинала 23 октября 2012 г. Проверено 12 января 2023 г.
- ^ «Доступность PDF» . ВебАИМ. Архивировано из оригинала 12 января 2023 года . Проверено 12 января 2023 г.
- ^ Кларк, Джо (22 августа 2005 г.). «Факты и мнения о доступности PDF» . Архивировано из оригинала 24 января 2013 года . Проверено 12 января 2023 г.
- ^ «Доступность и PDF-документы» . Центр веб-доступности . Университет штата Огайо. Архивировано из оригинала 27 апреля 2010 года . Проверено 12 января 2023 г.
- ^ «Стандарты доступности PDF» . 1.2. Би-би-си. Архивировано из оригинала 29 мая 2010 года . Проверено 12 января 2023 г.
- ^ «Доступность PDF» (PDF) . Калифорнийский государственный университет. 2009. Архивировано из оригинала (PDF) 27 мая 2010 года . Проверено 12 января 2023 г.
- ^ «Справка LibreOffice – Экспорт в PDF» . Архивировано из оригинала 12 января 2023 года . Проверено 12 января 2023 г.
- ^ З., Андрей (11 января 2008 г.). «Экспорт PDF/A для долгосрочного архивирования» . Архивировано из оригинала 24 февраля 2021 года . Проверено 22 сентября 2012 г.
- ^ Бирсдорфер, доктор юридических наук (10 апреля 2009 г.). «Совет недели: функция Adobe Reader «Чтение вслух»» . Нью-Йорк Таймс . Архивировано из оригинала 22 ноября 2020 года . Проверено 12 января 2023 г.
- ^ «Доступ к PDF-документам с помощью вспомогательных технологий: руководство пользователя программы чтения с экрана» (PDF) . Adobe Systems Inc. Архивировано из оригинала (PDF) 28 июля 2008 года . Проверено 12 января 2023 г.
- ^ «Gnu PDF – Знания PDF – Формат данных форм» . Архивировано из оригинала 1 января 2013 года . Проверено 12 января 2023 г.
- ^ «О PDF-формах» . Adobe Systems Inc. Архивировано из оригинала 29 апреля 2011 года . Проверено 19 февраля 2010 г.
- ^ Демлинг, Питер (1 июля 2008 г.). «Преобразовать форму XFA в AcroForm?» . Архивировано из оригинала 12 января 2023 года . Проверено 12 января 2023 г.
- ^ «Миграция с форм Adobe Acrobat на формы XML» . Архивировано из оригинала 6 октября 2010 года . Проверено 12 января 2023 г.
- ^ Jump up to: а б «Спецификация формата данных форм XML, версия 2» (PDF) . Сентябрь 2007 г. Архивировано из оригинала (PDF) 30 июля 2018 г. . Проверено 19 февраля 2010 г.
- ^ «ISO 19444-1:2019(ru)» . Международная организация по стандартизации. Архивировано из оригинала 17 июня 2016 года . Проверено 3 декабря 2020 г.
- ^ Adobe Systems Incorporated (20 сентября 2022 г.). «Использование форм Acrobat и данных форм в Интернете» . Архивировано из оригинала 12 января 2023 года . Проверено 12 января 2023 г.
- ^ «Спецификация обмена данными FDF» (PDF) . 8 февраля 2007 г. Архивировано из оригинала (PDF) 3 декабря 2008 г. . Проверено 12 января 2023 г.
- ^ «Ресурсы для разработчиков» . Adobe Systems Inc. Архивировано из оригинала 27 февраля 2016 г.
- ^ Младенов Владислав; Майнка, Кристиан; Мейер Цу Сельхаузен, Карстен; Гроте, Мартин; Швенк, Йорг (6 ноября 2019 г.). «Возврат 1 триллиона долларов: как подделать подписи в PDF-файлах». Материалы конференции ACM SIGSAC 2019 года по компьютерной и коммуникационной безопасности . ККС '19. Цифровая библиотека ACM, Конференция ACM SIGSAC по компьютерной и коммуникационной безопасности. стр. 1–14. дои : 10.1145/3319535.3339812 . ISBN 9781450367479 . S2CID 199367545 . Архивировано из оригинала 26 апреля 2021 года . Проверено 6 апреля 2021 г.
- ^ Мюллер, Йенс; Исинг, Фабиан; Младенов Владислав; Майнка, Кристиан; Шинцель, Себастьян; Швенк, Йорг (6 ноября 2019 г.). «Практическая расшифровка эксфильтрации: взлом шифрования PDF». Материалы конференции ACM SIGSAC 2019 года по компьютерной и коммуникационной безопасности . ККС '19. Цифровая библиотека ACM, Конференция ACM SIGSAC по компьютерной и коммуникационной безопасности. стр. 15–29. дои : 10.1145/3319535.3354214 . ISBN 9781450367479 . S2CID 207959243 . Архивировано из оригинала 26 апреля 2021 года . Проверено 6 апреля 2021 г.
- ^ «Теневые атаки: скрытие и замена содержимого в подписанных PDF-файлах» . Интернет-сообщество, Симпозиум по безопасности сетей и распределенных систем. Архивировано из оригинала 21 апреля 2021 года . Проверено 6 апреля 2021 г.
- ^ «Обработка опасных путей: безопасность и конфиденциальность формата переносимого документа» . Интернет-сообщество, Симпозиум по безопасности сетей и распределенных систем. Архивировано из оригинала 21 апреля 2021 года . Проверено 6 апреля 2021 г.
- ^ «Недостаток портативных документов 101» . Блэкхэт. Архивировано из оригинала 9 апреля 2021 года . Проверено 6 апреля 2021 г.
- ^ «Могут ли PDF-файлы содержать вирусы? Берегите свои файлы» . Adobe. Архивировано из оригинала 4 октября 2023 года . Проверено 3 октября 2023 г.
- ↑ Форумы Adobe, Объявление: Вирус вложений PDF «Peachy». Архивировано 4 сентября 2015 г., в Wayback Machine , 15 августа 2001 г.
- ^ «Бюллетени и рекомендации по безопасности» . Adobe Systems Inc., 10 января 2023 г. Архивировано из оригинала 6 апреля 2010 г. . Проверено 12 января 2023 г.
- ^ Гибсон, Стив; Лапорт, Лео (12 марта 2009 г.). «Стив Гибсон – подкаст SecurityNow» . Архивировано из оригинала 8 мая 2020 года . Проверено 11 января 2011 г.
- ^ «Вредоносные PDF-файлы выполняют код без уязвимостей» . ПКМАГ . Архивировано из оригинала 4 апреля 2010 года.
- ^ Патхак, Хамош (7 октября 2017 г.). «Как создать PDF-файл с веб-страницы на iPhone и iPad в iOS 11» . яДжанки . Архивировано из оригинала 12 января 2023 года . Проверено 12 января 2023 г.
- ^ «Описание пакета обновления 2 (SP2) для пакета Microsoft Office 2007» . Майкрософт . Архивировано из оригинала 29 апреля 2009 года . Проверено 12 января 2023 г.
- ↑ 2 апреля 2014 г. в заметке от 10 февраля 2009 г. упоминались текущие высокоприоритетные проекты бесплатного программного обеспечения FSF , заархивированные 10 августа 2007 г. на Wayback Machine в качестве источника . Однако содержание последней страницы со временем меняется.
- ^ «Цели и мотивация» . gnupdf.org . GNUpdf. 28 ноября 2007. Архивировано из оригинала 4 июля 2014 года . Проверено 2 апреля 2014 г.
- ^ Ли, Мэтт (6 октября 2011 г.). «Проект GNU PDF покидает список высокоприоритетных проектов FSF; миссия выполнена!» . fsf.org . Фонд свободного программного обеспечения. Архивировано из оригинала 28 декабря 2014 года.
- ^ «Домашняя страница Попплера» . Архивировано из оригинала 8 января 2015 года . Проверено 12 января 2023 г.
Poppler — это библиотека рендеринга PDF, основанная на базе кода xpdf-3.0.
- ^ «Лицензия Xpdf» . Архивировано из оригинала 14 апреля 2013 года . Проверено 12 января 2023 г.
Xpdf распространяется под лицензией GNU General Public License (GPL) версии 2 или 3.
- ^ «Проект Apache PDFBox — выпущен Apache PDFBox 3.0.0» . 17 августа 2023 г. Архивировано из оригинала 7 января 2023 г. Обновлено для новых выпусков.
- ^ «Средство печати Adobe PDF» . Adobe Systems Inc. Архивировано из оригинала 22 августа 2013 года . Проверено 20 августа 2014 г.
- ^ «Jaws® 3.0 PDF и PostScript RIP SDK» . globalgraphics.com . Архивировано из оригинала 5 марта 2016 года . Проверено 26 ноября 2010 г.
- ^ «Арлекин МультиРИП» . Архивировано из оригинала 9 февраля 2014 года . Проверено 2 марта 2014 г.
- ^ «Готовые PDF-файлы» . Архивировано из оригинала 5 февраля 2009 года . Проверено 12 января 2023 г.
Для всех, кто заинтересован в коммерческой печати своего графического проекта непосредственно из цифровых файлов или PDF-файлов.
{{cite web}}
: CS1 maint: неподходящий URL ( ссылка ) - ^ «PDF как стандартный формат задания на печать» . Фонд Linux . Фонд Linux . 23 октября 2009 года. Архивировано из оригинала 14 ноября 2009 года . Проверено 12 января 2023 г.
- ^ Меушке, Норман; Джагдале, Апурва; Спинде, Тимо; Митрович, Елена; Гипп, Бела (2023), Ссерванга, Исаак; Гулдинг, Энн; Мулезон-Сэнди, Хизер; Ду, Цзя Тина (ред.), «Эталон инструментов извлечения информации из PDF-файлов с использованием многозадачной и многодоменной структуры оценки академических документов» , «Информация для лучшего мира: нормальность, виртуальность, физичность, инклюзивность» , том. 13972, Cham: Springer Nature Switzerland, стр. 383–405, arXiv : 2303.09957 , doi : 10.1007/978-3-031-28032-0_31 , ISBN 978-3-031-28031-3
Дальнейшее чтение
[ редактировать ]- Харди, MRB; Брэйлсфорд, Д.Ф. (2002). «Сопоставление и отображение структурных преобразований между XML и PDF» (PDF) . Материалы симпозиума ACM 2002 г. по разработке документации – DocEng '02 . стр. 95–102. дои : 10.1145/585058.585077 . ISBN 1-58113-594-7 . S2CID 9371237 . Архивировано из оригинала (PDF) 24 марта 2017 г. [ соответствующий? ]
- PDF 2.0 «ISO 32000-2:2020(ru), Управление документами. Переносимый формат документов. Часть 2: PDF 2.0» . Международная организация по стандартизации . Проверено 16 декабря 2020 г.
- PDF 2.0 «ISO 32000-2:2017(ru), Управление документами. Переносимый формат документов. Часть 2: PDF 2.0» . Международная организация по стандартизации . 3 августа 2017 г. Проверено 31 января 2019 г.
- PDF 1.7 (ИСО 32000-1:2008)
- PDF 1.7 и исправления к 1.7 на Wayback Machine (архивировано 6 марта 2022 г.)
- PDF 1.6 ( ISBN 0-321-30474-8 ) и исправления в версии 1.6 на Wayback Machine (архивировано 6 марта 2022 г.)
- PDF 1.5 и исправления к 1.5 на Wayback Machine (архивировано 22 декабря 2021 г.)
- PDF 1.4 ( ISBN 0-201-75839-3 ) и исправления в версии 1.4 на Wayback Machine (архивировано 6 марта 2022 г.)
- PDF 1.3 ( ISBN 0-201-61588-6 ) и исправления в версии 1.3 на Wayback Machine (архивировано 6 марта 2022 г.)
- PDF 1.2
- PDF 1.0 ( ISBN 0-201-62628-4 )
Внешние ссылки
[ редактировать ]- PDF Association – PDF Association – это отраслевая ассоциация разработчиков программного обеспечения, создающих или обрабатывающих PDF-файлы.
- Индекс спецификаций PDF в Ассоциации PDF
- Adobe PDF 101: Краткое изложение PDF-файла на Wayback Machine (архивировано 7 октября 2010 г.)
- Adobe: PostScript и PDF на Wayback Machine (архивировано 13 апреля 2016 г.) — официальное вводное сравнение PS, EPS и PDF.
- Стандарты PDF....переход спецификации PDF из стандарта де-факто в стандарт де-юре на Wayback Machine (архивировано 24 апреля 2011 г.) - Информация о спецификациях PDF/E и PDF/UA для формата файлов доступных документов.
- Стандарт PDF/A-1 ISO , опубликованный Международной организацией по стандартизации (с исправлениями)
- Справочник PDF и расширения Adobe к спецификации PDF на Wayback Machine (архивировано 16 января 2021 г.)
- Портативный формат документов: введение для программистов – введение в PDF в сравнении с PostScript и внутренними компонентами PDF (до версии 1.3)
- The Camelot Paper в Wayback Machine (заархивировано 22 апреля 2019 г.) - документ, в котором Джон Уорнок описал проект, в результате которого был создан PDF.
- Все, что вы хотели знать о PDF, но боялись спросить на Wayback Machine (архивировано 18 января 2016 г.) – запись выступления Леонарда Розентола (45 минут) ( Adobe Systems ) на TUG 2007 г.