Архитектура содержимого документа
Разработано | ИБМ |
---|---|
Тип формата | Формат файла документа |
Распространено на | МО:DCA |
Document Content Architecture , или DCA сокращенно , — это стандарт, разработанный IBM для текстовых документов в начале 1980-х годов. DCA использовался в мэйнфреймах и системах IBM i и лег в основу DisplayWrite формата файлов . Позднее DCA был расширен до MO:DCA (архитектура содержимого смешанных объектных документов), в которую были добавлены встроенные файлы данных .
Первоначальной целью DCA было предоставление общего формата документов, который можно было бы использовать на нескольких платформах обработки текста IBM, таких как IBM PC , мэйнфреймы IBM , система Displaywriter и административная система IBM 5520 . [1]
DCA определяет два типа документов: [2] [3]
- Текст изменяемой формы (DCA/RFT), который можно редактировать.
- Текст окончательной формы (DCA/FFT), который «отформатирован для конкретного устройства вывода и не может быть изменен».
Описание
[ редактировать ]DCA определяет поток данных, представляющий документ .
Документы могут содержать шрифты, наложения и другие объекты ресурсов, необходимые во время презентации для правильного представления данных. Наконец, документы могут содержать объекты ресурсов, такие как индекс документа и элементы тегов, поддерживающие поиск и навигацию по данным документа, для различных прикладных целей. [4] : 2
MO:DCA — это оболочка или контейнер для различных объектов , которые могут составлять документ. Каждый объект определяется своей собственной подчиненной архитектурой. Архитектуры: [4]
- Архитектура содержимого объекта текста презентации (PTOCA) описывает форматированный текст, включая текстовые атрибуты, такие как шрифт или цвет.
- Архитектура содержимого объекта изображения (IOCA) описывает изображения, независимые от разрешения.
- Архитектура содержимого графических объектов (GOCA) описывает векторные графические изображения. Вариант GOCA, AFP GOCA, используется в средах представления расширенных функций .
- Архитектура содержимого объекта штрих-кода (BCOCA) описывает штрих-коды в различных форматах.
- Архитектура содержимого объекта шрифта (FOCA) описывает шрифты, которые будут использоваться в документе.
- Архитектура содержимого объекта управления цветом (CMOCA) описывает необходимую информацию по управлению цветом.
Каждая архитектура использует ряд двоичных структурированных полей для описания соответствующего объекта.
Текст изменяемой формы
[ редактировать ]Разработано | ИБМ |
---|---|
Тип формата | Формат файла документа |
Текст изменяемой формы (сокращенно RFT или RFT-DCA ) является частью DCA. Его иногда называют текстом изменяемого формата . Он использовался IBM DisplayWriter 4 и 5 текстовыми процессорами на System/360 и 370 мейнфреймах , а также OfficeVision/400 для обеспечения передачи форматированных документов в другие системы. [1]
RFT имеет аналог Final-Form Text (сокращенно FFT или FFT-DCA ), который не предназначен для редактирования и предназначен только для вывода.
История
[ редактировать ] этого раздела Тон или стиль могут не отражать энциклопедический тон , используемый в Википедии . ( Август 2022 г. ) |
Попытка ввести международные стандарты для DCA была начата в 1980 году на предприятии IBM в Рочестере. Была собрана команда, состоящая из двух архитекторов MODCA, архитектора RTOCA и архитектора PTOCA. Эти архитекторы отвечали за формирование консенсуса IBM по проектированию потоков данных и вывод этой работы на арену международных стандартов. Были предприняты согласованные усилия по привлечению международного сообщества к развитию. Это решение было частично основано на опыте, полученном при принятии GML в международный стандарт SGML. Чтобы избежать длительной задержки создания архитектуры, они хотели привлечь всех к участию как можно раньше. СГМЛ [5] на разработку стандартизации ушло много лет. Работа IBM с содержимым документов была вызвана потребностями основных компьютеров, где использовались GML и DCA, но этот опыт указывал на необходимость в стандартизированных архитектурах компонентов, в частности, для изменяемого и нередактируемого текста.
В 1981 году, вскоре после своего создания, группа была переведена вместе с системой распределенных данных IBM 5280 в IBM Остин недалеко от Раунд-Рока, штат Техас, где работа продолжалась с переменным успехом. По мере того, как архитектуры становились все более прочными на международной арене, в 1987 году команда снова была переведена в Центр программирования IBM в Далласе, где в 1998 году она была расформирована, а работа над архитектурами DCA была прекращена, главным образом, из-за ухода сообщества ПК. в ином направлении необходимости. Архитектура DCA была полностью завершена, но не полностью согласована по прошествии 18 лет. Активных реализаций не предвиделось. [1]
Мир ПК остановил свой выбор на HTML (который считается применением международного стандарта SGML ) и использовал его части в своих целях. Microsoft Word в конечном итоге использовал аналогичный поток данных в качестве внутреннего рабочего потока данных для хранения редактируемого контента. Несмотря на то, что стандарт SGML был доступен, было непрактично использовать полную реализацию синтаксического анализатора SGML, поэтому потенциальное его подмножество стало фактическим стандартом для изменяемого текста, используемого сегодня на арене ПК.
Примерно в то же время компания Adobe Systems разработала и выпустила документ в формате PDF для печати , который стал стандартом для документов для печати, создаваемых на ПК. Международный стандарт был установлен в 2008 году при участии пользователей, которые решили использовать предлагаемые продукты в большом количестве. Решение было обусловлено потребностью в продукте, и найденное решение оказалось гораздо более приемлемым, чем могли придумать комитеты по стандартизации. За более чем 10 лет работы не было найдено приемлемого метода, и сообщество ПК создало то, что им было нужно, за меньшее время. [3]
Попытка достичь консенсусного потока данных документов была быстро отвергнута доступным и полезным контентом, предоставленным компаниями, которые не пытались поделиться с другими, но создали работоспособное решение и успешно продали его пользователям. Результаты программного обеспечения для обработки текстов «распечатываются» в формате PDF, предоставляемом наиболее используемым презентационным продуктом. Например, Microsoft Word предоставляет выбор принтера «Microsoft Print to PDF» для получения необходимого вывода для документа PDF. Подобный метод можно было бы использовать для создания международного стандарта, если бы он в конечном итоге появился.
Когда в 1998 году IBM распустила свой Центр программирования в Далласе, весь штат архитекторов ушел на пенсию и покинул компанию, за исключением менеджера, которого перевели, что положило конец проекту архитектуры DCA в IBM в обозримом будущем. [1]
См. также
[ редактировать ]- Расширенное представление функций
- Rich Text Format (RTF) — еще одна система кодирования форматирования, которую иногда путают с текстом Revisable-Form.
- Список языков разметки документов
Ссылки
[ редактировать ]- ^ Jump up to: а б с д Хенкель, Том (21 мая 1984 г.), «IBM идет по пути стандартизации к DPP» , Computerworld , vol. 18, нет. 21, ИДГ Предприятие, с. 7, ISSN 0010-4841.
- ^ «Энциклопедия журнала PC» . Проверено 25 июля 2012 г.
- ^ Jump up to: а б де ла Божардьер, Жан Мари (1988). «Устоявшиеся форматы обмена документами» . Манипулирование документами и типографика: материалы Международной конференции по электронным публикациям, манипулированию документами и типографике, Ницца (Франция), 20-22 апреля 1988 г. Архив Кубка. п. 83. ИСБН 978-0-521-36294-8 .
- ^ Jump up to: а б Корпорация IBM (май 2006 г.). Справочник по архитектуре содержимого документов смешанных объектов (PDF) . Проверено 7 февраля 2020 г.
- ^ "Дом" . sgmlsource.com .
Внешние ссылки
[ редактировать ]- Домашняя страница Консорциума AFP
- Консорциум по представлению расширенных функций (апрель 2017 г.). Справочник по архитектуре содержимого графических объектов для представления расширенных функций (PDF) (Четвертое изд.) . Проверено 7 февраля 2020 г.
- Уильямс; и др. (1996). Способ и устройство для многоэтапного преобразования формата документа в системе обработки данных (PDF) . [ мертвая ссылка ] Патент США № 5 513 323.