Формат файла документа
Эта статья нуждается в дополнительных цитатах для проверки . ( февраль 2023 г. ) |
Формат файла документа — это текстовый или двоичный формат файла для хранения документов на носителе , особенно для использования на компьютерах .В настоящее время существует множество несовместимых форматов файлов документов.
Примерами XML на основе открытых стандартов являются DocBook , XHTML и, в последнее время, ISO / IEC стандарты OpenDocument (ISO 26300:2006) и Office Open XML (ISO 29500:2008).
В 1993 году ITU-T попытался установить стандарт для форматов файлов документов, известный как архитектура открытого документа (ODA), который должен был заменить все конкурирующие форматы файлов документов. Он описан в документах ITU-T от T.411 до T.421, которые эквивалентны ISO 8613. Это не удалось.
Языки описания страниц, такие как PostScript и PDF, стали фактическим стандартом для документов, которые обычный пользователь должен иметь возможность только создавать и читать, но не редактировать. серия стандартов ISO / IEC В 2001 году начала публиковаться для PDF, включая спецификацию самого PDF — ISO-32000 .
HTML — наиболее используемый и открытый международный стандарт, который также используется в качестве формата файла документа. Он также стал стандартом ISO / IEC (ISO 15445:2000).
Формат двоичного файла по умолчанию, используемый Microsoft Word ( .doc ), стал широко распространенным стандартом де-факто для офисных документов, но это запатентованный формат , который не всегда полностью поддерживается другими текстовыми процессорами.
Распространенные форматы файлов документов [ править ]
- ASCII , UTF-8 — обычного текста кодировки . Для этих двух наборов символов используются три различных окончания строк: (a) LF — перевод строки в UNIX и подобных системах, (b) CRLF — возврат каретки, перевод строки в системах DOS и Windows и (c) CR — - возврат каретки в старых системах Macintosh.
- Руководство для друзей
- .doc для Microsoft Word — структурный двоичный формат, разработанный Microsoft (спецификации доступны с 2008 года в соответствии с обещанием открытой спецификации ). [1] [2]
- DjVu — формат файла, предназначенный в первую очередь для хранения отсканированных документов. [3]
- DocBook — формат XML для технической документации.
- HTML (.html, .htm) (открытый стандарт, ISO с 2000 г.) в сочетании с возможными файлами изображений . указанными
- FictionBook (.fb2) — открытый формат электронных книг на основе XML.
- Markdown (.md) — язык разметки для создания форматированного текста с использованием обычного текста.
- Office Open XML — .docx (стандарт для офисных документов на основе XML)
- OpenDocument — .odt (стандарт офисных документов на основе XML)
- OpenOffice.org XML — .sxw (открытый формат офисных документов на основе XML)
- OXPS — бумажная спецификация Open XML (Windows 8.1 и более поздние версии, более старая версия — XPS, используемая в Windows 7)
- PalmDoc — портативный формат документов
- .pages для страниц
- PDF — открытый стандарт обмена документами. Стандарты ISO включают PDF/X (обмен), PDF/A (архив), PDF/E (инжиниринг), ISO 32000 (PDF), PDF/UA (доступность) и PDF/VT (переменные данные и транзакционная печать). PDF читается практически на любой платформе с помощью бесплатных программ чтения или чтения с открытым исходным кодом. Также доступны средства создания PDF-файлов с открытым исходным кодом.
- Постскриптум — .ps
- Rich Text Format (RTF) — формат метаданных, разрабатываемый Microsoft с 1987 года для продуктов Microsoft и межплатформенного обмена документами. [4] [5] [6] [7] [8]
- Символическая связь (SYLK)
- Масштабируемая векторная графика (SVG) — графический формат, предназначенный преимущественно для векторных изображений.
- TeX — программа и формат верстки с открытым исходным кодом. Первый успешный язык математических обозначений.
- TEI — формат XML для цифровых публикаций.
- Трофф
- Единый офисный формат — китайский стандарт
- WordPerfect (.wpd, .wp, .wp7, .doc) (Примечание: возможна путаница с расширением формата Word)
См. также [ править ]
- Список форматов файлов документов
- Список языков разметки документов
- Сравнение языков разметки документов
- Открытый формат
- Текстовый процессор
- Настольные издательские системы
- Латекс
Ссылки [ править ]
- ^ «Двоичные форматы файлов Microsoft Office (doc, xls, ppt)» . Майкрософт . 15 февраля 2008 г. Архивировано из оригинала 8 марта 2009 г. Проверено 18 марта 2010 г.
- ^ Корпорация Microsoft (23 июля 2010 г.). «MS-DOC — спецификация структуры формата двоичного файла Word (.doc)» . Проверено 8 августа 2010 г.
- ^ «Что такое DjVu — DjVu.org» . DjVu.org . Архивировано из оригинала 21 января 2019 г. Проверено 5 марта 2009 г.
- ^ Корпорация Microsoft (май 1999 г.). «Спецификация расширенного текстового формата (RTF), версия 1.6» . Проверено 13 марта 2010 г.
- ^ «4.3 Форматы файлов, отличные от HTML» . Отдел электронного правительства. Май 2002. Архивировано из оригинала 18 февраля 2010 года . Проверено 13 марта 2010 г.
- ^ «RTF (.rtf) — языковая документация Wolfram» . ссылка.wolfram.com .
- ^ «WD: Спецификация расширенного текстового формата (RTF) 1.7» . support.microsoft.com .
- ^ Ранджан Парех, Ранджан (2006). Принципы мультимедиа . Тата МакГроу-Хилл. п. 87. ИСБН 0-07-058833-3 .