Док (компьютерный)
![]() | |
Расширение имени файла | док |
---|---|
Тип интернет-СМИ | приложение/мслово [1] |
Единый идентификатор типа (UTI) | com.microsoft.word.doc [2] [3] |
Разработано | Майкрософт |
Последний выпуск | 11.1 21 мая 2024 г [4] |
Тип формата | формат файла документа |
Контейнер для | Текст, изображение, таблица |
Расширено с | Двоичный формат составного файла (с версии 97) |
Распространено на | Форматы Microsoft Office XML , Office Open XML |
Открытый формат ? | Да |
.doc (аббревиатура от « документ ») — это расширение имени файла используемое для текстовых документов, хранящихся в Word собственном , двоичном формате Microsoft ; это был основной формат Microsoft Word, пока версия 2007 года не заменила его на Office Open XML. .docx
файлы. [4] Microsoft использует это расширение с 1983 года.
Формат двоичного файла Microsoft Word
[ редактировать ]Двоичные файлы DOC часто содержат больше информации о форматировании текста (а также сценариев и информации об отмене), чем некоторые другие форматы файлов документов , такие как формат расширенного текста и язык гипертекстовой разметки , но обычно они менее широко совместимы .
Файлы DOC, созданные в версиях Microsoft Word, различаются. Версии Microsoft Word до Word 97 («8.0») использовали формат, отличный от формата Microsoft Word 97 – 2003 на основе OLE и CFBF .
В Microsoft Word 2007 и более поздних версиях формат двоичного файла был заменен в качестве формата по умолчанию форматом Office Open XML , хотя Microsoft Word по-прежнему может создавать файлы DOC.
Поддержка приложений
[ редактировать ]Формат DOC является родным для Microsoft Word. Другие текстовые процессоры , такие как OpenOffice.org Writer , IBM Lotus Symphony , Apple Pages и AbiWord , также могут создавать и читать файлы DOC, хотя и с некоторыми ограничениями. Программы командной строки для Unix-подобных операционных систем, которые могут конвертировать файлы из формата DOC в обычный текст или другие стандартные форматы, включают библиотеку wv , которая сама используется непосредственно AbiWord .
Спецификация
[ редактировать ]Поскольку формат файла DOC в течение многих лет был закрытой спецификацией, непоследовательная обработка формата сохраняется и может привести к некоторой потере информации о форматировании при обработке одного и того же файла с помощью нескольких программ обработки текста. Некоторые спецификации форматов двоичных файлов Microsoft Office 97 были опубликованы в 1997 году под ограничительной лицензией, но в 1999 году эти спецификации были удалены из онлайн-загрузки. [5] [6] [7] [8] Спецификации более поздних версий форматов двоичных файлов Microsoft Office не были общедоступны. Спецификацию формата DOC можно получить в Microsoft по запросу. [9] с 2006 года [10] на ограничительных условиях RAND-Z до февраля 2008 года. Sun Microsystems и OpenOffice.org провели реверс-инжиниринг формата файла. [11] 15 февраля 2008 г. Microsoft выпустила спецификацию формата .DOC. [4] [12] [13] в соответствии с обещанием открытой спецификации Microsoft . [14] [15] Однако эта спецификация не описывает все функции, используемые форматом DOC, и необходима работа по обратному проектированию. [16] С 2008 года спецификация несколько раз обновлялась; последнее изменение было внесено в мае 2022 года.
Формат, использовавшийся в более ранних версиях Word до 97 («1.0» 1989 г. по «7.0» 1995 г.), менее известен, но и OpenOffice, и LibreOffice содержат код с открытым исходным кодом для чтения этих форматов. Этот формат, вероятно, связан с форматом «Поток», встречающимся в аналогичных версиях Excel. [17] Word 95 также имеет форму, завернутую в OLE.
Другие форматы файлов
[ редактировать ]В некоторых исторических документах может использоваться расширение имени файла DOC для текстовых файлов, указывающее на документацию для программного или аппаратного обеспечения. Расширение имени файла DOC также использовалось в 1980-х годах WordPerfect для своего собственного формата.
DOC иногда используется пользователями Palm OS как сокращение от PalmDoc , несвязанного формата (обычно с использованием расширения имени файла PDB), используемого для кодирования текстовых файлов, таких как электронные книги .
См. также
[ редактировать ]- docx — формат файла, используемый современными версиями Word.
- де-факто Стандарт
- Доминирующий дизайн
Ссылки
[ редактировать ]- ^ «Тип содержимого/подтип IME — приложение/мслово» . ИАНА . 22 июля 1993 г. Проверено 20 июня 2012 г.
- ^ Справочник по унифицированным идентификаторам типов (PDF) , Apple , получено 20 июня 2012 г.
- ^ «Объявленные системой унифицированные идентификаторы типов (Mac OS X v10.4)» . Связь с разработчиками Apple . Apple Inc., 8 апреля 2008 г.
- ^ Jump up to: а б с MS-DOC: Формат двоичного файла Word (.doc) , 19 ноября 2019 г. , получено 25 февраля 2020 г.
- ^ «Сравнение ODF и OOXML» (PDF) . 2006. Архивировано из оригинала (pdf) 28 сентября 2011 г. Проверено 23 мая 2011 г.
- ^ Остерегайтесь чудаков, приносящих дары , 2006 г. , получено 23 мая 2011 г.
- ^ «Конвертер Word 8 для Unix» . Проверено 23 мая 2011 г.
- ^ «Формат двоичного файла Microsoft Word 97» . Проверено 23 мая 2011 г.
- ^ «Спецификации без лицензионных отчислений для форматов двоичных файлов Microsoft Office» . Проверено 23 мая 2011 г.
- ^ «Сопоставление документов в двоичном формате (.doc; .xls; .ppt) с форматом Open XML» . 16 января 2008 г. Проверено 23 мая 2011 г.
- ^ «Формат составного документа Microsoft» (PDF) . OpenOffice.org . 07.08.2007.
- ^ Двоичные форматы файлов Microsoft Office (doc, xls, ppt) , 15 февраля 2008 г., заархивировано из оригинала 18 февраля 2008 г.
- ^ «Спецификация формата двоичных файлов Microsoft Office Word 97–2007 (*.doc)» (PDF) . Корпорация Майкрософт . 2008.
- ^ «Обещание Microsoft по открытой спецификации» . Корпорация Майкрософт . 23 марта 2009 г.
- ^ «Как извлечь информацию из файлов Office, используя форматы и схемы файлов Office» . Проверено 23 мая 2011 г.
- ^ Джоэл Спольски. «Почему форматы файлов Microsoft Office такие сложные? (И некоторые обходные пути)» . Архивировано из оригинала 14 октября 2013 г. Проверено 23 мая 2011 г.
- ^ «LibreOffice/ядро» . Гитхаб .
Внешние ссылки
[ редактировать ]- DOC , XLS и PPT Спецификации
- Формат составного документа Microsoft — OpenOffice.org