Форматированный текст
Эта статья нуждается в дополнительных цитатах для проверки . ( февраль 2024 г. ) |
В вычислительной технике форматированный текст , стилизованный текст или форматированный текст , в отличие от обычного текста , представляет собой цифровой текст , который имеет информацию о стиле, выходящую за рамки минимума семантических элементов: цвета, стили ( жирный шрифт , курсив ), размеры и специальные функции в HTML ( например гиперссылки ).
Терминология
[ редактировать ]Форматированный текст не может быть правильно отождествлен с двоичными файлами или отличаться от текста ASCII. Это связано с тем, что форматированный текст не обязательно является двоичным, он может быть только текстовым, например HTML , RTF или расширенными текстовыми файлами, а также может содержать только ASCII. И наоборот, простой текстовый файл может быть не в формате ASCII (в такой кодировке, как Unicode UTF-8 ). [ нужны дальнейшие объяснения ] Форматированный только текст текст создается с помощью разметки , которая также является текстовой, в то время как некоторые редакторы форматированного текста, такие как Microsoft Word, сохраняют его в двоичном формате.
Начало форматированного текста
[ редактировать ]Форматированный текст берет свое начало в докомпьютерном использовании подчеркивания для придания смелости отрывкам в машинописных рукописях . В первых интерактивных системах ранних компьютерных технологий подчеркивание было невозможно, и пользователи восполняли этот недостаток (и отсутствие форматирования в ASCII), используя определенные символы в качестве замены. Например, акцент в ASCII можно сделать несколькими способами: [1] [2]
- Капитализация: Я НЕ выдумываю это.
- Окружение подчеркиванием: Я _не_ это выдумываю.
- Вокруг звездочки: Я *не* это выдумываю.
- Расстояние: Я не выдумываю это.
Окружение подчеркиванием также использовалось для названий книг: Посмотрите это в _The_C_Programming_Language_.
Языки разметки
[ редактировать ]Форматирование может быть отмечено тегами, отличающимися от основного текста специальными символами, такими как угловые скобки в HTML . Например, этот текст:
- В систематике собака классифицируется как Canis Familiesis .
размечается в HTML следующим образом:
<p>The dog is classified as <i>Canis familiaris</i> in taxonomy.</p>
Текст, выделенный курсивом, заключен в открывающий и закрывающий теги курсива. В LaTeX текст будет размечен следующим образом:
The dog is classified as \textit{Canis familiaris} in taxonomy.
Большинство языков разметки можно редактировать в любом текстовом редакторе , не требуя специального программного обеспечения . Многие языки разметки также можно редактировать с помощью специального программного обеспечения, предназначенного для автоматизации некоторых функций или представления вывода в формате WYSIWYG .
Форматированные файлы документов
[ редактировать ]С момента изобретения MacWrite , первого текстового процессора WYSIWYG , в котором машинистка кодирует форматирование визуально, а не путем вставки текстовой разметки, текстовые процессоры имеют тенденцию сохранять данные в двоичных файлах . Открытие таких файлов в текстовом редакторе обнаруживает, что они содержат различные двоичные символы либо вокруг форматированного текста (например, в WordPerfect ), либо отдельно от него, в начале или конце файла (например, в Microsoft Word ).
Однако форматированные текстовые документы в двоичных файлах имеют недостатки, связанные с областью форматирования и секретностью. В то время как степень форматирования точно обозначена в языках разметки, форматирование WYSIWYG основано на памяти, то есть, например, нажатие кнопки, выделенной жирным шрифтом, сохраняется до тех пор, пока оно не будет отменено. Это может привести к ошибкам форматирования и проблемам с обслуживанием. Что касается секретности, форматы файлов текстовых документов, как правило, являются проприетарными и недокументированными, что приводит к трудностям в совместимости кодирования третьими сторонами, а также к ненужным обновлениям из-за изменений версий.
WordStar был популярным текстовым процессором, который не использовал двоичные файлы со скрытыми символами.
OpenOffice.org Writer сохраняет файлы в формате XML . Однако полученный файл является двоичным, поскольку он сжат ( эквивалент tarball ).
PDF — это еще один формат текстового файла, который обычно является двоичным (с использованием сжатия текста и сохранением графики и шрифтов в двоичном формате). Обычно это формат конечного пользователя, написанный из такого приложения, как Microsoft Word или OpenOffice.org Writer, и не подлежащий редактированию пользователем после его завершения.
См. также
[ редактировать ]- Кодировка символов
- Онлайн-редактор форматированного текста
- Допечатная подготовка
- Текстовый процессор
Ссылки
[ редактировать ]- ^ Хэмбридж, Салли (октябрь 1995 г.). «RFC1855: Рекомендации по сетевому этикету» . IETF Datatracker, Рабочая группа по разработке Интернета . Проверено 4 февраля 2024 г.
- ^ Маллен, Эд (26 июля 2015 г.). «Структурированный текст» . edmullen.net . Проверено 4 февраля 2024 г.