Пробелный символ
Символ пробела — это символьный элемент данных , который представляет пробел при текста вводе . визуализируется для отображения на компьютере .
Например, пробел ( U+0020 ПРОБЕЛ , ASCII 32) представляет собой пробел , например разделитель слов в западном алфавите .
приводит Печатаемый символ к выводу при рендеринге, но символ пробела - нет. Вместо этого символы пробелов в ограниченной степени определяют расположение текста, нарушая обычную последовательность отображения символов рядом друг с другом. Вывод последующих символов обычно смещается вправо (или влево для сценария с письмом справа налево ) или к началу следующей строки. Эффект от нескольких последовательных символов пробелов является накопительным, так что следующий печатаемый символ отображается в месте, основанном на накопленном эффекте предыдущих символов пробелов.
Термин «пробелы» уходит корнями в общепринятую практику отображения текста на белой бумаге . Обычно пробельный символ не отображается как белый. Он влияет на рендеринг, но сам не рендерится.
Обзор
[ редактировать ]Символ пробела обычно вставляет горизонтальное пространство шириной примерно с букву. Для моноширинного шрифта ширина равна ширине буквы, а для шрифта переменной ширины ширина зависит от шрифта. Некоторые шрифты поддерживают несколько пробелов разной ширины.
Символ табуляции обычно вставляет горизонтальное пространство, основанное на позициях табуляции , которые различаются в зависимости от приложения .
Последовательность символов новой строки обычно перемещает место вывода рендеринга в начало следующей строки. Если следовать за текстом, это фактически не приводит к появлению пробелов. Но две последовательные последовательности новой строки между текстовыми блоками приводят к появлению пустой строки между блоками. Высота пустой строки зависит от приложения.
Использование пробелов для компоновки текста является общепринятым . Приложения иногда отображают пробельные символы как видимую разметку, чтобы пользователь мог видеть то, что обычно не видно.
Обычно пользователь вводит пробел, нажимая spacebar, символ табуляции, нажав Tab ↹ и новую строку, нажав ↵ Enter.
Юникод
[ редактировать ]В таблице ниже перечислены двадцать пять символов, определенных как пробелы («WSpace=Y», «WS») в базе данных символов Юникода . [1] Семнадцать используют определение пробелов, соответствующее алгоритму двунаправленной записи («Тип двунаправленного символа = WS»), и известны как символы «Bidi-WS». Остальные символы также можно использовать, но они не относятся к типу «Биди».
Примечание. В зависимости от браузера и шрифтов, используемых для просмотра следующей таблицы, не все пробелы могут отображаться правильно.
Имя | Кодовая точка | Ширина коробки | Может сломаться ? | В ИДН ? |
Скрипт | Блокировать | Общий категория |
Примечания | |
---|---|---|---|---|---|---|---|---|---|
табуляция символов | U + 0009 | 9 | Да | Нет | Общий | Базовая латынь | Другой, контроль |
HT, горизонтальная вкладка . HTML/XML Именованный объект : 	 , Латекс : \tab , C escape: \t
| |
перевод строки | U + 000A | 10 | Это разрыв строки | Общий | Базовая латынь | Другой, контроль |
НЧ, перевод строки . Именованный объект HTML/XML: 
 , C escape: \n
| ||
табуляция строк | U + 000B | 11 | Это разрыв строки | Общий | Базовая латынь | Другой, контроль |
VT, Вертикальная вкладка . С побег: \v
| ||
подача формы | U+000C | 12 | Это разрыв строки | Общий | Базовая латынь | Другой, контроль |
FF, подача формы . С побег: \f
| ||
возврат каретки | U + 000D | 13 | Это разрыв строки | Общий | Базовая латынь | Другой, контроль |
CR, Возврат каретки . С побег: \r
| ||
космос | U + 0020 | 32 | Да | Нет | Общий | Базовая латынь | Сепаратор, космос |
Наиболее распространенный (обычное пространство ASCII). Латекс: \
| |
следующая строка | U + 0085 | 133 | Это разрыв строки | Общий | Латиница-1 Добавка |
Другой, контроль |
НЭЛ, Следующая строка . Латекс: \\
| ||
пространство без перерыва | U + 00A0 | 160 | Нет | Нет | Общий | Латиница-1 Добавка |
Сепаратор, космос |
Неразрывное пространство : идентично U+0020, но не является точкой, в которой строка может быть разорвана. Именованный объект HTML/XML: ,   , Латекс: ~
| |
знак пробела в огаме | U + 1680 | 5760 | Да | Нет | Огам | Огам | Сепаратор, космос |
Используется для разделения слов в огама тексте . Обычно это вертикальная линия в вертикальном тексте или горизонтальная линия в горизонтальном тексте, но также может быть пробелом в шрифтах без ножки. Требуется шрифт Ogham. | |
четверной | U+2000 | 8192 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Ширина одного en . U+2002 канонически эквивалентен этому символу; Предпочтителен U+2002. | |
в четверке | В +2001 | 8193 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Также известен как «бараний квадрокоптер». Ширина одного em . U+2003 канонически эквивалентен этому символу; Предпочтителен U+2003. | |
в космосе | В +2002 г. | 8194 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Также известен как «орех». Ширина одного en . U+2000 En Quad канонически эквивалентен этому символу; Предпочтителен U+2002. Именованный объект HTML/XML:   , Латекс: \enspace (пробел LaTeX en — это неразрывный пробел)
| |
космос | В +2003 г. | 8195 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Также известен как «баранина». Ширина одного em . U+2001 Em Quad канонически эквивалентен этому персонажу; Предпочтителен U+2003. Именованный объект HTML/XML:   , Латекс: \quad
| |
трехмерное пространство | В +2004 г. | 8196 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Также известно как «густое пространство». Ширина одной трети метра. Именованный объект HTML/XML:   , Латекс: \; (толстое пространство LaTeX — это неразрывное пространство)
| |
четырехмерное пространство | В +2005 г. | 8197 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Также известен как «средний космос». Одна четверть метра в ширину. Именованный объект HTML/XML:  
| |
шестиместное пространство | В +2006 г. | 8198 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Ширина одной шестой сантиметра. В компьютерной типографике иногда приравнивается к U+2009. | |
фигура пространства | В +2007 г. | 8199 | Нет | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Фигурное пространство . В шрифтах с моноширинными цифрами, равными ширине одной цифры. Именованный объект HTML/XML:  
| |
знак препинания | В +2008 г. | 8200 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Ширина равна узкому пунктуационному знаку шрифта, т. е. расширенной ширине точки или запятой. [2] Именованный объект HTML/XML:  
| |
тонкое пространство | В +2009 г. | 8201 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Тонкое пространство ; одна пятая (иногда одна шестая) ширины em. Рекомендуется использовать в качестве разделителя тысяч измерения для единиц СИ . В отличие от U+2002–U+2008, его ширину можно регулировать при наборе текста. [3] Именованный объект HTML/XML:   ,   , Латекс: \, (тонкое пространство LaTeX представляет собой непрерывное пространство)
| |
пространство для волос | У + 200А | 8202 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Тоньше тонкого пространства. Именованный объект HTML/XML:   ,  
| |
разделитель строк | U + 2028 | 8232 | Это разрыв строки | Общий | Общий Пунктуация |
Сепаратор, линия |
|||
разделитель абзацев | U + 2029 | 8233 | Это разрыв строки | Общий | Общий Пунктуация |
Сепаратор, абзац |
|||
узкое неразрывное пространство | U + 202F | 8239 | Нет | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
Узкое неразрывное пространство . По функциям аналогичен безразрывному пробелу U+00A0. При использовании с монгольским языком его ширина обычно составляет одну треть обычного пространства; в другом контексте его ширина иногда напоминает ширину Тонкого Пространства (U+2009). Латекс: \,
| |
среднее математическое пространство | U + 205F | 8287 | Да | Нет | Общий | Общий Пунктуация |
Сепаратор, космос |
ММСП. Используется в математических формулах. Четыре восемнадцатых эм. [4] В математической типографике ширина пробелов обычно задается целыми кратными восемнадцатой em, и 4/18 em может использоваться в нескольких ситуациях, например, между a и + и между + и b в выражение а+б . [5] Именованный объект HTML/XML:   , Латекс: \: (среднее пространство LaTeX является неразрывным)
| |
идеографическое пространство | U+3000 | 12288 | Да | Нет | Общий | Символы CJK и Пунктуация |
Сепаратор, космос |
Ширина такой же, как символьная ячейка CJK ( полная ширина ). Используется, например, в тай тоу . |
Имя | Кодовая точка | Ширина коробки | Может сломаться ? | В ИДН ? |
Скрипт | Блокировать | Общий категория |
Примечания | |
---|---|---|---|---|---|---|---|---|---|
монгольский разделитель гласных | U + 180E | 6158 | | Да | Нет | Монгольский | Монгольский | Другой, Формат |
МВС. Символ узкого пробела, используемый в монгольском языке для того, чтобы последние два символа слова принимали разную форму. [6] Он больше не классифицируется как пробельный символ (т. е. в категории Zs) в Unicode 6.3.0, хотя в предыдущих версиях стандарта он был. |
пространство нулевой ширины | U + 200B | 8203 | Да | Нет | ? | Общий Пунктуация |
Другой, Формат |
ZWSP, пространство нулевой ширины . Используется для обозначения границ слов в системах обработки текста при использовании сценариев, в которых не используются явные пробелы. Он похож на мягкий дефис с той разницей, что последний используется для обозначения границ слогов и должен отображать видимый дефис, когда строка разрывается на нем. HTML/XML Именованный объект : ​ [7] [с]
| |
нулевая ширина | U+200C | 8204 | | Да | Контекстно-зависимый [12] | ? | Общий Пунктуация |
Другой, Формат |
ZWNJ, необъединяемый элемент нулевой ширины . При размещении между двумя символами, которые в противном случае были бы соединены, ZWNJ заставляет их печатать в конечной и начальной формах соответственно. Именованный объект HTML/XML: ‌
|
Столяр нулевой ширины | U + 200D | 8205 | | Да | Контекстно-зависимый [13] | ? | Общий Пунктуация |
Другой, Формат |
ZWJ, соединитель нулевой ширины . При размещении между двумя символами, которые в противном случае не были бы соединены, ZWJ заставляет их печатать в связанных формах. Также может использоваться для изолированного отображения форм соединения. В зависимости от того, ожидается ли по умолчанию лигатура или соединение, может либо вызывать (как в эмодзи и в сингальском языке ), либо подавлять (как в деванагари ) замену одним глифом, при этом позволяя использовать отдельные формы соединения (в отличие от ZWNJ). Именованный объект HTML/XML: ‍
|
словосочетание | U + 2060 | 8288 | | Нет | Нет | ? | Общий Пунктуация |
Другой, Формат |
WJ, столяр слов . Аналогично U+200B, но не является точкой, в которой линия может быть прервана. Именованный объект HTML/XML: ⁠
|
неразрывное пространство нулевой ширины | U+FEFF | 65279 | | Нет | Нет | ? | арабский Презентация Формы-Б |
Другой, Формат |
Неразрывное пространство нулевой ширины . Используется в основном как знак порядка байтов . Использование в качестве обозначения неразрывности устарело начиная с Unicode 3.2; вместо этого см. U + 2060. |
|
Заменить изображения
[ редактировать ]Юникод также предоставляет некоторые видимые символы, которые можно использовать для обозначения различных символов пробелов в контекстах, где видимый символ должен отображаться:
Код | Десятичный | Имя | Блокировать | Отображать | Описание |
---|---|---|---|---|---|
U + 00B7 | 183 | Средняя точка | Дополнение Latin-1 | · | Интерпункт Именованная сущность: ·
|
U + 21A1 | 8609 | Двунаправленная стрелка вниз | Стрелки | ↡ | Символ ECMA-17/ ISO 2047 для перевода страницы (разрыв страницы) [15] |
U + 2261 | 8810 | Идентичен | Математический Операторы |
≡ | Среди прочего, это символ ECMA-17 / ISO 2047 для перевода строки. [15] |
U + 237D | 9085 | Открытая коробка с плечами | Разное техническое | ⍽ | Используется для обозначения NBSP |
U + 23CE | 9166 | Символ возврата | Разное техническое | ⏎ | Символ клавиши возврата , которая вводит разрыв строки |
U + 2409 | 9225 | Символ горизонтальной таблицы | Контрольные изображения | ␉ | Заменители символа табуляции |
U + 240А | 9226 | Символ перевода строки | Контрольные изображения | ␊ | Заменители перевода строки |
U + 240B | 9227 | Символ вертикальной таблицы | Контрольные изображения | ␋ | Заменители вертикальной табуляции (строчной табуляции) |
U+240C | 9228 | Символ подачи формы | Контрольные изображения | ␌ | Заменители подачи формы (разрыв страницы) |
U + 240D | 9229 | Символ возврата каретки | Контрольные изображения | ␍ | Заменители возврата каретки |
U + 2420 | 9248 | Символ космоса | Контрольные изображения | ␠ | Заменители пробела ASCII |
U + 2422 | 9250 | Пустой символ | Контрольные изображения | ␢ | он же «заменить пробел», [16] используется в BCDIC , [16] EBCDIC , [16] ASCII-1963 [16] [17] и т. д. как символ разделителя слов |
U + 2423 | 9251 | Открытая коробка | Контрольные изображения | ␣ | Используется в рукописном вводе печатными буквами, по крайней мере, с 1980-х годов, когда необходимо явно указать количество пробельных символов (например, при программировании с помощью ручки и бумаги). Используется в учебнике (опубликованном в 1982, 1984, 1985, 1988 годах издательством Springer-Verlag) по Модуле-2 , [18] язык программирования, в котором пространственные коды требуют явного указания. Также используется в клавиатуре [n 1] серии -8 x TI графических калькуляторов компании Texas Instruments . Именованная сущность: ␣
|
U + 2424 | 9252 | Символ новой строки | Контрольные изображения |  | Заменители разрыва строки |
U + 25B3 | 9651 | Белый треугольник вершиной вверх | Геометрические фигуры | △ | Среди прочего используется символ ECMA-17 / ISO 2047 для пространства ASCII. [15] |
U + 2A5B | 10843 | Логическое или со средним стеблем | Дополнительный Математический Операторы |
⩛ | Среди прочего используется символ ECMA-17 / ISO 2047 для вертикальной табуляции (строчной табуляции). [15] |
U + 2ААА | 10922 | Меньше, чем | Дополнительный Математический Операторы |
⪪ | Среди прочего используется символ ECMA-17 / ISO 2047 для возврата каретки. [15] |
У + 2 ААБ | 10923 | Больше, чем | Дополнительный Математический Операторы |
⪫ | Среди прочего, это символ ECMA-17 / ISO 2047 для символа табуляции. [15] |
U + 3037 | 12343 | Идеографический перевод строки телеграфа Символ разделителя |
Символы CJK и пунктуация |
〷 | Изображение, используемое для кода 9999 в китайском телеграфном коде , обозначающее перевод строки. |
- ^ Над нулевой клавишей «0» или отрицательной клавишей «(‒)».
- Точное пространство
- Cambridge Z88 предоставил специальное «точное пространство» (кодовая точка 160, также известное как 0xA0) (вызываемое сочетанием клавиш). ⌑+ SPACE[19] ), отображается как «…» драйвером дисплея операционной системы. [20] [21] Поэтому он также был известен как «точечное пространство» в сочетании с BBC BASIC . [20] [21]
- Под кодовой точкой 224 (0xE0) компьютер также предоставил специальный символ ПРОБЕЛ шириной в три символа.
"SPC"
(аналог U+2420 для одной ячейки Unicode). [20] [21]
Пробелы без пробелов
[ редактировать ]- Блок Юникода «Шаблоны Брайля» содержит U+2800 ⠀ ПУСТОЙ ШАБЛОН БРАЙЛЯ , образец Брайля без выступающих точек. Некоторые шрифты отображают символ как пробел фиксированной ширины, однако стандарт Unicode прямо указывает, что он не действует как пробел. [22]
- в Юникоде Охват корейского алфавита включает несколько кодовых точек, которые обозначают отсутствие письменной буквы и, следовательно, не отображают глиф:
- Юникод включает символ- заполнитель хангыль в блок Jamo совместимости с хангылем ( U + 3164 ㅤ ХАНГУЛЬНЫЙ НАПОЛНИТЕЛЬ ). Это классифицируется как буква, но отображается как пустое место, как блок хангыль, не содержащий джамо. Он используется в комбинирующих последовательностях хангыль KS X 1001 для их введения или обозначения отсутствия буквы в позиции, но не в комбинирующей системе джамо Unicode. [23]
- Комбинированная система джамо Unicode использует аналогичные символы Hangul Choseong Filler и Hangul Jungseong Filler для обозначения отсутствия буквы в начальной или средней позиции внутри блока слогов, которые включены в блок Hangul Jamo ( U + 115F ᅟ HANGUL CHOSEONG FILLER , U+1160 ㅤ ХАНГЫЛЬ ЧОНСОН ФИЛЛЕР ). [24]
- Кроме того, заполнитель хангыль половинной ширины включен в формы половинной и полной ширины ( U+FFA0 ᅠ HALFWIDTH HANGUL FILLER ), который используется при сопоставлении кодировок, включающих символы как Johab (или Wansung ), так и N-байтового Hangul (или его аналога EBCDIC ), например IBM-933, который включает в себя как Johab, так и EBCDIC. наполнители. [25] [26]
Пробелы и цифровая типографика
[ редактировать ]Экранное меню
[ редактировать ]Текстовые редакторы , текстовые процессоры и программное обеспечение для настольных издательских систем различаются тем, как они представляют пробелы на экране и как они представляют пробелы на концах строк, длина которых превышает ширину экрана или столбца. В некоторых случаях пробелы отображаются просто как пустое пространство; в других случаях они могут быть представлены интерпунктом или другими символами. Для создания пробелов можно использовать множество различных символов (описанных ниже), а несимвольные функции (такие как поля и настройки табуляции) также могут влиять на пробелы.
Многие пробельные символы Юникода были созданы для совместимости с классической печатной типографикой. [27]
Даже если цифровая типографика имеет алгоритмический кернинг и выравнивание, эти пробелы при необходимости можно использовать для дополнения электронного форматирования.
Пространство общего назначения переменной ширины
[ редактировать ]В компьютерных кодировках символов имеется обычное пространство общего назначения (символ Юникода U+0020), ширина которого зависит от конструкции шрифта. Типичные значения варьируются от 1/5 em до 1/3 em (в цифровой типографике em равен номинальному размеру шрифта, поэтому для шрифта размером 10 пунктов пространство, вероятно, будет составлять от 2 до 3,3 пункта). Сложные шрифты могут иметь пробелы разного размера для жирного, курсива и прописных букв, и часто наборщики вручную регулируют ширину пробела в зависимости от размера и заметности текста.
В дополнение к этому пространству общего назначения можно закодировать пространство определенной ширины. Полный список смотрите в таблице ниже.
Волосы вокруг черточек
[ редактировать ]Длинные тире, используемые в качестве разделителей в скобках, и длинные тире , используемые в качестве соединителей слов, обычно непрерывны по тексту. [28] Однако такое тире может быть дополнительно окружено пробелом U +200A или тонким пробелом U+2009. Пространство для волос можно записать в HTML, используя числовые ссылки на символы.  
или  
, или названный объект  
, хотя по состоянию на 2016 год он не поддерживается в браузерах повсеместно. [update][ нужно обновить ] Тонкое пространство называется сущностью  
и числовые ссылки  
или  
. Эти пробелы намного тоньше, чем обычное пространство (за исключением моноширинного (непропорционального) шрифта ), причем пространство для волос, в частности, является самым тонким из горизонтальных символов пробелов.
Обычное пространство с длинным тире | слева — справа |
---|---|
Тонкое пространство с тире | слева — справа |
Пространство для волос с тире | слева — справа |
Нет места с длинным тире | влево-вправо |
Вычислительные приложения
[ редактировать ]Языки программирования
[ редактировать ]В большинства языков программирования синтаксисе могут использоваться пробельные символы для разделения токенов . В языке свободной формы символы пробелов игнорируются процессорами кода (т. е. компилятором ). Даже когда синтаксис языка требует пробелов, часто несколько символов пробелов обрабатываются как один. В внешних правил языке отступы являются синтаксически значимыми. В сатирическом и противоречивом языке под названием Whitespace пробелы являются единственными значимыми символами, а обычный текст игнорируется.
Правильное использование пробелов в исходном коде может сгруппировать связанную логику и облегчить понимание кода. Чрезмерное использование пробелов, в том числе в конце строки, где они не обеспечивают отрисовки, считается неудобством.
Большинство языков распознают только пробельные символы, имеющие код ASCII. Они запрещают большинство или все коды Unicode, перечисленные выше. Язык C определяет пробельные символы как «пробел, горизонтальную табуляцию, новую строку, вертикальную табуляцию и перевод страницы». [29] Сетевой протокол HTTP требует использования разных типов пробелов в разных частях протокола, например: только символ пробела в строке состояния , CRLF в конце строки и «линейный пробел» в значениях заголовка. [30]
Анализ командной строки
[ редактировать ]Типичные анализаторы командной строки используют пробел для разделения аргументов . Значение со встроенным пробелом является проблематичным, поскольку оно приводит к анализу значения как нескольких аргументов. Обычно синтаксический анализатор позволяет избежать обычного анализа аргументов, заключая текст в кавычки.
Предположим, вы хотите перечислить файлы в каталоге с именем «foo bar». Вместо этого эта команда перечисляет файлы, соответствующие «foo» или «bar»:
ls foo bar
Эта команда правильно указывает один аргумент:
ls "foo bar"
Языки разметки
[ редактировать ]Некоторые языки разметки , такие как SGML , сохраняют пробелы в том виде, в каком они написаны.
Языки веб-разметки, такие как XML и HTML, специально обрабатывают пробельные символы, включая пробелы, для удобства программистов. Один или несколько пробельных символов, считываемых соответствующими процессорами времени отображения этих языков разметки, сжимаются до 0 или 1 пробела, в зависимости от их семантического контекста. Например, двойные (или более) пробелы в тексте сворачиваются в один пробел, а пробелы, которые появляются по обе стороны от « =
", который отделяет имя атрибута от его значения, не влияет на интерпретацию документа. Конечные теги элемента могут содержать конечные пробелы, а теги пустых элементов в XML могут содержать пробелы перед " />
". В этих языках ненужные пробелы увеличивают размер файла и, таким образом, могут замедлить передачу данных по сети. С другой стороны, ненужные пробелы также могут незаметно отмечать код, аналогичный комментариям в коде, но менее очевидный. Это может быть желательно доказать. нарушение лицензии или авторских прав , совершенное путем копирования и вставки .
В значениях атрибутов XML последовательности символов пробелов обрабатываются как один пробел, когда документ читается анализатором. [31] Пробелы в содержимом элемента XML синтаксическим анализатором таким образом не изменяются, но приложение, получающее информацию от синтаксического анализатора, может применить аналогичные правила к содержимому элемента. Автор XML-документа может использовать xml:space="preserve"
атрибут элемента, чтобы указать синтаксическому анализатору не допускать изменения нижестоящим приложением пробелов в содержимом этого элемента.
В большинстве элементов HTML последовательность символов пробелов рассматривается как один разделитель между словами , который может проявляться как одиночный символ пробела при рендеринге текста на языке, который обычно вставляет такой пробел между словами. [32] Соответствующие средства визуализации HTML должны применять более буквальную обработку пробелов в нескольких предписанных элементах, таких как pre
тег и любой элемент, к которому CSS. применялся pre
-как обработка пробелов. В таких элементах пробелы не будут «сворачиваться» в разделители между словами.
И в XML, и в HTML неразрывный пробел вместе с другими нестандартными пробелами не рассматривается как свертываемый «пробел», поэтому на него не распространяются приведенные выше правила.
Имена файлов
[ редактировать ]Такое использование похоже на имена файлов, состоящие из нескольких слов, написанные для операционных систем и приложений, которые путаются из-за встроенных кодов пробелов — вместо этого в таких именах файлов используется подчеркивание (_) в качестве разделителя слов, as_in_this_phrase.
Еще одним таким символом был U+2422 ␢ ПУСТОЙ СИМВОЛ . Это использовалось в первые годы компьютерного программирования при написании форм кодирования. Операторы Keypunch сразу распознали этот символ как «явный пробел». [16] Он использовался в BCDIC , [16] EBCDIC , [16] и ASCII-1963 . [16]
См. также
[ редактировать ]- Возврат каретки
- Эм (типографика)
- Ан (типографика)
- Подача формы
- Стиль отступа
- Перевод строки
- Новая строка
- Стиль программирования
- Знаки для азбуки Морзе
- Регулярное выражение § Классы символов для класса символов пробелов.
- Пробел
- Пробел (пунктуация)
- Клавиша табуляции
- Обрезка (компьютерное программирование)
- Пробелы (язык программирования)
- Пространство нулевой ширины
Ссылки
[ редактировать ]- ^ «Стандарт Юникод» . Консорциум Юникод.
- ^ «Стандарты дизайна персонажей – космические символы» . Стандарты дизайна персонажей . Майкрософт . 1998–1999 гг. Архивировано из оригинала 14 марта 2010 года . Проверено 18 мая 2009 г.
- ^ Стандарт Unicode 5.0, печатное издание, стр. 205; также доступен на «Глава 6 — Системы письма и пунктуация» (PDF) . Стандарт Unicode 5.0, электронное издание . Консорциум Юникод . 14 июля 2006 г. п. 11 (205) . Проверено 22 декабря 2022 г.
- ^ «Общая пунктуация» (PDF) . Стандарт Юникод 5.1 . Юникод Инк . 1991–2008 гг . Проверено 13 мая 2009 г.
- ^ Сарджент, Мюррей III (29 августа 2006 г.). «Математическое кодирование почти простого текста в Юникоде (версия 2)» . Техническое примечание Unicode №28 . Юникод Инк . стр. 19–20 . Проверено 19 мая 2009 г.
- ^ Гиллам, Ричард (2002). Демистификация Unicode: Практическое руководство программиста по стандарту кодирования . Аддисон-Уэсли. ISBN 0-201-70052-2 .
- ^ Jump up to: а б Хиксон, Ян . «12.5 Ссылки на именованные символы» . Стандарт HTML . ЧТОРГ .
- ^ Вольфрам . «\[NegativeThickSpace]» . Документация по языку Wolfram .
- ^ Вольфрам . "\[NegativeMediumSpace]" . Документация по языку Wolfram .
- ^ Вольфрам . "\[NegativeThinSpace]" . Документация по языку Wolfram .
- ^ Вольфрам . «\[NegativeVeryThinSpace]» . Документация по языку Wolfram .
- ^ Фальтстрем, П., изд. (август 2010 г.). «Нулевая ширина без соединения» . Кодовые элементы Unicode и интернационализированные доменные имена для приложений (IDNA) . IETF . сек. А.1. дои : 10.17487/RFC5892 . РФК 5892 . Проверено 4 сентября 2019 г.
- ^ Фальтстрем, П., изд. (август 2010 г.). «Столяр нулевой ширины» . Кодовые элементы Unicode и интернационализированные доменные имена для приложений (IDNA) . IETF . сек. А.2. дои : 10.17487/RFC5892 . РФК 5892 . Проверено 4 сентября 2019 г.
- ^ «Стандартное приложение Юникода № 44, База данных символов Юникода» .
- ^ Jump up to: а б с д и ж Европейская ассоциация производителей компьютеров (28 ноября 1968 г.). Графическое представление управляющих символов 7-битного набора кодированных символов ECMA для обмена информацией (PDF) . ЭКМА-17.
- ^ Jump up to: а б с д и ж г час Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие (PDF) . Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc., стр. 41, 47, 52, 102–103, 117, 119, 130, 132, 141, 148, 150–151, 212, 424. ISBN. 978-0-201-14460-4 . LCCN 77-90165 . Архивировано (PDF) из оригинала 26 мая 2016 г. Проверено 25 августа 2019 г.
- ^ «Американский стандартный код обмена информацией, ASA X3.4-1963» . Американская ассоциация стандартов (ASA). 17 июня 1963 г.
- ^ Вирт, Никлаус (1988). Программирование в Модуле-2 (PDF) . дои : 10.1007/978-3-642-83565-0 . ISBN 978-3-642-83567-4 .
- ^ «Руководство пользователя Cambridge Z88» . 4.7 (4-е изд.). Кембридж Компьютер Лимитед . 2016 [1987]. Основные понятия - Клавиатура. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.
- ^ Jump up to: а б с «Руководство пользователя Cambridge Z88» . 4.0 (4-е изд.). Кембридж Компьютер Лимитед . 1987. Приложение D. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.
- ^ Jump up to: а б с «Руководство пользователя Cambridge Z88» . 4.7 (4-е изд.). Кембридж Компьютер Лимитед . 2015 [1987]. Приложение D. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.
- ^ Таблица Unicode U + 2800 , образцы Брайля
- ^ Чунг, Джемин (30 марта 2017 г.). Предложение добавить информационную заметку к U+3164 HANGUL FILLER (PDF) . Консорциум Юникод . UTC L2/17-081.
- ^ Хангыль Джамо (PDF) . Юникод Консорциум 2020-10-25.
- ^ "ibm-933_P110-1995" . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
- ^ "ibm-933_P110-1995 (ведущие байты 0E84)" . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
- ^ «Глава 6 — Системы письма и пунктуация» (PDF) . Стандарт Unicode 15.0, электронное издание . Консорциум Юникод . 13 сентября 2022 г. стр. 12–13 (267–268) . Проверено 23 декабря 2022 г.
Пробелы фиксированной ширины (U+2000..U+200A) взяты из традиционной типографики (горячего вывода). Алгоритмический кернинг и выравнивание в компьютерной типографике не используют эти символы. Однако там, где они используются (например, при наборе математических формул), их ширина обычно задается шрифтом, и они обычно не расширяются при выравнивании. Исключением является тонкое пространство U+2009, которое иногда корректируется.
- ^ Использование различных типов тире проиллюстрировано, например, в Чикагском руководстве по стилю , §§ 6.80, 6.83–6.86.
- ^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Раздел 6.4, параграф 3.
- ^ Филдинг, Р.; и др. (июнь 1999 г.), «2.2 Основные правила», Протокол передачи гипертекста — HTTP/1.1 , doi : 10.17487/RFC2616 , RFC 2616
- ^ «3.3.3 Нормализация значения атрибута» . Расширяемый язык разметки (XML) 1.0 (пятое издание) . Консорциум Всемирной паутины.
- ^ «9.1 Пробелы» . Спецификация W3CHTML 4.01 . Консорциум Всемирной паутины.