Пробелный символ

Символ пробела — это символьный элемент данных , который представляет пробел при текста вводе . визуализируется для отображения на компьютере .

Например, пробел ( U+0020 ПРОБЕЛ , ASCII 32) представляет собой пробел , например разделитель слов в западном алфавите .

приводит Печатаемый символ к выводу при рендеринге, но символ пробела - нет. Вместо этого символы пробелов в ограниченной степени определяют расположение текста, нарушая обычную последовательность отображения символов рядом друг с другом. Вывод последующих символов обычно смещается вправо (или влево для сценария с письмом справа налево ) или к началу следующей строки. Эффект от нескольких последовательных символов пробелов является накопительным, так что следующий печатаемый символ отображается в месте, основанном на накопленном эффекте предыдущих символов пробелов.

Термин «пробелы» уходит корнями в общепринятую практику отображения текста на белой бумаге . Обычно пробельный символ не отображается как белый. Он влияет на рендеринг, но сам не рендерится.

Обзор [ править ]

Ширина различных Юникода пробельных символов

Символ пробела обычно вставляет горизонтальное пространство шириной примерно с букву. Для моноширинного шрифта ширина равна ширине буквы, а для шрифта переменной ширины ширина зависит от шрифта. Некоторые шрифты поддерживают несколько пробелов разной ширины.

Символ табуляции обычно вставляет горизонтальное пространство, основанное на позициях табуляции , которые различаются в зависимости от приложения .

Последовательность символов новой строки обычно перемещает место вывода рендеринга в начало следующей строки. Если следовать за текстом, это фактически не приводит к появлению пробелов. Но две последовательные последовательности новой строки между текстовыми блоками приводят к появлению пустой строки между блоками. Высота пустой строки зависит от приложения.

Использование пробелов для компоновки текста является общепринятым . Приложения иногда отображают пробельные символы как видимую разметку, чтобы пользователь мог видеть то, что обычно не видно.

Обычно пользователь вводит пробел, нажимая spacebar, символ табуляции, нажав Tab ↹ и новую строку, нажав ↵ Enter.

Юникод [ править ]

В таблице ниже перечислены двадцать пять символов, определенных как пробелы («WSpace=Y», «WS») в базе данных символов Юникода . ^[1] Семнадцать используют определение пробелов, соответствующее алгоритму двунаправленной записи («Тип двунаправленного символа = WS»), и известны как символы «Bidi-WS». Остальные символы также можно использовать, но они не относятся к типу «Биди».

Примечание. В зависимости от браузера и шрифтов, используемых для просмотра следующей таблицы, не все пробелы могут отображаться правильно.

v т и Символы Юникода со свойством White_Space=да ^[а]^[б]
Имя	Кодовая точка		Ширина коробки	Может сломаться ?	В ИДН ?	Скрипт	Блокировать	Общий категория	Примечания
табуляция символов	U + 0009	9		Да	Нет	Общий	Базовая латынь	Другой, контроль	HT, горизонтальная вкладка . HTML/XML Именованный объект : `&Tab;`, Латекс : `\tab`, C escape: `\t`
перевод строки	U + 000A	10	Это разрыв строки			Общий	Базовая латынь	Другой, контроль	НЧ, перевод строки . Именованный объект HTML/XML: `&NewLine;`, C escape: `\n`
табуляция строк	U + 000B	11	Это разрыв строки			Общий	Базовая латынь	Другой, контроль	VT, Вертикальная вкладка . С побег: `\v`
подача формы	U+000C	12	Это разрыв строки			Общий	Базовая латынь	Другой, контроль	FF, подача формы . С побег: `\f`
возврат каретки	U + 000D	13	Это разрыв строки			Общий	Базовая латынь	Другой, контроль	CR, Возврат каретки . С побег: `\r`
космос	U + 0020	32		Да	Нет	Общий	Базовая латынь	Сепаратор, космос	Наиболее распространенный (обычное пространство ASCII). Латекс: `\`
следующая строка	U + 0085	133	Это разрыв строки			Общий	Латиница-1 Добавка	Другой, контроль	НЭЛ, Следующая строка . Латекс: `\\`
пространство без перерыва	U + 00A0	160		Нет	Нет	Общий	Латиница-1 Добавка	Сепаратор, космос	Неразрывное пространство : идентично U+0020, но не является точкой, в которой строка может быть разорвана. Именованный объект HTML/XML: ` `, `&NonBreakingSpace;`, Латекс: `~`
знак пробела в огаме	U + 1680	5760		Да	Нет	Огам	Огам	Сепаратор, космос	Используется для разделения слов в огама тексте . Обычно это вертикальная линия в вертикальном тексте или горизонтальная линия в горизонтальном тексте, но также может быть пробелом в шрифтах без ножки. Требуется шрифт Ogham.
четверной	U+2000	8192		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Ширина одного en . U+2002 канонически эквивалентен этому символу; Предпочтителен U+2002.
в четверке	В +2001	8193		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Также известен как «бараний квадрокоптер». Ширина одного em . U+2003 канонически эквивалентен этому символу; Предпочтителен U+2003.
в космосе	В +2002 г.	8194		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Также известен как «орех». Ширина одного en . U+2000 En Quad канонически эквивалентен этому символу; Предпочтителен U+2002. Именованный объект HTML/XML: `&ensp;`, Латекс: `\enspace` (пробел LaTeX en — это неразрывный пробел)
космос	В +2003 г.	8195		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Также известен как «баранина». Ширина одного em . U+2001 Em Quad канонически эквивалентен этому персонажу; Предпочтителен U+2003. Именованный объект HTML/XML: `&emsp;`, Латекс: `\quad`
трехмерное пространство	В +2004 г.	8196		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Также известно как «густое пространство». Ширина одной трети метра. Именованный объект HTML/XML: `&emsp13;`, Латекс: `\;` (толстое пространство LaTeX — это неразрывное пространство)
четырехмерное пространство	В +2005 г.	8197		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Также известен как «средний космос». Одна четверть метра в ширину. Именованный объект HTML/XML: `&emsp14;`
шестиместное пространство	В +2006 г.	8198		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Ширина одной шестой сантиметра. В компьютерной типографике иногда приравнивается к U+2009.
фигура пространства	В +2007 г.	8199		Нет	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Фигурное пространство . В шрифтах с моноширинными цифрами, равными ширине одной цифры. Именованный объект HTML/XML: `&numsp;`
знак препинания	В +2008 г.	8200		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Ширина равна узкому пунктуационному знаку шрифта, т. е. расширенной ширине точки или запятой. ^[2] Именованный объект HTML/XML: `&puncsp;`
тонкое пространство	В +2009 г.	8201		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Тонкое пространство ; одна пятая (иногда одна шестая) ширины em. Рекомендуется использовать в качестве разделителя тысяч измерения для единиц СИ . В отличие от U+2002–U+2008, его ширину можно регулировать при наборе текста. ^[3] Именованный объект HTML/XML: ` `, ` `, Латекс: `\,` (тонкое пространство LaTeX представляет собой непрерывное пространство)
пространство для волос	У + 200А	8202		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Тоньше тонкого пространства. Именованный объект HTML/XML: `&hairsp;`, `&VeryThinSpace;`
разделитель строк	U + 2028	8232	Это разрыв строки			Общий	Общий Пунктуация	Сепаратор, линия
разделитель абзацев	U + 2029	8233	Это разрыв строки			Общий	Общий Пунктуация	Сепаратор, абзац
узкое неразрывное пространство	U + 202F	8239		Нет	Нет	Общий	Общий Пунктуация	Сепаратор, космос	Узкое неразрывное пространство . По функциям аналогичен безразрывному пробелу U+00A0. При использовании с монгольским языком его ширина обычно составляет одну треть обычного пространства; в другом контексте его ширина иногда напоминает ширину Тонкого Пространства (U+2009). Латекс: `\,`
среднее математическое пространство	U + 205F	8287		Да	Нет	Общий	Общий Пунктуация	Сепаратор, космос	ММСП. Используется в математических формулах. Четыре восемнадцатых эм. ^[4] В математической типографике ширина пробелов обычно задается целыми кратными восемнадцатой em, и 4/18 em может использоваться в нескольких ситуациях, например, между a и + и между + и b в выражение а+б . ^[5] Именованный объект HTML/XML: ` `, Латекс: `\:` (среднее пространство LaTeX является неразрывным)
идеографическое пространство	U+3000	12288		Да	Нет	Общий	Символы CJK и Пунктуация	Сепаратор, космос	Ширина такой же, как символьная ячейка CJK ( полная ширина ). Используется, например, в тай тоу .

v т и Связанные символы Юникода со свойством White_Space=нет
Имя	Кодовая точка		Ширина коробки	Может сломаться ?	В ИДН ?	Скрипт	Блокировать	Общий категория	Примечания
монгольский разделитель гласных	U + 180E	6158	᠎	Да	Нет	Монгольский	Монгольский	Другой, Формат	МВС. Символ узкого пробела, используемый в монгольском языке для того, чтобы последние два символа слова принимали разную форму. ^[6] Он больше не классифицируется как пробельный символ (т. е. в категории Zs) в Unicode 6.3.0, хотя в предыдущих версиях стандарта он был.
пространство нулевой ширины	U + 200B	8203		Да	Нет	?	Общий Пунктуация	Другой, Формат	ZWSP, пространство нулевой ширины . Используется для обозначения границ слов в системах обработки текста при использовании сценариев, в которых не используются явные пробелы. Он похож на мягкий дефис с той разницей, что последний используется для обозначения границ слогов и должен отображать видимый дефис, когда строка разрывается на нем. HTML/XML Именованный объект : `&ZeroWidthSpace;`^[7]^[с]
нулевая ширина	U+200C	8204	‌	Да	Контекстно-зависимый ^[12]	?	Общий Пунктуация	Другой, Формат	ZWNJ, необъединяемый элемент нулевой ширины . При размещении между двумя символами, которые в противном случае были бы соединены, ZWNJ заставляет их печатать в конечной и начальной формах соответственно. Именованный объект HTML/XML: `&zwnj;`
Столяр нулевой ширины	U + 200D	8205	‍	Да	Контекстно-зависимый ^[13]	?	Общий Пунктуация	Другой, Формат	ZWJ, соединитель нулевой ширины . При размещении между двумя символами, которые в противном случае не были бы соединены, ZWJ заставляет их печатать в связанных формах. Также может использоваться для изолированного отображения форм соединения. В зависимости от того, ожидается ли по умолчанию лигатура или соединение, может либо вызывать (как в эмодзи и в сингальском языке ), либо подавлять (как в деванагари ) замену одним глифом, при этом позволяя использовать отдельные формы соединения (в отличие от ZWNJ). Именованный объект HTML/XML: `&zwj;`
словосочетание	U + 2060	8288	⁠	Нет	Нет	?	Общий Пунктуация	Другой, Формат	WJ, столяр слов . Аналогично U+200B, но не является точкой, в которой линия может быть прервана. Именованный объект HTML/XML: `&NoBreak;`
неразрывное пространство нулевой ширины	U+FEFF	65279		Нет	Нет	?	арабский Презентация Формы-Б	Другой, Формат	Неразрывное пространство нулевой ширины . Используется в основном как знак порядка байтов . Использование в качестве обозначения неразрывности устарело начиная с Unicode 3.2; вместо этого см. U + 2060.

^ White_Space — это двоичное свойство Юникода. ^[14] ^ «PropList-15.1.0.txt» . Юникод . 01.08.2023 . Проверено 12 сентября 2023 г. ^ Хотя `&ZeroWidthSpace;` — это один объект с именем HTML5 для U+200B, дополнительные имена `NegativeMediumSpace`, `NegativeThickSpace`, `NegativeThinSpace` и `NegativeVeryThinSpace` (это имена, используемые в языке Wolfram Language для пространств с отрицательным продвижением, которые он отображает в Область частного использования ) ^[8]^[9]^[10]^[11] также определяются HTML5 как псевдонимы для U+200B (например, `&NegativeMediumSpace;`). ^[7]

Заменить изображения [ править ]

Юникод также предоставляет некоторые видимые символы, которые можно использовать для обозначения различных символов пробелов в контекстах, где видимый символ должен отображаться:

Символы Юникода, иллюстрирующие пробелы (видимые)
Код	Десятичный	Имя	Блокировать	Отображать	Описание
U + 00B7	183	Средняя точка	Дополнение Latin-1	·	Интерпункт Именованная сущность: `·`
U + 21A1	8609	Двунаправленная стрелка вниз	Стрелки	↡	Символ ECMA-17/ ISO 2047 для перевода страницы (разрыв страницы) ^[15]
U + 2261	8810	Идентичен	Математический Операторы	≡	Среди прочего, это символ ECMA-17 / ISO 2047 для перевода строки. ^[15]
U + 237D	9085	Открытая коробка с плечами	Разное техническое	⍽	Используется для обозначения NBSP
U + 23CE	9166	Символ возврата	Разное техническое	⏎	Символ клавиши возврата , которая вводит разрыв строки
U + 2409	9225	Символ горизонтальной таблицы	Контрольные изображения	␉	Заменители символа табуляции
U + 240А	9226	Символ перевода строки	Контрольные изображения	␊	Заменители перевода строки
U + 240B	9227	Символ вертикальной таблицы	Контрольные изображения	␋	Заменители вертикальной табуляции (строчной табуляции)
U+240C	9228	Символ подачи формы	Контрольные изображения	␌	Заменители подачи формы (разрыв страницы)
U + 240D	9229	Символ возврата каретки	Контрольные изображения	␍	Заменители возврата каретки
U + 2420	9248	Символ космоса	Контрольные изображения	␠	Заменители пробела ASCII
U + 2422	9250	Пустой символ	Контрольные изображения	␢	он же «заменить пробел», ^[16] используется в BCDIC , ^[16] EBCDIC , ^[16] ASCII-1963 ^[16]^[17] и т. д. как символ разделителя слов
U + 2423	9251	Открытая коробка	Контрольные изображения	␣	Используется в рукописном вводе печатными буквами, по крайней мере, с 1980-х годов, когда необходимо явно указать количество пробельных символов (например, при программировании с помощью ручки и бумаги). Используется в учебнике (опубликованном в 1982, 1984, 1985, 1988 годах издательством Springer-Verlag) по Модуле-2 , ^[18] язык программирования, в котором пространственные коды требуют явного указания. Также используется в клавиатуре ^{[n 1]} серии -8 x TI графических калькуляторов компании Texas Instruments . Именованная сущность: `&blank;`
U + 2424	9252	Символ новой строки	Контрольные изображения	␤	Заменители разрыва строки
U + 25B3	9651	Белый треугольник вершиной вверх	Геометрические фигуры	△	Среди прочего используется символ ECMA-17 / ISO 2047 для пространства ASCII. ^[15]
U + 2A5B	10843	Логическое или со средним стеблем	Дополнительный Математический Операторы	⩛	Среди прочего используется символ ECMA-17 / ISO 2047 для вертикальной табуляции (строчной табуляции). ^[15]
U + 2ААА	10922	Меньше, чем	Дополнительный Математический Операторы	⪪	Среди прочего используется символ ECMA-17 / ISO 2047 для возврата каретки. ^[15]
У + 2 ААБ	10923	Больше, чем	Дополнительный Математический Операторы	⪫	Среди прочего, это символ ECMA-17 / ISO 2047 для символа табуляции. ^[15]
U + 3037	12343	Идеографический перевод строки телеграфа Символ разделителя	Символы CJK и пунктуация	〷	Изображение, используемое для кода 9999 в китайском телеграфном коде , обозначающее перевод строки.

^ Над нулевой клавишей «0» или отрицательной клавишей «(‒)».

Точное пространство

Cambridge Z88 предоставил специальное «точное пространство» (кодовая точка 160, также известное как 0xA0) (вызываемое сочетанием клавиш). ⌑+ SPACE^[19]), отображается как «…» драйвером дисплея операционной системы. ^[20]^[21] Поэтому он также был известен как «точечное пространство» в сочетании с BBC BASIC . ^[20]^[21]
Под кодовой точкой 224 (0xE0) компьютер также предоставил специальный символ ПРОБЕЛ шириной в три символа. "SPC" (аналог U+2420 для одной ячейки Unicode). ^[20]^[21]

Пробелы без пробелов [ править ]

Блок Юникода «Шаблоны Брайля» содержит U+2800 ⠀ ПУСТОЙ ШАБЛОН БРАЙЛЯ , образец Брайля без выступающих точек. Некоторые шрифты отображают символ как пробел фиксированной ширины, однако стандарт Unicode прямо указывает, что он не действует как пробел. ^[22]
в Юникоде Охват корейского алфавита включает несколько кодовых точек, которые обозначают отсутствие письменной буквы и, следовательно, не отображают глиф:
- Юникод включает символ- заполнитель хангыль в блок Jamo совместимости с хангылем ( U + 3164 ㅤ ХАНГУЛЬНЫЙ НАПОЛНИТЕЛЬ ). Это классифицируется как буква, но отображается как пустое место, как блок хангыль, не содержащий джамо. Он используется в комбинирующих последовательностях хангыль KS X 1001 для их введения или обозначения отсутствия буквы в позиции, но не в комбинирующей системе джамо Unicode. ^[23]
- Комбинированная система джамо Unicode использует аналогичные символы Hangul Choseong Filler и Hangul Jungseong Filler для обозначения отсутствия буквы в начальной или средней позиции внутри блока слогов, которые включены в блок Hangul Jamo ( U + 115F ᅟ HANGUL CHOSEONG FILLER , U+1160 ㅤ ХАНГЫЛЬ ЧОНСОН ФИЛЛЕР ). ^[24]
- Кроме того, заполнитель хангыль половинной ширины включен в формы половинной и полной ширины ( U+FFA0 ﾠ HALFWIDTH HANGUL FILLER ), который используется при сопоставлении кодировок, включающих символы как Johab (или Wansung ), так и N-байтового Hangul (или его аналога EBCDIC ), например IBM-933, который включает в себя как Johab, так и EBCDIC. наполнители. ^[25]^[26]

Пробелы и цифровая типографика [ править ]

Экранное меню [ править ]

Текстовые редакторы , текстовые процессоры и программное обеспечение для настольных издательских систем различаются тем, как они представляют пробелы на экране и как они представляют пробелы на концах строк, длина которых превышает ширину экрана или столбца. В некоторых случаях пробелы отображаются просто как пустое пространство; в других случаях они могут быть представлены интерпунктом или другими символами. Для создания пробелов можно использовать множество различных символов (описанных ниже), а несимвольные функции (такие как поля и настройки табуляции) также могут влиять на пробелы.

Многие пробельные символы Юникода были созданы для совместимости с классической печатной типографикой. ^[27]

Даже если цифровая типографика имеет алгоритмический кернинг и выравнивание, эти пробелы при необходимости можно использовать для дополнения электронного форматирования.

Пространство общего назначения переменной ширины [ править ]

В компьютерных кодировках символов имеется обычное пространство общего назначения (символ Юникода U+0020), ширина которого зависит от конструкции шрифта. Типичные значения варьируются от 1/5 em до 1/3 em (в цифровой типографике em равен номинальному размеру шрифта, поэтому для шрифта размером 10 пунктов пространство, вероятно, будет составлять от 2 до 3,3 пункта). Сложные шрифты могут иметь пробелы разного размера для жирного, курсива и прописных букв, и часто наборщики вручную регулируют ширину пробела в зависимости от размера и заметности текста.

В дополнение к этому пространству общего назначения можно закодировать пространство определенной ширины. Полный список смотрите в таблице ниже.

Волосы вокруг тире [ править ]

Длинные тире, используемые в качестве разделителей в скобках, и длинные тире , используемые в качестве соединителей слов, обычно непрерывны по тексту. ^[28] Однако такое тире может быть дополнительно окружено пробелом U +200A или тонким пробелом U+2009. Пространство для волос можно записать в HTML, используя числовые ссылки на символы.   или  , или названный объект &hairsp;, но по состоянию на 2016 год он еще не поддерживается в браузерах повсеместно. ^[update]^{[ нужно обновить ]} Тонкое пространство называется сущностью   и числовые ссылки   или  . Эти пробелы намного тоньше, чем обычное пространство (за исключением моноширинного (непропорционального) шрифта ), причем пространство для волос, в частности, является самым тонким из горизонтальных символов пробелов.

Обычное пространство по сравнению с волосами и тонкими пространствами (как отображается в вашем браузере)
Обычное пространство с длинным тире	слева — справа
Тонкое пространство с тире	слева — справа
Пространство для волос с тире	слева — справа
Нет места с длинным тире	влево-вправо

Вычислительные приложения [ править ]

Языки программирования [ править ]

В большинства языков программирования синтаксисе могут использоваться пробельные символы для разделения токенов . В языке свободной формы символы пробелов игнорируются процессорами кода (т. е. компилятором ). Даже когда синтаксис языка требует пробелов, часто несколько символов пробелов обрабатываются как один. В внешних правил языке отступы являются синтаксически значимыми. В сатирическом и противоречивом языке под названием Whitespace пробелы являются единственными значимыми символами, а обычный текст игнорируется.

Правильное использование пробелов в исходном коде может сгруппировать связанную логику и облегчить понимание кода. Чрезмерное использование пробелов, в том числе в конце строки, где они не обеспечивают рендеринга, считается неудобством .

Большинство языков распознают только пробельные символы, имеющие код ASCII. Они запрещают большинство или все коды Unicode, перечисленные выше. Язык C определяет пробельные символы как «пробел, горизонтальную табуляцию, новую строку, вертикальную табуляцию и перевод страницы». ^[29] Сетевой протокол HTTP требует использования разных типов пробелов в разных частях протокола, например: только символ пробела в строке состояния , CRLF в конце строки и «линейный пробел» в значениях заголовка. ^[30]

Анализ командной строки [ править ]

Типичные анализаторы командной строки используют пробел для разделения аргументов . Значение со встроенным пробелом является проблематичным, поскольку оно приводит к анализу значения как нескольких аргументов. Обычно синтаксический анализатор позволяет избежать обычного анализа аргументов, заключая текст в кавычки.

Предположим, вы хотите перечислить файлы в каталоге с именем «foo bar». Вместо этого эта команда перечисляет файлы, соответствующие «foo» или «bar»:

ls foo bar

Эта команда правильно указывает один аргумент:

ls "foo bar"

Языки разметки [ править ]

Некоторые языки разметки , такие как SGML , сохраняют пробелы в том виде, в каком они написаны.

Языки веб-разметки, такие как XML и HTML, специально обрабатывают пробельные символы, включая пробелы, для удобства программистов. Один или несколько пробельных символов, считываемых соответствующими процессорами времени отображения этих языков разметки, сжимаются до 0 или 1 пробела, в зависимости от их семантического контекста. Например, двойные (или более) пробелы в тексте сворачиваются в один пробел, а пробелы, которые появляются по обе стороны от « =", который отделяет имя атрибута от его значения, не влияет на интерпретацию документа. Конечные теги элемента могут содержать конечные пробелы, а теги пустых элементов в XML могут содержать пробелы перед " />". В этих языках ненужные пробелы увеличивают размер файла и, таким образом, могут замедлить передачу данных по сети. С другой стороны, ненужные пробелы также могут незаметно отмечать код, аналогичный комментариям в коде, но менее очевидный. Это может быть желательно доказать. нарушение лицензии или авторских прав , совершенное путем копирования и вставки .

В значениях атрибутов XML последовательности символов пробелов обрабатываются как один пробел, когда документ читается анализатором. ^[31] Пробелы в содержимом элемента XML синтаксическим анализатором таким образом не изменяются, но приложение, получающее информацию от синтаксического анализатора, может применить аналогичные правила к содержимому элемента. Автор XML-документа может использовать xml:space="preserve" атрибут элемента, чтобы указать синтаксическому анализатору не допускать изменения нижестоящим приложением пробелов в содержимом этого элемента.

В большинстве элементов HTML последовательность символов пробелов рассматривается как один разделитель между словами , который может проявляться как одиночный символ пробела при рендеринге текста на языке, который обычно вставляет такой пробел между словами. ^[32] Соответствующие средства визуализации HTML должны применять более буквальную обработку пробелов в нескольких предписанных элементах, таких как pre тег и любой элемент, к которому CSS. применялся pre-как обработка пробелов. В таких элементах пробелы не будут «сворачиваться» в разделители между словами.

И в XML, и в HTML неразрывный пробел вместе с другими нестандартными пробелами не рассматривается как свертываемый «пробел», поэтому на него не распространяются приведенные выше правила.

Имена файлов [ править ]

Такое использование похоже на имена файлов, состоящие из нескольких слов, написанные для операционных систем и приложений, которые путаются из-за встроенных кодов пробелов — вместо этого в таких именах файлов используется подчеркивание (_) в качестве разделителя слов, as_in_this_phrase.

Еще одним таким символом был U+2422 ␢ ПУСТОЙ СИМВОЛ . Это использовалось в первые годы компьютерного программирования при написании форм кодирования. Операторы Keypunch сразу распознали этот символ как «явный пробел». ^[16] Он использовался в BCDIC , ^[16] EBCDIC , ^[16] и ASCII-1963 . ^[16]

См. также [ править ]

Ссылки [ править ]

^ «Стандарт Юникод» . Консорциум Юникод.
^ «Стандарты дизайна персонажей – космические символы» . Стандарты дизайна персонажей . Майкрософт . 1998–1999 гг. Архивировано из оригинала 14 марта 2010 года . Проверено 18 мая 2009 г.
^ Стандарт Unicode 5.0, печатное издание, стр. 205; также доступен на «Глава 6 — Системы письма и пунктуация» (PDF) . Стандарт Unicode 5.0, электронное издание . Консорциум Юникод . 14 июля 2006 г. п. 11 (205) . Проверено 22 декабря 2022 г.
^ «Общая пунктуация» (PDF) . Стандарт Юникод 5.1 . Юникод Инк . 1991–2008 гг . Проверено 13 мая 2009 г.
^ Сарджент, Мюррей III (29 августа 2006 г.). «Математическое кодирование почти простого текста в Юникоде (версия 2)» . Техническое примечание Unicode №28 . Юникод Инк . стр. 19–20 . Проверено 19 мая 2009 г.
^ Гиллам, Ричард (2002). Демистификация Unicode: Практическое руководство программиста по стандарту кодирования . Аддисон-Уэсли. ISBN 0-201-70052-2 .
↑ Перейти обратно: Перейти обратно: ^а ^б Хиксон, Ян . «12.5 Ссылки на именованные символы» . Стандарт HTML . ЧТОРГ .
^ Вольфрам . «\[NegativeThickSpace]» . Документация по языку Wolfram .
^ Вольфрам . "\[NegativeMediumSpace]" . Документация по языку Wolfram .
^ Вольфрам . "\[NegativeThinSpace]" . Документация по языку Wolfram .
^ Вольфрам . «\[NegativeVeryThinSpace]» . Документация по языку Wolfram .
^ Фальтстрем, П., изд. (август 2010 г.). «Нулевая ширина без соединения» . Кодовые элементы Unicode и интернационализированные доменные имена для приложений (IDNA) . IETF . сек. А.1. дои : 10.17487/RFC5892 . РФК 5892 . Проверено 4 сентября 2019 г.
^ Фальтстрем, П., изд. (август 2010 г.). «Столяр нулевой ширины» . Кодовые элементы Unicode и интернационализированные доменные имена для приложений (IDNA) . IETF . сек. А.2. дои : 10.17487/RFC5892 . РФК 5892 . Проверено 4 сентября 2019 г.
^ «Стандартное приложение Юникода № 44, База данных символов Юникода» .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж Европейская ассоциация производителей компьютеров (28 ноября 1968 г.). Графическое представление управляющих символов 7-битного набора кодированных символов ECMA для обмена информацией (PDF) . ЭКМА-17.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие (PDF) . Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc., стр. 41, 47, 52, 102–103, 117, 119, 130, 132, 141, 148, 150–151, 212, 424. ISBN. 978-0-201-14460-4 . LCCN 77-90165 . Архивировано (PDF) из оригинала 26 мая 2016 г. Проверено 25 августа 2019 г.
^ «Американский стандартный код обмена информацией, ASA X3.4-1963» . Американская ассоциация стандартов (ASA). 17 июня 1963 г.
^ Никлаус Вирт, Программирование в Модуле-2
^ «Руководство пользователя Cambridge Z88» . 4.7 (4-е изд.). Кембридж Компьютер Лимитед . 2016 [1987]. Основные понятия - Клавиатура. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с «Руководство пользователя Cambridge Z88» . 4.0 (4-е изд.). Кембридж Компьютер Лимитед . 1987. Приложение D. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с «Руководство пользователя Cambridge Z88» . 4.7 (4-е изд.). Кембридж Компьютер Лимитед . 2015 [1987]. Приложение D. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.
^ Таблица Unicode U + 2800 , образцы Брайля
^ Чунг, Джемин (30 марта 2017 г.). Предложение добавить информационную заметку к U+3164 HANGUL FILLER (PDF) . Консорциум Юникод . UTC L2/17-081.
^ Хангыль Джамо (PDF) . Юникод Консорциум 2020-10-25.
^ "ibm-933_P110-1995" . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
^ "ibm-933_P110-1995 (ведущие байты 0E84)" . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
^ «Глава 6 — Системы письма и пунктуация» (PDF) . Стандарт Unicode 15.0, электронное издание . Консорциум Юникод . 13 сентября 2022 г. стр. 12–13 (267–268) . Проверено 23 декабря 2022 г. Пробелы фиксированной ширины (U+2000..U+200A) взяты из традиционной типографики (горячего вывода). Алгоритмический кернинг и выравнивание в компьютерной типографике не используют эти символы. Однако там, где они используются (например, при наборе математических формул), их ширина обычно задается шрифтом, и они обычно не расширяются при выравнивании. Исключением является тонкое пространство U+2009, которое иногда корректируется.
^ Использование различных типов тире проиллюстрировано, например, в Чикагском руководстве по стилю , §§ 6.80, 6.83–6.86.
^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Раздел 6.4, параграф 3.
^ Филдинг, Р.; и др. (июнь 1999 г.), «2.2 Основные правила», Протокол передачи гипертекста — HTTP/1.1 , doi : 10.17487/RFC2616 , RFC 2616
^ «3.3.3 Нормализация значения атрибута» . Расширяемый язык разметки (XML) 1.0 (пятое издание) . Консорциум Всемирной паутины.
^ «9.1 Пробелы» . Спецификация W3CHTML 4.01 . Консорциум Всемирной паутины.

Внешние ссылки [ править ]

Список свойств базы данных символов Юникода

[wsdef-2] White_Space — это двоичное свойство Юникода. ^[14]

[ws-3] «PropList-15.1.0.txt» . Юникод . 01.08.2023 . Проверено 12 сентября 2023 г.

[14] Хотя &ZeroWidthSpace; — это один объект с именем HTML5 для U+200B, дополнительные имена NegativeMediumSpace, NegativeThickSpace, NegativeThinSpace и NegativeVeryThinSpace (это имена, используемые в языке Wolfram Language для пространств с отрицательным продвижением, которые он отображает в Область частного использования ) ^[8]^[9]^[10]^[11] также определяются HTML5 как псевдонимы для U+200B (например, &NegativeMediumSpace;). ^[7]

[22] Над нулевой клавишей «0» или отрицательной клавишей «(‒)».

[1] «Стандарт Юникод» . Консорциум Юникод.

[4] «Стандарты дизайна персонажей – космические символы» . Стандарты дизайна персонажей . Майкрософт . 1998–1999 гг. Архивировано из оригинала 14 марта 2010 года . Проверено 18 мая 2009 г.

[5] Стандарт Unicode 5.0, печатное издание, стр. 205; также доступен на «Глава 6 — Системы письма и пунктуация» (PDF) . Стандарт Unicode 5.0, электронное издание . Консорциум Юникод . 14 июля 2006 г. п. 11 (205) . Проверено 22 декабря 2022 г.

[6] «Общая пунктуация» (PDF) . Стандарт Юникод 5.1 . Юникод Инк . 1991–2008 гг . Проверено 13 мая 2009 г.

[7] Сарджент, Мюррей III (29 августа 2006 г.). «Математическое кодирование почти простого текста в Юникоде (версия 2)» . Техническое примечание Unicode №28 . Юникод Инк . стр. 19–20 . Проверено 19 мая 2009 г.

[Gillam-8] Гиллам, Ричард (2002). Демистификация Unicode: Практическое руководство программиста по стандарту кодирования . Аддисон-Уэсли. ISBN 0-201-70052-2 .

[html5entity-9] Перейти обратно: Перейти обратно: ^а ^б Хиксон, Ян . «12.5 Ссылки на именованные символы» . Стандарт HTML . ЧТОРГ .

[10] Вольфрам . «\[NegativeThickSpace]» . Документация по языку Wolfram .

[11] Вольфрам . "\[NegativeMediumSpace]" . Документация по языку Wolfram .

[12] Вольфрам . "\[NegativeThinSpace]" . Документация по языку Wolfram .

[13] Вольфрам . «\[NegativeVeryThinSpace]» . Документация по языку Wolfram .

[15] Фальтстрем, П., изд. (август 2010 г.). «Нулевая ширина без соединения» . Кодовые элементы Unicode и интернационализированные доменные имена для приложений (IDNA) . IETF . сек. А.1. дои : 10.17487/RFC5892 . РФК 5892 . Проверено 4 сентября 2019 г.

[16] Фальтстрем, П., изд. (август 2010 г.). «Столяр нулевой ширины» . Кодовые элементы Unicode и интернационализированные доменные имена для приложений (IDNA) . IETF . сек. А.2. дои : 10.17487/RFC5892 . РФК 5892 . Проверено 4 сентября 2019 г.

[17] «Стандартное приложение Юникода № 44, База данных символов Юникода» .

[ECMA-17-18] Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж Европейская ассоциация производителей компьютеров (28 ноября 1968 г.). Графическое представление управляющих символов 7-битного набора кодированных символов ECMA для обмена информацией (PDF) . ЭКМА-17.

[Mackenzie_1980-19] Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие (PDF) . Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc., стр. 41, 47, 52, 102–103, 117, 119, 130, 132, 141, 148, 150–151, 212, 424. ISBN. 978-0-201-14460-4 . LCCN 77-90165 . Архивировано (PDF) из оригинала 26 мая 2016 г. Проверено 25 августа 2019 г.

[ASCII-1963-20] «Американский стандартный код обмена информацией, ASA X3.4-1963» . Американская ассоциация стандартов (ASA). 17 июня 1963 г.

[21] Никлаус Вирт, Программирование в Модуле-2

[Cambridge_UG_Keyboard-23] «Руководство пользователя Cambridge Z88» . 4.7 (4-е изд.). Кембридж Компьютер Лимитед . 2016 [1987]. Основные понятия - Клавиатура. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.

[Cambridge_UG40_AppendixD-24] Перейти обратно: Перейти обратно: ^а ^б ^с «Руководство пользователя Cambridge Z88» . 4.0 (4-е изд.). Кембридж Компьютер Лимитед . 1987. Приложение D. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.

[Cambridge_UG_AppendixD-25] Перейти обратно: Перейти обратно: ^а ^б ^с «Руководство пользователя Cambridge Z88» . 4.7 (4-е изд.). Кембридж Компьютер Лимитед . 2015 [1987]. Приложение D. Архивировано из оригинала 12 декабря 2016 г. Проверено 12 декабря 2016 г.

[Unicode_chart_U2800-26] Таблица Unicode U + 2800 , образцы Брайля

[27] Чунг, Джемин (30 марта 2017 г.). Предложение добавить информационную заметку к U+3164 HANGUL FILLER (PDF) . Консорциум Юникод . UTC L2/17-081.

[28] Хангыль Джамо (PDF) . Юникод Консорциум 2020-10-25.

[29] "ibm-933_P110-1995" . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .

[30] "ibm-933_P110-1995 (ведущие байты 0E84)" . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .

[31] «Глава 6 — Системы письма и пунктуация» (PDF) . Стандарт Unicode 15.0, электронное издание . Консорциум Юникод . 13 сентября 2022 г. стр. 12–13 (267–268) . Проверено 23 декабря 2022 г. Пробелы фиксированной ширины (U+2000..U+200A) взяты из традиционной типографики (горячего вывода). Алгоритмический кернинг и выравнивание в компьютерной типографике не используют эти символы. Однако там, где они используются (например, при наборе математических формул), их ширина обычно задается шрифтом, и они обычно не расширяются при выравнивании. Исключением является тонкое пространство U+2009, которое иногда корректируется.

[32] Использование различных типов тире проиллюстрировано, например, в Чикагском руководстве по стилю , §§ 6.80, 6.83–6.86.

[33] ttp://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf Раздел 6.4, параграф 3.

[34] Филдинг, Р.; и др. (июнь 1999 г.), «2.2 Основные правила», Протокол передачи гипертекста — HTTP/1.1 , doi : 10.17487/RFC2616 , RFC 2616

[35] «3.3.3 Нормализация значения атрибута» . Расширяемый язык разметки (XML) 1.0 (пятое издание) . Консорциум Всемирной паутины.

[36] «9.1 Пробелы» . Спецификация W3CHTML 4.01 . Консорциум Всемирной паутины.

[1]

[а]

[б]

[2]

[3]

[4]

[5]

[6]

[7]

[с]

[12]

[13]

[14]

[8]

[9]

[10]

[11]

[15]

[16]

[17]

[18]

[n 1]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]