Столяр слов
Слово joiner ( WJ ) — это Юникода формата символ , который используется для обозначения того, что разрыв строки не должен происходить в его позиции. [1] Он не влияет на формирование лигатур или соединение скорописи и игнорируется при сегментации текста. [1] Он кодируется начиная с версии Unicode 3.2 (выпущенной в 2002 г.) как U+2060 ОБЪЕДИНИТЕЛЬ СЛОВ ( &Без перерыва; ).
Слово joiner заменяет неразрывный пробел нулевой ширины ( ZWNBSP , U+FEFF) при использовании неразрывного пробела нулевой ширины. ZWNBSP метки изначально и в настоящее время используется в качестве порядка байтов (BOM) в начале файла. Однако, если он встречается где-либо еще, согласно Unicode, его следует рассматривать как соединение слов, неразрывный пробел нулевой ширины.
Намеренное использование U+FEFF для этой цели не рекомендуется начиная с Unicode 3.2, при этом слово joiner настоятельно предпочтительнее. [1] [2]
См. также [ править ]
- Знак порядка байтов , который использует Символ U+FEFF НУЛЕВОЙ ШИРИНЫ БЕЗ РАЗРЫВОВ ПРОБЕЛА (ZWNBSP)
- Пространство нулевой ширины
- Соединение нулевой ширины , которое в таких алфавитах, как арабский или индийский, приводит к отображению двух символов в связанной форме, даже если в противном случае они бы не отображались.
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б с «Элементы управления макетом» (PDF) . Стандарт Юникод, версия 12.0.0 . Консорциум Юникод. п. 871.
- ^ Часто задаваемые вопросы — UTF-8, UTF-16, UTF-32 и спецификация: «Что мне делать с U+FEFF в середине файла?» .