Несоединяемый элемент нулевой ширины
Необъединитель нулевой ширины ( ZWNJ , / z w ɪ n dʒ / ; визуализируется: ; HTML-объект : ‌ или ‌) — непечатный символ , используемый при компьютеризации систем письма , использующих лигатуры . При размещении между двумя символами, которые в противном случае были бы соединены в лигатуру, ZWNJ заставляет их печатать в окончательной и начальной формах соответственно. Это тоже эффект пробела , но ZWNJ используется, когда желательно расположить символы ближе друг к другу или соединить слово с его морфемой.
ZWNJ кодируется в Юникоде как U+200C НУЛЕВАЯ ШИРИНА, НЕ СОЕДИНЯЮЩАЯСЯ ( ‌ ).
Использование ZWNJ для правильной типографики.
[ редактировать ]В некоторых языках ZWNJ необходим для однозначного указания правильной типографской формы последовательности символов.
Правильно (с ZWNJ) | Неправильный | Значение | ||||
---|---|---|---|---|---|---|
Отображать | Картина | Код | Отображать | Картина | Код | |
Я хочу | می‌خواهم (изображено справа налево): می‌خواهم | Я хочу | میخواهم | Персидское «Я хочу» | ||
Саа ءЯннис | ساءين‌س (изображено справа налево): ساءين‌س | Сааа ءЯнс | ساءينس | Малайская «наука» | ||
Существование | הֱ‌ֽיֹות (изображено справа налево): הֱ‌ֽיֹות | Существование | הֱֽיֹות | Древнееврейское «быть» | ||
Версия | Auf‌lage | версия | Auflage | Немецкое «издание» ( сочетание « auf » + « Lage ») | ||
Время перекуса | Brot‌zeit | Закуска | Brotzeit | Немецкая (региональная) «(вид) закуска» (сложное существительное " Brot " + " Zeit " = 'время хлеба'), показано в переломе | ||
глухо | deaf‌ly | глухой | deafly | Не соединение «деа»+«летать», а наречие «глухой». | ||
мужа | श्रीमान्‌को | мужа | श्रीमान्को | На непальском языке «мужа» или «уважаемого человека» в зависимости от того, что используется для обозначения «श्रीमान्» (мужа или уважаемого человека). | ||
праздник | উদ্‌যাপন | праздник | উদ্যাপন | Бенгальский смысл праздника. | ||
алкоголь | अय्‌लाः | Алкоголь | अय्लाः | Вино в Непалбхасе | ||
Хайдарабад | హైద్‌రాబాదు | Хайдарабад | హైద్రాబాదు | Хайдарабад, написано на телугу |
На картинке показано, как выглядит код, когда он отрисован правильно, причем в каждой строке правильные и неправильные картинки должны быть разными. В системе, которая не настроена на правильное отображение Юникода, правильное и неправильное отображение могут выглядеть одинаково или любое из них может значительно отличаться от соответствующего изображения.
В этом примере на библейском иврите расположение метега слева от сегола правильное , на котором есть знак шва , написанный в виде двух вертикальных точек для обозначения короткой гласной. Если бы метег стоял слева от швы , это было бы ошибочно. В современном иврите нет причин использовать метег для разговорной речи, поэтому он редко используется в наборе текста на современном иврите.
В немецкой типографике лигатуры не могут пересекать границы составных частей . Так, в первом немецком примере приставка Auf- отделена от остального слова, чтобы запретить лигатуру fl . Точно так же в английском языке некоторые утверждают, что лигатуры не должны пересекать границы морфем . [1] [ нужен лучший источник ] Например, в некоторых словах «муха» и «рыба» являются морфемами, а в других — нет; следовательно, по их рассуждениям, такие слова, как глухой и эгоистичный (здесь показаны с несоединяемым знаком), не должны иметь лигатур (соответственно fl и fi), в то время как подсолнечник и сом должны их иметь.
В персидском языке этот символ широко используется для определенных префиксов, суффиксов и составных слов. [2] Это необходимо для устранения неоднозначности сложных слов от несоставных слов, в которых используется полный пробел.
В джави малайском алфавите ZWNJ используется всякий раз, когда в конце любой фразы пишется более одной согласной ( سا ء ينس , по-малайски «наука» или sains в латинском алфавите, произносится /ˈsa.ɪ ns /.). используется для обозначения отсутствия гласных (в частности, «a» или «ə») между двумя согласными буквами, поскольку سا ء ينس в противном случае произносилось бы либо /ˈsa.ɪnas/, либо /ˈsa.ɪnəs/. Пробел будет разделять фразу на разные слова, где такие фразы, как سا ء ين س, теперь будут означать «подписать арабскую букву грех » ( sain sin на латинице).
Использование ZWNJ для отображения альтернативных форм
[ редактировать ]В индийских сценариях вставка ZWNJ после согласной либо с галантом , либо перед зависимой гласной препятствует правильному соединению символов: [3]
В Деванагари персонажи क् и ष обычно объединяются, образуя क्ष , но когда между ними вставлен ZWNJ, Код : क्‌ष
) вместо этого виден.
В каннада символы ನ್ и ನ объединяются, образуя ನ್ನ, но когда между ними вставляется ZWNJ, отображается ನ್ನ. Этот стиль обычно используется для написания иностранных слов каннада: « Facebook » пишется как ಫೇಸ್ಬುಕ್, хотя его можно написать и как ಫೇಸ್ಬುಕ್. ರಾಜ್ಕುಮಾರ್ и ರಾಮ್ಗೊಪಾಲ್ являются примерами других имен собственных, которым нужен ZWNJ.
Чтобы вставить ZWNJ на каннада, используйте Shift-V в Linux ( iBus , InScript). В Windows ( InScript ) вы можете создать ZWNJ с помощью Ctrl+Shift+2 или Alt+0157. Для LipikaIME на Mac курсор возвращает ZWNJ.
В бенгальском языке , когда бенгальская буква য встречается в конце группы согласных, то есть перед য стоит ◌্ ( hôsôntô ), она появляется в особой форме: , известный как য-ফলা ( ja-phala ), например, в ক্য (ক ্ য). Таким образом, когда мы хотим написать উদ্যাপন (правильное написание слова «праздник» на бенгали), оно становится উদ্যাপন (что неверно). Здесь ZWNJ работает. Если мы хотим написать উদ্যাপন, нам нужно писать в следующей последовательности (код: উদ্
‌ যাপন
), [4] [5] тогда мы получим правильный рендеринг и правильное написание. В бенгали хосонто ) используется для образования любых союзов и фал (таких как ра-фала, ба-фала и т. д. . Если хосонто необходимо отобразить явно, необходимо вставить ZWNJ после хосонто .
Также в бенгальском языке , когда бенгальская буква র встречается в начале группы согласных (т. е. за র следует хосонто), она появляется в особой форме, известной как রেফ (reph). Таким образом, последовательность র ্ য по умолчанию отображается как র্য. Когда необходимо сохранить форму য-ফলা, а не форму রেফ, ZWJ U+200D СОЕДИНИТЕЛЬ НУЛЕВОЙ ШИРИНЫ ( ‍ ) вставляется сразу после র, т. е. র‍্য для отображения র্য. [4] [5] যায обычно используется для заимствований из английского языка, таких как রাম (RAM), random (случайный) и т. д.
Символ
[ редактировать ]Символ, используемый на клавиатурах, которые позволяют вводить ZWNJ напрямую, стандартизирован в Поправке 1 (2012) к стандарту ISO/IEC 9995-7 :2009 «Информационные технологии. Раскладки клавиатуры для текстовых и офисных систем. Символы, используемые для представления функций». как символ номер 81, а в МЭК 60417 «Графические символы для использования на оборудовании» как символ №. МЭК 60417-6177-2.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Когда не следует использовать лигатуру при наборе текста на английском языке?» . английский.stackexchange.org .
- ^ «Нестыковка нулевой ширины» . Национальный ближневосточный языковой ресурсный центр . Архивировано из оригинала 8 июля 2012 года.
- ^ «Часто задаваемые вопросы — индийские письменности и языки» . www.unicode.org . Проверено 15 марта 2020 г.
- ^ Jump up to: а б «Часто задаваемые вопросы по бенгальскому языку в Юникоде» .
- ^ Jump up to: а б Также см. главу 12 Unicode, бенгальский (Bangla) между страницами 475–479 здесь, в PDF .