Z-вариант
В Юникоде два глифа называются Z-вариантами (часто пишутся как zVariants ), если они имеют одну и ту же этимологию, но имеют немного разный внешний вид и разные кодовые точки Юникода . Например, символы Юникода U+8AAA 說 и U+8AAC 説 являются Z-вариантами. Понятие Z-вариации применимо только к « скриптам CJKV » — китайскому, японскому, корейскому и вьетнамскому — и является подтемой ханьского объединения .
Различия по оси Z [ править ]
Философия Unicode по распределению кодовых точек для языков CJK организована по трем « осям ». Ось X представляет различия в семантике; например, латинская заглавная буква A (U+0041 A) и греческая заглавная буква альфа (U+0391 Α) представлены двумя отдельными кодовыми точками в Юникоде и могут называться «X-вариантами» (хотя этот термин не является распространенным). ). Ось Y представляет существенные различия во внешнем виде, но не в семантике; например, традиционный китайский иероглиф мао «кот» (U+8C93貓) и упрощенный китайский иероглиф (U+732B猫) являются Y-вариантами. [1]
Ось Z представляет незначительные типографские различия. Например, китайские иероглифы (U+838A 莊) и (U+8358 荘) являются Z-вариантами, как и (U+8AAA 說) и (U+8AAC 説). Глоссарий на Unicode.org определяет «Z-вариант» как «Два унифицированных иероглифов CJK с идентичной семантикой и унифицированными формами». [1] где «объединяемый» понимается в смысле объединения Хань.
Таким образом, если бы объединение Хань было абсолютно успешным, Z-вариантов не существовало бы. Они существуют в Unicode, потому что было сочтено полезным иметь возможность «обмена» документов между Unicode и другими кодировками CJK, такими как Big5 и CCCII . Например, символ 莊 имеет кодировку CCCII 21552D, а его Z-вариант 荘 имеет кодировку CCCII 2D552D. Таким образом, этим двум вариантам были присвоены отдельные кодовые точки Unicode, так что преобразование документа CCCII в Unicode и обратно было бы операцией без потерь .
Путаница [ править ]
Существует некоторая путаница в отношении точного определения «Z-варианта». Например, в Интернет-проекте (из RFC 3743 ) от 2002 г., [2] можно найти bù «нет» (U+4E0D 不 ) и (U+F967 不︀ ), описываемые как «варианты шрифта», а термин «Z-вариант», по-видимому, зарезервирован для межъязыковых пар, таких как китайский tù «кролик» ( U+5154 兔 ) и японское « кролик» (U+514E 兎 ). Однако Unicode Консорциума Unihan база данных [3] [ не удалось пройти проверку – см. обсуждение ] рассматривает обе пары как Z-варианты.
См. также [ править ]

Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б «Глоссарий» . www.unicode.org .
- ^ Хуанг, К.; Ко, Ю.; Кониси, К.; Цянь, Х. (апрель 2004 г.). «Руководство Объединенной инженерной группы (JET) по регистрации и администрированию интернационализированных доменных имен (IDN) для китайского, японского и корейского языков» . www.tools.ietf.org .
- ^ «Поиск в базе данных Unihan» . www.unicode.org .