Формы половинной и полной ширины
В вычислениях CJK (китайский, японский и корейский) графические символы традиционно классифицируются как полноширинные. [а] и полуширина [б] персонажи. В отличие от моноширинных шрифтов , символ половинной ширины занимает половину ширины символа полной ширины, отсюда и название.
Формы половинной и полной ширины — это также название блока Юникода U+FF00–FFEF, предназначенного для того, чтобы старые кодировки, содержащие символы как половинной, так и полной ширины, могли осуществлять перевод без потерь в Юникод и из него.
Обоснование
[ редактировать ]Этот раздел нуждается в дополнительных цитатах для проверки . ( Апрель 2021 г. ) |
Во времена текстовых вычислений западные символы обычно располагались на экране в виде сетки, часто состоящей из 80 столбцов по 24 или 25 строк. Каждый символ отображался в виде небольшой точечной матрицы , часто шириной около 8 пикселей , а SBCS (однобайтовый набор символов) обычно использовался для кодирования символов западных языков.
По эстетическим соображениям и для удобства чтения предпочтительно, чтобы китайские иероглифы имели примерно квадратную форму, то есть в два раза шире, чем символы SBCS фиксированной ширины. Поскольку они обычно кодировались в DBCS (двухбайтовый набор символов), это также означало, что их ширина на экране в двухширинном шрифте была пропорциональна их длине в байтах. Некоторые терминалы и программы редактирования не могли обрабатывать двухбайтовые символы, начинающиеся с нечетных столбцов, а только четные (некоторые даже не могли помещать двухбайтовые и однобайтовые символы в одну строку). Таким образом, наборы DBCS обычно включали также латинские символы и цифры для использования вместе с символами CJK в одной строке.
С другой стороны, ранние японские компьютеры использовали однобайтовую кодовую страницу под названием JIS X 0201 для катаканы . Они будут отображаться с той же шириной, что и другие однобайтовые символы, что сделает их символами кана половинной ширины, а не кана с обычными пропорциями. Хотя в самом стандарте JIS X 0201 не указано отображение половинной ширины для катаканы, это стало визуальной отличительной особенностью в Shift JIS между однобайтовой катаканой JIS X 0201 и двухбайтовой катаканой JIS X 0208 . На некоторых кодовых страницах IBM использовалась аналогичная обработка корейского джамо . [1] на основе N-байтового кода хангыля и его трансляции EBCDIC .
В Юникоде
[ редактировать ]Для совместимости с существующими наборами символов, которые содержали версии одного и того же символа как половинной, так и полной ширины, Unicode выделил один блок по адресам U + FF00 – FFEF, содержащий необходимые символы «альтернативной ширины». Сюда входят полноширинные версии всех символов ASCII и некоторые знаки препинания, отличные от ASCII, такие как знак йены, версии катаканы и хангыля половинной ширины , а также версии некоторых других символов половинной ширины, например кругов. Были выделены только символы, необходимые для обхода существующих наборов символов без потерь, вместо того, чтобы (например) создавать полноширинную версию каждого символа с латинским акцентом.
Unicode присваивает каждой «восточноазиатской ширины» кодовой точке свойство . Это может быть: [2]
Аббревиатура | Имя | Описание |
---|---|---|
В | Широкий | Естественно широкий символ, например Хирагана . |
Уже | Узкий | Естественно узкий символ, например, базовый латинский алфавит ISO . |
Ф | Полная ширина | Широкий вариант с нормализацией совместимости до естественно узкого символа, например, полноширинного латинского алфавита. |
ЧАС | Полуширина | Узкий вариант с нормализацией совместимости до естественно широкого символа, например, kana половинной ширины . включает U+20A9 ( ₩ В качестве исключения ). |
А | Двусмысленный | Символы, включенные в восточноазиатские коды DBCS, а также в европейские коды SBCS, например, греческий алфавит . Следовательно, дуопространственное поведение может различаться. |
Н | Нейтральный | Символы, которых нет в восточноазиатских кодах DBCS, например Деванагари . |
Эмуляторы терминала могут использовать это свойство, чтобы решить, должен ли персонаж использовать один или два «столбца» при определении табуляции и положения курсора.
В OpenType
[ редактировать ]OpenType имеет fwid
, halt
, hwid
, и vhal
теги функций, которые будут использоваться для воспроизведения формы символа в полную или половинную ширину. CSS обеспечивает контроль над этими функциями с помощью font-variant-east-asian
и font-feature-settings
характеристики. [3]
См. также
[ редактировать ]- Восточноазиатская пунктуация
- Размер Em – формы полной ширины
- Закрытые буквенно-цифровые обозначения – последовательности пунктов списка; некоторые отображаются в полную ширину (например, ⒈, ⓵, ⑴, ⒜, ⓐ)
- Ханьское объединение
- Хангыль Джамо (блок Unicode)
- Катакана (блок Unicode)
- Латиница в Юникоде
Примечания
[ редактировать ]- ^ В Тайване и Гонконге : во всю ширину , в CJK: во всю ширину ;
- ^ В Тайване и Гонконге : половинная ширина , в CJK: половинная ширина ;
Ссылки
[ редактировать ]- ^ «Демонстрация ICU — Converter Explorer» . demo.icu-project.org . Проверено 7 мая 2018 г.
- ^ Лунде, Кен (25 января 2019 г.). «Стандартное приложение Unicode® № 11: ширина Восточной Азии» . Консорциум Юникод .
- ^ «Синтаксис функций OpenType в CSS» . Adobe . Проверено 20 сентября 2023 г.
Внешние ссылки
[ редактировать ]- Восточноазиатская ширина Стандарта Юникода, Приложение № 11