Jump to content

Формы половинной и полной ширины

Командная строка ( cmd.exe ) с корейской локализацией, показывающая символы половинной и полной ширины.

В вычислениях CJK (китайский, японский и корейский) графические символы традиционно классифицируются как полноширинные. [а] и полуширина [б] персонажи. В отличие от моноширинных шрифтов , символ половинной ширины занимает половину ширины символа полной ширины, отсюда и название.

Формы половинной и полной ширины — это также название блока Юникода U+FF00–FFEF, предназначенного для того, чтобы старые кодировки, содержащие символы как половинной, так и полной ширины, могли осуществлять перевод без потерь в Юникод и из него.

Обоснование

[ редактировать ]
Символы, которые появляются как в JIS X 0201 (однобайтовый), так и в JIS X 0208 / JIS X 0213 (двухбайтовый), имеют как половинную, так и полную ширину в Shift JIS .

Во времена текстовых вычислений западные символы обычно располагались на экране в виде сетки, часто состоящей из 80 столбцов по 24 или 25 строк. Каждый символ отображался в виде небольшой точечной матрицы , часто шириной около 8 пикселей , а SBCS (однобайтовый набор символов) обычно использовался для кодирования символов западных языков.

По эстетическим соображениям и для удобства чтения предпочтительно, чтобы китайские иероглифы имели примерно квадратную форму, то есть в два раза шире, чем символы SBCS фиксированной ширины. Поскольку они обычно кодировались в DBCS (двухбайтовый набор символов), это также означало, что их ширина на экране в двухширинном шрифте была пропорциональна их длине в байтах. Некоторые терминалы и программы редактирования не могли обрабатывать двухбайтовые символы, начинающиеся с нечетных столбцов, а только четные (некоторые даже не могли помещать двухбайтовые и однобайтовые символы в одну строку). Таким образом, наборы DBCS обычно включали также латинские символы и цифры для использования вместе с символами CJK в одной строке.

С другой стороны, ранние японские компьютеры использовали однобайтовую кодовую страницу под названием JIS X 0201 для катаканы . Они будут отображаться с той же шириной, что и другие однобайтовые символы, что сделает их символами кана половинной ширины, а не кана с обычными пропорциями. Хотя в самом стандарте JIS X 0201 не указано отображение половинной ширины для катаканы, это стало визуальной отличительной особенностью в Shift JIS между однобайтовой катаканой JIS X 0201 и двухбайтовой катаканой JIS X 0208 . На некоторых кодовых страницах IBM использовалась аналогичная обработка корейского джамо . [1] на основе N-байтового кода хангыля и его трансляции EBCDIC .

В Юникоде

[ редактировать ]

Для совместимости с существующими наборами символов, которые содержали версии одного и того же символа как половинной, так и полной ширины, Unicode выделил один блок по адресам U + FF00 – FFEF, содержащий необходимые символы «альтернативной ширины». Сюда входят полноширинные версии всех символов ASCII и некоторые знаки препинания, отличные от ASCII, такие как знак йены, версии катаканы и хангыля половинной ширины , а также версии некоторых других символов половинной ширины, например кругов. Были выделены только символы, необходимые для обхода существующих наборов символов без потерь, вместо того, чтобы (например) создавать полноширинную версию каждого символа с латинским акцентом.

Unicode присваивает каждой «восточноазиатской ширины» кодовой точке свойство . Это может быть: [2]

Свойства символов Юникода на основе ширины
Аббревиатура Имя Описание
В Широкий Естественно широкий символ, например Хирагана .
Уже Узкий Естественно узкий символ, например, базовый латинский алфавит ISO .
Ф Полная ширина Широкий вариант с нормализацией совместимости до естественно узкого символа, например, полноширинного латинского алфавита.
ЧАС Полуширина Узкий вариант с нормализацией совместимости до естественно широкого символа, например, kana половинной ширины . включает U+20A9 ( В качестве исключения ).
А Двусмысленный Символы, включенные в восточноазиатские коды DBCS, а также в европейские коды SBCS, например, греческий алфавит . Следовательно, дуопространственное поведение может различаться.
Н Нейтральный Символы, которых нет в восточноазиатских кодах DBCS, например Деванагари .

Эмуляторы терминала могут использовать это свойство, чтобы решить, должен ли персонаж использовать один или два «столбца» при определении табуляции и положения курсора.

OpenType имеет fwid, halt, hwid, и vhal теги функций, которые будут использоваться для воспроизведения формы символа в полную или половинную ширину. CSS обеспечивает контроль над этими функциями с помощью font-variant-east-asian и font-feature-settings характеристики. [3]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ «Демонстрация ICU — Converter Explorer» . demo.icu-project.org . Проверено 7 мая 2018 г.
  2. ^ Лунде, Кен (25 января 2019 г.). «Стандартное приложение Unicode® № 11: ширина Восточной Азии» . Консорциум Юникод .
  3. ^ «Синтаксис функций OpenType в CSS» . Adobe . Проверено 20 сентября 2023 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 118dfc0f35a61454c5f60d48ad445ad6__1714942260
URL1:https://arc.ask3.ru/arc/aa/11/d6/118dfc0f35a61454c5f60d48ad445ad6.html
Заголовок, (Title) документа по адресу, URL1:
Halfwidth and fullwidth forms - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)