Дополнительный набор символов Гонконга
МИМ / IANA | Big5-HKSCS |
---|---|
Псевдоним(а) | big5hk, csBig5HKSCS |
Язык(и) | Традиционный китайский , кантонский диалект |
Классификация | 8-битная CJK DBCS |
Расширяет | Big5 ETen |
Дополнительный набор символов Гонконга ( 香港增補字符集 ; обычно сокращается до HKSCS ) — набор китайских иероглифов — всего 4702 в первоначальном выпуске — используемых в кантонском диалекте , а также при написании названий некоторых мест в Гонконге ( будь то письменные предложения на кантонском диалекте или стандартные письменные предложения на китайском языке). [1]
Он произошел от предыдущего правительственного набора китайских символов ( 政府通用字庫 ) или GCCS . GCCS — это набор дополнительных китайских символов , закодированных в определяемых пользователем областях набора символов Big5 . Первоначально он использовался правительством Гонконга , а затем использовался общественностью. Позже он превратился в дополнительный набор символов Гонконга, когда символы в наборе были отправлены в ISO-10646 для кодирования.
История
[ редактировать ]Из-за внутренних различий между стандартным письменным китайским и письменным кантонским диалектом правительство Гонконга признало необходимость в стандартизированном наборе собственных символов, который позволил бы рационализировать электронную связь; в то время китайская схема кодирования Big5 не содержала подавляющего большинства этих символов (некоторые из них были ошибочно включены в перекрестный список с похожими символами).
правительственный набор китайских символов ( 政府通用字庫 Таким образом, правительством был разработан ) или GCCS. Набор символов состоит из китайских иероглифов, обычно используемых в Гонконге. Некоторые символы характерны для кантонского диалекта , а некоторые представляют собой альтернативные формы символов. Набор не очень хорошо организован, а персонажи не изучены внимательно.
Впоследствии был разработан HKSCS-1999 (спецификация HKSCS 1999). После его принятия в 2001 году (добавление 116 новых символов) и в 2004 году (добавление 123 новых символов) были выпущены новые версии общим объемом 4941 символ. 106 символов GCCS были удалены в HKSCS-1999 в результате унификации, а их кодовые точки Big5 зарезервированы для совместимости. [2] [3] Устаревшие «непроверяемые» символы GCCS можно найти в источниках UTC (UTC-00877–UTC-00898), [4] где они взяты из Adobe-CNS1-1, [5] дополнение Adobe-CNS1, реализованное для поддержки GCCS. [6]
HKSCS кодируется в Big5 (Big5-HKSCS, [7] big5hk [8] ) и ISO 10646 ( Юникод ). Начиная с HKSCS-2004, все символы, ранее использовавшиеся в разделе «Область частного использования » Юникода, переназначаются, причем многие из них переназначаются в блок расширения B или блок совместимости дополнительной идеографической плоскости. [9] Однако для сохранения совместимости с программами, создавшими кодовые точки PUA, выделенные кодовые точки зарезервированы, и никакие новые символы не будут отображаться в PUA .
Подобно ситуации в Гонконге, есть также символы, которые необходимы Макао, но не включены ни в Big5, ни в HKSCS, поэтому был разработан дополнительный набор символов Макао , основанный на HKSCS с дополнительными символами, отображаемыми в Юникоде. Первая партия из 121 символа MSCS была отправлена для добавления или горизонтального расширения в Unicode (в зависимости от обстоятельств) в 2009 году. [10] а первая окончательная версия MSCS была создана в 2020 году. [11]
Версии
[ редактировать ]HKSCS претерпел несколько итераций. [12]
Версия | Всего символов | Дата публикации |
---|---|---|
GCCS | 3,049 | 1995 |
ХКСКС-1999 | 4,702 | 09/1999 |
ХКСКС-2001 | 4,818 | 12/2001 |
ХКСКС-2004 | 4,941 | 05/2005 |
ХКСКС-2008 | 5,009 | 12/2009 |
ХКСКС-2016 | 5,033 | 05/2017 |
Последней редакцией HKSCS, кодирующей все символы в Big5, была HKSCS-2008, тогда как символы, добавленные в HKSCS-2016, сопоставляются только с Unicode (как расширение горизонтального глифа CJK Unified Ideographs , где это необходимо). [11]
Совместимость
[ редактировать ]Операционные системы
[ редактировать ]В Microsoft Windows 98, NT 4.0, 2000, XP поддержку HKSCS можно включить с помощью исправления Microsoft. В реализации Microsoft приложение, использующее кодовую страницу 950, автоматически использует скрытую таблицу кодовой страницы 951 для кодировки Big5 расширений HKSCS. Таблица поддерживает все кодовые точки HKSCS-2001, за исключением кодовых точек совместимости, указанных в стандарте. [13] Кроме того, шрифт MingLiU изменен с помощью патча Microsoft. Известно, что этот патч создает конфликты в таких приложениях, как Microsoft Office или любом приложении, использующем шрифты, поддерживающие упрощенные китайские символы (например: SimSun ). Если целевая среда содержит пользовательский шрифт, сопоставленный с кодовыми точками, на которые влияет исправление Microsoft, пользовательские шрифты могут отменить исправление Microsoft. Кроме того, патч нарушает работу редактора EUDC, поставляемого с затронутыми версиями Windows. [14] Начиная с Windows Vista, символы HKSCS-2004 поддерживаются только в Юникоде 4.1 или более поздней версии. [15] Всем символам присвоены стандартные коды, отличные от PUA . Символы отображаются шрифтом MingLiU , и эти символы можно вводить с клавиатуры. Исправление, обеспечивающее Big5 кодировку HKSCS , не поддерживается в Windows Vista и более поздних версиях. Доступна утилита Microsoft для преобразования символов в кодировке HKSCS и Unicode PUA в версию Unicode 4.1. [16] В 2010 году Microsoft опубликовала патч HKSCS-2004 для Windows XP и Windows Server 2003. [17] Он заменяет версии MingLiu, PMingLiu и MingLiu_HKSCS для Windows XP (если было применено исправление HKSCS-2001) на версии MingLiu, PMingLiu и MingLiu_HKSCS для Windows 7. Кроме того, в целевую систему будут добавлены шрифты MingLiU-ExtB, MingLiU_HKSCS-ExtB и PMingLiU-ExtB. Однако IME не обновляется, как это было в случае с патчем HKSCS-2001, а шрифты взяты из предварительной версии Windows 7. Для более ранних версий ОС поддержка HKSCS требует использования патча Microsoft или гонконгского патча. государственные коммунальные услуги Digital 21.
HKSCS-2001 Big5 IBM присваивает CCSID 5471 кодовой странице (с CPGID 1374 в качестве CCSID 5470 в качестве двухбайтового компонента), [18] [19] CCSID 9567 в кодовую страницу HKSCS-2004 (с CPGID 1374 в качестве CCSID 9566 в качестве двухбайтового компонента), [20] и CCSID 13663 в кодовую страницу HKSCS-2008 (с CPGID 1374 в качестве CCSID 13662 в качестве двухбайтового компонента), [21] в то время как CCSID 1375 (с CPGID 1374 в качестве CCSID 1374 в качестве его двухбайтового компонента) назначен растущей кодовой странице HKSCS, которая в настоящее время эквивалентна CCSID 13663. [22]
Поддержка HKSCS была добавлена в glibc в 2000 году, но с тех пор не обновлялась. Поддержка HKSCS-2004 обрабатывается как Unicode 4.1 и более поздних версий. Для freedesktop.org настройки шрифт AR PL ShanHeiSun Uni полностью поддерживает HKSCS-2004, начиная с 0.1-0.dot.1, а последняя версия HKSCS-2004 поддерживается в версии 0.1.20060903-1. Современные дистрибутивы для настольных компьютеров (например, Ubuntu) включают HKSCS-совместимые шрифты UKai и UMing от Arphic Technology из коробки, если во время установки выбрана поддержка традиционного китайского языка. Их также можно установить вручную позже.
Mac OS X 10.0–10.2 поддерживает HKSCS-1999. 10.3–10.4 поддерживают HKSCS-2001. Некоторые буквы, добавленные в HKSCS-2004, поддерживаются через Unicode PUA в OS X 10.4. Начиная с OS X 10.5, все символы HKSCS-2004 поддерживаются стандартными кодовыми точками Unicode 4.1.
Приложения и Интернет
[ редактировать ]Mozilla 1.5 и более поздние версии поддерживают HKSCS, при этом поддержка HKSCS-2004 добавлена в базу кода Gecko 1.8.1. [23] В отличие от вышеупомянутого патча, Mozilla использует собственную таблицу кодовых страниц. Однако исправление ошибки 343129 не поддерживает символы, сопоставленные с кодовыми точками выше базовой многоязычной плоскости. [24]
Приложения на базе QT 3.x (например: KDE ) поддерживают только символы, сопоставленные с кодовыми точками FFFF или ниже. В QT4 символы вне BMP поддерживаются через суррогаты. Текстовый кодек Big5-HKSCS поддерживает HKSCS-1999 еще в Qt-2.3.x, но в графике разработки Qt было слишком поздно, чтобы его официально включили в серию Qt-2.3.x, поэтому он был официально поддержан в Qt-3.0.1. . Поддержка HKSCS-2001 была добавлена в Qt-3.0.5. [25]
GNOME поддерживает символы HKSCS в диапазонах Юникода, за исключением тех, которые сопоставлены с блоком совместимости базовой многоязычной плоскости. Патчи для поддержки символов, сопоставленных с вышеуказанной базовой многоязычной плоскостью, были представлены в Pango 1.1. [26]
Стандарт кодирования WHATWG (используемый HTML5 ) включает HKSCS в определение Big5 (используется даже с простой меткой Big5). Однако только его декодер использует все расширения HKSCS, тогда как его кодер явно исключает расширения с ведущими байтами ниже 0xA1 (таким образом исключая большинство расширений HKSCS, но включая, например, унаследованные от Big5 ETEN ). [27] Этому стандарту соответствуют новые браузеры, включая Firefox .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Часто задаваемые вопросы об онлайн-сервисах GovHK — другие технические вопросы и устранение неполадок.
- ^ «Big5CMP.txt» . Архивировано Найдено 13 сентября 2016 года. в таблице сопоставления - HKSCS-2008.
- ^ «HKSCS-2004 Приложение IV. Точки совместимости для GCCS» (PDF) . Архивировано из оригинала (PDF) 30 сентября 2016 года . Проверено 29 сентября 2016 г.
- ^ «Группа:Big5-GCCS外字» . Проверено 30 сентября 2016 г.
- ^ «Глифы U-источника» (PDF) . Проверено 30 сентября 2016 г.
- ^ «Коллекция символов Adobe-CNS1-6» (PDF) . Проверено 30 сентября 2016 г.
- ^ «Наборы символов» . ИАНА.
- ^ «Компоненты SDK» .
- ^ «Большой5-HKSCS:2004» .
- ^ Рабочая группа по кодированию компьютерных китайских иероглифов (12 июня 2009 г.). «Представление символов из набора символов информационных систем Макао» (PDF) . ISO/IEC JTC 1/SC 2 /WG 2 IRGN 1580. Архивировано из оригинала (PDF) 4 января 2015 г.
- ^ Jump up to: а б Правительство специального административного района Макао (11 июня 2020 г.). «Представление вертикального расширения Макао (символы UNC), горизонтального расширения и регистрации IVSes для MSCS» (PDF) . ISO/IEC JTC 1/SC 2 /WG 2 IRGN 2430.
- ^ «OGCIO – Развитие HKSCS» . Архивировано из оригинала 22 августа 2017 года . Проверено 21 августа 2017 г.
- ^ Стил, Шон. «CP 951 и HKSCS» . Я не клингон . Блог разработчиков MS . Проверено 13 сентября 2016 г.
- ^ Информационная сеть Хуатун: Будьте осторожны! Кто-то тайно изменил ваши системные шрифты Windows
- ^ Microsoft: Дополнительный набор символов Гонконга - поддержка платформы Windows
- ^ Процедуры преобразования кода символов Microsoft для HKSCS-2004
- ^ Пакет шрифтов Windows XP для ISO 10646:2003 + поправка 1. Поддержка традиционного китайского языка.
- ^ «CCSID 5471: смешанный добавочный номер Big-5 для HKSCS-2001» . Идентификаторы наборов символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
- ^ Международные компоненты для Unicode (ICU), ibm-5471_P100-2006.ucm , 9 мая 2007 г.
- ^ «CCSID 9567: смешанный добавочный номер Big-5 для HKSCS-2004» . Идентификаторы наборов символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
- ^ «CCSID 13663: смешанный добавочный номер Big-5 для HKSCS-2008» . Идентификаторы наборов символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
- ^ «CCSID 1375: смешанный добавочный номер Big-5 для HKSCS» . Идентификаторы наборов символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
- ^ Mozilla.org: Ошибка 343129 — Big5-HKSCS 2004 <==> Обновление таблицы Юникода
- ^ Ошибка 162431 — добавление поддержки Юникода, отличного от BMP (плоскость 1 и выше. суррогат), в кодировщик/декодер кодировки.
- ^ «Qt 4.7: Текстовый кодек Big5-HKSCS» . Архивировано из оригинала 4 марта 2016 года . Проверено 10 ноября 2011 г.
- ^ Ошибка 101081 — символы, отличные от BMP (плоскости с 1 по 16), не поддерживаются.
- ^ ван Кестерен, Энн . «Стандарт кодирования» . ЧТОРГ .
Внешние ссылки
[ редактировать ]- Сайт правительства Гонконга на HKSCS. Загружаемые документы и шрифт HKSCS.
- Поддержка Microsoft HKSCS для платформы Windows
- Гонконгский справочник Song Dynasty Страница загрузки шрифта Dynalab ( Huakang Technology Co., Ltd. ). HKSCS компании
- Графическое представление Big5-HKSCS в Converter Explorer ICU
- Набор символов, работающий в Mac OS X.
- UMing/UKai — бесплатный шрифт с открытым исходным кодом, поддерживающий HKSCS.
- Проект гонконгских шрифтов с открытым исходным кодом