Jump to content

Дополнительный набор символов Гонконга

Расширение HKSCS Big-5
МИМ / IANA Big5-HKSCS
Псевдоним(а) big5hk, csBig5HKSCS
Язык(и) Традиционный китайский , кантонский диалект
Классификация 8-битная CJK DBCS
Расширяет Big5 ETen

Дополнительный набор символов Гонконга ( 香港增補字符集 ; обычно сокращается до HKSCS ) — набор китайских иероглифов — всего 4702 в первоначальном выпуске — используемых в кантонском диалекте , а также при написании названий некоторых мест в Гонконге ( будь то письменные предложения на кантонском диалекте или стандартные письменные предложения на китайском языке). [1]

Он произошел от предыдущего правительственного набора китайских символов ( 政府通用字庫 ) или GCCS . GCCS — это набор дополнительных китайских символов , закодированных в определяемых пользователем областях набора символов Big5 . Первоначально он использовался правительством Гонконга , а затем использовался общественностью. Позже он превратился в дополнительный набор символов Гонконга, когда символы в наборе были отправлены в ISO-10646 для кодирования.

Из-за внутренних различий между стандартным письменным китайским и письменным кантонским диалектом правительство Гонконга признало необходимость в стандартизированном наборе собственных символов, который позволил бы рационализировать электронную связь; в то время китайская схема кодирования Big5 не содержала подавляющего большинства этих символов (некоторые из них были ошибочно включены в перекрестный список с похожими символами).

правительственный набор китайских символов ( 政府通用字庫 Таким образом, правительством был разработан ) или GCCS. Набор символов состоит из китайских иероглифов, обычно используемых в Гонконге. Некоторые символы характерны для кантонского диалекта , а некоторые представляют собой альтернативные формы символов. Набор не очень хорошо организован, а персонажи не изучены внимательно.

Впоследствии был разработан HKSCS-1999 (спецификация HKSCS 1999). После его принятия в 2001 году (добавление 116 новых символов) и в 2004 году (добавление 123 новых символов) были выпущены новые версии общим объемом 4941 символ. 106 символов GCCS были удалены в HKSCS-1999 в результате унификации, а их кодовые точки Big5 зарезервированы для совместимости. [2] [3] Устаревшие «непроверяемые» символы GCCS можно найти в источниках UTC (UTC-00877–UTC-00898), [4] где они взяты из Adobe-CNS1-1, [5] дополнение Adobe-CNS1, реализованное для поддержки GCCS. [6]

HKSCS кодируется в Big5 (Big5-HKSCS, [7] big5hk [8] ) и ISO 10646 ( Юникод ). Начиная с HKSCS-2004, все символы, ранее использовавшиеся в разделе «Область частного использования » Юникода, переназначаются, причем многие из них переназначаются в блок расширения B или блок совместимости дополнительной идеографической плоскости. [9] Однако для сохранения совместимости с программами, создавшими кодовые точки PUA, выделенные кодовые точки зарезервированы, и никакие новые символы не будут отображаться в PUA .

Подобно ситуации в Гонконге, есть также символы, которые необходимы Макао, но не включены ни в Big5, ни в HKSCS, поэтому был разработан дополнительный набор символов Макао , основанный на HKSCS с дополнительными символами, отображаемыми в Юникоде. Первая партия из 121 символа MSCS была отправлена ​​​​для добавления или горизонтального расширения в Unicode (в зависимости от обстоятельств) в 2009 году. [10] а первая окончательная версия MSCS была создана в 2020 году. [11]

HKSCS претерпел несколько итераций. [12]

Версия Всего символов Дата публикации
GCCS 3,049 1995
ХКСКС-1999 4,702 09/1999
ХКСКС-2001 4,818 12/2001
ХКСКС-2004 4,941 05/2005
ХКСКС-2008 5,009 12/2009
ХКСКС-2016 5,033 05/2017

Последней редакцией HKSCS, кодирующей все символы в Big5, была HKSCS-2008, тогда как символы, добавленные в HKSCS-2016, сопоставляются только с Unicode (как расширение горизонтального глифа CJK Unified Ideographs , где это необходимо). [11]

Совместимость

[ редактировать ]

Операционные системы

[ редактировать ]

В Microsoft Windows 98, NT 4.0, 2000, XP поддержку HKSCS можно включить с помощью исправления Microsoft. В реализации Microsoft приложение, использующее кодовую страницу 950, автоматически использует скрытую таблицу кодовой страницы 951 для кодировки Big5 расширений HKSCS. Таблица поддерживает все кодовые точки HKSCS-2001, за исключением кодовых точек совместимости, указанных в стандарте. [13] Кроме того, шрифт MingLiU изменен с помощью патча Microsoft. Известно, что этот патч создает конфликты в таких приложениях, как Microsoft Office или любом приложении, использующем шрифты, поддерживающие упрощенные китайские символы (например: SimSun ). Если целевая среда содержит пользовательский шрифт, сопоставленный с кодовыми точками, на которые влияет исправление Microsoft, пользовательские шрифты могут отменить исправление Microsoft. Кроме того, патч нарушает работу редактора EUDC, поставляемого с затронутыми версиями Windows. [14] Начиная с Windows Vista, символы HKSCS-2004 поддерживаются только в Юникоде 4.1 или более поздней версии. [15] Всем символам присвоены стандартные коды, отличные от PUA . Символы отображаются шрифтом MingLiU , и эти символы можно вводить с клавиатуры. Исправление, обеспечивающее Big5 кодировку HKSCS , не поддерживается в Windows Vista и более поздних версиях. Доступна утилита Microsoft для преобразования символов в кодировке HKSCS и Unicode PUA в версию Unicode 4.1. [16] В 2010 году Microsoft опубликовала патч HKSCS-2004 для Windows XP и Windows Server 2003. [17] Он заменяет версии MingLiu, PMingLiu и MingLiu_HKSCS для Windows XP (если было применено исправление HKSCS-2001) на версии MingLiu, PMingLiu и MingLiu_HKSCS для Windows 7. Кроме того, в целевую систему будут добавлены шрифты MingLiU-ExtB, MingLiU_HKSCS-ExtB и PMingLiU-ExtB. Однако IME не обновляется, как это было в случае с патчем HKSCS-2001, а шрифты взяты из предварительной версии Windows 7. Для более ранних версий ОС поддержка HKSCS требует использования патча Microsoft или гонконгского патча. государственные коммунальные услуги Digital 21.

HKSCS-2001 Big5 IBM присваивает CCSID 5471 кодовой странице (с CPGID 1374 в качестве CCSID 5470 в качестве двухбайтового компонента), [18] [19] CCSID 9567 в кодовую страницу HKSCS-2004 (с CPGID 1374 в качестве CCSID 9566 в качестве двухбайтового компонента), [20] и CCSID 13663 в кодовую страницу HKSCS-2008 (с CPGID 1374 в качестве CCSID 13662 в качестве двухбайтового компонента), [21] в то время как CCSID 1375 (с CPGID 1374 в качестве CCSID 1374 в качестве его двухбайтового компонента) назначен растущей кодовой странице HKSCS, которая в настоящее время эквивалентна CCSID 13663. [22]

Поддержка HKSCS была добавлена ​​в glibc в 2000 году, но с тех пор не обновлялась. Поддержка HKSCS-2004 обрабатывается как Unicode 4.1 и более поздних версий. Для freedesktop.org настройки шрифт AR PL ShanHeiSun Uni полностью поддерживает HKSCS-2004, начиная с 0.1-0.dot.1, а последняя версия HKSCS-2004 поддерживается в версии 0.1.20060903-1. Современные дистрибутивы для настольных компьютеров (например, Ubuntu) включают HKSCS-совместимые шрифты UKai и UMing от Arphic Technology из коробки, если во время установки выбрана поддержка традиционного китайского языка. Их также можно установить вручную позже.

Mac OS X 10.0–10.2 поддерживает HKSCS-1999. 10.3–10.4 поддерживают HKSCS-2001. Некоторые буквы, добавленные в HKSCS-2004, поддерживаются через Unicode PUA в OS X 10.4. Начиная с OS X 10.5, все символы HKSCS-2004 поддерживаются стандартными кодовыми точками Unicode 4.1.

Приложения и Интернет

[ редактировать ]

Mozilla 1.5 и более поздние версии поддерживают HKSCS, при этом поддержка HKSCS-2004 добавлена ​​в базу кода Gecko 1.8.1. [23] В отличие от вышеупомянутого патча, Mozilla использует собственную таблицу кодовых страниц. Однако исправление ошибки 343129 не поддерживает символы, сопоставленные с кодовыми точками выше базовой многоязычной плоскости. [24]

Приложения на базе QT 3.x (например: KDE ) поддерживают только символы, сопоставленные с кодовыми точками FFFF или ниже. В QT4 символы вне BMP поддерживаются через суррогаты. Текстовый кодек Big5-HKSCS поддерживает HKSCS-1999 еще в Qt-2.3.x, но в графике разработки Qt было слишком поздно, чтобы его официально включили в серию Qt-2.3.x, поэтому он был официально поддержан в Qt-3.0.1. . Поддержка HKSCS-2001 была добавлена ​​в Qt-3.0.5. [25]

GNOME поддерживает символы HKSCS в диапазонах Юникода, за исключением тех, которые сопоставлены с блоком совместимости базовой многоязычной плоскости. Патчи для поддержки символов, сопоставленных с вышеуказанной базовой многоязычной плоскостью, были представлены в Pango 1.1. [26]

Стандарт кодирования WHATWG (используемый HTML5 ) включает HKSCS в определение Big5 (используется даже с простой меткой Big5). Однако только его декодер использует все расширения HKSCS, тогда как его кодер явно исключает расширения с ведущими байтами ниже 0xA1 (таким образом исключая большинство расширений HKSCS, но включая, например, унаследованные от Big5 ETEN ). [27] Этому стандарту соответствуют новые браузеры, включая Firefox .

См. также

[ редактировать ]
  1. ^ Часто задаваемые вопросы об онлайн-сервисах GovHK — другие технические вопросы и устранение неполадок.
  2. ^ «Big5CMP.txt» . Архивировано Найдено 13 сентября 2016 года. в таблице сопоставления - HKSCS-2008.
  3. ^ «HKSCS-2004 Приложение IV. Точки совместимости для GCCS» (PDF) . Архивировано из оригинала (PDF) 30 сентября 2016 года . Проверено 29 сентября 2016 г.
  4. ^ «Группа:Big5-GCCS外字» . Проверено 30 сентября 2016 г.
  5. ^ «Глифы U-источника» (PDF) . Проверено 30 сентября 2016 г.
  6. ^ «Коллекция символов Adobe-CNS1-6» (PDF) . Проверено 30 сентября 2016 г.
  7. ^ «Наборы символов» . ИАНА.
  8. ^ «Компоненты SDK» .
  9. ^ «Большой5-HKSCS:2004» .
  10. ^ Рабочая группа по кодированию компьютерных китайских иероглифов (12 июня 2009 г.). «Представление символов из набора символов информационных систем Макао» (PDF) . ISO/IEC JTC 1/SC 2 /WG 2 IRGN 1580. Архивировано из оригинала (PDF) 4 января 2015 г.
  11. ^ Jump up to: а б Правительство специального административного района Макао (11 июня 2020 г.). «Представление вертикального расширения Макао (символы UNC), горизонтального расширения и регистрации IVSes для MSCS» (PDF) . ISO/IEC JTC 1/SC 2 /WG 2 IRGN 2430.
  12. ^ «OGCIO – Развитие HKSCS» . Архивировано из оригинала 22 августа 2017 года . Проверено 21 августа 2017 г.
  13. ^ Стил, Шон. «CP 951 и HKSCS» . Я не клингон . Блог разработчиков MS . Проверено 13 сентября 2016 г.
  14. ^ Информационная сеть Хуатун: Будьте осторожны! Кто-то тайно изменил ваши системные шрифты Windows
  15. ^ Microsoft: Дополнительный набор символов Гонконга - поддержка платформы Windows
  16. ^ Процедуры преобразования кода символов Microsoft для HKSCS-2004
  17. ^ Пакет шрифтов Windows XP для ISO 10646:2003 + поправка 1. Поддержка традиционного китайского языка.
  18. ^ «CCSID 5471: смешанный добавочный номер Big-5 для HKSCS-2001» . Идентификаторы набора символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
  19. ^ Международные компоненты для Unicode (ICU), ibm-5471_P100-2006.ucm , 9 мая 2007 г.
  20. ^ «CCSID 9567: смешанный добавочный номер Big-5 для HKSCS-2004» . Идентификаторы набора символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
  21. ^ «CCSID 13663: смешанный добавочный номер Big-5 для HKSCS-2008» . Идентификаторы набора символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
  22. ^ «CCSID 1375: смешанный добавочный номер Big-5 для HKSCS» . Идентификаторы наборов символов в кодировке IBM Globalization . ИБМ . Архивировано из оригинала 29 ноября 2014 года.
  23. ^ Mozilla.org: Ошибка 343129 — Big5-HKSCS 2004 <==> Обновление таблицы Юникода
  24. ^ Ошибка 162431 — добавление поддержки Юникода, отличного от BMP (плоскость 1 и выше. суррогат), в кодировщик/декодер кодировки.
  25. ^ «Qt 4.7: Текстовый кодек Big5-HKSCS» . Архивировано из оригинала 4 марта 2016 года . Проверено 10 ноября 2011 г.
  26. ^ Ошибка 101081 — символы, отличные от BMP (плоскости с 1 по 16), не поддерживаются.
  27. ^ ван Кестерен, Энн . «Стандарт кодирования» . ЧТОРГ .
[ редактировать ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 316348feadeea9a2050a1bc2d37d04b5__1709260440
URL1:https://arc.ask3.ru/arc/aa/31/b5/316348feadeea9a2050a1bc2d37d04b5.html
Заголовок, (Title) документа по адресу, URL1:
Hong Kong Supplementary Character Set - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)