Расширение унифицированных идеографов CJK I
Расширение унифицированных идеографов CJK I | |
---|---|
Диапазон | U+2EBF0..U+2EE5F (624 кодовых точки) |
Самолет | ГЛОТОК |
Скрипты | Он |
Назначенный | 622 кодовых точки |
Неиспользованный | 2 зарезервированные кодовые точки |
История версий Юникода | |
15.1 (2023) | 622 (+622) |
Документация Юникод | |
Таблица кодов ∣ Веб-страница | |
Примечание : [1] [2] |
Расширение I унифицированных идеографов CJK — это блок Unicode, включающий унифицированные идеографы CJK , включенные в проекты поправки к китайскому стандарту GB 18030, распространенные в 2022 и 2023 годах, которые были быстро преобразованы в Unicode в 2023 году.
Предыстория [ править ]
В отличие от большинства других наборов унифицированных иероглифов CJK, Расширение I не было подготовлено и представлено Группой идеографических исследований (IRG). [3]
GB 18030 является обязательным национальным стандартом Китайской Народной Республики (КНР). Он определяет формат преобразования Unicode , который сохраняет совместимость с существующими данными в более ранних кодировках символов GBK и EUC-CN , а также определяет конкретные символы Unicode, которые должны поддерживать устройства, продаваемые в Китае. [4] В его редакции 2022 года, GB 18030-2022 , изменен ряд обязательных символов для сопоставления со стандартными кодовыми точками Unicode , а не с кодовыми точками зон частного использования .
В конце 2022 года КНР представила для общественного обсуждения проект дополнительной поправки к GB 18030. Этот проект поместил бы 897 новых синографических символов в Plane 10 ( шестнадцатеричный : 0A), еще не имеющий названия астральный план Unicode . [5] Это было мотивировано «острой необходимостью сертификации настоящего имени граждан в Китае». [6] Поскольку это повлияет на ISO/IEC 10646 (универсальный набор кодированных символов, стандарт ISO , синхронизированный с Unicode), проект был распространен в ISO/IEC JTC 1/SC 2 , подкомитете ISO, ответственном за ISO 10646. Китайский национальный орган поддерживал что «ISO/IEC 10646 не определяет назначение плоскости 0A», которую ISO 10646 обозначает как «зарезервированную для будущей стандартизации», и что такое использование, следовательно, «не является неуместным». [5]
Однако, поскольку цель ISO 10646 заключалась в том, чтобы зарезервировать плоскость 10 для будущего распределения ISO 10646 и Unicode посредством обычного процесса голосования, а не для ее распределения в одностороннем порядке национальными органами по стандартизации , этот предложенный шаг подвергся критике со стороны экспертов и других специалистов. национальные органы как орган, который «дестабилизирует синхронизацию» между GB 18030 и ISO/IEC 10646 (и, следовательно, Unicode) и который сделает невозможным соответствие обоим стандартам с помощью одной реализации, [5] эффективно разветвляет Unicode. На своем заседании в марте 2023 года IRG подчеркнула важность своевременного предоставления любых последующих проектов поправок к GB 18030 экспертам IRG и недопущения «ненадлежащего использования стандарта ISO/IEC 10646». [7]
В качестве альтернативы репертуар (в конечном итоге сокращенный до 622 символов после проверки экспертами) был ускорен в версии Unicode 15.1 в сентябре 2023 года как блок CJK Unified Ideographs Extension I. [5] Персонажи представляют собой источник Unihan "GIDC23" , [8] определено как полученное из «Системы идентификации Министерства общественной безопасности Китая, 2023 г.». [9] Блок CJK Unified Ideographs Extension D был назван прецедентом, поскольку он включал репертуар срочно необходимых символов (UNC) от организаций-членов IRG, тогда как рабочий набор IRG, первоначально планировалось стать расширением D, вместо этого стал E. расширением [10] Для компактности блок был выделен доступному пространству в дополнительной идеографической плоскости после CJK Unified Ideographs Extension F , а не в третичной идеографической плоскости после CJK Unified Ideographs Extension H ; это означает, что блоки расширения CJK больше не располагаются в алфавитном порядке по букве расширения. [11] После этого проект поправки GB 18030 был изменен для использования кодовых точек расширения I. [6]
На своем следующем заседании в октябре 2023 года IRG выразила обеспокоенность по поводу обхода IRG для больших коллекций персонажей CJK и отметила, что два персонажа в Расширении I для целей источников символов других регионов ранее были унифицированы с существующими персонажи по правилам объединения IRG: [3] [12]
- Учитывая взаимозаменяемые формы травяного радикала , U+2ED9D <RESERVED-2ED9D> соответствует ранее существовавшему глифу T-source ( Тайвань ) для U + 8286 芆 CJK ЕДИНАЯ ИДЕОГРАФИЯ-8286 (ссылка на CNS 11643 ), [13] а также предлагаемый для него символ J-source ( Япония ). [14] Символ, соответствующий другому глифу U+8286 (источник G, т.е. материковый Китай), существует где-то еще в более поздних выпусках CNS 11643, поэтому добавление U+2ED9D влияет на существующие соответствия между CNS 11643 и Unicode, хотя из-за поскольку ни один из символов не находится в плоскостях 1 или 2, это не влияет на отображение Big5 в Юникоде . [12]
- U+2EDE0 <RESERVED-2EDE0> соответствует предлагаемому глифу J-источника (Япония) для U+8FF3 迳 CJK ЕДИНАЯ ИДЕОГРАФИЯ-8FF3 . [15] Ранее он дважды предлагался в качестве нового символа (один раз со ссылкой на CNS 11643 и один раз Японией), но был отклонен на том основании, что его можно объединить с U + 8FF3. [12] Предложенный символ позже был перенесен в новый U+2EDE0 Кодовая точка <RESERVED-2EDE0> по запросу национального органа Японии. [16]
В ответ IRG рекомендовала, чтобы в будущем отправители предлагаемых символов CJK были обязаны предоставлять информацию о влиянии на другие источники символов CJK любых разобщений, предложенных в представлении, и чтобы IRG было предоставлено время для рассмотрения всех крупных представлений символов CJK. Персонажи CJK. IRG призвала китайскую организацию предложить решения проблем, вызванных добавлением этих двух символов, на следующем заседании IRG. [3]
Блокировать [ править ]
Расширение унифицированных идеографов CJK I [1] [2] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
U+2EBFx | | | | | | | | | | | | | | | | |
U + 2EC0x | | | | | | | | | | | | | | | | |
U + 2EC1x | | | | | | | | | | | | | | | | |
U + 2EC2x | | | | | | | | | | | | | | | | |
U + 2EC3x | | | | | | | | | | | | | | | | |
U + 2EC4x | | | | | | | | | | | | | | | | |
U + 2EC5x | | | | | | | | | | | | | | | | |
U + 2EC6x | | | | | | | | | | | | | | | | |
U + 2EC7x | | | | | | | | | | | | 🮱 | | | | |
U + 2EC8x | | | | | | | | | | | | | | | | |
U + 2EC9x | | | | | | | | | | | | | | | | |
U + 2ECAx | | | | | | | | | | | | | | | | |
U+2ECBx | | | | | | | | | | | | | | | | |
U+2ECCx | | | | | | | | | | | | | | | | |
U + 2ECDx | | | | | | | | | | | | | | | | |
U+2ECEx | | | | | | | | | | | | | | | | |
U+2ECFx | | | | | | | | | | | | | | | | |
U + 2ED0x | | | | | | | | | | | | | | | | |
U + 2ED1x | | | | | | | | | | | | | | | | |
U + 2ED2x | | | | | | | | | | | | | | | | |
U + 2ED3x | | | | | | | | | | | | | | | | |
U + 2ED4x | | | | | | | | 🮵 | 🮵 | | 🮵 | 🮵 | | | | |
U + 2ED5x | | | | | | | | | 🮵 | | | | | | 🮵 | |
U + 2ED6x | | | | | | | | | | | | | | | | |
U + 2ED7x | | | | | | | | | | | | | | | | 🮵 |
U + 2ED8x | | | | | | | | | | | | | | | | |
U + 2ED9x | | | | | | | | | | | | | | | | |
U + 2EDAx | | | | | | | | | | | | | | | | |
U + 2EDBx | | | | | | | | | | | | | | | | |
U + 2EDCx | | | | | | | | | | | | | | | | |
U + 2EDDx | 🮷 | | | | | | | | | | 🮷 | 🮷 | | | | |
U + 2EDEx | | | | | | | | | | | | | | | | |
U + 2EDFx | | | | | 🮷 | | 🮷 | | | | | | | | | |
U + 2EE0x | | | | 🮸 | | | | | | | | | | | | |
U + 2EE1x | | | | | | 🮸 | | | | | | | | | | |
U + 2EE2x | | | | | | | | | | | | | | | | |
U + 2EE3x | | | 🮸 | | | | | | 🮸 | | | | | | | |
U + 2EE4x | | | | | | | | | | | | | | | | |
U + 2EE5x | | | | | | | | | | | | | | | ||
Примечания |
История [ править ]
В следующих документах, связанных с Unicode, записаны цель и процесс определения конкретных символов в блоке CJK Unified Ideographs Extension I:
Версия | Окончательные кодовые точки [а] | Считать | L2 Идентификатор | рабочей группы 2 Идентификатор | IRG идентификатор | Документ |
---|---|---|---|---|---|---|
15.1 | U+2EBF0..2EE5D | 622 | Л2/23-011 | Лунде, Кен (11 января 2023 г.), «18) Поправка к GB 18030-2022», Рекомендации CJK и Unihan Group для собрания UTC № 174 | ||
Л2/23-057 | N5201 | N2591 | Проект поправки к GB 18030-2022. Отзывы и рекомендации , 3 февраля 2023 г. | |||
Л2/23-100 | Поправка к GB 18030-2022, проект 2 + расположение комментариев, проект 1 , 10 апреля 2023 г. | |||||
Л2/23-082 | Лунде, Кен (22 апреля 2023 г.), «02 и 03», Рекомендации CJK и Unihan Group для собрания UTC № 175 | |||||
Л2/23-106 | N5214 | Лунде, Кен (24 апреля 2023 г.), «Альтернативное предложение — версия Юникода 15.1», Предложение о временном присвоении или принятии 603 крайне необходимых иероглифов. | ||||
Л2/23-076 | Констебль, Питер (01 мая 2023 г.), «E.4.2 Предложение о временном назначении или принятии 603 срочно необходимых иероглифов», UTC № 175 минут. | |||||
Л2/23-114Р | N5214R2 | Лунде, Кен (05 июля 2023 г.), Предложение закодировать 622 крайне необходимых иероглифов в UCS. | ||||
Л2/23-115 | Констебль, Питер (01.05.2023), Комментарии USNB к проекту 2 GB 18030-2020, поправка 1 и рекомендации для ISO/IEC 10646:2022, поправка 2 | |||||
Л2/23-154 | N5238 | Пересмотр 622 UNC Китая (отзывы по WG2 N5214) , 30 июня 2023 г. | ||||
Л2/23-163 | Лунде, Кен (11 июля 2023 г.), «01», Рекомендации CJK и Unihan Group для собрания UTC № 176 | |||||
Л2/23-157 | Констебль, Питер (31 июля 2023 г.), «E.1 Раздел 1) CJK Unified Ideographs Extension I», UTC № 176, минуты | |||||
|
Ссылки [ править ]
- ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 12 сентября 2023 г.
- ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 12 сентября 2023 г.
- ^ Jump up to: Перейти обратно: а б с Группа идеографических исследований (20 октября 2023 г.). «Рекомендация IRG M61.12: выпуск расширения I для других исходных символов CJK (IRGN2635 и обратная связь, IRGN2622)» (PDF) . Заседание IRG №61 Рекомендации и действия . ISO/IEC JTC1/SC2 N4885, WG2 N5243, IRG N2620; UTC L2/23-250.
- ^ Каплан, Майкл С. (28 марта 2013 г.). «Вы называете это GB18030, я называю это UTF-GBK...» Разбираемся во всем .
- ^ Jump up to: Перейти обратно: а б с д Национальный орган США (1 мая 2023 г.). «Комментарии USNB к проекту 2 поправки 1 GB 18030-2022 и рекомендации для поправки 2 к ISO/IEC 10646:2020» (PDF) . ISO/IEC JTC1/SC2 N4852, WG2 N5222; UTC L2/23-115.
- ^ Jump up to: Перейти обратно: а б Национальный орган Китая (13 октября 2023 г.). «Отчет о деятельности IRG №61» (PDF) . ISO/IEC JTC1/SC2 /WG2/ IRG N2623; UTC L2/23-240.
- ^ Группа идеографических исследований (24 марта 2023 г.). «Рекомендация IRG M60.7: проект обратной связи с поправкой GB18030-2022 (IRGN2591, IRGN2605)» (PDF) . Заседание IRG №60 Рекомендации и действия . ISO/IEC JTC1/SC2 N4840, WG2 N5205, IRG N2600; UTC Л2/23-087.
- ^ «Расширение унифицированных иероглифов CJK I» (PDF) . Стандарт Юникод, версия 15.1 . Консорциум Юникод . 2023.
- ^ Лунде, Кен ; Кук, Ричард, ред. (01.09.2023). "kIRG_GSource" . База данных Unicode Han (Unihan) . Юникод 15.1.0. УАК №38.
- ^ Лунде, Кен (22 апреля 2023 г.). «03) L2/23-100: Поправка к GB 18030-2022, проект 2 + расположение комментариев, проект 1» (PDF) . Рекомендации CJK и Unihan Group для встречи UTC № 175 . UTC L2/23-082.
- ^ «Изменения CJK/Unihan». Юникод 15.1.0 . Консорциум Юникод . 12 сентября 2023 г.
Чтобы диапазоны блоков CJK были максимально компактными, расширение I было добавлено в плоскость 2, а не сразу после расширения H в плоскости 3. Разработчикам следует также проверить, что их код не предполагает, что все расширения CJK встречаются в алфавитном порядке по письмо о продлении.
- ^ Jump up to: Перейти обратно: а б с Сим, Чхон Хён (17 мая 2023 г.). «2. Недавно представленные полудублированные персонажи» (PDF) . Приложение для горизонтального расширения нескольких источников в CJK-ExtI . стр. 3–5. ISO/IEC JTC1/SC2 /WG2/ IRG N2635. (Примечание: документ, на который ссылается, относится к более раннему проекту Расширения I с кодовыми точками, которые отличаются от тех, которые были в окончательной версии, принятой в Unicode. U+2ED90 в ссылочном документе соответствует U+2ED9D <RESERVED-2ED9D> в окончательной версии, тогда как U+2EDD1 в ссылочном документе соответствует U+2EDE0 <RESERVED-2EDE0> в финальной версии.)
- ^ «Единые иероглифы CJK» (PDF) . Стандарт Юникод, версия 15.0 . Консорциум Юникод . п. 823.
- ^ Национальный орган Японии (24 апреля 2023 г.). «Файл данных WG2 n5221: предлагаемое горизонтальное расширение» (PDF) . Запрос на горизонтальное расширение в J-столбце ISO/IEC 10646 (PDF) . п. 414. ISO/IEC JTC1/SC2 /WG2 N5221; UTC L2/23-144.
- ^ Национальный орган Японии (24 апреля 2023 г.). «Файл данных WG2 n5221: предлагаемое горизонтальное расширение» (PDF) . Запрос на горизонтальное расширение в J-столбце ISO/IEC 10646 (PDF) . п. 458. ISO/IEC JTC1/SC2 /WG2 N5221; UTC L2/23-144.
- ^ Суиньяр, Мишель, изд. (03.01.2024). «Расположение комментариев по CDAM2.3 к ISO/IEC 10646, 6-е издание» (PDF) . ISO/IEC JTC1/SC2 /WG2 N5245, UTC L2/24-016.
Дальнейшее чтение [ править ]
- Лунде, Кен (15 июля 2023 г.). «Первая поправка» . В этой статье подробно описано, как блок CJK Unified Ideographs Extension I стал стандартизированным, а также его связь с двумя проектами поправки GB 18030-2022.