Jump to content

Расширение унифицированных идеографов CJK I

Расширение унифицированных идеографов CJK I
Диапазон U+2EBF0..U+2EE5F
(624 кодовых точки)
Самолет ГЛОТОК
Скрипты Он
Назначенный 622 кодовых точки
Неиспользованный 2 зарезервированные кодовые точки
История версий Юникода
15.1 (2023) 622 (+622)
Документация Юникод
Таблица кодов Веб-страница
Примечание : [1] [2]

Расширение I унифицированных идеографов CJK — это блок Unicode, включающий унифицированные идеографы CJK , включенные в проекты поправки к китайскому стандарту GB 18030, распространенные в 2022 и 2023 годах, которые были быстро преобразованы в Unicode в 2023 году.

Предыстория [ править ]

В отличие от большинства других наборов унифицированных иероглифов CJK, Расширение I не было подготовлено и представлено Группой идеографических исследований (IRG). [3]

GB 18030 является обязательным национальным стандартом Китайской Народной Республики (КНР). Он определяет формат преобразования Unicode , который сохраняет совместимость с существующими данными в более ранних кодировках символов GBK и EUC-CN , а также определяет конкретные символы Unicode, которые должны поддерживать устройства, продаваемые в Китае. [4] В его редакции 2022 года, GB 18030-2022 , изменен ряд обязательных символов для сопоставления со стандартными кодовыми точками Unicode , а не с кодовыми точками зон частного использования .

В конце 2022 года КНР представила для общественного обсуждения проект дополнительной поправки к GB 18030. Этот проект поместил бы 897 новых синографических символов в Plane 10 ( шестнадцатеричный : 0A), еще не имеющий названия астральный план Unicode . [5] Это было мотивировано «острой необходимостью сертификации настоящего имени граждан в Китае». [6] Поскольку это повлияет на ISO/IEC 10646 (универсальный набор кодированных символов, стандарт ISO , синхронизированный с Unicode), проект был распространен в ISO/IEC JTC 1/SC 2 , подкомитете ISO, ответственном за ISO 10646. Китайский национальный орган поддерживал что «ISO/IEC 10646 не определяет назначение плоскости 0A», которую ISO 10646 обозначает как «зарезервированную для будущей стандартизации», и что такое использование, следовательно, «не является неуместным». [5]

Однако, поскольку цель ISO 10646 заключалась в том, чтобы зарезервировать плоскость 10 для будущего распределения ISO 10646 и Unicode посредством обычного процесса голосования, а не для ее распределения в одностороннем порядке национальными органами по стандартизации , этот предложенный шаг подвергся критике со стороны экспертов и других специалистов. национальные органы как орган, который «дестабилизирует синхронизацию» между GB 18030 и ISO/IEC 10646 (и, следовательно, Unicode) и который сделает невозможным соответствие обоим стандартам с помощью одной реализации, [5] эффективно разветвляет Unicode. На своем заседании в марте 2023 года IRG подчеркнула важность своевременного предоставления любых последующих проектов поправок к GB 18030 экспертам IRG и недопущения «ненадлежащего использования стандарта ISO/IEC 10646». [7]

В качестве альтернативы репертуар (в конечном итоге сокращенный до 622 символов после проверки экспертами) был ускорен в версии Unicode 15.1 в сентябре 2023 года как блок CJK Unified Ideographs Extension I. [5] Персонажи представляют собой источник Unihan "GIDC23" , [8] определено как полученное из «Системы идентификации Министерства общественной безопасности Китая, 2023 г.». [9] Блок CJK Unified Ideographs Extension D был назван прецедентом, поскольку он включал репертуар срочно необходимых символов (UNC) от организаций-членов IRG, тогда как рабочий набор IRG, первоначально планировалось стать расширением D, вместо этого стал E. расширением [10] Для компактности блок был выделен доступному пространству в дополнительной идеографической плоскости после CJK Unified Ideographs Extension F , а не в третичной идеографической плоскости после CJK Unified Ideographs Extension H ; это означает, что блоки расширения CJK больше не располагаются в алфавитном порядке по букве расширения. [11] После этого проект поправки GB 18030 был изменен для использования кодовых точек расширения I. [6]

На своем следующем заседании в октябре 2023 года IRG выразила обеспокоенность по поводу обхода IRG для больших коллекций персонажей CJK и отметила, что два персонажа в Расширении I для целей источников символов других регионов ранее были унифицированы с существующими персонажи по правилам объединения IRG: [3] [12]

  • Учитывая взаимозаменяемые формы травяного радикала , U+2ED9D 𮶝 <RESERVED-2ED9D> соответствует ранее существовавшему глифу T-source ( Тайвань ) для U + 8286 CJK ЕДИНАЯ ИДЕОГРАФИЯ-8286 (ссылка на CNS 11643 ), [13] а также предлагаемый для него символ J-source ( Япония ). [14] Символ, соответствующий другому глифу U+8286 (источник G, т.е. материковый Китай), существует где-то еще в более поздних выпусках CNS 11643, поэтому добавление U+2ED9D влияет на существующие соответствия между CNS 11643 и Unicode, хотя из-за поскольку ни один из символов не находится в плоскостях 1 или 2, это не влияет на отображение Big5 в Юникоде . [12]
  • U+2EDE0 𮷠 <RESERVED-2EDE0> соответствует предлагаемому глифу J-источника (Япония) для U+8FF3 CJK ЕДИНАЯ ИДЕОГРАФИЯ-8FF3 . [15] Ранее он дважды предлагался в качестве нового символа (один раз со ссылкой на CNS 11643 и один раз Японией), но был отклонен на том основании, что его можно объединить с U + 8FF3. [12] Предложенный символ позже был перенесен в новый U+2EDE0 𮷠 Кодовая точка <RESERVED-2EDE0> по запросу национального органа Японии. [16]

В ответ IRG рекомендовала, чтобы в будущем отправители предлагаемых символов CJK были обязаны предоставлять информацию о влиянии на другие источники символов CJK любых разобщений, предложенных в представлении, и чтобы IRG было предоставлено время для рассмотрения всех крупных представлений символов CJK. Персонажи CJK. IRG призвала китайскую организацию предложить решения проблем, вызванных добавлением этих двух символов, на следующем заседании IRG. [3]

Блокировать [ править ]

Расширение унифицированных идеографов CJK I [1] [2]
Официальная таблица кодов Консорциума Unicode (PDF)
 0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
U+2EBFx 𮯰 𮯱 𮯲 𮯳 𮯴 𮯵 𮯶 𮯷 𮯸 𮯹 𮯺 𮯻 𮯼 𮯽 𮯾 𮯿
U + 2EC0x 𮰀 𮰁 𮰂 𮰃 𮰄 𮰅 𮰆 𮰇 𮰈 𮰉 𮰊 𮰋 𮰌 𮰍 𮰎 𮰏
U + 2EC1x 𮰐 𮰑 𮰒 𮰓 𮰔 𮰕 𮰖 𮰗 𮰘 𮰙 𮰚 𮰛 𮰜 𮰝 𮰞 𮰟
U + 2EC2x 𮰠 𮰡 𮰢 𮰣 𮰤 𮰥 𮰦 𮰧 𮰨 𮰩 𮰪 𮰫 𮰬 𮰭 𮰮 𮰯
U + 2EC3x 𮰰 𮰱 𮰲 𮰳 𮰴 𮰵 𮰶 𮰷 𮰸 𮰹 𮰺 𮰻 𮰼 𮰽 𮰾 𮰿
U + 2EC4x 𮱀 𮱁 𮱂 𮱃 𮱄 𮱅 𮱆 𮱇 𮱈 𮱉 𮱊 𮱋 𮱌 𮱍 𮱎 𮱏
U + 2EC5x 𮱐 𮱑 𮱒 𮱓 𮱔 𮱕 𮱖 𮱗 𮱘 𮱙 𮱚 𮱛 𮱜 𮱝 𮱞 𮱟
U + 2EC6x 𮱠 𮱡 𮱢 𮱣 𮱤 𮱥 𮱦 𮱧 𮱨 𮱩 𮱪 𮱫 𮱬 𮱭 𮱮 𮱯
U + 2EC7x 𮱰 𮱱 𮱲 𮱳 𮱴 𮱵 𮱶 𮱷 𮱸 𮱹 𮱺 🮱 𮱼 𮱽 𮱾 𮱿
U + 2EC8x 𮲀 𮲁 𮲂 𮲃 𮲄 𮲅 𮲆 𮲇 𮲈 𮲉 𮲊 𮲋 𮲌 𮲍 𮲎 𮲏
U + 2EC9x 𮲐 𮲑 𮲒 𮲓 𮲔 𮲕 𮲖 𮲗 𮲘 𮲙 𮲚 𮲛 𮲜 𮲝 𮲞 𮲟
U + 2ECAx 𮲠 𮲡 𮲢 𮲣 𮲤 𮲥 𮲦 𮲧 𮲨 𮲩 𮲪 𮲫 𮲬 𮲭 𮲮 𮲯
U+2ECBx 𮲰 𮲱 𮲲 𮲳 𮲴 𮲵 𮲶 𮲷 𮲸 𮲹 𮲺 𮲻 𮲼 𮲽 𮲾 𮲿
U+2ECCx 𮳀 𮳁 𮳂 𮳃 𮳄 𮳅 𮳆 𮳇 𮳈 𮳉 𮳊 𮳋 𮳌 𮳍 𮳎 𮳏
U + 2ECDx 𮳐 𮳑 𮳒 𮳓 𮳔 𮳕 𮳖 𮳗 𮳘 𮳙 𮳚 𮳛 𮳜 𮳝 𮳞 𮳟
U+2ECEx 𮳠 𮳡 𮳢 𮳣 𮳤 𮳥 𮳦 𮳧 𮳨 𮳩 𮳪 𮳫 𮳬 𮳭 𮳮 𮳯
U+2ECFx 𮳰 𮳱 𮳲 𮳳 𮳴 𮳵 𮳶 𮳷 𮳸 𮳹 𮳺 𮳻 𮳼 𮳽 𮳾 𮳿
U + 2ED0x 𮴀 𮴁 𮴂 𮴃 𮴄 𮴅 𮴆 𮴇 𮴈 𮴉 𮴊 𮴋 𮴌 𮴍 𮴎 𮴏
U + 2ED1x 𮴐 𮴑 𮴒 𮴓 𮴔 𮴕 𮴖 𮴗 𮴘 𮴙 𮴚 𮴛 𮴜 𮴝 𮴞 𮴟
U + 2ED2x 𮴠 𮴡 𮴢 𮴣 𮴤 𮴥 𮴦 𮴧 𮴨 𮴩 𮴪 𮴫 𮴬 𮴭 𮴮 𮴯
U + 2ED3x 𮴰 𮴱 𮴲 𮴳 𮴴 𮴵 𮴶 𮴷 𮴸 𮴹 𮴺 𮴻 𮴼 𮴽 𮴾 𮴿
U + 2ED4x 𮵀 𮵁 𮵂 𮵃 𮵄 𮵅 𮵆 🮵 🮵 𮵉 🮵 🮵 𮵌 𮵍 𮵎 𮵏
U + 2ED5x 𮵐 𮵑 𮵒 𮵓 𮵔 𮵕 𮵖 𮵗 🮵 𮵙 𮵚 𮵛 𮵜 𮵝 🮵 𮵟
U + 2ED6x 𮵠 𮵡 𮵢 𮵣 𮵤 𮵥 𮵦 𮵧 𮵨 𮵩 𮵪 𮵫 𮵬 𮵭 𮵮 𮵯
U + 2ED7x 𮵰 𮵱 𮵲 𮵳 𮵴 𮵵 𮵶 𮵷 𮵸 𮵹 𮵺 𮵻 𮵼 𮵽 𮵾 🮵
U + 2ED8x 𮶀 𮶁 𮶂 𮶃 𮶄 𮶅 𮶆 𮶇 𮶈 𮶉 𮶊 𮶋 𮶌 𮶍 𮶎 𮶏
U + 2ED9x 𮶐 𮶑 𮶒 𮶓 𮶔 𮶕 𮶖 𮶗 𮶘 𮶙 𮶚 𮶛 𮶜 𮶝 𮶞 𮶟
U + 2EDAx 𮶠 𮶡 𮶢 𮶣 𮶤 𮶥 𮶦 𮶧 𮶨 𮶩 𮶪 𮶫 𮶬 𮶭 𮶮 𮶯
U + 2EDBx 𮶰 𮶱 𮶲 𮶳 𮶴 𮶵 𮶶 𮶷 𮶸 𮶹 𮶺 𮶻 𮶼 𮶽 𮶾 𮶿
U + 2EDCx 𮷀 𮷁 𮷂 𮷃 𮷄 𮷅 𮷆 𮷇 𮷈 𮷉 𮷊 𮷋 𮷌 𮷍 𮷎 𮷏
U + 2EDDx 🮷 𮷑 𮷒 𮷓 𮷔 𮷕 𮷖 𮷗 𮷘 𮷙 🮷 🮷 𮷜 𮷝 𮷞 𮷟
U + 2EDEx 𮷠 𮷡 𮷢 𮷣 𮷤 𮷥 𮷦 𮷧 𮷨 𮷩 𮷪 𮷫 𮷬 𮷭 𮷮 𮷯
U + 2EDFx 𮷰 𮷱 𮷲 𮷳 🮷 𮷵 🮷 𮷷 𮷸 𮷹 𮷺 𮷻 𮷼 𮷽 𮷾 𮷿
U + 2EE0x 𮸀 𮸁 𮸂 🮸 𮸄 𮸅 𮸆 𮸇 𮸈 𮸉 𮸊 𮸋 𮸌 𮸍 𮸎 𮸏
U + 2EE1x 𮸐 𮸑 𮸒 𮸓 𮸔 🮸 𮸖 𮸗 𮸘 𮸙 𮸚 𮸛 𮸜 𮸝 𮸞 𮸟
U + 2EE2x 𮸠 𮸡 𮸢 𮸣 𮸤 𮸥 𮸦 𮸧 𮸨 𮸩 𮸪 𮸫 𮸬 𮸭 𮸮 𮸯
U + 2EE3x 𮸰 𮸱 🮸 𮸳 𮸴 𮸵 𮸶 𮸷 🮸 𮸹 𮸺 𮸻 𮸼 𮸽 𮸾 𮸿
U + 2EE4x 𮹀 𮹁 𮹂 𮹃 𮹄 𮹅 𮹆 𮹇 𮹈 𮹉 𮹊 𮹋 𮹌 𮹍 𮹎 𮹏
U + 2EE5x 𮹐 𮹑 𮹒 𮹓 𮹔 𮹕 𮹖 𮹗 𮹘 𮹙 𮹚 𮹛 𮹜 𮹝
Примечания
1. ^ Начиная с версии Unicode 15.1.
2. ^ Серые области обозначают неназначенные кодовые точки.

История [ править ]

В следующих документах, связанных с Unicode, записаны цель и процесс определения конкретных символов в блоке CJK Unified Ideographs Extension I:

Версия Окончательные кодовые точки [а] Считать L2 Идентификатор рабочей группы 2 Идентификатор IRG идентификатор Документ
15.1 U+2EBF0..2EE5D 622 Л2/23-011 Лунде, Кен (11 января 2023 г.), «18) Поправка к GB 18030-2022», Рекомендации CJK и Unihan Group для собрания UTC № 174
Л2/23-057 N5201 N2591 Проект поправки к GB 18030-2022. Отзывы и рекомендации , 3 февраля 2023 г.
Л2/23-100 Поправка к GB 18030-2022, проект 2 + расположение комментариев, проект 1 , 10 апреля 2023 г.
Л2/23-082 Лунде, Кен (22 апреля 2023 г.), «02 и 03», Рекомендации CJK и Unihan Group для собрания UTC № 175
Л2/23-106 N5214 Лунде, Кен (24 апреля 2023 г.), «Альтернативное предложение — версия Юникода 15.1», Предложение о временном присвоении или принятии 603 крайне необходимых иероглифов.
Л2/23-076 Констебль, Питер (01 мая 2023 г.), «E.4.2 Предложение о временном назначении или принятии 603 срочно необходимых иероглифов», UTC № 175 минут.
Л2/23-114Р N5214R2 Лунде, Кен (05 июля 2023 г.), Предложение закодировать 622 крайне необходимых иероглифов в UCS.
Л2/23-115 Констебль, Питер (01.05.2023), Комментарии USNB к проекту 2 GB 18030-2020, поправка 1 и рекомендации для ISO/IEC 10646:2022, поправка 2
Л2/23-154 N5238 Пересмотр 622 UNC Китая (отзывы по WG2 N5214) , 30 июня 2023 г.
Л2/23-163 Лунде, Кен (11 июля 2023 г.), «01», Рекомендации CJK и Unihan Group для собрания UTC № 176
Л2/23-157 Констебль, Питер (31 июля 2023 г.), «E.1 Раздел 1) CJK Unified Ideographs Extension I», UTC № 176, минуты
  1. ^ Предлагаемые кодовые точки и имена символов могут отличаться от окончательных кодовых точек и имен.

Ссылки [ править ]

  1. ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 12 сентября 2023 г.
  2. ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 12 сентября 2023 г.
  3. ^ Jump up to: Перейти обратно: а б с Группа идеографических исследований (20 октября 2023 г.). «Рекомендация IRG M61.12: выпуск расширения I для других исходных символов CJK (IRGN2635 и обратная связь, IRGN2622)» (PDF) . Заседание IRG №61 Рекомендации и действия . ISO/IEC JTC1/SC2 N4885, WG2 N5243, IRG N2620; UTC L2/23-250.
  4. ^ Каплан, Майкл С. (28 марта 2013 г.). «Вы называете это GB18030, я называю это UTF-GBK...» Разбираемся во всем .
  5. ^ Jump up to: Перейти обратно: а б с д Национальный орган США (1 мая 2023 г.). «Комментарии USNB к проекту 2 поправки 1 GB 18030-2022 и рекомендации для поправки 2 к ISO/IEC 10646:2020» (PDF) . ISO/IEC JTC1/SC2 N4852, WG2 N5222; UTC L2/23-115.
  6. ^ Jump up to: Перейти обратно: а б Национальный орган Китая (13 октября 2023 г.). «Отчет о деятельности IRG №61» (PDF) . ISO/IEC JTC1/SC2 /WG2/ IRG N2623; UTC L2/23-240.
  7. ^ Группа идеографических исследований (24 марта 2023 г.). «Рекомендация IRG M60.7: проект обратной связи с поправкой GB18030-2022 (IRGN2591, IRGN2605)» (PDF) . Заседание IRG №60 Рекомендации и действия . ISO/IEC JTC1/SC2 N4840, WG2 N5205, IRG N2600; UTC Л2/23-087.
  8. ^ «Расширение унифицированных иероглифов CJK I» (PDF) . Стандарт Юникод, версия 15.1 . Консорциум Юникод . 2023.
  9. ^ Лунде, Кен ; Кук, Ричард, ред. (01.09.2023). "kIRG_GSource" . База данных Unicode Han (Unihan) . Юникод 15.1.0. УАК №38.
  10. ^ Лунде, Кен (22 апреля 2023 г.). «03) L2/23-100: Поправка к GB 18030-2022, проект 2 + расположение комментариев, проект 1» (PDF) . Рекомендации CJK и Unihan Group для встречи UTC № 175 . UTC L2/23-082.
  11. ^ «Изменения CJK/Unihan». Юникод 15.1.0 . Консорциум Юникод . 12 сентября 2023 г. Чтобы диапазоны блоков CJK были максимально компактными, расширение I было добавлено в плоскость 2, а не сразу после расширения H в плоскости 3. Разработчикам следует также проверить, что их код не предполагает, что все расширения CJK встречаются в алфавитном порядке по письмо о продлении.
  12. ^ Jump up to: Перейти обратно: а б с Сим, Чхон Хён (17 мая 2023 г.). «2. Недавно представленные полудублированные персонажи» (PDF) . Приложение для горизонтального расширения нескольких источников в CJK-ExtI . стр. 3–5. ISO/IEC JTC1/SC2 /WG2/ IRG N2635. (Примечание: документ, на который ссылается, относится к более раннему проекту Расширения I с кодовыми точками, которые отличаются от тех, которые были в окончательной версии, принятой в Unicode. U+2ED90 в ссылочном документе соответствует U+2ED9D 𮶝 <RESERVED-2ED9D> в окончательной версии, тогда как U+2EDD1 в ссылочном документе соответствует U+2EDE0 𮷠 <RESERVED-2EDE0> в финальной версии.)
  13. ^ «Единые иероглифы CJK» (PDF) . Стандарт Юникод, версия 15.0 . Консорциум Юникод . п. 823.
  14. ^ Национальный орган Японии (24 апреля 2023 г.). «Файл данных WG2 n5221: предлагаемое горизонтальное расширение» (PDF) . Запрос на горизонтальное расширение в J-столбце ISO/IEC 10646 (PDF) . п. 414. ISO/IEC JTC1/SC2 /WG2 N5221; UTC L2/23-144.
  15. ^ Национальный орган Японии (24 апреля 2023 г.). «Файл данных WG2 n5221: предлагаемое горизонтальное расширение» (PDF) . Запрос на горизонтальное расширение в J-столбце ISO/IEC 10646 (PDF) . п. 458. ISO/IEC JTC1/SC2 /WG2 N5221; UTC L2/23-144.
  16. ^ Суиньяр, Мишель, изд. (03.01.2024). «Расположение комментариев по CDAM2.3 к ISO/IEC 10646, 6-е издание» (PDF) . ISO/IEC JTC1/SC2 /WG2 N5245, UTC L2/24-016.

Дальнейшее чтение [ править ]

  • Лунде, Кен (15 июля 2023 г.). «Первая поправка» . В этой статье подробно описано, как блок CJK Unified Ideographs Extension I стал стандартизированным, а также его связь с двумя проектами поправки GB 18030-2022.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: fbd038275bf63ede4cb41cc4b0807188__1707061320
URL1:https://arc.ask3.ru/arc/aa/fb/88/fbd038275bf63ede4cb41cc4b0807188.html
Заголовок, (Title) документа по адресу, URL1:
CJK Unified Ideographs Extension I - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)