Символы и пунктуация CJK
Символы и пунктуация CJK | |
---|---|
Диапазон | U+3000..U+303F (64 кодовых точки) |
Самолет | БМП |
Скрипты | Он (15 символов) Хангыль (2 символа) Общий (43 символа) Наследуется (4 символа) |
Назначенный | 64 кодовых точки |
Неиспользованный | 0 зарезервированных кодовых точек |
История версий Юникода | |
1.0.0 (1991) | 56 (+56) |
1.0.1 (1992) | 56 (+0) |
1.1 (1993) | 57 (+1) |
3.0 (1999) | 61 (+4) |
3.2 (2002) | 64 (+3) |
Документация Юникод | |
Таблица кодов ∣ Веб-страница | |
Примечание : [1] [2] В Unicode 1.0.1 в процессе унификации с ISO 10646 «ИДЕОГРАФИЧЕСКИЙ ТАКОЙ ЗНАК» (仝) был унифицирован с унифицированным иероглифом U+4EDD, что позволило переместить символ японского промышленного стандарта с U+32FF в Закрытый блок букв и месяцев CJK для освободившейся кодовой точки U + 3004. [3] |
Символы и пунктуация CJK — это блок Юникода , содержащий символы и знаки препинания, используемые для написания китайского, японского и корейского языков. Он также содержит один китайский иероглиф .
Блокировать [ править ]
Символы и пунктуация CJK [1] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
U+300x | ИДЕНТИФИКАТОР СП | 、 | 。 | 〃 | 〄 | каждый | 〆 | 〇 | 〈 | 〉 | 《 | 》 | 「 | 」 | 『 | 』 |
U + 301x | 【 | 】 | 〒 | 〓 | 〔 | 〕 | 〖 | 〗 | 〘 | 〙 | 〚 | 〛 | 〜 | 〝 | 〞 | 〟 |
U + 302x | 〠 | 〡 | 〢 | 〣 | 〤 | 〥 | 〦 | 〧 | 〨 | 〩 | 〪 | 〫 | 〬 | 〭 | 〮 | 〯 |
U + 303x | 〰 | 〱 | 〲 | 〳 | 〴 | 〵 | 〶 | 〷 | 〸 | 〹 | 〺 | 〻 | 〼 | 〽 | 〾 | 〿 |
Примечания
|
В блоке имеются последовательности вариаций, определенные для вариантов положения пунктуации в Восточной Азии. [4] [5] Они используют U+FE00 СЕЛЕКТОР ВАРИАЦИИ-1 (VS01) и U+FE01 СЕЛЕКТОР ВАРИАНТОВ-2 (VS02):
У+ | 3001 | 3002 | Описание |
базовая кодовая точка | 、 | 。 | |
база + VS01 | 、︀ | 。︀ | форма, выровненная по углу |
база + VS02 | 、︁ | 。︁ | центрированная форма |
Китайский иероглиф [ править ]
Блок символов и пунктуации CJK содержит один китайский иероглиф : U+3007 〇 ИДЕОГРАФИЧЕСКИЙ НОМЕР НОЛЬ . Хотя он не входит в раздел «Единые иероглифы», для всех остальных намерений и целей он рассматривается как символ CJK. [6]
Эмодзи [ править ]
Блок «Символы и пунктуация CJK» содержит два эмодзи :U+3030 и U+303D. [7] [8]
Блок имеет четыре стандартизированных варианта, определенных для указания стиля эмодзи (U+FE0F VS16) или текстового представления (U+FE0E VS15) длядва смайлика, оба по умолчанию представляют собой текстовую презентацию. [9]
У+ | 3030 | 303D |
базовая кодовая точка | 〰 | 〽 |
база+VS15 (текст) | 〰︎ | 〽︎ |
база+VS16 (эмодзи) | 〰️ | 〽️ |
История [ править ]
В Unicode 1.0.1 в этот блок были внесены два изменения, чтобы сделать Unicode 1.0.1 подмножеством ISO 10646 : [10] [11] [12]
- U+3004 IDEOGRAPHIC DITTO MARK был объединен с U+4EDD (仝) в блоке CJK Unified Ideographs , освободив кодовую точку U+3004.
- СИМВОЛ ЯПОНСКОГО ПРОМЫШЛЕННОГО СТАНДАРТА U + 32FF был перенесен из блока «Закрытые буквы и месяцы CJK» в U + 3004 (〄).
В следующих документах, связанных с Unicode, записаны цель и процесс определения конкретных символов в блоке символов и пунктуации CJK:
Версия | Окончательные кодовые точки [а] | Считать | L2 Идентификатор | рабочей группы 2 Идентификатор | IRG идентификатор | Документ |
---|---|---|---|---|---|---|
1.0.0 | U+3000..3003, 3005..3037, 303F | 56 | (будет определено) | |||
Л2/11-402 | Янку, Лауренциу (20 октября 2011 г.), Предложение об изменении General_Category тоновых знаков хангыля U + 302E и U + 302F. | |||||
Л2/14-198 | N4606 | Комацу, Хироюки (06 августа 2014 г.), Предложение по изменению примерного макета символов WAVE_DASH (U + 301C) | ||||
Л2/14-177 | Мур, Лиза (17 октября 2014 г.), "WAVE_DASH (B.15.3)", UTC № 140 минут. | |||||
Л2/16-052 | N4603 (pdf , док ) | Умамахесваран, VS (01 сентября 2015 г.), «M63.11v», Неподтвержденный протокол заседания WG 2 63. Измените форму текущего глифа для 301C WAVE DASH, как указано в документе N4606. | ||||
Л2/17-056 | Лунде, Кен (13 февраля 2017 г.), Предложение добавить стандартизированные вариационные последовательности | |||||
Л2/17-436 | Лунде, Кен (21 января 2018 г.), Предложение добавить стандартизированные вариационные последовательности для полноширинной восточноазиатской пунктуации. | |||||
Л2/18-039 | Андерсон, Дебора; Уистлер, Кен; Пурнадер, Рузбе; Мур, Лиза; Лян, Хай; Кук, Ричард (19 января 2018 г.), «24. Полноширинная восточноазиатская пунктуация», Рекомендации для UTC № 154, январь 2018 г., по предложениям сценариев | |||||
Л2/18-115 | Мур, Лиза (09 мая 2018 г.), «Консенсус 154-C17», UTC № 155 минут . Добавьте 16 стандартизированных вариационных последовательностей на основе L2/17-436R для Unicode 12.0. | |||||
1.0.1 | U+3004 | 1 | (будет определено) | |||
3.0 | U + 3038..303А | 3 | Л2/97-017 | N1182 | N202 | Предложение добавить 210 радикалов Канси и 3 числа ХАНЧЖОУ в BMP для совместимости , 23 марта 1995 г. |
N1203 | Умамахесваран, В.С.; Ксар, Майк (03.05.1995), «6.1.11», Неподтвержденный протокол 27-го заседания SC2/WG2, Женева | |||||
N1303 (html , документ ) | Umamaheswaran, V. S.; Ksar, Mike (1996-01-26), Minutes of Meeting 29, Tokyo | |||||
Л2/97-284 | N1629 | N486 | Чжан, Чжоукай (7 июля 1997 г.), Радикалы Канси и цифры Ханчжоу | |||
Л2/97-255Р | Алипранд, Джоан (1997-12-03), "4.B.1 Ханчжоуские цифры", утвержденный протокол - совместное заседание UTC № 73 и L2 № 170, Пало-Альто, Калифорния - 4-5 августа 1997 г. , Предложение [# 73 -M9]: что UTC соответствует резолюции SC2/WG2 M32.11 и принимает 3 цифровых символа Ханчжоу. | |||||
Л2/98-112 | N1629R | Чжан, Чжоукай (19 марта 1998 г.), радикалы Канси, цифры Ханчжоу | ||||
Л2/98-332 | N1923 | Совместное голосование по регистрации PDAM и рассмотрению вопроса о WD по стандарту ISO/IEC 10646-1/Amd. 15, ПОПРАВКА 15: Дополнение к радикалам Кан Си и радикалам CJK , 28 октября 1998 г. | ||||
Л2/99-073 | N1968 (html , документ ) | Итоги голосования по SC 2 N 3213, бюллетень PDAM по WD за 10646-1/Amd. 15: Радикалы Кан Си и дополнение к радикалам CJK , 8 февраля 1999 г. | ||||
Л2/99-119 | Текст для голосования FPDAM по ISO/IEC 10646, поправка. 15 - Радикалы Кан Си и добавка радикалов CJK , 7 апреля 1999 г. | |||||
Л2/99-232 | Н2003 | Умамахесваран, VS (03 августа 1999 г.), «6.1.1 PDAM15 - Кан Си и радикалы CJK», протокол заседания 36 WG 2, Фукуока, Япония, 15 сентября 1999 г. | ||||
Л2/99-252 | N2065 | Сводка голосования по SC 2 N 3311, ISO 10646-1/FPDAM 15 - Дополнение к радикалам Кан Си и радикалам CJK , 19 августа 1999 г. | ||||
Л2/99-300 | N2122 | Патерсон, Брюс (21 сентября 1999 г.), Пересмотренный текст для голосования FDAM по ISO / IEC 10646-1 / FDAM 15, ПОПРАВКА 15: Дополнение к радикалам Кан Си и радикалам CJK. | ||||
Л2/00-044 | Сводка голосования FDAM: Поправка 15 к ISO 10646: Дополнение к радикалам Кан Си и радикалам CJK , 31 января 2000 г. | |||||
U + 303E | 1 | N1431 | Н406 , Н406А | Идеографический знак вариации , 27 июня 1996 г. | ||
N1453 | Ксар, Майк; Умамахесваран, VS (1996-12-06), «9.7 Идеографический знак вариации», WG 2 минуты - Встреча в Квебеке 31 | |||||
Л2/97-023 | N1486 | N437 | Резолюции IRG №8 , 16 января 1997 г. | |||
N1489 | Дополнение к «Идеографическим компонентам и композиционным схемам» , 16 января 1997 г. | |||||
N1490 | N436 | «Ответ, связанный с N1431 (идеографический знак вариации)», Ответ на вопрос WG2 о символах идеографической структуры , 16 января 1997 г. | ||||
Л2/97-024 | N1491 | Предложение IRG: Идеографический вариант символа , 19 января 1997 г. | ||||
Л2/97-030 | N1503 (pdf , doc ) | Умамахесваран, В.С.; Ксар, Майк (1997-04-01), "9.5", Неподтвержденный протокол заседания WG 2 № 32, Сингапур; 1997-01-20--24 | ||||
Л2/97-114 | N1544 (html , документ ) | N453 | Сато, Т.К. (08 апреля 1997 г.), Вопросы по «методу структуры Хана», описанному в WG2 N1490 (IRG N436). | |||
N1678 (pdf , doc ) | Дальнейшее объяснение знака вариации , 18 декабря 1997 г. | |||||
Л2/98-100 | N1728 | Специальный отчет по индикатору идеографических вариаций , 18 марта 1998 г. | ||||
Л2/98-158 | Алипранд, Джоан; Винклер, Арнольд (26 мая 1998 г.), «Индикатор идеографических изменений», черновой вариант протокола - совместное заседание UTC № 76 и подгруппы NCITS L2 № 173, Тредиффрин, Пенсильвания, 20–22 апреля 1998 г. | |||||
Л2/98-286 | N1703 | Умамахесваран, В.С.; Ксар, Майк (02 июля 1998 г.), «9.3», неподтвержденный протокол собрания, заседание WG 2 № 34, Редмонд, Вашингтон, США; 1998-03-16--20 | ||||
Л2/98-321 | N1905 | Пересмотренный текст 10646-1/FPDAM 23, ПОПРАВКА 23: Расширенный Бопомофо и другие символы , 22 октября 1998 г. | ||||
3.2 | U + 303B..303D | 3 | Л2/99-238 | Консолидированный документ, содержащий 6 предложений Японии , 15 июля 1999 г. | ||
N2092 | Добавление сорока восьми символов , 13 сентября 1999 г. | |||||
Л2/00-024 | Сибано, Кодзи (31 января 2000 г.), предложение JCS пересмотрено | |||||
Л2/00-098 , Л2/00-098-стр.5 | N2195 | Обоснование использования символов, отличных от кандзи, предложенное комитетом JCS , 15 марта 2000 г. | ||||
Л2/00-234 | N2203 (rtf , txt ) | Умамахесваран, В.С. (21 июля 2000 г.), «8.20», Протокол заседания SC2/WG2 в Пекине, 21 марта 2000 г. — 24 | ||||
Л2/00-298 | N2258 | Сато, ТК (04 сентября 2000 г.), символы JIS X 0213, часть 2 | ||||
Л2/00-342 | N2278 | Сато, ТК; Эверсон, Майкл ; Уистлер, Кен; Фрейтаг, Асмус (20 сентября 2000 г.), Специальный отчет по отзывам Японии N2257 и N2258 | ||||
Л2/01-050 | N2253 | Умамахесваран, В.С. (21 января 2001 г.), «7.16 Символы JIS X0213», протокол заседания SC2/WG2 в Афинах, сентябрь 2000 г. | ||||
Л2/01-114 | N2328 | Итоги голосования по SC 2 N 3503, ISO/IEC 10646-1: 2000/PDAM 1 , 09 марта 2001 г. | ||||
Л2/11-438 [б] [с] | N4182 | Эдберг, Питер (22 декабря 2011 г.), Последовательности вариаций эмодзи (редакция L2 / 11-429) | ||||
|
См. также [ править ]
Ссылки [ править ]
- ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 26 июля 2023 г.
- ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 26 июля 2023 г.
- ^ «Дополнение к Unicode 1.0.1» (PDF) . Стандарт Юникод . 03.11.1992 . Проверено 9 июля 2016 г.
- ^ Лунде, Кен (21 января 2018 г.). «L2/17-436: Предложение по добавлению стандартизированных вариационных последовательностей для полноширинной восточноазиатской пунктуации» (PDF) .
- ^ «База данных символов Юникода: стандартизированные вариационные последовательности» . Консорциум Юникод.
- ^ GB/T 15835-2011 «Использование чисел в публикациях». Китай Гоцзя Бяочжунь https://journals.usst.edu.cn/uploadfile/file/GBT%2015835-2011%E3%80%8A%E5%87 . %BA%E7%89%88%E7%89%A9%E4%B8%8A%E6%95%B0%E5%AD%97%E7%94%A8%E6%B3%95%E3%80%8B .pdf
- ^ «UTR № 51: эмодзи Юникода» . Консорциум Юникод. 05.09.2023.
- ^ «UCD: данные Emoji для UTR #51» . Консорциум Юникод. 01.02.2023.
- ^ «Последовательности вариаций эмодзи UTS № 51» . Консорциум Юникод.
- ^ «Дополнение к Unicode 1.0.1» (PDF) . Стандарт Юникод . 03.11.1992 . Проверено 9 июля 2016 г.
- ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 9 июля 2016 г.
- ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 9 июля 2016 г.