Код китайских символов для обмена информацией
Язык(и) | Китайский , японский , корейский |
---|---|
Стандартный | MARC-8 , ANSI/NISO Z39.64 (обе версии EACC) |
Текущий статус | Используется в основном библиотечными системами. |
Классификация | TBCS для CJK на основе структуры ISO 2022 , компонента JACKPHY MARC. |
Код китайских символов для обмена информацией ( китайский : 中文資訊交換碼 ) или CCCII — это набор символов , разработанный Группой анализа китайских символов на Тайване . Впервые он был опубликован в 1980 году и значительно расширен в 1982 и 1987 годах. [1]
Он используется в основном библиотечными системами . [2] [3] Это одна из самых ранних и самых сложных кодировок традиционного китайского языка (до создания Big5 в 1984 году и CNS 11643 в 1986 году). [2] Он отличается уникальной системой кодирования упрощенных версий и других вариантов основного набора символов ханзи . [1]
Вариант более ранней версии CCCII используется Библиотекой Конгресса как часть MARC-8 под названием « Код символов Восточной Азии» ( EACC , ANSI/NISO Z39.64). [4] где он является частью 21 MARC поддержки JACKPHY . Однако EACC содержит меньше символов, чем самые последние версии CCCII. [5] [1] Работа в Apple, основанная на тезаурусе CJK Research Libraries Group , который использовался для поддержки EACC, была одним из прямых предшественников Unicode набора Unihan . [6]
Дизайн
[ редактировать ]Диапазоны байтов
[ редактировать ]CCCII спроектирован как 94 н набор, как определено ISO/IEC 2022 . [1] Каждый китайский иероглиф представлен 3-байтовым кодом, в котором каждый байт имеет 7 бит, от 0x21 до 0x7E включительно. Таким образом, максимальное количество китайских иероглифов, представленных в CCCII, составляет 94×94×94 = 830584. На практике количество символов, кодируемых CCCII, будет меньше этого числа, поскольку варианты символов кодируются в соответствующих плоскостях ISO 2022 под CCCII, поэтому большинство кодовых точек придется зарезервировать для вариантов.
Однако на практике иногда используются байты за пределами этих диапазонов. Код 0x212320 используется некоторыми реализациями в качестве идеографического пространства . [8] Спецификация CCCII, используемая библиотеками Гонконга, использует коды, начинающиеся с 0x2120, для знаков препинания и символов. [9] Первый байт 0x7F используется в некоторых вариантах для кодирования кодов для некоторых других недоступных Unified Repertoire and Ordering или CJK Unified Ideographs Extension A hanzi (например, 0x7F3449 для U+3449 или 0x7F796E для U+796E; [9] обратите внимание, что байты продолжения соответствуют коду UCS-2BE ), и это могут быть байты за пределами диапазона 0x21–0x7E или даже 0x20–0x7F, например 0x7F551C для U+551C, [10] 0x7F5AA4 для U+5AA4 [10] или 0x7F8EDA для U+8EDA. [9]
Взаимодействие с ISO 2022
[ редактировать ]CCCII/EACC не зарегистрирован в Международном реестре наборов кодированных символов, используемых с Escape-последовательностями . [11] для частного использования ( и, как таковой, не имеет стандартного escape-обозначения для использования с ISO 2022. MARC-8 назначает EACC F -байт 0x31 1
) в реализации ANSI X3.41 (ISO 2022). [12]
Слои и варианты символов
[ редактировать ]94 плоскости ISO 2022 сгруппированы в 16 слоев по 6 плоскостей в каждой (кроме слоя 16, который содержит четыре плоскости 91–94). [1] Уровень 1 содержит как символы, не являющиеся ханзи, так и символы ханзи , причем не-ханзи и наиболее часто используемые ханзи размещаются в плоскости 1, а остальные пять плоскостей состоят из менее распространенных ханзи. [1] Уровень 2 содержит упрощенные китайские иероглифы которых , номера строк и ячеек совпадают с номерами их традиционных китайских эквивалентов в слое 1. Слои с 3 по 12 содержат дополнительные варианты форм , номера строк и ячеек которых гомологичны первым двум слоям. [13]
Последние четыре слоя используются для других целей. В частности, слой 13 содержит дополнительные символы для японского языка поддержки ( кана и японский кокудзи ), а слой 14 содержит дополнительные символы для корейского языка поддержки ( хангыль ). [13] Уровень 15 не используется (зарезервирован), а уровень 16 используется для других символов. [1]
Этот отличительный дизайн подвергся критике со стороны Кристиана Виттерна из Международного исследовательского института дзен-буддизма при Университете Ханазоно , который утверждает, что отношения вариантов символов «очень сложны и не могут быть выражены в фиксированной, одномерной, жестко запрограммированной кодовой таблице». ". [3] Кен Лунде описывает его как «один из наиболее продуманных стандартов набора символов из Тайваня», описывая его структуру как «вызывающую истинное восхищение», но делая вывод, что замена форм вариантами OpenType может обеспечить тот же уровень функциональности. [1]
CCCII определяет примерно 53 940 кодовых точек по состоянию на издание 1987 года, хотя в более позднем проекте 1989 года это число расширено до 75 684 кодовых точек (включая 44 167 уникальных символов и 31 517 вариантов). EACC, вариант, используемый Библиотекой Конгресса, включает лишь меньший набор из 15 686 символов. [1]
Принятие
[ редактировать ]По состоянию на 1995 год CCCII или EACC использовался в основном в библиотеках США , Гонконга и Тайваня . Хотя CCCII обещала покрытие Pan -CJK , ее поддержка ограничивалась специализированным оборудованием; трудности с выяснением того, когда следует использовать корневой или вариантный символ, усугубляемые отсутствием твердо установленных справочных глифов, еще больше ограничивали его распространение, в результате чего Big5 чаще использовался для китайского языка на тех территориях, за пределами использования библиотеки (поскольку Unicode еще не стал широко распространенное в то время). [3]
По состоянию на 2009 год [update]EACC до сих пор широко используется в специализированных библиографических целях. [1] Это также был важный предшественник Unicode: [1] Работа в Apple над базой данных перекрестных ссылок символов CJK, основанной на тезаурусе CJK Research Libraries Group , используемом для поддержки EACC, была непосредственно включена в разработку Unicode набора Unihan . [6] Символы Unicode hanzi ссылаются на соответствующие им коды CCCII и EACC в базе данных Unihan в ключах. kCCCII
и kEACC
; [4] однако, поскольку критерии унификации символов Unicode (основанные на критериях, используемых в японском стандарте JIS X 0208 и на критериях, разработанных Ассоциацией общего китайского кода в Китае) отличаются от критериев, используемых CCCII, не все варианты символов сопоставляются индивидуально. [6] Таблицы сопоставления ханзи, хангыля , каны и знаков препинания между EACC и Unicode доступны в Библиотеке Конгресса. [14]
Таблицы пунктуации, символов, кана и джамо
[ редактировать ]Ниже приведены таблицы пунктуации, символов, каны и хангыль джамо , показывающие символы и возможные сопоставления Юникода. Там, где это возможно, они сопоставляются с опубликованными картографическими данными.
Сопоставления Юникода для слогов хангыля ниже для краткости опущены, но задокументированы Библиотекой Конгресса. [15] CCCII число ханьцзы в десятках тысяч [1] [3] и не показаны ниже (за исключением тех случаев, когда они также включены в диапазон, не относящийся к ханзи, в виде радикалов или цифр), но сопоставления с Unicode доступны в базе данных Unihan. [4] и из других мест. [10] [9]
Набор символов 0x2120 (плоскость 1, строка 0: пунктуация Гонконга)
[ редактировать ]Хотя CCCII обычно равен 94 н набор, [1] и поэтому обычно не использует коды, начинающиеся с 0x2120, [10] следующий макет используется в варианте, используемом библиотеками Гонконга: [9]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | 、 | 。 | ・ | ゙ | ゚ | ´ | ` | ¨ |  ̄ | ヽ | ヾ | ゝ | ゞ | |||
3x | 〃 | 〆 | ‖ | … | ‥ | |||||||||||
4x | “ | 〔 | 〕 | 「 | 」 | 『 | 』 | 【 | 】 | ± | × | ÷ | ||||
5x | ≠ | ≦ | ≧ | ∞ | ∴ | ♂ | ♀ | ° | ℃ | ¢ | £ | § | ☆ | ★ | ○ | ● |
6x | ′ | ″ | ◎ | |||||||||||||
7x | ◇ | ◆ | □ | ■ | △ | ▲ | ▽ | ▼ | ※ | 〒 | → | ← | ↑ | ↓ |
Набор символов 0x2121 (плоскость 1, строка 1: зарезервирована для элементов управления)
[ редактировать ]В строке 1 плоскости 1, которая зарезервирована для управляющих кодов , символы не назначены . [1]
Набор символов 0x2122 (плоскость 1, строка 2: математические операторы)
[ редактировать ]Эта строка содержит математические операторы. EACC оставляет эту строку пустой. [14] В следующей таблице приведены ссылки на источники из Тайваня. [2] [10]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ∞ | + | − | ± | × | ⋅ | ÷ | ∕ | = | ≠ | ≡ | ≈ | ∼ | ∝ | < | |
3x | > | ≮ | ≯ | ≤ | ≥ | ≪ | ≫ | ∂ | ∫ | Д | ∆ | ∇ | ▫ | ∠ | ⊤ | ∥ |
4x | ≅ | ≞ | ∴ | ∃ | ∀ | ∪ | ∩ | ⊂ | ⊃ | ⇒ | ⇔ | ∋ | ∈ | ∉ | ∑ | ㏒ |
5x | ㏑ | ℯ | п | √ | ︕ | ⎸ | ⎹ | 〈 | 〉 | |||||||
6x | ||||||||||||||||
7x |
В следующей таблице приведены данные CCCII, предоставленные Гонконгской группой инновационных пользователей, группой библиотек Гонконга и размещенные на базе Университета Гонконга . [17] [9] В этой строке используется совершенно другой макет:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ∈ | ∋ | ⊆ | ⊇ | ⊂ | ⊃ | ∪ | ∩ | ∧ | ∨ | ¬ | ⇒ | ⇔ | ∀ | ∃ | |
3x | ∠ | ⊥ | ⌒ | ∂ | ∇ | ≡ | ≒ | ≪ | ≫ | √ | ∽ | ∝ | ∵ | ∫ | ∬ | |
4x | Ой | ‰ | ♯ | ♭ | ♪ | † | ‡ | ¶ | ◯ | |||||||
5x | ─ | │ | ┌ | ┐ | ┘ | └ | ├ | ┬ | ┤ | ┴ | ┼ | ━ | ┃ | ┏ | ┓ | ┛ |
6x | ┗ | ┣ | ┳ | ┫ | ┻ | ╋ | ┠ | ┯ | ┨ | ┷ | ┿ | ┝ | ┰ | ┥ | ┸ | ╂ |
7x |
Набор символов 0x2123 (плоскость 1, строка 3: римский и знаки препинания)
[ редактировать ]В эту строку входят знаки препинания, западные арабские цифры и римские буквы. [10] Сравните строку 3 кода Wansung и строку 3 GB 2312 .
Различные варианты по-разному кодируют идеографическое пространство (U+3000) по адресу 0x212320 (что подтверждает спецификация MARC), [8] [9] 0x212321 (который указан в стандарте ANSI и также подтвержден MARC), [8] [9] или 0x21635F. [10] EACC включает в этот набор только дефис-минус , круглые скобки и идеографическое пространство. [8]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ИДСП [а] | ! / ИДСП [б] | " | # | $ | % | & | ' | ( / ( | ) / ) | * | + | , | - / - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ↑ | _ |
6x | ` / ' | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ |
Набор символов 0x212A (плоскость 1, строка 10: внутренние символы IME и метка geta)
[ редактировать ]В EACC эта строка включает несколько символов, сопоставленных с областью частного использования , которые используются внутри для представления компонентов символов с помощью метода ввода RLIN . [18] который используется Библиотекой Конгресса для нелатинской каталогизации. [19] Эти составляющие символы должны использоваться только внутри IME и, если они встречаются где-либо еще, могут быть заменены знаком geta (U+3013). [18] который эта строка также включает в себя по адресу 0x212A46. Эта строка не назначена в CCCII, [1] но знак гета также указан в этом месте в некоторых сопоставлениях для CCCII. [10]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | � | � | � | � | � | � | � | � | � | � | � | � | � | � | ||
3x | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � | |
4x | � | � | � | � | � | � | 〓 | |||||||||
5x | ||||||||||||||||
6x | ||||||||||||||||
7x |
Набор символов 0x212B (плоскость 1, строка 11: знаки препинания)
[ редактировать ]В этой строке содержатся различные знаки препинания, используемые в китайском языке. [1] [8] помимо других символов. CCCII включает в себя набор из 35 знаков препинания в этой строке. [1] EACC включает в эту строку только 13 символов (показано в рамке ниже). [8]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ︵ | ︶ | ﹁ | ﹂ | 「 | 」 | ︳ | _ | ﹃ | ﹄ | 『 | 』 | ︴ | ﹏ | ︹ | |
3x | ︺ | 〔 / [ | 〕 / ] | 。 | ・ / . | 、 | ⋮ | ⋯ | , | ; | : | ? | ︱ | ! | ︲ | ︱ |
4x | ‘ | ’ | “ | ” | 《 | 》 | 【 | 】 | 〖 | 〗 | ||||||
5x | $ | ¢ | ₡ | £ | ¥ | ₨ | д. | с. | / | # | % | ⅌ | @ | ¶ | ® | |
6x | © | ℅ | & | § | † | ‡ | * | |||||||||
7x | ヽ | ヾ | ゝ | ゞ | а | 〒 |
Наборы символов 0x212C–0x212E (плоскость 1, строки 12–14: радикалы и порядковые номера)
[ редактировать ]В этих рядах содержатся китайские радикалы , [1] Римские цифры , [10] небесные стебли и земные ветви . [16]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ⼀ | ⼁ | ⼂ | ⼃ | ⼄ | ⼅ | ⼆ | ⼇ | ⼈ | ⼉ | ⼊ | ⼋ | ⼌ | |||
3x | ⼍ | ⼎ | ⼏ | ⼐ | ⼑ | ⼒ | ⼓ | ⼔ | ⼕ | ⼖ | ⼗ | ⼘ | ⼙ | ⼚ | ⼛ | ⼜ |
4x | ⼝ | ⼞ | ⼟ | ⼠ | ⼡ | ⼢ | ⼣ | ⼤ | ⼥ | ⼦ | ⼧ | ⼨ | ⼩ | ⼪ | ⼫ | |
5x | ⼬ | ⼭ | ⼮ | ⼯ | ⼰ | ⼱ | ⼲ | ⼳ | ⼴ | ⼵ | ⼶ | ⼷ | ⼸ | ⼹ | ⼺ | ⼻ |
6x | ⼼ | ⼽ | ⼾ | ⼿ | ⽀ | ⽁ | ⽂ | ⽃ | ⽄ | ⽅ | ⽆ | ⽇ | ⽈ | ⽉ | ⽊ | |
7x | ⽋ | ⽌ | ⽍ | ⽎ | ⽏ | ⽐ | ⽑ | ⽒ | ⽓ | ⽔ | ⽕ | ⽖ | ⽗ | ⽘ | ⽙ |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ⽚ | ⽛ | ⽜ | ⽝ | ⽞ | ⽟ | ⽠ | ⽡ | ⽢ | ⽣ | ⽤ | ⽥ | ⽦ | ⽧ | ||
3x | ⽨ | ⽩ | ⽪ | ⽫ | ⽬ | ⽭ | ⽮ | ⽯ | ⽰ | ⽱ | ⽲ | ⽳ | ⽴ | ⽵ | ⽶ | |
4x | ⽷ | ⽸ | ⽹ | ⽺ | ⽻ | ⽼ | ⽽ | ⽾ | ⽿ | ⾀ | ⾁ | ⾂ | ⾃ | ⾄ | ⾅ | ⾆ |
5x | ⾇ | ⾈ | ⾉ | ⾊ | ⾋ | ⾌ | ⾍ | ⾎ | ⾏ | ⾐ | ⾑ | ⾒ | ⾓ | речь / человек | ⾕ | |
6x | ⾖ | ⾗ | ⾘ | ⾙ | ⾚ | ⾛ | ⾜ | ⾝ | ⾞ | ⾟ | ⾠ | ⾡ | ⾢ | ⾣ | ⾤ | ⾥ |
7x | золото / чайник | ⾧ | ⾨ | ⾩ | ⾪ | ⾫ | ⾬ | ⾭ | ⾮ | ⾯ | ⾰ | ⾱ | ⾲ |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ⾳ | ⾴ | ⾵ | ⾶ | ⷷ / 飠 | ⾸ | ⾹ | ⾺ | ⾻ | ⾼ | ⾽ | ⾾ | ⾿ | ⿀ | ||
3x | ⿁ | ⿂ | ⿃ | ⿄ | ⿅ | ⿆ | ⿇ | ⿈ | ⿉ | ⿊ | ⿋ | ⿌ | ⿍ | |||
4x | ⿎ | ⿏ | ⿐ | ⿑ | ⿒ | ⿓ | ⿔ | ⿕ | ||||||||
5x | Первый | Второй | С | Мужчина | Э | себя | Гэн | Пряный | девятый из десяти Небесных Стволов | Гуй | ||||||
6x | ребенок | уродливый | Инь | Мао | Чен | Си | полдень | еще нет | состояние | унитарный | Сюй | Хай | ||||
7x | Ⅰ | Ⅱ | Ⅲ | Ⅳ | Ⅴ | Ⅵ | Ⅶ | Ⅷ | Ⅸ | Ⅹ | Ⅺ | Ⅻ |
Набор символов 0x212F (плоскость 1, строка 15: китайские цифры и бопомофо)
[ редактировать ]В эту строку входят китайские цифры и символы бопомофо . [1] EACC включает только идеографический ноль (〇). [8]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | 〡 | 〢 | 〣 | 〤 | 〥 | 〦 | 〧 | 〨 | 〩 | 〸 | 〹 | 〺 | ||||
3x | 〇 | один | два | три | Четыре | пять | шесть | Семь | восемь | Девять | десять | сто | тысяча | Десять тысяч | ||
4x | ноль | один | два | женьшень | Четыре | Ву | земля | Семь | восемь | Джиу | подобрать | сто | тысяча | Десять тысяч | 100 миллионов | |
5x | ˊ | ˇ | ˋ | ˙ / ﹒ [с] | ㄅ | ㄆ | ㄇ | ㄈ | ㄉ | ㄊ | ㄋ | ㄌ | ㄍ | ㄎ | ㄏ | ㄐ |
6x | ㄑ | ㄒ | ㄓ | ㄔ | ㄕ | ㄖ | ㄗ | ㄘ | ㄙ | ㄚ | ㄛ | ㄜ | ㄝ | ㄞ | ㄟ | ㄠ |
7x | ㄡ | ㄢ | ㄣ | ㄤ | ㄥ | ㄦ | ㄧ | ㄨ | ㄩ | ты |
Набор символов 0x272B (плоскость 7, строка 11: контрольная метка)
[ редактировать ]Эта строка содержит контрольный знак ( комэ дзируши ). [10]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
6x | ※ |
Набор символов 0x272E–0x272F (плоскость 7, строки 14–15: альтернативный бопомофо)
[ редактировать ]Вариант, используемый библиотеками Гонконга, не включает символы бопомофо в строку 15 плоскости 1, но включает их в другом макете в плоскости 7. [9]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
7x | ㄅ | ㄆ | ㄇ | ㄈ | ㄉ | ㄊ | ㄋ | ㄌ | ㄍ | ㄎ |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ㄏ | ㄐ | ㄑ | ㄒ | ㄓ | ㄔ | ㄕ | ㄖ | ㄗ | ㄘ | ㄙ | ㄚ | ㄛ | ㄜ | ㄝ | |
3x | ㄞ | ㄟ | ㄠ | ㄡ | ㄢ | ㄣ | ㄤ | ㄥ | ㄦ | ㄧ | ㄨ | ㄩ |
Набор символов 0x6921 (плоскость 73, строка 1: японская пунктуация)
[ редактировать ]Эта строка находится в плоскости 73, первой плоскости слоя 13, который содержит символы, включенные для поддержки японского языка . [13] Он содержит знаки препинания. [8] Сравните строку 1 из JIS X 0208 , где эта строка имеет тенденцию повторять расположение включенных в нее символов.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ・ | |||||||||||||||
3x | каждый | 〆 | ー | |||||||||||||
4x | ||||||||||||||||
5x | 〈 | 〉 | 《 | 》 | ||||||||||||
6x | ||||||||||||||||
7x |
Набор символов 0x6924 (плоскость 73, строка 4: хирагана)
[ редактировать ]Эта строка содержит хирагану . Сравните строку 4 стандарта JIS X 0208 .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ах | а | я | желудок | Эм-м-м | баклан | Эх | картина | Ой | ой | комар | но | дерево | Ги | Ку | |
3x | ингредиент | волосы | Ге | ребенок | Идти | разница | ざ | смерть | характер | уксус | фигура | высота | Зе | Так | Ух ты | Та |
4x | является | Чи | Ди | Ух ты | Один | цу | рука | в | и | степень | На | к | Ню | привет | из | зубы |
5x | Ба | Па | огонь | Красота | Пи | долг | Бу | Пу | пердеть | Быть | Пе | Хо | Бо | По | Ма | фрукты |
6x | ничего | глаз | слишком | Ага | или | ты | горячая вода | Йо | Йо | и другие | закон природы | Ру | Ре | реактор | ゎ | круг |
7x | ゐ | Э | из | ага |
Набор символов 0x6925 (плоскость 73, строка 5: катакана)
[ редактировать ]В этой строке содержится катакана . Сравните строку 5 JIS X 0208 , которой соответствует эта строка, не считая добавления отдельных дакутен и хандакутен .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | А | а | я | желудок | ты | баклан | Э | рабочий | Ой | О | комар | Га | дерево | Ги | девять | |
3x | Группа | Ке | Игра | Ко | Идти | са | ザ | С | Джи | уксус | З | Се | Зе | Так | Зо | Та |
4x | да | кровь | も | Ух ты | цу | ㅅ | Те | де | к | де | На | Д | Ню | Не | из | Ха |
5x | Ба | год | Привет | Би | Пи | центр | Бу | П | Ф | Быть | Пе | Хо | Бо | По | Ма | Ми |
6x | Му | Почта | Мо | Ча | Да | ты | Ю | йоу | Йо | Ла | Ли | ле | Ре | Б | ヮ | Ва |
7x | ヰ | ヱ | горе | хм | В | Ка | га | ◌゙ / ゛ | ◌゚ / ゜ |
Набор символов 0x6F24–0x6F25 (плоскость 79, строки 4–5: джамо)
[ редактировать ]Эти строки содержат корейский джамо .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
5x | идти | ты | делать | ㄹ | могила | сто | корова | одеяло | триллион | |||||||
6x | поздравляю | ржу не могу | рамка | кровь | он | цветок | снова | пердеть | ||||||||
7x | ㅆ | хромой | все | ага | привет | да | к | женщина | ㅗ | ㅘ | одеяло |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | рыдать | ㅠ | ㅡ | ㅢ | зуб |
Набор символов 0x6F76 (плоскость 79, строка 86: архаичный хангыль)
[ редактировать ]В этой строке содержатся несколько исторических символов хангыля , которые больше не используются регулярно. Некоторые из них привязаны к Зоне частного использования . [18]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x | ㆁ | ㆆ | ㅿ | � | точка | |||||||||||
3x | ||||||||||||||||
4x | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � |
5x | � | � | � | � | � | � | � | � | ||||||||
6x | ||||||||||||||||
7x |
Набор символов 0x7B25 (плоскость 91, строка 5: дополнительная катакана)
[ редактировать ]В этом ряду находится дополнительная катакана, используемая для написания иностранных фонем. [10]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
7x | ヷ | ヸ | ヹ |
См. также
[ редактировать ]Сноски
[ редактировать ]- ^ За пределами диапазона конечных байтов ISO 2022 94. н установлен, но отмечен как используемый в некоторых реализациях. [8]
- ^ Кодирование идеографического пространства, указанное в стандарте ANSI для EACC. [8] В CCCII используется как восклицательный знак. [10] в дополнение к восклицательному знаку по адресу 0x212B3D. [16] Гонконгский вариант HKIUG CCCII здесь следует за EACC. [9]
- ^ В сопоставлениях Encode::HanExtra для этого символа используется U+FE52. [10] Однако здесь после ˊ, ˇ и ˋ появляется [16] какие остальные три тона обозначают бопомофо . Отображение U+02D9 чаще используется для этого тона в диапазонах кодировок bopomofo, например Big5 . [20]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час я дж к л м н тот п д р с Лунде, Кен (2009). Обработка информации CJKV: китайские, японские, корейские и вьетнамские вычисления (2-е изд.). Севастополь, Калифорния : О'Рейли . стр. 122–124. ISBN 978-0-596-51447-1 .
- ^ Перейти обратно: а б с Тан, Одри (10 ноября 2007 г.). «Encode::HanExtra — Дополнительные наборы китайских кодировок» .
CCCII: Самая ранняя (и самая сложная) традиционная китайская кодировка... используемая в основном в библиотечных системах... Карта для "CCCII" предоставлена тайваньским проектом Koha .
- ^ Перейти обратно: а б с д Виттерн, Кристиан (1 мая 1995 г.). «Китайские коды символов: обновление» . Международный научно-исследовательский институт дзен-буддизма / Университет Ханазоно . Архивировано из оригинала 12 октября 2004 г.
- ^ Перейти обратно: а б с Дженкинс, Джон Х.; Кук, Ричард; Лунде, Кен (05 марта 2020 г.). «База данных Unicode Han (Unihan)» . Стандартное приложение Юникод № 38.
- ^ «Архивная копия» . Архивировано из оригинала 15 июня 2016 г. Проверено 15 июня 2016 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка ) - ^ Перейти обратно: а б с «Приложение E: История объединения Хань» (PDF) . Стандарт Unicode версии 15.0 – Основная спецификация . Консорциум Юникод . 2022.
- ^ Словарь Канси , стр. 1296, чар. 1
- ^ Перейти обратно: а б с д и ж г час я дж Библиотека Конгресса (5 декабря 2007 г.). «Кодовая таблица знаков препинания Восточной Азии» . MARC 21 Спецификации для структуры записи, наборов символов и носителей обмена .
- ^ Перейти обратно: а б с д и ж г час я дж к л м н тот п д Рабочая группа по Unicode Гонконгской группы инновационных пользователей. «Кодовая таблица HKIUG для символов CJK: сопоставление с Unicode» . Библиотеки Гонконгского университета .
- ^ Перейти обратно: а б с д и ж г час я дж к л м н тот п д р с т в v В Тан, Одри; Коха Тайвань. «Карта для CCCII» . Кодировать::HanExtra . КПАН .
- ^ «2.4: Многобайтовые наборы графических символов». Международный реестр наборов кодированных символов, которые будут использоваться с escape-последовательностями (ISO-IR) (PDF) . ITSCJ/ IPSJ . п. 14.
- ^ Библиотека Конгресса (05 декабря 2007 г.). «Техника 2: Использование стандартных альтернативных наборов графических символов» . MARC 21 Спецификации для структуры записи, наборов символов и носителей обмена .
- ^ Перейти обратно: а б с Лунде, Кен (18 декабря 1995 г.). «2.5.2: CCCII». CJK.INF Версия 1.9 .
- ^ Перейти обратно: а б с д и ж г час я дж к л Библиотека Конгресса (5 декабря 2007 г.). «Кодовые таблицы Восточной Азии» . MARC 21 Спецификации для структуры записи, наборов символов и носителей обмена .
- ^ Библиотека Конгресса (5 декабря 2007 г.). «Кодовая таблица корейского хангыля» . MARC 21 Спецификации для структуры записи, наборов символов и носителей обмена .
- ^ Перейти обратно: а б с д и ж г час я дж Показанные символы частично сопоставлены с репрезентативным шрифтом BDF для CCCII, распространяемым Коичи Ясуокой из Киотского университета.
- ^ Гонконгская группа инновационных пользователей (07.01.2013). «Знакомство с группой инновационных пользователей Гонконга» . Библиотеки Гонконгского университета .
- ^ Перейти обратно: а б с Библиотека Конгресса (2 сентября 2004 г.). «Сводный список символов MARC 21, назначенных области частного использования (PUA)» . MARC 21 Спецификации для структуры записи, наборов символов и носителей обмена .
- ^ Моррис, Сьюзен (2007). «В поисках ДЖЕКФИ: онлайн-каталог, включающий арабский, иврит и другие алфавиты» . Информационный бюллетень Библиотеки Конгресса . Том. 66, нет. 12.
- ^ ван Кестерен, Энн. «большая пятёрка» . Стандарт кодирования . ЧТОРГ .
- Некоторая информация на этой странице основана на информации на официальном сайте CNS .
Внешние ссылки
[ редактировать ]- Официальный веб-сайт CNS 11643 (доступна английская версия страниц) содержит информацию о наборе символов CCCII в разделе «Китайский информационный код».
- Полное сопоставление EACC с Unicode из Библиотеки Конгресса.