Персонажи CJK
В интернационализации символы CJK — это собирательный термин для графем, используемых в китайской , японской и корейской системах письма , каждая из которых включает китайские иероглифы . Термин CJKV также включает Chữ Nôm письмо китайского происхождения, , логографическое ранее использовавшееся для вьетнамского языка .
Репертуар персонажей
[ редактировать ]Стандартный китайский и стандартный кантонский диалект написаны почти исключительно китайскими иероглифами. требуется более 3000 символов Для общей грамотности , а для достаточно полного охвата — до 40 000 символов. В японском языке используется меньше символов: общая грамотность японского языка может составлять 2136 символов. Использование китайских иероглифов в Корее становится все более редким, хотя своеобразное использование китайских иероглифов в именах собственных требует знания (и, следовательно, наличия) гораздо большего количества символов. Однако даже сегодня южнокорейские студенты изучают 1800 иероглифов .
Другие алфавиты, используемые для этих языков, такие как бопомофо и латиницы на основе пиньинь для китайского языка, хирагана и катакана для японского языка и хангыль для корейского языка, не являются строго «символами CJK», хотя наборы символов CJK почти всегда включают их по мере необходимости для полного использования. охват целевых языков.
Синолог Карл Лебан (1971) провел ранний обзор систем кодирования CJK.
До начала 20 века классический китайский был письменным языком правительства и науки во Вьетнаме. Популярная литература на вьетнамском языке была написана шрифтом Тё Ном , состоящим из китайских иероглифов, многие из которых были созданы на местном уровне. С 1920-х годов для записи литературы использовался вьетнамский алфавит на основе латиницы . [ 1 ] [ 2 ]
Кодирование
[ редактировать ]Количество символов, необходимое для полного покрытия потребностей всех этих языков, не может уместиться в 256-символьном кодовом пространстве 8-битных кодировок символов , поэтому требуется как минимум 16-битная кодировка фиксированной ширины или многобайтовые кодировки переменной длины. 16-битные кодировки с фиксированной шириной, такие как кодировки от Unicode до версии 2.0 включительно, теперь устарели из-за требования кодировать больше символов, чем может вместить 16-битная кодировка — Unicode 5.0 содержит около 70 000 символов Han — и требование правительства Китая о том, чтобы программное обеспечение в Китае поддерживало набор символов GB 18030 .
Хотя кодировки CJK имеют общие наборы символов, кодировки, часто используемые для их представления, были разработаны отдельно правительствами разных стран Восточной Азии и компаниями-разработчиками программного обеспечения и несовместимы друг с другом. Unicode попыталась, хотя и с некоторыми противоречиями, унифицировать наборы символов в процессе, известном как унификация Хань .
Кодировки символов CJK должны состоять как минимум из символов хань плюс фонетические сценарии, специфичные для языка, такие как пиньинь , бопомофо , хирагана, катакана и хангыль. [ 3 ]
Кодировки символов CJK включают:
- Big5 (наиболее распространенная кодировка до внедрения Unicode)
- 322
- CNS 11643 (официальный стандарт Китайской Республики )
- EUC-JP
- EUC-КР
- GB 2312 (подмножество и предшественник GB 18030)
- GB 18030 (стандарт, утвержденный в Китайской Народной Республике )
- Набор символов Гига (GCS)
- ИСО 2022-ЯП
- КС С 5861
- Shift-JIS
- ТРОН
- Юникод
Наборы символов CJK занимают большую часть отведенного кодового пространства Юникода . Среди японских экспертов по китайским иероглифам существует много разногласий по поводу желательности и технической ценности процесса объединения хань , используемого для сопоставления нескольких наборов китайских и японских символов в единый набор унифицированных символов. [ нужна ссылка ]
На всех трех языках можно писать как слева направо, так и сверху вниз (справа налево и сверху вниз в древних документах), но при обсуждении проблем кодирования их обычно рассматривают как сценарии с письмом слева направо.
Юридический статус
[ редактировать ]Библиотеки сотрудничали в разработке стандартов кодирования символов JACKPHY в начале 1980-х годов. По словам Кена Лунде , аббревиатура «CJK» была зарегистрированной торговой маркой Research Libraries Group. [ 4 ] (которая объединилась с OCLC в 2006 году). Срок действия товарного знака, принадлежавшего OCLC в период с 1987 по 2009 год, истек. [ 5 ]
См. также
[ редактировать ]- Языки описания китайских иероглифов
- Кодировка китайских символов
- Китайские методы ввода для компьютеров
- Иероглифы совместимости CJK
- Штрихи китайских иероглифов
- Единые иероглифы CJK
- Языки сложной текстовой компоновки (CTL)
- Редактор метода ввода
- Японский язык и компьютеры
- Корейский язык и компьютеры
- Список шрифтов CJK
- Синоксеник
- Кодирование переменной ширины
- Вьетнамский язык и компьютеры
Ссылки
[ редактировать ]- ^ Коулмас (1991) , стр. 113–115.
- ^ ДеФрэнсис (1977) .
- ^ Эта статья основана на материалах, взятых из CJK в Бесплатном онлайн-словаре вычислительной техники до 1 ноября 2008 г. и включенных в соответствии с условиями «повторного лицензирования» GFDL версии 1.3 или более поздней.
- ^ Кен Лунде, 1996
- ^ Список Юстии
Цитируемые работы
[ редактировать ]- Коулмас, Флориан (1991). Письменные системы мира . Блэквелл. ISBN 978-0-631-18028-9 .
- ДеФрэнсис, Джон (1977). Колониализм и языковая политика во Вьетнаме . Гаага: Мутон. ISBN 978-90-279-7643-7 .
Источники
[ редактировать ]- ДеФрэнсис, Джон . Китайский язык: факты и фантазии . Гонолулу: Гавайский университет Press, 1990. ISBN 0-8248-1068-6 .
- Ханнас, Уильям К. Орфографическая дилемма Азии . Гонолулу: Издательство Гавайского университета, 1997. ISBN 0-8248-1892-X (мягкая обложка); ISBN 0-8248-1842-3 (твердый переплет).
- Лемберг, Вернер: Пакет CJK для LATEX2ε — многоязычная поддержка за пределами Babel. TUGboat, Том 18 (1997), № 3 – Материалы ежегодного собрания 1997 года.
- Лебан, Карл. Автоматизированные орфографические системы для восточноазиатских языков (китайский, японский, корейский) , современный отчет, подготовленный для совета директоров Ассоциации азиатских исследований. 1971.
- Лунде, Кен . Обработка информации CJKV . Севастополь, Калифорния: O'Reilly & Associates, 1998. ISBN 1-56592-224-7 .