ДЖИС Х 0212
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Март 2018 г. ) |
Язык(и) | Предназначен для использования вместе с JIS X 0208 для поддержки Японии . Сам по себе практически не поддерживает какой-либо язык. |
---|---|
Стандартный | ДЖИС Х 0212:1990 |
Текущий статус | Унихан Источник . Сам набор кодированных символов не так широко поддерживается, как JIS X 0208 , но иногда используется в EUC-JP . [1] |
Классификация |
|
Расширения |
|
Форматы кодирования | |
Преемник | ДЖИС Х 0213 |
Другая связанная кодировка(и) | Предназначен для дополнения: JIS X 0208. Другие дополнительные DBC CJK ISO 2022: KS X 1002. |
JIS X 0212 — это японский промышленный стандарт, определяющий набор кодированных символов для кодирования дополнительных символов для использования в японском языке. Этот стандарт предназначен для дополнения JIS X 0208 (кодовая страница 952). имеет номер 953 или 5049 Кодовая страница IBM (см. ниже).
Это один из исходных стандартов для унифицированных иероглифов CJK Unicode .
История
[ редактировать ]В 1990 году Японская ассоциация по стандартизации (JSA) выпустила дополнительный стандарт набора символов: JIS X 0212-1990 Код дополнительного набора японских графических символов для обмена информацией ( 情報交換用漢字符号-補助漢字 , Jōhō Kōkan'yō Kanji Fugō - Hojo). Кандзи ) . Целью этого стандарта было расширение диапазона символов, доступных в основном наборе символов JIS X 0208 , а также устранение недостатков в охвате этого набора.
Функции
[ редактировать ]В стандарте указано 6067 символов, включая:
- 21 греческий символ с диакритическими знаками.
- 26 восточноевропейских символов с диакритическими знаками (в основном кириллица).
- 198 буквенных символов с диакритическими знаками.
- 5801 кандзи
Кодировки
[ редактировать ]Следующие кодировки или инкапсуляции используются для использования символов JIS X 0212 в файлах и т. д.
- в EUC-JP символы представлены тремя байтами, первый из которых — 0x8F, а следующие два — в диапазоне 0xA1 — 0xFE.
- в некоторых реализациях ISO 2022 на основе кодировки JIS , включая ISO-2022-JP-EXT , ISO-2022-JP-1 и ISO-2022-JP-2 , последовательность «ESC $ (D» используется для обозначения JIS). Х 0212 символов.
Инкапсуляция символов JIS X 0212 в популярной кодировке Shift JIS невозможна, поскольку Shift JIS не имеет достаточного нераспределенного кодового пространства для символов.
Реализации
[ редактировать ]JIS X 0212 называется кодовой страницей 953 и включает расширения поставщиков. IBM [2] [3] [4] Альтернативный CCSID 5049 исключает эти расширения. [5]
Поскольку символы JIS X 0212 не могут быть закодированы в Shift JIS, системе кодирования, которая традиционно доминировала в японской обработке информации, практических реализаций этого набора символов было мало. Как упоминалось выше, его можно закодировать в EUC-JP, который обычно используется в системах Unix/Linux, и именно здесь произошло большинство реализаций:
- в начале 1990-х базовые шрифты «BDF» были скомпилированы для использования в системе Unix X Window ;
- для системы WNN скомпилирован файл преобразования IME;
- консольное оконное приложение kterm было расширено для его поддержки;
- редакторы Emacs jstevie и . были расширены для его поддержки
Многие WWW-браузеры, такие как семейство Netscape/Mozilla/ Firefox , Opera и т. д., а также связанные с ними приложения, такие как Mozilla Thunderbird, поддерживают отображение символов JIS X 0212 в кодировке EUC-JP, однако Internet Explorer не поддерживает символы JIS X 0212. Современные пакеты эмуляции терминала, такие как GNOME Terminal, также поддерживают символы JIS X 0212.
Приложения, поддерживающие JIS X 0212 в кодировке EUC, включают:
- программа -словарь xjdic для Unix/Linux;
- сервер японских словарей WWWJDIC (однако, поскольку Internet Explorer не поддерживает расширения JIS X 0212 в EUC, этот сервер отправляет растровую графику для этих символов, если он установлен в режиме EUC-JP.)
JIS X 0212 и Юникод
[ редактировать ]Кандзи в JIS X 0212 были взяты в качестве одного из источников для унификации Хань , которая привела к унифицированному набору символов CJK в исходном стандарте ISO 10646 / Unicode . Были включены все 5801 кандзи.
Будущее
[ редактировать ]Если не считать упомянутых выше приложений, стандарт JIS X 0212 фактически мертв. 2743 кандзи из него были включены в более поздний стандарт JIS X 0213 . В долгосрочной перспективе его вкладом, вероятно, станет 5801 кандзи, включенный в Unicode .
См. также
[ редактировать ]Ссылки
[ редактировать ]- JIS X 0212-1990 情報交換用漢字符号―補助漢字, 日本規格協会, 東京 (1990年10月1日制定).ДЖИС
- Понимание японской обработки информации, Кен Лунде, О'Рейли и доц. 1993 год
- CJKV Information Processing, Кен Лунде, О'Рейли и доц. 1999, 2008.
- ^ ван Кестерен, Энн . «5. Индексы (§ Индекс jis0212)» . Стандарт кодирования . ЧТОРГ .
- ^ «Информационный документ с кодовой страницей 953» . Архивировано из оригинала 17 марта 2016 г.
- ^ «Информационный документ CCSID 953» . Архивировано из оригинала 28 марта 2016 г.
- ^ Кодовая страница CPGID 00953 (pdf) (PDF) , IBM
- ^ «Информационный документ CCSID 5049» . Архивировано из оригинала 27 марта 2016 г.