Jump to content

ДЖИС Х 0212

(Перенаправлено с кодовой страницы 953 )
ДЖИС Х 0212
Язык(и) Предназначен для использования вместе с JIS X 0208 для поддержки Японии . Сам по себе практически не поддерживает какой-либо язык.
Стандартный ДЖИС Х 0212:1990
Текущий статус Унихан Источник . Сам набор кодированных символов не так широко поддерживается, как JIS X 0208 , но иногда используется в EUC-JP . [1]
Классификация
Расширения
  • Кодовая страница IBM 953
  • Расширения OSF
  • JIS X 0212/0213 2 Гибридный самолет
Форматы кодирования
Преемник ДЖИС Х 0213
Другая связанная кодировка(и) Предназначен для дополнения: JIS X 0208.
Другие дополнительные DBC CJK ISO 2022: KS X 1002.

JIS X 0212 — это японский промышленный стандарт, определяющий набор кодированных символов для кодирования дополнительных символов для использования в японском языке. Этот стандарт предназначен для дополнения JIS X 0208 (кодовая страница 952). имеет номер 953 или 5049 Кодовая страница IBM (см. ниже).

Это один из исходных стандартов для унифицированных иероглифов CJK Unicode .

В 1990 году Японская ассоциация по стандартизации (JSA) выпустила дополнительный стандарт набора символов: JIS X 0212-1990 Код дополнительного набора японских графических символов для обмена информацией ( 情報交換用漢字符号-補助漢字 , Jōhō Kōkan'yō Kanji Fugō - Hojo). Кандзи ) . Целью этого стандарта было расширение диапазона символов, доступных в основном наборе символов JIS X 0208 , а также устранение недостатков в охвате этого набора.

Диаграмма Эйлера, сравнивающая репертуары JIS X 0208 , JIS X 0212, JIS X 0213 , Windows-31J , стандартного репертуара Microsoft и Unicode .

В стандарте указано 6067 символов, включая:

  • 21 греческий символ с диакритическими знаками.
  • 26 восточноевропейских символов с диакритическими знаками (в основном кириллица).
  • 198 буквенных символов с диакритическими знаками.
  • 5801 кандзи

Кодировки

[ редактировать ]

Следующие кодировки или инкапсуляции используются для использования символов JIS X 0212 в файлах и т. д.

  • в EUC-JP символы представлены тремя байтами, первый из которых — 0x8F, а следующие два — в диапазоне 0xA1 — 0xFE.
  • в некоторых реализациях ISO 2022 на основе кодировки JIS , включая ISO-2022-JP-EXT , ISO-2022-JP-1 и ISO-2022-JP-2 , последовательность «ESC $ (D» используется для обозначения JIS). Х 0212 символов.

Инкапсуляция символов JIS X 0212 в популярной кодировке Shift JIS невозможна, поскольку Shift JIS не имеет достаточного нераспределенного кодового пространства для символов.

Реализации

[ редактировать ]
EUC-JP использует первый байт 0x8F, за которым следуют два байта 0xA1–FE для JIS X 0212.
Кодовая страница Windows 20932 использует первый байт в 0xA1–FE, за которым следует байт в 0x21–FE для JIS X 0212.
Кодировка JIS X 0212 в соответствии с EUC-JP (слева) и кодовой страницей Windows 20932 (справа).

JIS X 0212 называется кодовой страницей 953 и включает расширения поставщиков. IBM [2] [3] [4] Альтернативный CCSID 5049 исключает эти расширения. [5]

Поскольку символы JIS X 0212 не могут быть закодированы в Shift JIS, системе кодирования, которая традиционно доминировала в японской обработке информации, практических реализаций этого набора символов было мало. Как упоминалось выше, его можно закодировать в EUC-JP, который обычно используется в системах Unix/Linux, и именно здесь произошло большинство реализаций:

  • в начале 1990-х базовые шрифты «BDF» были скомпилированы для использования в системе Unix X Window ;
  • для системы WNN скомпилирован файл преобразования IME;
  • консольное оконное приложение kterm было расширено для его поддержки;
  • редакторы Emacs jstevie и . были расширены для его поддержки

Многие WWW-браузеры, такие как семейство Netscape/Mozilla/ Firefox , Opera и т. д., а также связанные с ними приложения, такие как Mozilla Thunderbird, поддерживают отображение символов JIS X 0212 в кодировке EUC-JP, однако Internet Explorer не поддерживает символы JIS X 0212. Современные пакеты эмуляции терминала, такие как GNOME Terminal, также поддерживают символы JIS X 0212.

Приложения, поддерживающие JIS X 0212 в кодировке EUC, включают:

JIS X 0212 и Юникод

[ редактировать ]

Кандзи в JIS X 0212 были взяты в качестве одного из источников для унификации Хань , которая привела к унифицированному набору символов CJK в исходном стандарте ISO 10646 / Unicode . Были включены все 5801 кандзи.

Если не считать упомянутых выше приложений, стандарт JIS X 0212 фактически мертв. 2743 кандзи из него были включены в более поздний стандарт JIS X 0213 . В долгосрочной перспективе его вкладом, вероятно, станет 5801 кандзи, включенный в Unicode .

См. также

[ редактировать ]
  • JIS X 0212-1990 情報交換用漢字符号―補助漢字, 日本規格協会, 東京 (1990年10月1日制定).ДЖИС
  • Понимание японской обработки информации, Кен Лунде, О'Рейли и доц. 1993 год
  • CJKV Information Processing, Кен Лунде, О'Рейли и доц. 1999, 2008.
  1. ^ ван Кестерен, Энн . «5. Индексы (§ Индекс jis0212)» . Стандарт кодирования . ЧТОРГ .
  2. ^ «Информационный документ с кодовой страницей 953» . Архивировано из оригинала 17 марта 2016 г.
  3. ^ «Информационный документ CCSID 953» . Архивировано из оригинала 28 марта 2016 г.
  4. ^ Кодовая страница CPGID 00953 (pdf) (PDF) , IBM
  5. ^ «Информационный документ CCSID 5049» . Архивировано из оригинала 27 марта 2016 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4c395a018d72cd02c87002639a957ad1__1703251920
URL1:https://arc.ask3.ru/arc/aa/4c/d1/4c395a018d72cd02c87002639a957ad1.html
Заголовок, (Title) документа по адресу, URL1:
JIS X 0212 - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)