Кодовая страница 936 (Microsoft Windows)
МИМ / IANA | ГБК |
---|---|
Язык(и) | В основном используется для упрощенного китайского языка , но также поддерживает традиционный китайский , японский , английский , русский и (частично) греческий . |
Классификация | GBK Вариант , расширенный ASCII , [а] кодировка переменной ширины , кодировка CJK |
Расширяет | EUC-CN |
На основе | ГБК (ГБ 13000.1-93 приложение) |
Преемник | Кодовая страница 54936 ( GB 18030 ) |
| |
Кодовая страница Windows 936 (сокращенно MS936 , Windows-936 или ( неоднозначно ) CP936 ), [1] — это Microsoft устаревшая (до Unicode ) кодировка символов , предназначенная для представления упрощенного текста на китайском языке на компьютерах . Это одна из четырех DBCS Windows для восточноазиатских языков , сопровождающая кодовые страницы 932 ( японский ), 949 ( корейский ) и 950 ( традиционный китайский ). Это вариант кодировки материкового Китая Guójiā Biāozhīn Kuòzhǎn (GBK) и примерно соответствует кодовой странице IBM 1386 ( CP1386 или IBM-1386 ).
История
[ редактировать ]Первоначально Windows-936 охватывала 2312 ГБ (в форме EUC-CN она была расширена и теперь охватывает большую часть ГБК ), но с выпуском Windows 95 . Знак евро (€), не определенный в GBK, кодируется как 0x80 в Windows-936 и IBM-1386. С другой стороны, 95 символов, определенные в GBK 1.0, изначально не были закодированы в Windows-936. Эта проблема частично решена в более поздних версиях Windows, и, как и в Windows 7, все символы GBK, не входящие в область частного использования Unicode BMP, могут отображаться с использованием кодовой страницы 936, но кодирование 95 символов по-прежнему не поддерживается по состоянию на 2014 год. [update].
Кодовая страница Windows 936 была заменена кодовой страницей 54936 ( GB 18030 ), но с 2014 г. [update] все еще широко использовался. Консоль Windows использует кодовую страницу 936 в качестве кодовой страницы по умолчанию для упрощенных китайских установок, хотя часть GB 18030 была сделана обязательной для всех программных продуктов, продаваемых в Китае. В 2002 году интернет-имя IANA GBK было зарегистрировано в сопоставлении Windows-936. [2] [3] что делает его де-факто определением ГБК в Интернете.
Терминология
[ редактировать ]Название «кодовая страница 936» неоднозначно. Кодовая страница IBM 936 , [4] , устаревшая кодировка IBM 5550 , также является кодировкой упрощенного китайского языка, но использует другой метод кодирования для GB 2312 ( Shift GB ), и поэтому совершенно несовместима с кодовой страницей Windows 936 (в отличие от кодовой страницы IBM 932, которая, по первое приближение, [а] подмножество кодовой страницы Windows 932 ) — хотя International Components for Unicode не включает кодек IBM-936 и использует кодовую страницу Windows для cp936
этикетка. [1] Кодовой страницей IBM для покрытия GBK является кодовая страница 1386, которая определяется как комбинация однобайтовой кодовой страницы 1114 и двухбайтовой кодовой страницы 1385 . [5]
Понятия «Windows-936», «GBK», «GB2312» и «EUC-CN» иногда объединяют в различных программных продуктах. EUC-CN зарегистрирован в IANA как GB2312
, хотя это особый с переменной шириной 8-битный без сохранения состояния формат кодирования GB 2312 (который также имеет другие, менее широко используемые форматы кодирования, такие как HZ-GB-2312 , ISO-2022-CN или вышеупомянутый Shift GB). ).
Поскольку GBK является надмножеством EUC-CN (хотя сам по себе он не является кодом EUC) и заменил GB 2312 , а программное обеспечение Microsoft продолжает назначать код давно GB2312
метка кодирования на кодовую страницу 936 даже после ее расширения для реализации GBK, а не EUC-CN, большинство современных программных продуктов на базе Windows означают частичную поддержку GBK через Windows-936, а не EUC-CN или другие форматы кодирования GB 2312. , когда они используют термин «GB 2312» в качестве варианта кодировки символов. Это можно наблюдать в таких продуктах, как Microsoft Internet Explorer и Notepad++.
Сноски
[ редактировать ]- ^ Если замены вариантов символов с 1983 года . игнорируются
Ссылки
[ редактировать ]- ^ Перейти обратно: а б «windows-936-2000 (псевдоним cp936)» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode.
- ^ «Наборы символов» . Проверено 3 октября 2016 г.
- ^ Заявление о регистрации кодировки IANA для GBK
- ^ «Идентификаторы кодированных наборов символов — CCSID 936» . IBM Глобализация . ИБМ. Архивировано из оригинала 1 декабря 2014 г.
- ^ «Идентификаторы кодированных наборов символов — CCSID 1386» . ИБМ. Архивировано из оригинала 29 ноября 2014 г.
Внешние ссылки
[ редактировать ]Windows-936:
- Справочник Microsoft для Windows-936
- Файл кодовой страницы для Windows-936
- Сопоставление Windows-936 с Unicode
- Демонстрация Windows-936 в отделении интенсивной терапии
- Международные компоненты для Unicode (ICU), windows-936-2000.ucm
ИБМ-1386: