~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 8571356FCF73207AEDD99397F1B4A9A1__1709170320 ✰
Заголовок документа оригинал.:
✰ Code page 936 (IBM) - Wikipedia ✰
Заголовок документа перевод.:
✰ Кодовая страница 936 (IBM) — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Code_page_936_(IBM) ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/85/a1/8571356fcf73207aedd99397f1b4a9a1.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/85/a1/8571356fcf73207aedd99397f1b4a9a1__translat.html ✰
Дата и время сохранения документа:
✰ 15.06.2024 21:49:20 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 29 February 2024, at 04:32 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Кодовая страница 936 (IBM) — Википедия Jump to content

Кодовая страница 936 (IBM)

Из Википедии, бесплатной энциклопедии
ИБМ-936
Псевдоним(а) SHIFTGB [1]
Язык(и) Упрощенный китайский
Сделано ИБМ
Текущее состояние Устарело
Преобразует/кодирует ГБ 2312
Преемник ИБМ-1381
Другая связанная кодировка(и) Сдвиг HE

Кодовая страница IBM 936 — это кодировка символов упрощенного китайского языка, включающая 1880 определяемых пользователем символов (UDC), которая была заменена в 1993 году. Это комбинация однобайтовой кодовой страницы 903 и двухбайтовой кодовой страницы 928 . [2] [3] Кодовая страница 946 использует тот же двухбайтовый компонент, но расширенный однобайтовый компонент ( Кодовая страница 1042 ). [2] [4]

Кодовую страницу IBM 936 не следует путать с кодовой страницей Windows с идентичным номером , которая является вариантом кодировки GBK ; [2] называет GBK кодовой страницей 1386 IBM . В то время как GBK является расширенным набором EUC-CN кодировки GB 2312 , IBM-936 использует другую кодированную форму GB 2312, более близко напоминающую отношение Shift JIS к JIS X 0208 .

История [ править ]

За исключением самого Shift JIS , кодовые страницы с аналогичной структурой для других локалей CJK были прекращены в период с 1992 по 2016 год.

Кодировка использовалась в основном в 1980-х и начале 1990-х годов. В то время как исходный IBM PC ( IBM 5150 ) не имел функций обработки данных на языках CJK , IBM 5550 обладал такой функциональностью и был доступен в моделях, поддерживающих японский , корейский , традиционный китайский или упрощенный китайский . Кодовая страница 936 для упрощенного китайского языка, сопровождаемая кодовой страницей 932 ( Shift JIS ) для японского языка, кодовая страница 934 для корейского языка и кодовая страница 938 для традиционного китайского языка.

Последняя версия IBM-928/936/946 была задокументирована в 1992 году, а в 1993 году она была заменена EUC-CN кодовыми страницами на основе с 1380 по 1383 ; Кодовая страница 1380 кодирует те же символы, что и кодовая страница 928, но в другой раскладке. [5] По состоянию на 1998 год «некоторые старые китайские пакеты» все еще включали алгоритм преобразования между IBM-936 и другими кодировками GB 2312. [1]

Статус [ править ]

Хотя определения диаграмм для кодовой страницы 1380 (документ CH 3-3220-130, 1993-11) предоставляются IBM в Интернете, IBM аналогичным образом не предоставляет определения диаграмм для более старой кодовой страницы 928 (документ CH 3-3220-130, 1992 г.). -11, т.е. более ранняя версия той же спецификации). [5] [6] Международные компоненты для Unicode (ICU) не включают кодек IBM-936 или IBM-946 и используют кодовую страницу Windows для метки «cp936». [7] Проект ICU действительно располагает картографическими данными для IBM-946, которые он делает общедоступными. [8] но не отправляет его вместе с отделением интенсивной терапии.

Структура [ править ]

Кодовая страница 928, двухбайтовый компонент, включает 9355 символов в виде двухбайтовых последовательностей, начиная с 0x81 до 0xAC и от 0xF0 до 0xFA. [9]

Диапазон ведущих байтов 0x81–AC используется для символов GB 2312: ведущие байты 0x81–87 использовались для не-ханзи, 0x88–9C использовались для ханзи уровня 1 и 0x9C–AC использовались для ханзи уровня 2. [1] [5] [8] Как и Shift JIS , следовые (вторые) байты находятся в диапазоне 0x40–FC, исключая 0x7F, что позволяет кодировать две строки GB 2312 на один ведущий байт; [8] в отличие от Shift JIS, байты 0xA0–AC не исключаются из диапазона ведущих байтов, [5] [8] поскольку совместимость с JIS X 0201 не требовалась. Диапазон ведущих байтов 0xF0–FA используется для расширений IBM: от 0xF0 до 0xF9 используются для определяемых пользователем символов, а 0xFA используется для дополнительных не-ханзи. [5]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с Лейшер, Марк (2008) [1998-03-06]. «SHIFTGB.TXT: изменено GB2312.1980. Создано на основе алгоритма, поставляемого с некоторыми старыми китайскими пакетами» . Департамент математических наук Университета штата Нью-Мексико . Архивировано из оригинала 20 января 2023 г.
  2. ^ Перейти обратно: а б с Лунде, Кен (2009). «Глава 4: Методы кодирования (§ Кодовые страницы)». Обработка информации CJKV (2-е изд.). Севастополь, Калифорния : O'Reilly Media . стр. 278–282. ISBN  978-0-596-51447-1 .
  3. ^ «CCSID 936» . ИБМ . Архивировано из оригинала 27 марта 2016 г.
  4. ^ «CCSID 946» . ИБМ . Архивировано из оригинала 26 марта 2016 г.
  5. ^ Перейти обратно: а б с д Это «Таблица 1: Регистрация GCSGID и CPGID для набора графических символов IBM CH-S». CH 3-3220-130 1993-11: Набор упрощенных китайских графических символов IBM (PDF) . 1993. с. 6.
  6. ^ «Информационный документ с кодовой страницей 928» . Архивировано из оригинала 17 марта 2016 г.
  7. ^ «windows-936-2000 (псевдоним cp936)» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode.
  8. ^ Перейти обратно: а б с д «ibm-946_P100-1995» . Международные компоненты для репозитория данных Unicode . Консорциум Unicode , IBM .
  9. ^ «Информационный документ CCSID 928» . Архивировано из оригинала 26 марта 2016 г.
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 8571356FCF73207AEDD99397F1B4A9A1__1709170320
URL1:https://en.wikipedia.org/wiki/Code_page_936_(IBM)
Заголовок, (Title) документа по адресу, URL1:
Code page 936 (IBM) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)