~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 612C3274E4B0C9BB8717B56E0461B260__1709260260 ✰
Заголовок документа оригинал.:
✰ Code page 950 - Wikipedia ✰
Заголовок документа перевод.:
✰ Кодовая страница 950 — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Code_page_950 ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/61/60/612c3274e4b0c9bb8717b56e0461b260.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/61/60/612c3274e4b0c9bb8717b56e0461b260__translat.html ✰
Дата и время сохранения документа:
✰ 15.06.2024 21:50:09 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 1 March 2024, at 05:31 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Кодовая страница 950 — Википедия Jump to content

Кодовая страница 950

Из Википедии, бесплатной энциклопедии
Кодовая страница 950
Макет кодовой страницы 950, реализованный Microsoft (вверху, MS-950 или IBM-1373) и IBM (внизу, IBM-950).
Язык(и) Традиционный китайский
Сделано Майкрософт
Расширяет Большой5
На основе Big5 ест

Кодовая страница 950 — это кодовая страница, используемая в Microsoft Windows для традиционного китайского языка . Это реализация Microsoft де-факто стандартной кодировки символов Big5 . Кодовая страница не зарегистрирована в IANA . [1] и, следовательно, передача информации через Интернет не является стандартом, хотя обычно это обозначается просто как big5, в том числе с помощью функций библиотеки Microsoft. [2]

Терминология и варианты [ править ]

Основное различие между кодовой страницей Windows 950 и «общим» (не зависящим от поставщика) Big5 заключается во включении подмножества расширений ETEN в Big5 по адресам от 0x F9D6 до 0xF9FE (содержащих семь китайских иероглифов 碁, 銹, 裏, 墻). , 恒, 粧 и 嫺, за которыми следуют 34 символа для рисования прямоугольников и блочные элементы ). Вместо этого диапазоны, используемые некоторыми другими расширенными символами ETEN, определяются как символы, определяемые конечным пользователем (частное использование) . [3]

компании IBM CCSID 950 состоит из однобайтовой кодовой страницы 1114 (CCSID 1114) и двухбайтовой кодовой страницы 947 (CCSID 947). [4] [5] [6] и, хотя это тоже вариант Big5, он несколько отличается от кодовой страницы Microsoft 950, включая некоторые расширения ETEN для ведущих байтов 0xA3, [7] 0xC6, [3] [8] 0xC7 [9] и 0xC8, [3] [10] опуская те, у которых есть ведущий байт 0xF9 (которые включает Microsoft), вместо этого сопоставляя их с областью частного использования как определяемые пользователем символы. [3] [11] Он также включает в себя две области расширения, не относящиеся к ETEN, со следящими байтами 0x81–A0, т. е. за пределами обычного диапазона следовых байтов Big5, но аналогично диапазону следовых байтов Big5+: область 5 имеет ведущие байты 0xF2–F9 и содержит символы, выбранные IBM, а область 9 имеет ведущие байты 0x81–8C и является определяемой пользователем областью. [12]

Microsoft обновила свою версию кодовой страницы 950 в 2000 году, добавив знак евро (€) к двухбайтовому коду 0xA3E1. IBM называет обновление знака евро своего варианта Big-5 CCSID 1370 (который включает как однобайтовые (0x80), так и двухбайтовые знаки евро). [13] Он состоит из однобайтовой кодовой страницы 1114 (CCSID 5210) и двухбайтовой кодовой страницы 947 (CCSID 21427). [13] [14] [15]

Для лучшей совместимости с вариантом Microsoft в IBM Db2 IBM также определяет чистую двухбайтовую кодовую страницу 1372. [16] и связанный CCSID переменной ширины 1373 , который включает только двухбайтовый знак евро. [17] и соответствует поведению Microsoft, в которое включены регионы расширения. [18] [19] [20] [21] [22]

Однобайтовые коды [ править ]

Ниже приведены однобайтовые графические символы, включенные IBM. Коды от 0x00 до 0x1F и 0x7F могут использоваться вместо кодов управления C0 , в зависимости от контекста (сравните кодовую страницу 437 , кодовую страницу 897 ). Как отмечалось выше, однобайтовый знак евро по адресу 0x80 не включен в IBM CCSID 950 или 1373, а также в Microsoft.

Кодовая страница 1114 [23] [24]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x §
2x  СП   ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф г ЧАС я Дж К л М Н О
5x п вопрос р С Т В V В Икс И С [ \ ] ^ _
6x ` а б с д Это ж г час я дж к л м н О
7x п д р с т в v В Икс и С { | } ~
8x

Остальные являются частями двухбайтовой последовательности.

Использование зоны частного использования [ править ]

Сопоставление кодовых точек Big5 EUDC с PUA кодовыми точками [25]
Диапазон Big5 Диапазон Юникода Формула [26]
81 40–8Д ФЭ U + EEB8 – U + F6B0 0xeeb8 + (157 * (H-0x81)) + (L<0x80)?(L-0x40):(L-0x62)
8Э 40–А0 ФЭ U + E311 – U + EEB7 0xe311 + (157 * (H-0x8e)) + (L<0x80)?(L-0x40):(L-0x62)
C6 A1–C8 FE U + F6B1 – U + F848 0xf672 + (157 * (H-0xc6)) + (L<0x80)?(L-0x40):(L-0x62)
ФА 40–ФЭ ФЭ U + E000 – U + E310 0xe000 + (157 * (H-0xfa)) + (L<0x80)?(L-0x40):(L-0x62)

Это сопоставление также используется в HKSCS , где данный глиф еще не найден в указанной версии Unicode. [27]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Наборы символов» . IANA — Реестры протоколов .
  2. ^ «Свойство Encoding.WindowsCodePage — .NET Framework (текущая версия)» . MSDN . Майкрософт.
  3. ^ Перейти обратно: а б с д Чжу, ХФ.; Ху, Д.Ю.; Ван, ЗГ .; Као, ТК; Чанг, ЧМ.; Криспин, М. (1996). «Китайская кодировка символов для интернет-сообщений» . Запросы на комментарии . IETF . дои : 10.17487/rfc1922 . РФК 1922.
  4. ^ «Информационный документ CCSID 950» . Архивировано из оригинала 2 декабря 2014 г.
  5. ^ «Информационный документ CCSID 1114» . Архивировано из оригинала 27 марта 2016 г.
  6. ^ «Информационный документ CCSID 947» . Архивировано из оригинала 1 декабря 2014 г.
  7. ^ «Свинцовый байт A3: IBM-950_P110-1999» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  8. ^ «Свинцовый байт C6: IBM-950_P110-1999» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  9. ^ «Свинцовый байт C7: IBM-950_P110-1999» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  10. ^ «Свинцовый байт C8: ibm-950_P110-1999» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  11. ^ «Свинцовый байт F9: IBM-950_P110-1999» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  12. ^ «Набор традиционных китайских графических символов IBM для кода IBM BIG-5» (PDF) . ИБМ . 1999. CH 3-3220-131 1999-04.
  13. ^ Перейти обратно: а б «Информационный документ CCSID 1370» . Архивировано из оригинала 27 марта 2016 г.
  14. ^ «Информационный документ CCSID 5210» . Архивировано из оригинала 29 ноября 2014 г.
  15. ^ «Информационный документ CCSID 21427» . Архивировано из оригинала 27 марта 2016 г.
  16. ^ «CPGID 01372: MS T-Chinese Big-5 (специально для DB2)» . IBM Globalization — Идентификаторы кодовых страниц . Архивировано из оригинала 17 марта 2016 г.
  17. ^ "ibm-1373_P100-2002" . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  18. ^ «Свинцовый байт A3: IBM-1373_P100-2002» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  19. ^ «Свинцовый байт C6: ibm-1373_P100-2002» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  20. ^ «Свинцовый байт C7: ibm-1373_P100-2002» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  21. ^ «Свинцовый байт C8: ibm-1373_P100-2002» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  22. ^ «Свинцовый байт F9: IBM-1373_P100-2002» . Демонстрация ICU — Converter Explorer . Международные компоненты для Unicode .
  23. ^ Кодовая страница CPGID 01114 (pdf) (PDF) , IBM
  24. ^ Кодовая страница CPGID 01114 (txt) , IBM
  25. ^ «Таблица наилучшего соответствия Windows: CP950» . unicode.org . Проверено 13 сентября 2016 г.
  26. ^ «Большая пятёрка» . База данных кандзи . Проверено 13 сентября 2016 г.
  27. ^ «Большой5-HKSCS:2008» . Архивировано из оригинала 13 сентября 2016 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 612C3274E4B0C9BB8717B56E0461B260__1709260260
URL1:https://en.wikipedia.org/wiki/Code_page_950
Заголовок, (Title) документа по адресу, URL1:
Code page 950 - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)