ИСО/МЭК 8859-11

Из Википедии, бесплатной энциклопедии

ISO/IEC 8859-11:2001 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 11. Латинский/тайский алфавит , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , первое издание опубликован в 2001 году. Неофициально его называют Latin/Thai . Он практически идентичен национальному тайскому стандарту TIS-620 (1990 г.). Единственное отличие состоит в том, что ISO/IEC 8859-11 выделяет неразрывное пространство для кода 0xA0, а TIS-620 оставляет его неопределенным. (На практике это небольшое различие обычно игнорируется.)

ISO-8859-11 является не основным зарегистрированным именем кодировки IANA, несмотря на то, что соответствует обычному шаблону для кодировок IANA, основанному на серии ISO 8859 . Однако он определяется как псевдоним [1] близкого эквивалента TIS-620 (в котором отсутствует неразрывное пространство) и которое можно без проблем использовать для ISO/IEC 8859-11, поскольку неразрывное пространство имеет код, который не был выделен в TIS-620. Microsoft присвоила кодовую страницу 28601, также известную как Windows-28601 , ISO-8859-11 в Windows. [2] В черновике тайские буквы были в разных местах. [3]

Как и во всех вариантах ISO/IEC 8859, нижние 128 кодов эквивалентны ASCII . Дополнительные символы, кроме неразрывного пробела, встречаются в Юникоде в том же порядке, только со сдвигом от 0xA1 к U+0E01 и так далее.

Кодовая страница Microsoft Windows 874 , а также кодовая страница, используемая в тайской версии Apple Macintosh , MacThai , являются вариантами TIS-620, однако несовместимыми друг с другом.

Набор символов [ править ]

ИСО/МЭК 8859-11 [4]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x
2x  СП   ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф г ЧАС я Дж К л М Н О
5x п вопрос р С Т В V В Икс И С [ \ ] ^ _
6x ` а б с д Это ж г час я дж к л м н О
7x п д р с т в v В Икс и С { | } ~
8x
9x
Топор НБСП г б С д Э я М С Да
Бх й й й на д Т че Т че н Б п п Дождь п Ф
Сх Ph м Да р р л Вт Проф. С ЧАС О ЧАС и т. д.
Дх Ой   я Да Да   Смотреть ฺ ฿
Бывший т И Ой В Что? Любой другой   Это Да Да  �� ๎
Форекс

Кодовые значения D1, D4-DA, E7-EE представляют собой комбинированные символы .

Расширения поставщиков [ править ]

Кодовая страница 874 (IBM) / 9066 [ править ]

Кодовая страница IBM 874 ( CP874 , IBM-874 , x-IBM874 ), также известная как кодовая страница 9066 ( IBM-9066 ), [5] отличается от ISO/IEC 8859-11 только девятью символами, заключенными в рамки в следующей таблице: [6] [7] [8]

Кодовая страница IBM 874/9066 (отличия от ISO-8859-11) [9] [10] [11]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
Топор  г б С д Э я М С Да
Бх й й й на д Т че Т че н Б п п Дождь п Ф
Сх Ph м Да р р л Вт Проф. С ЧАС О ЧАС и т. д.
Дх Ой   я Да Да   Смотреть ฺ Это Да Да  ฿
Бывший т И Ой В Что? Любой другой   Это Да Да  �� ๎
Форекс ¢ ¬ ¦ НБСП
  Отличия от ISO 8859-11

Кодовая страница 1161 [ править ]

Кодовая страница 1161 ( CP1161 , IBM-1161 ) является вариантом кодовой страницы IBM 874. Единственное отличие — это знак евро (€) в шестнадцатеричной позиции DE (222). [12] [13]

Кодовая страница 874 (Microsoft)/1162 [ править ]

Кодовая страница Windows 874 ( windows-874 , MS874 , x-windows-874 ), известная как кодовая страница 1162 ( CP1162 , IBM-1162 ) от IBM, [14] [15] используется Microsoft Windows. Он отличается от ISO/IEC 8859-11 только добавлением девяти символов, показанных в следующей таблице:

Кодовая страница 1162 (IBM)/874 (Microsoft): отличие от ISO-8859-11. [16] [17] [18] [19]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
8x
9x
  Отличия от ISO 8859-11

Mac OS Тайский [ править ]

Этот вариант используется в классической Mac OS .

Mac OS Тайский [20]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
8x « »  Это Да Да   Это Да Да  ��
9x   я Да Да   Это Да Да 
Топор НБСП г б С д Э я М С Да
Бх й й й на д Т че Т че н Б п п Дождь п Ф
Сх Ph м Да р р л Вт Проф. С ЧАС О ЧАС и т. д.
Дх Ой   я Да Да   Смотреть ฺ  У.Дж.   ЗВСП ฿
Бывший т И Ой В Что? Любой другой   Это Да Да  ��
Форекс ® ©
  Отличия от ISO 8859-11

См. также [ править ]

Сноски [ править ]

Ссылки [ править ]

  1. ^ «Наборы символов IANA» .
  2. ^ "js-кодовая страница, Получение кодовых страниц" . Гитхаб . 12 октября 2021 г.
  3. ^ Эверсон, Майкл. «Предлагаемый стандарт ISO 8859-11» .
  4. ^ Уистлер, Кен (07 октября 2002 г.), ISO/IEC 8859-11:2001 для Unicode , Консорциум Unicode
  5. ^ ИБМ ; Консорциум Юникод . "convrtrs.txt" . Международные компоненты для Unicode . в. 59180.0.1. Да, IBM-874 == IBM-9066. IBM-1161 имеет еврообновление.
  6. ^ «Информационный документ с кодовой страницей 874» . Архивировано из оригинала 16 января 2017 г.
  7. ^ «Информационный документ CCSID 874» . Архивировано из оригинала 27 марта 2016 г.
  8. ^ «Информационный документ CCSID 9066» . Архивировано из оригинала 27 марта 2016 г.
  9. ^ ИБМ . «Кодовая страница CPGID 00874» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
  10. ^ Кодовая страница CPGID 00874 (txt) , IBM
  11. ^ «Проводник конвертеров: IBM-874_P100-1995» . Международные компоненты для Unicode . Консорциум Юникод .
  12. ^ «Кодовая страница 01161» (PDF) .
  13. ^ «Информационный документ CCSID 1161» . Архивировано из оригинала 27 марта 2016 г.
  14. ^ «Информационный документ с кодовой страницей 1162» . Архивировано из оригинала 17 марта 2016 г.
  15. ^ «Информационный документ CCSID 1162» . Архивировано из оригинала 27 марта 2016 г.
  16. ^ «Кодовая страница 01162» (PDF) .
  17. ^ Стил, Шон (28 февраля 1998 г.). «cp874 в таблицу Юникода» . Консорциум Unicode , Microsoft .
  18. ^ Кодовая страница CPGID 01162 (txt) , IBM
  19. ^ Международные компоненты для Unicode (ICU), ibm-1162_P100-1999.ucm , 3 декабря 2002 г.
  20. ^ Яблоко (05 апреля 2005 г.). «Сопоставить (внешнюю версию) тайского набора символов Mac OS с Unicode 3.2 и более поздних версий» . Консорциум Юникод .

Внешние ссылки [ править ]