ИСО/МЭК 8859-11
ISO/IEC 8859-11:2001 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 11. Латинский/тайский алфавит , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , первое издание опубликован в 2001 году. Неофициально его называют Latin/Thai . Он практически идентичен национальному тайскому стандарту TIS-620 (1990 г.). Единственное отличие состоит в том, что ISO/IEC 8859-11 выделяет неразрывное пространство для кода 0xA0, а TIS-620 оставляет его неопределенным. (На практике это небольшое различие обычно игнорируется.)
ISO-8859-11 является не основным зарегистрированным именем кодировки IANA, несмотря на то, что соответствует обычному шаблону для кодировок IANA, основанному на серии ISO 8859 . Однако он определяется как псевдоним [1] близкого эквивалента TIS-620 (в котором отсутствует неразрывное пространство) и которое можно без проблем использовать для ISO/IEC 8859-11, поскольку неразрывное пространство имеет код, который не был выделен в TIS-620. Microsoft присвоила кодовую страницу 28601, также известную как Windows-28601, ISO-8859-11 в Windows. [2] В черновике тайские буквы были в разных местах. [3]
Как и во всех вариантах ISO/IEC 8859, нижние 128 кодов эквивалентны ASCII . Дополнительные символы, кроме неразрывного пробела, встречаются в Юникоде в том же порядке, только со сдвигом от 0xA1 к U+0E01 и так далее.
Microsoft Кодовая страница Windows 874, а также кодовая страница, используемая в тайской версии Apple Macintosh , MacThai , являются вариантами TIS-620, однако несовместимыми друг с другом.
Набор символов
[ редактировать ]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | г | б | ฃ | С | ฅ | ก | д | Э | я | М | С | ฺ | Да | ก | ก |
Бх | й | й | й | на | д | Т | че | Т | че | н | Б | П | П | Дождь | П | Ф |
Сх | Ph | м | Да | Р | Р | л | ฦ | Вт | Проф. | ก | С | ЧАС | ก | О | ЧАС | и т. д. |
Дх | Ой | | ก | | я | Да | Да | | | Смотреть | ฺ | ฿ | ||||
Бывший | т | И | Ой | В | Что? | ๅ | Любой другой | | | Это | Да | Да | | �� | ๎ | ๏ |
Форекс | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ |
Кодовые значения D1, D4-DA, E7-EE представляют собой комбинированные символы .
Расширения поставщиков
[ редактировать ]Кодовая страница 874 (IBM) / 9066
[ редактировать ]Кодовая страница IBM 874 ( CP874 , IBM-874 , x-IBM874 ), также известная как кодовая страница 9066 ( IBM-9066 ), [5] отличается от ISO/IEC 8859-11 только девятью символами, заключенными в рамки в следующей таблице: [6] [7] [8]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
Топор | | г | б | ฃ | С | ฅ | ก | д | Э | я | М | С | ฺ | Да | ก | ก |
Бх | й | й | й | на | д | Т | че | Т | че | н | Б | П | П | Дождь | П | Ф |
Сх | Ph | м | Да | Р | Р | л | ฦ | Вт | Проф. | ก | С | ЧАС | ก | О | ЧАС | и т. д. |
Дх | Ой | | ก | | я | Да | Да | | | Смотреть | ฺ | Это | Да | Да | | ฿ |
Бывший | т | И | Ой | В | Что? | ๅ | Любой другой | | | Это | Да | Да | | �� | ๎ | ๏ |
Форекс | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ¢ | ¬ | ¦ | НБСП |
Кодовая страница 1161
[ редактировать ]Кодовая страница 1161 ( CP1161 , IBM-1161 ) является вариантом кодовой страницы IBM 874. Единственное отличие — это знак евро (€) в шестнадцатеричной позиции DE (222). [12] [13]
Кодовая страница 874 (Microsoft) / 1162
[ редактировать ]Кодовая страница Windows 874 ( windows-874 , MS874 , x-windows-874 ), известная как кодовая страница 1162 ( CP1162 , IBM-1162 ) от IBM, [14] [15] используется Microsoft Windows. Он отличается от ISO/IEC 8859-11 только добавлением девяти символов, показанных в следующей таблице:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | € | … | ||||||||||||||
9x | ‘ | ’ | “ | ” | • | – | — |
Mac OS Тайский
[ редактировать ]Этот вариант используется в классической Mac OS .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | « | » | … | | Это | Да | Да | | | Это | Да | Да | | “ | ” | �� |
9x | • | | | я | Да | Да | | | Это | Да | Да | | ‘ | ’ | ||
Топор | НБСП | г | б | ฃ | С | ฅ | ก | д | Э | я | М | С | ฺ | Да | ก | ก |
Бх | й | й | й | на | д | Т | че | Т | че | н | Б | П | П | Дождь | П | Ф |
Сх | Ph | м | Да | Р | Р | л | ฦ | Вт | Проф. | ก | С | ЧАС | ก | О | ЧАС | и т. д. |
Дх | Ой | | ก | | я | Да | Да | | | Смотреть | ฺ | У.Дж. | ЗВСП | – | — | ฿ |
Бывший | т | И | Ой | В | Что? | ๅ | Любой другой | | | Это | Да | Да | | �� | ™ | ๏ |
Форекс | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ® | © |
См. также
[ редактировать ]Сноски
[ редактировать ]Ссылки
[ редактировать ]- ^ «Наборы символов IANA» .
- ^ "js-кодовая страница, Получение кодовых страниц" . Гитхаб . 12 октября 2021 г.
- ^ Эверсон, Майкл. «Предлагаемый стандарт ISO 8859-11» .
- ^ Уистлер, Кен (07 октября 2002 г.), ISO/IEC 8859-11:2001 для Unicode , Консорциум Unicode
- ^ ИБМ ; Консорциум Юникод . "convrtrs.txt" . Международные компоненты для Unicode . в. 59180.0.1.
Да, IBM-874 == IBM-9066. IBM-1161 имеет еврообновление.
- ^ «Информационный документ с кодовой страницей 874» . Архивировано из оригинала 16 января 2017 г.
- ^ «Информационный документ CCSID 874» . Архивировано из оригинала 27 марта 2016 г.
- ^ «Информационный документ CCSID 9066» . Архивировано из оригинала 27 марта 2016 г.
- ^ ИБМ . «Кодовая страница CPGID 00874» (PDF) . РЕЕСТР: наборы графических символов и кодовые страницы .
- ^ Кодовая страница CPGID 00874 (txt) , IBM
- ^ «Проводник конвертеров: IBM-874_P100-1995» . Международные компоненты для Unicode . Консорциум Юникод .
- ^ «Кодовая страница 01161» (PDF) .
- ^ «Информационный документ CCSID 1161» . Архивировано из оригинала 27 марта 2016 г.
- ^ «Информационный документ с кодовой страницей 1162» . Архивировано из оригинала 17 марта 2016 г.
- ^ «Информационный документ CCSID 1162» . Архивировано из оригинала 27 марта 2016 г.
- ^ «Кодовая страница 01162» (PDF) .
- ^ Стил, Шон (28 февраля 1998 г.). «cp874 в таблицу Юникода» . Консорциум Unicode , Microsoft .
- ^ Кодовая страница CPGID 01162 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1162_P100-1999.ucm , 3 декабря 2002 г.
- ^ Яблоко (05 апреля 2005 г.). «Сопоставить (внешнюю версию) тайского набора символов Mac OS с Unicode 3.2 и более поздних версий» . Консорциум Юникод .
Внешние ссылки
[ редактировать ]- ИСО/МЭК 8859-11:2001
- ISO/IEC 8859-11:1999 - 8-битные однобайтовые наборы графических символов, Часть 11: Набор латинских/тайских символов (проект от 22 июня 1999 г.; заменен стандартом ISO/IEC 8859-11:2001, опубликованным 15 декабря). , 2001)
- Кодовая страница Windows 874
- ISO-IR 166 Набор символов тайского языка (13 июля 1992 г., из тайского стандарта TIS 620-2533 (1990))
- Стандартизация и внедрение тайского языка PDF 175k