Windows-1258
МИМ / IANA | окна-1258 |
---|---|
Псевдоним(а) | cp1258 ( Кодовая страница 1258) |
Язык(и) | Вьетнамский , английский , французский , немецкий , испанский , датский , норвежский , шведский , финский , ирландский , албанский , люксембургский , голландский . С объединением диакритических знаков: Эстонский , итальянский , португальский , йоруба , гуарани , игбо , науруанский , транслитерация деванагари . |
Создано | Майкрософт |
Стандартный | WHATWG Стандарт кодирования |
Классификация | расширенный ASCII , Windows-125x |
На основе | Windows-1252 |
Windows-1258 — это кодовая страница , используемая в Microsoft Windows для представления вьетнамских текстов. Он использует сочетание диакритических знаков .
Windows-1258 не совместима ни с вьетнамским стандартом ( TCVN 5712 /VSCII), ни с различными другими используемыми на практике кодировками ( VISCII , VNI , VPS ). Скорее, он очень похож на Windows-1252 , с той разницей, что отсутствуют s-caron и z-caron (которые были добавлены в Windows-1252 позже), пять букв с диакритическими знаками заменены комбинированными диакритическими знаками для вьетнамского языка. знаки тона , один был заменен знаком ông , а восемь других (четыре в каждом случае) были заменены на четыре вьетнамских буквы, которые иначе не поддерживаются .
Использование комбинирования диакритических знаков означает, что Windows-1258 может охватывать большое количество комбинаций букв и тональных знаков вьетнамского языка без ущерба для охвата управляющих кодов или символов. Однако это также означает, что программное обеспечение должно быть осторожным при преобразовании между заранее составленными символами и правильном объединении последовательностей при преобразовании в/из других кодировок, а также усложняет определение видимой пользователем длины строки.
IBM использует кодовую страницу 1258 ( CCSID 1258 и расширенный CCSID 5354 со знаком евро ) для Windows-1258. [1] [2] [3]
UTF-8 является предпочтительной кодировкой вьетнамского языка в современных приложениях. Windows-1258 не всегда может передавать вьетнамский язык в кодировке Unicode туда и обратно из-за изменений, вызванных нормализацией Unicode . [4] Комбинированные диакритические знаки кодируются после буквы как в Windows-1258, так и в Unicode. [4] (как VNI , в отличие от ANSEL ).
Набор символов
[ редактировать ]В следующей таблице показана Windows-1258. Каждый символ отображается с его эквивалентом в Юникоде .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | СОХ | СТХ | И Т. Д | EOT | ENQ | ПОДТВЕРЖДЕНИЕ | БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | В СООТВЕТСТВИИ С | DC1 | DC2 | DC3 | DC4 | ХОТЕТЬ | СИН | ЭТБ | МОЖЕТ | В | СУБ | ЭКУ | ФС | GS | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | ‹ | О | |||||
9x | ‘ | ’ | “ | ” | • | – | — | ˜ | ™ | › | œ | Ÿ | ||||
Топор | НБСП | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | й | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Бх | ° | ± | ² | ³ | ´ | м | ¶ | · | ¸ | ¹ | й | » | ¼ | ½ | ¾ | ¿ |
Сх | ИМЕЕТ | На | Â | Хм | Ä | Ой | Ой | Что | И | И | Э | Э | ◌̀ | В | вопрос | Я |
Дх | Д | С | ◌̉ | Ой | ЗОНТИК | ЭХ | ОН | × | Ø | Ù | О | И | О | Эм-м-м | ◌̃ | SS |
Бывший | имеет | на | â | Хм | ä | к | ой | Что | И | и | ага | ага | ◌́ | в | вопрос | я |
Форекс | Д | н | ◌̣ | от | Зонтик | Привет | он | ÷ | ø | ты | ты | и | ты | Эм-м-м | ₫ | ÿ |
Отличия от Windows-1252 |
Кодовая страница 1129
[ редактировать ]Кодовая страница IBM 1129 ( CCSID 1129 и расширенный знак евро CCSID 1163) [11] [12] [13] аналогична кодовой странице 1258, но со следующими отличиями:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | œ | © | й | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Бх | ° | ± | ² | ³ | Ÿ | м | ¶ | · | О | ¹ | й | » | ¼ | ½ | ¾ | ¿ |
Отличия от Windows-1258 |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Информационный документ с кодовой страницей 1258» . Архивировано из оригинала 3 марта 2016 г.
- ^ «Информационный документ CCSID 1258» . Архивировано из оригинала 29 ноября 2014 г.
- ^ «Информационный документ CCSID 5354» . Архивировано из оригинала 29 ноября 2014 г.
- ^ Перейти обратно: а б Каплан, Майкл С. (19 апреля 2005 г.). «Некоторые ошибки MultiByteToWideChar» . Разбираемся во всем .
- ^ Стил, Шон (15 апреля 1998 г.). «cp1258 в таблицу Юникода» . Майкрософт .
- ^ Сопоставления Unicode для Windows 1258 с «наилучшим соответствием»
- ^ Кодовая страница CPGID 01258 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01258 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1258_P100-1997.ucm , 3 декабря 2002 г.
- ^ Международные компоненты для Unicode (ICU), ibm-5354_P100-1998.ucm , 3 декабря 2002 г.
- ^ «Информационный документ с кодовой страницей 1129» . Архивировано из оригинала 21 сентября 2010 г.
- ^ «Информационный документ CCSID 1129» . Архивировано из оригинала 27 марта 2016 г.
- ^ «Информационный документ CCSID 1163» . Архивировано из оригинала 29 ноября 2014 г.
- ^ Лунде, Кен (13 января 2009 г.). «Приложение L: Наборы вьетнамских символов» (PDF) . Обработка информации CJKV (2-е изд.). ISBN 978-0-596-51447-1 .
- ^ Кодовая страница CPGID 01129 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01129 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1129_P100-1997.ucm , 3 декабря 2002 г.
- ^ Кодовая страница CPGID 01163 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01163 (txt) , IBM