Windows-1255
МИМ / IANA | окна-1255 |
---|---|
Псевдоним(а) | cp1255 ( Кодовая страница 1255) |
Язык(и) | иврит , английский |
Создано | Майкрософт |
Стандартный | WHATWG Стандарт кодирования |
Классификация | расширенный ASCII , Windows-125x |
Другая связанная кодировка(и) | ИСО-8859-8 |
Windows-1255 — это кодовая страница , используемая в Microsoft Windows для написания иврита . Это почти совместимая расширенная версия ISO-8859-8 – большинство символов находятся в тех же позициях (за исключением A4, который является «знаком шекеля» в Windows-1255, но «общим знаком валюты» в ISO 8859-8 и кроме для DF, который не определен в Windows-1255, но имеет «двойную нижнюю строку» в ISO 8859-8), но Windows-1255 добавляет точки гласных и другие знаки в нижних позициях.
IBM использует кодовую страницу 1255 ( CCSID 1255, расширенный CCSID 5351 со знаком евро и дополнительный расширенный CCSID 9447) для Windows-1255. [1] [2] [3] [4]
Современные приложения предпочитают Unicode Windows-1255, особенно в Интернете; [5] имеется в виду UTF-8 , доминирующая кодировка веб-страниц (или UTF-16, если ее нет в Интернете по соображениям безопасности). Windows-1255 используется менее чем на 0,1% веб-сайтов. [6]
Набор символов
[ редактировать ]В следующей таблице показана Windows-1255. Каждый символ отображается с его эквивалентом в Юникоде .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | НУЛЕВОЙ | СОХ | СТХ | И Т. Д | EOT | ENQ | ПОДТВЕРЖДЕНИЕ | БЕЛ | БС | ХТ | НЧ | ВТ | ФФ | ЧР | ТАК | И |
1x | ДЛЕ | DC1 | DC2 | DC3 | DC4 | ХОТЕТЬ | СИН | ЭТБ | МОЖЕТ | В | СУБ | ЭКУ | ФС | GS | РС | НАС |
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | ПРИНАДЛЕЖАЩИЙ |
8x | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | ‹ | ||||||
9x | ‘ | ’ | “ | ” | • | – | — | ˜ | ™ | › | ||||||
Топор | НБСП | ¡ | ¢ | £ | ₪ | ¥ | ¦ | § | ¨ | © | × | « | ¬ | ЗАСТЕНЧИВЫЙ | ® | ¯ |
Бх | ° | ± | ² | ³ | ´ | м | ¶ | · | ¸ | ¹ | ÷ | » | ¼ | ½ | ¾ | ¿ |
Сх | ְ | ֱ | ֲ | ֳ | ִ | ֵ | ֶ | ַ | ָ | ֹ | ֺ | ֻ | ּ | ֽ | ־ | ֿ |
Дх | ׀ | ׁ | ׂ | ׃ | крюк | Да | Да | ׳ | ״ | |||||||
Бывший | А | на | третий | д | тот | и | Г | ЧАС | девятый | Дж | с | о | к | М | от | Н |
Форекс | Н | С | П | ж | П | С | С | К | Р | что | А | ЛРМ | РЛМ |
Использование
[ редактировать ]Windows-1255 Иврит всегда находится в логическом порядке (в отличие от визуального). Продукты Microsoft для иврита (Windows, Office и Internet Explorer) сделали логически упорядоченный иврит общепринятым, в результате чего Windows-1255 — это кодировка иврита, которую чаще всего можно найти в Интернете, вытеснив визуально упорядоченный ISO-8859-8. , и предпочтительнее логически упорядоченного ISO-8859-8-I , поскольку он предусматривает наличие гласных.
Связь с Юникодом
[ редактировать ]Блок Unicode для иврита (U+0590–U+05FF) следует за Windows-1255, кодируя буквы и гласные в тех же относительных позициях, что и в Windows-1255. Unicode идет дальше в кодировании знаков кантилляции в нижних позициях. Юникод на иврите всегда располагается в логическом порядке.
Для современных приложений UTF-8 или UTF-16 предпочтительной кодировкой является .
См. также
[ редактировать ]- 7-битный иврит в соответствии с ISO 646.
- Кодовая страница 862
- ИСО 8859-8
- ЛМБКС-3
Ссылки
[ редактировать ]- ^ «Информационный документ с кодовой страницей 1255» . Архивировано из оригинала 4 марта 2016 г.
- ^ «Информационный документ CCSID 1255» . Архивировано из оригинала 27 марта 2016 г.
- ^ «Информационный документ CCSID 5351» . Архивировано из оригинала 29 ноября 2014 г.
- ^ «Информационный документ CCSID 9447» . Архивировано из оригинала 26 марта 2016 г.
- ^ Джон, Николас А. (2013). «Строительство многоязычного Интернета: Юникод, иврит и глобализация» . Журнал компьютерной коммуникации . 18 (3): 321–338. дои : 10.1111/jcc4.12015 . ISSN 1083-6101 .
Предыстория: проблема иврита и Интернета
- ^ «Статистика использования Windows-1255 для веб-сайтов, январь 2019 г.» . w3techs.com . Проверено 17 января 2019 г.
- ^ Таблица сопоставления Юникода для Windows 1255
- ^ Сопоставления Unicode для Windows 1255 с «наилучшим соответствием»
- ^ Кодовая страница CPGID 01255 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01255 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-1255_P100-1995.ucm , 3 декабря 2002 г.
- ^ Международные компоненты для Unicode (ICU), ibm-1251_P100-1995.ucm , 3 декабря 2002 г.
- ^ Международные компоненты для Unicode (ICU), ibm-5351_P100-1998.ucm , 3 декабря 2002 г.