ИСО/МЭК 8859-2
МИМ / IANA | ИСО-8859-2 |
---|---|
Псевдоним(а) | iso-ir-101, csISOLatin2, latin2, l2, IBM1111 |
Язык(и) | (см. ниже) |
Стандартный | ECMA-94 :1986, ISO/IEC 8859. |
Классификация | Расширенный ASCII , ISO/IEC 8859 |
Расширяет | США-ASCII |
На основе | ИСО-8859-1 |
Другая связанная кодировка(и) | Windows-1250 , Макхорватский |
ISO/IEC 8859-2:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 2. Латинский алфавит № 2 , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , сначала издание вышло в свет в 1987 году. Неофициально оно называется «Латиница-2». Обычно он предназначен для Центральной [1] или «восточноевропейские» языки, написанные латиницей. Обратите внимание, что ISO/IEC 8859-2 сильно отличается от кодовой страницы 852 (MS-DOS Latin 2, PC Latin 2), которую также называют «Latin-2» в чешском и словацком регионах. [2] Почти половина кодировки используется для польского языка, и это основная устаревшая кодировка для польского языка, хотя практически все ее использование было заменено на UTF-8 (в Интернете).
ISO-8859-2 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . По состоянию на октябрь 2022 года менее 0,04% всех веб-страниц используют ISO-8859-2. [3] [4] Microsoft присвоила кодовую страницу 28592, также известную как Windows-28592, коду ISO-8859-2 в Windows. IBM присвоила кодовую страницу 912 стандарту ISO 8859-2, [5] пока эта кодовая страница не была расширена в 1999 году. [6] Кодовая страница 1111 аналогична, но заменяет байт B0 ° (знак градуса) на U+02DA ˚ (кольцо выше).
Windows-1250 похожа на ISO-8859-2 и содержит все печатные символы и даже больше. Однако некоторые из них переставлены (в отличие от Windows-1252 , в которой все печатные символы из ISO-8859-1 хранятся в одном и том же месте).
Языковой охват
Эти значения кода можно использовать для следующих языков:
- ^ Отсутствующая буква Å официально является частью финского алфавита , однако она не имеет местного применения и ограничивается только иностранными именами.
- ^ В 2017 году Совет немецкой орфографии официально добавил заглавную букву ẞ , но на самом деле это не требуется, поскольку вместо нее можно использовать SS.
- ^ Этот набор символов объединяет ş и ş (S,T с запятыми ниже) с Ş и Ţ (S, T с седильями ), как и практически все другие наборы символов, включая Microsoft Windows-1250 и первую версию Unicode . Впоследствии Unicode разъединил их, однако примечания Unicode по состоянию на 2014 год. [ нужна ссылка ] что разъединение букв запятой ниже было ошибкой, которая привела к повреждению румынских данных: ранее существовавшие данные и методы ввода по-прежнему содержали бы старые кодовые точки седиллы, что усложняло поиск текста.
Макет кодовой страницы [ править ]
Отличия от ISO-8859-1 имеют номер кодовой точки Unicode внизу.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | А 0104 | ˘ 02D8 | Л 0141 | ¤ | Ľ 013D | С 015А | § | ¨ | С 0160 | Ш 015E | Т 0164 | С 0179 | ЗАСТЕНЧИВЫЙ | Ж 017D | З 017Б |
Бх | ° | а 0105 | ˛ 02ДБ | л 0142 | ´ | л 013E | поздно 015Б | ˇ 02C7 | ¸ | с 0161 | ш 015F | й 0165 | С 017А | ˝ 02ДД | час 017E | г 017C |
Сх | – 0154 | На | Â | Хм 0102 | Ä | ù 0139 | Ć 0106 | Что | С 010С | И | Ä 0118 | Э | Э 011А | В | вопрос | Д 010E |
Дх | Д 0110 | Н 0143 | Н 0147 | Ой | ЗОНТИК | ОН 0150 | ОН | × | Р 0158 | В 016E | О | Ű 0170 | О | ИДЕЯ | Þ 0162 | SS |
Бывший | к 0155 | на | â | Хм 0103 | ä | ĺ 013А | Ч 0107 | Что | С 010D | и | ę 0119 | ага | Э 011Б | в | вопрос | д 010F |
Форекс | Д 0111 | является 0144 | нет 0148 | от | Зонтик | он 0151 | он | ÷ | р 0159 | в 016F | ты | фу 0171 | ты | идея | Þ 0163 | ˙ 02D9 |
См. также [ править ]
Ссылки [ править ]
- ^ «Кодировка сообщений Microsoft Outlook» . 10 января 2017 г.
- ^ «Объяснение беспорядка с кодировкой чешских и словацких символов» . luki.sdf-eu.org . Проверено 27 февраля 2022 г.
- ^ «Статистика использования и рыночная доля ISO-8859-2 для веб-сайтов, октябрь 2022 г.» . w3techs.com . Проверено 23 октября 2022 г.
- ^ «Исторические тенденции статистики использования кодировок символов для веб-сайтов, февраль 2022 г.» .
- ^ «Icu-data/Charset/Data/XML/Ibm-912_P100-1995.XML в основном · unicode-org/Icu-data» . Гитхаб .
- ^ «Icu-data/Charset/Data/Ucm/Ibm-912_P100-1999.ucm в основном · unicode-org/Icu-data» . Гитхаб .
Внешние ссылки [ править ]
- ИСО/МЭК 8859-2:1999
- Стандарт ECMA-94 : наборы 8-битных однобайтовых графических символов - латинские алфавиты с № 1 по № 4, 2-е издание (июнь 1986 г.)
- ISO-IR 101 Правая часть латинского алфавита № 2 (1 февраля 1986 г.)
- Ресурсы по ISO 8859-2 (латиница 2)