ИСО/МЭК 8859-2
МИМ / IANA | ИСО-8859-2 |
---|---|
Псевдоним(а) | iso-ir-101, csISOLatin2, latin2, l2, IBM1111 |
Язык(и) | (см. ниже) |
Стандартный | ECMA-94 : 1986, ISO/IEC 8859. |
Классификация | Расширенный ASCII , ISO/IEC 8859 |
Расширяет | США-ASCII |
На основе | ИСО-8859-1 |
Другая связанная кодировка(и) | Windows-1250 , Макхорватский |
ISO/IEC 8859-2:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 2. Латинский алфавит № 2 , является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , сначала издание вышло в свет в 1987 году. Неофициально оно называется «Латиница-2». Обычно он предназначен для Центральной [1] или «восточноевропейские» языки, написанные латиницей. Обратите внимание, что ISO/IEC 8859-2 сильно отличается от кодовой страницы 852 (MS-DOS Latin 2, PC Latin 2), которую также называют «Latin-2» в чешском и словацком регионах. [2] Почти половина кодировки используется для польского языка, и это основная устаревшая кодировка для польского языка, хотя практически все ее использование было заменено на UTF-8 (в Интернете).
ISO-8859-2 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . По состоянию на октябрь 2022 года менее 0,04% всех веб-страниц используют ISO-8859-2. [3] [4] Microsoft присвоила кодовую страницу 28592, также известную как Windows-28592, коду ISO-8859-2 в Windows. IBM присвоила кодовую страницу 912 стандарту ISO 8859-2, [5] пока эта кодовая страница не была расширена в 1999 году. [6] Кодовая страница 1111 аналогична, но заменяет байт B0 ° (знак градуса) на U+02DA ˚ (кольцо выше).
Windows-1250 похожа на ISO-8859-2 и содержит все печатные символы и многое другое. Однако некоторые из них переставлены (в отличие от Windows-1252 , в которой все печатные символы из ISO-8859-1 хранятся в одном и том же месте).
охват Языковой
Эти значения кода можно использовать для следующих языков:
- ^ Отсутствующая буква Å официально является частью финского алфавита , однако она не имеет местного применения и ограничивается только иностранными именами.
- ^ В 2017 году Совет немецкой орфографии официально добавил заглавную букву ẞ , но на самом деле это не требуется, поскольку вместо нее можно использовать SS.
- ^ Этот набор символов объединяет ş и ş (S,T с запятыми ниже) с Ş и Ţ (S, T с седильями ), как и практически все другие наборы символов, включая Microsoft Windows-1250 и первую версию Unicode . Впоследствии Unicode разъединил их, однако примечания Unicode по состоянию на 2014 год. [ нужна цитата ] что разделение букв запятой ниже было ошибкой, которая привела к искажению румынских данных: ранее существовавшие данные и методы ввода по-прежнему содержали бы старые кодовые точки седиллы, что усложняло поиск текста.
Макет кодовой страницы [ править ]
Отличия от ISO-8859-1 имеют номер кодовой точки Unicode внизу.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О |
5x | п | вопрос | р | С | Т | В | V | В | Икс | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | Это | ж | г | час | я | дж | к | л | м | н | О |
7x | п | д | р | с | т | в | v | В | Икс | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | А 0104 |
˘ 02D8 |
Л 0141 |
¤ | Ľ 013D |
С 015А |
§ | ¨ | С 0160 |
С 015E |
Т 0164 |
С 0179 |
ЗАСТЕНЧИВЫЙ | Ж 017D |
З 017Б |
Бх | ° | а 0105 |
˛ 02ДБ |
л 0142 |
´ | л 013E |
поздно 015Б |
ˇ 02C7 |
¸ | с 0161 |
с 015F |
й 0165 |
С 017А |
˝ 02ДД |
час 017E |
г 017C |
Сх | – 0154 |
На | Â | Хм 0102 |
Ä | ù 0139 |
Ć 0106 |
Что | С 010С |
И | Ä 0118 |
Э | Э 011А |
В | вопрос | Д 010E |
Дх | Д 0110 |
Н 0143 |
Н 0147 |
Ой | ЗОНТИК | ОН 0150 |
ОН | × | р 0158 |
В 016E |
О | Ű 0170 |
О | ИДЕЯ | Þ 0162 |
SS |
Бывший | к 0155 |
на | â | Хм 0103 |
ä | ĺ 013А |
Ч 0107 |
Что | С 010D |
Это | ę 0119 |
е | Э 011Б |
в | вопрос | д 010F |
Форекс | Д 0111 |
является 0144 |
нет 0148 |
от | Зонтик | Он 0151 |
он | ÷ | р 0159 |
в 016F |
ты | ой 0171 |
ты | идея | Þ 0163 |
˙ 02D9 |
См. также [ править ]
Ссылки [ править ]
- ^ «Кодировка сообщений Microsoft Outlook» . 10 января 2017 г.
- ^ «Объяснение беспорядка с кодировкой чешских и словацких символов» . luki.sdf-eu.org . Проверено 27 февраля 2022 г.
- ^ «Статистика использования и рыночная доля ISO-8859-2 для веб-сайтов, октябрь 2022 г.» . w3techs.com . Проверено 23 октября 2022 г.
- ^ «Исторические тенденции статистики использования кодировок символов для веб-сайтов, февраль 2022 г.» .
- ^ «Icu-data/Charset/Data/XML/Ibm-912_P100-1995.XML в основном · unicode-org/Icu-data» . Гитхаб .
- ^ «Icu-data/Charset/Data/Ucm/Ibm-912_P100-1999.ucm в основном · unicode-org/Icu-data» . Гитхаб .
Внешние ссылки [ править ]
- ИСО/МЭК 8859-2:1999
- Стандарт ECMA-94 : наборы 8-битных однобайтовых графических символов - латинские алфавиты с № 1 по № 4, 2-е издание (июнь 1986 г.)
- ISO-IR 101 Правая часть латинского алфавита № 2 (1 февраля 1986 г.)
- Ресурсы по ISO 8859-2 (латиница 2)