ИСО-ИР-111
Псевдоним(а) | ИСО-ИР-111 |
---|---|
Язык(и) | Русский , Белорусский , Македонский , Сербский , Украинский (частичный) |
Стандартный | ECMA-113:1986 |
Классификация | Расширенный ASCII , KOI |
Расширяет | КОИ8-Б |
Преемник | ECMA-113:1988 ( ISO-8859-5 ) |
Другая связанная кодировка(и) | КОИ8-Ф |
ИСО-ИР-111 [1] или КОИ8-Е [2] представляет собой 8-битный набор символов. Это международное расширение KOI-8 для белорусского , македонского , сербского и украинского языков (кроме Ґ ґ, который добавляется к KOI8-F ). Название «ISO-IR-111» относится к его регистрационному номеру в реестре ISO-IR и обозначает его как набор, который можно использовать с ISO/IEC 2022 .
Это было определено в первом (1986 г.) издании ECMA-113, [3] который является международным стандартом Ecma, соответствующим ISO/IEC 8859-5 , и, как таковой, также соответствует черновой версии ISO-8859-5 1987 года. [4] Опубликованные редакции ISO/IEC 8859-5 вместо этого соответствуют последующим редакциям ECMA-113, которые определяют другую кодировку. [5]
Путаница в именах
[ редактировать ]ISO-IR-111, версия ECMA-113 1985 года (также называемая «ECMA-кириллица» или «KOI8-E»), была основана на редакции ГОСТ 19768 1974 года (т.е. KOI-8 ). В 1987 году ECMA-113 был модернизирован. [5] Эти новые редакции ECMA-113 эквивалентны ISO-8859-5 . [5] [6] и не следуйте макету KOI. Эта путаница привела к распространенному заблуждению, что ISO-8859-5 был определен в ГОСТ 19768-74 или основан на нем. [6]
Возможно, как еще одно следствие этого, В RFC 1345 ошибочно указана другая кодовая страница под именами «ISO-IR-111» и «ECMA-Cyrillic», напоминающая ISO-8859-5 с переупорядоченными строками и частично совместимая с Windows-1251 . [7] [6] Из-за опасений, что существующие реализации могут использовать определение RFC 1345 для этих двух меток, было предложено, чтобы IANA дополнительно признала KOI8-E
в качестве метки содержимого ECMA-113:1985, [7] и IANA в настоящее время перечисляет этот ярлык как псевдоним. [2]
Набор символов
[ редактировать ]В следующей таблице показана кодировка ISO-IR-111. Каждый символ отображается со своим эквивалентом кодовой точки Unicode .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | д 0452 | ж 0453 | или 0451 | есть 0454 | дж 0455 | и 0456 | е 0457 | дж 0458 | жж 0459 | Нью-Джерси 045А | час 045Б | д 045С | ЗАСТЕНЧИВЫЙ | в 045E | дж 045F |
Бх | № 2116 | Đ 0402 | Ф 0403 | Или 0401 | Есть 0404 | С 0405 | я 0406 | Ей 0407 | Дж 0408 | ЖЖ 0409 | Нью-Джерси 040А | Ć 040Б | К 040С | ¤ 00А4 | В 040E | Дж 040F |
Сх | ю 044E | а 0430 | б 0431 | час 0446 | д 0434 | является 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | и 0439 | к 043А | л 043Б | м 043С | н 043D | о 043E |
Дх | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | же 0436 | в 0432 | ь 044C | й 044Б | с 0437 | ш 0448 | э 044D | щ 0449 | час 0447 | ъ 044А |
Бывший | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Хорошо 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | И 0419 | К 041А | л 041Б | М 041С | Н 041D | О 041E |
Форекс | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Же 0416 | В 0412 | Ь 042C | Да 042Б | С 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042А |
Расширенные и модифицированные версии
[ редактировать ]Модифицированная версия под названием KOI8 Unified или KOI8-F использовалась в программном обеспечении, созданном Fingertip Software, с добавлением Ґ в его местоположении KOI8-U (замена мягкого дефиса и смещением универсального знака валюты ), а также добавлением некоторых графических символов в элемент управления C1. область кодов , в основном из КОИ8-Р и Windows-1251 . [4] [6] [8] [9]
Неверная кодовая страница RFC 1345.
[ редактировать ]Язык(и) | Русский , Белорус , Македонский , Сербский |
---|---|
Стандартный | РФК 1345 |
Классификация | Расширенный ASCII |
Преобразует/кодирует | ИСО-ИР-111 |
Другая связанная кодировка(и) | ИСО-8859-5 , Windows-1251 |
В RFC 1345 ошибочно указана другая кодовая страница под названием ISO-IR-111, кодирующая те же символы кириллицы, но с другой раскладкой. Он напоминает смесь Windows-1251 и ISO-8859-5 . [7] В частности, строка A_ соответствует ISO-8859-5, строки от C_ до F_ соответствуют Windows-1251. [6] (эквивалентно строкам от B_ до E_ в ISO-8859-5), а строка B_ почти соответствует строке F_ из ISO-8859-5, за исключением того, что § заменяется на ¤ .
Некоторые коды напоминают ISO-IR-111 с перевернутым регистром букв, что могло привести к путанице. Большинство из них отличаются и показаны ниже.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
Топор | НБСП | Или | Đ | Ф | Есть | С | я | Ей | Дж | ЖЖ | Нью-Джерси | Ć | К | ЗАСТЕНЧИВЫЙ | В | Дж |
Бх | № | или | д | ж | есть | дж | и | е | дж | жж | Нью-Джерси | час | д | ¤ | в | дж |
Сх | А | Б | В | Г | Д | Хорошо | Же | С | И | И | К | л | М | Н | О | П |
Дх | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Да | Ь | Э | Ю | Я |
Бывший | а | б | в | г | д | является | же | с | и | и | к | л | м | н | о | п |
Форекс | р | с | т | у | ф | х | час | час | ш | щ | ъ | й | ь | э | ю | я |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ ECMA (1 августа 1985 г.). Правая часть кириллицы (PDF) . ITSCJ/ IPSJ . ИСО-ИК -111.
- ^ Jump up to: а б «Наборы символов» . ИАНА.
- ^ ЭКМА-113. Наборы 8-битных однобайтовых графических символов - латиница/кириллица (1-е изд., июнь 1986 г.)
- ^ Jump up to: а б Чиборра, Роман (30 ноября 1998 г.) [25 мая 1998 г.]. «Суп с кириллицей» . Архивировано из оригинала 3 декабря 2016 г. Проверено 3 декабря 2016 г.
- ^ Jump up to: а б с ЭКМА-113. Наборы 8-битных однобайтовых графических символов - латиница/кириллица (2-е изд., июнь 1988 г.)
- ^ Jump up to: а б с д и Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.
- ^ Jump up to: а б с Соколов, Михаил (5 апреля 2003 г.). «ECMA-кириллица псевдоним iso-ir-111 болячка» . IETF Список рассылки кодировок .
- ^ «КОИ8 Унифицированный» . Программное обеспечение для кончиков пальцев. Архивировано из оригинала 9 января 1998 г. Проверено 11 февраля 2020 г.
- ^ Лейшер, Марк (2008) [1998-03-05]. «Таблица сопоставления унифицированной кириллицы KOI8 с Unicode 2.1» . Департамент математических наук Университета штата Нью-Мексико . Проверено 2 мая 2020 г.