ИСО-ИР-111
Псевдоним(а) | ИСО-ИР-111 |
---|---|
Язык(и) | Русский , Белорусский , Македонский , Сербский , Украинский (частично) |
Стандартный | ECMA-113:1986 |
Классификация | Расширенный ASCII , KOI |
Расширяет | КОИ8-Б |
Преемник | ECMA-113:1988 ( ISO-8859-5 ) |
Другая связанная кодировка(и) | КОИ8-Ф |
ИСО-ИР-111 [1] или КОИ8-Е [2] представляет собой 8-битный набор символов. Это международное расширение KOI-8 для белорусского , македонского , сербского и украинского языков (кроме Ґ ґ, который добавляется к KOI8-F ). Название «ISO-IR-111» относится к его регистрационному номеру в реестре ISO-IR и обозначает его как набор, который можно использовать с ISO/IEC 2022 .
Это было определено в первом (1986 г.) издании ECMA-113, [3] который является международным стандартом Ecma, соответствующим ISO/IEC 8859-5 , и, как таковой, также соответствует черновой версии ISO-8859-5 1987 года. [4] Опубликованные редакции ISO/IEC 8859-5 вместо этого соответствуют последующим редакциям ECMA-113, которые определяют другую кодировку. [5]
Путаница в именах [ править ]
ISO-IR-111, версия ECMA-113 1985 года (также называемая «ECMA-кириллица» или «KOI8-E»), была основана на редакции ГОСТ 19768 1974 года (т.е. KOI-8 ). В 1987 году ECMA-113 был модернизирован. [5] Эти новые редакции ECMA-113 эквивалентны ISO-8859-5 . [5] [6] и не следуйте макету KOI. Эта путаница привела к распространенному заблуждению, что ISO-8859-5 был определен в ГОСТ 19768-74 или основан на нем. [6]
Возможно, как еще одно следствие этого, В RFC 1345 ошибочно указана другая кодовая страница под именами «ISO-IR-111» и «ECMA-Cyrillic», напоминающая ISO-8859-5 с переупорядоченными строками и частично совместимая с Windows-1251 . [7] [6] Из-за опасений, что существующие реализации могут использовать определение RFC 1345 для этих двух меток, было предложено, чтобы IANA дополнительно признала KOI8-E
в качестве метки содержимого ECMA-113:1985, [7] и IANA в настоящее время перечисляет этот ярлык как псевдоним. [2]
Набор символов [ править ]
В следующей таблице показана кодировка ISO-IR-111. Каждый символ отображается с эквивалентной кодовой точкой Юникода .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О |
5x | п | вопрос | р | С | Т | В | V | В | Икс | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | Это | ж | г | час | я | дж | к | л | м | н | О |
7x | п | д | р | с | т | в | v | В | Икс | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | д 0452 |
ж 0453 |
или 0451 |
есть 0454 |
дж 0455 |
и 0456 |
е 0457 |
дж 0458 |
Л Джей 0459 |
Нью-Джерси 045А |
час 045Б |
д 045С |
ЗАСТЕНЧИВЫЙ | в 045E |
дж 045F |
Бх | № 2116 |
Đ 0402 |
Ф 0403 |
Или 0401 |
Есть 0404 |
С 0405 |
я 0406 |
Ей 0407 |
Дж 0408 |
Л Джей 0409 |
Нью-Джерси 040А |
Ć 040Б |
К 040С |
¤ 00А4 |
В 040E |
Дж 040F |
Сх | ю 044E |
а 0430 |
б 0431 |
час 0446 |
д 0434 |
является 0435 |
ф 0444 |
г 0433 |
х 0445 |
и 0438 |
и 0439 |
к 043А |
л 043Б |
м 043С |
н 043D |
о 043E |
Дх | п 043F |
я 044F |
р 0440 |
с 0441 |
т 0442 |
у 0443 |
же 0436 |
в 0432 |
ь 044C |
й 044Б |
с 0437 |
ш 0448 |
э 044D |
щ 0449 |
час 0447 |
ъ 044А |
Бывший | Ю 042E |
А 0410 |
Б 0411 |
Ц 0426 |
Д 0414 |
Хорошо 0415 |
Ф 0424 |
Г 0413 |
Х 0425 |
И 0418 |
И 0419 |
К 041А |
л 041Б |
М 041С |
Н 041D |
О 041E |
Форекс | П 041F |
Я 042F |
Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
Же 0416 |
В 0412 |
Ь 042C |
Да 042Б |
С 0417 |
Ш 0428 |
Э 042D |
Щ 0429 |
Ч 0427 |
Ъ 042А |
Расширенные и модифицированные версии [ править ]
Модифицированная версия под названием KOI8 Unified или KOI8-F использовалась в программном обеспечении, созданном Fingertip Software, с добавлением Ґ в его KOI8-U местоположении (заменив мягкий дефис и сместив универсальный знак валюты ), а также добавив некоторые графические символы в элемент управления C1. область кодов , в основном из КОИ8-Р и Windows-1251 . [4] [6] [8] [9]
Неверная кодовая страница RFC 1345 [ править ]
Язык(и) | Русский , Белорус , Македонский , Сербский |
---|---|
Стандартный | РФК 1345 |
Классификация | Расширенный ASCII |
Преобразует/кодирует | ИСО-ИР-111 |
Другая связанная кодировка(и) | ИСО-8859-5 , Windows-1251 |
В RFC 1345 ошибочно указана другая кодовая страница под названием ISO-IR-111, кодирующая те же символы кириллицы, но с другой раскладкой. Он напоминает смесь Windows-1251 и ISO-8859-5 . [7] В частности, строка A_ соответствует ISO-8859-5, строки от C_ до F_ соответствуют Windows-1251. [6] (эквивалентны строкам от B_ до E_ в ISO-8859-5), а строка B_ почти соответствует строке F_ из ISO-8859-5, за исключением того, что § заменяется на ¤ .
Некоторые коды напоминают ISO-IR-111 с перевернутым регистром букв, что могло привести к путанице. Большинство из них отличаются и показаны ниже.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
Топор | НБСП | Или | Đ | Ф | Есть | С | я | Ей | Дж | Л Джей | Нью-Джерси | Ć | К | ЗАСТЕНЧИВЫЙ | В | Дж |
Бх | № | или | д | ж | есть | дж | и | е | дж | Л Джей | Нью-Джерси | час | д | ¤ | в | дж |
Сх | А | Б | В | Г | Д | Хорошо | Же | С | И | И | К | л | М | Н | О | П |
Дх | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Да | Ь | Э | Ю | Я |
Бывший | а | б | в | г | д | является | же | с | и | и | к | л | м | н | о | п |
Форекс | р | с | т | у | ф | х | час | час | ш | щ | ъ | й | ь | э | ю | я |
См. также [ править ]
Ссылки [ править ]
- ^ ECMA (1 августа 1985 г.). Правая часть кириллицы (PDF) . ITSCJ/ IPSJ . ИСО-ИК -111.
- ^ Перейти обратно: а б «Наборы символов» . ИАНА.
- ^ ЭКМА-113. Наборы 8-битных однобайтовых графических символов - латиница/кириллица (1-е изд., июнь 1986 г.)
- ^ Перейти обратно: а б Чиборра, Роман (30 ноября 1998 г.) [25 мая 1998 г.]. «Суп с кириллицей» . Архивировано из оригинала 3 декабря 2016 г. Проверено 3 декабря 2016 г.
- ^ Перейти обратно: а б с ЭКМА-113. Наборы 8-битных однобайтовых графических символов - латиница/кириллица (2-е изд., июнь 1988 г.)
- ^ Перейти обратно: а б с д Это Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.
- ^ Перейти обратно: а б с Соколов, Михаил (5 апреля 2003 г.). "ECMA-кириллица псевдоним iso-ir-111 болячка" . IETF Список рассылки кодировок .
- ^ «КОИ8 Унифицированный» . Программное обеспечение для кончиков пальцев. Архивировано из оригинала 9 января 1998 г. Проверено 11 февраля 2020 г.
- ^ Лейшер, Марк (2008) [1998-03-05]. «Таблица сопоставления унифицированной кириллицы KOI8 с Unicode 2.1» . Департамент математических наук Университета штата Нью-Мексико . Проверено 2 мая 2020 г.