КОИ8-RU
Язык(и) | Белорусский , Украинский , Русский , Болгарский |
---|---|
Классификация | 8-битный KOI , расширенный ASCII |
Расширяет | КОИ8-Б |
На основе | КОИ8-У , КОИ8-Р |
Другая связанная кодировка(и) | КОИ8-Э , КОИ8-Ф |
KOI8-RU — это 8-битная кодировка символов , предназначенная для русского , украинского и белорусского языков , использующих кириллицу . Он тесно связан с KOI8-R , который охватывает русский и болгарский языки , но заменяет десять символов графического рисунка пятью украинскими и белорусскими буквами Ґ , Є , І , Ї и Ў как в верхнем, так и в нижнем регистре. Он еще более тесно связан с КОИ8-У , который не включает Ў, но в остальном делает те же замены букв. Дополнительные буквы соответствуют KOI8-E , за исключением Ґ, который добавляется к KOI8-F .
В IBM KOI8-RU присвоена кодовая страница/ CCSID 1167. [1] [2]
KOI8 по-прежнему используется гораздо чаще, чем ISO 8859-5 , который так и не прижился. Другая распространенная кодировка символов кириллицы — Windows-1251 . В будущем оба могут уступить место Unicode .
KOI8 stands for K od o bmena i nformatsiey, 8 bit ( Russian : К од о бмена и нформацией, 8 бит ) which means "Code for Information Exchange, 8 bit".
Наборы символов КОИ8 обладают тем свойством, что русские кириллические буквы расположены в псевдолатинском порядке, а не в естественном кириллическом алфавитном порядке, как в ISO 8859-5. Хотя это может показаться неестественным, у этого есть то полезное свойство, что даже если восьмой бит удален, текст все равно можно прочитать (или, по крайней мере, расшифровать) в транслитерации с обратным регистром на обычном терминале ASCII. Например, «Русский Текст» в KOI8-RU становится РУССКИЙ ТЕКСТ («Русский Текст»), если удалить 8-й бит.
Набор символов [ править ]
В следующей таблице показана кодировка KOI8-RU. Каждый символ отображается с эквивалентной кодовой точкой Юникода .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О |
5x | п | вопрос | р | С | Т | В | V | В | Икс | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | Это | ж | г | час | я | дж | к | л | м | н | О |
7x | п | д | р | с | т | в | v | В | Икс | и | С | { | | | } | ~ | |
8x | ─ 2500 |
│ 2502 |
┌ 250С |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251С |
┤ 2524 |
┬ 252С |
┴ 2534 |
┼ 253С |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258С |
▐ 2590 |
9x | ░ 2591 |
▒ 2592 |
▓ 2593 |
“ [а] 201С |
■ 25А0 |
∙ 2219 |
” 201Д |
— [а] 2014 |
№ 2116 |
™ [а] 2122 |
НБСП | » 00BB |
® 00AE |
« 00AB |
· 00B7 |
¤ 00А4 |
Топор | ═ 2550 |
║ 2551 |
╒ 2552 |
или 0451 |
есть [б] [с] 0454 |
╔ 2554 |
и [б] [с] 0456 |
е [б] [с] 0457 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255А |
╛ 255Б |
ґ [б] 0491 |
в [с] 045E |
╞ 255Э |
Бх | ╟ 255Ф |
╠ 2560 |
╡ 2561 |
Или 0401 |
Есть [б] [с] 0404 |
╣ 2563 |
я [б] [с] 0406 |
Ей [б] [с] 0407 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256А |
Г [б] 0490 |
В [с] 040E |
© 00A9 |
Сх | ю 044E |
а 0430 |
б 0431 |
час 0446 |
д 0434 |
является 0435 |
ф 0444 |
г 0433 |
х 0445 |
и 0438 |
и 0439 |
к 043А |
л 043Б |
м 043С |
н 043D |
о 043E |
Дх | п 043F |
я 044F |
р 0440 |
с 0441 |
т 0442 |
у 0443 |
же 0436 |
в 0432 |
ь 044C |
й 044Б |
с 0437 |
ш 0448 |
э 044D |
щ 0449 |
час 0447 |
ъ 044А |
Бывший | Ю 042E |
А 0410 |
Б 0411 |
Ц 0426 |
Д 0414 |
Хорошо 0415 |
Ф 0424 |
Г 0413 |
Х 0425 |
И 0418 |
И 0419 |
К 041А |
л 041Б |
М 041С |
Н 041D |
О 041E |
Форекс | П 041F |
Я 042F |
Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
Же 0416 |
В 0412 |
Ь 042C |
Да 042Б |
С 0417 |
Ш 0428 |
Э 042D |
Щ 0429 |
Ч 0427 |
Ъ 042А |
Хотя в RFC 2319 говорится, что символ 0x95 должен быть U+2219 (∙), он также может быть U+2022 (•), чтобы соответствовать символу маркера в Windows-1251 .
В некоторых ссылках есть опечатка и неверно указано, что символ 0xB4 — это U+0403, а не правильный U+0404. Эта опечатка присутствует в Приложении A к RFC 2319 (но таблица в основном тексте RFC дает правильное сопоставление).
См. также [ править ]
Ссылки [ править ]
- ^ «Информационный документ с кодовой страницей 1167» . Архивировано из оригинала 16 января 2017 г.
- ^ «Информационный документ CCSID 1167» . Архивировано из оригинала 27 марта 2016 г.
- ^ Лейшер, Марк (20 декабря 1999 г.), KOI8-RU Таблица сопоставления белорусской/украинской кириллицы с Unicode 2.1 , KOI8RU.TXT
- ^ Кодовая страница CPGID 01167 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01167 (txt) , IBM
Внешние ссылки [ править ]
- Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.