КОИ8-RU
Язык(и) | Белорусский , Украинский , Русский , Болгарский |
---|---|
Классификация | 8-битный KOI , расширенный ASCII |
Расширяет | КОИ8-Б |
На основе | КОИ8-У , КОИ8-Р |
Другая связанная кодировка(и) | КОИ8-Э , КОИ8-Ф |
KOI8-RU — это 8-битная кодировка символов , предназначенная для русского , украинского и белорусского языков , использующих кириллицу . Он тесно связан с KOI8-R , который охватывает русский и болгарский языки , но заменяет десять символов графического рисунка пятью украинскими и белорусскими буквами Ґ , Є , І , Ї и Ў как в верхнем, так и в нижнем регистре. Он еще более тесно связан с КОИ8-У , который не включает Ў, но в остальном делает те же замены букв. Дополнительные буквы соответствуют KOI8-E , за исключением Ґ, который добавляется к KOI8-F .
В IBM KOI8-RU присвоена кодовая страница/ CCSID 1167. [1] [2]
KOI8 по-прежнему используется гораздо чаще, чем ISO 8859-5 , который так и не прижился. Другая распространенная кодировка символов кириллицы — Windows-1251 . В будущем оба могут в конечном итоге уступить место Unicode .
KOI8 stands for K od o bmena i nformatsiey, 8 bit ( Russian : К од о бмена и нформацией, 8 бит ) which means "Code for Information Exchange, 8 bit".
Наборы символов КОИ8 обладают тем свойством, что русские кириллические буквы расположены в псевдолатинском порядке, а не в естественном кириллическом алфавитном порядке, как в ISO 8859-5. Хотя это может показаться неестественным, у этого есть полезное свойство: даже если восьмой бит удален, текст все равно можно прочитать (или, по крайней мере, расшифровать) в транслитерации с обратным регистром на обычном терминале ASCII. Например, «Русский текст» в KOI8-RU становится «РУССКИЙ ТЕКСТ» («Русский текст»), если удалить 8-й бит.
Набор символов [ править ]
В следующей таблице показана кодировка KOI8-RU. Каждый символ отображается со своим эквивалентом кодовой точки Unicode .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО |
5x | П | вопрос | Р | С | Т | В | V | В | Х | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот |
7x | п | д | р | с | т | в | v | В | х | и | С | { | | | } | ~ | |
8x | ─ 2500 | │ 2502 | ┌ 250С | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251С | ┤ 2524 | ┬ 252С | ┴ 2534 | ┼ 253С | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258С | ▐ 2590 |
9x | ░ 2591 | ▒ 2592 | ▓ 2593 | “ [а] 201С | ■ 25А0 | ∙ 2219 | ” 201Д | — [а] 2014 | № 2116 | ™ [а] 2122 | НБСП | » 00BB | ® 00AE | « 00AB | · 00B7 | ¤ 00А4 |
Топор | ═ 2550 | ║ 2551 | ╒ 2552 | или 0451 | есть [б] [с] 0454 | ╔ 2554 | и [б] [с] 0456 | е [б] [с] 0457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255А | ╛ 255Б | ґ [б] 0491 | в [с] 045E | ╞ 255Э |
Бх | ╟ 255Ф | ╠ 2560 | ╡ 2561 | Или 0401 | Есть [б] [с] 0404 | ╣ 2563 | я [б] [с] 0406 | Ей [б] [с] 0407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256А | Г [б] 0490 | В [с] 040E | © 00A9 |
Сх | ю 044E | а 0430 | б 0431 | час 0446 | д 0434 | является 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | и 0439 | к 043А | л 043Б | м 043С | н 043D | о 043E |
Дх | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | же 0436 | в 0432 | ь 044C | й 044Б | с 0437 | ш 0448 | э 044D | щ 0449 | час 0447 | ъ 044А |
Бывший | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Хорошо 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | И 0419 | К 041А | л 041Б | М 041С | Н 041D | О 041E |
Форекс | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Же 0416 | В 0412 | Ь 042C | Да 042Б | С 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042А |
- ^ Jump up to: Перейти обратно: а б с Изменено относительно KOI8-R для соответствия Windows-1251 .
- ^ Jump up to: Перейти обратно: а б с д и ж г час Изменено относительно KOI8-R, чтобы соответствовать KOI8-U .
- ^ Jump up to: Перейти обратно: а б с д и ж г час Изменено относительно KOI8-R, чтобы соответствовать KOI8-E .
Хотя в RFC 2319 говорится, что символ 0x95 должен быть U+2219 (∙), он также может быть U+2022 (•), чтобы соответствовать символу маркера в Windows-1251 .
В некоторых ссылках есть опечатка и неверно указано, что символ 0xB4 — это U+0403, а не правильный U+0404. Эта опечатка присутствует в Приложении A к RFC 2319 (но таблица в основном тексте RFC дает правильное сопоставление).
См. также [ править ]
Ссылки [ править ]
- ^ «Информационный документ с кодовой страницей 1167» . Архивировано из оригинала 16 января 2017 г.
- ^ «Информационный документ CCSID 1167» . Архивировано из оригинала 27 марта 2016 г.
- ^ Лейшер, Марк (20 декабря 1999 г.), KOI8-RU Таблица сопоставления белорусской/украинской кириллицы с Unicode 2.1 , KOI8RU.TXT
- ^ Кодовая страница CPGID 01167 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 01167 (txt) , IBM
Внешние ссылки [ править ]
- Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.