Jump to content

КОИ8-RU

КОИ8-RU
Язык(и) Белорусский , Украинский , Русский , Болгарский
Классификация 8-битный KOI , расширенный ASCII
Расширяет КОИ8-Б
На основе КОИ8-У , КОИ8-Р
Другая связанная кодировка(и) КОИ8-Э , КОИ8-Ф

KOI8-RU — это 8-битная кодировка символов , предназначенная для русского , украинского и белорусского языков , использующих кириллицу . Он тесно связан с KOI8-R , который охватывает русский и болгарский языки , но заменяет десять символов графического рисунка пятью украинскими и белорусскими буквами Ґ , Є , І , Ї и Ў как в верхнем, так и в нижнем регистре. Он еще более тесно связан с КОИ8-У , который не включает Ў, но в остальном делает те же замены букв. Дополнительные буквы соответствуют KOI8-E , за исключением Ґ, который добавляется к KOI8-F .

В IBM KOI8-RU присвоена кодовая страница/ CCSID 1167. [1] [2]

KOI8 по-прежнему используется гораздо чаще, чем ISO 8859-5 , который так и не прижился. Другая распространенная кодировка символов кириллицы — Windows-1251 . В будущем оба могут в конечном итоге уступить место Unicode .

KOI8 stands for K od o bmena i nformatsiey, 8 bit ( Russian : К од о бмена и нформацией, 8 бит ) which means "Code for Information Exchange, 8 bit".

Наборы символов КОИ8 обладают тем свойством, что русские кириллические буквы расположены в псевдолатинском порядке, а не в естественном кириллическом алфавитном порядке, как в ISO 8859-5. Хотя это может показаться неестественным, у этого есть полезное свойство: даже если восьмой бит удален, текст все равно можно прочитать (или, по крайней мере, расшифровать) в транслитерации с обратным регистром на обычном терминале ASCII. Например, «Русский текст» в KOI8-RU становится «РУССКИЙ ТЕКСТ» («Русский текст»), если удалить 8-й бит.

Набор символов [ править ]

В следующей таблице показана кодировка KOI8-RU. Каждый символ отображается со своим эквивалентом кодовой точки Unicode .

КОИ8-RU [3] [4] [5]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x
2x  СП  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф Г ЧАС я Дж К л М Н ТО
5x П вопрос Р С Т В V В Х И С [ \ ] ^ _
6x ` а б с д и ж г час я дж к л м н тот
7x п д р с т в v В х и С { | } ~
8x
2500

2502

250С

2510

2514

2518

251С

2524

252С

2534

253С

2580

2584

2588

258С

2590
9x
2591

2592

2593
[а]
201С

25А0

2219

201Д
[а]
2014

2116
[а]
2122
НБСП »
00BB
®
00AE
«
00AB
·
00B7
¤
00А4
Топор
2550

2551

2552
или
0451
есть [б] [с]
0454

2554
и [б] [с]
0456
е [б] [с]
0457

2557

2558

2559

255А

255Б
ґ [б]
0491
в [с]
045E

255Э
Бх
255Ф

2560

2561
Или
0401
Есть [б] [с]
0404

2563
я [б] [с]
0406
Ей [б] [с]
0407

2566

2567

2568

2569

256А
Г [б]
0490
В [с]
040E
©
00A9
Сх ю
044E
а
0430
б
0431
час
0446
д
0434
является
0435
ф
0444
г
0433
х
0445
и
0438
и
0439
к
043А
л
043Б
м
043С
н
043D
о
043E
Дх п
043F
я
044F
р
0440
с
0441
т
0442
у
0443
же
0436
в
0432
ь
044C
й
044Б
с
0437
ш
0448
э
044D
щ
0449
час
0447
ъ
044А
Бывший Ю
042E
А
0410
Б
0411
Ц
0426
Д
0414
Хорошо
0415
Ф
0424
Г
0413
Х
0425
И
0418
И
0419
К
041А
л
041Б
М
041С
Н
041D
О
041E
Форекс П
041F
Я
042F
Р
0420
С
0421
Т
0422
У
0423
Же
0416
В
0412
Ь
042C
Да
042Б
С
0417
Ш
0428
Э
042D
Щ
0429
Ч
0427
Ъ
042А
  Отличия от КОИ8-Р
  1. ^ Jump up to: Перейти обратно: а б с Изменено относительно KOI8-R для соответствия Windows-1251 .
  2. ^ Jump up to: Перейти обратно: а б с д и ж г час Изменено относительно KOI8-R, чтобы соответствовать KOI8-U .
  3. ^ Jump up to: Перейти обратно: а б с д и ж г час Изменено относительно KOI8-R, чтобы соответствовать KOI8-E .

Хотя в RFC 2319 говорится, что символ 0x95 должен быть U+2219 (∙), он также может быть U+2022 (•), чтобы соответствовать символу маркера в Windows-1251 .

В некоторых ссылках есть опечатка и неверно указано, что символ 0xB4 — это U+0403, а не правильный U+0404. Эта опечатка присутствует в Приложении A к RFC 2319 (но таблица в основном тексте RFC дает правильное сопоставление).

См. также [ править ]

Ссылки [ править ]

  1. ^ «Информационный документ с кодовой страницей 1167» . Архивировано из оригинала 16 января 2017 г.
  2. ^ «Информационный документ CCSID 1167» . Архивировано из оригинала 27 марта 2016 г.
  3. ^ Лейшер, Марк (20 декабря 1999 г.), KOI8-RU Таблица сопоставления белорусской/украинской кириллицы с Unicode 2.1 , KOI8RU.TXT
  4. ^ Кодовая страница CPGID 01167 (pdf) (PDF) , IBM
  5. ^ Кодовая страница CPGID 01167 (txt) , IBM

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 24bfb18cb8941b819b242e0938e9b837__1708675560
URL1:https://arc.ask3.ru/arc/aa/24/37/24bfb18cb8941b819b242e0938e9b837.html
Заголовок, (Title) документа по адресу, URL1:
KOI8-RU - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)