Jump to content

КОИ8-У

КОИ8-У
Язык(и) украинец , русский , болгарин
Классификация 8-битный KOI , расширенный ASCII
Расширяет КОИ8-Б
На основе КОИ8-Р
Другая связанная кодировка(и) КОИ8-РУ , КОИ8-Ф

KOI8-U (RFC 2319) — 8-битная кодировка символов , предназначенная для покрытия украинского языка , использующая кириллицу . Он основан на KOI8-R , который охватывает русский и болгарский языки , но заменяет восемь символов графического рисунка четырьмя украинскими буквами Ґ , Є , І и Ї как в верхнем, так и в нижнем регистре.

KOI8-RU тесно связан, но добавляет Ў для белорусского языка . В обоих случаях расположение букв соответствует таковому в KOI8-E , за исключением Ґ, которое добавляется к KOI8-F .

В Microsoft Windows KOI8-U присвоен номер кодовой страницы 21866. В IBM KOI8-U присвоена кодовая страница/ CCSID 1168. [1] [2] [3]

KOI8 по-прежнему используется гораздо чаще, чем ISO 8859-5 , который так и не прижился. Другая распространенная кодировка символов кириллицы — Windows-1251 . В будущем оба могут в конечном итоге уступить место Unicode .

KOI8 stands for Kod Obmena Informatsiey, 8 bit ( Russian : Код Обмена Информацией, 8 бит ) which means "Code for Information Exchange, 8 bit".

Наборы символов КОИ8 обладают тем свойством, что русские кириллические буквы расположены в псевдолатинском порядке, а не в естественном кириллическом алфавитном порядке, как в ISO 8859-5. Хотя это может показаться неестественным, у этого есть полезное свойство: даже если восьмой бит удален, текст все равно можно прочитать (или, по крайней мере, расшифровать) в транслитерации с обратным регистром на обычном терминале ASCII. Например, «Русский текст» в KOI8-U становится «РУССКИЙ ТЕКСТ» («Русский текст»), если удалить 8-й бит.

Набор символов [ править ]

В следующей таблице показана кодировка KOI8-U. [1] [4] Каждый символ отображается со своим эквивалентом кодовой точки Unicode .

КОИ8-У
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x
2x  СП  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф Г ЧАС я Дж К л М Н ТО
5x П вопрос Р С Т В V В Х И С [ \ ] ^ _
6x ` а б с д и ж г час я дж к л м н тот
7x п д р с т в v В х и С { | } ~
8x
2500

2502

250С

2510

2514

2518

251С

2524

252С

2534

253С

2580

2584

2588

258С

2590
9x
2591

2592

2593

2320

25А0

2219

221А

2248

2264

2265
НБСП
2321
°
00B0
²
00B2
·
00B7
÷
00F7
Топор
2550

2551

2552
или
0451
есть
0454

2554
и
0456
е
0457

2557

2558

2559

255А

255Б
ґ
0491

255Д

255Э
Бх
255Ф

2560

2561
Или
0401
Есть
0404

2563
я
0406
Ей
0407

2566

2567

2568

2569

256А
Г
0490

256С
©
00A9
Сх ю
044E
а
0430
б
0431
час
0446
д
0434
является
0435
ф
0444
г
0433
х
0445
и
0438
и
0439
к
043А
л
043Б
м
043С
н
043D
о
043E
Дх п
043F
я
044F
р
0440
с
0441
т
0442
у
0443
же
0436
в
0432
ь
044C
й
044Б
с
0437
ш
0448
э
044D
щ
0449
час
0447
ъ
044А
Бывший Ю
042E
А
0410
Б
0411
Ц
0426
Д
0414
Хорошо
0415
Ф
0424
Г
0413
Х
0425
И
0418
И
0419
К
041А
л
041Б
М
041С
Н
041D
О
041E
Форекс П
041F
Я
042F
Р
0420
С
0421
Т
0422
У
0423
Же
0416
В
0412
Ь
042C
Да
042Б
С
0417
Ш
0428
Э
042D
Щ
0429
Ч
0427
Ъ
042А
  Отличия от КОИ8-Р (нерусские буквы)

Хотя в RFC 2319 говорится, что символ 0x95 должен быть U+2219 (∙), он также может быть U+2022 (•), чтобы соответствовать символу маркера в Windows-1251 .

В некоторых ссылках есть опечатка и неверно указано, что символ 0xB4 — это U+0403, а не правильный U+0404. Эта опечатка присутствует в Приложении A к RFC 2319 (но таблица в основном тексте RFC дает правильное сопоставление).

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б «Информация о кодовой странице SBCS — CPGID: 01168 / Название: Украинский КОИ8-У» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . ИБМ . СН 3-3220-050. Архивировано из оригинала 18 февраля 2017 г. Проверено 18 февраля 2017 г. [1] [2]
  2. ^ «Информационный документ CCSID; CCSID 1168; КОИ8-У» . ИБМ . Архивировано из оригинала 18 февраля 2017 г. Проверено 18 февраля 2017 г.
  3. ^ Международные компоненты для Unicode (ICU), ibm-1168_P100-2002.ucm , 3 декабря 2002 г.
  4. ^ Верди, Филипп; Рихтер, Хельмут (04 января 2016 г.) [13 октября 2008 г.]. «КОИ8-У.TXT» . 2.0 . Проверено 9 декабря 2016 г.

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6db74e41e52048f2120a5fabb73ae79e__1695828000
URL1:https://arc.ask3.ru/arc/aa/6d/9e/6db74e41e52048f2120a5fabb73ae79e.html
Заголовок, (Title) документа по адресу, URL1:
KOI8-U - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)