КОИ8-Р
Псевдоним(а) | cp878 ( кодовая страница 878) |
---|---|
Язык(и) | русский , болгарский |
Классификация | 8-битный KOI , расширенный ASCII |
Расширяет | КОИ8-Б |
На основе | ТРЕБОВАНИЕ-8 |
Другая связанная кодировка(и) | КОИ8-У , КОИ8-РУ |
КОИ8-Р (RFC 1489) — 8-битная кодировка символов , созданная на основе кодировки КОИ-8 программистом Андреем Черновым в 1993 году и предназначенная для покрытия русского языка , использующего кириллицу . КОИ8-Р был основан на русской азбуке Морзе , которая была создана на основе фонетической версии латинской азбуки Морзе . В результате русские кириллические буквы располагаются в псевдолатинском порядке, а не в обычном кириллическом алфавитном порядке. Хотя это может показаться неестественным, если удалить 8-й бит, текст частично читается в ASCII и может быть преобразован в синтаксически правильный KOI-7 . Например, «Русский Текст» в KOI8-R становится РУССКИЙ ТЕКСТ («Русский Текст»).
КОИ8 расшифровывается как Код Обмена Информацией, 8 бит ( русский : Код Обмена Информацией, 8 бит ), что означает «Код обмена информацией, 8 бит». В Microsoft Windows KOI8-R присвоен номер кодовой страницы 20866. В IBM KOI8-R присвоен номер кодовой страницы 878. [1] [2] KOI8-R также охватывает болгарский язык , но не использовался для этой цели с момента CP1251 принятия . Использование этих старых кодовых страниц заменяется Unicode как более распространенным способом представления кириллицы вместе с другими языками.
Unicode предпочтительнее KOI-8 В современных приложениях, особенно в Интернете, и его вариантов или других кодировок кириллицы, что делает UTF-8 доминирующей кодировкой для веб-страниц. KOI8-R, самый популярный вариант, используется менее чем на 0,004% веб-сайтов, в основном русских и болгарских. Однако обе группы предпочитают другие кодировки. [ нужна цитата ] Для дальнейшего обсуждения полного покрытия Unicode 436 кириллических букв/кодовых точек, включая старую кириллицу , и того, как однобайтовые кодировки символов, такие как варианты Windows-1251 и KOI8, не могут этого обеспечить, см. раздел «Кириллица в Unicode» .
Набор символов [ править ]
В следующей таблице показана кодировка KOI8-R. Каждый символ отображается с эквивалентной кодовой точкой Юникода .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О |
5x | п | вопрос | р | С | Т | В | V | В | Икс | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | Это | ж | г | час | я | дж | к | л | м | н | О |
7x | п | д | р | с | т | в | v | В | Икс | и | С | { | | | } | ~ | |
8x | ─ 2500 |
│ 2502 |
┌ 250С |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251С |
┤ 2524 |
┬ 252С |
┴ 2534 |
┼ 253С |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258С |
▐ 2590 |
9x | ░ 2591 |
▒ 2592 |
▓ 2593 |
⌠ 2320 |
■ 25А0 |
∙ 2219 |
√ 221А |
≈ 2248 |
≤ 2264 |
≥ 2265 |
НБСП | ⌡ 2321 |
° 00B0 |
² 00B2 |
· 00B7 |
÷ 00F7 |
Топор | ═ 2550 |
║ 2551 |
╒ 2552 |
или 0451 |
╓ 2553 |
╔ 2554 |
╕ 2555 |
╖ 2556 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255А |
╛ 255Б |
╜ 255С |
╝ 255Д |
╞ 255Э |
Бх | ╟ 255Ф |
╠ 2560 |
╡ 2561 |
Или 0401 |
╢ 2562 |
╣ 2563 |
╤ 2564 |
╥ 2565 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256А |
╫ 256Б |
╬ 256С |
© 00A9 |
Сх | ю 044E |
а 0430 |
б 0431 |
час 0446 |
д 0434 |
является 0435 |
ф 0444 |
г 0433 |
х 0445 |
и 0438 |
и 0439 |
к 043А |
л 043Б |
м 043С |
н 043D |
о 043E |
Дх | п 043F |
я 044F |
р 0440 |
с 0441 |
т 0442 |
у 0443 |
же 0436 |
в 0432 |
ь 044C |
й 044Б |
с 0437 |
ш 0448 |
э 044D |
щ 0449 |
час 0447 |
ъ 044А |
Бывший | Ю 042E |
А 0410 |
Б 0411 |
Ц 0426 |
Д 0414 |
Хорошо 0415 |
Ф 0424 |
Г 0413 |
Х 0425 |
И 0418 |
И 0419 |
К 041А |
л 041Б |
М 041С |
Н 041D |
О 041E |
Форекс | П 041F |
Я 042F |
Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
Же 0416 |
В 0412 |
Ь 042C |
Да 042Б |
С 0417 |
Ш 0428 |
Э 042D |
Щ 0429 |
Ч 0427 |
Ъ 042А |
См. также [ править ]
- KOI8-B , производное от KOI8-R, в котором реализовано только подмножество букв.
- КОИ8-У , еще одна производная кодировка, добавляющая украинские символы.
- Кодировки символов KOI
- РЕЛКОМ
- Windows-1251 , еще одна распространенная кодировка кириллицы.
Ссылки [ править ]
- ^ «Информация о кодовой странице SBCS — CPGID: 00878 / Название: Русский интернет koi8-r» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . ИБМ . СН 3-3220-050. Архивировано из оригинала 18 февраля 2017 г. Проверено 18 февраля 2017 г.
- ^ «Информационный документ CCSID; CCSID 878; KOI8-R КИРИЛЛИЦА» . ИБМ . Проверено 18 февраля 2017 г.
- ^ Рихтер, Хельмут (04 января 2016 г.) [18 августа 1999 г.]. «КОИ8-Р.TXT» . 2.0 . Проверено 9 декабря 2016 г.
- ^ Кодовая страница CPGID 00878 (pdf) (PDF) , IBM
- ^ Кодовая страница CPGID 00878 (txt) , IBM
- ^ Международные компоненты для Unicode (ICU), ibm-878_P100-1996.ucm , 3 декабря 2002 г.
Дальнейшее чтение [ править ]
- Флор, Гвидо; Поцелуй, Габор; Чернов, Андрей А. (2016) [2006]. «Locale::RecodeData::KOI8_R — процедуры преобразования для KOI8-R» . CPAN libintl-perl . 1.0. Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
- Костис, Коста. "koi8-r (русская кодировка U*IX, также используется РЭЛКОМ)" . 1.20. Архивировано из оригинала 16 января 2017 г. Проверено 16 января 2017 г.
- РФК 1489
- «КОИ8-Р (RFC 1489)» . Кермит . Колумбийский университет . Проверено 24 июня 2020 г.
- Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Фрэнк; Дэвис, Бер; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Симонсен, Келд Дж.; Тобе, Гленн Э.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по КИРИЛЛИЧЕСКОЙ КОДИРОВКЕ Версия 1.3» . 1.3 . Проверено 24 июня 2020 г.
Внешние ссылки [ править ]
- Универсальный декодер кириллицы — онлайн-программа, которая поможет восстановить кириллические тексты с неработающими кодировками KOI8-R или другими кодировками символов .
- «Дом KOI8-R с 1995 года» . 1995 . Проверено 5 декабря 2016 г.
- Чиборра, Роман (30 ноября 1998 г.) [25 мая 1998 г.]. «Суп с кириллицей» . Архивировано из оригинала 3 декабря 2016 г. Проверено 3 декабря 2016 г.
- Хохлов, Ю. Е. «Представление кириллической информации в электронном виде – таблицы наборов символов (кодовых страниц)» . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.
- Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.