Кодировки символов KOI
КОИ ( КОИ ) — семейство нескольких кодовых страниц для кириллицы .Название расшифровывается как бмена и об нформацией » , » что Код « « Кодекс означает . информацией для обмена
Особенностью кодовых страниц KOI является то, что текст остается удобочитаемым даже после удаления крайнего левого бита , если он случайно пройдет через оборудование или программное обеспечение, которое может обрабатывать только 7-битные символы. Это связано с тем, что символы располагаются в особом порядке (128 кодовых знаков, не считая латинской буквы, на которую они наиболее похожи по звучанию), который, однако, не соответствует алфавитному порядку ни на одном языке, написанном на кириллице, и обусловливает необходимость использования таблицы поиска для выполнения сортировки .
Эти кодировки произошли от ASCII на основе некоторого соответствия между латиницей и кириллицей (почти фонетического), которое уже использовалось в русском диалекте азбуки Морзе и в МТК-2 телеграфном коде . Первые 26 символов из А (0xE1) в KOI8-R — это А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, С, Т, У, Ж, В, Ь, Ы, З.
ТРЕБОВАНИЕ-7
[ редактировать ]Исходная кодировка KOI (1967 г.) представляла собой 7-битную кодовую страницу под названием KOI-7 ( КОИ-7 ), которая не содержала строчных букв.В КОИ-7 коды 31 или 32 русских букв упорядочены по латинским буквам. Остальные кодовые точки такие же, как в ASCII (однако знак доллара код 24 $ ( шестнадцатеричный ) может быть заменен универсальным знаком валюты ¤).
ТРЕБОВАНИЕ-8
[ редактировать ]КОИ-8 (КОИ-8), стандартизированный в 1974 году как ГОСТ 19768, представляет собой 8-битное расширение ASCII . [1] [2] Первоначально в нем было всего 32 строчные и 31 заглавная русские буквы.
Более поздние производные KOI-8 составляют семейство кодировок, известных как KOI8 , KOI8 и KOI-8 .
Членами семьи являются:
- КОИ8-Б (с Ё ё и Ъ ) [1]
- KOI8-R / KOI8-RUSSIA для русского и болгарского языков (RFC 1489). [3] ( Кодовая страница 878 )
- КОИ8-У / КОИ8-УКРАИНА для украинского языка (RFC 2319). [3] ( Кодовая страница 1168 )
- КОИ8-RU для украинского , белорусского и русского языков . [4] [5] [6] [7] [8] ( Кодовая страница 1167 )
- КОИ8-Т для таджикского языка . [9] ( Кодовая страница FreeDOS 62318 )
- КОИ8-С , также КОИ8-СА , предложение для Кавказа и Средней Азии ; почти никогда не использовался. [10] ( Кодовая страница FreeDOS 61294 )
- ИСО-ИР-111 / КОИ8-Э [11] (ECMA-113 (1-е изд., 1986 г.), [12] многоязычный для славянских языков).
- КОИ8-Ф , КОИ-8 Унифицированный. Включает распределение букв из KOI8-U и KOI8-E, а также подмножество псевдографики из KOI8-R. [13] [14] ( Кодовая страница FreeDOS 60270 )
- КОИ8-К1 «Кириллица-1» (определено в ЧСН 36 9103, СТ СЭВ 358–88)
- КОИ8-О (ранее КОИ8-С) для древнерусской орфографии . [15] ( Кодовая страница FreeDOS 63342 )
Кроме того, ГОСТ Р 34.303-92 определяет «КОИ-8 В1», что соответствует ISO-IR-153 , а также «КОИ-8 Н1» и «КОИ-8 Н2», которые являются вариантами кодовой страницы 866 . [16] Они не соответствуют компоновке КОИ-8.
ДКОИ
[ редактировать ]DKOI — это кодировка на основе EBCDIC, используемая в мейнфреймах ES EVM . Он определен несколькими стандартами: ГОСТ 19768-74/СТ СЭВ 358–76, СТ СЭВ 358-88/ГОСТ 19768–93, ЧСН 36 9103. [17]
Есть два варианта:
- ДКОИ К1 (ДКОИ К1), каждой букве кириллицы присвоен свой код.
- DKOI K2 (ДКОИ К2), some Cyrillic letters (А, В, Е, К, М, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) are merged with visually identical Latin letters.
Латинские варианты
[ редактировать ]Некоторые кодировки называются KOI, но определяют латинские алфавиты:
- КОИ8-CS [18] / КОИ8-CS2 [17] для чешского и словацкого языков (ČSN (Чешский технический стандарт) 369103, разработанный Comecon . Он кодировал латынь с диакритическими знаками , которые используются в чешском и словацком языках, а не кириллицу, но основная идея была той же - текст должен оставаться разборчивым с помощью 8 -ый бит очищается, например, Č становится C и т. д.).
- КОИ8-Л2 «Латиница-2» (определено в ЧСН 36 9103), ISO IR 139 [19] (почти идентичен ISO 8859-2 (1987), но в нем поменяны местами знак доллара и знак валюты)
- DKOI CS2 (определено в CSN 36 9103) [17]
- DKOI L2 (определен в CSN 36 9103) [17]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Чиборра, Роман (30 ноября 1998 г.) [25 мая 1998 г.]. «Суп с кириллицей» . Архивировано из оригинала 3 декабря 2016 г. Проверено 3 декабря 2016 г.
- ^ Флор, Гвидо; Чернов, Андрей А. (2016) [2006]. «Locale::RecodeData::KOI_8 — процедуры преобразования для KOI-8» . CPAN libintl-perl . 1.0. Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
- ^ Перейти обратно: а б да Круз, Фрэнк (2 апреля 2010 г.). «Имена наборов символов Кермит и MIME» . Проект Кермит . Колумбийский университет , Нью-Йорк, США. Архивировано из оригинала 3 декабря 2016 г. Проверено 2 декабря 2016 г.
- ^ Демченко, Юрий В. (13 ноября 1997 г.). Регистрация украинского набора символов кириллицы KOI8-RU (как расширение русского KOI8-R и ISO-IR-111) (Отчет). Рабочая группа по интернет-инжинирингу.
- ^ Флор, Гвидо (2016) [2006]. "Locale::RecodeData::KOI8_RU - Процедуры преобразования для KOI8-RU" . CPAN libintl-perl . Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
- ^ «Информация о кодовой странице SBCS — CPGID: 01167 / Название: Белорусский/Украинский KOI8-RU» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . ИБМ . СН 3-3220-050. Архивировано из оригинала 18 февраля 2017 г. Проверено 18 февраля 2017 г. [1] [2]
- ^ «Информационный документ CCSID; CCSID 1167; КОИ8-RU» . ИБМ . Архивировано из оригинала 18 февраля 2017 г. Проверено 18 февраля 2017 г.
- ^ Лейшер, Марк (2008) [1999-12-20]. «Таблица сопоставления белорусской/украинской кириллицы KOI8-RU с Unicode 2.1» . Департамент математических наук Университета штата Нью-Мексико. Архивировано из оригинала 19 февраля 2017 г. Проверено 18 февраля 2017 г.
- ^ Флор, Гвидо; Дэвис, Майкл (2016) [2006]. «Locale::RecodeData::KOI8_T — процедуры преобразования для KOI8-T» . CPAN libintl-perl . Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
- ^ Обсуждение
- ^ «Наборы символов IANA» .
- ^ ЭКМА-113. Наборы 8-битных однобайтовых графических символов - латиница/кириллица (1-е изд., июнь 1986 г.)
- ^ "Кодировки кириллицы (Charsets). Небольшое описание" .
- ^ Лейшер, Марк (2008) [1998-03-05]. «Таблица сопоставления унифицированной кириллицы KOI8 с Unicode 2.1» . Департамент математических наук Университета штата Нью-Мексико. Архивировано из оригинала 19 февраля 2017 г. Проверено 18 февраля 2017 г.
- ^ Виницкий, Серж (29 января 2002 г.). КОИ8-С (Отчет). Рабочая группа по интернет-инжинирингу.
- ^ (in Russian) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = 8-bit coded character sets. 8-bit code for information interchange.
- ^ Перейти обратно: а б с д Петрлик, Лукас (19 июня 1996 г.). «Объяснение беспорядка с кодировкой чешских и словацких символов» . cs-кодировки-часто задаваемые вопросы . 1.10. Архивировано из оригинала 21 июня 2016 г. Проверено 21 июня 2016 г.
- ^ «Станислав Печа — ASCII» . Архивировано из оригинала 21 марта 2011 г. Проверено 19 апреля 2011 г.
- ^ ИСО-ИР-139
Дальнейшее чтение
[ редактировать ]- Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Фрэнк; Дэвис, Бер; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Симонсен, Келд Дж.; Тобе, Гленн Э.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по КИРИЛЛИЧЕСКОЙ КОДИРОВКЕ Версия 1.3» . 1.3 . Проверено 18 февраля 2017 г.
- «Кодировки и наборы символов » Robotron Technik (Виртуальный компьютерный музей) (на немецком языке). 29 ноября 2016 г. Код ASCII/код KOI . Проверено 21 февраля 2017 г.
Внешние ссылки
[ редактировать ]- «Дом KOI8-R с 1995 года» . 1995 . Проверено 5 декабря 2016 г.
- Хохлов, Ю. Е. «Представление кириллической информации в электронном виде – таблицы наборов символов (кодовых страниц)» . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.
- Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.