Jump to content

Кодировки символов KOI

(Перенаправлено с 8-битной кириллицы DEC )

КОИ ( КОИ ) — семейство нескольких кодовых страниц для кириллицы .Название расшифровывается как бмена и об нформацией » , » что Код « « Кодекс означает . информацией для обмена

Особенностью кодовых страниц KOI является то, что текст остается удобочитаемым даже после удаления крайнего левого бита , если он случайно пройдет через оборудование или программное обеспечение, которое может обрабатывать только 7-битные символы. Это связано с тем, что символы располагаются в особом порядке (128 кодовых знаков, не считая латинской буквы, на которую они наиболее похожи по звучанию), который, однако, не соответствует алфавитному порядку ни на одном языке, написанном на кириллице, и обусловливает необходимость использования таблицы поиска для выполнения сортировки .

Эти кодировки произошли от ASCII на основе некоторого соответствия между латиницей и кириллицей (почти фонетического), которое уже использовалось в русском диалекте азбуки Морзе и в МТК-2 телеграфном коде . Первые 26 символов из А (0xE1) в KOI8-R — это А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, С, Т, У, Ж, В, Ь, Ы, З.

ТРЕБОВАНИЕ-7

[ редактировать ]

Исходная кодировка KOI (1967 г.) представляла собой 7-битную кодовую страницу под названием KOI-7 ( КОИ-7 ), которая не содержала строчных букв.В КОИ-7 коды 31 или 32 русских букв упорядочены по латинским буквам. Остальные кодовые точки такие же, как в ASCII (однако знак доллара код 24 $ ( шестнадцатеричный ) может быть заменен универсальным знаком валюты ¤).

ТРЕБОВАНИЕ-8

[ редактировать ]

КОИ-8 (КОИ-8), стандартизированный в 1974 году как ГОСТ 19768, представляет собой 8-битное расширение ASCII . [1] [2] Первоначально в нем было всего 32 строчные и 31 заглавная русские буквы.

Более поздние производные KOI-8 составляют семейство кодировок, известных как KOI8 , KOI8 и KOI-8 .

Членами семьи являются:

Кроме того, ГОСТ Р 34.303-92 определяет «КОИ-8 В1», что соответствует ISO-IR-153 , а также «КОИ-8 Н1» и «КОИ-8 Н2», которые являются вариантами кодовой страницы 866 . [16] Они не соответствуют компоновке КОИ-8.

DKOI — это кодировка на основе EBCDIC, используемая в мейнфреймах ES EVM . Он определен несколькими стандартами: ГОСТ 19768-74/СТ СЭВ 358–76, СТ СЭВ 358-88/ГОСТ 19768–93, ЧСН 36 9103. [17]

Есть два варианта:

  • ДКОИ К1 (ДКОИ К1), каждой букве кириллицы присвоен свой код.
  • DKOI K2 (ДКОИ К2), some Cyrillic letters (А, В, Е, К, М, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) are merged with visually identical Latin letters.

Латинские варианты

[ редактировать ]

Некоторые кодировки называются KOI, но определяют латинские алфавиты:

  • КОИ8-CS [18] / КОИ8-CS2 [17] для чешского и словацкого языков (ČSN (Чешский технический стандарт) 369103, разработанный Comecon . Он кодировал латынь с диакритическими знаками , которые используются в чешском и словацком языках, а не кириллицу, но основная идея была той же - текст должен оставаться разборчивым с помощью 8 -ый бит очищается, например, Č становится C и т. д.).
  • КОИ8-Л2 «Латиница-2» (определено в ЧСН 36 9103), ISO IR 139 [19] (почти идентичен ISO 8859-2 (1987), но в нем поменяны местами знак доллара и знак валюты)
  • DKOI CS2 (определено в CSN 36 9103) [17]
  • DKOI L2 (определен в CSN 36 9103) [17]
  1. ^ Перейти обратно: а б Чиборра, Роман (30 ноября 1998 г.) [25 мая 1998 г.]. «Суп с кириллицей» . Архивировано из оригинала 3 декабря 2016 г. Проверено 3 декабря 2016 г.
  2. ^ Флор, Гвидо; Чернов, Андрей А. (2016) [2006]. «Locale::RecodeData::KOI_8 — процедуры преобразования для KOI-8» . CPAN libintl-perl . 1.0. Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
  3. ^ Перейти обратно: а б да Круз, Фрэнк (2 апреля 2010 г.). «Имена наборов символов Кермит и MIME» . Проект Кермит . Колумбийский университет , Нью-Йорк, США. Архивировано из оригинала 3 декабря 2016 г. Проверено 2 декабря 2016 г.
  4. ^ Демченко, Юрий В. (13 ноября 1997 г.). Регистрация украинского набора символов кириллицы KOI8-RU (как расширение русского KOI8-R и ISO-IR-111) (Отчет). Рабочая группа по интернет-инжинирингу.
  5. ^ Флор, Гвидо (2016) [2006]. "Locale::RecodeData::KOI8_RU - Процедуры преобразования для KOI8-RU" . CPAN libintl-perl . Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
  6. ^ «Информация о кодовой странице SBCS — CPGID: 01167 / Название: Белорусский/Украинский KOI8-RU» . Программное обеспечение IBM: Глобализация: Наборы кодированных символов и соответствующие ресурсы: Кодовые страницы по CPGID: Идентификаторы кодовых страниц . ИБМ . СН 3-3220-050. Архивировано из оригинала 18 февраля 2017 г. Проверено 18 февраля 2017 г. [1] [2]
  7. ^ «Информационный документ CCSID; CCSID 1167; КОИ8-RU» . ИБМ . Архивировано из оригинала 18 февраля 2017 г. Проверено 18 февраля 2017 г.
  8. ^ Лейшер, Марк (2008) [1999-12-20]. «Таблица сопоставления белорусской/украинской кириллицы KOI8-RU с Unicode 2.1» . Департамент математических наук Университета штата Нью-Мексико. Архивировано из оригинала 19 февраля 2017 г. Проверено 18 февраля 2017 г.
  9. ^ Флор, Гвидо; Дэвис, Майкл (2016) [2006]. «Locale::RecodeData::KOI8_T — процедуры преобразования для KOI8-T» . CPAN libintl-perl . Архивировано из оригинала 15 января 2017 г. Проверено 15 января 2017 г.
  10. ^ Обсуждение
  11. ^ «Наборы символов IANA» .
  12. ^ ЭКМА-113. Наборы 8-битных однобайтовых графических символов - латиница/кириллица (1-е изд., июнь 1986 г.)
  13. ^ "Кодировки кириллицы (Charsets). Небольшое описание" .
  14. ^ Лейшер, Марк (2008) [1998-03-05]. «Таблица сопоставления унифицированной кириллицы KOI8 с Unicode 2.1» . Департамент математических наук Университета штата Нью-Мексико. Архивировано из оригинала 19 февраля 2017 г. Проверено 18 февраля 2017 г.
  15. ^ Виницкий, Серж (29 января 2002 г.). КОИ8-С (Отчет). Рабочая группа по интернет-инжинирингу.
  16. ^ (in Russian) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = 8-bit coded character sets. 8-bit code for information interchange.
  17. ^ Перейти обратно: а б с д Петрлик, Лукас (19 июня 1996 г.). «Объяснение беспорядка с кодировкой чешских и словацких символов» . cs-кодировки-часто задаваемые вопросы . 1.10. Архивировано из оригинала 21 июня 2016 г. Проверено 21 июня 2016 г.
  18. ^ «Станислав Печа — ASCII» . Архивировано из оригинала 21 марта 2011 г. Проверено 19 апреля 2011 г.
  19. ^ ИСО-ИР-139

Дальнейшее чтение

[ редактировать ]
  • Корнаи, Андрас; Бирнбаум, Дэвид Дж.; да Круз, Фрэнк; Дэвис, Бер; Фаулер, Джордж; Пейн, Ричард Б.; Паперно, Слава; Симонсен, Келд Дж.; Тобе, Гленн Э.; Вулис, Дмитрий; ван Винген, Йохан В. (13 марта 1993 г.). «Часто задаваемые вопросы по КИРИЛЛИЧЕСКОЙ КОДИРОВКЕ Версия 1.3» . 1.3 . Проверено 18 февраля 2017 г.
  • «Кодировки и наборы символов » Robotron Technik (Виртуальный компьютерный музей) (на немецком языке). 29 ноября 2016 г. Код ASCII/код KOI . Проверено 21 февраля 2017 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b34c2c57209eed37f21ada30522fbb65__1716337440
URL1:https://arc.ask3.ru/arc/aa/b3/65/b34c2c57209eed37f21ada30522fbb65.html
Заголовок, (Title) документа по адресу, URL1:
KOI character encodings - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)