МИК (набор символов)
МИК ( МИК ) — 8-битная кириллицы кодовая страница , используемая в DOS . Он основан на наборе символов, используемом в болгарском Правец 16. [1] IBM PC-совместимая система. Кермит называет этот набор символов « БОЛГАРИЯ-ПК » / « Болгария-ПК ». [2] [3] [4] В Болгарии ее иногда неправильно называли кодовой страницей 856 (что противоречит определению IBM кодовой страницы на иврите). Эта кодовая страница известна принтерам Star и FreeDOS как кодовая страница 3021 (ранее она была известна FreeDOS как кодовая страница 30033 (теперь используется для варианта кодовой страницы 857 , который содержит знак крымскотатарской гривны), но ее нумерация была изменена, чтобы соответствовать Кодовая страница принтера Star).
Это наиболее распространенная кодовая страница DOS / OEM , используемая в Болгарии , а не CP 808 , CP 855 , CP 866 или CP 872 .
Почти каждая программа DOS, созданная в Болгарии и содержащая болгарские строки, использовала MIK в качестве кодировки, и многие такие программы используются до сих пор.
Набор символов
[ редактировать ]Каждый символ отображается с эквивалентной кодовой точкой Юникода и десятичной кодовой точкой. Показана только вторая половина таблицы (кодовые точки 128–255), первая половина (кодовые точки 0–127) совпадает с ASCII .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
8x | А | Б | В | Г | Д | Хорошо | Же | С | И | И | К | л | М | Н | О | П |
9x | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Да | Ь | Э | Ю | Я |
Топор | а | б | в | г | д | является | же | с | и | и | к | л | м | н | о | п |
Бх | р | с | т | у | ф | х | час | час | ш | щ | ъ | й | ь | э | ю | я |
Сх | └ | ┴ | ┬ | ├ | ─ | ┼ | ╣ | ║ | ╚ | ╔ | ╩ | ╦ | ╠ | ═ | ╬ | ┐ |
Дх | ░ | ▒ | ▓ | │ | ┤ | № | § | ╗ | ╝ | ┘ | ┌ | █ | ▄ | ▌ | ▐ | ▀ |
Бывший | а | SS [номер 1] | С | п | С [номер 2] | п | м [номер 3] | т | Ф | че | Ой [номер 4] | д | ∞ | ж | е [номер 5] | ∩ |
Форекс | ≡ | ± | ≥ | ≤ | ⌠ | ⌡ | ÷ | ≈ | ° | ∙ | · | √ | ⁿ | ² | ■ | НБСП |
Примечания для разработчиков преобразования таблиц в Unicode
[ редактировать ]Разработчикам сопоставления таблиц с Unicode следует учитывать, что кодовая страница MIK унифицирует некоторые символы:
- ^ 0xE1 — это одновременно немецкая диез S (U+00DF, ß) и греческая строчная бета (U+03B2, β);
- ^ 0xE4 — это одновременно n-арный знак суммирования (U+2211, ∑) и греческая сигма в верхнем регистре (U+03A3, Σ);
- ^ 0xE6 — это одновременно микрознак (U+00B5, µ) и греческая строчная буква mu (U+03BC, µ);
- ^ 0xEA — это одновременно знак Ома (U + 2126, Ом) и греческая прописная омега (U + 03A9, Ом);
- ^ 0xEE — это одновременно элемент знака (U+2208, ∈) и греческий строчный эпсилон (U+03B5, ε)!
Манипуляции с двоичными символами
[ редактировать ]Кодовая страница MIK хранит все буквы кириллицы в алфавитном порядке, что позволяет очень легко манипулировать символами в двоичной форме:
10xx xxxx — буква кириллицы.
100x xxxx – это заглавная буква кириллицы.
101x xxxx — строчная кириллическая буква.
В таком случае функции тестирования и манипулирования персонажами такие, как:
IsAlpha(), IsUpper(), IsLower(), ToUpper() и ToLower(),
являются битовыми операциями, а сортировка осуществляется путем простого сравнения значений символов.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Правец 16» . Архивировано из оригинала 6 декабря 2016 г. Проверено 6 декабря 2016 г.
- ^ да Круз, Фрэнк (2 апреля 2010 г.). «Имена наборов символов Кермит и MIME» . Проект Кермит . Колумбийский университет , Нью-Йорк, США. Архивировано из оригинала 3 декабря 2016 г. Проверено 2 декабря 2016 г.
- ^ «Кермит 95 — Наборы символов кириллицы» .
- ^ Перейти обратно: а б http://www.columbia.edu/kermit/ftp/charsets/cp856.txt [ текстовый файл с пустым URL-адресом ]
- ^ Чиборра, Роман (30 ноября 1998 г.) [25 мая 1998 г.]. «Суп с кириллицей» . Архивировано из оригинала 3 декабря 2016 г. Проверено 3 декабря 2016 г. [1] [2]
- ^ Хохлов, Ю. Е. «Представление кириллической информации в электронном виде – таблицы наборов символов (кодовых страниц)» . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.
Внешние ссылки
[ редактировать ]- https://www.unicode.org/Public/MAPPINGS/VENDORS/IBM/IBM_conversions.html Сопоставления Консорциума Unicode между кодовыми страницами IBM и Unicode
- http://www.cl.cam.ac.uk/~mgk25/unicode.html#conv Часто задаваемые вопросы по UTF-8 и Unicode для Unix/Linux, Маркус Кун