ИСО/МЭК 8859-5
Псевдоним(а) | ISO-IR-144, кириллица, csISOLatinCyrillic [1] |
---|---|
Язык(и) | Русский , Болгарский , Белорусский , Македонский , Сербский , Украинский (частично) |
Стандартный | ИСО/МЭК 8859-5, ECMA-113 (с выпуска 1988 г.) |
Классификация | Расширенный ASCII , ISO 8859 |
Расширяет | США-ASCII , ISO-IR-153 |
На основе | Основная кодовая страница [2] |
Расширения | ИБМ-915 |
Предшествует | ECMA-113:1986 ( ISO-IR-111 ) |
Другая связанная кодировка(и) | ИБМ-1124 |
ISO/IEC 8859-5:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 5. Латиница/кириллица. Является частью серии ISO/IEC 8859 на основе ASCII стандартных кодировок символов , первое издание. опубликован в 1988 году. Неофициально его называют латиницей/кириллицей .
Он был разработан для языков, использующих кириллицу, таких как болгарский , белорусский , русский , сербский и македонский , но никогда не использовался широко. 8-битные кодировки KOI8-R и KOI8-U , IBM-866 , а также Windows-1251 Гораздо чаще используются . В отличие от связи между Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесного отношения к ISO 8859-5. Однако основной блок кириллицы в Юникоде использует раскладку, основанную на ISO-8859-5.
ISO 8859-5 также можно было использовать для украинского языка в Советском Союзе с 1933 по 1990 год, но в нем отсутствует украинская буква ge , ґ, которая требовалась в украинской орфографии до и после, а также в течение этого периода за пределами Советской Украины . В результате IBM создала кодовую страницу 1124 .
ISO-8859-5 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . Кодовая страница Windows для ISO-8859-5 — это кодовая страница 28595, также известная как Windows-28595 . [3] IBM присвоила кодовую страницу 915 ISO-8859-5 до тех пор, пока эта кодовая страница не была расширена.
Макет кодовой страницы [ править ]
Отличия от ISO 8859-1 показаны с помощью Unicode эквивалентной кодовой точки .
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | СП | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | А | Б | С | Д | И | Ф | г | ЧАС | я | Дж | К | л | М | Н | О |
5x | п | вопрос | р | С | Т | В | V | В | Икс | И | С | [ | \ | ] | ^ | _ |
6x | ` | а | б | с | д | Это | ж | г | час | я | дж | к | л | м | н | О |
7x | п | д | р | с | т | в | v | В | Икс | и | С | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Топор | НБСП | Или 0401 |
Đ 0402 |
Ф 0403 |
Есть 0404 |
С 0405 |
я 0406 |
Ей 0407 |
Дж 0408 |
Л Джей 0409 |
Нью-Джерси 040А |
Ć 040Б |
К 040С |
ЗАСТЕНЧИВЫЙ | В 040E |
Дж 040F |
Бх | А 0410 |
Б 0411 |
В 0412 |
Г 0413 |
Д 0414 |
Хорошо 0415 |
Же 0416 |
С 0417 |
И 0418 |
И 0419 |
К 041А |
л 041Б |
М 041С |
Н 041D |
О 041E |
П 041F |
Сх | Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
Ф 0424 |
Х 0425 |
Ц 0426 |
Ч 0427 |
Ш 0428 |
Щ 0429 |
Ъ 042А |
Да 042Б |
Ь 042C |
Э 042D |
Ю 042E |
Я 042F |
Дх | а 0430 |
б 0431 |
в 0432 |
г 0433 |
д 0434 |
является 0435 |
же 0436 |
с 0437 |
и 0438 |
и 0439 |
к 043А |
л 043Б |
м 043С |
н 043D |
о 043E |
п 043F |
Бывший | р 0440 |
с 0441 |
т 0442 |
у 0443 |
ф 0444 |
х 0445 |
час 0446 |
час 0447 |
ш 0448 |
щ 0449 |
ъ 044А |
й 044Б |
ь 044C |
э 044D |
ю 044E |
я 044F |
Форекс | № 2116 |
или 0451 |
д 0452 |
ж 0453 |
есть 0454 |
дж 0455 |
и 0456 |
е 0457 |
дж 0458 |
Л Джей 0459 |
Нью-Джерси 045А |
час 045Б |
д 045С |
§ 00A7 |
в 045E |
дж 045F |
[ править ]
Стандарт ECMA-113 эквивалентен ISO-8859-5 со времени его второго издания. [4] его первое издание ( ISO-IR-111 ) было расширением более раннего КОИ-8 (определенного ГОСТ 19768-74), в котором русские буквы, где это возможно, располагаются так же, как и их римские эквиваленты ASCII. Первоначальный проект ISO-8859-5 (DIS-8859-5:1987) последовал за ISO-IR-111, но был пересмотрен. [4] после замены ГОСТ 19768-74 [5] новым стандартом ISO-IR-153 1987 года, в котором русские буквы были переставлены в алфавитном порядке (кроме Ё). [5] [6] ISO-IR-153 содержит русские буквы, включая Ё, неразрывный пробел и мягкий дефис, тогда как полный набор кириллицы ISO-8859-5 также называется ISO-IR-144. [7]
Возможно, в результате этой путаницы В RFC 1345 ошибочно указана еще одна кодовая страница как «ISO-IR-111», сочетающая порядок букв и регистров ISO-8859-5 с порядком строк ISO-IR-111 (и, следовательно, не совместимая ни с одной из них на практике, но на практике частично совместимо [2] с Windows-1251 ). [8] [2]
IBM Кодовая страница 915 является расширением ISO/IEC 8859-5, добавляющим некоторые полуграфические и другие символы в область C1 . IBM Кодовая страница 1124 в основном идентична ISO-8859-5, но для украинского использования заменяется ѓ на ґ.
ИСО-ИР-200 , «Уральский дополнительный набор кириллицы», [9] была зарегистрирована в 1998 году компанией Everson Gunn Teoranta (директором которой был Майкл Эверсон до основания Evertype в 2001 году), [10] и меняет несколько нерусских букв для поддержки кильдин-саамского , коми и ненецкого языков, не поддерживаемых самим ISO-8859-5. Майкл Эверсон также представил Mac OS Barents Cyrillic для тех же языков, что и классическая Mac OS. FreeDOS называет ее кодовой страницей 59283 . [11]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
Топор | НБСП | Или | Ӈ 04C7 |
Ӓ 04D2 |
ک 04EC |
Ҍ 048C |
я | Ӧ 04E6 |
Ҋ 048А |
Ӆ 04C5 |
Ӊ 04C9 |
« 00AB |
Ӎ 04CD |
ЗАСТЕНЧИВЫЙ | Ҏ 048E |
ʼ 02BC |
Форекс | № | или | ӈ 04C8 |
ӓ 04D3 |
ӭ 04ЭД |
ҍ 048D |
и | ӧ 04E7 |
ҋ 048Б |
ӆ 04C6 |
н 04CA |
» 00BB |
ӎ 04CE |
§ | ҏ 048F |
ˮ 02EE |
ИСО-ИР-201, «Волжский дополнительный набор кириллицы», [12] аналогичным образом был введен Эверсоном Ганном Теорантой с целью поддержки чувашского , коми , марийского и удмуртского языков, на которых говорят в титульных республиках России . FreeDOS называет ее кодовой страницей 58259 . [13]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
Топор | НБСП | Или | Ӑ 04D0 |
Ӓ 04D2 |
Ӗ 04D6 |
Ҫ 04АА |
я | Ӧ 04E6 |
Ӥ 04E4 |
Жї 04DC |
Ҥ 04А4 |
Ӹ 04F8 |
Ӟ 04DE |
ЗАСТЕНЧИВЫЙ | Ӱ 04F0 |
Ӵ 04F4 |
Форекс | № | или | ӑ 04D1 |
ӓ 04D3 |
ӗ 04D7 |
ҫ 04AB |
и | ӧ 04E7 |
ӥ 04E5 |
жї 04ДД |
час 04А5 |
ӹ 04F9 |
ӟ 04DF |
§ | Э 04F1 |
ӵ 04F5 |
Ссылки [ править ]
- ^ Наборы символов , Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
- ^ Перейти обратно: а б с Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кодировок кириллицы" . Архивировано из оригинала 5 декабря 2016 г. Проверено 5 декабря 2016 г.
- ^ «Идентификаторы кодовых страниц» . 7 января 2021 г.
- ^ Перейти обратно: а б «ECMA-113 - Ecma International» (PDF) .
- ^ Перейти обратно: а б Чиборра, Роман (30 ноября 1998 г.) [25 мая 1998 г.]. «Суп с кириллицей» . Архивировано из оригинала 3 декабря 2016 г. Проверено 3 декабря 2016 г.
- ^ «Файл gost19768-87 TXT.GZ» .
- ^ Европейская ассоциация производителей компьютеров (1 мая 1988 г.). Кириллическая часть латинского/кириллицического алфавита (PDF) . ITSCJ/ IPSJ . ИСО-ИК -144.
- ^ Соколов, Михаил (5 апреля 2003 г.). «ECMA-кириллица псевдоним iso-ir-111 болячка» . IETF Список рассылки кодировок (список рассылки).
- ^ Перейти обратно: а б Национальный орган по стандартизации Ирландии. Уральский дополнительный набор кириллицы (PDF) . ITSCJ/ IPSJ . ИСО-ИК -200.
- ^ Ганн, Мэрион; Эверсон, Майкл (20 сентября 2001 г.). «Эверсон Ганн Теоранта (EGT) и Everson Typography» . Список рассылки Unicode (список рассылки).
- ^ «Cpi/CPIISO/Codepage.TXT на ведущем устройстве · FDOS/Cpi» . Гитхаб .
- ^ Перейти обратно: а б Национальный орган по стандартизации Ирландии. Волжский дополнительный набор кириллицы (PDF) . ITSCJ/ IPSJ . ИСО-ИР -201.
- ^ «Cpi/CPIISO/Codepage.TXT на ведущем устройстве · FDOS/Cpi» . Гитхаб .
Внешние ссылки [ править ]
- ISO-IR 144 Кириллическая часть латинского/кириллического алфавита (1 мая 1988 г., из ISO 8859-5, 2-е издание)
- ИСО/МЭК 8859-5:1999
- Стандарт ECMA-113 : наборы 8-битных однобайтовых графических символов - латиница/кириллица, 3-е издание (декабрь 1999 г.)