ИСО/МЭК 10367
ISO/IEC 10367 :1991 — это стандарт, разработанный ISO/IEC JTC 1/SC 2 . [1] определение наборов графических символов для использования в кодировках символов, реализующих уровни 2 и 3 стандарта ISO/IEC 4873. [2] (в отличие от ISO/IEC 8859 , который определяет кодировки символов на уровне 1 ISO/IEC 4873).
Связь с ISO/IEC 8859 [ править ]
Части ISO/IEC 8859 определяют полные кодировки на уровне 1 ISO/IEC 4873 (т. е. как ASCII расширенные однобайтовые кодировки без сохранения состояния, с резервированием области C1 ) и не допускают совместного использования нескольких частей. Для использования на уровнях 2 и 3 ISO/IEC 4873 (т. е. с кодами смены для дополнительных наборов графических символов) ISO/IEC 8859 предусматривает, что вместо этого следует использовать эквивалентные наборы из ISO/IEC 10367. [3]
ISO/IEC 10367:1991 включает ASCII , а также наборы, соответствующие наборам G1 , используемым для правых частей (не ASCII-частей) ISO/IEC 6937 ( ITU T.51 ) и ISO/IEC 8859, части с 1 по 9 (т. е. те части, которые существовали по состоянию на 1991 год, когда он был опубликован), набор дополнительных латинских символов, дополняющих некоторые из этих частей, и набор символов для рисования прямоугольников (показан ниже). [2] [4]
латиницы Дополнительный набор G3
ISO/IEC 10367 включает графический набор ISO-IR-154 , который предназначен для дополнения латинских алфавитов номер 1, 2 и 5 (т. е. ISO-8859-1 , ISO-8859-2 и ISO-8859-9 ). [4] В частности, он предназначен для использования в качестве набора G3 в профиле ISO/IEC 4873, в котором наборы G1 и G2 включают правую часть ISO-8859-2, а также правую часть ISO-8859-1 или ISO. -8859-9. [5] Эти конфигурации представляют весь набор стандартов ISO/IEC 6937 (ITU T.51 Приложение A) без непространственных кодов. [6]
Например, буква Ĉ будет кодироваться в соответствии со стандартом ISO/IEC 4873 уровня 2 как 0x8F 0x23
если этот набор включен.
Выделенные символы также встречаются в ISO-8859-1 или ISO-8859-9. В соответствии с текущей редакцией ISO/IEC 4873/ECMA-43 (но не более ранними редакциями): [7] символы должны использоваться из рабочего набора с наименьшим номером, в котором они присутствуют, поэтому эти символы не используются из этого набора G3, когда соответствующий набор правой части ISO-8859 используется в качестве набора G1 или G2. [8]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x/топор | И | Ч | С | Э | БЫЛ | Дж | ‘ | “ | ™ | ← | ↑ | → | ↓ | |||
3x/Вх | и | с | с | д | Эм-м-м | Был | дж | ’ | ” | ♪ | ⅛ | ⅜ | ⅝ | ⅞ | ||
4x/Сх | Г | г | г | Ч | ЧАС | Я | Я | я | К | IJ | Дж | К | л | Ŀ | Н | |
5x/Дх | — | С | Ой | О | Р | Ш | Ŧ | че | Ũ | Вт | О | Ø | ź | ИДЕЯ | Ŷ | Ÿ |
6x/Ex | Ой | г | с | г | ч | час | ой | я | я | к | ij | диджей | к | л | ŀ | нет |
7x/FX | ĸ | ŋ | ой | œ | р | ш | ŧ | то есть | фу | ш | Эм-м-м | Эм-м-м | ой | идея | дом | а |
Набор чертежей коробки [ править ]
Ниже показан набор чертежей коробки из ISO/IEC 10367, который зарегистрирован для использования в ISO/IEC 2022 как ISO-IR-155 . Он не использует позиции 0x20 /A0 или 0x7F/FF, но, тем не менее, регистрируется как набор из 96 символов. [9]
Perl libintl включает кодек «ISO_10367-BOX». Он кодирует/декодирует ASCII через GL и набор чертежей коробки ISO-IR-155 через GR с некоторыми отклонениями. с двойной линией В частности, он включает в себя символы рисования прямоугольников вместо символов с толстой линией и заменяет верхний полублок (▀) в 0xCB на символ частного использования U + E019, задокументированный как «Единичное пространство B». [10]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
2x/топор | ||||||||||||||||
3x/Вх | ||||||||||||||||
4x/Сх | ┃ | ━ | ┏ | ┓ | ┗ | ┛ | ┣ | ┫ | ┳ | ┻ | ╋ | ▀ | ▄ | █ | ▪ | |
5x/Дх | │ | ─ | ┌ | ┐ | └ | ┘ | ├ | ┤ | ┬ | ┴ | ┼ | ░ | ▒ | ▓ | ||
6x/Ex | ||||||||||||||||
7x/FX |
Ссылки [ править ]
- ^ ИСО/МЭК ОТК 1/ПК 2 (1991). «Информационные технологии. Стандартизированные наборы кодированных графических символов для использования в 8-битных кодах» . ИСО . ИСО/МЭК 10367:1991.
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б ван Винген, Йохан В. (1999). «8. Расширение кода, ISO 2022 и 2375, ISO 4873 и 10367» . Наборы символов. Буквы, жетоны и коды . Терена. Архивировано из оригинала 01 августа 2020 г.
- ^ ISO/IEC JTC 1/SC 2 (12 февраля 1998 г.). Окончательный текст DIS 8859-10, Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 10. Латинский алфавит № 6 (PDF) . ISO/IEC FDIS 8859-10:1998, JTC1/SC2 N2992, WG3 N415.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Перейти обратно: а б «8-битные наборы символов — ISO/IEC 10367» . Руководство по использованию наборов символов в Европе . ДКУУГ .
- ^ Перейти обратно: а б ЭКМА (1 марта 1990 г.). Дополнительный набор для латинских алфавитов 1, 2 и 5 (PDF) . ITSCJ/ IPSJ . ИСО-ИК -154.
- ^ ISO/IEC JTC 1/SC 2/WG 3 (15 апреля 1998 г.). «Приложение E: Альтернативное кодированное представление репертуара без непромежуточных диакритических знаков». WD 6937, Кодированный набор графических символов для текстовой связи — латиница (PDF) . п. 37. JTC1/SC2/N454.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ ЭКМА (1991). «Основные различия между вторым изданием (1985 г.) и настоящим (третьим) изданием настоящего стандарта ECMA». ECMA-43: Структура и правила набора 8-битных кодированных символов (PDF) (стандарт ECMA) (3-е изд.). п. 23.
- ^ ЭКМА (1991). «Уникальная кодировка символов». ECMA-43: Структура и правила набора 8-битных кодированных символов (PDF) (стандарт ECMA) (3-е изд.). п. 10.
- ^ Перейти обратно: а б ISO/IEC/JTC1/SC2/WG3 (16 апреля 1990 г.). Базовый набор чертежей коробок (PDF) . ITSCJ/ IPSJ . ИСО-ИК -155.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Флор, Гвидо. «Процедуры преобразования для ISO_10367_BOX» . libintl-perl . Локаль::RecodeData::ISO_10367_BOX.