ИСО 2033

Из Википедии, бесплатной энциклопедии

Стандарт ISO 2033:1983 ( «Кодирование машиночитаемых символов (MICR и OCR)» ) [1] определяет наборы символов для использования с системами оптического распознавания символов или систем распознавания символов с помощью магнитных чернил . Японский стандарт JIS X 9010:1984 ( «Кодирование машиночитаемых символов (OCR и MICR)» , первоначально обозначенный JIS C 6229-1984 ) тесно связан с ним. [2]

Набор символов для OCR-A [ править ]

Версия кодировки шрифта OCR-A , зарегистрированная в реестре ISO-IR как ISO-IR-91, является японской (JIS X 9010 / JIS C 6229) версией, которая отличается от кодировки, определенной ISO 2033, только в добавление знака йены в точке 5C. [2]

Набор ISO 2033 и JIS C 6229 OCR-A
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x НУЛЕВОЙ СОХ СТХ И Т. Д EOT ENQ ПОДТВЕРЖДЕНИЕ БЕЛ БС ХТ НЧ ВТ ФФ ЧР ТАК И
1x В СООТВЕТСТВИИ С DC1 DC2 DC3 DC4 ХОТЕТЬ СИН ЭТБ МОЖЕТ В СУБ ЭКУ ФС GS РС НАС
2x  СП   " £
00А3
$ % & ' {
007Б
}
007D
* + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ;
2440
=
2441
?
4x А Б С Д И Ф г ЧАС я Дж К л М Н О
5x п вопрос р С Т В V В Икс И С ¥
00А5

2442
6x
7x | ПРИНАДЛЕЖАЩИЙ
  Переопределено по сравнению с JIS-Roman

Набор символов для OCR-B [ править ]

Версия набора G0 для шрифта OCR-B , зарегистрированная в реестре ISO-IR как ISO-IR-92, является японской (JIS X 9010/JIS C 6229) версией, которая отличается от кодировки, определенной ISO 2033, только в основан на JIS-Roman (со знаком доллара в 0x24 и знаком иены в 0x5C), а не на ISO 646 IRV (с обратной косой чертой в 0x5C и, в то время, универсальным знаком валюты (¤) в 0x24). [3] Помимо этих кодовых точек, он отличается от ASCII только отсутствием обратного кавычка (`) и тильды (~). [3] Дополнительный дополнительный набор, зарегистрированный как ISO-IR-93, присваивает знак фунта (£), знак универсальной валюты (¤) и знак раздела (§) их кодовым точкам ISO-8859-1 , а обратную косую черту - ISO-8859-1. код для знака иены. [4]

Набор символов для JIS X 9008 (JIS C 6257) [ править ]

JIS X 9010 (JIS C 6229) также определяет наборы символов для шрифта OCR JIS X 9008:1981 (ранее JIS C 6257-1981), «напечатанного вручную». [5] : фн1 К ним относятся подмножества римского набора JIS X 0201 (зарегистрированные как ISO-IR-94 и без обратных кавычек (`), строчных букв, фигурных скобок ({, }) и надчеркивания (‾)), [5] и набор кана (зарегистрирован как ISO-IR-96 в восточноазиатском стиле ), и без запятой (、) и точки (。), межпункта (・) и маленькой каны [6] в дополнение к набору (зарегистрированному как ISO-IR-95 ), содержащему только обратную косую черту, которая присвоена той же кодовой точке, что и в ISO-IR-93. [7]

Шрифт JIS C 6527 стилизует косую черту. [5] и обратная косая черта [7] персонажи с удвоенной внешностью. Даны имена персонажей: «Солидус». [5] и «Обратный солидус», [7] соответствие именам символов Юникода для косой и обратной косой черты ASCII. [8] Однако блок оптического распознавания символов Unicode включает дополнительную кодовую точку для «двойной обратной косой черты OCR» (⑊), но не для двойной (прямой) косой черты. [9] хотя двойная косая черта доступна и в другом месте, например U+2AFD ДВОЙНОЙ ОПЕРАТОР СОЛИДУСА .

Набор символов для E-13B [ править ]

Шрифт MICR E-13B, показывающий набор символов ISO-IR-98.

Кодировка ISO-IR-98 , определенная стандартом ISO 2033, кодирует набор символов шрифта E13B , используемый при распознавании символов магнитными чернилами . [10] Хотя ISO 2033 также определяет другие кодировки, кодировка E-13B — это кодировка, называемая ISO_2033_1983 автор Perl libintl, [11] и в качестве ISO_2033-1983 или csISO2033 IANA . [12] Другие зарегистрированные лейблы включают iso-ir-98, его регистрационный номер ISO-IR и просто e13b. [12]

Цифры сохраняются в своих местах ASCII . Буквы и символы, недоступные в шрифте E13B, опущены, а специальные знаки препинания для банковских чеков, добавлены включенные в шрифт E13B. Эти же символы доступны в Юникоде в блоке «Оптическое распознавание символов» .

Набор ISO 2033:1983 E-13B [11]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x НУЛЕВОЙ СОХ СТХ И Т. Д EOT ENQ ПОДТВЕРЖДЕНИЕ БЕЛ БС ХТ НЧ ВТ ФФ ЧР ТАК И
1x В СООТВЕТСТВИИ С DC1 DC2 DC3 DC4 ХОТЕТЬ СИН ЭТБ МОЖЕТ В СУБ ЭКУ ФС GS РС НАС
2x  СП  
3x 0 1 2 3 4 5 6 7 8 9
2446

2447

2448

2449
4x
5x
6x
7x ПРИНАДЛЕЖАЩИЙ
  Переопределено по сравнению с ASCII

Ссылки [ править ]

  1. ^ ИСО/МЭК ОТК 1/ПК 2 (1983). Обработка информации. Кодирование машиночитаемых символов (MICR и OCR) . ИСО . ИСО 2033:1983. {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  2. ^ Перейти обратно: а б ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-91: Набор графических символов японского языка OCR-A (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  3. ^ Перейти обратно: а б ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-92: Базовый набор японских графических символов OCR-B (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  4. ^ ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-93: Японский OCR-B — Дополнительный набор графических символов (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  5. ^ Перейти обратно: а б с д ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-94: Базовый набор японских графических символов, напечатанных вручную, для оптического распознавания символов (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  6. ^ ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-96: Набор графических символов катаканы, напечатанный вручную для оптического распознавания символов (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  7. ^ Перейти обратно: а б с ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-95: Дополнительный набор японских графических символов, напечатанных вручную, для оптического распознавания символов (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  8. ^ Консорциум Юникод . «Элементы управления C0 и базовая латиница» (PDF) . Стандарт Юникод .
  9. ^ Консорциум Юникод . «Оптическое распознавание символов» (PDF) . Стандарт Юникод .
  10. ^ ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-98: Набор из 14 графических символов шрифта E13B (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  11. ^ Перейти обратно: а б Флор, Гвидо. «Процедуры преобразования для ISO_2033_1983» . либинтл . Локаль::RecodeData::ISO_2033_1983.
  12. ^ Перейти обратно: а б «Наборы символов» . ИАНА.

Внешние ссылки [ править ]