ОКР-Б

Из Википедии, бесплатной энциклопедии
ОКР-Б
Категория Без засечек
Классификация Неогротеск
Дизайнер(ы) Адриан Фрутигер
Дата создания 1968
Образец

OCR-B — это моноширинный шрифт, разработанный в 1968 году Адрианом Фрутигером для Monotype в соответствии со стандартом Европейской ассоциации производителей компьютеров . Его функция заключалась в облегчении операций оптического распознавания символов с помощью конкретных электронных устройств, первоначально предназначенных для финансовых и банковских целей. Он был принят в качестве мирового стандарта в 1973 году. [1] Он соответствует стандарту ISO 1073-2:1976 (E), уточненному в 1979 году (дизайн высокой печати, размер I). Он включает в себя все символы ASCII и другие символы, необходимые в банковской среде. Он широко используется для удобочитаемых цифр в штрих-кодах UPC / EAN . [2] [ нужна цитата ] Он также используется для машиносчитываемых паспортов . [3] Он разделяет эту цель с OCR-A , но его легче читать человеческому глазу и мозгу, и он имеет менее технический вид, чем OCR-A.

История [ править ]

В июне 1961 года Европейская ассоциация производителей компьютеров (ECMA) начала деятельность по стандартизации, связанную с оптическим распознаванием символов (OCR) . После оценки существующих дизайнов оптического распознавания символов было решено разработать два новых шрифта: стилизованный дизайн, состоящий только из цифр, под названием «Класс А»; и более традиционный шрифт с более широким охватом символов, называемый «Класс B». дизайн шрифта «Класс B» В феврале 1965 года ECMA предложила ISO , который принял его в качестве международного стандарта ISO 1073-2 в октябре 1965 года. [4] Первая редакция содержала три размера шрифта: I, II и III. Спецификация включала дизайн высокой печати , предназначенный для высококачественного печатного оборудования; с закругленными краями и конструкция с постоянной шириной штриха для ударных принтеров. [5] : 3  с пониженным типографским качеством.

В сентябре 1969 года ECMA начала работу по пересмотру своего опубликованного стандарта. Чтобы сделать OCR-B более широко распространенным, формы некоторых символов были немного изменены. В новой версии удален размер шрифта II, который редко использовался на практике; было удалено пять форм символов; и добавлен новый размер шрифта IV. ECMA опубликовала второе издание OCR-B в октябре 1971 года. [4]

В марте 1976 года ECMA опубликовала третью версию своей спецификации ECMA-11. Он добавил символы § и ¥ в OCR-B; добавлены два типа меток стирания (█) для затемнения неправильно напечатанных символов; а длина вертикальной полосы была изменена в соответствии с ISO 1073-2. [4]

В 1993 году Турция предложила расширить ISO 1073-2, включив в него турецкие буквы Ğ ğ, İ ı и Ş ş. [6] Был обобщен запрос на расширение OCR-B за счет ряда латинских и греческих букв, используемых в европейских языках. [7] : 27  Поэтому был пересмотрен стандарт ISO 1073-2:1976. началась работа над тремя последовательными проектами документов. В окончательном проекте OCR-B был бы расширен за счет 40 латинских и 10 греческих букв; для шести латинских букв в проекте были даны новые альтернативные формы. [7] : 26  Запрос на расширение OCR-B с вьетнамским акцентом был отклонен. [7] : 27  В отличие от предыдущих версий стандарта, в которых формы глифов определялись с помощью справочных рисунков, новая версия включала бы формы в машиночитаемой форме. [7] : 26  Однако, в то время не удалось обеспечить отраслевую поддержку тестирования нового шрифта, поэтому работа по пересмотру была остановлена ​​в 1997 году. [7] : IV Рабочая группа описала свои выводы в техническом отчете. [7] : 1 

Два предложенных варианта знака евро OCR-B. [5]

В июне 1998 года Европейский комитет по стандартизации опубликовал отчет о добавлении знака евро в OCR-B. [5] В отчете предлагался вариант знака евро как с одним, так и с двойным штрихом, оставляя решение о дальнейшем тестировании эффективности оптического распознавания символов. [5] : 4  Тестирование было трудным: теоретические методы проектирования, использованные при первоначальной разработке символов OCR-B, больше не могли быть воспроизведены, а технологические ограничения 1960-х годов также больше не были полностью актуальны в среде OCR 1990-х годов. [8] Был разработан новый метод тестирования с использованием современной технологии оптического распознавания символов. Испытания не обнаружили различий в производительности оптического распознавания символов между двумя вариантами евро и рекомендовали использовать вариант с двойным штрихом, поскольку он соответствует традиционной форме глифа. [8] У проекта не было средств для тщательного тестирования расширений глифов предложения 1993 года; первоначальные результаты были неубедительными. [8]

Наличие [ править ]

Microsoft Office поставляет версию Letterpress OCR-B производства Monotype . Он охватывает Windows-1252 . [9] Многие поставщики, включая Adobe, до сих пор продают свои версии OCR-A и OCR-B.

Система набора текста TeX имеет общедоступный шрифт Constant Strokewidth OCR-B в METAFONT форме определения . Он был создан Норбертом Шварцем в 1995 году и обновлен в 2010 году. Он имеет настройку для квадратных концов штрихов. [10] Определение также было переведено на METATYPE1 , поэтому округленная версия доступна также в TrueType и OpenType . [11]

Версия Constant Strokewidth OCR-B Мэтью Андерсона имеет расширенный охват символов. Он доступен под CC-BY 4.0 . [12]

Кодировка MS-DOS OCR-B [ править ]

Кодировка MS-DOS OCR-B — кодовая страница 877 . Обратите внимание, что могила, акут, циркумфлекс (в 0x9B), тильда, диэрезис и седиль могут быть добавлены поверх букв (в случае седиллы — под) для образования букв с ударением.

MS-DOS OCR-B [13]
0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
0x
1x [а]
2x  СП   ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ А Б С Д И Ф г ЧАС я Дж К л М Н О
5x п вопрос р С Т В V В Икс И С [ \ ] ^ _
6x ` а б с д Это ж г час я дж к л м н О
7x п д р с т в v В Икс и С { | } ~ [б]
8x ты ä к Ä Ой
9x ой Ой он ОН О ^ £ ¥
Топор С ø Ø ˍ
02CD
Бх IJ ij
Сх ¤
Дх
Бывший SS ´
Форекс § ¸ ¨

Символы не в Юникоде:

  • ^ Групповое стирание (0x18)
  • ^b Удаление символов (0x7F)

Ссылки [ править ]

  1. ^ Фрутигер, Адриан. Тип. Знак . ABC Verlag, Цюрих, 1980. с. 50
  2. ^ «Руководство по внедрению человекочитаемой интерпретации (HRI) GS1» (PDF) . ГС1 АИСБЛ. 2018. с. 13 . Проверено 27 сентября 2018 г.
  3. ^ Doc 9303. Машиносчитываемые проездные документы, Часть 3. Технические характеристики, общие для всех МСПД (PDF) (Восьмое изд.). Международная организация гражданской авиации . 2015. с. 25. ISBN  978-92-9249-792-7 . Проверено 3 марта 2016 г.
  4. ^ Перейти обратно: а б с «Стандарт ECMA-11 для буквенно-цифрового набора символов OCR-B для оптического распознавания» (PDF) . Европейская ассоциация производителей компьютеров. Март 1976 г. Раздел «Краткая история».
  5. ^ Перейти обратно: а б с д «Проект отчета о евроглифе в OCR-B» (PDF) . 28 июня 1998 г.
  6. ^ Карл Ивар Ларссон (8 августа 2000 г.). «Примечания о передаче ответственности по стандартам OCR-B» .
  7. ^ Перейти обратно: а б с д Это ж «Предложение по техническому отчету типа 3, TR 15907, Информационные технологии. Пересмотр стандарта OCR-B (ISO 1073/II-1976)» (PDF) . 28 сентября 1998 г.
  8. ^ Перейти обратно: а б с Карссон, Кент Ивар (28 июня 1998 г.), Отчет TC304 о ситуации с OCR-B , Технический комитет Unicode, Консорциум Unicode, Документ UTC L2/01-259
  9. ^ «Семейство шрифтов OCRB — Типография» . 30 марта 2022 г.
  10. ^ «CTAN: /Tex-archive/Fonts/Ocr-b» .
  11. ^ «OCR а и OCR B» .
  12. ^ «ОКР-Б» . wehtt.am . Архивировано из оригинала 28 марта 2019 года . Проверено 11 января 2022 г.
  13. ^ «Кодовая страница 877» (PDF) . Архивировано из оригинала (PDF) 21 января 2013 г.

Внешние ссылки [ править ]