Распознавание символов магнитными чернилами
Код распознавания символов с помощью магнитных чернил , сокращенно известный как код MICR , представляет собой технологию распознавания символов , используемую в основном в банковской сфере для оптимизации обработки и оформления чеков и других документов. Кодировка MICR, называемая строкой MICR , находится в нижней части чеков и других ваучеров и обычно включает в себя индикатор типа документа, код банка , номер банковского счета , номер чека, сумму чека (обычно добавляется после предъявления чека к оплате), и контрольный индикатор. Формат кода банка и номера банковского счета зависит от страны.
Технология позволяет считывателям MICR сканировать и считывать информацию непосредственно в устройство сбора данных. В отличие от штрих-кода и аналогичных технологий, символы MICR легко читаются человеком. Документы, закодированные MICR, могут обрабатываться гораздо быстрее и точнее, чем обычные документы, закодированные OCR .
представление Unicode Стандартное до
Стандарт ISO E - 2033 :1983 и соответствующий японский промышленный стандарт JIS X 9010:1984 (первоначально JIS C 6229–1984) определяют кодировки символов для OCR-A , OCR-B и 13B .
Международное распространение
Используются два основных шрифта MICR : E-13B и CMC-7. Не существует конкретного международного соглашения о том, какие страны какой шрифт используют. [1] На практике это не создает особых проблем, поскольку чеки и другие ваучеры обычно не вытекают из конкретной юрисдикции.
Шрифт E-13B был принят в качестве международного стандарта в ISO 1004-1:2013 и является стандартом в Австралии, Канаде, Великобритании, США, а также в Центральной Америке и большей части Азии, помимо других стран. . [1]
Шрифт CMC-7 был принят в качестве международного стандарта в ISO 1004-2:2013 и широко используется в Европе, включая Францию и Италию, Мексику и Южную Америку, включая Аргентину, Бразилию, Чили и другие страны.
Израиль — единственная страна, которая может использовать оба шрифта одновременно, хотя такая практика делает систему значительно менее эффективной. Эта ситуация является результатом того, что израильтяне приняли на вооружение CMC-7, в то время как палестинцы выбрали E-13B. [1]
Шрифты [ править ]
Е-13Б [ править ]
E-13B имеет набор из 14 символов, состоящий из 10 десятичных цифр и следующих символов:
- ⑆ (транзит: используется для разграничения банковского кода );
- ⑈ (на сайте: используется для разделения номера счета клиента);
- ⑇ (сумма: используется для ограничения суммы транзакции);
- ⑉ (тире: используется для разделения частей чисел, например, номеров маршрутов или номеров счетов).
В сфере печати чеков и банковской деятельности линию E-13B MICR также часто называют линией TOAD. Эта ссылка состоит из 4 символов: Transit, Onus, Amount и Dash. [ нужна ссылка ] По сравнению с CMC-7, некоторые пары символов E-13B (особенно 2 и 5) могут давать относительно схожие результаты при магнитном сканировании; однако в качестве запасного варианта на случай сбоя магнитного считывания E-13B также хорошо работает при оптическом распознавании символов . [1]
Репертуар E-13B может быть представлен в Юникоде (см. ниже). До появления Unicode его можно было закодировать в соответствии со стандартом ISO 2033 :1983, который кодирует цифры в их обычных ASCII местах , транзит как 0x3A, на нас как 0x3C, сумму как 0x3B и тире как 0x3D. [2] Для EBCDIC кодовая страница IBM 1001 кодирует цифры в их обычных местах EBCDIC, транзит как 0xDB, на нас как 0xEB, сумму как 0xCB и тире как 0xFB. [3]
Кодовая страница IBM 1032 расширяет кодовую страницу 1001, добавляя альтернативные кодировки для транзита по адресам 0x5C, 0x7A и 0xC1, для нас по адресам 0x4C, 0x61 и 0xC3, суммы по адресам 0x5B, 0x5E и 0xC2 и тире по адресам 0x60, 0x7E и 0xC4, в дополнение к пространство нулевой ширины по адресу 0x5A. [4] Эти альтернативные представления были добавлены для совместимости с Siemens и Océ . принтерами [5]
СМС-7 [ править ]
CMC-7 включает 10 цифр, 26 заглавных букв, [6] [7] и 5 управляющих символов: S I ( внутренний ), [ нужна ссылка ] S II ( терминатор ), [ нужна ссылка ] S III ( сумма ), [ нужна ссылка ] S IV (неиспользуемый символ) и S V ( маршрутизация ). [ нужна ссылка ]
CMC-7 имеет формат штрих-кода , в котором каждый символ имеет два отдельных больших промежутка в разных местах, а также отдельные узоры между ними, чтобы свести к минимуму любую вероятность путаницы символов при магнитном чтении; однако эти полосы слишком близки и узки, чтобы их можно было надежно распознать при типичном разрешении сканирования, если вернуться к оптическому сканированию. CMC-7 также может производить внешне успешное, но неправильное сканирование перевернутых линий MICR. [1]
Юникод не включает поддержку управляющих символов CMC-7. Кодовая страница IBM 1033 кодирует: [8]
- Цифры и заглавные буквы в своих обычных EBCDIC . местах
- S I ( внутренний ) как 0x5E, 0x61 или 0xCB;
- S II ( терминатор ) как 0x4C, 0x5B или 0xEB;
- S III ( сумма ) как 0x60, 0x7E или 0xFB;
- S IV как 0x50, 0x7A или 0xDB;
- S V ( маршрутизация ) как 0x5C, 0x6E или 0xBB.
MICR-считыватель [ править ]
Символы MICR печатаются на документах одним из двух шрифтов MICR с использованием намагничивающихся (обычно называемых магнитными) чернил или тонера , обычно содержащих оксид железа . При сканировании документ проходит через считыватель MICR, который выполняет две функции: намагничивание чернил и распознавание символов. Символы считываются считывающей головкой MICR — устройством, похожим на воспроизводящую головку магнитофона . Когда каждый символ проходит над головой, он создает уникальную форму волны , которую система может легко идентифицировать.
Считыватели MICR являются основным инструментом для сортировки чеков и используются в сети распространения чеков на нескольких этапах. Например, торговец будет использовать считыватель MICR для сортировки чеков по банкам и отправки отсортированных чеков в клиринговую палату для перераспределения между этими банками. После получения банки выполняют еще одну сортировку MICR, чтобы определить, с какого счета клиента списаны средства и в какой филиал чек следует отправить на обратном пути клиенту. Однако многие банки больше не предлагают этот последний шаг по возврату чека клиенту. Вместо этого чеки сканируются и сохраняются в цифровом виде. Сортировка чеков осуществляется в соответствии с географическим охватом банков страны. [9]
Юникод [ править ]
Символы OCR и MICR включены в стандарт Unicode , по крайней мере, с версии 1.1 (июнь 1993 г.). Поскольку база данных символов Юникода отслеживает только символы, начиная с версии 1.1, они также могли присутствовать в Юникоде 1.0 или 1.0.1. [10]
Блок Юникода, включающий символы OCR и MICR, называется оптическим распознаванием символов и охватывает U+2440–U+245F. Из символов этого блока четыре взяты из шрифта MICR E-13B:
- U + 2446 ⑆ ИДЕНТИФИКАЦИЯ БАНКА ОТДЕЛЕНИЯ OCR
- U+2447 ⑇ OCR СУММА ПРОВЕРКИ
- U + 2448 ⑈ OCR DASH (исправленный псевдоним MICR НА СИМВОЛ США ) [11]
- U + 2449 ⑉ НОМЕР СЧЕТА КЛИЕНТА OCR (исправленный псевдоним MICR DASH SYMBOL ) [11]
Имена последних двух символов были случайно заменены, когда они были названы в ISO/IEC 10646:1993 . [12] и им были присвоены точные имена в качестве официальных псевдонимов. [11] Согласно Политике стабильности Unicode, существующие имена остаются, что позволяет использовать их в качестве стабильных идентификаторов. [13] Кроме того, все четыре символа имеют информативные (неформальные) псевдонимы в диаграммах Юникода: «транзит», «сумма», «на нас» и «тире» соответственно.
До появления Unicode эти символы кодировались с помощью кодировки ISO-IR-98, определенной стандартом ISO 2033 :1983, в котором они назывались просто СИМВОЛ ОДИН ЧЕТЫРЕ – СИМВОЛ . Они были закодированы сразу после цифр, которые были закодированы в своих ASCII . местах [2] Хотя ISO 2033 также определяет кодировку для OCR-A и OCR-B , его кодировка для E-13B известна просто как ISO_2033-1983
IANA . [14]
Оптическое распознавание символов [1] [2] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
U + 244x | ⑀ | ⑁ | ⑂ | ⑃ | ⑄ | ⑅ | ⑆ | ⑇ | ⑈ | ⑉ | ⑊ | |||||
U + 245x | ||||||||||||||||
Примечания |
История [ править ]
До середины 1940-х годов чеки обрабатывались вручную с использованием метода Sort-A-Matic или Top Tab Key. Обработка и клиринг чеков отнимали очень много времени и представляли собой значительные затраты на оформление чеков и банковские операции. По мере увеличения количества проверок стали искать пути автоматизации процесса. Стандарты были разработаны для обеспечения единообразия в финансовых учреждениях. К середине 1950-х годов Стэнфордский исследовательский институт и компания General Electric [15] Компьютерная лаборатория разработала первую автоматизированную систему обработки проверок с использованием MICR. Эта же команда разработала шрифт E-13B MICR. «E» означает, что шрифт является пятым из рассматриваемых, а «B» означает, что это была вторая версия. «13» относится к сетке символов 0,013 дюйма.
Испытание шрифта MICR E-13B было показано Американской ассоциации банкиров (ABA) в июле 1956 года, которая приняла его в 1958 году в качестве стандарта MICR для оборотных документов в Соединенных Штатах . ABA приняла MICR в качестве своего стандарта, поскольку машины могли точно считывать MICR, а MICR можно было распечатать с использованием существующей технологии. Кроме того, MICR оставался машиночитаемым, даже несмотря на чрезмерную штамповку, маркировку, искажение и многое другое. Первые чеки с использованием MICR были напечатаны к концу 1959 года. Хотя соблюдение стандартов MICR было добровольным в Соединенных Штатах, к 1963 году оно было почти повсеместно принято в Соединенных Штатах. [16] В 1963 году ANSI принял шрифт E-13B ABA в качестве американского стандарта печати MICR. [17] и E-13B также был стандартизирован как ISO 1004:1995.
Другие страны устанавливают свои собственные стандарты, хотя считыватели MICR и большая часть другого оборудования были произведены в США. Технология MICR с некоторыми вариациями была принята во многих странах. Шрифт E-13B был принят в качестве стандарта в США, Канаде, Великобритании, Австралии и многих других странах. В Австралии системой управляет Австралийская платежная сеть .
Шрифт CMC-7 был разработан во Франции компанией Groupe Bull в 1957 году. Он был принят в качестве стандарта MICR в Аргентине, Франции, Италии и некоторых других европейских странах.
В 1960-х годах шрифты MICR стали символом современности или футуризма, что привело к созданию похожих «компьютерных» шрифтов , имитирующих внешний вид шрифтов MICR, которые, в отличие от настоящих шрифтов MICR, имели полный набор символов.
MICR E-13B также используется для кодирования информации в других приложениях, таких как рекламные акции, купоны, кредитные карты, авиабилеты, квитанции о страховых взносах, депозитные билеты и многое другое. E-13b — версия, специально разработанная для офсетной печати. Была немного другая версия для высокой печати , [ нужна ссылка ] под названием E-13a. Кроме того, существовала конкурирующая система под названием «Фред» (электронное устройство для чтения цифр), в которой использовались цифры, которые выглядели более традиционными.
См. также [ править ]
- Проверьте систему усечения
- Электронная записывающая машина, Бухгалтерский учет
- ОКР-А
- ОКР-Б
- Амелия (шрифт)
- Вестминстер (шрифт)
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б с д и Битва шрифтов MICR: что лучше, E13B или CMC7?
- ↑ Перейти обратно: Перейти обратно: а б ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-98: Набор из 14 графических символов шрифта E-13B (PDF) . ITSCJ/ IPSJ .
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Кодовая страница 01001» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
- ^ «Кодовая страница 01032» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
- ^ «Шрифты MICR для принтеров Infoprint 4100» . ИБМ. 24 июня 2004 г.
- ^ «ConnectCode MICR CMC7» (PDF) . ООО КоннектКод Пте 2021.
- ^ Обработка информации. Распознавание символов магнитными чернилами. Часть 2. Характеристики печати для CMC7 . ИСО . 01.06.2013. ИСО 1004-2:2013. ( Предварительный отрывок )
- ^ «Кодовая страница 01033» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
- ^ «Резервный банк Индии — Публикации» . rbi.org.in.
- ^ Консорциум Юникод (08 сентября 2019 г.). «Производный возраст» . База данных символов Юникода: данные о производных свойствах .
- ↑ Перейти обратно: Перейти обратно: а б с Фрейтаг, Асмус; Макгоуэн, Рик; Уистлер, Кен (10 апреля 2017 г.). Известные аномалии в именах символов Юникода (4-е изд.). Консорциум Юникод . Техническое примечание Unicode № 27.
- ^ ISO/IEC JTC 1/SC 2/WG 2 (03 января 2012 г.). «Т.3. Оптическое распознавание символов». Неподтвержденный протокол заседания РГ 2 58 (PDF) . п. 29. SC2 N4188/WG2 N4103.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Политика стабильности кодировки символов Юникода» . Консорциум Юникод. 23 июня 2017 г.
- ^ «Наборы символов» . ИАНА.
- ^ «СТАТЬИ: Распознавание символов магнитными чернилами» (PDF) . Компьютеры и автоматизация . 5 (10): 10–16, 44 (12 — Другие сессии ). Октябрь 1956 года . Проверено 05 сентября 2020 г.
- ^ Манделл, Льюис (май 1977 г.). «Распространение EFTS среди национальных банков: Примечания». Журнал денег, кредита и банковского дела . 9 (2): 341–348. дои : 10.2307/1991983 . JSTOR 1991983 .
- ^ Стандарт ANSI X9.27-1995 и стандарт ANSI ANS X9.7-1990.
Внешние ссылки [ править ]
- Справочник по основам MICR , Troy Group, Inc.
- Что лучше, E13B или CMC7?
- Набор символов MICR E13B
- Простой эксперимент по обнаружению магнитных чернил на банкнотах (на французском языке)