Распознавание символов магнитными чернилами
Код распознавания символов с помощью магнитных чернил , сокращенно известный как код MICR , представляет собой технологию распознавания символов , используемую в основном в банковской сфере для оптимизации обработки и оформления чеков и других документов. Кодировка MICR, называемая строкой MICR , находится в нижней части чеков и других ваучеров и обычно включает в себя индикатор типа документа, код банка , номер банковского счета , номер чека, сумму чека (обычно добавляется после предъявления чека к оплате), и контрольный индикатор. Формат кода банка и номера банковского счета зависит от страны.
Технология позволяет считывателям MICR сканировать и считывать информацию непосредственно в устройство сбора данных. В отличие от штрих-кода и подобных технологий, символы MICR легко читаются человеком. Документы, закодированные MICR, могут обрабатываться гораздо быстрее и точнее, чем обычные документы, закодированные OCR .
Стандартное представление до Unicode
[ редактировать ]Стандарт ISO E - 2033 :1983 и соответствующий японский промышленный стандарт JIS X 9010:1984 (первоначально JIS C 6229–1984) определяют кодировки символов для OCR-A , OCR-B и 13B .
Международное распространение
[ редактировать ]Используются два основных шрифта MICR : E-13B и CMC-7. Не существует конкретного международного соглашения о том, какие страны какой шрифт используют. [1] На практике это не создает особых проблем, поскольку чеки и другие ваучеры обычно не вытекают из конкретной юрисдикции.
Шрифт E-13B был принят в качестве международного стандарта в ISO 1004-1:2013 и является стандартом в Австралии, Канаде, Великобритании, США, а также в Центральной Америке и большей части Азии, помимо других стран. . [1]
Шрифт CMC-7 был принят в качестве международного стандарта в ISO 1004-2:2013 и широко используется в Европе, включая Францию и Италию, Мексику и Южную Америку, включая Аргентину, Бразилию, Чили и другие страны.
Израиль — единственная страна, которая может использовать оба шрифта одновременно, хотя такая практика делает систему значительно менее эффективной. Эта ситуация является результатом того, что израильтяне приняли на вооружение CMC-7, в то время как палестинцы выбрали E-13B. [1]
Шрифты
[ редактировать ]Е-13Б
[ редактировать ]E-13B был разработан в 1958 году Американской ассоциацией банкиров при спонсорской поддержке Американской ассоциации стандартов . [2] Это набор из 14 символов, состоящий из 10 десятичных цифр и следующих символов:
- ⑆ (транзит: используется для разграничения банковского кода );
- ⑈ (на сайте: используется для разделения номера счета клиента);
- ⑇ (сумма: используется для ограничения суммы транзакции);
- ⑉ (тире: используется для разделения частей чисел, например, номеров маршрутов или номеров счетов).
В сфере печати чеков и банковской деятельности линию E-13B MICR также часто называют линией TOAD. Эта ссылка состоит из 4 символов: Transit, Onus, Amount и Dash. [ нужна ссылка ] По сравнению с CMC-7, некоторые пары символов E-13B (особенно 2 и 5) могут давать относительно схожие результаты при магнитном сканировании; однако в качестве запасного варианта на случай сбоя магнитного считывания E-13B также хорошо работает при оптическом распознавании символов . [1]
Репертуар E-13B может быть представлен в Юникоде (см. ниже). До появления Unicode его можно было закодировать в соответствии со стандартом ISO 2033 :1983, который кодирует цифры в их обычных ASCII местах , транзит как 0x3A, на нас как 0x3C, сумму как 0x3B и тире как 0x3D. [3] Для EBCDIC кодовая страница IBM 1001 кодирует цифры в их обычных местах EBCDIC, транзит как 0xDB, на нас как 0xEB, сумму как 0xCB и тире как 0xFB. [4]
Кодовая страница IBM 1032 расширяет кодовую страницу 1001, добавляя альтернативные кодировки для транзита по адресам 0x5C, 0x7A и 0xC1, для нас по адресам 0x4C, 0x61 и 0xC3, суммы по адресам 0x5B, 0x5E и 0xC2 и тире по адресам 0x60, 0x7E и 0xC4, в дополнение к пространство нулевой ширины по адресу 0x5A. [5] Эти альтернативные представления были добавлены для совместимости с Siemens и Océ . принтерами [6]
КМЦ-7
[ редактировать ]CMC-7 включает 10 цифр, 26 заглавных букв, [7] [8] и 5 управляющих символов: S I ( внутренний ), [ нужна ссылка ] S II ( терминатор ), [ нужна ссылка ] S III ( сумма ), [ нужна ссылка ] S IV (неиспользуемый символ) и S V ( маршрутизация ). [ нужна ссылка ]
CMC-7 имеет формат штрих-кода , в котором каждый символ имеет два отдельных больших промежутка в разных местах, а также отдельные узоры между ними, чтобы свести к минимуму любую вероятность путаницы символов при магнитном чтении; однако эти полосы слишком близки и узки, чтобы их можно было надежно распознать при типичном разрешении сканирования, если вернуться к оптическому сканированию. CMC-7 также может производить внешне успешное, но неправильное сканирование перевернутых линий MICR. [1]
Юникод не включает поддержку управляющих символов CMC-7. Кодовая страница IBM 1033 кодирует: [9]
- Цифры и заглавные буквы в своих обычных EBCDIC . местах
- S I ( внутренний ) как 0x5E, 0x61 или 0xCB;
- S II ( терминатор ) как 0x4C, 0x5B или 0xEB;
- S III ( сумма ) как 0x60, 0x7E или 0xFB;
- S IV как 0x50, 0x7A или 0xDB;
- S V ( маршрутизация ) как 0x5C, 0x6E или 0xBB.
считыватель MICR
[ редактировать ]Символы MICR печатаются на документах одним из двух шрифтов MICR с использованием намагничивающихся (обычно называемых магнитными) чернил или тонера , обычно содержащего оксид железа . При сканировании документ проходит через считыватель MICR, который выполняет две функции: намагничивание чернил и распознавание символов. Символы считываются считывающей головкой MICR — устройством, похожим на воспроизводящую головку магнитофона . Когда каждый символ проходит над головой, он создает уникальную форму волны , которую система может легко идентифицировать.
Считыватели MICR являются основным инструментом сортировки чеков и используются в сети распространения чеков на нескольких этапах. Например, торговец будет использовать считыватель MICR для сортировки чеков по банкам и отправки отсортированных чеков в клиринговую палату для перераспределения между этими банками. После получения банки выполняют еще одну сортировку MICR, чтобы определить, с какого счета клиента списаны средства и в какой филиал чек следует отправить на обратном пути клиенту. Однако многие банки больше не предлагают этот последний шаг по возврату чека клиенту. Вместо этого чеки сканируются и сохраняются в цифровом виде. Сортировка чеков осуществляется в соответствии с географическим охватом банков страны. [10]
Юникод
[ редактировать ]Символы OCR и MICR включены в стандарт Unicode , по крайней мере, с версии 1.1 (июнь 1993 г.). Поскольку база данных символов Юникода отслеживает только символы, начиная с версии 1.1, они также могли присутствовать в Юникоде 1.0 или 1.0.1. [11]
Блок Юникода, включающий символы OCR и MICR, называется оптическим распознаванием символов и охватывает U+2440–U+245F. Из символов этого блока четыре взяты из шрифта MICR E-13B:
- U + 2446 ⑆ ИДЕНТИФИКАЦИЯ БАНКА ОТДЕЛЕНИЯ OCR
- U+2447 ⑇ OCR СУММА ПРОВЕРКИ
- U + 2448 ⑈ OCR DASH (исправленный псевдоним MICR НА СИМВОЛ США ) [12]
- U + 2449 ⑉ НОМЕР СЧЕТА КЛИЕНТА OCR (исправленный псевдоним MICR DASH SYMBOL ) [12]
Имена последних двух символов были случайно заменены, когда они были названы в ISO/IEC 10646:1993 . [13] и им были присвоены точные имена в качестве официальных псевдонимов. [12] Согласно Политике стабильности Unicode, существующие имена остаются, что позволяет использовать их в качестве стабильных идентификаторов. [14] Кроме того, все четыре символа имеют информативные (неформальные) псевдонимы в диаграммах Юникода: «транзит», «сумма», «на нас» и «тире» соответственно.
До появления Unicode эти символы кодировались с помощью кодировки ISO-IR-98, определенной стандартом ISO 2033 :1983, в котором они назывались просто СИМВОЛ ОДИН ЧЕТЫРЕ – СИМВОЛ . Они были закодированы сразу после цифр, которые были закодированы в своих ASCII . местах [3] Хотя ISO 2033 также определяет кодировку для OCR-A и OCR-B , его кодировка для E-13B известна просто как ISO_2033-1983
IANA . [15]
Оптическое распознавание символов [1] [2] Официальная таблица кодов Консорциума Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | А | Б | С | Д | И | Ф | |
U + 244x | ⑀ | ⑁ | ⑂ | ⑃ | ⑄ | ⑅ | ⑆ | ⑇ | ⑈ | ⑉ | ⑊ | |||||
U + 245x | ||||||||||||||||
Примечания |
История
[ редактировать ]До середины 1940-х годов чеки обрабатывались вручную с использованием метода Sort-A-Matic или Top Tab Key. Обработка и клиринг чеков отнимали очень много времени и представляли собой значительные затраты на оформление чеков и банковские операции. По мере увеличения количества проверок стали искать пути автоматизации процесса. Стандарты были разработаны для обеспечения единообразия в финансовых учреждениях. К середине 1950-х годов Стэнфордский исследовательский институт и компания General Electric [16] Компьютерная лаборатория разработала первую автоматизированную систему обработки проверок с использованием MICR. Эта же команда разработала шрифт E-13B MICR. «E» означает, что шрифт является пятым из рассматриваемых, а «B» означает, что это была вторая версия. «13» относится к сетке символов 0,013 дюйма.
Испытание шрифта MICR E-13B было показано Американской ассоциации банкиров (ABA) в июле 1956 года, которая приняла его в 1958 году в качестве стандарта MICR для оборотных документов в Соединенных Штатах . ABA приняла MICR в качестве своего стандарта, поскольку машины могли точно считывать MICR, а MICR можно было распечатать с использованием существующей технологии. Кроме того, MICR оставался машиночитаемым, даже несмотря на чрезмерную штамповку, маркировку, искажение и многое другое. Первые чеки с использованием MICR были напечатаны к концу 1959 года. Хотя соблюдение стандартов MICR было добровольным в Соединенных Штатах, к 1963 году оно было почти повсеместно принято в Соединенных Штатах. [17] В 1963 году ANSI принял шрифт E-13B ABA в качестве американского стандарта печати MICR. [18] и E-13B также был стандартизирован как ISO 1004:1995.
Другие страны устанавливают свои собственные стандарты, хотя считыватели MICR и большая часть другого оборудования были произведены в США. Технология MICR с некоторыми вариациями была принята во многих странах. Шрифт E-13B был принят в качестве стандарта в США, Канаде, Великобритании, Австралии и многих других странах. В Австралии системой управляет Австралийская платежная сеть .
Шрифт CMC-7 был разработан во Франции компанией Groupe Bull в 1957 году. Он был принят в качестве стандарта MICR в Аргентине, Франции, Италии и некоторых других европейских странах.
В 1960-х годах шрифты MICR стали символом современности или футуризма, что привело к созданию похожих «компьютерных» шрифтов , имитирующих внешний вид шрифтов MICR, которые, в отличие от настоящих шрифтов MICR, имели полный набор символов.
MICR E-13B также используется для кодирования информации в других приложениях, таких как рекламные акции, купоны, кредитные карты, авиабилеты, квитанции о страховых взносах, депозитные билеты и многое другое. E-13b — версия, специально разработанная для офсетной печати. Была немного другая версия для высокой печати , [ нужна ссылка ] под названием E-13a. Кроме того, существовала конкурирующая система под названием «Фред» (электронное устройство для чтения цифр), в которой использовались цифры, которые выглядели более традиционными.
См. также
[ редактировать ]- Проверьте систему усечения
- Электронная записывающая машина, Бухгалтерский учет
- ОКР-А
- ОКР-Б
- Амелия (шрифт)
- Вестминстер (шрифт)
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и «Битва шрифтов MICR: что лучше, E13B или CMC7?» . Архивировано из оригинала 03 августа 2020 г. Проверено 16 июля 2019 г.
- ^ Распознавание персонажей . Лондон: Британское компьютерное общество . 1967. с. 33.
- ^ Jump up to: а б ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-98: Набор из 14 графических символов шрифта E-13B (PDF) . ITSCJ/ IPSJ .
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Кодовая страница 01001» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
- ^ «Кодовая страница 01032» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
- ^ «Шрифты MICR для принтеров Infoprint 4100» . ИБМ. 24 июня 2004 г. Архивировано из оригинала 10 февраля 2022 г. Проверено 10 февраля 2022 г.
- ^ «ConnectCode MICR CMC7» (PDF) . ООО КоннектКод Пте 2021.
- ^ Обработка информации. Распознавание символов магнитными чернилами. Часть 2. Характеристики печати для CMC7 . ИСО . 01.06.2013. ИСО 1004-2:2013. ( Отрывок из предварительного просмотра. Архивировано 24 ноября 2022 г. на Wayback Machine )
- ^ «Кодовая страница 01033» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
- ^ «Резервный банк Индии — Публикации» . rbi.org.in. Архивировано из оригинала 6 сентября 2017 г. Проверено 6 сентября 2017 г.
- ^ Консорциум Юникод (08 сентября 2019 г.). «Производный возраст» . База данных символов Юникода: данные о производных свойствах . Архивировано из оригинала 20 апреля 2023 г. Проверено 10 июля 2020 г.
- ^ Jump up to: а б с Фрейтаг, Асмус; Макгоуэн, Рик; Уистлер, Кен (10 апреля 2017 г.). Известные аномалии в именах символов Юникода (4-е изд.). Консорциум Юникод . Техническое примечание Unicode № 27. Архивировано из оригинала 20 февраля 2020 г. Проверено 10 июля 2020 г.
- ^ ISO/IEC JTC 1/SC 2/WG 2 (03.01.2012). «Т.3. Оптическое распознавание символов». Неподтвержденный протокол заседания РГ 2 58 (PDF) . п. 29. SC2 N4188/WG2 N4103. Архивировано (PDF) из оригинала 14 июня 2019 г. Проверено 10 июля 2020 г.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Политика стабильности кодировки символов Юникода» . Консорциум Юникод. 23.06.2017. Архивировано из оригинала 14 июля 2022 г. Проверено 10 июля 2020 г.
- ^ «Наборы символов» . ИАНА. Архивировано из оригинала 06 марта 2023 г. Проверено 10 июля 2020 г.
- ^ «СТАТЬИ: Распознавание символов магнитными чернилами» (PDF) . Компьютеры и автоматизация . 5 (10): 10–16, 44 (12 — Другие сессии ). Октябрь 1956 г. Архивировано (PDF) из оригинала 3 октября 2020 г. Проверено 05 сентября 2020 г.
- ^ Манделл, Льюис (май 1977 г.). «Распространение EFTS среди национальных банков: Примечания». Журнал денег, кредита и банковского дела . 9 (2): 341–348. дои : 10.2307/1991983 . JSTOR 1991983 .
- ^ Стандарт ANSI X9.27-1995 и стандарт ANSI ANS X9.7-1990.
Внешние ссылки
[ редактировать ]- Справочник по основам MICR , Troy Group, Inc.
- Что лучше, E13B или CMC7?
- Набор символов MICR E13B
- Простой эксперимент по обнаружению магнитных чернил на банкнотах (на французском языке)