Jump to content

Распознавание символов магнитными чернилами

(Перенаправлено из ISO 1004 )

Код распознавания символов с помощью магнитных чернил , сокращенно известный как код MICR , представляет собой технологию распознавания символов , используемую в основном в банковской сфере для оптимизации обработки и оформления чеков и других документов. Кодировка MICR, называемая строкой MICR , находится в нижней части чеков и других ваучеров и обычно включает в себя индикатор типа документа, код банка , номер банковского счета , номер чека, сумму чека (обычно добавляется после предъявления чека к оплате), и контрольный индикатор. Формат кода банка и номера банковского счета зависит от страны.

Технология позволяет считывателям MICR сканировать и считывать информацию непосредственно в устройство сбора данных. В отличие от штрих-кода и аналогичных технологий, символы MICR легко читаются человеком. Документы, закодированные MICR, могут обрабатываться гораздо быстрее и точнее, чем обычные документы, закодированные OCR .

Стандартное представление до Unicode

[ редактировать ]

Стандарт ISO E - 2033 :1983 и соответствующий японский промышленный стандарт JIS X 9010:1984 (первоначально JIS C 6229–1984) определяют кодировки символов для OCR-A , OCR-B и 13B .

Международное распространение

[ редактировать ]

Используются два основных шрифта MICR : E-13B и CMC-7. Не существует конкретного международного соглашения о том, какие страны какой шрифт используют. [1] На практике это не создает особых проблем, поскольку чеки и другие ваучеры обычно не вытекают из конкретной юрисдикции.

Шрифт E-13B был принят в качестве международного стандарта в ISO 1004-1:2013 и является стандартом в Австралии, Канаде, Великобритании, США, а также в Центральной Америке и большей части Азии, помимо других стран. . [1]

Шрифт CMC-7 был принят в качестве международного стандарта в ISO 1004-2:2013 и широко используется в Европе, включая Францию ​​и Италию, Мексику и Южную Америку, включая Аргентину, Бразилию, Чили и другие страны.

Израиль — единственная страна, которая может использовать оба шрифта одновременно, хотя такая практика делает систему значительно менее эффективной. Эта ситуация является результатом того, что израильтяне приняли на вооружение CMC-7, в то время как палестинцы выбрали E-13B. [1]

Шрифт MICR E-13B из 14 символов. Управляющие символы, заключающие в скобки каждый блок цифр: (слева направо) транзит , on-us , сумма и тире .

E-13B имеет набор из 14 символов, состоящий из 10 десятичных цифр и следующих символов:

  • ⑆ (транзит: используется для разграничения банковского кода );
  • ⑈ (на сайте: используется для разделения номера счета клиента);
  • ⑇ (сумма: используется для ограничения суммы транзакции);
  • ⑉ (тире: используется для разделения частей чисел, например, номеров маршрутов или номеров счетов).

В сфере печати чеков и банковской деятельности линию E-13B MICR также часто называют линией TOAD. Эта ссылка состоит из 4 символов: Transit, Onus, Amount и Dash. [ нужна ссылка ] По сравнению с CMC-7, некоторые пары символов E-13B (особенно 2 и 5) могут давать относительно схожие результаты при магнитном сканировании; однако в качестве запасного варианта на случай сбоя магнитного считывания E-13B также хорошо работает при оптическом распознавании символов . [1]

Репертуар E-13B может быть представлен в Юникоде (см. ниже). До появления Unicode его можно было закодировать в соответствии со стандартом ISO 2033 :1983, который кодирует цифры в их обычных ASCII местах , транзит как 0x3A, на нас как 0x3C, сумму как 0x3B и тире как 0x3D. [2] Для EBCDIC кодовая страница IBM 1001 кодирует цифры в их обычных местах EBCDIC, транзит как 0xDB, на нас как 0xEB, сумму как 0xCB и тире как 0xFB. [3]

Кодовая страница IBM 1032 расширяет кодовую страницу 1001, добавляя альтернативные кодировки для транзита по адресам 0x5C, 0x7A и 0xC1, для нас по адресам 0x4C, 0x61 и 0xC3, суммы по адресам 0x5B, 0x5E и 0xC2 и тире по адресам 0x60, 0x7E и 0xC4, в дополнение к пространство нулевой ширины по адресу 0x5A. [4] Эти альтернативные представления были добавлены для совместимости с Siemens и Océ . принтерами [5]

Шрифт MICR CMC-7 из 41 символа. Управляющие символы после цифр: (слева направо) S I ( внутренний ), S II ( терминатор ), S III ( сумма ), S IV ( неиспользуемый ) и S V ( маршрутизация ).

CMC-7 включает 10 цифр, 26 заглавных букв, [6] [7] и 5 управляющих символов: S I ( внутренний ), [ нужна ссылка ] S II ( терминатор ), [ нужна ссылка ] S III ( сумма ), [ нужна ссылка ] S IV (неиспользуемый символ) и S V ( маршрутизация ). [ нужна ссылка ]

CMC-7 имеет формат штрих-кода , в котором каждый символ имеет два отдельных больших промежутка в разных местах, а также отдельные узоры между ними, чтобы свести к минимуму любую вероятность путаницы символов при магнитном чтении; однако эти полосы слишком близки и узки, чтобы их можно было надежно распознать при типичном разрешении сканирования, если вернуться к оптическому сканированию. CMC-7 также может производить внешне успешное, но неправильное сканирование перевернутых линий MICR. [1]

Юникод не включает поддержку управляющих символов CMC-7. Кодовая страница IBM 1033 кодирует: [8]

Цифры и заглавные буквы в своих обычных EBCDIC . местах
  • S I ( внутренний ) как 0x5E, 0x61 или 0xCB;
  • S II ( терминатор ) как 0x4C, 0x5B или 0xEB;
  • S III ( сумма ) как 0x60, 0x7E или 0xFB;
  • S IV как 0x50, 0x7A или 0xDB;
  • S V ( маршрутизация ) как 0x5C, 0x6E или 0xBB.

считыватель MICR

[ редактировать ]

Символы MICR печатаются на документах одним из двух шрифтов MICR с использованием намагничивающихся (обычно называемых магнитными) чернил или тонера , обычно содержащих оксид железа . При сканировании документ проходит через считыватель MICR, который выполняет две функции: намагничивание чернил и распознавание символов. Символы считываются считывающей головкой MICR — устройством, похожим на воспроизводящую головку магнитофона . Когда каждый символ проходит над головой, он создает уникальную форму волны , которую система может легко идентифицировать.

Считыватели MICR являются основным инструментом сортировки чеков и используются в сети распространения чеков на нескольких этапах. Например, торговец будет использовать считыватель MICR для сортировки чеков по банкам и отправки отсортированных чеков в клиринговую палату для перераспределения между этими банками. После получения банки выполняют еще одну сортировку MICR, чтобы определить, с какого счета клиента списаны средства и в какое отделение следует отправить чек на пути обратно к клиенту. Однако многие банки больше не предлагают этот последний шаг по возврату чека клиенту. Вместо этого чеки сканируются и сохраняются в цифровом виде. Сортировка чеков осуществляется в соответствии с географическим охватом банков страны. [9]

Символы OCR и MICR включены в стандарт Unicode , по крайней мере, с версии 1.1 (июнь 1993 г.). Поскольку база данных символов Юникода отслеживает только символы, начиная с версии 1.1, они также могли присутствовать в Юникоде 1.0 или 1.0.1. [10]

Блок Юникода, включающий символы OCR и MICR, называется оптическим распознаванием символов и охватывает U+2440–U+245F. Из символов этого блока четыре взяты из шрифта MICR E-13B:

  • U + 2446 ИДЕНТИФИКАЦИЯ БАНКА ОТДЕЛЕНИЯ OCR
  • U+2447 OCR СУММА ПРОВЕРКИ
  • U + 2448 OCR DASH (исправленный псевдоним MICR НА СИМВОЛ США ) [11]
  • U + 2449 НОМЕР СЧЕТА КЛИЕНТА OCR (исправленный псевдоним MICR DASH SYMBOL ) [11]

Имена последних двух символов были случайно заменены, когда они были названы в ISO/IEC 10646:1993 . [12] и им были присвоены точные имена в качестве официальных псевдонимов. [11] Согласно Политике стабильности Unicode, существующие имена остаются, что позволяет использовать их в качестве стабильных идентификаторов. [13] Кроме того, все четыре символа имеют информативные (неформальные) псевдонимы в диаграммах Юникода: «транзит», «сумма», «на нас» и «тире» соответственно.

До появления Unicode эти символы кодировались с помощью кодировки ISO-IR-98, определенной стандартом ISO 2033 :1983, в котором они назывались просто СИМВОЛ ОДИН ЧЕТЫРЕ – СИМВОЛ . Они были закодированы сразу после цифр, которые были закодированы в своих ASCII . местах [2] Хотя ISO 2033 также определяет кодировку для OCR-A и OCR-B , его кодировка для E-13B известна просто как ISO_2033-1983 IANA . [14]

Оптическое распознавание символов [1] [2]
Официальная таблица кодов Консорциума Unicode (PDF)
 0 1 2 3 4 5 6 7 8 9 А Б С Д И Ф
U + 244x
U + 245x
Примечания
1. ^ Начиная с версии Unicode 15.1.
2. ^ Серые области обозначают неназначенные кодовые точки.
Ранняя демонстрация использования шрифта E-13 MICR на чеке. Символ «транзит» отличается от E-13B.

До середины 1940-х годов чеки обрабатывались вручную с использованием метода Sort-A-Matic или Top Tab Key. Обработка и клиринг чеков отнимали очень много времени и представляли собой значительные затраты на оформление чеков и банковские операции. По мере увеличения количества проверок стали искать пути автоматизации процесса. Стандарты были разработаны для обеспечения единообразия в финансовых учреждениях. К середине 1950-х годов Стэнфордский исследовательский институт и компания General Electric [15] Компьютерная лаборатория разработала первую автоматизированную систему обработки проверок с использованием MICR. Эта же команда разработала шрифт E-13B MICR. «E» означает, что шрифт является пятым из рассматриваемых, а «B» означает, что это была вторая версия. «13» относится к сетке символов 0,013 дюйма.

Чек, подписанный Джеральдом Фордом , с маркировкой E-13B.

Испытание шрифта MICR E-13B было показано Американской ассоциации банкиров (ABA) в июле 1956 года, которая приняла его в 1958 году в качестве стандарта MICR для оборотных документов в Соединенных Штатах . ABA приняла MICR в качестве своего стандарта, поскольку машины могли точно считывать MICR, а MICR можно было распечатать с использованием существующей технологии. Кроме того, MICR оставался машиночитаемым, даже несмотря на чрезмерную штамповку, маркировку, искажение и многое другое. Первые чеки с использованием MICR были напечатаны к концу 1959 года. Хотя соблюдение стандартов MICR было добровольным в Соединенных Штатах, к 1963 году оно было почти повсеместно принято в Соединенных Штатах. [16] В 1963 году ANSI принял шрифт E-13B ABA в качестве американского стандарта печати MICR. [17] и E-13B также был стандартизирован как ISO 1004:1995.

Другие страны устанавливают свои собственные стандарты, хотя считыватели MICR и большая часть другого оборудования были произведены в США. Технология MICR с некоторыми вариациями была принята во многих странах. Шрифт E-13B был принят в качестве стандарта в США, Канаде, Великобритании, Австралии и многих других странах. В Австралии системой управляет Австралийская платежная сеть .

Чек, подписанный Энцо Феррари из коллекции Музея Феррари , с маркировкой CMC-7.

Шрифт CMC-7 был разработан во Франции компанией Groupe Bull в 1957 году. Он был принят в качестве стандарта MICR в Аргентине, Франции, Италии и некоторых других европейских странах.

В 1960-х годах шрифты MICR стали символом современности или футуризма, что привело к созданию похожих «компьютерных» шрифтов , имитирующих внешний вид шрифтов MICR, которые, в отличие от настоящих шрифтов MICR, имели полный набор символов.

MICR E-13B также используется для кодирования информации в других приложениях, таких как рекламные акции, купоны, кредитные карты, авиабилеты, квитанции о страховых взносах, депозитные билеты и многое другое. E-13b — версия, специально разработанная для офсетной печати. Была немного другая версия для высокой печати , [ нужна ссылка ] под названием E-13a. Кроме того, существовала конкурирующая система под названием «Фред» (электронное устройство для чтения цифр), в которой использовались цифры, которые выглядели более традиционными.

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с д и «Битва шрифтов MICR: что лучше, E13B или CMC7?» . Архивировано из оригинала 03 августа 2020 г. Проверено 16 июля 2019 г.
  2. ^ Перейти обратно: а б ISO/TC97/SC2 (1 августа 1985 г.). ISO-IR-98: Набор из 14 графических символов шрифта E-13B (PDF) . ITSCJ/ IPSJ . {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  3. ^ «Кодовая страница 01001» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
  4. ^ «Кодовая страница 01032» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
  5. ^ «Шрифты MICR для принтеров Infoprint 4100» . ИБМ. 24 июня 2004 г. Архивировано из оригинала 10 февраля 2022 г. Проверено 10 февраля 2022 г.
  6. ^ «ConnectCode MICR CMC7» (PDF) . ООО КоннектКод Пте 2021.
  7. ^ Обработка информации. Распознавание символов магнитными чернилами. Часть 2. Характеристики печати для CMC7 . ИСО . 01.06.2013. ИСО 1004-2:2013. ( Отрывок из предварительного просмотра. Архивировано 24 ноября 2022 г. на Wayback Machine )
  8. ^ «Кодовая страница 01033» (PDF) . ИБМ . Архивировано из оригинала (PDF) 8 июля 2015 г. Проверено 19 октября 2021 г.
  9. ^ «Резервный банк Индии — Публикации» . rbi.org.in. Архивировано из оригинала 6 сентября 2017 г. Проверено 6 сентября 2017 г.
  10. ^ Консорциум Юникод (08 сентября 2019 г.). «Производный возраст» . База данных символов Юникода: данные о производных свойствах . Архивировано из оригинала 20 апреля 2023 г. Проверено 10 июля 2020 г.
  11. ^ Перейти обратно: а б с Фрейтаг, Асмус; Макгоуэн, Рик; Уистлер, Кен (10 апреля 2017 г.). Известные аномалии в именах символов Юникода (4-е изд.). Консорциум Юникод . Техническое примечание Unicode № 27. Архивировано из оригинала 20 февраля 2020 г. Проверено 10 июля 2020 г.
  12. ^ ISO/IEC JTC 1/SC 2/WG 2 (03.01.2012). «Т.3. Оптическое распознавание символов». Неподтвержденный протокол заседания РГ 2 58 (PDF) . п. 29. SC2 N4188/WG2 N4103. Архивировано (PDF) из оригинала 14 июня 2019 г. Проверено 10 июля 2020 г. {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  13. ^ «Политика стабильности кодировки символов Юникода» . Консорциум Юникод. 2017-06-23. Архивировано из оригинала 14 июля 2022 г. Проверено 10 июля 2020 г.
  14. ^ «Наборы символов» . ИАНА. Архивировано из оригинала 06 марта 2023 г. Проверено 10 июля 2020 г.
  15. ^ «СТАТЬИ: Распознавание символов магнитными чернилами» (PDF) . Компьютеры и автоматизация . 5 (10): 10–16, 44 (12 — Другие сессии ). Октябрь 1956 г. Архивировано (PDF) из оригинала 3 октября 2020 г. Проверено 05 сентября 2020 г.
  16. ^ Манделл, Льюис (май 1977 г.). «Распространение EFTS среди национальных банков: Примечания». Журнал денег, кредита и банковского дела . 9 (2): 341–348. дои : 10.2307/1991983 . JSTOR   1991983 .
  17. ^ Стандарт ANSI X9.27-1995 и стандарт ANSI ANS X9.7-1990.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e224157bce076ba10e337078e1707599__1721922120
URL1:https://arc.ask3.ru/arc/aa/e2/99/e224157bce076ba10e337078e1707599.html
Заголовок, (Title) документа по адресу, URL1:
Magnetic ink character recognition - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)