КЕДР-ЛИСА

Это программный комплекс для судебно-медицинской экспертизы почерка . Он был разработан в CEDAR , Центре передового опыта в области анализа и распознавания документов при Университете Буффало. ^[1]^[2]^[3] CEDAR-FOX имеет возможности взаимодействия с экспертом допрашиваемого документа для выполнения таких этапов обработки, как извлечение интересующих областей из отсканированного документа, определение строк и слов текста, распознавание текстовых элементов. Конечная цель — сравнить два образца письма, чтобы определить логарифмическое соотношение правдоподобия согласно гипотезам обвинения и защиты. Его также можно использовать для сравнения образцов подписей. Программное обеспечение, защищенное патентом США. ^[4] может быть лицензирована у Cedartech, Inc.

Подробности

Проверка писателя – это задача определить, написаны ли два рукописных образца одним и тем же писателем или нет. Он используется в экзаменаторе документов. Используя набор показателей, CedarFox может связать меру уверенности в том, написаны ли два документа одним и тем же человеком или разными людьми. CedarFox позволяет вам выбрать весь документ или определенную его область для сравнения. Сравнение основано на макрофункциях (которые измеряют глобальные характеристики, такие как наклон, связность и т. д.), микрофункциях (которые основаны на отдельных формах символов) и особенностях стиля (например, формах пар символов или биграммах). Доступны два различных режима проверки автора: (i) сомнительный документ сравнивается с одним известным документом (основанием этого сравнения являются статистические данные, основанные на том, сколько вариаций может иметь человек) и (ii) сравнивается сомнительный документ. против «нескольких известных» документов. Здесь система узнает из известных документов о привычках писателя. Для использования этого режима должны быть доступны как минимум четыре известных документа. Задача идентификации пользователя разделена на две части:

Обработка документов и извлечение признаков

CEDAR-FOX выполняет различные операции с документами, чтобы подготовить их к сравнению. Они включают определение порога, удаление строк, сегментацию строк, сегментацию слов и картографирование транскриптов.

Обработка изображений

Пороговое значение преобразует изображение в оттенках серого в двоичное для отделения пикселя переднего плана от пикселя фона. Используемые методы определения порога: определение порога Оцу, адаптивное определение порога и определение порога текстуры.
Если документ написан с использованием линейчатой бумаги, пользователь может выполнить операцию удаления подчеркивания. Для этой операции применяется преобразование Хафа, и пользователь может выбрать для него правильный порог. Выбор высокого порога приведет к удалению некоторых штрихов символов, и пользователю придется подобрать правильное значение порога.
Сегментация линий разделяет каждую строку в документе и использует концепцию двумерной гауссовой плотности. Сегментация слов действует аналогичным образом и разделяет каждое слово в документе.
Сегментация слов.
Сопоставление транскрипта — это сопоставление достоверных данных, при котором программному обеспечению предоставляется текстовый файл, содержащий расшифровку рукописного изображения. Это полезно, когда разные субъекты должны написать один и тот же контент от руки, а затем он сопоставляется с неизвестным документом. Он находит наилучшее выравнивание на уровне слов между расшифровкой и рукописным изображением. Изображения символов извлекаются и могут использоваться для сравнения сходства между документами.

Системные утилиты

CedarFox имеет пользовательские интерфейсы для прямого сканирования документов, а также для ввода результатов непосредственно в электронные таблицы и для печати промежуточных результатов. Доступ к базе данных также доступен для хранения метаданных документа.

Сравнение документов

В CEDAR-FOX доступно множество опций для сравнения документов. Четыре основные используемые модели проверки:

Выявление отличительных элементов.

Функции разделены на макро-(глобальные) и микро-(локальные) функции. Макрофункции рассчитываются для всего документа, тогда как микрофункции рассчитываются для выбранных символов/биграмм/слов. Макрофункции основаны на шкале серого, на основе контура, на основе наклона, ширины штриха, наклона, высоты и пробела в словах. Эти характеристики используются для сравнения.

Сопоставление пространства объектов с пространством расстояний с использованием меры сходства .

Сравнение карт документов из пространства признаков с пространством расстояний. Макрообъекты имеют реальные значения, поэтому отображение в пространстве расстояний представляет собой абсолютную разницу между двумя объектами. Сходство для двоичного признака можно рассчитать, используя расстояние Хэмминга, евклидово расстояние и т. д. В качестве наилучшей меры рекомендуется использовать корреляционную меру сходства.

Параметрическое моделирование пространственного распределения расстояний в формате pdf.

Распределение в пространстве расстояний моделируется с использованием функции плотности вероятности, которая представлена как распределение Гаусса или гамма-распределение. характер документов влияет на микрофункции, но не на макрофункции. Рассчитывается коэффициент правдоподобия (LR), а затем логарифм коэффициента правдоподобия (LLR).

Вычисление силы доказательств по 9 пунктам.

LLR отображается по 9-балльной качественной шкале. Эта шкала соответствует силе доказательств, связанных со значением LLR. Он соответствует 9-балльной шкале технологии ASTM. [1- Идентифицировано как то же самое, 2-Вероятно, 3-Вероятно, 4-Признаки были, 5-Нет вывода, 6-Указания нет, 7-Вероятно нет, 8-Вероятно нет, 9-Определено как Устранение].

Идет поиск

CedarFox имеет несколько модальностей для поиска рукописных документов на наличие ключевых слов. Обнаружение слов позволяет пользователю выбрать изображение слова в качестве запроса, который используется для поиска похожих изображений слов в указанном документе. Другой тип поиска позволяет пользователю ввести слово, которое используется для ранжирования всех слов в документе (документах) с точки зрения вероятности соответствия слова запросу.

Распознавание рукописного ввода

CedarFox имеет возможность автоматического распознавания символов . Распознавание слов с заранее заданным словарем также встроено. Пользователь также может вручную вводить идентификаторы символов, если для целей проверки/идентификации автора требуется наивысшая точность распознавания символов.

Анализ разборчивости и читаемости

Поддерживается сравнение пробелов в словах и сравнение с метриками Палмера.

Ссылки

^ С.Н. Шрихари , К. Хуанг и Х. Сринивасан, «О различимости почерка близнецов», Журнал судебной медицины. Архивировано 23 ноября 2010 г. в Wayback Machine , март 2008 г., том. 53(2), стр. 430-446.
^ Шрихари, СН, Ш. Ча, Х. Арора и С. Ли, «Индивидуальность почерка», Журнал судебно-медицинской экспертизы, архивировано 23 ноября 2010 г. в Wayback Machine , 2002, 47 (4): 856-872.
^ С.Н. Шрихари, Х. Сринивасан и К. Десаи, «Экспертиза сомнительных документов с использованием CEDAR-FOX», Журнал судебно-медицинской экспертизы документов , 18, 2007 г., стр. 1-20.
^ С.Н. Шрихари и др., Метод и устройство для анализа и/или сравнения рукописных или биометрических образцов , патент США № 7,580,551, 29 августа 2009 г.

Внешние ссылки

[Handwriting_of_Twins-1] С.Н. Шрихари , К. Хуанг и Х. Сринивасан, «О различимости почерка близнецов», Журнал судебной медицины. Архивировано 23 ноября 2010 г. в Wayback Machine , март 2008 г., том. 53(2), стр. 430-446.

[Individuality_of_Handwriting-2] Шрихари, СН, Ш. Ча, Х. Арора и С. Ли, «Индивидуальность почерка», Журнал судебно-медицинской экспертизы, архивировано 23 ноября 2010 г. в Wayback Machine , 2002, 47 (4): 856-872.

[Forensic_Document_Examination-3] С.Н. Шрихари, Х. Сринивасан и К. Десаи, «Экспертиза сомнительных документов с использованием CEDAR-FOX», Журнал судебно-медицинской экспертизы документов , 18, 2007 г., стр. 1-20.

[4] С.Н. Шрихари и др., Метод и устройство для анализа и/или сравнения рукописных или биометрических образцов , патент США № 7,580,551, 29 августа 2009 г.

[1]

[2]

[3]

[4]