КЕДР-ЛИСА
Это программный комплекс для судебно-медицинской экспертизы почерка . Он был разработан в CEDAR , Центре передового опыта в области анализа и распознавания документов при Университете Буффало. [1] [2] [3] CEDAR-FOX имеет возможности взаимодействия с экспертом допрашиваемого документа для выполнения таких этапов обработки, как извлечение интересующих областей из отсканированного документа, определение строк и слов текста, распознавание текстовых элементов. Конечная цель — сравнить два образца письма, чтобы определить логарифмическое соотношение правдоподобия согласно гипотезам обвинения и защиты. Его также можно использовать для сравнения образцов подписей. Программное обеспечение, защищенное патентом США. [4] может быть лицензирована у Cedartech, Inc.
Подробности
[ редактировать ]Проверка писателя – это задача определить, написаны ли два рукописных образца одним и тем же писателем или нет. Он используется в экзаменаторе документов. Используя набор показателей, CedarFox может связать меру уверенности в том, написаны ли два документа одним и тем же человеком или разными людьми. CedarFox позволяет вам выбрать весь документ или определенную его область для сравнения. Сравнение основано на макрофункциях (которые измеряют глобальные характеристики, такие как наклон, связность и т. д.), микрофункциях (которые основаны на отдельных формах символов) и особенностях стиля (например, формах пар символов или биграммах). Доступны два различных режима проверки автора: (i) сомнительный документ сравнивается с одним известным документом (основанием этого сравнения являются статистические данные, основанные на том, сколько вариаций может иметь человек) и (ii) сравнивается сомнительный документ. против «нескольких известных» документов. Здесь система узнает из известных документов о привычках писателя. Для использования этого режима должны быть доступны как минимум четыре известных документа. Задача идентификации пользователя разделена на две части:
Обработка документов и извлечение признаков
[ редактировать ]CEDAR-FOX выполняет различные операции с документами, чтобы подготовить их к сравнению. Они включают определение порога, удаление строк, сегментацию строк, сегментацию слов и картографирование транскриптов.
Обработка изображений
[ редактировать ]- Пороговое значение преобразует изображение в оттенках серого в двоичное для отделения пикселя переднего плана от пикселя фона. Используемые методы определения порога: определение порога Оцу, адаптивное определение порога и определение порога текстуры.
- Если документ написан с использованием линейчатой бумаги, пользователь может выполнить операцию удаления подчеркивания. Для этой операции применяется преобразование Хафа, и пользователь может выбрать для него правильный порог. Выбор высокого порога приведет к удалению некоторых штрихов символов, и пользователю придется подобрать правильное значение порога.
- Сегментация линий разделяет каждую строку в документе и использует концепцию двумерной гауссовой плотности. Сегментация слов действует аналогичным образом и разделяет каждое слово в документе.
- Сопоставление транскрипта — это сопоставление достоверных данных, при котором программному обеспечению предоставляется текстовый файл, содержащий расшифровку рукописного изображения. Это полезно, когда разные субъекты должны написать один и тот же контент от руки, а затем он сопоставляется с неизвестным документом. Он находит наилучшее выравнивание на уровне слов между расшифровкой и рукописным изображением. Изображения символов извлекаются и могут использоваться для сравнения сходства между документами.
Системные утилиты
[ редактировать ]CedarFox имеет пользовательские интерфейсы для прямого сканирования документов, а также для ввода результатов непосредственно в электронные таблицы и для печати промежуточных результатов. Доступ к базе данных также доступен для хранения метаданных документа.
Сравнение документов
[ редактировать ]В CEDAR-FOX доступно множество опций для сравнения документов. Четыре основные используемые модели проверки:
- Выявление отличительных элементов.
- Функции разделены на макро-(глобальные) и микро-(локальные) функции. Макрофункции рассчитываются для всего документа, тогда как микрофункции рассчитываются для выбранных символов/биграмм/слов. Макрофункции основаны на шкале серого, на основе контура, на основе наклона, ширины штриха, наклона, высоты и пробела в словах. Эти характеристики используются для сравнения.
- Сопоставление пространства объектов с пространством расстояний с использованием меры сходства .
- Сравнение карт документов из пространства признаков с пространством расстояний. Макрообъекты имеют реальные значения, поэтому отображение в пространстве расстояний представляет собой абсолютную разницу между двумя объектами. Сходство для двоичного признака можно рассчитать, используя расстояние Хэмминга, евклидово расстояние и т. д. В качестве наилучшей меры рекомендуется использовать корреляционную меру сходства.
- Параметрическое моделирование пространственного распределения расстояний в формате pdf.
- Распределение в пространстве расстояний моделируется с использованием функции плотности вероятности, которая представлена как распределение Гаусса или гамма-распределение. характер документов влияет на микрофункции, но не на макрофункции. Рассчитывается коэффициент правдоподобия (LR), а затем логарифм коэффициента правдоподобия (LLR).
- Вычисление силы доказательств по 9 пунктам.
- LLR отображается по 9-балльной качественной шкале. Эта шкала соответствует силе доказательств, связанных со значением LLR. Он соответствует 9-балльной шкале технологии ASTM. [1- Идентифицировано как то же самое, 2-Вероятно, 3-Вероятно, 4-Признаки были, 5-Нет вывода, 6-Указания нет, 7-Вероятно нет, 8-Вероятно нет, 9-Определено как Устранение].
Идет поиск
[ редактировать ]CedarFox имеет несколько модальностей для поиска рукописных документов на наличие ключевых слов. Обнаружение слов позволяет пользователю выбрать изображение слова в качестве запроса, который используется для поиска похожих изображений слов в указанном документе. Другой тип поиска позволяет пользователю ввести слово, которое используется для ранжирования всех слов в документе (документах) с точки зрения вероятности соответствия слова запросу.
Распознавание рукописного ввода
[ редактировать ]CedarFox имеет возможность автоматического распознавания символов . Распознавание слов с заранее заданным словарем также встроено. Пользователь также может вручную вводить идентификаторы символов, если для целей проверки/идентификации автора требуется наивысшая точность распознавания символов.
Анализ разборчивости и читаемости
[ редактировать ]Поддерживается сравнение пробелов в словах и сравнение с метриками Палмера.
Ссылки
[ редактировать ]- ^ С.Н. Шрихари , К. Хуанг и Х. Сринивасан, «О различимости почерка близнецов», Журнал судебной медицины. Архивировано 23 ноября 2010 г. в Wayback Machine , март 2008 г., том. 53(2), стр. 430-446.
- ^ Шрихари, СН, Ш. Ча, Х. Арора и С. Ли, «Индивидуальность почерка», Журнал судебно-медицинской экспертизы, архивировано 23 ноября 2010 г. в Wayback Machine , 2002, 47 (4): 856-872.
- ^ С.Н. Шрихари, Х. Сринивасан и К. Десаи, «Экспертиза сомнительных документов с использованием CEDAR-FOX», Журнал судебно-медицинской экспертизы документов , 18, 2007 г., стр. 1-20.
- ^ С.Н. Шрихари и др., Метод и устройство для анализа и/или сравнения рукописных или биометрических образцов , патент США № 7,580,551, 29 августа 2009 г.