Характеристика, похожая на волосы
Функции, подобные Хаару, — это цифрового изображения функции , используемые при распознавании объектов . Своим названием они обязаны интуитивному сходству с вейвлетами Хаара и использовались в первом детекторе лиц в реальном времени. [1]
Исторически сложилось так, что работа только с интенсивностью изображения (т. е. RGB значениями пикселей в каждом пикселе изображения) делала задачу расчета признаков вычислительно дорогостоящей . Публикация Папагеоргиу и др. [2] обсуждалась работа с альтернативным набором функций, основанным на вейвлетах Хаара вместо обычных интенсивностей изображения. Пол Виола и Майкл Джонс [1] адаптировал идею использования вейвлетов Хаара и разработал так называемые хаар-подобные функции. Функция, подобная Хаару, рассматривает соседние прямоугольные области в определенном месте окна обнаружения, суммирует интенсивности пикселей в каждой области и вычисляет разницу между этими суммами. Эта разница затем используется для категоризации подразделов изображения.Например, применительно к человеческому лицу часто наблюдается то, что у всех лиц область глаз темнее области щек. Таким образом, общей особенностью Хаара для обнаружения лица является набор из двух соседних прямоугольников, расположенных над глазом и областью щек. Положение этих прямоугольников определяется относительно окна обнаружения, которое действует как ограничивающая рамка целевого объекта (в данном случае лица).
На этапе обнаружения структуры обнаружения объектов Виолы-Джонса окно целевого размера перемещается по входному изображению, и для каждого подраздела изображения вычисляется признак Хаара. Затем эта разница сравнивается с изученным порогом, который отделяет необъекты от объектов. Поскольку такой признак, подобный Хаару, является лишь слабым обучающимся или классификатором (качество его обнаружения немного лучше, чем случайное угадывание), для описания объекта с достаточной точностью необходимо большое количество подобных Хаару признаков. Таким образом, в структуре обнаружения объектов Виолы-Джонса функции, подобные Хаару, организованы в так называемый каскад классификаторов , чтобы сформировать сильного обучающегося или классификатора.
Ключевым преимуществом функции, подобной Хаару, перед большинством других функций является скорость вычислений. Благодаря использованию интегральных изображений хааровский элемент любого размера может быть вычислен за постоянное время (примерно 60 инструкций микропроцессора для 2-прямоугольного элемента).
Прямоугольные черты, подобные Хаару
[ редактировать ]Простую прямоугольную характеристику, подобную Хаару, можно определить как разницу суммы пикселей областей внутри прямоугольника, которые могут находиться в любом положении и масштабе исходного изображения. Этот измененный набор функций называется функцией «2 прямоугольника» . Виола и Джонс также определили объекты с тремя прямоугольниками и объекты с четырьмя прямоугольниками. Значения указывают на определенные характеристики конкретной области изображения. Каждый тип объекта может указывать на наличие (или отсутствие) определенных характеристик изображения, таких как края или изменения текстуры. Например, объект из двух прямоугольников может указывать, где проходит граница между темной и светлой областью.
Быстрое вычисление характеристик Хаара
[ редактировать ]Одним из достижений Виолы и Джонса было использование таблиц суммированных площадей . [3] которые они назвали целостными образами . Целочисленные изображения можно определить как двумерные справочные таблицы в виде матрицы того же размера, что и исходное изображение. Каждый элемент целостного изображения содержит сумму всех пикселей, расположенных в верхней левой части исходного изображения (относительно положения элемента). Это позволяет вычислить сумму прямоугольных областей изображения в любой позиции и масштабе, используя всего четыре поиска:
где точки принадлежат целостному образу , как показано на рисунке.
Для каждой функции типа Хаара может потребоваться более четырех поисков, в зависимости от того, как она была определена. Для 2-прямоугольных объектов Виолы и Джонса требуется шесть поисков, для 3-прямоугольных объектов — восемь поисков, а для 4-прямоугольных объектов — девять поисков.
Наклоненные волосы
[ редактировать ]Линхарт и Мейдт [4] представил концепцию наклонного (45°) элемента, подобного Хаару. Это использовалось для увеличения размерности набора функций в попытке улучшить обнаружение объектов на изображениях. Это удалось, поскольку некоторые из этих функций могут лучше описать объект. Например, наклоненный элемент Хаара в виде двух прямоугольников может указывать на наличие края под углом 45 °.
Мессом и Барчак [5] расширил эту идею до обычного вращающегося элемента, подобного Хаару. Хотя эта идея математически обоснована, практические проблемы не позволяют использовать свойства Хаара под любым углом. Чтобы быть быстрыми, алгоритмы обнаружения используют изображения с низким разрешением, что приводит к ошибкам округления . По этой причине повернутые элементы типа Хаара обычно не используются.
Ссылки
[ редактировать ]- ^ Jump up to: а б Виола и Джонс, « Быстрое обнаружение объектов с использованием расширенного каскада простых функций », «Компьютерное зрение и распознавание образов» , 2001 г.
- ^ Папагеоргиу, Орен и Поджо, «Общая основа обнаружения объектов», Международная конференция по компьютерному зрению, 1998.
- ^ Кроу, Ф., « Таблицы суммированных площадей для наложения текстур. Архивировано 8 августа 2017 г. в Wayback Machine », в Proceedings of SIGGRAPH , 18 (3): 207–212, 1984.
- ^ Jump up to: а б Линхарт Р. и Мэйдт Дж. « Расширенный набор функций Хаара для быстрого обнаружения объектов. Архивировано 15 декабря 2017 г. в Wayback Machine », ICIP02, стр. I: 900–903, 2002 г.
- ^ Мессом, Ч. Х. и Барчак, ALC, « Быстрые и эффективные вращающиеся элементы, подобные Хаару, с использованием повернутых интегральных изображений », Австралийская конференция по робототехнике и автоматизации (ACRA2006), стр. 1–6, 2006 г.
Дальнейшее чтение
[ редактировать ]- Хаар А. К теории ортогональных функциональных систем , Mathematical Annals, 69 , стр. 331–371, 1910.