Детектор гессенских аффинных областей
Обнаружение функций |
---|
Обнаружение края |
Обнаружение угла |
Обнаружение больших двоичных объектов |
Обнаружение гребней |
Преобразование Хафа |
Тензор структуры |
Обнаружение аффинных инвариантных функций |
Описание функции |
Масштабировать пространство |
Детектор аффинных областей Гессе — это детектор признаков, используемый в области компьютерного зрения и анализа изображений . Как и другие детекторы признаков, аффинный детектор Гессе обычно используется в качестве этапа предварительной обработки алгоритмов, которые полагаются на идентифицируемые характерные точки интереса .
Аффинный детектор Гессе является частью подкласса детекторов признаков, известных как аффинно-инвариантные детекторы: детектор аффинных областей Харриса , аффинные области Гессе, максимально стабильные экстремальные области , детектор значимости Кадира – Брейди , области на основе краев (EBR) и экстремумы интенсивности. -регионы (IBR).
Описание алгоритма
[ редактировать ]Алгоритм аффинного детектора Гессиана практически идентичен детектору аффинных областей Харриса . Фактически, оба алгоритма были разработаны Кристианом Миколайчиком и Корделией Шмид в 2002 году. [ 1 ] на основе более ранних работ, [ 2 ] [ 3 ] см. также [ 4 ] для более общего обзора.
Чем отличается аффин Гессе?
[ редактировать ]Аффинный детектор Харриса основан на точках интереса, обнаруженных в нескольких масштабах с использованием угловой меры Харриса на матрице второго момента. Аффинный гессиан также использует многомасштабный итерационный алгоритм для пространственной локализации и выбора масштабных и аффинных инвариантных точек. Однако в каждом отдельном масштабе аффинный детектор Гессе выбирает точки интереса на основе матрицы Гессе в этой точке:
где является второй частной производной в направление и — смешанная частная вторая производная в и направления. Важно отметить, что производные вычисляются в текущем масштабе итерации и, таким образом, являются производными изображения, сглаженного ядром Гаусса: . Как обсуждалось в статье о детекторе аффинных областей Харриса , производные должны быть соответствующим образом масштабированы с помощью коэффициента, связанного с ядром Гаусса: .
В каждом масштабе точками интереса являются те точки, которые одновременно являются локальными экстремумами как определителя , так и следа матрицы Гессе. След матрицы Гессе идентичен лапласиану гауссианов (LoG): [ 5 ]
Как обсуждалось Миколайчиком и др. (2005), выбирая точки, которые максимизируют определитель гессиана, эта мера наказывает более длинные структуры, которые имеют небольшие вторые производные (изменения сигнала) в одном направлении. [ 6 ] Этот тип меры очень похож на меры, используемые в схемах обнаружения капель , предложенных Линдебергом (1998), где либо лапласиан, либо определитель гессиана использовались в методах обнаружения капель с автоматическим выбором масштаба.
Как и аффинный алгоритм Харриса, эти точки интереса, основанные на матрице Гессе, также пространственно локализованы с использованием итеративного поиска, основанного на лапласиане гауссианов. Как и следовало ожидать, эти точки интереса называются точками интереса Гессиана – Лапласа . Кроме того, используя эти первоначально обнаруженные точки, аффинный детектор Гессе использует итеративный алгоритм адаптации формы для вычисления локального аффинного преобразования для каждой точки интереса. Реализация этого алгоритма практически идентична реализации аффинного детектора Харриса; однако вышеупомянутая мера Гессе заменяет все случаи угловой меры Харриса.
Устойчивость к аффинным и другим преобразованиям
[ редактировать ]Миколайчик и др. (2005) провели тщательный анализ нескольких современных детекторов аффинных областей: аффин Харриса, аффин Гессе, MSER , [ 7 ] ИБР и ЕБР [ 8 ] и заметный [ 9 ] детекторы. [ 6 ] Миколайчик и др. в своей оценке проанализировали как структурированные изображения, так и текстурированные изображения. Двоичные файлы детекторов для Linux и их тестовые образы находятся в свободном доступе на их веб-странице. Краткое изложение результатов Миколайчика и соавт. (2005) следуйте; см. Сравнение детекторов аффинных областей для более количественного анализа.
В целом аффинный детектор Гессе по производительности уступает MSER. Как и аффинный детектор Харриса, аффинные области интереса Гессе обычно более многочисленны и меньше, чем другие детекторы. Для одного изображения аффинный детектор Гессе обычно определяет более надежные области, чем аффинный детектор Харриса. Производительность меняется в зависимости от типа анализируемой сцены. Аффинный детектор Гессиана хорошо реагирует на текстурированные сцены, в которых много угловатых деталей. Однако для некоторых структурированных сцен, таких как здания, аффинный детектор Гессе работает очень хорошо. Это дополняет MSER, который лучше справляется с хорошо структурированными (сегментируемыми) сценами.
Пакеты программного обеспечения
[ редактировать ]- Аффинные ковариантные функции : К. Миколайчик поддерживает веб-страницу, содержащую двоичные файлы Linux гессианско-аффинного детектора в дополнение к другим детекторам и дескрипторам. Также доступен код Matlab, который можно использовать для иллюстрации и расчета повторяемости различных детекторов. Также доступны код и изображения для дублирования результатов, найденных в Mikolajczyk et al. (2005) статья.
- Lip-vireo. Архивировано 11 мая 2017 г. на Wayback Machine : — двоичный код для Linux, Windows и SunOS от исследовательской группы VIREO, подробнее см. на домашней странице. Архивировано 11 мая 2017 г. на Wayback Machine.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Миколайчик К. и Шмид К. 2002. Аффинно-инвариантный детектор точек интереса. В материалах 8-й Международной конференции по компьютерному зрению , Ванкувер, Канада.
- ^ Линдеберг, Тони. «Обнаружение функций с автоматическим выбором масштаба», Международный журнал компьютерного зрения, 30, 2, стр. 77–116, 1998.
- ^ Т. Линдеберг и Дж. Гардинг (1997). «Сглаживание с адаптацией к форме при оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры» . Вычисление изображений и зрительных образов . 15 (6): 415–434. дои : 10.1016/S0262-8856(97)01144-X .
- ^ Т. Линдеберг (2008–2009). «Масштаб-космос» . Энциклопедия компьютерных наук и техники (Бенджамин Ва, изд.), John Wiley and Sons . Том. IV. стр. 2495–2504. дои : 10.1002/9780470050118.ecse609 .
- ^ Миколайчик К. и Шмид, К. 2004. Масштабные и аффинно-инвариантные детекторы точек интереса. Международный журнал по компьютерному зрению 60(1):63–86.
- ^ Перейти обратно: а б К. Миколайчик, Т. Туителаарс, К. Шмид, А. Зиссерман, Дж. Мэйтас, Ф. Шаффалицки, Т. Кадир и Л. Ван Гул, Сравнение детекторов аффинных областей. В IJCV 65(1/2):43-72, 2005 г.
- ^ Дж.Матас, О. Чам, М. Урбан и Т. Пайдла, Надежное стерео с широкой базовой линией из максимально стабильных экстремальных регионов. В BMVC, стр. 384–393, 2002 г.
- ^ Т.Туйтелаарс и Л. Ван Гул, Сопоставление широко разделенных взглядов, основанных на аффинных инвариантных областях. В IJCV 59(1):61–85, 2004 г.
- ^ Т. Кадир, А. Зиссерман и М. Брэди, Аффинно-инвариантный детектор заметной области. В ECCV, стр. 404–416, 2004 г.
Внешние ссылки
[ редактировать ]- [1] – Слайды презентации Миколайчика и др. в своей статье 2005 года.
- [2] – Лаборатория компьютерного зрения Корделии Шмид .
- [3] - Код, тестовые изображения, библиография аффинных ковариантных функций, поддерживаемая Кристианом Миколайчиком и группой визуальной геометрии из группы робототехники Оксфордского университета.
- [4] - Библиография детекторов объектов (и капель), поддерживаемая Институтом робототехники и интеллектуальных систем Университета Южной Калифорнии.