Аффинная адаптация формы
Обнаружение функций |
---|
Обнаружение края |
Обнаружение углов |
Обнаружение больших двоичных объектов |
Обнаружение гребня |
Преобразование Хафа |
Тензор структуры |
Обнаружение аффинных инвариантных функций |
Описание функции |
Масштабировать пространство |
Аффинная адаптация формы — это методология итеративной адаптации формы ядер сглаживания в аффинной группе ядер сглаживания к локальной структуре изображения в области окрестности конкретной точки изображения. Аналогичным образом, адаптация аффинной формы может быть достигнута путем итеративного искажения локального фрагмента изображения с помощью аффинных преобразований с одновременным применением вращательно-симметричного фильтра к деформированным фрагментам изображения. При условии, что этот итерационный процесс сходится, результирующая фиксированная точка будет аффинно-инвариантной . В области компьютерного зрения эта идея использовалась для определения операторов аффинно-инвариантных точек интереса, а также методов аффинно-инвариантного анализа текстур.
Аффинно-адаптированные операторы точек интереса
[ редактировать ]Точки интереса, полученные с помощью адаптированного к масштабу детектора пятен Лапласа или многомасштабного углового детектора Харриса с автоматическим выбором масштаба, инвариантны к перемещениям, вращениям и равномерным изменениям масштаба в пространственной области. Однако изображения, которые представляют собой входные данные для системы компьютерного зрения, также подвержены перспективным искажениям. Чтобы получить точки интереса, более устойчивые к перспективным преобразованиям, естественным подходом является разработка детектора признаков, инвариантного к аффинным преобразованиям .
Аффинная инвариантность может быть достигнута на основе измерений одной и той же многомасштабной оконной матрицы второго момента. как используется в многомасштабном операторе Харриса при условии, что мы расширяем концепцию пространства регулярного масштаба, полученную путем свертки с вращательно-симметричными гауссовскими ядрами, до аффинного гауссовского масштабного пространства , полученного с помощью гауссовских ядер с адаптированной формой ( Lindeberg 1994 , раздел 15.3; Lindeberg & Гардинг, 1997 ). Для двухмерного изображения , позволять и пусть быть положительно определенной матрицей 2×2. Тогда неоднородное гауссово ядро можно определить как
и учитывая любое входное изображение аффинное гауссово масштабное пространство - это трехпараметрическое масштабное пространство, определяемое как
Далее введем аффинное преобразование где представляет собой матрицу 2×2 и определяет преобразованное изображение как
- .
Тогда представления в аффинном масштабном пространстве и из и соответственно связаны соотношением
при условии, что матрицы аффинной формы и связаны согласно
- .
Если не принимать во внимание математические детали, которые, к сожалению, становятся несколько техническими, если стремиться к точному описанию происходящего, важным сообщением является то, что аффинное гауссово масштабное пространство замкнуто при аффинных преобразованиях .
Если мы, учитывая обозначения а также матрица локальной формы и матрица формы интегрирования , ввести аффинно-адаптированную многомасштабную матрицу второго момента в соответствии с
можно показать, что при любом аффинном преобразовании аффинно-адаптированная многомасштабная матрица второго момента преобразуется в соответствии с
- .
Опять же, не обращая внимания на некоторые запутанные технические детали, важным сообщением здесь является то, что при наличии соответствия между точками изображения и , аффинное преобразование можно оценить на основе измерений многомасштабных матриц второго момента и в двух доменах.
Важным следствием этого исследования является то, что если мы сможем найти аффинное преобразование такой, что является константой, умноженной на единичную матрицу, то мы получаем фиксированную точку, инвариантную к аффинным преобразованиям ( Линдеберг 1994 , раздел 15.4; Линдеберг и Гардинг 1997 ). Для целей практической реализации этого свойства часто можно достичь одним из двух основных способов. Первый подход основан на преобразованиях сглаживающих фильтров и состоит из:
- оценка матрицы второго момента в области изображений,
- определение нового адаптированного ядра сглаживания с ковариационной матрицей, пропорциональной ,
- сглаживание исходного изображения с помощью ядра сглаживания, адаптированного к форме, и
- повторяя эту операцию до тех пор, пока разница между двумя последовательными матрицами второго момента не станет достаточно малой.
Второй подход основан на искажениях в области изображений и предполагает:
- оценка в области изображений,
- оценивая локальное аффинное преобразование, пропорциональное где обозначает матрицу квадратного корня из ,
- деформация входного изображения с помощью аффинного преобразования и
- повторяя эту операцию до тех пор, пока достаточно близко к константе, умноженной на единичную матрицу.
Этот общий процесс называется адаптацией аффинной формы ( Линдеберг и Гардинг 1997 ; Баумберг 2000 ; Миколайчик и Шмид 2004 ; Туителаарс и ван Гул 2004 ; Равела 2004 ; Линдеберг 2008 ). В идеальном непрерывном случае оба подхода математически эквивалентны. Однако в практических реализациях первый подход на основе фильтра обычно более точен при наличии шума, тогда как второй подход на основе деформации обычно быстрее.
На практике описанный здесь процесс адаптации аффинной формы часто сочетается с автоматическим выбором масштаба обнаружения точек интереса, как описано в статьях об обнаружении каплей и обнаружении углов , чтобы получить точки интереса, которые инвариантны к полной аффинной группе, включая изменения масштаба. Помимо широко используемого многомасштабного оператора Харриса, эта аффинная адаптация формы также может быть применена к другим типам операторов точки интереса, таким как оператор лапласа/разности гауссовских BLOB-объектов и определитель гессиана ( Lindeberg 2008 ). Аффинную адаптацию формы также можно использовать для распознавания аффинно-инвариантных текстур и сегментации аффинно-инвариантных текстур.
С понятием аффинной адаптации формы тесно связано понятие аффинной нормализации , которая определяет аффинную инвариантную систему отсчета , как далее описано Линдебергом ( 2013a , b , 2021 : Приложение I.3), так что любое измерение изображения, выполняемое в аффинной инвариантная система отсчета является аффинно-инвариантной.
См. также
[ редактировать ]- Обнаружение больших двоичных объектов
- Обнаружение углов
- Функция Гаусса
- Детектор аффинных областей Харриса
- Детектор гессенских аффинных областей
- Масштабировать пространство
Ссылки
[ редактировать ]- Баумберг, А. (2000). «Надежное сопоставление функций в широко разделенных представлениях». Материалы конференции IEEE по компьютерному зрению и распознаванию образов . стр. I: 1774–1781. дои : 10.1109/CVPR.2000.855899 .
- Линдеберг, Т. (1994). Теория масштаба-пространства в компьютерном зрении . Спрингер. ISBN 0-7923-9418-6 .
- Линдеберг, Т.; Гардинг, Дж. (1997). «Сглаживание с адаптацией к форме при оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры» . Вычисление изображений и зрительных образов . 15 (6): 415–434. дои : 10.1016/S0262-8856(97)01144-X .
- Линдеберг, Т. (2008). «Масштаб-космос» . Энциклопедия компьютерных наук и техники ( Бенджамин Ва , изд.), John Wiley and Sons . Том. IV. стр. 2495–2504. дои : 10.1002/9780470050118.ecse609 . ISBN 978-0470050118 .
- Линдеберг, Т. (2013a). «Инвариантность зрительных операций на уровне рецептивных полей» . ПЛОС ОДИН . 8 (7): e66990:1–33. arXiv : 1210.0754 . Бибкод : 2013PLoSO...866990L . дои : 10.1371/journal.pone.0066990 . ПМЦ 3716821 . ПМИД 23894283 .
- Линдеберг, Т. (2013b). «Обобщенная аксиоматическая теория масштабного пространства» . Достижения в области визуализации и электронной физики . 178 (7): 1–96. дои : 10.1016/B978-0-12-407701-0.00001-7 . ISBN 9780124077010 .
- Линдеберг, Т. (2021). «Нормативная теория зрительных рецептивных полей» . Гелион . 7 (1): e05897. дои : 10.1016/j.heliyon.2021.e05897 . ПМЦ 7820928 . ПМИД 33521348 .
- Миколайчик, К.; Шмид, К. (2004). «Масштабные и аффинно-инвариантные детекторы точек интереса» (PDF) . Международный журнал компьютерного зрения . 60 (1): 63–86. дои : 10.1023/B:VISI.0000027790.02288.f2 . S2CID 1704741 .
Интеграция многомасштабного оператора Харриса с методологией автоматического выбора масштаба, а также с аффинной адаптацией формы.
- Туйтелаарс, Т.; ван Гул, Л. (2004). «Сопоставление широко разделенных представлений на основе аффинных инвариантных областей» (PDF) . Международный журнал компьютерного зрения . 59 (1): 63–86. дои : 10.1023/B:VISI.0000020671.28016.e8 . S2CID 5107897 . Архивировано из оригинала (PDF) 12 июня 2010 г.
- Равела, С. (2004). «Формирование рецептивных полей для аффинной инвариантности». Материалы конференции IEEE Computer Society 2004 г. по компьютерному зрению и распознаванию образов, 2004 г. CVPR 2004 . Том. 2. С. 725–730. дои : 10.1109/CVPR.2004.1315236 . ISBN 0-7695-2158-4 .