Аксиомы масштабного пространства
В обработке изображений и компьютерном зрении структура масштабного пространства может использоваться для представления изображения как семейства постепенно сглаженных изображений. Эта структура является очень общей, и существуют различные представления пространства масштаба . Типичный подход к выбору определенного типа представления масштабного пространства состоит в том, чтобы установить набор аксиом масштабного пространства , описывающих основные свойства желаемого представления масштабного пространства и часто выбираемых так, чтобы сделать представление полезным в практических приложениях. После установления аксиомы сужают возможные представления в масштабном пространстве до меньшего класса, обычно имеющего лишь несколько свободных параметров.
Набор аксиом стандартного масштабного пространства, обсуждаемый ниже, приводит к линейному гауссовскому масштабному пространству, которое является наиболее распространенным типом масштабного пространства, используемым при обработке изображений и компьютерном зрении.
Аксиомы масштабного пространства для линейного представления в масштабном пространстве
[ редактировать ]пространства линейного масштаба Представление сигнала полученное сглаживанием с помощью ядра Гаусса удовлетворяет ряду свойств « аксиом масштабного пространства» , которые делают его особой формой многомасштабного представления:
- линейность
- где и являются сигналами, в то время как и являются константами,
- сдвиговая инвариантность
- где обозначает оператор сдвига (перевода)
- полугрупповая структура
- со связанным свойством каскадного сглаживания
- существование бесконечно малого генератора
- отсутствие создания локальных экстремумов (переходов через нуль) в одном измерении,
- отсутствие усиления локальных экстремумов в любом количестве измерений
- в пространственных максимумах и в пространственных минимумах,
- вращательная симметрия
- для какой-то функции ,
- масштабная инвариантность
- для некоторых функций и где обозначает преобразование Фурье ,
- позитивность
- ,
- нормализация
- .
Фактически, можно показать, что гауссово ядро является уникальным выбором , учитывая несколько различных комбинаций подмножеств этих аксиом масштабного пространства: [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] большинство аксиом (линейность, инвариантность к сдвигу, полугруппа) соответствуют масштабированию, являющемуся полугруппой линейного оператора, инвариантного к сдвигу, которому удовлетворяет ряд интегральных преобразований семейств , в то время как «несоздание локальных экстремумов» [4] для одномерных сигналов или «неусиление локальных экстремумов» [4] [7] [10] для сигналов более высокой размерности являются решающими аксиомами, которые связывают масштабные пространства со сглаживанием (формально, параболические уравнения в частных производных ) и, следовательно, выбирают гауссиану.
Ядро Гаусса также разделимо в декартовых координатах, т.е. . Однако разделимость не считается аксиомой масштабного пространства, поскольку это свойство, зависящее от координат и связанное с проблемами реализации. Кроме того, требование разделимости в сочетании с вращательной симметрией само по себе фиксирует, что ядро сглаживания является гауссовым.
Существует обобщение теории гауссовского масштабного пространства на более общие аффинные и пространственно-временные масштабные пространства. [10] [11] В дополнение к изменчивости по масштабу, для обработки которой была разработана оригинальная теория масштабного пространства, эта обобщенная теория масштабного пространства также включает в себя другие типы изменчивости, включая деформации изображения, вызванные вариациями просмотра, аппроксимируемыми локальными аффинными преобразованиями , и относительными движениями между объектами. в мире и наблюдателе, аппроксимированном локальными преобразованиями Галилея . В этой теории вращательная симметрия не навязывается как необходимая аксиома масштабного пространства, а вместо этого заменяется требованиями аффинной и/или галилеевой ковариантности. Обобщенная теория масштабного пространства приводит к предсказаниям о профилях рецептивных полей, которые хорошо качественно согласуются с профилями рецептивных полей, измеренными с помощью записей клеток с помощью биологического зрения. [12] [13] [14]
В литературе по компьютерному зрению , обработке изображений и обработке сигналов существует множество других многомасштабных подходов, использующих вейвлеты и множество других ядер, которые не используют и не требуют тех же требований, что и масштабного пространства описания ; пожалуйста, ознакомьтесь со статьей о соответствующих многомасштабных подходах . Также проводилась работа над концепциями дискретного масштабного пространства, которые переносят свойства масштабного пространства в дискретную область; см. в статье о реализации масштабного пространства примеры и ссылки .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Кендеринк, Ян Дж. (август 1984 г.). «Структура изображений». Биологическая кибернетика . 50 (5): 363–370. дои : 10.1007/bf00336961 . ПМИД 6477978 . S2CID 206775432 .
- ^ Бабо, Жан; Уиткин, Эндрю П.; Боден, Мишель; Дуда, Ричард О. (1986). «Уникальность гауссовского ядра для фильтрации в масштабном пространстве» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 8 (1): 26–33. дои : 10.1109/TPAMI.1986.4767749 . ПМИД 21869320 . S2CID 18295906 .
- ^ Юлль, Алан Л.; Поджо, Томазо А. (1986). «Теоремы масштабирования для пересечений нуля» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 8 (1): 15–25. дои : 10.1109/TPAMI.1986.4767748 . hdl : 1721.1/5655 . ПМИД 21869319 . S2CID 14815630 .
- ^ Перейти обратно: а б с Линдеберг, Т. (1990). «Масштабное пространство для дискретных сигналов» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 12 (3): 234–254. дои : 10.1109/34.49051 .
- ^ Линдеберг, Тони, Теория масштабного пространства в компьютерном зрении, Kluwer, 1994 ,
- ^ Пауэлс, Э.Дж.; Ван Гул, LJ; Фидделерс, П.; Мунс, Т. (1995). «Расширенный класс масштабно-инвариантных и рекурсивных масштабных пространственных фильтров» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 17 (7): 691–701. дои : 10.1109/34.391411 .
- ^ Перейти обратно: а б Линдеберг, Тони (май 1996 г.). «Об аксиоматических основах линейного масштабного пространства: сочетание полугрупповой структуры с причинностью и масштабной инвариантностью». В Спорринге, Дж.; и др. (ред.). Гауссова масштабно-пространственная теория: Учеб. Аспирантура по теории масштабного пространства . Копенгаген, Дания: Издательство Kluwer Academic Publishers. стр. 75–98. урна : nbn:se:kth:diva-40221 .
- ^ Флорак, Люк, Структура изображения, Kluwer Academic Publishers, 1997.
- ^ Вайкерт, Иоахим; Исикава, Сэйдзи; Имия, Ацуши (1999). «Линейное масштабное пространство впервые было предложено в Японии» . Журнал математического изображения и видения . 10 (3): 237–252. дои : 10.1023/А:1008344623873 . S2CID 17835046 .
- ^ Перейти обратно: а б с Линдеберг, Тони (2011). «Обобщенная аксиоматика гауссовского масштаба-пространства, включающая линейное масштабное пространство, аффинное масштабное пространство и пространственно-временное масштабное пространство» . Журнал математического изображения и видения . 40 : 36–81. дои : 10.1007/s10851-010-0242-2 . S2CID 950099 .
- ^ Перейти обратно: а б Линдеберг, Тони (2013). Обобщенная аксиоматическая теория масштаба-пространства . Достижения в области визуализации и электронной физики. Том. 178. стр. 1–96. дои : 10.1016/B978-0-12-407701-0.00001-7 . ISBN 9780124077010 .
- ^ Линдеберг, Тони (2013). «Вычислительная теория зрительных рецептивных полей» . Биологическая кибернетика . 107 (6): 589–635. дои : 10.1007/s00422-013-0569-z . ПМК 3840297 . ПМИД 24197240 .
- ^ Линдеберг, Тони (2013). «Инвариантность зрительных операций на уровне рецептивных полей» . ПЛОС ОДИН . 8 (7): e66990. arXiv : 1210.0754 . Бибкод : 2013PLoSO...866990L . дои : 10.1371/journal.pone.0066990 . ПМК 3716821 . ПМИД 23894283 .
- ^ Линдеберг, Тони (2021). «Нормативная теория зрительных рецептивных полей» . Гелион . 7 (1): e05897. Бибкод : 2021Heliy...705897L . дои : 10.1016/j.heliyon.2021.e05897 . ПМК 7820928 . ПМИД 33521348 .