Jump to content

Аксиомы масштабного пространства

Масштабировать пространство
Аксиомы масштабного пространства
Масштабирование пространственной реализации
Обнаружение функций
Обнаружение края
Обнаружение больших двоичных объектов
Обнаружение углов
Обнаружение гребня
Обнаружение точек интереса
Выбор масштаба
Аффинная адаптация формы
Масштабно-пространственная сегментация

В обработке изображений и компьютерном зрении структура масштабного пространства может использоваться для представления изображения как семейства постепенно сглаженных изображений. Эта структура является очень общей, и существуют различные представления пространства масштаба . Типичный подход к выбору определенного типа представления масштабного пространства состоит в том, чтобы установить набор аксиом масштабного пространства , описывающих основные свойства желаемого представления масштабного пространства и часто выбираемых так, чтобы сделать представление полезным в практических приложениях. После установления аксиомы сужают возможные представления в масштабном пространстве до меньшего класса, обычно имеющего лишь несколько свободных параметров.

Набор аксиом стандартного масштабного пространства, обсуждаемый ниже, приводит к линейному гауссовскому масштабному пространству, которое является наиболее распространенным типом масштабного пространства, используемым при обработке изображений и компьютерном зрении.

Аксиомы масштабного пространства для линейного представления в масштабном пространстве

[ редактировать ]

пространства линейного масштаба Представление сигнала полученное сглаживанием с помощью ядра Гаусса удовлетворяет ряду свойств « аксиом масштабного пространства» , которые делают его особой формой многомасштабного представления:

линейность
где и являются сигналами, в то время как и являются константами,
сдвиговая инвариантность
где обозначает оператор сдвига (перевода)
полугрупповая структура
со связанным свойством каскадного сглаживания
существование бесконечно малого генератора
отсутствие создания локальных экстремумов (переходов через нуль) в одном измерении,
отсутствие усиления локальных экстремумов в любом количестве измерений
в пространственных максимумах и в пространственных минимумах,
вращательная симметрия
для какой-то функции ,
масштабная инвариантность
для некоторых функций и где обозначает преобразование Фурье ,
позитивность
,
нормализация
.

Фактически, можно показать, что гауссово ядро ​​является уникальным выбором , учитывая несколько различных комбинаций подмножеств этих аксиом масштабного пространства: [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] большинство аксиом (линейность, инвариантность к сдвигу, полугруппа) соответствуют масштабированию, являющемуся полугруппой линейного оператора, инвариантного к сдвигу, которому удовлетворяет ряд интегральных преобразований семейств , в то время как «несоздание локальных экстремумов» [4] для одномерных сигналов или «неусиление локальных экстремумов» [4] [7] [10] для сигналов более высокой размерности являются решающими аксиомами, которые связывают масштабные пространства со сглаживанием (формально, параболические уравнения в частных производных ) и, следовательно, выбирают гауссиану.

Ядро Гаусса также разделимо в декартовых координатах, т.е. . Однако разделимость не считается аксиомой масштабного пространства, поскольку это свойство, зависящее от координат и связанное с проблемами реализации. Кроме того, требование разделимости в сочетании с вращательной симметрией само по себе фиксирует, что ядро ​​сглаживания является гауссовым.

Существует обобщение теории гауссовского масштабного пространства на более общие аффинные и пространственно-временные масштабные пространства. [10] [11] В дополнение к изменчивости по масштабу, для обработки которой была разработана оригинальная теория масштабного пространства, эта обобщенная теория масштабного пространства также включает в себя другие типы изменчивости, включая деформации изображения, вызванные вариациями просмотра, аппроксимируемыми локальными аффинными преобразованиями , и относительными движениями между объектами. в мире и наблюдателе, аппроксимированном локальными преобразованиями Галилея . В этой теории вращательная симметрия не навязывается как необходимая аксиома масштабного пространства, а вместо этого заменяется требованиями аффинной и/или галилеевой ковариантности. Обобщенная теория масштабного пространства приводит к предсказаниям о профилях рецептивных полей, которые хорошо качественно согласуются с профилями рецептивных полей, измеренными с помощью записей клеток с помощью биологического зрения. [12] [13] [14]

В литературе по компьютерному зрению , обработке изображений и обработке сигналов существует множество других многомасштабных подходов, использующих вейвлеты и множество других ядер, которые не используют и не требуют тех же требований, что и масштабного пространства описания ; пожалуйста, ознакомьтесь со статьей о соответствующих многомасштабных подходах . Также проводилась работа над концепциями дискретного масштабного пространства, которые переносят свойства масштабного пространства в дискретную область; см. в статье о реализации масштабного пространства примеры и ссылки .

См. также

[ редактировать ]
  1. ^ Кендеринк, Ян Дж. (август 1984 г.). «Структура изображений». Биологическая кибернетика . 50 (5): 363–370. дои : 10.1007/bf00336961 . ПМИД   6477978 . S2CID   206775432 .
  2. ^ Бабо, Жан; Уиткин, Эндрю П.; Боден, Мишель; Дуда, Ричард О. (1986). «Уникальность гауссовского ядра для фильтрации в масштабном пространстве» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 8 (1): 26–33. дои : 10.1109/TPAMI.1986.4767749 . ПМИД   21869320 . S2CID   18295906 .
  3. ^ Юлль, Алан Л.; Поджо, Томазо А. (1986). «Теоремы масштабирования для пересечений нуля» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 8 (1): 15–25. дои : 10.1109/TPAMI.1986.4767748 . hdl : 1721.1/5655 . ПМИД   21869319 . S2CID   14815630 .
  4. ^ Перейти обратно: а б с Линдеберг, Т. (1990). «Масштабное пространство для дискретных сигналов» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 12 (3): 234–254. дои : 10.1109/34.49051 .
  5. ^ Линдеберг, Тони, Теория масштабного пространства в компьютерном зрении, Kluwer, 1994 ,
  6. ^ Пауэлс, Э.Дж.; Ван Гул, LJ; Фидделерс, П.; Мунс, Т. (1995). «Расширенный класс масштабно-инвариантных и рекурсивных масштабных пространственных фильтров» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 17 (7): 691–701. дои : 10.1109/34.391411 .
  7. ^ Перейти обратно: а б Линдеберг, Тони (май 1996 г.). «Об аксиоматических основах линейного масштабного пространства: сочетание полугрупповой структуры с причинностью и масштабной инвариантностью». В Спорринге, Дж.; и др. (ред.). Гауссова масштабно-пространственная теория: Учеб. Аспирантура по теории масштабного пространства . Копенгаген, Дания: Издательство Kluwer Academic Publishers. стр. 75–98. урна : nbn:se:kth:diva-40221 .
  8. ^ Флорак, Люк, Структура изображения, Kluwer Academic Publishers, 1997.
  9. ^ Вайкерт, Иоахим; Исикава, Сэйдзи; Имия, Ацуши (1999). «Линейное масштабное пространство впервые было предложено в Японии» . Журнал математического изображения и видения . 10 (3): 237–252. дои : 10.1023/А:1008344623873 . S2CID   17835046 .
  10. ^ Перейти обратно: а б с Линдеберг, Тони (2011). «Обобщенная аксиоматика гауссовского масштаба-пространства, включающая линейное масштабное пространство, аффинное масштабное пространство и пространственно-временное масштабное пространство» . Журнал математического изображения и видения . 40 : 36–81. дои : 10.1007/s10851-010-0242-2 . S2CID   950099 .
  11. ^ Перейти обратно: а б Линдеберг, Тони (2013). Обобщенная аксиоматическая теория масштаба-пространства . Достижения в области визуализации и электронной физики. Том. 178. стр. 1–96. дои : 10.1016/B978-0-12-407701-0.00001-7 . ISBN  9780124077010 .
  12. ^ Линдеберг, Тони (2013). «Вычислительная теория зрительных рецептивных полей» . Биологическая кибернетика . 107 (6): 589–635. дои : 10.1007/s00422-013-0569-z . ПМК   3840297 . ПМИД   24197240 .
  13. ^ Линдеберг, Тони (2013). «Инвариантность зрительных операций на уровне рецептивных полей» . ПЛОС ОДИН . 8 (7): e66990. arXiv : 1210.0754 . Бибкод : 2013PLoSO...866990L . дои : 10.1371/journal.pone.0066990 . ПМК   3716821 . ПМИД   23894283 .
  14. ^ Линдеберг, Тони (2021). «Нормативная теория зрительных рецептивных полей» . Гелион . 7 (1): e05897. Бибкод : 2021Heliy...705897L . дои : 10.1016/j.heliyon.2021.e05897 . ПМК   7820928 . ПМИД   33521348 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8506a320a1fab18f0102e204c307d3e0__1714030860
URL1:https://arc.ask3.ru/arc/aa/85/e0/8506a320a1fab18f0102e204c307d3e0.html
Заголовок, (Title) документа по адресу, URL1:
Scale-space axioms - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)