Разница гауссиан
В науке о изображениях разница гауссианов ( DoG ) — это алгоритм улучшения характеристик , который включает в себя вычитание одной размытой по Гауссу версии исходного изображения из другой, менее размытой версии оригинала. В простом случае изображений в оттенках серого размытые изображения получаются путем свертки исходных изображений в оттенках серого с ядрами Гаусса, имеющими разную ширину (стандартные отклонения). Размытие изображения с использованием ядра Гаусса подавляет только высокочастотную пространственную информацию. Вычитание одного изображения из другого сохраняет пространственную информацию, которая находится между диапазоном частот, которые сохраняются в двух размытых изображениях. Таким образом, DoG представляет собой пространственный полосовой фильтр , который ослабляет частоты исходного изображения в оттенках серого, которые находятся далеко от центра полосы. [1]
Математика разности гауссианов
[ редактировать ]Позволять обозначим радиальную функцию Гаусса со средним и дисперсия , т. е. многомерная функция Гаусса со средним и ковариация . Более явно мы имеем
Разница гауссианов с дисперсиями это функция ядра
полученный путем вычитания гауссиана с более высокой дисперсией из гауссиана с более низкой дисперсией. Отличием оператора Гаусса является сверточный оператор, связанный с этой функцией ядра. Итак, учитывая n -мерное в оттенках серого изображение , разница гауссиан изображения — это n- мерное изображение
Поскольку свертка является билинейной, свертка с учетом разницы гауссиан эквивалентна применению двух разных размытий по Гауссу и затем получению разницы. На практике это происходит быстрее, поскольку размытие по Гауссу является разделимым фильтром .
Разницу гауссианов можно рассматривать как аппроксимацию функции ядра мексиканской шляпы, используемой для лапласиана гауссова оператора. Ключевое наблюдение состоит в том, что семейство гауссиан является фундаментальным решением уравнения теплопроводности
Левую часть можно аппроксимировать разностным коэффициентом
Между тем правая часть представляет собой в точности лапласиан функции Гаусса. Обратите внимание, что лапласиан гауссиана можно использовать в качестве фильтра для создания размытия по Гауссу лапласиана изображения, потому что по стандартным свойствам свертки. Связь между разницей оператора Гаусса и лапласианом оператора Гаусса объясняется далее в Приложении А Линдеберга (2015). [2]
Подробности и приложения
[ редактировать ]В качестве алгоритма улучшения характеристик можно использовать разницу Гаусса для повышения видимости краев и других деталей, присутствующих в цифровом изображении. Широкий выбор альтернативных фильтров повышения резкости краев работает за счет улучшения высокочастотных деталей, но поскольку случайный шум также имеет высокую пространственную частоту, многие из этих фильтров повышения резкости имеют тенденцию усиливать шум, что может быть нежелательным артефактом. Отличие алгоритма Гаусса удаляет высокочастотные детали, которые часто включают случайный шум, что делает этот подход одним из наиболее подходящих для обработки изображений с высокой степенью шума. Основным недостатком применения алгоритма является естественное снижение общего контраста изображения, вызванное этой операцией. [1]
При использовании для улучшения изображения алгоритм разницы Гаусса обычно применяется, когда отношение размеров ядра (2) к ядру (1) составляет 4:1 или 5:1. В примерах изображений справа размеры ядер Гаусса, использованных для сглаживания образца изображения, составляли 10 пикселей и 5 пикселей.
Алгоритм также можно использовать для получения аппроксимации лапласиана гауссиана , когда отношение размера 2 к размеру 1 примерно равно 1,6. [3] Лапласиан Гаусса полезен для обнаружения краев, которые появляются при различных масштабах изображения или степенях фокусировки изображения. Точные значения размеров двух ядер, которые используются для аппроксимации лапласиана или гауссиана, будут определять масштаб разностного изображения, которое в результате может оказаться размытым.
Различия гауссиан также использовались для обнаружения BLOB-объектов при преобразовании масштабно-инвариантных признаков . Фактически, DoG как разница двух многомерных нормальных распределений всегда имеет полную нулевую сумму, и ее свертка с однородным сигналом не дает ответа. Он хорошо аппроксимирует вторую производную гауссиана ( лапласиан гауссиана ) с К~1,6 и рецептивные поля ганглиозных клеток сетчатки с К~5. Его можно легко использовать в рекурсивных схемах и в качестве оператора в алгоритмах реального времени для обнаружения больших двоичных объектов и автоматического выбора масштаба.
Дополнительная информация
[ редактировать ]Считается, что в своей работе отличие алгоритма Гаусса имитирует то, как нейронная обработка в сетчатке глаза извлекает детали из изображений, предназначенных для передачи в мозг. [4] [5] [6]
См. также
[ редактировать ]- Алгоритм Марра – Хилдрета
- Обработка разницы гауссовского подхода при обнаружении BLOB-объектов.
- Обнаружение больших двоичных объектов
- Гауссова пирамида
- Масштабировать пространство
- Преобразование масштабно-инвариантного объекта
Ссылки
[ редактировать ]- ^ Перейти обратно: а б «Учебник по микроскопии молекулярных выражений: цифровая обработка изображений - разница в алгоритме улучшения края гауссиана», Olympus America Inc. и Университет штата Флорида Майкл В. Дэвидсон, Мортимер Абрамовиц
- ^ Линдеберг, Тони (2015). «Сопоставление изображений с использованием обобщенных точек интереса в масштабном пространстве» . Журнал математического изображения и видения . 52 : 3–36. дои : 10.1007/s10851-014-0541-0 . S2CID 254657377 .
- ^ Д. Марр; Э. Хилдрет (29 февраля 1980 г.). «Теория обнаружения краев». Труды Лондонского королевского общества. Серия Б, Биологические науки . 207 (1167): 215–217. Бибкод : 1980РСПСБ.207..187М . дои : 10.1098/rspb.1980.0020 . JSTOR 35407 . ПМИД 6102765 . S2CID 2150419 . — Разность гауссиан любого масштаба является аппроксимацией лапласиана гауссиана (см. запись о разнице гауссианов при обнаружении Blob ). Однако Марр и Хилдрет рекомендуют соотношение 1,6 из соображений проектирования, обеспечивающих баланс полосы пропускания и чувствительности. URL-адрес этой ссылки может сделать доступной только первую страницу и аннотацию статьи в зависимости от того, подключаетесь ли вы через академическое учреждение или нет.
- ^ К. Энрот-Кугель; Дж. Г. Робсон (1966). «Контрастная чувствительность ганглиозных клеток сетчатки кошки» . Журнал физиологии . 187 (3): 517–23. doi : 10.1113/jphysicalol.1966.sp008107 . ПМК 1395960 . ПМИД 16783910 .
- ^ Мэтью Дж. МакМахон; Орин С. Пакер; Деннис М. Дейси (14 апреля 2004 г.). «Классическое окружение рецептивного поля ганглиозных клеток зонтика приматов опосредовано в первую очередь неГАМКергическим путем» (PDF) . Журнал неврологии . 24 (15): 3736–3745. doi : 10.1523/JNEUROSCI.5252-03.2004 . ПМК 6729348 . ПМИД 15084653 .
- ^ Янг, Ричард (1987). «Гауссова производная модель пространственного зрения: I. Механизмы сетчатки». Пространственное видение . 2 (4): 273–293 (21). дои : 10.1163/156856887X00222 . ПМИД 3154952 .
Дальнейшее чтение
[ редактировать ]- Заметки Мелисы Дурмуш об обнаружении краев и математике, связанной с гауссовой функцией, из Эдинбургского университета.