Фильтр Габора
![]() | Эта статья может быть слишком технической для понимания большинства читателей . ( февраль 2017 г. ) |

В обработке изображений применяется фильтр Габора , названный в честь Денниса Габора , который первым предложил его как 1D-фильтр. [1] Фильтр Габора был впервые обобщен на 2D Гёста Гранлундом, [2] добавив опорное направление. Фильтр Габора — это линейный фильтр, используемый для анализа текстуры , что, по сути, означает, что он анализирует наличие какого-либо определенного частотного содержания в изображении в определенных направлениях в локализованной области вокруг точки или области анализа. Частотные и ориентационные представления фильтров Габора, как утверждают многие современные ученые, занимающиеся зрением, аналогичны представлениям зрительной системы человека . [3] Было обнаружено, что они особенно подходят для представления и распознавания текстур. В пространственной области двумерный фильтр Габора представляет собой Гаусса, функцию ядра модулированную синусоидальной плоской волной (см. преобразование Габора ).
Некоторые авторы утверждают, что простые клетки зрительной коры головного мозга млекопитающих можно моделировать с помощью функций Габора. [4] [5] Таким образом, некоторые считают, что анализ изображений с помощью фильтров Габора аналогичен восприятию в зрительной системе человека .
Определение
[ редактировать ]![]() | этого раздела Фактическая точность оспаривается . ( февраль 2013 г. ) |
Его импульсная характеристика определяется синусоидальной волной ( плоская волна для 2D-фильтров Габора), умноженной на функцию Гаусса . [6] Из-за свойства умножения-свертки ( теоремы о свертке ) преобразование Фурье импульсной характеристики фильтра Габора представляет собой свертку преобразования Фурье гармонической функции (синусоидальной функции) и преобразования Фурье функции Гаусса. Фильтр имеет действительную и мнимую составляющие, представляющие ортогональные направления. [7] Два компонента можно объединить в комплексное число или использовать по отдельности.
Сложный
Настоящий
Воображаемый
где и .
В этом уравнении представляет длину волны синусоидального фактора, представляет собой ориентацию нормали к параллельным полосам функции Габора , это сдвиг фазы, - сигма/стандартное отклонение гауссовой оболочки и представляет собой пространственное соотношение сторон и определяет эллиптичность опоры функции Габора.
Вейвлет-пространство
[ редактировать ]
Фильтры Габора напрямую связаны с вейвлетами Габора , поскольку они могут быть рассчитаны на ряд расширений и вращений. Однако, как правило, расширение не применяется для вейвлетов Габора, поскольку для этого требуется вычисление биортогональных вейвлетов, что может занять очень много времени. Поэтому обычно создается банк фильтров, состоящий из фильтров Габора с различными масштабами и поворотами. Фильтры свернуты с сигналом, в результате чего образуется так называемое пространство Габора. Этот процесс тесно связан с процессами в первичной зрительной коре . [8] Джонс и Палмер показали, что действительная часть сложной функции Габора хорошо соответствует весовым функциям рецептивного поля, обнаруженным в простых клетках полосатой коры головного мозга кошки. [9]
Временно-причинный аналог фильтра Габора
[ редактировать ]При обработке временных сигналов доступ к данным из будущего невозможен, что приводит к проблемам при попытке использовать функции Габора для обработки сигналов реального времени, которые зависят от временного измерения. Временно-причинный аналог фильтра Габора был разработан в [10] основан на замене ядра Гаусса в функции Габора на время-каузальное и время-рекурсивное ядро, называемое временем-каузальным предельным ядром. Таким образом, частотно-временной анализ, основанный на результирующем комплекснозначном расширении ядра причинно-временного предела, позволяет улавливать по существу аналогичные преобразования временного сигнала, как это может сделать фильтр Габора, и как это может быть описано группой Гейзенберга. , видеть [10] для получения более подробной информации.
Извлечение признаков из изображений
[ редактировать ]Набор фильтров Габора с разными частотами и ориентацией может быть полезен для извлечения полезных функций из изображения. [11] В дискретной области двумерные фильтры Габора имеют вид:
где B и C — нормирующие коэффициенты, подлежащие определению.
2D-фильтры Габора находят широкое применение при обработке изображений, особенно при выделении признаков для анализа и сегментации текстур. [12] определяет частоту, которую ищут в текстуре. Варьируя , мы можем искать текстуру, ориентированную в определенном направлении. Варьируя , меняем поддержку базиса или размер анализируемой области изображения.
Применение 2D-фильтров Габора при обработке изображений
[ редактировать ]При обработке изображений документов функции Gabor идеально подходят для определения алфавита слова в многоязычном документе. [13] Фильтры Габора с разными частотами и ориентацией в разных направлениях использовались для локализации и извлечения текстовых областей из сложных изображений документов (как серых, так и цветных), поскольку текст богат высокочастотными компонентами, тогда как изображения относительно гладкие по своей природе. [14] [15] [16] Он также применяется для распознавания выражений лица. [17] Фильтры Габора также широко используются в приложениях анализа закономерностей. Например, его использовали для изучения распределения направленности внутри пористой трабекулярной кости позвоночника губчатой . [18] Пространство Габора очень полезно в приложениях обработки изображений , таких как оптическое распознавание символов , распознавание радужной оболочки глаза и распознавание отпечатков пальцев . Отношения между активациями для конкретного пространственного местоположения очень различны между объектами на изображении. Более того, важные активации можно извлечь из пространства Габора, чтобы создать разреженное представление объекта.
Пример реализации
[ редактировать ]Питон
[ редактировать ]Это пример реализации на Python :
import numpy as np
def gabor(sigma, theta, Lambda, psi, gamma):
"""Gabor feature extraction."""
sigma_x = sigma
sigma_y = float(sigma) / gamma
# Bounding box
nstds = 3 # Number of standard deviation sigma
xmax = max(
abs(nstds * sigma_x * np.cos(theta)), abs(nstds * sigma_y * np.sin(theta))
)
xmax = np.ceil(max(1, xmax))
ymax = max(
abs(nstds * sigma_x * np.sin(theta)), abs(nstds * sigma_y * np.cos(theta))
)
ymax = np.ceil(max(1, ymax))
xmin = -xmax
ymin = -ymax
(y, x) = np.meshgrid(np.arange(ymin, ymax + 1), np.arange(xmin, xmax + 1))
# Rotation
x_theta = x * np.cos(theta) + y * np.sin(theta)
y_theta = -x * np.sin(theta) + y * np.cos(theta)
gb = np.exp(
-0.5 * (x_theta**2 / sigma_x**2 + y_theta**2 / sigma_y**2)
) * np.cos(2 * np.pi / Lambda * x_theta + psi)
return gb
Информацию о реализации на изображениях см. в [1] .
МАТЛАБ
[ редактировать ]Это пример реализации в MATLAB / Octave :
function gb = gabor_fn(sigma, theta, lambda, psi, gamma)
sigma_x = sigma;
sigma_y = sigma / gamma;
% Bounding box
nstds = 3;
xmax = max(abs(nstds * sigma_x * cos(theta)), abs(nstds * sigma_y * sin(theta)));
xmax = ceil(max(1, xmax));
ymax = max(abs(nstds * sigma_x * sin(theta)), abs(nstds * sigma_y * cos(theta)));
ymax = ceil(max(1, ymax));
xmin = -xmax;
ymin = -ymax;
[x,y] = meshgrid(xmin:xmax, ymin:ymax);
% Rotation
x_theta = x * cos(theta) + y * sin(theta);
y_theta = -x * sin(theta) + y * cos(theta);
gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);
Код для извлечения признаков Габора из изображений в MATLAB можно найти по адресу http://www.mathworks.com/matlabcentral/fileexchange/44630 .
Хаскелл
[ редактировать ]Это еще один пример реализации на Haskell :
import Data.Complex
gabor λ θ ψ σ γ x y = exp(-(x'^2 + γ^2 * y'^2) / (2*σ^2)) * exp(i * (2*pi*x'/λ + ψ))
where x' = x * cos θ + y * sin θ
y' = -x * sin θ + y * cos θ
i = 0 :+ 1
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Габор, Д. (1946). «Теория связи». Дж. Инст. Электр. англ . 93 .
- ^ Гранлунд Г.Х. (1978). «В поисках генерального оператора обработки изображений». Компьютерная графика и обработка изображений . 8 (2): 155–173. дои : 10.1016/0146-664X(78)90047-3 . ISSN 0146-664X .
- ^ Ольсхаузен, бакалавр и Филд, диджей (1996). «Появление свойств рецептивного поля простой клетки путем изучения разреженного кода естественных изображений». Природа . 381 (6583): 607–609. Бибкод : 1996Natur.381..607O . дои : 10.1038/381607a0 . ПМИД 8637596 . S2CID 4358477 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Марчеля, С. (1980). «Математическое описание ответов простых корковых клеток». Журнал Оптического общества Америки . 70 (11): 1297–1300. Бибкод : 1980JOSA...70.1297M . дои : 10.1364/JOSA.70.001297 . ПМИД 7463179 .
- ^ Даугман, Джон Г. (1 июля 1985 г.). «Отношение неопределенности для разрешения в пространстве, пространственной частоте и ориентации, оптимизированное с помощью двумерных зрительных кортикальных фильтров». Журнал Оптического общества Америки А. 2 (7): 1160–9. Бибкод : 1985JOSAA...2.1160D . CiteSeerX 10.1.1.465.8506 . дои : 10.1364/JOSAA.2.001160 . ISSN 1084-7529 . ПМИД 4020513 . S2CID 9271650 .
- ^ Фогель, И.; Саги, Д. (июнь 1989 г.). «Фильтры Габора как дискриминатор текстур». Биологическая кибернетика . 61 (2): 103–113. CiteSeerX 10.1.1.367.2700 . дои : 10.1007/BF00204594 . ISSN 0340-1200 . OCLC 895625214 . S2CID 14952808 .
- ^ Трехмерное отслеживание поверхности и аппроксимация с использованием Фильтры Габора, Йеспер Юул Хенриксен, Университет Южной Дании, 28 марта 2007 г.
- ^ Даугман, Дж. Г. (1980), «Двумерный спектральный анализ профилей кортикальных рецептивных полей», Vision Res. , 20 (10): 847–56, doi : 10.1016/0042-6989(80)90065-6 , PMID 7467139 , S2CID 40518532
- ^ Джонс, JP; Палмер, Луизиана (1987). «Оценка двумерной модели фильтра Габора простых рецептивных полей в полосатой коре кошки» (PDF) . Дж. Нейрофизиология . 58 (6): 1233–1258. дои : 10.1152/jn.1987.58.6.1233 . ПМИД 3437332 . S2CID 16809045 . Архивировано из оригинала (PDF) 28 февраля 2020 г.
- ^ Перейти обратно: а б Линдеберг, Т. (23 января 2023 г.). «Причинное во времени и рекурсивное во времени масштабно-ковариантное масштабно-пространственное представление временных сигналов и прошлого времени» . Биологическая кибернетика . 117 (1–2): 21–59. дои : 10.1007/s00422-022-00953-6 . ПМЦ 10160219 . ПМИД 36689001 .
- ^ Хагигат, М.; Зонуз, С.; Абдель-Мотталеб, М. (2013). «Идентификация с использованием зашифрованной биометрии». Компьютерный анализ изображений и узоров . Конспекты лекций по информатике. Том. 8048. стр. 440–448. дои : 10.1007/978-3-642-40246-3_55 . ISBN 978-3-642-40245-6 .
- ^ Рамакришнан, АГ; Кумар Раджа, С.; Рагху Рам, HV (2002). «Сегментация текстур на основе нейронных сетей с использованием функций Габора» (PDF) . Материалы 12-го семинара IEEE по нейронным сетям для обработки сигналов . Мартиньи, Швейцария: IEEE. стр. 365–374. дои : 10.1109/NNSP.2002.1030048 . ISBN 978-0-7803-7616-8 . OCLC 812617471 . S2CID 10994982 .
- ^ Пати, Пит Баса; Рамакришнан, AG (июль 2008 г.). «Многоскриптовая идентификация на уровне слов». Буквы для распознавания образов . 29 (9): 1218–1229. Бибкод : 2008PaReL..29.1218P . дои : 10.1016/j.patrec.2008.01.027 . ISSN 0167-8655 .
- ^ Раджу С, С.; Пати, ПБ; Рамакришнан, АГ (2004). «Анализ энергии блоков на основе фильтра Габора для извлечения текста из изображений цифровых документов» (PDF) . Первый международный семинар по анализу изображений документов для библиотек, 2004 г. Материалы . Пало-Альто, Калифорния, США: IEEE. стр. 233–243. дои : 10.1109/DIAL.2004.1263252 . ISBN 978-0-7695-2088-9 . LCCN 2003116308 . ОЛ 8067708М . S2CID 21856192 .
- ^ Раджу, С. Сабари; Пати, ПБ; Рамакришнан, АГ (2005). «Локализация текста и извлечение из сложных цветных изображений». Достижения в области визуальных вычислений . Конспекты лекций по информатике. Том. 3804. стр. 486–493. дои : 10.1007/11595755_59 . ISBN 978-3-540-30750-1 . ISSN 0302-9743 . LCCN 2005936803 . ОЛ 9056158М .
- ^ С. Сабари Раджу, П. Б. Пати и А. Г. Рамакришнан, «Локализация текста и извлечение из сложных цветных изображений», Proc. Первая международная конференция по достижениям в области визуальных вычислений (ISVC05) , Невада, США, LNCS 3804, Springer Verlag, 5–7 декабря 2005 г., стр. 486–493.
- ^ Лайонс, М.; Акамацу, С.; Камачи, М.; Гёба, Дж. (1998). «Кодирование выражений лица с помощью вейвлетов Габора». Материалы Третьей международной конференции IEEE по автоматическому распознаванию лиц и жестов . стр. 200–205. дои : 10.1109/AFGR.1998.670949 . ISBN 0-8186-8344-9 . ОЛ 11390549М . S2CID 1586662 .
- ^ Гдичинский, CM; Манбачи, А.; и др. (2014). «Об оценке распределения направленности в трабекулярной кости на ножке по изображениям микроКТ». Физиологическое измерение . 35 (12): 2415–2428. Бибкод : 2014PhyM...35.2415G . дои : 10.1088/0967-3334/35/12/2415 . ПМИД 25391037 . S2CID 206078730 .
Внешние ссылки
[ редактировать ]- Код MATLAB для фильтров Габора и извлечения признаков Габора
- 3D Габор продемонстрирован с помощью Mathematica
- реализация log-Gabors на Python для неподвижных изображений
- Фильтр Габора для обработки изображений и компьютерного зрения (демонстрация). Архивировано 29 мая 2018 г. на Wayback Machine.
Дальнейшее чтение
[ редактировать ]- Файхтингер, Ганс Г .; Стромер, Томас, ред. (1998). Анализ Габора и алгоритмы: теория и приложения . Бостон: Биркхойзер. ISBN 0-8176-3959-4 . LCCN 97032252 . ОСЛК 37761814 . ОЛ 685385М .
- Грехениг, Карлхайнц (2001). Основы частотно-временного анализа: с 15 рисунками . Прикладной и численный гармонический анализ. Бостон: Биркхойзер. дои : 10.1007/978-1-4612-0003-1 . ISBN 0-8176-4022-3 . LCCN 00044508 . OCLC 44420790 . ОЛ 8074618М .
- Даугман, Дж. Г. (1988). «Полное дискретное двумерное преобразование Габора с помощью нейронных сетей для анализа и сжатия изображений» (PDF) . Транзакции IEEE по акустике, речи и обработке сигналов . 36 (7): 1169–1179. CiteSeerX 10.1.1.371.5847 . дои : 10.1109/29.1644 . ISSN 0096-3518 .
- «Демонстрация онлайн-фильтра Габора» . Архивировано из оригинала 15 июня 2009 г. Проверено 25 мая 2009 г.
- Мовеллан, Хавьер Р. «Учебное пособие по фильтрам Габора» (PDF) . Архивировано из оригинала (PDF) 19 апреля 2009 г. Проверено 14 мая 2008 г.
- Лагаэ, Арес; Лефевр, Сильвен; Дреттакис, Джордж; Дютре, Филип (2009). «Процедурный шум с использованием разреженной свертки Габора» . Транзакции ACM с графикой . 28 (3): 1. CiteSeerX 10.1.1.232.5566 . дои : 10.1145/1531326.1531360 . Проверено 12 сентября 2009 г.
- Управляемые пирамиды:
- Страница Ээро Симончелли об управляемых пирамидах
- Мандучи, Р.; Перона, П.; Шай, Д. (апрель 1998 г.). «Эффективные деформируемые блоки фильтров» (PDF) . Транзакции IEEE по обработке сигналов . 46 (4): 1168–1173. Бибкод : 1998ITSP...46.1168M . дои : 10.1109/78.668570 . ISSN 1053-587X . OCLC 926890247 . ( PDF заархивировано 12 ноября 2021 г. на Wayback Machine ) ( Код заархивирован 13 июня 2010 г. на Wayback Machine )
- Фишер, Сильвен; Шроубек, Филип; Перрине, Лоран; Редондо, Рафаэль; Кристобаль, Габриэль (2007). «Самообратимые двумерные вейвлеты Лог-Габора» (PDF) . Международный журнал компьютерного зрения . 75 (2): 231–246. CiteSeerX 10.1.1.329.6283 . дои : 10.1007/s11263-006-0026-8 . ISSN 0920-5691 . S2CID 1452724 .