Jump to content

Фильтр Габора

Пример двумерного фильтра Габора

В обработке изображений применяется фильтр Габора , названный в честь Денниса Габора , который первым предложил его как 1D-фильтр. [1] Фильтр Габора был впервые обобщен на 2D Гёста Гранлундом, [2] добавив опорное направление. Фильтр Габора — это линейный фильтр, используемый для анализа текстуры , что, по сути, означает, что он анализирует наличие какого-либо определенного частотного содержания в изображении в определенных направлениях в локализованной области вокруг точки или области анализа. Частотные и ориентационные представления фильтров Габора, как утверждают многие современные ученые, занимающиеся зрением, аналогичны представлениям зрительной системы человека . [3] Было обнаружено, что они особенно подходят для представления и распознавания текстур. В пространственной области двумерный фильтр Габора представляет собой Гаусса, функцию ядра модулированную синусоидальной плоской волной (см. преобразование Габора ).

Некоторые авторы утверждают, что простые клетки зрительной коры головного мозга млекопитающих можно моделировать с помощью функций Габора. [4] [5] Таким образом, некоторые считают, что анализ изображений с помощью фильтров Габора аналогичен восприятию в зрительной системе человека .

Определение

[ редактировать ]

Его импульсная характеристика определяется синусоидальной волной ( плоская волна для 2D-фильтров Габора), умноженной на функцию Гаусса . [6] Из-за свойства умножения-свертки ( теоремы о свертке ) преобразование Фурье импульсной характеристики фильтра Габора представляет собой свертку преобразования Фурье гармонической функции (синусоидальной функции) и преобразования Фурье функции Гаусса. Фильтр имеет действительную и мнимую составляющие, представляющие ортогональные направления. [7] Два компонента можно объединить в комплексное число или использовать по отдельности.

Сложный

Настоящий

Воображаемый

где и .

В этом уравнении представляет длину волны синусоидального фактора, представляет собой ориентацию нормали к параллельным полосам функции Габора , это сдвиг фазы, - сигма/стандартное отклонение гауссовой оболочки и представляет собой пространственное соотношение сторон и определяет эллиптичность опоры функции Габора.

Вейвлет-пространство

[ редактировать ]
Демонстрация применения фильтра Габора к китайскому распознаванию текста. Справа показаны четыре ориентации: 0°, 45°, 90° и 135°. Исходное изображение персонажа и суперпозиция всех четырех ориентаций показаны слева.

Фильтры Габора напрямую связаны с вейвлетами Габора , поскольку они могут быть рассчитаны на ряд расширений и вращений. Однако, как правило, расширение не применяется для вейвлетов Габора, поскольку для этого требуется вычисление биортогональных вейвлетов, что может занять очень много времени. Поэтому обычно создается банк фильтров, состоящий из фильтров Габора с различными масштабами и поворотами. Фильтры свернуты с сигналом, в результате чего образуется так называемое пространство Габора. Этот процесс тесно связан с процессами в первичной зрительной коре . [8] Джонс и Палмер показали, что действительная часть сложной функции Габора хорошо соответствует весовым функциям рецептивного поля, обнаруженным в простых клетках полосатой коры головного мозга кошки. [9]

Временно-причинный аналог фильтра Габора

[ редактировать ]

При обработке временных сигналов доступ к данным из будущего невозможен, что приводит к проблемам при попытке использовать функции Габора для обработки сигналов реального времени, которые зависят от временного измерения. Временно-причинный аналог фильтра Габора был разработан в [10] основан на замене ядра Гаусса в функции Габора на время-каузальное и время-рекурсивное ядро, называемое временем-каузальным предельным ядром. Таким образом, частотно-временной анализ, основанный на результирующем комплекснозначном расширении ядра причинно-временного предела, позволяет улавливать по существу аналогичные преобразования временного сигнала, как это может сделать фильтр Габора, и как это может быть описано группой Гейзенберга. , видеть [10] для получения более подробной информации.

Извлечение признаков из изображений

[ редактировать ]

Набор фильтров Габора с разными частотами и ориентацией может быть полезен для извлечения полезных функций из изображения. [11] В дискретной области двумерные фильтры Габора имеют вид:

где B и C — нормирующие коэффициенты, подлежащие определению.

2D-фильтры Габора находят широкое применение при обработке изображений, особенно при выделении признаков для анализа и сегментации текстур. [12] определяет частоту, которую ищут в текстуре. Варьируя , мы можем искать текстуру, ориентированную в определенном направлении. Варьируя , меняем поддержку базиса или размер анализируемой области изображения.

Применение 2D-фильтров Габора при обработке изображений

[ редактировать ]

При обработке изображений документов функции Gabor идеально подходят для определения алфавита слова в многоязычном документе. [13] Фильтры Габора с разными частотами и ориентацией в разных направлениях использовались для локализации и извлечения текстовых областей из сложных изображений документов (как серых, так и цветных), поскольку текст богат высокочастотными компонентами, тогда как изображения относительно гладкие по своей природе. [14] [15] [16] Он также применяется для распознавания выражений лица. [17] Фильтры Габора также широко используются в приложениях анализа закономерностей. Например, его использовали для изучения распределения направленности внутри пористой ​​трабекулярной кости позвоночника губчатой . [18] Пространство Габора очень полезно в приложениях обработки изображений , таких как оптическое распознавание символов , распознавание радужной оболочки глаза и распознавание отпечатков пальцев . Отношения между активациями для конкретного пространственного местоположения очень различны между объектами на изображении. Более того, важные активации можно извлечь из пространства Габора, чтобы создать разреженное представление объекта.

Пример реализации

[ редактировать ]

Это пример реализации на Python :

import numpy as np


def gabor(sigma, theta, Lambda, psi, gamma):
    """Gabor feature extraction."""
    sigma_x = sigma
    sigma_y = float(sigma) / gamma

    # Bounding box
    nstds = 3  # Number of standard deviation sigma
    xmax = max(
        abs(nstds * sigma_x * np.cos(theta)), abs(nstds * sigma_y * np.sin(theta))
    )
    xmax = np.ceil(max(1, xmax))
    ymax = max(
        abs(nstds * sigma_x * np.sin(theta)), abs(nstds * sigma_y * np.cos(theta))
    )
    ymax = np.ceil(max(1, ymax))
    xmin = -xmax
    ymin = -ymax
    (y, x) = np.meshgrid(np.arange(ymin, ymax + 1), np.arange(xmin, xmax + 1))

    # Rotation
    x_theta = x * np.cos(theta) + y * np.sin(theta)
    y_theta = -x * np.sin(theta) + y * np.cos(theta)

    gb = np.exp(
        -0.5 * (x_theta**2 / sigma_x**2 + y_theta**2 / sigma_y**2)
    ) * np.cos(2 * np.pi / Lambda * x_theta + psi)
    return gb

Информацию о реализации на изображениях см. в [1] .

Это пример реализации в MATLAB / Octave :

function gb = gabor_fn(sigma, theta, lambda, psi, gamma)

sigma_x = sigma;
sigma_y = sigma / gamma;

% Bounding box
nstds = 3;
xmax = max(abs(nstds * sigma_x * cos(theta)), abs(nstds * sigma_y * sin(theta)));
xmax = ceil(max(1, xmax));
ymax = max(abs(nstds * sigma_x * sin(theta)), abs(nstds * sigma_y * cos(theta)));
ymax = ceil(max(1, ymax));
xmin = -xmax; 
ymin = -ymax;
[x,y] = meshgrid(xmin:xmax, ymin:ymax);

% Rotation 
x_theta =  x * cos(theta) + y * sin(theta);
y_theta = -x * sin(theta) + y * cos(theta);

gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);

Код для извлечения признаков Габора из изображений в MATLAB можно найти по адресу http://www.mathworks.com/matlabcentral/fileexchange/44630 .

Это еще один пример реализации на Haskell :

import Data.Complex
gabor λ θ ψ σ γ x y = exp(-(x'^2 + γ^2 * y'^2) / (2*σ^2)) * exp(i * (2*pi*x'/λ + ψ))
    where x' =  x * cos θ + y * sin θ
          y' = -x * sin θ + y * cos θ
          i  = 0 :+ 1

См. также

[ редактировать ]
  1. ^ Габор, Д. (1946). «Теория связи». Дж. Инст. Электр. англ . 93 .
  2. ^ Гранлунд Г.Х. (1978). «В поисках генерального оператора обработки изображений». Компьютерная графика и обработка изображений . 8 (2): 155–173. дои : 10.1016/0146-664X(78)90047-3 . ISSN   0146-664X .
  3. ^ Ольсхаузен, бакалавр и Филд, диджей (1996). «Появление свойств рецептивного поля простой клетки путем изучения разреженного кода естественных изображений». Природа . 381 (6583): 607–609. Бибкод : 1996Natur.381..607O . дои : 10.1038/381607a0 . ПМИД   8637596 . S2CID   4358477 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Марчеля, С. (1980). «Математическое описание ответов простых корковых клеток». Журнал Оптического общества Америки . 70 (11): 1297–1300. Бибкод : 1980JOSA...70.1297M . дои : 10.1364/JOSA.70.001297 . ПМИД   7463179 .
  5. ^ Даугман, Джон Г. (1 июля 1985 г.). «Отношение неопределенности для разрешения в пространстве, пространственной частоте и ориентации, оптимизированное с помощью двумерных зрительных кортикальных фильтров». Журнал Оптического общества Америки А. 2 (7): 1160–9. Бибкод : 1985JOSAA...2.1160D . CiteSeerX   10.1.1.465.8506 . дои : 10.1364/JOSAA.2.001160 . ISSN   1084-7529 . ПМИД   4020513 . S2CID   9271650 .
  6. ^ Фогель, И.; Саги, Д. (июнь 1989 г.). «Фильтры Габора как дискриминатор текстур». Биологическая кибернетика . 61 (2): 103–113. CiteSeerX   10.1.1.367.2700 . дои : 10.1007/BF00204594 . ISSN   0340-1200 . OCLC   895625214 . S2CID   14952808 .
  7. ^ Трехмерное отслеживание поверхности и аппроксимация с использованием Фильтры Габора, Йеспер Юул Хенриксен, Университет Южной Дании, 28 марта 2007 г.
  8. ^ Даугман, Дж. Г. (1980), «Двумерный спектральный анализ профилей кортикальных рецептивных полей», Vision Res. , 20 (10): 847–56, doi : 10.1016/0042-6989(80)90065-6 , PMID   7467139 , S2CID   40518532
  9. ^ Джонс, JP; Палмер, Луизиана (1987). «Оценка двумерной модели фильтра Габора простых рецептивных полей в полосатой коре кошки» (PDF) . Дж. Нейрофизиология . 58 (6): 1233–1258. дои : 10.1152/jn.1987.58.6.1233 . ПМИД   3437332 . S2CID   16809045 . Архивировано из оригинала (PDF) 28 февраля 2020 г.
  10. ^ Перейти обратно: а б Линдеберг, Т. (23 января 2023 г.). «Причинное во времени и рекурсивное во времени масштабно-ковариантное масштабно-пространственное представление временных сигналов и прошлого времени» . Биологическая кибернетика . 117 (1–2): 21–59. дои : 10.1007/s00422-022-00953-6 . ПМЦ   10160219 . ПМИД   36689001 .
  11. ^ Хагигат, М.; Зонуз, С.; Абдель-Мотталеб, М. (2013). «Идентификация с использованием зашифрованной биометрии». Компьютерный анализ изображений и узоров . Конспекты лекций по информатике. Том. 8048. стр. 440–448. дои : 10.1007/978-3-642-40246-3_55 . ISBN  978-3-642-40245-6 .
  12. ^ Рамакришнан, АГ; Кумар Раджа, С.; Рагху Рам, HV (2002). «Сегментация текстур на основе нейронных сетей с использованием функций Габора» (PDF) . Материалы 12-го семинара IEEE по нейронным сетям для обработки сигналов . Мартиньи, Швейцария: IEEE. стр. 365–374. дои : 10.1109/NNSP.2002.1030048 . ISBN  978-0-7803-7616-8 . OCLC   812617471 . S2CID   10994982 .
  13. ^ Пати, Пит Баса; Рамакришнан, AG (июль 2008 г.). «Многоскриптовая идентификация на уровне слов». Буквы для распознавания образов . 29 (9): 1218–1229. Бибкод : 2008PaReL..29.1218P . дои : 10.1016/j.patrec.2008.01.027 . ISSN   0167-8655 .
  14. ^ Раджу С, С.; Пати, ПБ; Рамакришнан, АГ (2004). «Анализ энергии блоков на основе фильтра Габора для извлечения текста из изображений цифровых документов» (PDF) . Первый международный семинар по анализу изображений документов для библиотек, 2004 г. Материалы . Пало-Альто, Калифорния, США: IEEE. стр. 233–243. дои : 10.1109/DIAL.2004.1263252 . ISBN  978-0-7695-2088-9 . LCCN   2003116308 . ОЛ   8067708М . S2CID   21856192 .
  15. ^ Раджу, С. Сабари; Пати, ПБ; Рамакришнан, АГ (2005). «Локализация текста и извлечение из сложных цветных изображений». Достижения в области визуальных вычислений . Конспекты лекций по информатике. Том. 3804. стр. 486–493. дои : 10.1007/11595755_59 . ISBN  978-3-540-30750-1 . ISSN   0302-9743 . LCCN   2005936803 . ОЛ   9056158М .
  16. ^ С. Сабари Раджу, П. Б. Пати и А. Г. Рамакришнан, «Локализация текста и извлечение из сложных цветных изображений», Proc. Первая международная конференция по достижениям в области визуальных вычислений (ISVC05) , Невада, США, LNCS 3804, Springer Verlag, 5–7 декабря 2005 г., стр. 486–493.
  17. ^ Лайонс, М.; Акамацу, С.; Камачи, М.; Гёба, Дж. (1998). «Кодирование выражений лица с помощью вейвлетов Габора». Материалы Третьей международной конференции IEEE по автоматическому распознаванию лиц и жестов . стр. 200–205. дои : 10.1109/AFGR.1998.670949 . ISBN  0-8186-8344-9 . ОЛ   11390549М . S2CID   1586662 .
  18. ^ Гдичинский, CM; Манбачи, А.; и др. (2014). «Об оценке распределения направленности в трабекулярной кости на ножке по изображениям микроКТ». Физиологическое измерение . 35 (12): 2415–2428. Бибкод : 2014PhyM...35.2415G . дои : 10.1088/0967-3334/35/12/2415 . ПМИД   25391037 . S2CID   206078730 .
[ редактировать ]

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2515a2eb3a3be068ce775e5475c57f24__1714150800
URL1:https://arc.ask3.ru/arc/aa/25/24/2515a2eb3a3be068ce775e5475c57f24.html
Заголовок, (Title) документа по адресу, URL1:
Gabor filter - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)