Фильтр Габора журнала
При обработке сигналов полезно одновременно анализировать пространственные и частотные характеристики сигнала. Хотя преобразование Фурье дает информацию о частоте сигнала, оно не локализовано. Это означает, что мы не можем определить, какая часть (возможно, длинного) сигнала создает определенную частоту. Для этой цели можно использовать кратковременное преобразование Фурье , однако кратковременное преобразование Фурье ограничивает синусоидальность базисных функций. Для обеспечения более гибкого пространственно-частотного разложения сигнала было предложено несколько фильтров (включая вейвлеты). Лог-Габор [1] Фильтр — один из таких фильтров, который является усовершенствованием оригинального фильтра Габора . [2] Преимущество этого фильтра перед многими альтернативами заключается в том, что он лучше соответствует статистике естественных изображений по сравнению с фильтрами Габора и другими вейвлет -фильтрами.
Приложения
[ редактировать ]Фильтр Лога-Габора способен описывать сигнал с точки зрения локальных частотных характеристик. Поскольку это фундаментальный метод анализа сигналов, он имеет множество применений при обработке сигналов. Действительно, любое приложение, использующее фильтры Габора или другие базисные вейвлет-функции, может извлечь выгоду из фильтра Лога-Габора. Однако в зависимости от особенностей проектной задачи никакой выгоды может не быть. Тем не менее, фильтр Лога-Габора оказался особенно полезным в приложениях обработки изображений, поскольку было показано, что он лучше собирает статистику естественных изображений.
При обработке изображений есть несколько низкоуровневых примеров использования фильтров Лога-Габора. Обнаружение краев — одна из таких примитивных операций, при которой края изображения помечаются. Поскольку края в частотной области проявляются как высокие частоты, естественно использовать фильтр, такой как Лог-Габор, для выделения этих краев. [3] [4] Эти обнаруженные края можно использовать в качестве входных данных для алгоритма сегментации или алгоритма распознавания. Связанная проблема — обнаружение углов. Целью обнаружения углов является поиск точек на изображении, которые являются углами. Углы полезно находить, поскольку они представляют собой устойчивые места, которые можно использовать для решения задач сопоставления изображений. Угол можно описать с точки зрения информации о локализованной частоте с помощью фильтра Лога-Габора. [5]
При распознавании образов входное изображение должно быть преобразовано в представление объекта, которое алгоритму классификации будет легче разделить классы. Характеристики, сформированные на основе отклика фильтров Лога-Габора, могут составлять хороший набор функций для некоторых приложений, поскольку они могут локально представлять информацию о частоте. Например, фильтр успешно использовался при классификации выражений лиц. [6] Есть некоторые свидетельства того, что зрительная система человека обрабатывает визуальную информацию аналогичным образом. [7]
Существует множество других приложений, которым требуется локализованная информация о частоте. Фильтр Лога-Габора использовался в таких приложениях, как улучшение изображений, [8] анализ речи, [9] обнаружение контуров, [10] синтез текстур [11] и шумоподавление изображения [12] среди других.
Существующие подходы
[ редактировать ]Существует несколько существующих подходов к вычислению локализованной частотной информации. Эти подходы имеют преимущество, поскольку в отличие от преобразования Фурье эти фильтры могут легче отображать разрывы сигнала. Например, преобразование Фурье может представлять край, но только с помощью бесконечного числа синусоид.
Фильтры Габора
[ редактировать ]При рассмотрении фильтров, которые извлекают информацию о локальной частоте, существует взаимосвязь между разрешением по частоте и разрешением во времени/пространстве. Когда берется больше выборок, разрешение частотной информации выше, однако временное/пространственное разрешение будет ниже. Аналогичным образом, взятие всего нескольких образцов означает более высокое пространственно-временное разрешение, но за это приходится платить меньшим разрешением по частоте. Хороший фильтр должен иметь возможность получить максимальное частотное разрешение при заданном временном/пространственном разрешении, и наоборот. Фильтр Габора достигает этой границы. [2] По этой причине фильтр Габора является хорошим методом одновременной локализации пространственно-временной и частотной информации. Фильтр Габора в пространственной (или временной) области формулируется как огибающая Гаусса, умноженная на комплексную экспоненту. Было обнаружено, что корковые реакции зрительной системы человека можно моделировать с помощью фильтра Габора. [7] [13] Фильтр Габора был модифицирован Морле для формирования ортонормированного непрерывного вейвлет-преобразования. [14]
Хотя фильтр Габора обеспечивает ощущение оптимальности с точки зрения соотношения пространственная частота, в некоторых приложениях он может быть не идеальным фильтром. В определенных полосах пропускания фильтр Габора имеет ненулевую составляющую постоянного тока. Это означает, что отклик фильтра зависит от среднего значения сигнала. Если выходные данные фильтра будут использоваться для таких приложений, как распознавание образов, этот компонент постоянного тока нежелателен, поскольку он дает характеристику, которая изменяется вместе со средним значением. Как мы вскоре увидим, фильтр Лога-Габора не обнаруживает этой проблемы. Кроме того, оригинальный фильтр Габора имеет импульсную характеристику бесконечной длины. Наконец, оригинальный фильтр Габора, хотя и оптимален с точки зрения неопределенности, не соответствует должным образом статистике естественных изображений. Как показано в, [1] в задаче кодирования изображения лучше выбрать фильтр с более длинным наклонным хвостом.
В некоторых приложениях другие разложения имеют преимущества. Хотя таких разложений возможно множество, здесь мы кратко представляем два популярных метода: вейвлеты мексиканской шляпы и управляемую пирамиду.
Вейвлет Мексиканской шляпы
[ редактировать ]Рикера Вейвлет , обычно называемый вейвлетом мексиканской шляпы, — это еще один тип фильтра, который используется для моделирования данных. В многомерных измерениях это становится лапласианом функции Гаусса . По причинам вычислительной сложности лапласиан функции Гаусса часто аппроксимируется с использованием разности гауссиан . Эта разница в функции Гаусса нашла применение в нескольких приложениях компьютерного зрения, таких как обнаружение ключевых точек. [15] Недостаток вейвлета «Мексиканская шляпа» заключается в том, что он демонстрирует некоторое сглаживание и плохо отображает наклонные ориентации.
Управляемая пирамида
[ редактировать ]пирамиды управляемой Разложение [16] был представлен как альтернатива вейвлетам Морле (Габора) и Рикера. Это разложение игнорирует ограничение ортогональности формулировки вейвлета и, делая это, позволяет построить набор фильтров, которые не зависят ни от трансляции, ни от вращения. Недостатком декомпозиции управляемой пирамиды является то, что она является чрезмерно полной. Это означает, что для описания сигнала используется больше фильтров, чем действительно необходимо.
Определение
[ редактировать ]Филд представил фильтр Лога-Габора и показал, что он способен лучше кодировать естественные изображения по сравнению с оригинальным фильтром Габора. [1] Кроме того, фильтр Лога-Габора не имеет той же проблемы с постоянным током, что и оригинальный фильтр Габора. Одномерная функция Лога-Габора имеет частотную характеристику:
где и — параметры фильтра. даст центральную частоту фильтра. влияет на полосу пропускания фильтра. Полезно сохранять одну и ту же форму при изменении частотного параметра. Для этого соотношение должно оставаться постоянным. На следующем рисунке показана частотная характеристика Gabor по сравнению с Log-Gabor:
Другое определение фильтра Лога-Габора состоит в том, чтобы рассматривать его как функцию распределения вероятностей с нормальным распределением , но с учетом логарифма частот. Это имеет смысл в контекстах, где применяется закон Вебера-Фехнера , например, при зрительном или слуховом восприятии. Таким образом, после изменения правила переменной одномерная функция Лога-Габора имеет измененную частотную характеристику:
Обратите внимание, что это распространяется на начало координат и что у нас все еще есть .
В обоих определениях из-за нуля в значении DC невозможно получить аналитическое выражение для фильтра в пространственной области. На практике фильтр сначала проектируется в частотной области, а затем обратное преобразование Фурье дает импульсную характеристику во временной области.
Двумерный фильтр Лога-Габора
[ редактировать ]Как и фильтр Габора, логарифмический фильтр Габора пользуется большой популярностью при обработке изображений. [4] По этой причине полезно рассмотреть двумерное расширение лог-фильтра Габора. Благодаря этому дополнительному размеру фильтр не только предназначен для определенной частоты, но и для определенной ориентации. Компонент ориентации представляет собой функцию расстояния по Гауссу в зависимости от угла в полярных координатах (см. [1] или [2] ):
где здесь теперь четыре параметра: центральная частота, параметр ширины для частоты, центральная ориентация и параметр ширины ориентации. Пример этого фильтра показан ниже.
Полоса пропускания по частоте определяется выражением:
Обратите внимание, что результирующая полоса пропускания измеряется в октавах.
Угловая ширина полосы определяется выражением:
Во многих практических приложениях набор фильтров предназначен для формирования банка фильтров . Поскольку фильтры не образуют набор ортогональных базисов, проектирование набора фильтров является своего рода искусством и может зависеть от конкретной поставленной задачи. Необходимыми параметрами, которые необходимо выбрать, являются: минимальная и максимальная частоты, полоса пропускания фильтра, количество ориентаций, угловая полоса пропускания, масштабирование фильтра и количество масштабов.
См. также
[ редактировать ]- Преобразование Габора
- Вейвлет Габора
- Фильтр Габора
- Атом Габора
- Обнаружение функций (компьютерное зрение) для других детекторов функций низкого уровня.
- Производное изображения
- Подавление шума изображения
- Обнаружение гребня для связи между детекторами краев и детекторами гребней
Ссылки
[ редактировать ]- ^ Jump up to: а б с Диджей Филд. Связь между статистикой естественных изображений и ответными свойствами клеток коры . J. Опт. Соц. Являюсь. А, 1987, стр. 2379–2394.
- ^ Jump up to: а б Д. Габор. Теория связи. Дж. Инст. Электр. англ. 93, 1946.
- ^ Цз. Сяо, К. Го, Ю. Мин и Л. Цян. Исследование логарифмического вейвлета Габора и его применения для обнаружения краев изображения . В Международной конференции по обработке сигналов, том 1, страницы 592–595, август 2002 г.
- ^ Jump up to: а б Сильвен Фишер, Филип Срубек, Лоран Ю. Перрине, Рафаэль Редондо, Габриэль Кристобаль. Самообратимые двумерные логарифмические вейвлеты Габора . Межд. Журнал вычислительного видения, 2007 г.
- ^ X. Гао, Ф. Саттар и Р. Венкатешварлу. Многомасштабное обнаружение углов изображений уровня серого на основе вейвлет-преобразования логарифма-Габора . Транзакции IEEE по схемам и системам для видеотехнологий, 17 (7): 868–875, июль 2007 г.
- ^ Н. Роуз. Классификация выражений лица с использованием фильтров Габора и лог-Габора . На Международной конференции по автоматическому распознаванию лиц и жестов (FGR), страницы 346–350, апрель 2006 г.
- ^ Jump up to: а б Дж. Г. Даугман. Отношение неопределенности для разрешения в пространстве, пространственной частоте и ориентации, оптимизированное с помощью двумерных зрительных кортикальных фильтров . Журнал Оптического общества Америки, 1985, стр. 1160–9.
- ^ В. Ван, Дж. Ли, Ф. Хуан и Х. Фэн. Разработка и реализация фильтра Логарифма-Габора для улучшения изображений отпечатков пальцев . Письма о распознавании образов, 2008. стр. 301–308.
- ^ Л. Хе, М. Лех, Н. Мэддидж и Н. Аллен. Распознавание стресса и эмоций с использованием логарифмического фильтра Габора, анализа речевых спектрограмм . Аффективные вычисления и интеллектуальное взаимодействие, 2009 г., стр. 1–6.
- ^ Сильвен Фишер, Рафаэль Редондо, Лоран Перрине, Габриэль Кристобаль. Редкая аппроксимация изображений, вдохновленная функциональной архитектурой основных зрительных областей . Журнал EURASIP о достижениях в области обработки сигналов, специальный выпуск о восприятии изображений, 2007 г.
- ^ Паула С. Леон, Иво Ванцетта, Гийом С. Массон, Лоран У. Перрине. Облака движения: синтез стимулов на основе моделей естественных случайных текстур для изучения восприятия движения . Журнал нейрофизиологии, 107(11):3217–3226, 2012 г.
- ^ П. Ковеси. Фазово-сохраняющее шумоподавление изображений . Конференция Австралийского общества распознавания образов: DICTA'99, 1999, стр. 212–217.
- ^ Эндрю Б. Уотсон. Преобразование коры: быстрое вычисление смоделированных нейронных изображений . Журнал компьютерного зрения, графики и обработки изображений. 1987. стр. 311–327.
- ^ А. Гроссманн и Дж. Морле. Разложение функций Харди на квадратные интегрируемые вейвлеты постоянной формы . Журнал SIAM по математическому анализу, 1984, стр. 723–736.
- ^ Д. Г. Лоу. Отличительные особенности изображения по масштабно-инвариантным ключевым точкам . Международный журнал компьютерного зрения, 2004 г., стр. 91–110.
- ^ EP Simoncelli и WT Freeman. Управляемая пирамида: гибкая архитектура для многомасштабных вычислений производных . Международная конференция IEEE по обработке изображений, 1995. стр. 444–447.