Детектор областей на основе основной кривизны
Обнаружение функций |
---|
Обнаружение края |
Обнаружение углов |
Обнаружение больших двоичных объектов |
Обнаружение гребня |
Преобразование Хафа |
Тензор структуры |
Обнаружение аффинных инвариантных функций |
Описание функции |
Масштабировать пространство |
Детектор областей на основе основной кривизны , также называемый PCBR. [1] — это детектор признаков, используемый в области компьютерного зрения и анализа изображений . В частности, детектор PCBR предназначен для приложений распознавания объектов.
Детекторы локальных областей обычно можно разделить на две категории: детекторы на основе интенсивности и детекторы на основе структуры .
- Детекторы на основе интенсивности зависят от анализа локальной дифференциальной геометрии или диаграмм интенсивности для поиска точек или областей, которые удовлетворяют некоторым критериям уникальности и стабильности. Эти детекторы включают SIFT , гессиан-аффин , Харрис-аффин , MSER и т. д.
- Детекторы на основе структуры зависят от структурных особенностей изображения, таких как линии, края, кривые и т. д., для определения точек интереса или областей. Эти детекторы включают в себя области на основе краев (EBR) и масштабно-инвариантные функции формы (SISF).
С точки зрения инвариантности обнаружения детекторы признаков можно разделить на детекторы с фиксированным масштабом, такие как обычный угловой детектор Харриса , масштабно-инвариантные детекторы, такие как SIFT , и аффинно-инвариантные детекторы, такие как гессиан-аффинный .
Детектор PCBR представляет собой детектор на основе структуры аффинно-инвариантный .
Зачем новый детектор?
[ редактировать ]Во многих задачах распознавания объектов внутриклассовые изменения позы, освещения, цвета и текстуры могут вызвать значительные различия в локальной интенсивности. Следовательно, локальная интенсивность больше не обеспечивает стабильного сигнала обнаружения. Таким образом, операторы интересов на основе интенсивности (например, SIFT , Harris-Affine ) – и основанные на них системы распознавания объектов – часто не могут идентифицировать отличительные признаки. Альтернативой локальным признакам интенсивности является улавливание полулокальных структурных сигналов, таких как края и криволинейные формы. Эти структурные сигналы, как правило, более устойчивы к интенсивности, цвету и вариациям позы. Таким образом, они обеспечивают основу для более стабильного процентного оператора, что, в свою очередь, повышает точность распознавания объектов. Детектор PCBR был разработан для использования этих более надежных структурных признаков изображения.
Описание алгоритма
[ редактировать ]Шаг 1: Обнаружение криволинейных структур
[ редактировать ]В качестве детектора на основе структуры PCBR не использует края, вместо этого он использует криволинейные структуры, также называемые гребнями . Обнаружение криволинейных структур генерирует единый отклик как для линий, так и для краев, создавая более четкий структурный эскиз изображения, чем обычно обеспечивается изображением величины градиента. Алгоритм Стегера [2] модифицируется для получения криволинейных изображений. Поскольку используется только первый шаг этого алгоритма, который заключается в вычислении изображений главной кривизны, главная кривизна принята в качестве названия этого детектора. Чтобы получить главную кривизну, матрица Гессе вычисляется :
где — вторая частная производная изображения, оцененного в точке x в направление и — это смешанная частная вторая производная изображения, оцененного в точке x в и направления. Максимальное и минимальное собственные значения этой матрицы образуют два изображения, которые соответствуют белым линиям на черном фоне и черным линиям на белом фоне.
Шаг 2: Поиск характеристик и надежности в масштабируемом пространстве
[ редактировать ]Чтобы сделать этот детектор масштабно-инвариантным и повысить надежность обнаружения, был использован процесс Дэвида Лоу. [3] Детектор SIFT моделируется для обнаружения основной криволинейной структуры в масштабном пространстве. Локальные максимальные изображения главных значений кривизны используются для определения областей.
Шаг 3. Определение регионов с помощью усовершенствованных алгоритмов водораздела
[ редактировать ]Изображения главной кривизны очищаются с помощью морфологического замыкания и управляемого собственным вектором определения порога гистерезиса , потока . традиционный алгоритм водораздела Затем к изображениям применяется для получения регионов.
Шаг 4. Выбор стабильной области
[ редактировать ]Подобно процессу выбора стабильных регионов с помощью порогового значения в MSER , [4] стабильные регионы выбираются с учетом изменений локального масштаба. Для этого ошибка перекрытия вычисляется для каждой тройки последовательных шкал. Если ошибка перекрытия регионов превышает 90 %, сохраняется только один регион. Если ошибка больше 70% и меньше 90%, сохраняются все регионы. Если перекрытие составляет менее 70%, отбросьте эти регионы. Эти цифры определяются путем анализа чувствительности дескриптора SIFT .
Чем отличается PCBR?
[ редактировать ]- Это детектор на основе структуры.
- Он предназначен для обработки внутриклассовой дисперсии.
- Он используется, когда местная интенсивность нестабильна.
- Он обнаруживает полулокальную характеристическую область.
Пакеты программного обеспечения
[ редактировать ]Двоичный код реализации PCBR можно скачать с веб-страницы Тома Диттериха. [5]
См. также
[ редактировать ]- ПРОСЕЯТЬ
- МСЭР
- Гессен-аффинный
- Харрис-Аффин
- Масштабировать пространство
- Обнаружение углов
- Обнаружение больших двоичных объектов
- Обнаружение точек интереса
- Компьютерное зрение
Ссылки
[ редактировать ]- ^ Дэн, Х.; Чжан, В.; Мортенсен, Э.; Дитерих, Т.; Шапиро, Л. (2007). Детектор областей на основе основной кривизны для распознавания объектов (PDF) . Конференция IEEE по компьютерному зрению и распознаванию образов.
- ^ Стегер, К. (1998). «Непредвзятый детектор криволинейных структур». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 20 (2): 113–125. CiteSeerX 10.1.1.42.2266 . дои : 10.1109/34.659930 .
- ^ Лоу, генеральный директор (2004). «Отличительные особенности изображения по масштабно-инвариантным ключевым точкам» (PDF) . Международный журнал компьютерного зрения . 60 (2): 91–110. дои : 10.1023/B:VISI.0000029664.99615.94 . S2CID 221242327 .
- ^ Мэйтас, Дж.; Чам, О.; Урбан, М.; Пайдла, Т. (2002). «Надежное стерео с широкой базовой линией из максимально стабильных экстремальных регионов» (PDF) . Материалы Британской конференции по машинному зрению, 2002 г. стр. 384–393. дои : 10.5244/C.16.36 . ISBN 1-901725-19-7 .
- ^ Диттерих, Том. «PCBR» (ZIP-файл) .