Jump to content

Обнаружение угла

(Перенаправлено из показателей силы Гессе )
Выходные данные типичного алгоритма обнаружения углов
Оценка эгодвижения с использованием обнаружения углов

Обнаружение углов — это подход, используемый в системах компьютерного зрения для извлечения определенных типов функций и определения содержимого изображения. Обнаружение углов часто используется при обнаружении движения , регистрации изображений , отслеживании видео , составлении мозаики изображений , сшивании панорам , 3D-реконструкции и распознавании объектов . Обнаружение углов пересекается с темой обнаружения точек интереса .

Формализация

[ редактировать ]

Угол можно определить как пересечение двух ребер. Угол также можно определить как точку, для которой есть два доминирующих и разных направления края в локальной окрестности точки.

Точка интереса — это точка на изображении, которая имеет четко определенное положение и может быть надежно обнаружена. Это означает, что точка интереса может быть углом, но также может быть, например, изолированной точкой локального максимума или минимума интенсивности, окончаниями линий или точкой на кривой, где кривизна локально максимальна.

На практике большинство так называемых методов обнаружения углов обнаруживают точки интереса в целом, и фактически термины «угол» и «точка интереса» используются в литературе более или менее взаимозаменяемо. [ 1 ] Как следствие, если необходимо обнаружить только углы, необходимо провести локальный анализ обнаруженных точек интереса, чтобы определить, какие из них являются настоящими углами. Примерами обнаружения краев, которые можно использовать с постобработкой для обнаружения углов, являются оператор Кирша и набор маскирования Фрея-Чена. [ 2 ]

«Угол», «точка интереса» и «особенность» используются в литературе как синонимы, что запутывает проблему. В частности, существует несколько детекторов капель , которые можно назвать «операторами точек интереса», но которые иногда ошибочно называют «детекторами углов». Более того, существует понятие обнаружения гребней, позволяющее фиксировать наличие удлиненных объектов.

Угловые детекторы обычно не очень надежны и часто требуют большого резервирования, чтобы предотвратить влияние отдельных ошибок на задачу распознавания.

Одним из показателей качества детектора углов является его способность обнаруживать один и тот же угол на нескольких похожих изображениях в условиях различного освещения, перемещения, вращения и других преобразований.

Простой подход к обнаружению углов на изображениях — использовать корреляцию , но это очень затратно в вычислительном отношении и неоптимально. Часто используемый альтернативный подход основан на методе, предложенном Харрисом и Стивенсом (ниже), который, в свою очередь, является усовершенствованием метода Моравека.

Алгоритм обнаружения углов Моравца

[ редактировать ]

Это один из самых ранних алгоритмов обнаружения углов, который определяет угол как точку с низким самоподобием. [ 3 ] Алгоритм проверяет каждый пиксель изображения на предмет наличия угла, учитывая, насколько участок с центром в пикселе похож на близлежащие, в значительной степени перекрывающиеся участки. Сходство измеряется путем взятия суммы квадратов разностей (SSD) между соответствующими пикселями двух патчей. Меньшее число указывает на большее сходство.

Если пиксель находится в области равномерной интенсивности, то близлежащие участки будут выглядеть одинаково. Если пиксель находится на краю, то соседние участки в направлении, перпендикулярном краю, будут выглядеть совсем по-другому, но соседние участки в направлении, параллельном краю, приведут лишь к небольшому изменению. Если пиксель находится на объекте с вариациями во всех направлениях, то ни один из соседних участков не будет выглядеть одинаково.

Угловая прочность определяется как наименьший SSD между патчем и его соседями (по горизонтали, вертикали и по двум диагоналям). Причина в том, что если это число велико, то вариация по всем сдвигам либо равна ему, либо превышает его, поэтому все близлежащие участки выглядят по-разному.

Если число угловой прочности вычисляется для всех мест, то, что оно локально максимально для одного местоположения, указывает на то, что в нем присутствует интересующий объект.

Как отметил Моравец, одна из основных проблем этого оператора заключается в том, что он не изотропен : если присутствует ребро, не направленное в сторону соседей (горизонтальное, вертикальное или диагональное), то наименьший SSD будет большой, и край будет неправильно выбран в качестве точки интереса. [ 4 ]

Алгоритмы обнаружения углов Харриса и Стивенса/Ши-Томази

[ редактировать ]

Харрис и Стивенс [ 5 ] усовершенствован детектор углов Моравека за счет непосредственного учета разницы угловых показателей относительно направления вместо использования смещенных участков. (Эту угловую оценку часто называют автокорреляцией , поскольку этот термин используется в статье, в которой описывается этот детектор. Однако математические расчеты в статье ясно указывают на то, что используется сумма квадратов разностей.)

Без ограничения общности будем считать, что используется двухмерное изображение в оттенках серого. Пусть это изображение задано . Рассмотрите возможность использования патча изображения над областью. и смещая его на . Взвешенная сумма квадратов разностей (SSD) между этими двумя патчами, обозначаемая , определяется:

может быть аппроксимировано разложением Тейлора . Позволять и быть частными производными от , такой, что

Это дает приближение

что можно записать в матричной форме:

где A структурный тензор ,

Говоря словами, находим ковариацию частной производной интенсивности изображения в отношении и топоры.

Угловые скобки обозначают усреднение (т.е. суммирование по ). обозначает тип окна, которое скользит по изображению. Если используется фильтр Box , отклик будет анизотропным , но если используется фильтр Gaussian , отклик будет изотропным .

Угол (или вообще точка интереса) характеризуется большим изменением во всех направлениях вектора . Анализируя собственные значения , эта характеристика может быть выражена следующим образом: должно иметь два «больших» собственных значения для точки интереса. Основываясь на величинах собственных значений, на основе этого аргумента можно сделать следующие выводы:

  1. Если и тогда этот пиксель не имеет особенностей, представляющих интерес.
  2. Если и имеет некоторое большое положительное значение, то находится ребро.
  3. Если и имеют большие положительные значения, то находится угол.

Харрис и Стивенс отмечают, что точное вычисление собственных значений требует больших вычислительных затрат, поскольку требует вычисления квадратного корня , и вместо этого предлагают следующая функция , где — настраиваемый параметр чувствительности:

Следовательно, алгоритм [ 6 ] не нужно фактически вычислять разложение матрицы по собственным значениям и вместо этого достаточно определитель и след оценить найти углы, а точнее точки интереса в целом.

Ши-Томази [ 7 ] детектор углов напрямую вычисляет потому что при определенных предположениях углы более стабильны для отслеживания. Обратите внимание, что этот метод также иногда называют угловым детектором Канаде – Томаси.

Стоимость должен определяться эмпирически, и в литературе сообщалось, что значения в диапазоне 0,04–0,15 являются возможными.

Можно избежать установки параметра с помощью Нобла [ 8 ] угловая мера что составляет среднее гармоническое собственных значений:

является небольшой положительной константой.

Если можно интерпретировать как матрицу точности углового положения, ковариационная матрица углового положения равна , то есть

Сумма собственных значений , которую в этом случае можно интерпретировать как обобщенную дисперсию (или «полную неопределенность») углового положения, связана с угловой мерой Нобла. по следующему уравнению:

Угловой детектор Фёрстнера

[ редактировать ]
Обнаружение углов с использованием алгоритма Фёрстнера

В некоторых случаях может потребоваться вычислить местоположение угла с точностью до субпикселя. Чтобы получить приближенное решение, Фёрстнер [ 9 ] Алгоритм находит точку, ближайшую ко всем касательным линиям угла в данном окне, и представляет собой решение методом наименьших квадратов. Алгоритм основан на том факте, что в идеальном углу касательные пересекаются в одной точке.

Уравнение касательной в пикселе дается:

где вектор градиента изображения в .

Суть ближайший ко всем касательным линиям в окне является:

Расстояние от к касательным линиям взвешивается по величине градиента, что придает большее значение касательным, проходящим через пиксели с сильными градиентами.

Решение для :

определяются как:

Минимизацию этого уравнения можно выполнить, дифференцируя по и установим его равным 0:

Обратите внимание, что структурный тензор . Чтобы уравнение имело решение, должно быть обратимым, а это означает, что должен быть полного ранга (ранг 2). Таким образом, решение

существует только там, где в окне существует реальный угол .

Методология автоматического выбора масштаба для этого метода угловой локализации была представлена ​​Линдебергом. [ 10 ] [ 11 ] минимизируя нормализованную невязку

над весами. Таким образом, способ имеет возможность автоматически адаптировать уровни масштаба для вычисления градиентов изображения к уровню шума в данных изображения, выбирая более грубые уровни масштаба для зашумленных данных изображения и более мелкие уровни масштаба для почти идеальных угловых структур.

Примечания:

  • можно рассматривать как остаток при вычислении решения методом наименьших квадратов: если , то ошибки не было.
  • этот алгоритм можно модифицировать для вычисления центров круговых объектов, заменив касательные линии нормальными линиями.

Многомасштабный оператор Харриса

[ редактировать ]

Вычисление матрицы второго момента (иногда также называемой структурным тензором ) в операторе Харриса требуется вычисление производных изображений в области изображений, а также суммирование нелинейных комбинаций этих производных по локальным окрестностям. Поскольку вычисление производных обычно включает этап сглаживания в масштабном пространстве, рабочее определение оператора Харриса требует двух параметров масштаба: (i) локального масштаба для сглаживания перед вычислением производных изображения и (ii) масштаба интегрирования . для накопления нелинейных операций над производными операторами в интегрированный дескриптор изображения.

С обозначая исходную интенсивность изображения, пусть обозначают масштабное пространственное представление полученный сверткой с гауссовским ядром

с параметром локального масштаба :

и пусть и обозначаем частные производные . Кроме того, введем оконную функцию Гаусса с параметром масштаба интегрирования . Тогда многомасштабная матрица второго момента [ 12 ] [ 13 ] [ 14 ] может быть определен как

Затем мы можем вычислить собственные значения аналогично собственным значениям и определим многомасштабную угловую меру Харриса как

К вопросу о выборе параметра локального масштаба и параметр масштаба интегрирования , эти параметры масштаба обычно связаны параметром относительного масштаба интегрирования такой, что , где обычно выбирается в интервале . [ 12 ] [ 13 ] Таким образом, мы можем вычислить многомасштабную угловую меру Харриса. в любом масштабе в масштабном пространстве, чтобы получить многомасштабный угловой детектор, который реагирует на угловые структуры разных размеров в области изображения.

На практике этот многомасштабный угловой детектор часто дополняется шагом выбора масштаба , где нормированный по масштабу оператор Лапласа [ 11 ] [ 12 ]

вычисляется в каждом масштабе в масштабном пространстве, а угловые точки, адаптированные к масштабу, с автоматическим выбором масштаба («оператор Харриса-Лапласа») вычисляются из точек, которые одновременно: [ 15 ]

  • пространственные максимумы многомасштабной угловой меры
  • локальные максимумы или минимумы в масштабах нормированного по масштабу оператора Лапласа [ 11 ] :

Подход с использованием кривизны кривой уровня

[ редактировать ]

Более ранний подход к обнаружению углов заключался в обнаружении точек, в которых кривизна кривых уровня и величина градиента одновременно высоки. [ 16 ] [ 17 ] Дифференциальный способ обнаружения таких точек заключается в вычислении масштабированной кривизны кривой уровня (произведение кривизны кривой уровня и величины градиента, возведенной в степень три).

и обнаружить положительные максимумы и отрицательные минимумы этого дифференциального выражения в некотором масштабе в масштабном представлении пространства исходного изображения. [ 10 ] [ 11 ] Однако основная проблема при вычислении объекта кривизны перемасштабированной кривой уровня в одном масштабе заключается в том, что он может быть чувствителен к шуму и выбору уровня масштаба. Лучшим методом является вычисление -нормализованная измененная кривизна кривой уровня

с и обнаружить масштабном пространстве знаковые экстремумы этого выражения в , которые представляют собой точки и масштабы, которые являются положительными максимумами и отрицательными минимумами как по отношению к пространству, так и по масштабу.

в сочетании с дополнительным шагом локализации для обработки увеличения ошибки локализации в более крупных масштабах. [ 10 ] [ 11 ] [ 12 ] Таким образом, более крупные значения масштаба будут связаны с закругленными углами большой пространственной протяженности, тогда как меньшие значения масштаба будут связаны с острыми углами с небольшой пространственной протяженностью. Этот подход является первым детектором углов с автоматическим выбором масштаба (до «оператора Харриса-Лапласа», описанного выше) и использовался для отслеживания углов при крупномасштабных изменениях в области изображения. [ 18 ] и для сопоставления угловых реакций с краями для вычисления структурных особенностей изображения для распознавания объектов на основе географического изображения . [ 19 ]

Лапласиан от гауссиана, различия гауссианов и определитель точек интереса гессенского масштабного пространства

[ редактировать ]

Бревно [ 11 ] [ 12 ] [ 15 ] это аббревиатура, обозначающая лапласиан или гауссиан , DoG. [ 20 ] — это аббревиатура, обозначающая разность гауссианов (DoG — это аппроксимация LoG), а DoH — это аббревиатура, обозначающая определитель гессиана . [ 11 ] Все эти инвариантные к масштабу точки интереса извлекаются путем обнаружения экстремумов в масштабном пространстве нормализованных к масштабу дифференциальных выражений, т. е. точек в масштабном пространстве, где соответствующие нормированные к масштабу дифференциальные выражения принимают локальные экстремумы как по отношению к пространству, так и к масштабу. [ 11 ]

где обозначает соответствующий дифференциальный объект, нормализованный по масштабу (определенный ниже).

Эти детекторы более полно описаны в разделе «Обнаружение BLOB-объектов» . Нормированный по масштабу лапласиан гауссовых и разностных гауссовских характеристик (Линдеберг 1994, 1998; Лоу 2004) [ 11 ] [ 12 ] [ 20 ]

не обязательно создавать высокоизбирательные функции, поскольку эти операторы также могут приводить к ответам вблизи границ. Чтобы улучшить способность обнаружения углов разностей детектора Гаусса, в SIFT используется детектор функций. [ 20 ] Поэтому система использует дополнительный этап постобработки, на котором собственные значения изображения гессиана в масштабе обнаружения исследуются аналогично тому, как в операторе Харриса. Если соотношение собственных значений слишком велико, то локальное изображение считается слишком похожим на ребро, поэтому признак отклоняется. Также можно определить лапласиан Линдеберга детектора гауссовых признаков, включающий дополнительную пороговую обработку на дополнительном дифференциальном инварианте для подавления откликов вблизи границ. [ 21 ]

Нормированный по масштабу определитель оператора Гессе (Линдеберг 1994, 1998). [ 11 ] [ 12 ]

с другой стороны, он очень избирательно относится к хорошо локализованным функциям изображения и реагирует только тогда, когда существуют значительные различия в уровне серого в двух направлениях изображения. [ 11 ] [ 14 ] и в этом и других отношениях является лучшим детектором точек интереса, чем лапласиан гауссиана. Определитель гессиана представляет собой аффинное ковариантное дифференциальное выражение и имеет лучшие свойства выбора масштаба при аффинных преобразованиях изображения, чем оператор Лапласа. (Линдеберг 2013, 2015). [ 21 ] [ 22 ] Экспериментально это означает, что определитель точек интереса Гессе имеет лучшие свойства повторяемости при локальной деформации изображения, чем точки интереса Лапласа, что, в свою очередь, приводит к лучшей производительности сопоставления на основе изображений с точки зрения более высоких оценок эффективности и более низких оценок точности 1- . [ 21 ]

Свойства выбора масштаба, свойства аффинного преобразования и экспериментальные свойства этих и других детекторов точек интереса в масштабном пространстве подробно анализируются в (Lindeberg 2013, 2015). [ 21 ] [ 22 ]

Точки интереса в масштабном пространстве, основанные на мерах силы признаков Линдеберга-Гессе

[ редактировать ]

Вдохновлен структурно схожими свойствами матрицы Гессе. функции и матрица второго момента (структурный тензор) , что может проявляться, например, в их схожих трансформационных свойствах при аффинных деформациях изображений [ 13 ] [ 21 ]

,
,

Линдеберг (2013, 2015) [ 21 ] [ 22 ] предложено определять четыре меры силы признаков из матрицы Гессе аналогичным образом, поскольку операторы Харриса и Ши-и-Томази определяются из структурного тензора (матрицы второго момента). В частности, он определил следующие беззнаковые и подписанные меры силы гессенских признаков:

  • беззнаковая мера силы гессенского признака I:
  • подписанная мера силы гессенского признака I:
  • беззнаковая мера силы гессиана II:
  • подписанная мера силы гессенского признака II:

где и обозначаем след и определитель матрицы Гессе представления в масштабном пространстве в любом масштабе , тогда как

обозначают собственные значения матрицы Гессе. [ 23 ]

Беззнаковая мера силы гессиана реагирует на локальные экстремумы положительными значениями и не чувствителен к седловым точкам, тогда как знаковая мера силы признака Гессе дополнительно реагирует на седловые точки отрицательными значениями. Беззнаковая мера силы гессиана нечувствителен к локальной полярности сигнала, тогда как знаковая мера силы гессиана реагирует на локальную полярность сигнала по знаку его выхода.

В Линдеберге (2015) [ 21 ] эти четыре дифференциальных объекта были объединены с выбором локального масштаба на основе обнаружения экстремумов в масштабном пространстве.

или масштабировать связь. Кроме того, знаковый и беззнаковый гессиан характеризуются мерами силы. и были объединены с дополнительной пороговой оценкой .

Путем экспериментов по сопоставлению изображений при масштабных преобразованиях на наборе данных плакатов с 12 плакатами с сопоставлением нескольких изображений по масштабным преобразованиям до масштабного коэффициента 6 и изменениям направления просмотра до угла наклона 45 градусов с локальными дескрипторами изображений, определенными из переформулировок было показано, что дескрипторы чистого изображения в операторах SIFT и SURF для измерения изображений в терминах операторов производной Гаусса (Gauss-SIFT и Gauss-SURF) вместо исходного SIFT, определенного на основе пирамиды изображений, или исходного SURF, определенного на основе вейвлетов Хаара, было показано это обнаружение точки интереса в масштабном пространстве на основе беззнаковой меры силы признака Гессе допускал лучшую производительность и лучшую производительность, чем точки интереса в масштабном пространстве, полученные из определителя гессиана . Обе беззнаковые гессианские функции являются мерой силы. , знаковая мера силы гессиана и определитель гессиана допускал лучшую производительность, чем лапласиан гауссовой . В сочетании с привязкой масштабов и дополнительным пороговым значением , знаковая мера силы гессиана дополнительно обеспечил лучшую производительность, чем лапласиан гауссовой .

Кроме того, было показано, что все эти детекторы точек интереса в дифференциальном масштабе, определенные на основе матрицы Гессе, позволяют обнаруживать большее количество точек интереса и улучшать производительность сопоставления по сравнению с операторами Харриса и Ши-и-Томази, определенными из структуры тензор (матрица второго момента).

Теоретический анализ свойств выбора масштаба этих четырех мер силы гессиана и других дифференциальных объектов для обнаружения точек интереса в масштабном пространстве, включая лапласиан гауссиана и определитель гессиана, приведен в Линдеберге (2013). [ 22 ] и анализ их свойств аффинного преобразования, а также экспериментальных свойств в Линдеберге (2015). [ 21 ]

Аффинно-адаптированные операторы точек интереса

[ редактировать ]

Точки интереса, полученные с помощью многомасштабного оператора Харриса с автоматическим выбором масштаба, инвариантны к перемещениям, вращениям и равномерным изменениям масштаба в пространственной области. Однако изображения, которые представляют собой входные данные для системы компьютерного зрения, также подвержены перспективным искажениям. Чтобы получить оператор точки интереса, более устойчивый к перспективным преобразованиям, естественным подходом является разработка детектора признаков, инвариантного к аффинным преобразованиям . На практике аффинные инвариантные точки интереса могут быть получены путем применения аффинной адаптации формы , при которой форма сглаживающего ядра итеративно деформируется, чтобы соответствовать локальной структуре изображения вокруг точки интереса, или, что эквивалентно, локальный фрагмент изображения итеративно деформируется, в то время как форма сглаживания ядро остается вращательно-симметричным (Линдеберг, 1993, 2008; Линдеберг и Гардинг, 1997; Миколайзчик и Шмид, 2004). [ 12 ] [ 13 ] [ 14 ] [ 15 ] Следовательно, помимо широко используемого многомасштабного оператора Харриса, аффинная адаптация формы может применяться к другим угловым детекторам, перечисленным в этой статье, а также к дифференциальным детекторам BLOB-объектов, таким как оператор Лапласа/разности гауссовских операторов, определитель гессиана. [ 14 ] и оператор Гессиана–Лапласа.

Алгоритм обнаружения углов Ванга и Брейди

[ редактировать ]

Ван и Брейди [ 24 ] детектор считает изображение поверхностью и ищет места с большой кривизной по краю изображения. Другими словами, алгоритм ищет места, где край быстро меняет направление. Угловой счет, , определяется:

где - единичный вектор, перпендикулярный градиенту, и определяет, насколько фобичен детектор. Авторы также отмечают, что для уменьшения шума необходимо сглаживание (предлагается гауссово).

Сглаживание также вызывает смещение углов, поэтому авторы выводят выражение для смещения угла на 90 градусов и применяют его в качестве поправочного коэффициента к обнаруженным углам.

Угловой детектор SUSAN

[ редактировать ]

СЬЮЗЕН [ 25 ] — аббревиатура, обозначающая наименьший однозначный сегмент ассимилирующего ядра . Этот метод является предметом патента Великобритании 1994 года, который больше не действует. [ 26 ]

Для обнаружения признаков СЬЮЗАН помещает круглую маску на тестируемый пиксель (ядро). Область маски , а пиксель в этой маске представлен как . Ядро находится в . Каждый пиксель сравнивается с ядром с помощью функции сравнения:

где – порог разницы яркостей, [ 27 ] - яркость пикселя, а степень показателя степени определена эмпирически. Эта функция имеет вид сглаженного цилиндра или прямоугольной функции . Площадь Сьюзен определяется как:

Если – прямоугольная функция, то количество пикселей в маске, находящихся в пределах ядра. Ответ оператора SUSAN имеет вид:

где называется «геометрическим порогом». Другими словами, оператор SUSAN имеет положительную оценку только в том случае, если площадь достаточно мала. Наименьший SUSAN локально можно найти с помощью немаксимального подавления, и это полный оператор SUSAN.

Значение определяет, насколько похожими должны быть точки на ядро, прежде чем они будут считаться частью однозначного сегмента. Стоимость определяет минимальный размер однозначного сегмента. Если достаточно велик, то это становится детектором границ .

Для обнаружения угла используются два дополнительных шага. Во-первых, находится центр тяжести Сьюзен. В правильном углу центр тяжести будет находиться далеко от ядра. Второй шаг требует, чтобы все точки на линии от ядра через центроид до края маски находились в Сьюзен.

Угловой детектор Трайковича и Хедли

[ редактировать ]

Подобно СЬЮЗАН, этот детектор [ 28 ] напрямую проверяет, является ли участок под пикселем самоподобным, исследуя близлежащие пиксели. - это пиксель, который следует учитывать, и это точка на окружности сосредоточен вокруг . Суть это точка, противоположная по диаметру.

Функция ответа определяется как:

Оно будет большим, если не существует направления, в котором центральный пиксель похож на два соседних пикселя по диаметру. представляет собой дискретизированный круг ( круг Брезенхема ), поэтому интерполяция для промежуточных диаметров используется , чтобы дать более изотропный отклик. Поскольку любое вычисление дает верхнюю границу , сначала проверяются горизонтальное и вертикальное направления, чтобы понять, стоит ли приступать к полному вычислению .

Детекторы признаков на основе AST

[ редактировать ]

AST — это аббревиатура, обозначающая ускоренное тестирование сегмента . Этот тест представляет собой упрощенную версию углового критерия СЬЮЗАН. Вместо оценки круглого диска только пиксели в круге Брезенхэма радиуса вокруг точки-кандидата рассматриваются. Если все смежные пиксели ярче ядра как минимум на или все темнее ядра на , то пиксель под ядром считается признаком. Сообщается, что этот тест дает очень стабильные функции. [ 29 ] Выбор порядка проверки пикселей — это так называемая задача двадцати вопросов . Построение коротких деревьев решений для этой проблемы приводит к созданию наиболее эффективных в вычислительном отношении доступных детекторов признаков.

Первый алгоритм обнаружения углов, основанный на AST, — это FAST ( функции ускоренного теста сегмента ). [ 29 ] Хотя в принципе может принимать любое значение, FAST использует только значение 3 (что соответствует окружности с окружностью 16 пикселей), а тесты показывают, что наилучшие результаты достигаются при равно 9. Это значение является самым низким, при котором края не обнаруживаются. Порядок проверки пикселей определяется алгоритмом ID3 из обучающего набора изображений. Как ни странно, название детектора чем-то похоже на название статьи, описывающей детектор Трайковича и Хедли.

Автоматический синтез детекторов

[ редактировать ]

Трухильо и Олаге [ 30 ] представил метод, с помощью которого генетическое программирование используется для автоматического синтеза операторов изображений, которые могут обнаруживать точки интереса. Наборы терминалов и функций содержат примитивные операции, которые распространены во многих ранее предложенных искусственных конструкциях. Фитнес измеряет стабильность каждого оператора посредством коэффициента повторяемости и способствует равномерному распределению обнаруженных точек по плоскости изображения. Производительность усовершенствованных операторов была подтверждена экспериментально с использованием обучающих и тестовых последовательностей постепенно преобразуемых изображений. Следовательно, предложенный алгоритм GP считается конкурентоспособным для человека в задаче обнаружения точек интереса.

Детекторы пространственно-временных точек интереса

[ редактировать ]

Оператор Харриса был распространен на пространство-время Лаптевым и Линдебергом. [ 31 ] Позволять обозначают пространственно-временную матрицу второго момента, определяемую формулой

Тогда для подходящего выбора , пространственно-временные точки интереса обнаруживаются по пространственно-временным экстремумам следующей пространственно-временной меры Харриса:

Определитель оператора Гессе был расширен на совместное пространство-время Виллемсом и др. [ 32 ] и Линдеберг, [ 33 ] что приводит к следующему дифференциальному выражению, нормализованному по масштабу:

В работе Виллемса и др. [ 32 ] более простое выражение, соответствующее и был использован. В Линдеберге, [ 33 ] было показано, что и подразумевает лучшие свойства выбора масштаба в том смысле, что выбранные уровни масштаба получены из пространственно-временного гауссова пятна с пространственной протяженностью. и временная протяженность будет идеально соответствовать пространственной протяженности и временной продолжительности BLOB-объекта, при этом выбор масштаба выполняется путем обнаружения экстремумов пространственно-временного масштаба-пространства дифференциального выражения.

Оператор Лапласа был расширен Линдебергом до пространственно-временных видеоданных. [ 33 ] что приводит к следующим двум пространственно-временным операторам, которые также составляют модели рецептивных полей незапаздывающих и отстающих нейронов в LGN :

Для первого оператора свойства выбора масштаба требуют использования и , если мы хотим, чтобы этот оператор принял свое максимальное значение в пространственно-временных масштабах на уровне пространственно-временного масштаба, отражающем пространственную протяженность и временную продолжительность возникшего гауссова пятна. Для второго оператора свойства выбора масштаба требуют использования и , если мы хотим, чтобы этот оператор принял максимальное значение в пространственно-временных масштабах на уровне пространственно-временного масштаба, отражающем пространственную протяженность и временную продолжительность мигающего гауссова пятна.

Цветовые расширения пространственно-временных детекторов точек интереса были исследованы Everts et al. [ 34 ]

Библиография

[ редактировать ]
  1. ^ Эндрю Уиллис и Юнфэн Суй (2009). «Алгебраическая модель для быстрого обнаружения углов». 2009 12-я Международная конференция IEEE по компьютерному зрению . IEEE. стр. 2296–2302. дои : 10.1109/ICCV.2009.5459443 . ISBN  978-1-4244-4420-5 .
  2. ^ Шапиро, Линда и Джордж К. Стокман (2001). Компьютерное зрение , с. 257. Книги Прентиса, река Аппер-Седл. ISBN   0-13-030796-3 .
  3. ^ Х. Моравец (1980). «Обход препятствий и навигация в реальном мире с помощью видящего робота-вездехода» . Технический отчет CMU-RI-TR-3 Университет Карнеги-Меллона, Институт робототехники .
  4. ^ Предотвращение препятствий и навигация в реальном мире с помощью видящего робота-вездехода, Ганс Моравец, март 1980 г., факультет компьютерных наук, Стэнфордский университет (докторская диссертация)
  5. ^ К. Харрис и М. Стивенс (1988). «Комбинированный детектор углов и краев» (PDF) . Материалы 4-й конференции Alvey Vision . стр. 147–151. Архивировано из оригинала (PDF) 1 апреля 2022 г. Проверено 30 декабря 2010 г.
  6. ^ Хавьер Санчес, Нельсон Монсон и Агустин Сальгадо (2018). «Анализ и реализация углового детектора Харриса» . Обработка изображений в режиме онлайн . 8 : 305–328. дои : 10.5201/ipol.2018.229 . hdl : 10553/43499 . Архивировано из оригинала 11 мая 2020 г. Проверено 6 мая 2020 г. {{cite journal}}: CS1 maint: bot: исходный статус URL неизвестен ( ссылка )
  7. ^ Дж. Ши и К. Томази (июнь 1994 г.). «Хорошие возможности для отслеживания». 9-я конференция IEEE по компьютерному зрению и распознаванию образов . Спрингер. стр. 593–600. CiteSeerX   10.1.1.36.2669 . дои : 10.1109/CVPR.1994.323794 .
    К. Томази и Т. Канаде (1991). Обнаружение и отслеживание точечных особенностей (Технический отчет). Школа компьютерных наук Университета Карнеги-Меллон. CiteSeerX   10.1.1.45.5770 . КМУ-КС-91-132.
  8. ^ А. Ноубл (1989). Описания поверхностей изображений (доктор философии). Департамент инженерных наук Оксфордского университета. п. 45.
  9. ^ Фёрстнер, В; Гюльх (1987). «Быстрый оператор для обнаружения и точного определения различных точек, углов и центров круговых элементов» (PDF) . ИСПРС .
  10. ^ Перейти обратно: а б с Т. Линдеберг (1994). «Обнаружение соединений с автоматическим выбором масштабов обнаружения и масштабов локализации» . Учеб. 1-я Международная конференция по обработке изображений . Том. И. Остин, Техас. стр. 924–928.
  11. ^ Перейти обратно: а б с д и ж г час я дж к Тони Линдеберг (1998). «Обнаружение признаков с автоматическим выбором масштаба» . Международный журнал компьютерного зрения . Том. 30, нет. 2. С. 77–116.
  12. ^ Перейти обратно: а б с д и ж г час Т. Линдеберг (1994). Теория масштаба-пространства в компьютерном зрении . Спрингер. ISBN  978-0-7923-9418-1 .
  13. ^ Перейти обратно: а б с д Т. Линдеберг и Дж. Гардинг «Сглаживание с адаптацией к форме при оценке трехмерных сигналов глубины на основе аффинных искажений локальной двумерной структуры». Image and Vision Computing 15 (6): стр. 415–434, 1997.
  14. ^ Перейти обратно: а б с д Т. Линдеберг (2008). «Масштаб-Пространство» . В Бенджамине Ва (ред.). Энциклопедия компьютерных наук и техники Wiley . Том. IV. Джон Уайли и сыновья. стр. 2495–2504. дои : 10.1002/9780470050118.ecse609 . ISBN  978-0-470-05011-8 .
  15. ^ Перейти обратно: а б с К. Миколайчик, К. и К. Шмид (2004). «Масштабные и аффинно-инвариантные детекторы точек интереса» (PDF) . Международный журнал компьютерного зрения . 60 (1): 63–86. дои : 10.1023/B:VISI.0000027790.02288.f2 . S2CID   1704741 .
  16. ^ Л. Китчен и А. Розенфельд (1982). «Обнаружение углов на уровне серого». Буквы для распознавания образов . Том. 1, нет. 2. С. 95–102.
  17. ^ Дж. Дж. Кендеринк и В. Ричардс (1988). «Операторы двумерной кривизны» . Журнал Оптического общества Америки А. Том. 5, нет. 7. С. 1136–1141.
  18. ^ Л. Бретцнер и Т. Линдеберг (1998). «Функциональное отслеживание с автоматическим выбором пространственных масштабов» . Компьютерное зрение и понимание изображений . Том. 71. С. 385–392.
  19. ^ Т. Линдеберг и М.-Х. Ли (1997). «Сегментация и классификация ребер с использованием приближения минимальной длины описания и дополнительных сигналов соединения» . Компьютерное зрение и понимание изображений . Том. 67, нет. 1. С. 88–98.
  20. ^ Перейти обратно: а б с Д. Лоу (2004). «Отличительные особенности изображения по масштабно-инвариантным ключевым точкам» . Международный журнал компьютерного зрения . 60 (2): 91. CiteSeerX   10.1.1.73.2924 . дои : 10.1023/B:VISI.0000029664.99615.94 . S2CID   221242327 .
  21. ^ Перейти обратно: а б с д и ж г час Т. Линдеберг «Сопоставление изображений с использованием точек интереса в обобщенном масштабном пространстве», Журнал Mathematical Imaging and Vision, том 52, номер 1, страницы 3–36, 2015.
  22. ^ Перейти обратно: а б с д Т. Линдеберг «Свойства выбора масштаба детекторов точек интереса в обобщенном масштабном пространстве», Журнал Mathematical Imaging and Vision, том 46, выпуск 2, страницы 177–210, 2013.
  23. ^ Линдеберг, Т. (1998). «Обнаружение кромок и гребней с автоматическим выбором масштаба» . Международный журнал компьютерного зрения . 30 (2): 117–154. дои : 10.1023/А:1008097225773 . S2CID   35328443 .
  24. ^ Х. Ван и М. Брэди (1995). «Алгоритм обнаружения углов в реальном времени для оценки движения». Вычисление изображений и зрительных образов . 13 (9): 695–703. дои : 10.1016/0262-8856(95)98864-П .
  25. ^ С. М. Смит и Дж. М. Брэди (май 1997 г.). «СЬЮЗАН – новый подход к низкоуровневой обработке изображений» . Международный журнал компьютерного зрения . 23 (1): 45–78. дои : 10.1023/A:1007963824710 . S2CID   15033310 .
    С. М. Смит и Дж. М. Брэди (январь 1997 г.), «Метод цифровой обработки изображений для определения положения их краев и/или углов для наведения беспилотного аппарата». Патент Великобритании 2272285, владелец: министр обороны Великобритании.
  26. ^ Патент Великобритании 2272285 , Смит, Стивен Марк, «Определение положения краев и углов изображений», опубликован 11 мая 1994 г., выдан 11 мая 1994 г., передан Secr Defense.  
  27. ^ «Детектор SUSAN Edge в деталях» .
  28. ^ М. Трайкович и М. Хедли (1998). «Быстрое обнаружение углов». Вычисление изображений и зрительных образов . 16 (2): 75–87. дои : 10.1016/S0262-8856(97)00056-5 .
  29. ^ Перейти обратно: а б Э. Ростен и Т. Драммонд (май 2006 г.). «Машинное обучение для высокоскоростного обнаружения поворотов» . Европейская конференция по компьютерному зрению .
  30. ^ Леонардо Трухильо и Густаво Олаге (2008). «Автоматическая разработка операторов изображений, определяющих точки интереса» (PDF) . Эволюционные вычисления . 16 (4): 483–507. дои : 10.1162/evco.2008.16.4.483 . ПМИД   19053496 . S2CID   17704640 . Архивировано из оригинала (PDF) 17 июля 2011 г.
  31. ^ Иван Лаптев и Тони Линдеберг (2003). «Пространственно-временные точки интереса» . Международная конференция по компьютерному зрению . IEEE. стр. 432–439.
  32. ^ Перейти обратно: а б Герт Виллемс, Тинне Туйтелаарс и Люк ван Гул (2008). «Эффективный плотный и масштабно-инвариантный пространственно-временной детектор точек интереса». Европейская конференция по компьютерному зрению . Конспекты лекций Спрингера по информатике. Том. 5303. стр. 650–663. дои : 10.1007/978-3-540-88688-4_48 .
  33. ^ Перейти обратно: а б с Тони Линдеберг (2018). «Выбор пространственно-временного масштаба в видеоданных» . Журнал математического изображения и видения . 60 (4): 525–562. дои : 10.1007/s10851-017-0766-9 . S2CID   254649837 .
  34. ^ И. Эвертс, Дж. ван Гемерт и Т. Геверс (2014). «Оценка цветовых пространственно-временных точек интереса для распознавания действий человека». Транзакции IEEE при обработке изображений . 23 (4): 1569–1589. дои : 10.1109/TIP.2014.2302677 . ПМИД   24577192 . S2CID   1999196 .

Эталонные реализации

[ редактировать ]

В этом разделе представлены внешние ссылки на эталонные реализации некоторых детекторов, описанных выше. Эти эталонные реализации предоставлены авторами статьи, в которой впервые описан детектор. Они могут содержать детали, отсутствующие или явные в документах, описывающих эти функции.

См. также

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 25ab89208fd837fd2b03398b8ece2c80__1704355500
URL1:https://arc.ask3.ru/arc/aa/25/80/25ab89208fd837fd2b03398b8ece2c80.html
Заголовок, (Title) документа по адресу, URL1:
Corner detection - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)