Jump to content

Тензор обобщенной структуры

В анализе изображений тензор обобщенной структуры (GST) является расширением тензора декартовой структуры до криволинейных координат . [1] Он в основном используется для обнаружения и представления параметров «направления» кривых, точно так же, как тензор декартовой структуры обнаруживает и представляет направление в декартовых координатах. Лучше всего изучены семейства кривых, порожденные парами локально ортогональных функций.

Это широко известный метод в приложениях обработки изображений и видео, включая компьютерное зрение, таких как биометрическая идентификация по отпечаткам пальцев, [2] и исследования срезов тканей человека. [3] [4]

GST в 2D и локально ортогональных базисах

[ редактировать ]

Пусть термин image представляет собой функцию где являются действительными переменными и , и , являются вещественнозначными функциями. GST представляет собой направление, в котором изображение может подвергаться бесконечно малому перемещению с минимальной ( общей ошибкой наименьших квадратов ) по «линиям», удовлетворяющим следующим условиям:

1. «Линии» — это обычные линии в криволинейной системе координат.

которые представляют собой кривые в декартовых координатах, как показано уравнением выше. Ошибка измеряется в смысл и минимальность ошибки относятся тем самым к норме L2 .

2. Функции составляют гармоническую пару, т. е. удовлетворяют уравнениям Коши–Римана ,

Соответственно, такие криволинейные координаты локально ортогональны.

Тогда GST состоит из

где — ошибки (бесконечно-малого) перевода в наилучшем направлении (обозначаются углом ) и худшее направление (обозначается ). Функция — это оконная функция, определяющая «внешний масштаб», в котором обнаружение будет осуществляться, что можно опустить, если оно уже включено в или если это полное изображение (а не локальное). Матрица является единичной матрицей . Используя правило цепочки , можно показать, что описанное выше интегрирование может быть реализовано как свертка в декартовых координатах, примененная к тензору обычной структуры, когда соединить действительную и мнимую части аналитической функции ,

где . [5] Примеры аналитических функций включают в себя , а также мономы , , где — произвольное положительное или отрицательное целое число. Мономы также называются гармоническими функциями в компьютерном зрении и обработке изображений.

Таким образом, тензор декартовой структуры является частным случаем GST, где , и , т.е. гармоническая функция просто . Таким образом, выбрав гармоническую функцию , можно обнаружить все кривые, которые являются линейными комбинациями своих действительных и мнимых частей, путем свертки только на (прямоугольных) сетках изображений, даже если являются некартезианскими. Кроме того, вычисления свертки могут выполняться с использованием сложных фильтров, применяемых к комплексной версии структурного тензора. Таким образом, реализации GST часто выполнялись с использованием сложной версии структурного тензора, а не с использованием тензора (1,1).

Сложная версия НДС

[ редактировать ]

Поскольку существует комплексная версия тензора обычной структуры , существует также комплексная версия GST.

который идентичен своему двоюродному брату с той разницей, что это сложный фильтр. Напомним, что обычный структурный тензор — это реальный фильтр, обычно определяемый с помощью выборки и масштабирования гауссиана для определения окрестностей, также известный как внешний масштаб. Эта простота является причиной того, что при реализации GST преимущественно используется описанная выше сложная версия. Для семейств кривых определяется аналитическими функциями , можно показать, что [1] функция, определяющая окрестности, имеет комплексное значение,

,

так называемая симметричная производная гауссианы. Таким образом, изменение ориентации искомого шаблона непосредственно включается в функцию определения окрестности, и обнаружение происходит в пространстве (обычного) структурного тензора.

Основная концепция использования в обработке изображений и компьютерном зрении.

[ редактировать ]

Эффективное обнаружение в изображениях возможно путем обработки изображений по паре , . Сложные свертки (или соответствующие матричные операции) и поточечные нелинейные отображения являются основными вычислительными элементами реализаций GST. Общая оценка наименьших квадратов ошибки затем получается вместе с двумя ошибками, и . По аналогии с тензором декартовой структуры оцененный угол представлен в виде двойного угла, т.е. предоставляется путем вычислений и может использоваться как признак формы, тогда как отдельно или в сочетании с может использоваться как мера качества (достоверности, определенности) для оценки угла.

Логарифмические спирали, включая круги, можно обнаружить, например, с помощью (сложных) сверток и нелинейных отображений. [1] Спирали могут быть в серых (значных) изображениях или в двоичном изображении , т.е. местоположения краевых элементов соответствующих рисунков, таких как контуры кругов или спиралей, не должны быть известны или отмечены иным образом.

Тензор обобщенной структуры можно использовать в качестве альтернативы преобразованию Хафа при обработке изображений и компьютерном зрении для обнаружения закономерностей, локальную ориентацию которых можно смоделировать, например точек соединения. Основные различия заключаются в следующем:

  • Допускается отрицательное, а также сложное голосование;
  • С помощью одного шаблона можно обнаружить несколько шаблонов, принадлежащих к одному семейству;
  • Бинаризация изображения не требуется.

Физико-математическая интерпретация

[ редактировать ]

Криволинейные координаты GST могут объяснить физические процессы, применяемые к изображениям. Хорошо известная пара процессов состоит из вращения и масштабирования. Они связаны с преобразованием координат и .

Если изображение состоит из изокривых, которые можно объяснить только т.е. его изокривые состоят из кругов , где — это любая дифференцируемая функция с действительным знаком, определенная в 1D, изображение инвариантно к вращениям (вокруг начала координат).

Операция масштабирования (включающая в себя уменьшение масштаба) моделируется аналогичным образом. Если на изображении есть изокривые, похожие на «звезду» или велосипедные спицы, т.е. для некоторой дифференцируемой 1D-функции затем изображение инвариантен к масштабированию (относительно начала координат).

В сочетании,

инвариантен к определенному повороту в сочетании с масштабированием, где величина определяется параметром .

Аналогично, тензор декартовой структуры также является представлением перевода . Здесь физический процесс заключается в обычном перемещении некоторой суммы вдоль в сочетании с переводом ,

где сумма задается параметром . Очевидно здесь представляет направление линии.

Как правило, предполагаемый представляет направление (в координаты), вдоль которых бесконечно малые перемещения оставляют изображение инвариантным, на практике наименьшим вариантом. Таким образом, каждая базисная пара криволинейных координат имеет пару бесконечно малых трансляторов, линейная комбинация которых представляет собой дифференциальный оператор . Последние связаны с алгеброй Ли .

Разнообразный

[ редактировать ]

«Изображение» в контексте GST может означать как обычное изображение, так и изображение его окрестности (локальное изображение), в зависимости от контекста. Например, фотография — это изображение, как и все его окрестности.

См. также

[ редактировать ]
  1. ^ Jump up to: а б с Бигун, Дж.; Бигун, Т.; Нильссон, К. (декабрь 2004 г.). «Распознавание по производным симметрии и тензору обобщенной структуры» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 26 (12): 1590–1605. дои : 10.1109/TPAMI.2004.126 . ПМИД   15573820 . S2CID   602221 .
  2. ^ Фронталер, Х.; Коллрейдер, К.; Бигун, Дж. (2008). «Локальные функции для улучшения и извлечения деталей из отпечатков пальцев» . Транзакции IEEE при обработке изображений . 17 (3): 354–363. Бибкод : 2008ITIP...17..354F . CiteSeerX   10.1.1.160.6312 . дои : 10.1109/TIP.2007.916155 . ПМИД   18270124 . S2CID   7119251 .
  3. ^ О. Шмитт; Х. Биркхольц (2010). «Улучшение цитоархитектонического картирования за счет сочетания электродинамического моделирования с локальной ориентацией на изображениях коры головного мозга высокого разрешения» . Микроск. Рез. Тех . 74 (3): 225–243. дои : 10.1109/TIP.2007.916155 . ПМИД   18270124 . S2CID   7119251 .
  4. ^ О. Шмитт; М. Пакура; Т. Аах; Л. Хомке; М. Бёме; С. Бок; С. Прейсс (2004). «Анализ нервных волокон и их распределение в гистологических срезах головного мозга человека». Микроск. Рез. Тех . 63 (4): 220–243. дои : 10.1002/jemt.20033 . ПМИД   14988920 . S2CID   28746142 .
  5. ^ Бигун, Йозеф (декабрь 1997 г.). «Распознавание образов в изображениях по симметрии и преобразованиям координат». Компьютерное зрение и понимание изображений . 68 (3): 290–307. дои : 10.1006/cviu.1997.0556 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c261fe122dd53a5712867d8f740ea592__1716949440
URL1:https://arc.ask3.ru/arc/aa/c2/92/c261fe122dd53a5712867d8f740ea592.html
Заголовок, (Title) документа по адресу, URL1:
Generalized structure tensor - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)