Jump to content

Модель активного контура

(Перенаправлено с Активного контура )

Модель активного контура , также называемая змеями , представляет собой основу компьютерного зрения, предложенную Майклом Кассом , Эндрю Уиткиным и Деметри Терзопулосом. [1] для выделения контура объекта из возможно зашумленного 2D- изображения . Модель змей популярна в компьютерном зрении, а змеи широко используются в таких приложениях, как отслеживание объектов, распознавание форм, сегментация , обнаружение краев и сопоставление стереоизображений.

Змея — это минимизирующая энергию деформируемая сплайн, на которую влияют силы ограничения и изображения, которые притягивают ее к контурам объекта, а также внутренние силы, которые противостоят деформации. Змей можно понимать как частный случай общего метода сопоставления деформируемой модели с изображением посредством минимизации энергии. [1] В двух измерениях модель активной формы представляет собой дискретную версию этого подхода, использующую преимущества модели распределения точек для ограничения диапазона формы явной областью, полученной из обучающего набора.

Змеи – активные деформируемые модели

Змеи не решают всей проблемы поиска контуров на изображениях, так как метод требует предварительного знания желаемой формы контура. Скорее, они зависят от других механизмов, таких как взаимодействие с пользователем, взаимодействие с каким-либо процессом понимания изображения более высокого уровня или информация из данных изображения, смежных во времени или пространстве.

Мотивация

[ редактировать ]

В компьютерном зрении контурные модели описывают границы фигур на изображении. Змеи, в частности, созданы для решения задач, в которых известна приблизительная форма границы. Будучи деформируемой моделью, змеи могут адаптироваться к различиям и шуму при стереосогласовании и отслеживании движения. Кроме того, метод может находить иллюзорные контуры на изображении, игнорируя недостающую информацию о границах.

По сравнению с классическими методами извлечения признаков змеи имеют ряд преимуществ:

  • Они автономно и адаптивно ищут минимальное состояние.
  • Внешние силы образа действуют на змею интуитивно.
  • Включение гауссова сглаживания в функцию энергии изображения повышает чувствительность к масштабу.
  • Их можно использовать для отслеживания динамических объектов.

Ключевые недостатки традиционных змей:

  • Они чувствительны к локальным минимумам, которым можно противодействовать с помощью методов моделирования отжига.
  • Мелкие особенности часто игнорируются при минимизации энергии по всему контуру.
  • Их точность зависит от политики конвергенции. [2]

Энергетическая формулировка

[ редактировать ]

Простая эластичная змея определяется набором из n точек. для , член внутренней упругой энергии и внешний энергетический член на основе ребра . Целью внутренней энергии является контроль деформаций, производимых змеей, а целью внешней энергии является контроль соответствия контура изображению. Внешняя энергия обычно представляет собой комбинацию сил, обусловленных самим изображением. и силы ограничения, введенные пользователем

Энергетическая функция змеи представляет собой сумму ее внешней энергии и внутренней энергии, или

Внутренняя энергия

[ редактировать ]

Внутренняя энергия змеи складывается из непрерывности контура и плавность контура .

[3]

Это можно расширить как

где и определяемые пользователем веса; они контролируют чувствительность функции внутренней энергии к величине растяжения и кривизны змеи соответственно и тем самым контролируют количество ограничений на форму змеи.

На практике большой вес поскольку член непрерывности наказывает изменения в расстояниях между точками контура. Большой вес поскольку термин гладкости наказывает колебания контура и заставляет контур действовать как тонкая пластина.

Энергия изображения

[ редактировать ]

Энергия изображения — это некоторая функция особенностей изображения. Это одна из наиболее распространенных точек модификации производных методов. Элементы изображений и сами изображения можно обрабатывать множеством различных способов.

Для изображения , линии, края и окончания, присутствующие на изображении, общая формулировка энергии, обусловленной изображением, такова:

где , , являются весами этих существенных особенностей. Более высокие веса указывают на то, что значимая особенность будет иметь больший вклад в силу изображения.

Линейный функционал

[ редактировать ]

Функционал линии – это интенсивность изображения, которую можно представить как

Знак определит, будет ли линия притягиваться к темным или светлым линиям.

На изображении можно использовать некоторое сглаживание или шумоподавление, после чего функционал линии будет выглядеть как

Краевой функционал

[ редактировать ]

Краевой функционал основан на градиенте изображения. Одной из реализаций этого является

Змея, берущая начало далеко от желаемого контура объекта, может ошибочно сходиться к некоторому локальному минимуму. Чтобы избежать этих локальных минимумов, можно использовать продолжение масштабного пространства. Это достигается за счет использования фильтра размытия изображения и уменьшения степени размытия по мере выполнения расчета для уточнения соответствия змеи. Функционал энергии, использующий продолжение масштабного пространства, равен

где является гауссовой функцией со стандартным отклонением . Минимумы этой функции приходятся на пересечения нуля точки которые определяют края согласно теории Марра – Хилдрета .

Функционал завершения

[ редактировать ]

Кривизну линий уровня на слегка сглаженном изображении можно использовать для обнаружения углов и границ изображения. Используя этот метод, пусть быть изображением, сглаженным

с углом градиента

единичные векторы вдоль направления градиента

и единичные векторы, перпендикулярные направлению градиента

Функционал терминации энергии можно представить как

Энергия ограничения

[ редактировать ]

Некоторые системы, включая оригинальную реализацию змей, позволяли пользователю управлять змеями не только при их первоначальном размещении, но и с точки зрения их энергии. Такая энергия ограничения может использоваться для интерактивного направления змей к определенным объектам или от них.

Оптимизация посредством градиентного спуска

[ редактировать ]

Учитывая начальное предположение о змее, энергетическая функция змеи итеративно минимизируется. Минимизация градиентного спуска — одна из простейших оптимизаций, которую можно использовать для минимизации энергии змеи. [4] Каждая итерация занимает один шаг в отрицательном градиенте точки с контролируемым размером шага. найти локальный минимум. Эту минимизацию градиентного спуска можно реализовать как

Где — это сила, действующая на змею, которая определяется отрицательным градиентом энергетического поля.

Предполагая веса и постоянны по отношению к , этот итерационный метод можно упростить до

Дискретное приближение

[ редактировать ]

На практике изображения имеют конечное разрешение и могут быть интегрированы только за конечные шаги по времени. . Таким образом, для практической реализации змей необходимо сделать дискретные приближения.

Энергетическую функцию змеи можно аппроксимировать, используя дискретные точки змеи.

Следовательно, силы змеи можно аппроксимировать как

Градиентная аппроксимация может быть выполнена с помощью любого метода конечной аппроксимации относительно s , например конечной разности .

Численная нестабильность из-за дискретного времени

[ редактировать ]

Введение дискретного времени в алгоритм может привести к обновлениям, при которых змея перемещается за пределы минимумов, к которым она привлечена; это также может вызвать колебания вокруг минимумов или привести к обнаружению других минимумов.

Этого можно избежать, настроив временной шаг таким образом, чтобы размер шага никогда не превышал пиксель из-за сил изображения. Однако в регионах с низкой энергией в обновлении будут доминировать внутренние энергии.

Альтернативно, силы изображения можно нормализовать для каждого шага так, чтобы силы изображения обновляли змею только на один пиксель. Это можно сформулировать как

где находится рядом со значением размера пикселя. Это позволяет избежать проблемы доминирования внутренней энергии, возникающей при настройке шага по времени. [5]

Численная нестабильность из-за дискретного пространства

[ редактировать ]

Энергии в непрерывном изображении могут иметь пересечение нуля, которого нет в виде пикселя изображения. В этом случае точка змеи будет колебаться между двумя пикселями, соседними с точкой пересечения нуля. Этого колебания можно избежать, используя интерполяцию между пикселями вместо ближайшего соседа. [5]

Некоторые варианты змей

[ редактировать ]

Метод змей по умолчанию имеет различные ограничения и крайние случаи, когда сходимость работает плохо. Существует несколько альтернатив, которые решают проблемы метода по умолчанию, хотя и со своими компромиссами. Некоторые из них перечислены здесь.

Модель змеи GVF

[ редактировать ]

Модель змеи градиентного векторного потока (GVF) [6] решает две проблемы со змеями:

  • плохая производительность сходимости для вогнутых границ
  • плохая производительность сходимости, когда змея инициализируется далеко от минимума

В 2D векторное поле GVF минимизирует энергетический функционал

где — управляемый сглаживающий член. Это можно решить, решив уравнения Эйлера

Эту проблему можно решить путем итерации к установившемуся значению.

Этот результат заменяет внешнюю силу по умолчанию.

Основная проблема с использованием GVF — это сглаживающий фактор. вызывает закругление краев контура. Снижение стоимости уменьшает округление, но ослабляет степень сглаживания.

Модель воздушного шара

[ редактировать ]

Модель воздушного шара [5] решает эти проблемы с помощью модели активного контура по умолчанию:

  • Змею не привлекают дальние края.
  • Змея сожмется внутрь, если на нее не будут действовать существенные образные силы.
  • змея, размер которой больше контура минимума, в конечном итоге сожмется в него, но змея меньше контура минимума не найдет минимумы и вместо этого продолжит сжиматься.

Модель воздушного шара вводит член инфляции в силы, действующие на змею.

где - нормальный унитарный вектор кривой в точке и это величина силы. должен иметь ту же величину, что и коэффициент нормализации изображения и быть меньше по стоимости, чем чтобы позволить силам на краях изображения преодолеть силу инфляции.

При использовании баллонной модели возникают три проблемы:

  • Вместо того, чтобы сжиматься, змея расширяется в минимумы и не находит контуров минимумов, меньших, чем она.
  • Внешняя сила приводит к тому, что контур становится немного больше фактического минимума. Эту проблему можно решить, уменьшив силу баллона после того, как будет найдено устойчивое решение.
  • Сила инфляции может преобладать над силами слабых краев, усугубляя проблему, когда змеи игнорируют более слабые детали изображения.

Модель диффузных змей

[ редактировать ]

Модель диффузной змеи [7] касается чувствительности змей к шуму, беспорядку и окклюзии. Он реализует модификацию функционала Мамфорда-Шаха и его мультипликационный предел и включает в себя статистические знания о форме. Функционал энергии изображения по умолчанию заменяется на

где основан на модифицированном функционале Мамфорда – Шаха

где — кусочно-гладкая модель изображения домена . Границы определяются как

где являются квадратичными базисными функциями B-сплайна и являются контрольными точками сплайнов. Модифицированный мультипликационный предел получается как и является допустимой конфигурацией .

Функционал основано на обучении по бинарным изображениям различных контуров и по силе контролируется параметром . Для гауссовского распределения векторов контрольных точек со средним вектором контрольной точки и ковариационная матрица , квадратичная энергия, соответствующая гауссовой вероятности, равна

Сила этого метода зависит от силы обучающих данных, а также настройки модифицированного функционала Мамфорда – Шаха. Разным змеям потребуются разные наборы обучающих данных и настройки.

Геометрические активные контуры

[ редактировать ]

Геометрический активный контур, или геодезический активный контур (GAC). [8] или конформные активные контуры [9] использует идеи эволюции, сокращающей евклидову кривую . Контуры разделяются и сливаются в зависимости от обнаружения объектов на изображении. Эти модели во многом основаны на наборах уровней и широко используются в вычислениях медицинских изображений .

Например, уравнение эволюции кривой градиентного спуска GAC: [8]

где — функция остановки, c — множитель Лагранжа, это кривизна, а Является ли блок внутри нормальным. Эта конкретная форма уравнения эволюции кривой зависит только от скорости в нормальном направлении. Поэтому его можно эквивалентно переписать в эйлеровой форме, вставив функцию набора уровней в него следующим образом

Это простое, но мощное преобразование набора уровней позволяет активным контурам обрабатывать изменения топологии во время эволюции кривой градиентного спуска. Это привело к огромному прогрессу в смежных областях, и использование численных методов для решения переформулировки набора уровней теперь широко известно как метод набора уровней . Хотя метод набора уровней стал довольно популярным инструментом для реализации активных контуров, Ван и Чан утверждали, что не все уравнения эволюции кривых следует решать с его помощью напрямую . [10]

Более поздние разработки в области активных контуров касаются моделирования региональных свойств, включения гибких априорных форм, полностью автоматической сегментации и т. д.

Статистические модели, сочетающие локальные и глобальные характеристики, были сформулированы Лэнктоном и Алленом Танненбаумом . [11]

Связь с разрезами графа

[ редактировать ]

Разрезы графа , или max-flow/min-cut , — это общий метод минимизации определенной формы энергии, называемой энергией марковского случайного поля (MRF). Метод разрезов графика также применялся к сегментации изображений, и иногда он превосходит метод набора уровней, когда модель представляет собой MRF или может быть аппроксимирована MRF.

См. также

[ редактировать ]
  1. ^ Jump up to: а б Касс, М.; Виткин, А .; Терзопулос, Д. (1988). «Змеи: активные контурные модели» (PDF) . Международный журнал компьютерного зрения . 1 (4): 321. CiteSeerX   10.1.1.124.5318 . дои : 10.1007/BF00133570 . S2CID   12849354 . Архивировано из оригинала (PDF) 12 января 2016 г. Проверено 29 августа 2015 г.
  2. ^ Змеи: активная модель, Рамани Пичумани, http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/RAMANI1/node31.html.
  3. ^ Доктор. Джордж Бебис, Университет Невады, http://www.cse.unr.edu/~bebis/CS791E/Notes/DeformableContours.pdf
  4. ^ Понимание изображений , Брайан С. Морс, Университет Бригама Янга, 1998–2000 гг. http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/MORSE/iu.pdf
  5. ^ Jump up to: а б с Коэн, Лоран Д. (1991). «Об активных контурных моделях и баллонах». CVGIP: Понимание изображений . 53 (2): 211–218. дои : 10.1016/1049-9660(91)90028-Н .
  6. ^ Чэньян Сюй; Принс, Дж. Л. (1997). «Градиентный векторный поток: новая внешняя сила для змей». Материалы конференции IEEE Computer Society по компьютерному зрению и распознаванию образов (PDF) . стр. 66–71. дои : 10.1109/CVPR.1997.609299 . ISBN  0-8186-7822-4 . S2CID   980797 .
  7. ^ Кремерс, Д.; Шнорр, К.; Вайкерт, Дж. (2001). «Диффузионные змеи: объединение статистических знаний о форме и информации об изображениях в вариационной структуре». Труды семинара IEEE по вариационным методам и методам набора уровней в компьютерном зрении . Том. 50. стр. 137–144. CiteSeerX   10.1.1.28.3639 . дои : 10.1109/VLSM.2001.938892 . ISBN  978-0-7695-1278-5 . S2CID   14929019 .
  8. ^ Jump up to: а б Геодезические активные контуры, В. Каселлес, Р. Киммел, Г. Сапиро http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.21.2196
  9. ^ Киченассами, Сатьянад; Кумар, Арун; Олвер, Питер; Танненбаум, Аллен; Йеззи, Энтони (1996). «Конформные потоки кривизны: от фазовых переходов к активному зрению». Архив рациональной механики и анализа . 134 (3): 275–301. Бибкод : 1996АрРМА.134..275К . дои : 10.1007/BF00379537 . S2CID   116487549 .
  10. ^ Ван, Джуньян; Чан, Кап Лук (8 июля 2014 г.). «Активный контур с тангенциальной составляющей». Журнал математического изображения и видения . 51 (2): 229–247. arXiv : 1204.6458 . дои : 10.1007/s10851-014-0519-y . ISSN   0924-9907 . S2CID   13100077 .
  11. ^ Лэнктон, С.; Танненбаум, А. (2008). «Локализация активных контуров на основе регионов» . Транзакции IEEE при обработке изображений . 17 (11): 2029–2039. Бибкод : 2008ИТИП...17.2029Л . дои : 10.1109/TIP.2008.2004611 . ПМК   2796112 . ПМИД   18854247 .
[ редактировать ]

Пример кода

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5f1fd3e3fdcea884e68dd704bdc870b7__1691010840
URL1:https://arc.ask3.ru/arc/aa/5f/b7/5f1fd3e3fdcea884e68dd704bdc870b7.html
Заголовок, (Title) документа по адресу, URL1:
Active contour model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)