Jump to content

Максимально устойчивые экстремальные области

В компьютерном зрении техника максимально стабильных экстремальных областей ( MSER ) ​​используется как метод обнаружения пятен на изображениях. Этот метод был предложен Matas et al. [1] найти соответствия между элементами изображения, взятыми из двух изображений с разных точек зрения. Этот метод извлечения полного количества соответствующих элементов изображения способствует сопоставлению с широкой базой и привел к улучшению стереосопоставления и распознавания объектов алгоритмов .

Термины и определения

[ редактировать ]

Изображение это отображение . Экстремальные области хорошо выделяются на изображениях, если:

  1. полностью упорядочен (полные, антисимметричные и транзитивные бинарные отношения существовать).
  2. Отношение смежности определяется. Обозначим, что две точки смежны как .

Область представляет собой непрерывное (то есть связанное) подмножество . (Для каждого есть последовательность такой как .) Обратите внимание, что согласно этому определению область может содержать «дырки» (например, кольцеобразная область соединена, но ее внутренняя окружность не является частью ).

(Внешняя) граница региона , что означает границу из это набор пикселей, смежных хотя бы с одним пикселем но не принадлежащий . Опять же, в случае регионов с «дырками» граница региона не обязательно должна быть связана подмножеством (у кольца есть внутренняя и внешняя границы, которые не пересекаются).

Экстремальный регион регион такой, что либо для всех (область максимальной интенсивности) или для всех (область минимальной интенсивности). Насколько полностью упорядочен, мы можем переформулировать эти условия как для области максимальной интенсивности и для области минимальной интенсивности соответственно. В этой форме мы можем использовать понятие порогового значения интенсивности, разделяющего область и ее границу.

Максимально устойчивая экстремальная область Пусть экстремальная область, такая как все точки в ней, имеют интенсивность меньше, чем . Примечание за все позитивное . Экстремальный регион максимально устойчив тогда и только тогда, когда имеет локальный минимум в . (Здесь обозначает мощность). здесь параметр метода.

Уравнение проверяет регионы, которые остаются стабильными в течение определенного количества порогов. Если регион не значительно больше региона , регион принимается как максимально устойчивая область.

Более просто эту концепцию можно объяснить с помощью порогового значения . Все пиксели ниже заданного порога являются «черными», а все пиксели выше или равные — «белыми». Учитывая исходное изображение, если последовательность пороговых изображений результатов генерируется, где каждое изображение соответствует увеличению порога t, сначала будет видно белое изображение, затем появятся «черные» пятна, соответствующие локальным минимумам интенсивности, а затем они станут больше. Максимально стабильная экстремальная область обнаруживается, когда размер одной из этих черных областей такой же (или почти такой же), как на предыдущем изображении.

Эти «черные» пятна со временем сольются, пока все изображение не станет черным. Множество всех компонент связности последовательности — это множество всех экстремальных областей. В этом смысле понятие MSER связано с понятием дерева компонентов изображения. [2] Дерево компонентов действительно обеспечивает простой способ реализации MSER. [3]


Экстремальные регионы

[ редактировать ]

Экстремальные области в этом контексте обладают двумя важными свойствами: множество замкнуто относительно...

  1. непрерывное преобразование координат изображения. Это означает, что он аффинно-инвариантен, и не имеет значения, искажено или искажено изображение.
  2. монотонное преобразование интенсивностей изображения. Этот подход, конечно, чувствителен к эффектам естественного освещения, таким как изменение дневного света или движущиеся тени.

Преимущества МСЭР

[ редактировать ]

Поскольку регионы определяются исключительно функцией интенсивности в регионе и на внешней границе, это приводит к появлению многих ключевых характеристик регионов, которые делают их полезными. В широком диапазоне пороговых значений локальная бинаризация стабильна в определенных регионах и имеет свойства, перечисленные ниже.

  • Инвариантность к аффинному преобразованию интенсивностей изображений.
  • сохраняющему смежность (непрерывному) Ковариация к преобразованию, в области изображений
  • Стабильность : выбираются только регионы, поддержка которых практически одинакова в диапазоне пороговых значений.
  • Многомасштабное обнаружение без какого-либо сглаживания, обнаруживается как мелкая, так и крупная структура.
    Однако обратите внимание, что обнаружение MSER в пирамиде масштаба улучшает повторяемость и количество соответствий при изменении масштаба. [4]
  • Множество всех экстремальных регионов можно перечислить в худшем случае. , где это количество пикселей в изображении. [5]

Сравнение с другими детекторами регионов

[ редактировать ]

Миколайчик и др., [6] изучаются шесть детекторов областей ( аффинные по Харрису , аффинные по Гессиану , MSER, области на основе краев, экстремумы интенсивности и заметные области ). Ниже приводится сводная информация о производительности MSER по сравнению с остальными пятью.

  • Плотность регионов – по сравнению с другими MSER предлагает наибольшее разнообразие, обнаруживая около 2600 регионов для сцены с текстурированным размытием и 230 для сцены с измененным светом, и разнообразие обычно считается хорошим. Также MSER имел повторяемость этого теста 92%.
  • Размер региона . MSER имел тенденцию обнаруживать множество небольших областей по сравнению с большими областями, которые с большей вероятностью были закрыты или не покрывали плоскую часть сцены. Хотя крупные регионы может быть немного легче сопоставить.
  • Изменение точки обзора — MSER превосходит пять других детекторов областей как на исходных изображениях, так и на изображениях с повторяющимися текстурными мотивами.
  • Изменение масштаба . После гессиано-аффинного детектора MSER занимает второе место по изменению масштаба и вращению в плоскости.
  • Размытие — MSER оказался наиболее чувствительным к такому типу изменения изображения, это единственная область, в которой этот тип обнаружения отсутствует.
    Однако обратите внимание, что в этой оценке не использовалось обнаружение с несколькими разрешениями, которое, как было показано, улучшает повторяемость при размытии. [4]
  • Изменение освещения – MSER показал самый высокий показатель повторяемости для этого типа сцены, при этом все остальные также имели хорошую надежность.

MSER неизменно получал самые высокие оценки во многих тестах, доказывая, что он является надежным детектором областей. [6]

Выполнение

[ редактировать ]

Оригинальный алгоритм Мэтаса и др. [1] является в номере пикселей. Сначала происходит сортировка пикселей по интенсивности. Это потребует время, используя BINSORT . После сортировки на изображении размечаются пиксели, а список растущих и сливающихся связанных компонентов и их площадей поддерживается с помощью алгоритма объединения-поиска . Это потребует время. На практике эти шаги выполняются очень быстро. В ходе этого процесса площадь каждого подключенного компонента в зависимости от интенсивности сохраняется, образуя структуру данных. Слияние двух компонентов рассматривается как прекращение существования меньшего компонента и вставка всех пикселей меньшего компонента в больший. В экстремальных областях «максимально стабильными» являются те, которые соответствуют порогам, где относительное изменение площади как функция относительного изменения порога находится на локальном минимуме, т.е. MSER — это части изображения, где локальная бинаризация стабильна в течение большой диапазон порогов. [1] [6]

Дерево компонентов представляет собой совокупность всех связных компонентов порогов изображения, упорядоченных по включению. Эффективные (квазилинейные, независимо от диапазона весов) алгоритмы его вычисления существуют. [2] Таким образом, эта структура предлагает простой способ реализации MSER. [3]

Совсем недавно Нистер и Стевениус предложили действительно (если веса являются небольшими целыми числами) наихудший случай. метод в, [5] что также намного быстрее на практике. Этот алгоритм аналогичен алгоритму Ф. Салембье и др. [7]

Надежный алгоритм с широкой базой

[ редактировать ]

Целью этого алгоритма является сопоставление MSER для установления точек соответствия между изображениями. Первые области MSER вычисляются на изображении интенсивности (MSER+) и на инвертированном изображении (MSER-). Области измерения выбираются в нескольких масштабах: размер фактической области, выпуклая оболочка области в масштабе 1,5x, 2x и 3x. Сопоставление выполняется надежным образом, поэтому лучше повысить различимость больших регионов, не подвергаясь серьезному влиянию беспорядка или непланарности прообраза региона. Измерение, выполненное на почти плоском участке сцены со стабильным инвариантным описанием, называется «хорошим измерением». Нестабильные измерения или измерения на неплоских поверхностях или разрывах называются «испорченными измерениями». Робастное подобие вычисляется:Для каждого по региону регионы из другого изображения с соответствующим i-м измерением ближайший к найдены и проводится голосование, предполагающее соответствие A и каждого из . Голоса суммируются по всем измерениям, и с помощью вероятностного анализа можно выбрать «хорошие измерения», поскольку «некорректные измерения», скорее всего, распределят свои голоса случайным образом. Применяя RANSAC к центрам тяжести регионов, грубую эпиполярную геометрию можно вычислить . Вычисляется аффинное преобразование между парами потенциально соответствующих областей, и соответствия определяют его с точностью до поворота, который затем определяется эпиполярными линиями. Затем регионы фильтруются и выбираются те, у которых корреляция преобразованных изображений превышает пороговое значение. RANSAC применяется снова с более узким порогом, а окончательная эпиполярная геометрия оценивается с помощью восьмиточечного алгоритма .

Этот алгоритм можно протестировать здесь (соответствия с ограничениями по эпиполярной или гомографической геометрии): WBS Image Matcher

Использование при обнаружении текста

[ редактировать ]

Алгоритм MSER использовался Ченом для обнаружения текста путем объединения MSER с краями Canny . Осторожные края используются, чтобы помочь справиться с слабостью MSER к размытию. MSER сначала применяется к рассматриваемому изображению для определения областей символов. Для улучшения областей MSER все пиксели за пределами границ, образованных краями Кэнни, удаляются. Разделение последних по краям значительно повышает удобство использования MSER при извлечении размытого текста. [8]

Альтернативным использованием MSER для обнаружения текста является работа Ши с использованием графовой модели. Этот метод снова применяет MSER к изображению для создания предварительных областей. Затем они используются для построения графовой модели на основе позиционного расстояния и цветового расстояния между каждым MSER, который рассматривается как узел. Затем узлы разделяются на передний план и фон с помощью функций стоимости. Одна функция стоимости состоит в том, чтобы связать расстояние от узла до переднего и заднего планов. Другой наказывает узлы за существенное отличие от своего соседа. Когда они свернуты, граф разрезается , чтобы отделить текстовые узлы от нетекстовых узлов. [9]

Чтобы обеспечить обнаружение текста в общей сцене, Нейманн использует алгоритм MSER в различных проекциях. В дополнение к проекции интенсивности оттенков серого он использует каналы красного, синего и зеленого цветов для обнаружения текстовых областей, которые различаются по цвету, но не обязательно различаются по интенсивности оттенков серого. Этот метод позволяет обнаруживать больше текста, чем просто использование функций MSER+ и MSER-, описанных выше. [10]

Расширения и адаптации

[ редактировать ]
  • Алгоритм MSER был адаптирован для цветных изображений путем замены пороговой функции интенсивности на агломеративную кластеризацию на основе цветовых градиентов. [11]
  • Алгоритм MSER можно использовать для обнаружения областей на основе цвета, а не интенсивности. Это сделано Чавесом путем создания функции интенсивности для красного, зеленого и синего цвета в цветовом пространстве HSV . Затем алгоритм MSER запускается пять раз; по трем псевдоинтенсивностям цветов, а затем по интенсивностям серой шкалы с использованием стандартных функций MSER+ и MSER-. [12]
  • Алгоритм MSER можно использовать для отслеживания цветных объектов, выполняя обнаружение MSER на расстоянии Махаланобиса до распределения цвета. [3]
  • Обнаружив MSER в нескольких разрешениях, можно повысить устойчивость к размытию и изменению масштаба. [4]

Другие приложения

[ редактировать ]

См. также

[ редактировать ]
[ редактировать ]
  • VLFeat , библиотека компьютерного зрения с открытым исходным кодом на языке C MEX- интерфейсом для MATLAB ), включая реализацию MSER.
  • OpenCV , библиотека компьютерного зрения с открытым исходным кодом на C/ C++ , включая реализацию Linear Time MSER.
  • Исследование повторяемости детектора , Кристиан Миколайчик Двоичные файлы (Win/Linux для вычисления MSER/HarrisAffine.... Двоичные файлы, использованные в его исследовании повторяемости.
  • Реализация MSER с линейным временем , Шарль Дюбу, реализация MSER на C++ в качестве детектора больших двоичных объектов
  1. ^ Jump up to: а б с Дж. Мэйтас, О. Чам, М. Урбан и Т. Пайдла. «Надежное стерео с широкой базовой линией из максимально стабильных экстремальных регионов». Учеб. Британской конференции по машинному зрению, стр. 384–396, 2002 г.
  2. ^ Jump up to: а б Л. Наджман и М. Купри: «Построение дерева компонентов за квазилинейное время». Архивировано 9 апреля 2011 г. в Wayback Machine ; Транзакции IEEE по обработке изображений, том 15, номера 11, 2006 г., стр. 3531-3539
  3. ^ Jump up to: а б с Доносер М. и Бишоф Х. Эффективное отслеживание максимально стабильной экстремальной области (MSER) ​​CVPR , 2006.
  4. ^ Jump up to: а б с Форссен, ЧП. и Лоу, генеральный директор «Дескрипторы формы для максимально стабильных экстремальных областей». Архивировано 10 июня 2011 г. в Wayback Machine ICCV, 2007.
  5. ^ Jump up to: а б Нистер Д. и Стевениус Х., «Максимально стабильные экстремальные области с линейным временем» , ECCV, 2008.
  6. ^ Jump up to: а б с К. Миколайчик, Т. Туителаарс, К. Шмид, А. Зиссерман, Т. Кадир и Л. Ван Гул: «Сравнение детекторов аффинных областей» ; Международный журнал компьютерного зрения, том 65, номера 1–2 / ноябрь 2005 г., стр. 43–72.
  7. ^ Салембье, Филипп; А. Оливерас; Л. Гарридо (1998). «Антирасширенные связные операторы для обработки изображений и последовательностей» . Транзакции IEEE при обработке изображений . 7 (4): 555–570. Бибкод : 1998ITIP....7..555S . дои : 10.1109/83.663500 . hdl : 2117/90134 . ПМИД   18276273 . Архивировано из оригинала 25 апреля 2012 г. Проверено 17 ноября 2011 г.
  8. ^ Чен, Хуэйчжун; Цай, Сэм; Шрот, Георг; Чен, Дэвид; Гжещук, Радек; Жирод, Бернд . «Надежное обнаружение текста в естественных изображениях с максимально стабильными экстремальными областями с улучшенными краями» . Учеб. Международная конференция IEEE по обработке изображений 2011 .
  9. ^ Ши, Цунчжао; Ван, Чунхэн; Сяо, Байхуа; Гао, Сун (15 января 2013 г.). «Обнаружение текста сцены с использованием графовой модели, построенной на максимально стабильных экстремальных областях». Буквы для распознавания образов . 34 (2): 107–116. Бибкод : 2013PaReL..34..107S . дои : 10.1016/j.patrec.2012.09.019 .
  10. ^ Нойманн, Лукас; Матас, Иржи (2011). «Метод локализации и распознавания текста на изображениях реального мира». Accv 2010 : 770–783.
  11. ^ Форссен, ЧП. Максимально стабильные цветовые области для распознавания и сопоставления. Архивировано 10 июня 2011 г. в Wayback Machine , CVPR, 2007 г.
  12. ^ Чавес, Аарон; Густафсон, Дэвид (2011). «Цветовые расширения MSER». ИСВК 2011г . Конспекты лекций по информатике. 6939 : 358–366. дои : 10.1007/978-3-642-24031-7_36 . ISBN  978-3-642-24030-0 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8078c91f37cbdf1ae450a721994f2d24__1721655240
URL1:https://arc.ask3.ru/arc/aa/80/24/8078c91f37cbdf1ae450a721994f2d24.html
Заголовок, (Title) документа по адресу, URL1:
Maximally stable extremal regions - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)