Jump to content

Категоризация объектов на основе сегментации

Проблема сегментации изображения связана с разделением изображения на несколько областей в соответствии с некоторым критерием однородности. Эта статья в первую очередь посвящена теоретико-графовым подходам к сегментации изображений с применением разделения графа с помощью минимального или максимального разреза . Категоризацию объектов на основе сегментации можно рассматривать как частный случай спектральной кластеризации, применяемой к сегментации изображений.

Приложения сегментации изображений

[ редактировать ]
  • Сжатие изображения
    • Сегментируйте изображение на однородные компоненты и используйте наиболее подходящий алгоритм сжатия для каждого компонента, чтобы улучшить сжатие.
  • Медицинский диагноз
    • Автоматическая сегментация МРТ-изображений для выявления раковых областей.
  • Картирование и измерение
  • Транспорт
    • Разделение транспортной сети позволяет выделить регионы, характеризующиеся однородным состоянием движения. [1]

Сегментация с использованием нормализованных разрезов

[ редактировать ]

Теоретико-графовая формулировка

[ редактировать ]

Множество точек в произвольном пространстве признаков можно представить как взвешенный неориентированный полный граф G = (V, E), где узлами графа являются точки в пространстве признаков. Вес края является функцией сходства между узлами и . В этом контексте мы можем сформулировать проблему сегментации изображения как задачу разделения графа, которая требует разделения множества вершин , где по некоторой мере вершины любого множества имеют высокое сходство, а вершины находятся в двух разных наборах имеют низкое сходство.

Нормализованные разрезы

[ редактировать ]

Пусть G = ( V , E , w ) — взвешенный граф. Позволять и быть двумя подмножествами вершин.

Позволять:

В подходе нормализованных сокращений [2] для любого разреза в , измеряет сходство между различными частями и измеряет общее сходство вершин в одной и той же детали.

С , разрез что сводит к минимуму также максимизирует .

Вычисление разреза что сводит к минимуму является NP-трудной задачей. Однако мы можем найти за полиномиальное время разрез малого нормализованного веса с использованием спектральных методов .

Алгоритм ncut

[ редактировать ]

Позволять:

Кроме того, пусть D будет диагональная матрица с по диагонали, и пусть быть симметричная матрица с .

После некоторых алгебраических манипуляций получим:

с учетом ограничений:

  • , для некоторой константы

Минимизация с учетом вышеуказанных ограничений является NP-hard . Чтобы сделать задачу разрешимой, мы ослабим ограничения на и позвольте ему принимать реальные значения. Релаксированную проблему можно решить путем решения обобщенной проблемы собственных значений. для второго наименьшего обобщенного собственного значения.

Алгоритм разделения:

  1. Учитывая набор признаков, настройте взвешенный график , вычислите вес каждого ребра и суммируйте информацию в и .
  2. Решать для собственных векторов со вторыми по величине собственными значениями.
  3. Используйте собственный вектор со вторым наименьшим собственным значением для разделения графа на два (например, группировку по знаку).
  4. Решите, следует ли разделить текущий раздел.
  5. При необходимости рекурсивно разделите сегментированные части.

Вычислительная сложность

[ редактировать ]

Решение стандартной проблемы собственных значений для всех собственных векторов ( с использованием алгоритма QR ) требует например, время. Это непрактично для приложений сегментации изображений, где это количество пикселей в изображении.

Поскольку в необрезанном алгоритме используется только один собственный вектор, соответствующий второму наименьшему обобщенному собственному значению, эффективность может быть значительно повышена, если решение соответствующей проблемы собственных значений выполняется безматрицным способом , т. е. без явного манипулирования с помощью или даже вычисление матрицы W, как, например, в алгоритме Ланцоша . Безматричные методы требуют только функции, которая выполняет произведение матрицы на вектор для данного вектора на каждой итерации. Для сегментации изображения матрица W обычно является разреженной и содержит несколько ненулевых элементов. , поэтому такое произведение матрицы-вектора принимает время.

Для изображений с высоким разрешением второе собственное значение часто плохо обусловлено , что приводит к медленной сходимости итеративных решателей собственных значений, таких как алгоритм Ланцоша . Предварительное обуславливание является ключевой технологией, ускоряющей сходимость, например, в безматричном методе LOBPCG . Вычисление собственного вектора с использованием оптимально предварительно обусловленного безматричного метода занимает время, что является оптимальной сложностью, поскольку собственный вектор имеет компоненты.

Реализации программного обеспечения

[ редактировать ]

scikit-learn [3] использует LOBPCG из SciPy с алгебраической многосеточной предварительной обуславливанием для решения проблемы собственных значений для лапласиана графа для выполнения сегментации изображения посредством разделения спектрального графа, как впервые было предложено в [4] и фактически протестировано в [5] и. [6]

ОБЖ ВЫРЕЗАТЬ

[ редактировать ]

ОБЖ ВЫРЕЗАТЬ [7] — эффективный метод, который автоматически сегментирует объект. Метод OBJ CUT является универсальным методом и поэтому применим к любой модели категории объектов. Учитывая изображение D, содержащее экземпляр известной категории объектов, например коров, алгоритм OBJ CUT вычисляет сегментацию объекта, то есть выводит набор меток m .

Пусть m — набор двоичных меток, и пусть быть параметром формы( является формой, предшествующей этикеткам из модели многослойной графической структуры (LPS). Энергетическая функция определяется следующим образом.

(1)

Термин называется унарным членом, а термин называется парным членом. Унарный член состоит из вероятности на основе цвета и унарного потенциала в зависимости от расстояния от . Парный терм состоит из априорного и контрастный термин .

Лучшая маркировка сводит к минимуму , где вес параметра .

(2)

Алгоритм

[ редактировать ]
  1. Учитывая изображение D, выбирается категория объекта, например, коровы или лошади.
  2. Соответствующая модель LPS сопоставляется с D для получения образцов.
  3. Целевая функция, заданная уравнением (2), определяется путем вычисления и использование
  4. Целевая функция минимизируется с помощью одной операции MINCUT для получения сегментации m .

Другие подходы

[ редактировать ]
  1. ^ Лопес, Клелия; Леклерк, Людовик; Кришнакумари, Панчами; Чиабо, Николя; Ван Линт, Ганс (25 октября 2017 г.). «Выявление повседневной регулярности городских заторов с помощью 3D-карт скорости» . Научные отчеты . 7 (14029): 14029. Бибкод : 2017NatSR...714029L . дои : 10.1038/s41598-017-14237-8 . ПМЦ   5656590 . ПМИД   29070859 .
  2. ^ Цзянбо Ши и Джитендра Малик (1997): «Нормализованные разрезы и сегментация изображений», Конференция IEEE по компьютерному зрению и распознаванию образов, стр. 731–737.
  3. ^ «Спектральная кластеризация — учебная документация» .
  4. ^ Князев, Андрей Васильевич (2003). Боли; Диллон; Гоша; Коган (ред.). Современные предварительно подготовленные собственные решатели для спектральной сегментации изображений и деления графа пополам . Кластеризация больших наборов данных; Третья Международная конференция IEEE по интеллектуальному анализу данных (ICDM 2003) Мельбурн, Флорида: Компьютерное общество IEEE. стр. 59–62.
  5. ^ Князев, Андрей В. (2006). Многомасштабная сегментация спектрального изображения. Многомасштабная предварительная подготовка для вычисления собственных значений лапласианов графа при сегментации изображений . Семинар по быстрому изучению многообразий, В.М. Вильямбург, Вирджиния. дои : 10.13140/RG.2.2.35280.02565 .
  6. ^ Князев, Андрей В. (2006). Многомасштабное разбиение спектрального графа и сегментация изображений . Семинар по алгоритмам обработки современных массивных наборов данных Стэнфордского университета и Yahoo! Исследовать.
  7. ^ Член парламента Кумар, PHS Торр и А. Зиссерман. Объект вырезается. В материалах конференции IEEE по компьютерному зрению и распознаванию образов , Сан-Диего, страницы 18–25, 2005 г.
  8. ^ Э. Боренштейн, С. Ульман: Классовая сегментация сверху вниз . В материалах 7-й Европейской конференции по компьютерному зрению, Копенгаген, Дания, страницы 109–124, 2002 г.
  9. ^ З. Ту, X. Чен, А. Л. Юйл, С. К. Чжу: Анализ изображений: объединение сегментации, обнаружения и распознавания . На пути к распознаванию объектов на уровне категорий, 2006 г.: 545–576.
  10. ^ Б. Лейбе, А. Леонардис, Б. Шиле: неявная модель формы для комбинированной категоризации и сегментации объектов . На пути к распознаванию объектов на уровне категорий, 2006 г.: 508–524.
  11. ^ Дж. Винн, Н. Йойич. Локус: изучение классов объектов с неконтролируемой сегментацией . В материалах Международной конференции IEEE по компьютерному зрению, Пекин, 2005 г.
  12. ^ Дж. М. Винн, Дж. Шоттон: Согласованное по макету случайное поле для распознавания и сегментации частично закрытых объектов . ЦВПР (1) 2006: 37–44.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4c263aac50709309198a79ff439df4f1__1704718980
URL1:https://arc.ask3.ru/arc/aa/4c/f1/4c263aac50709309198a79ff439df4f1.html
Заголовок, (Title) документа по адресу, URL1:
Segmentation-based object categorization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)