Категоризация объектов на основе сегментации
Проблема сегментации изображения связана с разделением изображения на несколько областей в соответствии с некоторым критерием однородности. Эта статья в первую очередь посвящена теоретико-графовым подходам к сегментации изображений с применением разделения графа с помощью минимального или максимального разреза . Категоризацию объектов на основе сегментации можно рассматривать как частный случай спектральной кластеризации, применяемой к сегментации изображений.
Приложения сегментации изображений
[ редактировать ]- Сжатие изображения
- Сегментируйте изображение на однородные компоненты и используйте наиболее подходящий алгоритм сжатия для каждого компонента, чтобы улучшить сжатие.
- Медицинский диагноз
- Автоматическая сегментация МРТ-изображений для выявления раковых областей.
- Картирование и измерение
- Автоматический анализ данных дистанционного зондирования со спутников для выявления и измерения областей интереса.
- Транспорт
- Разделение транспортной сети позволяет выделить регионы, характеризующиеся однородным состоянием движения. [1]
Сегментация с использованием нормализованных разрезов
[ редактировать ]Теоретико-графовая формулировка
[ редактировать ]Множество точек в произвольном пространстве признаков можно представить как взвешенный неориентированный полный граф G = (V, E), где узлами графа являются точки в пространстве признаков. Вес края является функцией сходства между узлами и . В этом контексте мы можем сформулировать проблему сегментации изображения как задачу разделения графа, которая требует разделения множества вершин , где по некоторой мере вершины любого множества имеют высокое сходство, а вершины находятся в двух разных наборах имеют низкое сходство.
Нормализованные разрезы
[ редактировать ]Пусть G = ( V , E , w ) — взвешенный граф. Позволять и быть двумя подмножествами вершин.
Позволять:
В подходе нормализованных сокращений [2] для любого разреза в , измеряет сходство между различными частями и измеряет общее сходство вершин в одной и той же детали.
С , разрез что сводит к минимуму также максимизирует .
Вычисление разреза что сводит к минимуму является NP-трудной задачей. Однако мы можем найти за полиномиальное время разрез малого нормализованного веса с использованием спектральных методов .
Алгоритм ncut
[ редактировать ]Позволять:
Кроме того, пусть D будет диагональная матрица с по диагонали, и пусть быть симметричная матрица с .
После некоторых алгебраических манипуляций получим:
с учетом ограничений:
- , для некоторой константы
Минимизация с учетом вышеуказанных ограничений является NP-hard . Чтобы сделать задачу разрешимой, мы ослабим ограничения на и позвольте ему принимать реальные значения. Релаксированную проблему можно решить путем решения обобщенной проблемы собственных значений. для второго наименьшего обобщенного собственного значения.
Алгоритм разделения:
- Учитывая набор признаков, настройте взвешенный график , вычислите вес каждого ребра и суммируйте информацию в и .
- Решать для собственных векторов со вторыми по величине собственными значениями.
- Используйте собственный вектор со вторым наименьшим собственным значением для разделения графа на два (например, группировку по знаку).
- Решите, следует ли разделить текущий раздел.
- При необходимости рекурсивно разделите сегментированные части.
Вычислительная сложность
[ редактировать ]Решение стандартной проблемы собственных значений для всех собственных векторов ( с использованием алгоритма QR ) требует например, время. Это непрактично для приложений сегментации изображений, где это количество пикселей в изображении.
Поскольку в необрезанном алгоритме используется только один собственный вектор, соответствующий второму наименьшему обобщенному собственному значению, эффективность может быть значительно повышена, если решение соответствующей проблемы собственных значений выполняется безматрицным способом , т. е. без явного манипулирования с помощью или даже вычисление матрицы W, как, например, в алгоритме Ланцоша . Безматричные методы требуют только функции, которая выполняет произведение матрицы на вектор для данного вектора на каждой итерации. Для сегментации изображения матрица W обычно является разреженной и содержит несколько ненулевых элементов. , поэтому такое произведение матрицы-вектора принимает время.
Для изображений с высоким разрешением второе собственное значение часто плохо обусловлено , что приводит к медленной сходимости итеративных решателей собственных значений, таких как алгоритм Ланцоша . Предварительное обуславливание является ключевой технологией, ускоряющей сходимость, например, в безматричном методе LOBPCG . Вычисление собственного вектора с использованием оптимально предварительно обусловленного безматричного метода занимает время, что является оптимальной сложностью, поскольку собственный вектор имеет компоненты.
Реализации программного обеспечения
[ редактировать ]scikit-learn [3] использует LOBPCG из SciPy с алгебраической многосеточной предварительной обуславливанием для решения проблемы собственных значений для лапласиана графа для выполнения сегментации изображения посредством разделения спектрального графа, как впервые было предложено в [4] и фактически протестировано в [5] и. [6]
ОБЖ ВЫРЕЗАТЬ
[ редактировать ]ОБЖ ВЫРЕЗАТЬ [7] — эффективный метод, который автоматически сегментирует объект. Метод OBJ CUT является универсальным методом и поэтому применим к любой модели категории объектов. Учитывая изображение D, содержащее экземпляр известной категории объектов, например коров, алгоритм OBJ CUT вычисляет сегментацию объекта, то есть выводит набор меток m .
Пусть m — набор двоичных меток, и пусть быть параметром формы( является формой, предшествующей этикеткам из модели многослойной графической структуры (LPS). Энергетическая функция определяется следующим образом.
- (1)
Термин называется унарным членом, а термин называется парным членом. Унарный член состоит из вероятности на основе цвета и унарного потенциала в зависимости от расстояния от . Парный терм состоит из априорного и контрастный термин .
Лучшая маркировка сводит к минимуму , где вес параметра .
- (2)
Алгоритм
[ редактировать ]- Учитывая изображение D, выбирается категория объекта, например, коровы или лошади.
- Соответствующая модель LPS сопоставляется с D для получения образцов.
- Целевая функция, заданная уравнением (2), определяется путем вычисления и использование
- Целевая функция минимизируется с помощью одной операции MINCUT для получения сегментации m .
Другие подходы
[ редактировать ]- Головоломный подход [8]
- Разбор изображений [9]
- Чередованная сегментация [10]
- ЛОКУС [11]
- МакетCRF [12]
- Сегментация на основе минимального связующего дерева
Ссылки
[ редактировать ]- ^ Лопес, Клелия; Леклерк, Людовик; Кришнакумари, Панчами; Чиабо, Николя; Ван Линт, Ганс (25 октября 2017 г.). «Выявление повседневной регулярности городских заторов с помощью 3D-карт скорости» . Научные отчеты . 7 (14029): 14029. Бибкод : 2017NatSR...714029L . дои : 10.1038/s41598-017-14237-8 . ПМЦ 5656590 . ПМИД 29070859 .
- ^ Цзянбо Ши и Джитендра Малик (1997): «Нормализованные разрезы и сегментация изображений», Конференция IEEE по компьютерному зрению и распознаванию образов, стр. 731–737.
- ^ «Спектральная кластеризация — учебная документация» .
- ^ Князев, Андрей Васильевич (2003). Боли; Диллон; Гоша; Коган (ред.). Современные предварительно подготовленные собственные решатели для спектральной сегментации изображений и деления графа пополам . Кластеризация больших наборов данных; Третья Международная конференция IEEE по интеллектуальному анализу данных (ICDM 2003) Мельбурн, Флорида: Компьютерное общество IEEE. стр. 59–62.
- ^ Князев, Андрей В. (2006). Многомасштабная сегментация спектрального изображения. Многомасштабная предварительная подготовка для вычисления собственных значений лапласианов графа при сегментации изображений . Семинар по быстрому изучению многообразий, В.М. Вильямбург, Вирджиния. дои : 10.13140/RG.2.2.35280.02565 .
- ^ Князев, Андрей В. (2006). Многомасштабное разбиение спектрального графа и сегментация изображений . Семинар по алгоритмам обработки современных массивных наборов данных Стэнфордского университета и Yahoo! Исследовать.
- ^ Член парламента Кумар, PHS Торр и А. Зиссерман. Объект вырезается. В материалах конференции IEEE по компьютерному зрению и распознаванию образов , Сан-Диего, страницы 18–25, 2005 г.
- ^ Э. Боренштейн, С. Ульман: Классовая сегментация сверху вниз . В материалах 7-й Европейской конференции по компьютерному зрению, Копенгаген, Дания, страницы 109–124, 2002 г.
- ^ З. Ту, X. Чен, А. Л. Юйл, С. К. Чжу: Анализ изображений: объединение сегментации, обнаружения и распознавания . На пути к распознаванию объектов на уровне категорий, 2006 г.: 545–576.
- ^ Б. Лейбе, А. Леонардис, Б. Шиле: неявная модель формы для комбинированной категоризации и сегментации объектов . На пути к распознаванию объектов на уровне категорий, 2006 г.: 508–524.
- ^ Дж. Винн, Н. Йойич. Локус: изучение классов объектов с неконтролируемой сегментацией . В материалах Международной конференции IEEE по компьютерному зрению, Пекин, 2005 г.
- ^ Дж. М. Винн, Дж. Шоттон: Согласованное по макету случайное поле для распознавания и сегментации частично закрытых объектов . ЦВПР (1) 2006: 37–44.