Масштабно-пространственная сегментация
Сегментация масштабного пространства или многомасштабная сегментация — это общая основа сегментации сигналов и изображений, основанная на вычислении дескрипторов изображения при нескольких масштабах сглаживания.
Одномерная иерархическая сегментация сигнала
[ редактировать ]Основополагающая работа Уиткина в масштабном пространстве [ 1 ] включало идею о том, что одномерный сигнал может быть однозначно сегментирован на области с одним параметром масштаба, управляющим масштабом сегментации.
Ключевое наблюдение заключается в том, что пересечения нуля вторых производных (которые являются минимумами и максимумами первой производной или наклона) многомасштабно сглаженных версий сигнала образуют дерево вложенности, которое определяет иерархические отношения между сегментами в разных масштабах. . В частности, экстремумы наклонов в крупных масштабах можно проследить до соответствующих характеристик в мелких масштабах. Когда максимум и минимум наклона аннигилируют друг друга в большем масштабе, три сегмента, которые они разделили, сливаются в один сегмент, определяя тем самым иерархию сегментов.
Сегментация изображения и первичный эскиз
[ редактировать ]В этой области было проведено множество исследовательских работ, некоторые из которых сейчас достигли состояния, когда их можно применять либо с помощью интерактивного ручного вмешательства (обычно с применением к медицинской визуализации ), либо полностью автоматически. Ниже приводится краткий обзор некоторых основных исследовательских идей, на которых основаны современные подходы.
Однако описанная Уиткином структура вложенности специфична для одномерных сигналов и не переносится тривиально на многомерные изображения. Тем не менее, эта общая идея вдохновила нескольких других авторов на исследование схем сегментации изображений от грубого до мелкого. Кендеринк [ 2 ] предложил изучить, как контуры изоинтенсивности развиваются в масштабах, и этот подход был более подробно исследован Лифшицем и Пайзером. [ 3 ] Однако, к сожалению, интенсивность элементов изображения меняется в зависимости от масштаба, а это означает, что трудно проследить элементы изображения грубого масштаба до более мелких масштабов, используя информацию об изоинтенсивности.
Линдеберг [ 4 ] изучил проблему связи локальных экстремумов и седловых точек в масштабах и предложил представление изображения, называемое первичным эскизом масштабного пространства , которое ясно показывает отношения между структурами в разных масштабах, а также показывает, какие функции изображения стабильны в больших диапазонах масштаба. включая соответствующие местные шкалы. Бергхольм [ 5 ] предложено обнаруживать края в крупных масштабах в масштабном пространстве, а затем отслеживать их обратно до более мелких масштабов с ручным выбором как грубого масштаба обнаружения, так и мелкого масштаба локализации.
Гауч и Пайзер [ 6 ] изучил взаимодополняющую проблему хребтов и долин в различных масштабах и разработал инструмент для интерактивной сегментации изображений на основе многомасштабных водоразделов . Использование многомасштабного водораздела с применением к карте градиента также исследовалось Олсеном и Нильсеном. [ 7 ] и был перенесен в клиническое использование Dam et al. [ 8 ] Винкен и др. [ 9 ] предложил гиперстек для определения вероятностных отношений между структурами изображений в разных масштабах. Использование стабильных структур изображения в масштабах было продолжено Ахуджей и его коллегами. [ 10 ] [ 11 ] в полностью автоматизированную систему. Полностью автоматический алгоритм сегментации мозга, основанный на тесно связанных идеях многомасштабных водоразделов, был представлен Ундеманом и Линдебергом. [ 12 ] и был тщательно протестирован в базах данных мозга.
Эти идеи многомасштабной сегментации изображений путем связывания структур изображения по масштабам также были подхвачены Флораком и Куйпером. [ 13 ] Бижауи и Рюэ [ 14 ] связывать структуры, обнаруженные в масштабном пространстве выше минимального шумового порога, в дерево объектов, которое охватывает несколько масштабов и соответствует своего рода признаку исходного сигнала. Извлеченные признаки точно реконструируются с использованием итерационного метода матрицы сопряженных градиентов.
Сегментация векторных функций времени
[ редактировать ]Сегментация масштабно-пространственного пространства была расширена Лионом в другом направлении. [ 15 ] к векторным функциям времени, где векторная производная не имеет максимумов и минимумов, а вторая производная не имеет переходов через нуль, путем помещения границ сегментов вместо максимумов евклидовой величины векторной производной сглаженных векторных сигналов. Этот метод был применен для сегментации речи и текста. [ 16 ]
Ссылки
[ редактировать ]- ^ Виткин, А. (1984). «Фильтрация в масштабном пространстве: новый подход к многомасштабному описанию» (PDF) . ИКАССП '84. Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 9. С. 150–153. дои : 10.1109/ICASSP.1984.1172729 . S2CID 11755124 . Архивировано из оригинала (PDF) 1 августа 2019 г. Проверено 1 августа 2019 г.
- ^ Кендеринк, Ян « Структура изображений », Биологическая кибернетика, 50:363–370, 1984.
- ^ Лифшиц, Л.М.; Пайзер, С.М. (1990). «Иерархический подход с несколькими разрешениями к сегментации изображений на основе экстремумов интенсивности» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 12 (6): 529–540. дои : 10.1109/34.56189 .
- ^ Линдеберг, Тони (1993). «Обнаружение заметных каплевидных структур изображения и их масштабов с помощью первичного эскиза в масштабном пространстве: метод фокусировки внимания» . Международный журнал компьютерного зрения . 11 (3): 283–318. дои : 10.1007/BF01469346 . S2CID 11998035 .
- ^ Бергхольм, Ф. (1987). «Фокусировка по краям» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 9 (6): 726–741. дои : 10.1109/tpami.1987.4767980 . ПМИД 21869435 . S2CID 18352198 .
- ^ Гауч, Дж. М.; Пайзер, С.М. (1993). «Множественный анализ хребтов и долин на изображениях в оттенках серого» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 15 (6): 635–646. дои : 10.1109/34.216734 .
- ^ Олсен, Оле Фог; Нильсен, Мэдс (1997). «Сегментация водораздела по величине многомасштабного градиента» (PDF) . Анализ и обработка изображений . Конспекты лекций по информатике. Том. 1310. стр. 6–13. дои : 10.1007/3-540-63507-6_178 . ISBN 978-3-540-63507-9 .
- ^ Дам, Э., Йохансен, П., Олсен, О. Томсен, А. Дарванн, Т., Добженик, А., Германн, Н., Китай, Н., Крейборг, С., Ларсен, П., Нильсен, М.: «Интерактивная многомасштабная сегментация в клиническом использовании» на Европейском конгрессе радиологии, 2000 г.
- ^ Винкен, КЛ; Костер, ASE; Виргевер, Массачусетс (1997). «Вероятностная многомасштабная сегментация изображений». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 19 (2): 109–120. дои : 10.1109/34.574787 .
- ^ Табб, М.; Ахуджа, Н. (1997). «Многомасштабная сегментация изображений с помощью встроенного обнаружения краев и областей» . Транзакции IEEE при обработке изображений . 6 (5): 642–655. Бибкод : 1997ITIP....6..642T . дои : 10.1109/83.568922 . ПМИД 18282958 .
- ^ Акбас, Эмре; Ахуджа, Нарендра (2010). «От разрывов рампы к дереву сегментации» . Компьютерное зрение – ACCV 2009 . Конспекты лекций по информатике. Том. 5994. стр. 123–134. дои : 10.1007/978-3-642-12307-8_12 . ISBN 978-3-642-12306-1 .
- ^ Ундеман, Карл; Линдеберг, Тони (2003). «Полностью автоматическая сегментация МРТ-изображений мозга с использованием вероятностной анизотропной диффузии и многомасштабных водоразделов». Методы масштабного пространства в компьютерном зрении . Конспекты лекций по информатике. Том. 2695. стр. 641–656. дои : 10.1007/3-540-44935-3_45 . ISBN 978-3-540-40368-5 .
- ^ Флорак, LMJ; Куйпер, А. (2000). «Топологическая структура масштабно-пространственных изображений» (PDF) . Журнал математического изображения и видения . 12 (1): 65–79. дои : 10.1023/А:1008304909717 . HDL : 1874/18929 . S2CID 7515494 .
- ^ Бижауи, Альберт; Рю, Фредерик (1995). «Многомасштабная модель видения, адаптированная к астрономическим изображениям» . Обработка сигналов . 46 (3): 345–362. дои : 10.1016/0165-1684(95)00093-4 .
- ^ Ричард Ф. Лайон. «Распознавание речи в масштабном пространстве», Учеб. 1987 года ICASSP. Сан-Диего, март, стр. 29.3.14, 1987 г.
- ^ «Слейни, М. Понселеон, Д., «Иерархическая сегментация с использованием скрытой семантической индексации в масштабном пространстве», Proc. Intl. Conf. on Acoustics, Speech and Signal Processing (ICASSP '01) 2001» (PDF) . Архивировано из оригинала (PDF) 19 сентября 2006 г. Проверено 1 ноября 2006 г.