Jump to content

Масштабно-пространственная сегментация

Масштабировать пространство
Аксиомы масштабного пространства
Масштабирование пространственной реализации
Обнаружение функций
Обнаружение края
Обнаружение больших двоичных объектов
Обнаружение угла
Обнаружение гребней
Обнаружение точек интереса
Выбор масштаба
Аффинная адаптация формы
Масштабно-пространственная сегментация
Одномерный пример сегментации масштаба и пространства. Сигнал (черный), его сглаженные версии с несколькими масштабами (красный) и средние значения сегмента (синий) на основе сегментации в масштабном пространстве.
Дендрограмма , соответствующая сегментациям на рисунке выше. Каждый «×» идентифицирует положение экстремума первой производной одной из 15 сглаженных версий сигнала (красный для максимумов, синий для минимумов). Каждый «+» идентифицирует положение, к которому возвращается экстремум в самом точном масштабе. Характеристики сигнала, которые сохраняются до самого высокого масштаба (самая гладкая версия), очевидны в виде высоких структур, соответствующих границам основных сегментов на рисунке выше.

Сегментация масштабного пространства или многомасштабная сегментация — это общая основа сегментации сигналов и изображений, основанная на вычислении дескрипторов изображения при нескольких масштабах сглаживания.

Одномерная иерархическая сегментация сигнала

[ редактировать ]

Основополагающая работа Уиткина в масштабном пространстве [ 1 ] включало идею о том, что одномерный сигнал может быть однозначно сегментирован на области с одним параметром масштаба, управляющим масштабом сегментации.

Ключевое наблюдение заключается в том, что пересечения нуля вторых производных (которые являются минимумами и максимумами первой производной или наклона) многомасштабно сглаженных версий сигнала образуют дерево вложенности, которое определяет иерархические отношения между сегментами в разных масштабах. . В частности, экстремумы наклонов в крупных масштабах можно проследить до соответствующих характеристик в мелких масштабах. Когда максимум и минимум наклона аннигилируют друг друга в большем масштабе, три сегмента, которые они разделили, сливаются в один сегмент, определяя тем самым иерархию сегментов.

Сегментация изображения и первичный эскиз

[ редактировать ]

В этой области было проведено множество исследовательских работ, некоторые из которых сейчас достигли состояния, когда их можно применять либо с помощью интерактивного ручного вмешательства (обычно с применением к медицинской визуализации ), либо полностью автоматически. Ниже приводится краткий обзор некоторых основных исследовательских идей, на которых основаны современные подходы.

Однако описанная Уиткином структура вложенности специфична для одномерных сигналов и не переносится тривиально на многомерные изображения. Тем не менее, эта общая идея вдохновила нескольких других авторов на исследование схем сегментации изображений от грубого до мелкого. Кендеринк [ 2 ] предложил изучить, как контуры изоинтенсивности развиваются в масштабах, и этот подход был более подробно исследован Лифшицем и Пайзером. [ 3 ] Однако, к сожалению, интенсивность элементов изображения меняется в зависимости от масштаба, а это означает, что трудно проследить элементы изображения грубого масштаба до более мелких масштабов, используя информацию об изоинтенсивности.

Линдеберг [ 4 ] изучил проблему связи локальных экстремумов и седловых точек в масштабах и предложил представление изображения, называемое первичным эскизом масштабного пространства , которое ясно показывает отношения между структурами в разных масштабах, а также показывает, какие функции изображения стабильны в больших диапазонах масштаба. включая соответствующие местные шкалы. Бергхольм [ 5 ] предложено обнаруживать края в крупных масштабах в масштабном пространстве, а затем отслеживать их обратно до более мелких масштабов с ручным выбором как грубого масштаба обнаружения, так и мелкого масштаба локализации.

Гауч и Пайзер [ 6 ] изучил взаимодополняющую проблему хребтов и долин в различных масштабах и разработал инструмент для интерактивной сегментации изображений на основе многомасштабных водоразделов . Использование многомасштабного водораздела с применением к карте градиента также исследовалось Олсеном и Нильсеном. [ 7 ] и был перенесен в клиническое использование Dam et al. [ 8 ] Винкен и др. [ 9 ] предложил гиперстек для определения вероятностных отношений между структурами изображений в разных масштабах. Использование стабильных структур изображения в масштабах было продолжено Ахуджей и его коллегами. [ 10 ] [ 11 ] в полностью автоматизированную систему. Полностью автоматический алгоритм сегментации мозга, основанный на тесно связанных идеях многомасштабных водоразделов, был представлен Ундеманом и Линдебергом. [ 12 ] и был тщательно протестирован в базах данных мозга.

Эти идеи многомасштабной сегментации изображений путем связывания структур изображения по масштабам также были подхвачены Флораком и Куйпером. [ 13 ] Бижауи и Рюэ [ 14 ] связывать структуры, обнаруженные в масштабном пространстве выше минимального шумового порога, в дерево объектов, которое охватывает несколько масштабов и соответствует своего рода признаку исходного сигнала. Извлеченные признаки точно реконструируются с использованием итерационного метода матрицы сопряженных градиентов.

Сегментация векторных функций времени

[ редактировать ]

Сегментация масштабно-пространственного пространства была расширена Лионом в другом направлении. [ 15 ] к векторным функциям времени, где векторная производная не имеет максимумов и минимумов, а вторая производная не имеет переходов через нуль, путем помещения границ сегментов вместо максимумов евклидовой величины векторной производной сглаженных векторных сигналов. Этот метод был применен для сегментации речи и текста. [ 16 ]

  1. ^ Виткин, А. (1984). «Фильтрация в масштабном пространстве: новый подход к многомасштабному описанию» (PDF) . ИКАССП '84. Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 9. С. 150–153. дои : 10.1109/ICASSP.1984.1172729 . S2CID   11755124 . Архивировано из оригинала (PDF) 1 августа 2019 г. Проверено 1 августа 2019 г.
  2. ^ Кендеринк, Ян « Структура изображений », Биологическая кибернетика, 50:363–370, 1984.
  3. ^ Лифшиц, Л.М.; Пайзер, С.М. (1990). «Иерархический подход с несколькими разрешениями к сегментации изображений на основе экстремумов интенсивности» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 12 (6): 529–540. дои : 10.1109/34.56189 .
  4. ^ Линдеберг, Тони (1993). «Обнаружение заметных каплевидных структур изображения и их масштабов с помощью первичного эскиза в масштабном пространстве: метод фокусировки внимания» . Международный журнал компьютерного зрения . 11 (3): 283–318. дои : 10.1007/BF01469346 . S2CID   11998035 .
  5. ^ Бергхольм, Ф. (1987). «Фокусировка по краям» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 9 (6): 726–741. дои : 10.1109/tpami.1987.4767980 . ПМИД   21869435 . S2CID   18352198 .
  6. ^ Гауч, Дж. М.; Пайзер, С.М. (1993). «Множественный анализ хребтов и долин на изображениях в оттенках серого» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 15 (6): 635–646. дои : 10.1109/34.216734 .
  7. ^ Олсен, Оле Фог; Нильсен, Мэдс (1997). «Сегментация водораздела по величине многомасштабного градиента» (PDF) . Анализ и обработка изображений . Конспекты лекций по информатике. Том. 1310. стр. 6–13. дои : 10.1007/3-540-63507-6_178 . ISBN  978-3-540-63507-9 .
  8. ^ Дам, Э., Йохансен, П., Олсен, О. Томсен, А. Дарванн, Т., Добженик, А., Германн, Н., Китай, Н., Крейборг, С., Ларсен, П., Нильсен, М.: «Интерактивная многомасштабная сегментация в клиническом использовании» на Европейском конгрессе радиологии, 2000 г.
  9. ^ Винкен, КЛ; Костер, ASE; Виргевер, Массачусетс (1997). «Вероятностная многомасштабная сегментация изображений». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 19 (2): 109–120. дои : 10.1109/34.574787 .
  10. ^ Табб, М.; Ахуджа, Н. (1997). «Многомасштабная сегментация изображений с помощью встроенного обнаружения краев и областей» . Транзакции IEEE при обработке изображений . 6 (5): 642–655. Бибкод : 1997ITIP....6..642T . дои : 10.1109/83.568922 . ПМИД   18282958 .
  11. ^ Акбас, Эмре; Ахуджа, Нарендра (2010). «От разрывов рампы к дереву сегментации» . Компьютерное зрение – ACCV 2009 . Конспекты лекций по информатике. Том. 5994. стр. 123–134. дои : 10.1007/978-3-642-12307-8_12 . ISBN  978-3-642-12306-1 .
  12. ^ Ундеман, Карл; Линдеберг, Тони (2003). «Полностью автоматическая сегментация МРТ-изображений мозга с использованием вероятностной анизотропной диффузии и многомасштабных водоразделов». Методы масштабного пространства в компьютерном зрении . Конспекты лекций по информатике. Том. 2695. стр. 641–656. дои : 10.1007/3-540-44935-3_45 . ISBN  978-3-540-40368-5 .
  13. ^ Флорак, LMJ; Куйпер, А. (2000). «Топологическая структура масштабно-пространственных изображений» (PDF) . Журнал математического изображения и видения . 12 (1): 65–79. дои : 10.1023/А:1008304909717 . HDL : 1874/18929 . S2CID   7515494 .
  14. ^ Бижауи, Альберт; Рю, Фредерик (1995). «Многомасштабная модель видения, адаптированная к астрономическим изображениям» . Обработка сигналов . 46 (3): 345–362. дои : 10.1016/0165-1684(95)00093-4 .
  15. ^ Ричард Ф. Лайон. «Распознавание речи в масштабном пространстве», Учеб. 1987 года ICASSP. Сан-Диего, март, стр. 29.3.14, 1987 г.
  16. ^ «Слейни, М. Понселеон, Д., «Иерархическая сегментация с использованием скрытой семантической индексации в масштабном пространстве», Proc. Intl. Conf. on Acoustics, Speech and Signal Processing (ICASSP '01) 2001» (PDF) . Архивировано из оригинала (PDF) 19 сентября 2006 г. Проверено 1 ноября 2006 г.

См. также

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: bfb7ba13e768b74aa95c74caa21a758e__1698255840
URL1:https://arc.ask3.ru/arc/aa/bf/8e/bfb7ba13e768b74aa95c74caa21a758e.html
Заголовок, (Title) документа по адресу, URL1:
Scale-space segmentation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)