Jump to content

Контекстная классификация изображений

Контекстная классификация изображений , тема распознавания образов в компьютерном зрении , представляет собой подход классификации , основанный на контекстной информации в изображениях. «Контекстуальный» означает, что этот подход фокусируется на отношениях соседних пикселей, которые также называются соседством. Целью этого подхода является классификация изображений с использованием контекстной информации.

Введение

[ редактировать ]

Подобно языку обработки , одно слово может иметь несколько значений, если не указан контекст, а шаблоны в предложениях — единственные информативные сегменты, которые нас интересуют. Для изображений принцип тот же. Найдите закономерности и свяжите с ними правильные значения.

Как показано на изображении ниже, если показана только небольшая часть изображения, очень сложно понять, о чем оно.

Рот
Mouth

Даже попробуйте другую часть изображения, классифицировать изображение все равно сложно.

Левый глаз
Left eye

Однако если повысить контекстуальность изображения, то распознавание имеет больше смысла.

Увеличение поля улыбающегося лица

Как показано на полных изображениях ниже, почти каждый может легко его классифицировать.

Полное изображение

Во время процедуры сегментации методы, не использующие контекстную информацию, чувствительны к шуму и вариациям, поэтому результат сегментации будет содержать большое количество неправильно классифицированных областей, и часто эти области малы (например, один пиксель).

По сравнению с другими методами этот подход устойчив к шуму и существенным изменениям, поскольку учитывает непрерывность сегментов.

Ниже будут описаны несколько методов этого подхода.

Приложения

[ редактировать ]

Работает как фильтр постобработки для помеченного изображения.

[ редактировать ]

Этот подход очень эффективен против небольших областей, вызванных шумом. И эти небольшие области обычно состоят из нескольких пикселей или одного пикселя. Этим регионам присвоена наиболее вероятная метка.Однако у этого метода есть недостаток. Маленькие регионы также могут быть образованы правильными регионами, а не шумом, и в этом случае метод фактически ухудшает классификацию.Этот подход широко используется в приложениях дистанционного зондирования .

Улучшение классификации постобработки

[ редактировать ]

Это двухэтапный процесс классификации:

  1. Для каждого пикселя пометьте его и сформируйте для него новый вектор признаков.
  2. Используйте новый вектор признаков и объедините контекстную информацию, чтобы присвоить окончательную метку объекту.

Объединение пикселей на более ранних этапах

[ редактировать ]

Вместо использования отдельных пикселей соседние пиксели можно объединить в однородные области, используя контекстную информацию. И предоставьте эти регионы классификатору.

Получение функции пикселя из окрестности

[ редактировать ]

Исходные спектральные данные могут быть дополнены добавлением контекстной информации, переносимой соседними пикселями, или даже заменены в некоторых случаях. Этот вид методов предварительной обработки широко используется при распознавании текстурированных изображений . Типичные подходы включают средние значения, дисперсии, описание текстуры и т. д.

Объединение спектральной и пространственной информации

[ редактировать ]

Классификатор использует уровень серого и окрестности пикселей (контекстную информацию) для присвоения меток пикселям. В таком случае информация представляет собой комбинацию спектральной и пространственной информации.

На базе классификатора минимальных ошибок Байеса

[ редактировать ]

Контекстная классификация данных изображения основана на классификаторе минимальных ошибок Байеса (также известном как наивный классификатор Байеса ).

Представьте пиксель :

  • Пиксель обозначается как .
  • Окрестность каждого пикселя является вектором и обозначается как .
    • Значения в векторе окрестности обозначаются как .
    • Каждый пиксель представлен вектором
  • Метки (классификация) пикселей по соседству представлены в виде вектора
здесь обозначает назначенный класс.
  • Вектор представляет метки в окрестностях без пикселя

Район :Размер квартала. Ограничения на размер нет, но он считается относительно небольшим для каждого пикселя. .Разумный размер района будет 4- связности или 8-связности ( отмечен красным и расположен в центре).

Расчет :

Применить минимальную классификацию ошибок к пикселю , если вероятность класса представляю пиксель является самым высоким среди всех, то присвойте как его класс.

Правило контекстной классификации описано ниже, оно использует вектор признаков скорее, чем .

Используйте формулу Байеса для расчета апостериорной вероятности.

Количество векторов совпадает с количеством пикселей в изображении. Для классификатора используется вектор, соответствующий каждому пикселю. , а вектор генерируется из окрестности пикселя.

Основные этапы контекстной классификации изображений :

  1. Вычислить вектор признаков для каждого пикселя.
  2. Рассчитать параметры распределения вероятностей и
  3. Вычислить апостериорные вероятности и все этикетки . Получите результат классификации изображений.

Алгоритмы

[ редактировать ]

Соответствие шаблону

[ редактировать ]

Сопоставление шаблонов представляет собой реализацию этого подхода методом «грубой силы». [1] Идея заключается в том, чтобы сначала создать набор шаблонов, а затем искать мелкие детали изображения, соответствующие шаблону.

Этот метод требует больших вычислительных ресурсов и неэффективен. На протяжении всего процесса он хранит целый список шаблонов, а количество комбинаций чрезвычайно велико. Для пиксельное изображение, может быть максимум комбинаций, что приводит к большим вычислительным затратам. Этот метод является методом сверху вниз и часто называется поиском по таблице или поиском по словарю .

Цепь Маркова низшего порядка

[ редактировать ]

Цепь Маркова [2] также может применяться при распознавании образов. Пиксели изображения можно распознать как набор случайных величин, а затем использовать цепь Маркова низшего порядка, чтобы найти взаимосвязь между пикселями. Изображение рассматривается как виртуальная линия, и метод использует условную вероятность.

Кривые, заполняющие гильбертово пространство

[ редактировать ]

проходит Кривая Гильберта по уникальному шаблону через все изображение, она пересекает каждый пиксель, не посещая ни один из них дважды, и сохраняет непрерывную кривую. Это быстро и эффективно.

Марковские сетки

[ редактировать ]

Цепь Маркова низшего порядка и кривые заполнения пространства Гильберта, упомянутые выше, рассматривают изображение как линейную структуру. Однако сетки Маркова будут учитывать двумерную информацию.

Дерево зависимостей

[ редактировать ]

Дерево зависимостей [3] — это метод, использующий древовидную зависимость для аппроксимации распределений вероятностей.

  1. ^ GT Туссен, « Использование контекста в распознавании образов », Распознавание образов, том. 10, 1977, стр. 189–204.
  2. ^ К. Абенд, Т. Дж. Харли и Л. Н. Канал, « Классификация двоичных случайных шаблонов », Транзакции IEEE по теории информации, том. 11, нет. 4 октября 1965 г., стр. 538–544.
  3. ^ CK Чоу и CN Лю, « Аппроксимация дискретных распределений вероятностей с помощью деревьев зависимостей », Транзакции IEEE по теории информации, том 14, вып. 3 мая 1965 г., стр. 462–467.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a2fd9eaf760ef716b2cc367626ec1a82__1703224260
URL1:https://arc.ask3.ru/arc/aa/a2/82/a2fd9eaf760ef716b2cc367626ec1a82.html
Заголовок, (Title) документа по адресу, URL1:
Contextual image classification - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)