Jump to content

Дескриптор цветового макета

При изображений и цифровой обработке видео дескриптор цветового расположения ( CLD предназначен для фиксации пространственного распределения цвета ) в изображении. Процесс извлечения признаков состоит из двух частей: выбора репрезентативного цвета на основе сетки и дискретного косинусного преобразования с квантованием.

Цвет — это самое основное качество визуального контента, поэтому цвета можно использовать для описания и представления изображения. Стандарт MPEG-7 проверил наиболее эффективную процедуру описания цвета и выбрал те, которые дали более удовлетворительные результаты. Этот стандарт предлагает различные методы получения этих дескрипторов , и одним из инструментов, определенных для описания цвета, является CLD, который позволяет описывать цветовое соотношение между последовательностями или группами изображений.

CLD фиксирует пространственное расположение репрезентативных цветов на сетке, наложенной на область или изображение. Представление основано на коэффициентах дискретного косинусного преобразования (ДКП). Это очень компактный дескриптор, который очень эффективен в приложениях быстрого просмотра и поиска. Его можно применять как к неподвижным изображениям, так и к фрагментам видео.

Определение

[ редактировать ]

CLD — это очень компактное и не зависящее от разрешения представление цвета для высокоскоростного поиска изображений , разработанное для эффективного представления пространственного распределения цветов. Эту функцию можно использовать для широкого спектра поиска на основе сходства, фильтрации контента и визуализации. Это особенно полезно для приложений поиска на основе пространственной структуры. Этот дескриптор получается путем применения преобразования DCT к двумерному массиву локальных репрезентативных цветов в цветовом пространстве Y, Cb или Cr . Функциональные возможности CLD в основном совпадают:

– Сопоставление изображений с изображениями
– Сопоставление видеоклипов с видеоклипами

Обратите внимание, что CLD является одним из наиболее точных и быстрых дескрипторов цвета.

Процесс извлечения CLD

Процесс извлечения этого цветового дескриптора состоит из четырех этапов:

  • Разделение изображений
  • Представительный выбор цвета
  • Преобразование ДКП
  • Зигзагообразное сканирование

Стандарт MPEG-7 рекомендует использовать цветовое пространство YCbCr для CLD.

Разделение изображений

Разделение изображений

[ редактировать ]

На этапе разделения изображения входное изображение (в цветовом пространстве RGB ) делится на 64 блока, чтобы гарантировать инвариантность к разрешению или масштабу. Входные и выходные данные этого этапа суммированы в следующей таблице:

Входной каскад 1 Выходной каскад 1
Входное изображение [M x N] Входное изображение, разделенное на
64 блока [M/8xN/8]
Представительный выбор цвета

Представительный выбор цвета

[ редактировать ]

После этапа разделения изображения из каждого блока выбирается один репрезентативный цвет. Можно применить любой метод выбора репрезентативного цвета, но стандарт рекомендует использовать среднее значение цветов пикселей в блоке в качестве соответствующего репрезентативного цвета, поскольку это проще и точность описания в целом достаточна. В результате выбора появляется крошечный значок изображения размером 8x8. На следующем рисунке показан этот процесс. Обратите внимание, что в изображении фигуры разрешение исходного изображения сохранено только для облегчения его представления. Входные и выходные данные этого этапа суммированы в следующей таблице:

Входной этап 2 Выходной каскад 2
Входное изображение разделено на 64 блока [M/8xN/8] Маленький значок изображения [8x8]

После получения крошечного значка изображения применяется преобразование цветового пространства между RGB и YCbCr.

Входной этап 3 Выходной каскад 3
Крошечный значок изображения [8x8] в цветовом пространстве RGB Крошечный значок изображения [8x8] в цветовом пространстве YCbCr.

Преобразование ДКП

[ редактировать ]

На четвертом этапе яркость синего и красного цветов (Y), а также цветность (Cb и Cr) преобразуются с помощью DCT 8x8, поэтому получаются три набора из 64 коэффициентов DCT. Для расчета DCT в 2D-массиве используются приведенные ниже формулы.

Входные и выходные данные этого этапа суммированы в следующей таблице:

Входной этап 4 Выходной каскад 4
Маленький значок изображения [8x8]
в цветовом пространстве YCbCr
3 [8x8] матрица из 64 коэффициентов
(DCTY, DCTCb, DCTCr)
Зигзагообразное сканирование

Зигзагообразное сканирование

[ редактировать ]

Зигзагообразное сканирование выполняется с этими тремя наборами из 64 коэффициентов DCT согласно схеме, представленной на рисунке. Целью зигзагообразного сканирования является группировка низкочастотных коэффициентов матрицы 8х8. Входные и выходные данные этого этапа суммированы в следующей таблице:

Входной этап 5 Выходной каскад 5
3 [8x8] матрица из 64 коэффициентов
(DCTY, DCTCb, DCTCr)
3 матрицы зигзагообразного сканирования
(ДИ, ДКб, ДКр)

Наконец, эти три набора матриц соответствуют CLD входного изображения.

Соответствие

[ редактировать ]

Процесс сопоставления помогает оценить, равны ли два элемента, сравнивая оба элемента и вычисляя расстояние между ними. В случае дескрипторов цвета процесс сопоставления помогает оценить, похожи ли два изображения. Его процедура следующая:

– Учитывая изображение в качестве входных данных, приложение пытается найти изображение с аналогичным дескриптором в базе данных изображений.

Если мы рассмотрим два CLD:

{DY, DCb, DCr}
{ DY‟, DCb‟, DCr‟ },

Расстояние между двумя дескрипторами можно вычислить как:

Индекс i представляет порядок зигзагообразного сканирования коэффициентов. Кроме того, обратите внимание, что можно взвешивать коэффициенты (w), чтобы регулировать производительность процесса сопоставления. Эти веса позволяют нам придавать некоторым компонентам дескриптора большее значение, чем другим. Соблюдая формулу, можно получить следующее:

– 2 изображения одинаковы, если расстояние равно 0
– 2 изображения похожи, если расстояние близко к 0

Таким образом, этот процесс сопоставления позволит идентифицировать изображения со схожими цветовыми дескрипторами. Поскольку сложность процесса сопоставления изображений, показанного выше, невелика, можно добиться высокоскоростного сопоставления изображений.

См. также

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1c5cd3aff23c6550f3a2321ae6674985__1691274240
URL1:https://arc.ask3.ru/arc/aa/1c/85/1c5cd3aff23c6550f3a2321ae6674985.html
Заголовок, (Title) документа по адресу, URL1:
Color layout descriptor - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)