Сумма абсолютных разностей
В цифровой обработке изображений сумма абсолютных разностей ( SAD ) является мерой сходства между блоками изображений . Он рассчитывается путем определения абсолютной разницы между каждым пикселем исходного блока и соответствующим пикселем блока, используемого для сравнения. Эти различия суммируются для создания простой метрики сходства блоков, L 1 норма разностного изображения или манхэттенское расстояние между двумя блоками изображения.
Сумма абсолютных разностей может использоваться для различных целей, таких как распознавание объектов , создание карт несоответствия для стереоизображений и оценка движения для сжатия видео .
Пример
[ редактировать ]В этом примере используется сумма абсолютных разностей, чтобы определить, какая часть изображения поиска наиболее похожа на изображение шаблона. В этом примере изображение шаблона имеет размер 3 на 3 пикселя, а изображение поиска — 3 на 5 пикселей. Каждый пиксель представлен одним целым числом от 0 до 9.
Template Search image 2 5 5 2 7 5 8 6 4 0 7 1 7 4 2 7 7 5 9 8 4 6 8 5
В изображении поиска есть ровно три уникальных места, куда может поместиться шаблон: левая сторона изображения, центр изображения и правая часть изображения. Для расчета значений SAD используется абсолютное значение разницы между каждой соответствующей парой пикселей: разница между 2 и 2 равна 0, 4 и 1 равна 3, 7 и 8 равна 1 и так далее.
Вычисление значений абсолютных разностей для каждого пикселя для трех возможных местоположений шаблона дает следующее:
Left Center Right 0 2 0 5 0 3 3 3 1 3 7 3 3 4 5 0 2 0 1 1 3 3 1 1 1 3 4
Для каждого из этих трех фрагментов изображения 9 абсолютных разностей суммируются, что дает значения SAD 20, 25 и 17 соответственно. На основании этих значений SAD можно утверждать, что правая часть изображения поиска наиболее похожа на изображение шаблона, поскольку она имеет наименьшую сумму абсолютных различий по сравнению с двумя другими местоположениями.
Сравнение с другими показателями
[ редактировать ]Распознавание объектов
[ редактировать ]Сумма абсолютных разностей обеспечивает простой способ автоматизации поиска объектов внутри изображения, но может быть ненадежным из-за влияния контекстуальных факторов, таких как изменения освещения, цвета, направления взгляда, размера или формы. SAD можно использовать в сочетании с другими методами распознавания объектов, такими как обнаружение границ , для повышения надежности результатов.
Сжатие видео
[ редактировать ]SAD является чрезвычайно быстрой метрикой из-за своей простоты; по сути, это простейшая метрика, которая учитывает каждый пиксель в блоке. Таким образом, он очень эффективен для поиска широкого движения множества различных блоков. SAD также легко распараллеливается , поскольку он анализирует каждый пиксель отдельно, что позволяет легко реализовать его с помощью таких инструкций, как ARM NEON или x86 SSE2 . Например, специально для этой цели в SSE имеется упакованная инструкция суммы абсолютных разностей (PSADBW). После того как блоки-кандидаты найдены, окончательное уточнение процесса оценки движения часто выполняется с использованием других, более медленных, но более точных показателей, которые лучше учитывают человеческое восприятие . К ним относятся сумма абсолютных преобразованных разностей (SATD), сумма квадратов разностей (SSD) и оптимизация искажений скорости .
См. также
[ редактировать ]- Компьютерное стереозрение
- Преобразование Адамара
- Компенсация движения
- Оценка движения
- Распознавание объектов (компьютерное зрение)
- Оптимизация искажения скорости
Ссылки
[ редактировать ]- Э.Г. Ричардсон, Иэн (2003). Сжатие видео H.264 и MPEG-4: кодирование видео для мультимедиа нового поколения . Чичестер: John Wiley & Sons Ltd.