Таблица суммированных площадей
Таблица суммированных площадей — это структура данных и алгоритм для быстрого и эффективного создания суммы значений в прямоугольном подмножестве сетки. В области обработки изображений оно также известно как целостное изображение . Он был представлен в компьютерной графике в 1984 году Фрэнком Кроу для использования с MIP-картами . В компьютерном зрении его популяризировал Льюис. [1] а затем получил название «интегральное изображение» и широко использовался в рамках системы обнаружения объектов Виолы-Джонса в 2001 году. Исторически этот принцип очень хорошо известен при изучении многомерных функций распределения вероятностей, а именно при вычислениях 2D (или ND). вероятности (площадь под распределением вероятностей) из соответствующих кумулятивных функций распределения . [2]
Алгоритм
[ редактировать ]Как следует из названия, значение в любой точке ( x , y ) в таблице суммированных площадей представляет собой сумму всех пикселей выше и слева от ( x , y ), включительно: [3] [4] где — значение пикселя в точке ( x , y ).
Таблицу суммированной площади можно эффективно вычислить за один проход по изображению, поскольку значение в таблице суммированной площади в ( x , y ) просто: [5] (Обратите внимание, что суммированная матрица рассчитывается из верхнего левого угла)
После вычисления таблицы суммированных площадей для оценки суммы интенсивностей по любой прямоугольной области требуется ровно четыре обращения к массиву независимо от размера области. То есть обозначения на рисунке справа, где A = ( x 0 , y 0 ) , B = ( x 1 , y 0 ) , C = ( x 0 , y 1 ) и D = ( x 1 , y 1 ) ) , сумма i ( x , y ) по прямоугольнику, охватываемому A , B , C и D , равна:
Расширения
[ редактировать ]Этот метод естественным образом распространяется на непрерывные области. [2]
Этот метод также можно распространить на изображения большой размерности. [6] Если углы прямоугольника с в , то сумма значений изображений, содержащихся в прямоугольнике, вычисляется по формуле где является целостным изображением на и размерность изображения. Обозначения соответствуют в примере , , , и . при нейровизуализации изображения имеют размерность. Например, или , при использовании вокселей или вокселей с отметкой времени.
Этот метод был распространен на интегральное изображение высокого порядка, как в работе Phan et al. [7] который предоставил два, три или четыре интегральных изображения для быстрого и эффективного расчета стандартного отклонения (дисперсии), асимметрии и эксцесса локального блока изображения. Подробно это описано ниже:
Чтобы вычислить дисперсию или стандартное отклонение блока, нам нужны два целых изображения: Отклонение определяется: Позволять и обозначим суммы блока из и , соответственно. и быстро вычисляются по интегральному изображению. Теперь мы манипулируем уравнением дисперсии следующим образом: Где и .
Аналогично оценке среднего ( ) и дисперсия ( ), для чего требуются целые изображения первой и второй степени изображения соответственно (т.е. ); манипуляции, подобные упомянутым выше, можно производить с третьей и четвертой степенями изображений (т.е. .) для получения асимметрии и эксцесса. [7] Но одна важная деталь реализации, которую следует учитывать для вышеупомянутых методов, как упоминалось F. Shafait et al. [8] Это переполнение целых чисел, возникающее для целочисленных изображений более высокого порядка в случае использования 32-битных целых чисел.
Рекомендации по реализации
[ редактировать ]Тип данных для сумм может отличаться и превышать тип данных, используемый для исходных значений, чтобы обеспечить наибольшую ожидаемую сумму без переполнения . Для данных с плавающей запятой ошибку можно уменьшить с помощью компенсированного суммирования .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Льюис, JP (1995). Быстрое сопоставление шаблонов . Учеб. Интерфейс видения . стр. 120–123.
- ^ Jump up to: а б Финкельштейн, Амир; Ниратшарма (2010). «Двойные интегралы путем суммирования значений кумулятивной функции распределения» . Демонстрационный проект Вольфрама .
- ^ Кроу, Франклин (1984). «Таблицы суммированных площадей для наложения текстур» . SIGGRAPH '84: Материалы 11-й ежегодной конференции по компьютерной графике и интерактивным методам . стр. 207–212. дои : 10.1145/800031.808600 .
- ^ Виола, Пол; Джонс, Майкл (2002). «Надежное обнаружение объектов в реальном времени» (PDF) . Международный журнал компьютерного зрения .
- ^ БАДГЕРАТИ (03.09.2010). «Компьютерное зрение – целостный образ» . Computersciencesource.wordpress.com . Проверено 13 февраля 2017 г.
- ^ Тапиа, Эрнесто (январь 2011 г.). «Заметка о вычислении многомерных интегральных изображений». Буквы для распознавания образов . 32 (2): 197–201. Бибкод : 2011PaReL..32..197T . дои : 10.1016/j.patrec.2010.10.007 .
- ^ Jump up to: а б Фан, Тьен; Сохони, Сухум; Ларсон, Эрик С.; Чендлер, Дэймон М. (22 апреля 2012 г.). «Ускорение оценки качества изображения на основе анализа производительности». Юго-западный симпозиум IEEE 2012 по анализу и интерпретации изображений (PDF) . стр. 81–84. CiteSeerX 10.1.1.666.4791 . дои : 10.1109/SSIAI.2012.6202458 . hdl : 11244/25701 . ISBN 978-1-4673-1830-3 . S2CID 12472935 .
- ^ Шафаит, Фейсал; Кейзерс, Дэниел; М. Брейэль, Томас (январь 2008 г.). Яникоглу, Беррин А.; Беркнер, Кэтрин (ред.). «Эффективная реализация методов локальной адаптивной пороговой обработки с использованием интегральных изображений» (PDF) . Электронная визуализация . Распознавание и поиск документов XV. 6815 : 681510–681510–6. Бибкод : 2008SPIE.6815E..10S . CiteSeerX 10.1.1.109.2748 . дои : 10.1117/12.767755 . S2CID 9284084 .