~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ F10D8254D7A3078223848B6A290B4166__1702056060 ✰
Заголовок документа оригинал.:
✰ Pyramid (image processing) - Wikipedia ✰
Заголовок документа перевод.:
✰ Пирамида (обработка изображений) — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Pyramid_(image_processing) ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/f1/66/f10d8254d7a3078223848b6a290b4166.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/f1/66/f10d8254d7a3078223848b6a290b4166__translat.html ✰
Дата и время сохранения документа:
✰ 18.06.2024 18:14:19 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 8 December 2023, at 20:21 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Пирамида (обработка изображений) — Википедия Jump to content

Пирамида (обработка изображений)

Из Википедии, бесплатной энциклопедии
Визуальное представление пирамиды изображений с 5 уровнями

Пирамида , или пирамидальное представление , — это тип многомасштабного сигнала представления , разработанный сообществами компьютерного зрения , обработки изображений и обработки сигналов , в котором сигнал или изображение подвергается многократному сглаживанию и субдискретизации . Пирамидальное представление является предшественником представления в масштабном пространстве и анализа с несколькими разрешениями .

Генерация пирамид [ править ]

Существует два основных типа пирамид: низкочастотные и полосовые.

Пирамида нижних частот создается путем сглаживания изображения с помощью соответствующего сглаживающего фильтра и последующей субдискретизации сглаженного изображения, обычно с коэффициентом 2 по каждому направлению координат. Полученное изображение затем подвергается той же процедуре, и цикл повторяется несколько раз. Каждый цикл этого процесса приводит к уменьшению изображения с повышенным сглаживанием, но с уменьшенной пространственной плотностью выборки (то есть с уменьшенным разрешением изображения). Если проиллюстрировать графически, все многомасштабное представление будет выглядеть как пирамида с исходным изображением внизу, а полученное меньшее изображение каждого цикла будет наложено одно на другое.

Пирамида полосы пропускания создается путем формирования разницы между изображениями на соседних уровнях пирамиды и выполнения интерполяции изображений между соседними уровнями разрешения, чтобы обеспечить вычисление попиксельных различий. [1]

Ядра генерации пирамид [ править ]

множество различных ядер сглаживания. Для построения пирамид было предложено [2] [3] [4] [5] [6] [7] Среди высказанных предложений биномиальные ядра , возникающие из биномиальных коэффициентов, выделяются как особенно полезный и теоретически обоснованный класс. [3] [8] [9] [10] [11] [12] Таким образом, к двумерному изображению мы можем применить (нормализованный) биномиальный фильтр (1/4, 1/2, 1/4), обычно дважды или более вдоль каждого пространственного измерения, а затем выполнить субдискретизацию изображения в два раза. Затем эта операция может выполняться столько раз, сколько необходимо, что приводит к компактному и эффективному многомасштабному представлению. Если это обусловлено конкретными требованиями, также могут быть созданы промежуточные уровни масштаба, где этап подвыборки иногда не учитывается, что приводит к избыточной выборке или гибридной пирамиде . [11] С ростом вычислительной эффективности доступных сегодня процессоров в некоторых ситуациях также возможно использовать более широко поддерживаемые фильтры Гаусса в качестве ядер сглаживания на этапах построения пирамиды.

Пирамида Гаусса [ править ]

В пирамиде Гаусса последующие изображения утяжеляются с использованием среднего по Гауссу ( размытие по Гауссу ) и масштабируются. Каждый пиксель, содержащий локальное среднее значение, соответствует пикселю окрестности на более низком уровне пирамиды. Этот метод особенно используется при синтезе текстур .

Пирамида Лапласа [ править ]

Пирамида Лапласа очень похожа на пирамиду Гаусса, но сохраняет разностное изображение размытых версий между каждым уровнем. Только наименьший уровень не является разностным изображением, чтобы обеспечить возможность реконструкции изображения с высоким разрешением с использованием разностных изображений на более высоких уровнях. Этот метод можно использовать при сжатии изображений . [13]

Управляемая пирамида [ править ]

Управляемая пирамида, разработанная Симончелли и другими, представляет собой реализацию многомасштабного, многоориентированного банка полосовых фильтров, используемого для таких приложений, как сжатие изображений , синтез текстур и распознавание объектов . набор управляемых фильтров Его можно рассматривать как селективную по ориентации версию пирамиды Лапласа, в которой на каждом уровне пирамиды используется вместо одного фильтра Лапласа или Гаусса . [14] [15] [16]

Применение пирамид [ править ]

Альтернативное представление [ править ]

На заре компьютерного зрения пирамиды использовались в качестве основного типа многомасштабного представления для вычисления характеристик многомасштабных изображений на основе данных реальных изображений. Более поздние методы включают представление в масштабном пространстве , которое было популярно среди некоторых исследователей из-за его теоретической основы, возможности отделить этап подвыборки от многомасштабного представления, более мощные инструменты для теоретического анализа, а также способность вычислять представление в любом желаемом масштабе, что позволяет избежать алгоритмических проблем, связанных с сопоставлением представлений изображений с различным разрешением. Тем не менее, пирамиды по-прежнему часто используются для выражения вычислительно эффективных приближений к представлению в масштабном пространстве . [11] [17] [18]

Детальная манипуляция [ править ]

Уровни пирамиды Лапласа можно добавлять или удалять из исходного изображения, чтобы усилить или уменьшить детализацию в разных масштабах. Однако известно, что детальное манипулирование этой формой во многих случаях приводит к появлению артефактов ореола, что приводит к разработке альтернатив, таких как двусторонний фильтр .

Некоторые форматы файлов сжатия изображений используют алгоритм Adam7 или какой-либо другой метод чересстрочной развертки . Их можно рассматривать как своего рода пирамиду изображений. Поскольку в этом формате файла сначала сохраняются «крупномасштабные» функции, а затем в файле — более мелкие детали, конкретный зритель, отображающий небольшую «миниатюру» или на маленьком экране, может быстро загрузить ровно столько изображения, чтобы отобразить его в доступных пикселях, поэтому один файл может поддерживать множество разрешений просмотра, вместо того, чтобы хранить или создавать другой файл для каждое разрешение.

См. также [ править ]

Ссылки [ править ]

  1. ^ Э. Х. Андельсон, Ч. Андерсон, Дж. Р. Берген, П. Дж. Берт и Дж. М. Огден. «Пирамидные методы обработки изображений» . 1984.
  2. ^ Берт, П.Дж. (май 1981 г.). «Быстрое преобразование фильтра для обработки изображений». Компьютерная графика и обработка изображений . 16 :20–51. дои : 10.1016/0146-664X(81)90092-7 .
  3. ^ Перейти обратно: а б Кроули, Джеймс Л. (ноябрь 1981 г.). «Представление визуальной информации» . Университет Карнеги-Меллон, Институт робототехники. тех. отчет CMU-RI-TR-82-07. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  4. ^ Берт, Питер; Адельсон, Тед (1983). «Пирамида Лапласа как компактный код изображения» (PDF) . Транзакции IEEE по коммуникациям . 9 (4): 532–540. CiteSeerX   10.1.1.54.299 . дои : 10.1109/TCOM.1983.1095851 . S2CID   8018433 .
  5. ^ Кроули, Дж.Л.; Паркер, AC (март 1984 г.). «Представление формы, основанное на пиках и гребнях разницы низкочастотного преобразования». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 6 (2): 156–170. CiteSeerX   10.1.1.161.3102 . дои : 10.1109/TPAMI.1984.4767500 . ПМИД   21869180 . S2CID   14348919 .
  6. ^ Кроули, Дж.Л.; Сандерсон, AC (1987). «Представление в множественном разрешении и вероятностное сопоставление двумерной формы в оттенках серого» (PDF) . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 9 (1): 113–121. CiteSeerX   10.1.1.1015.9294 . дои : 10.1109/tpami.1987.4767876 . ПМИД   21869381 . S2CID   14999508 .
  7. ^ Меер, П.; Баугер, Э.С.; Розенфельд, А. (1987). «Анализ частотной области и синтез ядер генерации изображений». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 9 (4): 512–522. дои : 10.1109/tpami.1987.4767939 . ПМИД   21869409 . S2CID   5978760 .
  8. ^ Линдеберг, Тони, « Масштабное пространство для дискретных сигналов », PAMI (12), № 3, март 1990 г., стр. 234–254.
  9. ^ Хаддад, РА; Акансу, АН (март 1991 г.). «Класс быстрых гауссовских биномиальных фильтров для обработки речи и изображений» (PDF) . Транзакции IEEE по обработке сигналов . 39 (3): 723–727. Бибкод : 1991ITSP...39..723H . дои : 10.1109/78.80892 .
  10. ^ Линдеберг, Тони. Теория масштаба-пространства в компьютерном зрении , Kluwer Academic Publishers, 1994, ISBN   0-7923-9418-6 (см., в частности, главу 2 для обзора гауссовых и лапласовых пирамид изображений и главу 3 для теории обобщенных биномиальных ядер и дискретных гауссовских ядер)
  11. ^ Перейти обратно: а б с Линдеберг Т. и Бретцнер Л. Выбор масштаба в реальном времени в гибридных многомасштабных представлениях , Proc. Scale-Space'03, остров Скай, Шотландия, Конспекты лекций Springer по информатике, том 2695, страницы 148–163, 2003.
  12. ^ см. в статье о многомасштабных подходах. Очень краткое теоретическое изложение
  13. ^ Берт, Питер Дж.; Адельсон, Эдвард Х. (1983). «Пирамида Лапласа как компактный код изображения» (PDF) . Транзакции IEEE в области коммуникаций . 31 (4): 532–540. CiteSeerX   10.1.1.54.299 . дои : 10.1109/TCOM.1983.1095851 . S2CID   8018433 .
  14. ^ Симончелли, Ээро. «Управляемая пирамида» . cns.nyu.edu.
  15. ^ Мандучи, Роберто; Перона, Пьетро; Застенчивый, Дуг (1997). «Эффективные наборы деформируемых фильтров» (PDF) . Калифорнийский технологический институт / Падуанский университет .
    Также в Мандучи, Р.; Перона, П.; Шай, Д. (1998). «Эффективные деформируемые блоки фильтров». Транзакции IEEE по обработке сигналов . 46 (4): 1168–1173. Бибкод : 1998ITSP...46.1168M . CiteSeerX   10.1.1.5.3102 . дои : 10.1109/78.668570 .
  16. ^ Кляйн, Стэнли А.; Карни, Том; Баргут-Стайн, Лорен; Тайлер, Кристофер В. (1997). «Семь моделей маскировки». В Роговитце, Бернис Э.; Паппас, Трасивулос Н. (ред.). Человеческое зрение и электронная визуализация II . Том. 3016. С. 13–24. дои : 10.1117/12.274510 . S2CID   8366504 .
  17. ^ Кроули, Дж., Рифф О. Быстрое вычисление нормализованных по масштабу гауссовских рецептивных полей , Proc. Scale-Space'03, остров Скай, Шотландия, Конспекты лекций Springer по информатике , том 2695, 2003 г.
  18. ^ Лоу, генеральный директор (2004). «Отличительные особенности изображения по масштабно-инвариантным ключевым точкам» . Международный журнал компьютерного зрения . 60 (2): 91–110. CiteSeerX   10.1.1.73.2924 . дои : 10.1023/B:VISI.0000029664.99615.94 . S2CID   221242327 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: F10D8254D7A3078223848B6A290B4166__1702056060
URL1:https://en.wikipedia.org/wiki/Pyramid_(image_processing)
Заголовок, (Title) документа по адресу, URL1:
Pyramid (image processing) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)