Галерея сравнения алгоритмов масштабирования изображений
В этой галерее показаны результаты многочисленных алгоритмов масштабирования изображений .
Методы масштабирования
[ редактировать ]Размер изображения можно изменить несколькими способами. Рассмотрите возможность изменения размера фотографии размером 160 x 160 пикселей до следующей миниатюры размером 40 x 40 пикселей, а затем масштабируйте миниатюру до изображения размером 160 x 160 пикселей. Также рассмотрите возможность удвоения размера следующего изображения, содержащего текст.
Миниатюра | Текст |
---|---|
![]() | ![]() |
Исходное фото | Увеличенное уменьшенное изображение | Масштабированный текст | Алгоритм и описание |
---|---|---|---|
![]() | ![]() | ![]() | Один из самых простых способов увеличения размера — замена каждого пикселя несколькими пикселями того же цвета. Полученное изображение больше исходного и сохраняет все исходные детали, но имеет (возможно, нежелательную) неровность . Например, диагональные линии буквы «W» теперь имеют форму «лестницы», характерную для интерполяции ближайшего соседа. Другие методы масштабирования, представленные ниже, лучше сохраняют плавные контуры изображения. |
![]() | ![]() | ![]() | Линейная (или билинейная в двух измерениях) интерполяция обычно хороша для изменения размера изображения, но приводит к некоторому нежелательному смягчению деталей и все же может быть несколько неровной. |
![]() | ![]() | ![]() | Лучшие методы масштабирования включают передискретизацию Ланцоша и фильтры Митчелла-Нетравали . |
![]() | ![]() | ![]() | Фурье Интерполяция на основе[ редактировать ]Простая интерполяция на основе Фурье, основанная на дополнении частотной области нулевыми компонентами (подход на основе сглаженного окна позволит уменьшить звон ). Помимо хорошей сохранности деталей, следует отметить звон и круговое перетекание контента от левой границы к правой границе (и наоборот). |
![]() | ![]() | ![]() | Алгоритмы интерполяции, ориентированные на края, направлены на сохранение краев изображения после масштабирования, в отличие от других алгоритмов, которые могут создавать ступенчатые артефакты вокруг диагональных линий или кривых. Примеры алгоритмов для этой задачи включают новую интерполяцию, направленную на края (NEDI), [1] [2] Интерполяция изображения по краям (EGGI), [3] Итеративная интерполяция на основе кривизны (ICBI), [ нужна ссылка ] и интерполяция направленной кубической свертки (DCCI). [4] Исследование показало, что DCCI показала лучшие результаты в PSNR и SSIM на серии тестовых изображений. [5] |
![]() | ![]() | ![]() | Для увеличения компьютерной графики с низким разрешением и небольшим количеством цветов (обычно от 2 до 256 цветов) лучшие результаты будут достигнуты с помощью алгоритмов масштабирования пиксельной графики, таких как hqx или xbr. Они создают острые края и поддерживают высокий уровень детализации. К сожалению, из-за стандартизированного размера 218x80 пикселей изображение «Вики» не может использовать HQ4x или 4xBRZ, чтобы лучше демонстрировать артефакты, которые они могут создавать, например сдвиг строк.
|
![]() | ![]() | ![]() | Семейство xbr очень полезно для создания плавных краев. Однако это значительно деформирует форму, что во многих случаях дает очень привлекательный результат. Однако это создаст эффект, аналогичный постеризации , за счет группировки локальных областей в один цвет. Он также удалит мелкие детали, находящиеся между более крупными, которые соединяются вместе. В примерах изображений используются 4xBRZ и 2xBRZ соответственно. |
![]() ![]() | ![]() ![]() | ![]() | Алгоритмы масштабирования пиксельной графики (GemCutter)[ редактировать ]Адаптируемая техника, которая может обеспечить различное количество деталей или плавности. Его цель — сохранить форму и координаты исходных деталей, не размывая эти детали на соседние. Это позволит избежать смешивания пикселей, которые непосредственно касаются друг друга, а вместо этого будет смешивать только пиксели с их соседями по диагонали. Название «Cutter» происходит от его тенденции срезать углы квадратов и превращать их в ромбы, а также создавать отдельные грани вдоль ступенчатых пикселей, то есть тех, которые существуют вдоль углов ребер ромба. Префикс «драгоценный камень» относится как к огранке бриллианта, так и ко многим традиционным огранкам драгоценных камней, которые включают огранку углов под углом 45 градусов.
|
![]() | ![]() | ![]() | Векторизация сначала создает независимое от разрешения векторное представление масштабируемой графики. Затем независимая от разрешения версия отображается как растровое изображение с желаемым разрешением. Этот метод используется в Adobe Illustrator Live Trace, Inkscape и в нескольких недавних статьях. [6] Масштабируемая векторная графика хорошо подходит для простых геометрических изображений, тогда как фотографии плохо справляются с векторизацией из-за их сложности.
|
![]() | ![]() | ![]() | Глубокие сверточные нейронные сети[ редактировать ]Используя машинное обучение , убедительные детали генерируются как наилучшие предположения путем изучения общих закономерностей из набора обучающих данных . Увеличенный результат иногда называют галлюцинацией , поскольку введенная информация может не соответствовать содержанию источника. Методы расширенной глубокой остаточной сети (EDSR) были разработаны путем оптимизации традиционной архитектуры остаточной нейронной сети . [7] К программам, использующим этот метод, относятся waifu2x , Imglarger и Neural Enhance. |
![]() | ![]() | ![]() | Глубокие сверточные нейронные сети, использующие потерю восприятия[ редактировать ]Разработанный на основе метода генеративно-состязательной сети сверхвысокого разрешения (SRGAN), [8] улучшенный СРГАН (ESRGAN) [9] представляет собой постепенную настройку той же основы генеративно-состязательной сети. Оба метода основаны на функции потерь восприятия. [10] для оценки итераций обучения. |
Ссылки
[ редактировать ]- ^ «Интерполяция по краям» . Проверено 19 февраля 2016 г.
- ^ Синь Ли; Майкл Т. Орчард. «НОВАЯ КРАЙНАЯ НАПРАВЛЕННАЯ ИНТЕРПОЛЯЦИЯ» (PDF) . Международная конференция IEEE по обработке изображений 2000 г .: 311. Архивировано из оригинала (PDF) 14 февраля 2016 г. Проверено 3 июля 2016 г.
- ^ Чжан, Д.; Сяолинь Ву (2006). «Алгоритм интерполяции изображений с наведением по краям посредством направленной фильтрации и объединения данных». Транзакции IEEE при обработке изображений . 15 (8): 2226–38. Бибкод : 2006ITIP...15.2226Z . дои : 10.1109/TIP.2006.877407 . ПМИД 16900678 . S2CID 9760560 .
- ^ Дэнвэнь Чжоу; Сяолю Шен. «Масштабирование изображения с использованием интерполяции направленной кубической свертки» . Проверено 13 сентября 2015 г.
- ^ Шаоде Ю; Ронгмао Ли; Руй Чжан; Моу Ан; Шибин Ву; Яоцинь Се (2013). «Оценка эффективности методов интерполяции по краям для изображений без шума». arXiv : 1303.6455 [ cs.CV ].
- ^ Йоханнес Копф и Дани Лишински (2011). «Депикселизация пиксель-арта» . Транзакции ACM с графикой . 30 (4): 99:1–99:8. дои : 10.1145/2010324.1964994 . Архивировано из оригинала 1 сентября 2015 г. Проверено 24 октября 2012 г.
- ^ Лим, Би; Сын, Санхён; Ким, Хивон; Нет, Сынджун; Кён Му Ли (2017). «Улучшенные глубокие остаточные сети для сверхвысокого разрешения одного изображения». arXiv : 1707.02921 [ cs.CV ].
- ^ «Генеративно-состязательная сеть и GAN сверхвысокого разрешения (SRGAN)» . 26 апреля 2020 г. Проверено 26 августа 2020 г.
- ^ Ван, Синьтао; Ву, Шисян; Лю, Ихао, Чао; Чен Цяо, Ю; Тан, Сяоу (2018). .arXiv 1809.00219 : cs.CV [ ] .
- ^ «Функции потери восприятия» . 17 мая 2019 года . Проверено 26 августа 2020 г.