Jump to content

Передача нейронного стиля

(Перенаправлено из передачи нейронного стиля )

Передача нейронного стиля ( NST ) относится к классу программных алгоритмов, которые манипулируют цифровыми изображениями или видео, чтобы принять внешний вид или визуальный стиль другого изображения. Алгоритмы NST характеризуются использованием глубоких нейронных сетей для преобразования изображений. Обычно NST используется для создания искусственных произведений искусства из фотографий, например, путем переноса внешнего вида известных картин на фотографии, предоставленные пользователями. Несколько известных мобильных приложений используют для этой цели методы NST, включая DeepArt и Prisma . Этот метод использовался художниками и дизайнерами по всему миру для создания новых произведений искусства на основе существующих стилей.

Алгоритмы передачи более раннего стиля

[ редактировать ]

NST — это пример стилизации изображения , проблемы, изучаемой более двух десятилетий в области нефотореалистичного рендеринга . Первые два алгоритма передачи стилей на основе примеров представляли собой аналогии изображений. [1] и выстегивание изображений. [2] Оба эти метода были основаны на алгоритмах синтеза текстур на основе патчей .

Учитывая обучающую пару изображений — фотографию и изображение, изображающее эту фотографию, — можно изучить преобразование, а затем применить его для создания нового изображения из новой фотографии по аналогии. Если тренировочной фотографии не было, ее нужно было бы создать путем обработки входного изображения; стеганое изображение не требовало этого этапа обработки, хотя оно было продемонстрировано только на одном стиле.

NST был впервые опубликован в статье Леона Гатиса и др. «Нейронный алгоритм художественного стиля», первоначально опубликованной на ArXiv 2015. [3] и впоследствии принят рецензируемой конференцией CVPR в 2016 году. [4] В оригинальной статье использовалась архитектура VGG-19. [5] который был предварительно обучен распознаванию объектов с использованием набора данных ImageNet .

В 2017 году Google AI представил метод [6] это позволяет одной глубокой сети передачи сверточных стилей одновременно изучать несколько стилей. Этот алгоритм позволяет интерполяцию стилей в режиме реального времени, даже если это делается на видео носителе.

Формулировка

[ редактировать ]

Процесс НСТ предполагает входное изображение и пример изображения стиля .

Изображение передается через CNN, а сетевые активации выбираются на уровне поздней свертки архитектуры VGG-19. Позволять быть результирующим выходным образцом, называемым «содержимым» входных данных .

Стиль изображения затем передается через ту же CNN, и сетевые активации выбираются на ранних и средних уровнях CNN. Эти активации закодированы в виде матрицы Грамиана , назовем ее для обозначения «стиля» .

Цель NST — синтезировать выходное изображение. который отображает содержание применяется в стиле , то есть и .

Итеративная оптимизация (обычно градиентный спуск ), затем постепенно обновляется. чтобы минимизировать ошибку функции потерь:

,

где расстояние L2 . Константа контролирует уровень эффекта стилизации.

Обучение

[ редактировать ]

Изображение первоначально аппроксимируется добавлением небольшого количества белого шума к входному изображению и подавать его через CNN. Затем мы последовательно распространяем эту потерю по сети с фиксированными весами CNN, чтобы обновить пиксели . После нескольких тысяч эпох обучения, (надеюсь) появляется, соответствующий стилю и содержание .

Алгоритмы обычно реализуются для графических процессоров , поэтому обучение занимает несколько минут. [ нужна ссылка ]

Расширения

[ редактировать ]

NST также был распространен на видео. [7]

Последующая работа улучшила скорость NST для изображений. [ нужны разъяснения ]

В статье Фей-Фей Ли и др. принял другую регуляризованную метрику потерь и ускоренный метод обучения для получения результатов в реальном времени (на три порядка быстрее, чем Gatys). [8] Их идея заключалась в том, чтобы использовать не потерю пикселей, определенную выше, а скорее «перцепционную потерю», измеряющую различия между слоями более высокого уровня внутри CNN. Они использовали симметричный кодер-декодер CNN. При обучении используется функция потерь, аналогичная базовому методу NST, но также регуляризуется выходной сигнал для обеспечения гладкости с использованием потерь общей вариации (TV). После обучения сеть можно использовать для преобразования изображения в стиль, используемый во время обучения, используя один проход сети с прямой связью. Однако сеть ограничена единственным стилем, в котором она обучена. [9]

В работе Чэнь Дундуна и др. они исследовали объединение информации оптического потока в сети прямой связи , чтобы улучшить временную когерентность вывода. [10]

Совсем недавно преобразовании объектов, были исследованы методы NST, основанные на для быстрой стилизации, которые не привязаны к одному конкретному стилю и обеспечивают управляемое пользователем смешивание стилей, например преобразование отбеливания и окраски (WCT). [11]

  1. ^ «Аналогии изображений» (PDF) . Mrl.nyu.edu . 2001 . Проверено 13 февраля 2019 г.
  2. ^ «Квилтинг изображений» . Graphics.cs.cmu.edu . 2001 . Проверено 4 февраля 2021 г.
  3. ^ Гатис, Леон А.; Экер, Александр С.; Бетге, Матиас (26 августа 2015 г.). «Нейронный алгоритм художественного стиля». arXiv : 1508.06576 [ cs.CV ].
  4. ^ Бетге, Матиас; Экер, Александр С.; Гатис, Леон А. (2016). «Передача стиля изображения с использованием сверточных нейронных сетей» . Cv-foundation.org . стр. 2414–2423 . Проверено 13 февраля 2019 г.
  5. ^ «Очень глубокая CNNS для крупномасштабного визуального распознавания» . Robots.ox.ac.uk . 2014 . Проверено 13 февраля 2019 г.
  6. ^ Дюмулен, Винсент; Шленс, Джонатон С.; Кудлур, Манджунатх (9 февраля 2017 г.). «Ученое представление художественного стиля». arXiv : 1610.07629 [ cs.CV ].
  7. ^ Рудер, Мануэль; Досовицкий, Алексей; Брокс, Томас (2016). «Передача художественного стиля для видео». Распознавание образов . Конспекты лекций по информатике. Том. 9796. стр. 26–36. arXiv : 1604.08610 . дои : 10.1007/978-3-319-45886-1_3 . ISBN  978-3-319-45885-4 . S2CID   47476652 .
  8. ^ Джонсон, Джастин; Алахи, Александр; Ли, Фей-Фей (2016). «Потери восприятия при передаче стиля в реальном времени и сверхвысоком разрешении». arXiv : 1603.08155 [ cs.CV ].
  9. ^ Джонсон, Джастин; Алахи, Александр; Ли, Фей-Фей (2016). «Потери восприятия при передаче стиля в реальном времени и сверхвысоком разрешении». arXiv : 1603.08155 [ cs.CV ].
  10. ^ Ю, Хуа, Ган ( Юань , Чен, Дундун ; 2017 Лу ; ) .
  11. ^ Синь, Мин-Сюань (2017 , ) Чжаовэнь ; Лу , Ли, Иджун, Чен, Ян .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7db1813e7acaa7bb26f310795ceee0d3__1677799500
URL1:https://arc.ask3.ru/arc/aa/7d/d3/7db1813e7acaa7bb26f310795ceee0d3.html
Заголовок, (Title) документа по адресу, URL1:
Neural style transfer - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)