Jump to content

метод Брегмана

Метод Брегмана — это итерационный алгоритм для решения некоторых выпуклой оптимизации, задач включающих регуляризацию . [1] Оригинальная версия принадлежит Льву М. Брегману , опубликовавшему ее в 1967 году. [2]

Алгоритм представляет собой метод действия по строкам, осуществляющий доступ к функциям ограничений одну за другой, и этот метод особенно подходит для больших задач оптимизации, где ограничения могут быть эффективно пронумерованы. [ нужна ссылка ] . Алгоритм особенно хорошо работает для регуляризаторов, таких как норма, где она сходится очень быстро из-за эффекта компенсации ошибок. [3]

Алгоритм

[ редактировать ]

Чтобы иметь возможность использовать метод Брегмана, необходимо сформулировать интересующую проблему как поиск , где является регуляризирующей функцией, такой как . [3]

Расстояние Брегмана определяется как где принадлежит субдифференциалу в (который мы обозначили ). [3] [4] Выполняется итерация , с константа, выбираемая пользователем (и минимизация, выполняемая обычным алгоритмом выпуклой оптимизации), [3] или , с каждый раз выбирался в качестве члена . [4]

Алгоритм начинается с пары простых и двойственных переменных. Затем для каждого ограничения выполняется обобщенная проекция на его допустимый набор, обновляя как двойственную переменную ограничения, так и все основные переменные, для которых есть ненулевые коэффициенты в градиенте функций ограничений. В случае, если цель строго выпукла и все функции ограничений выпуклы, предел этой итеративной проекции сходится к оптимальной прямой дуальной паре. [ нужна ссылка ]

В случае преследования базиса задачи типа , метод Брегмана эквивалентен обычному градиентному спуску в двойственной задаче . [5] В этом случае также имеет место точный эффект типа регуляризации; если превышает определенный порог, оптимальное значение это именно оптимальное решение . [3] [5]

Приложения

[ редактировать ]

Метод Брегмана или его обобщения можно применять для:

Обобщения и недостатки

[ редактировать ]

Метод имеет связи с методом множителей и методом двойного восхождения (посредством так называемого метода чередующихся направлений множителей Брегмана) . [10] [7] обобщая метод чередующихся множителей [8] ) и существует множество обобщений.

Одним из недостатков метода является то, что он доказуемо сходится только в том случае, если целевая функция строго выпукла. В случае, если это невозможно обеспечить, как для линейных программ или нестрого выпуклых квадратичных программ, дополнительные методы, такие как методы проксимального градиента . разработаны [ нужна ссылка ] В случае Рудина-Ошера-Фатеми модели шумоподавления изображения [ нужны разъяснения ] , метод Брегмана доказуемо сходится. [11]

Некоторые обобщения метода Брегмана включают:

Линеаризованный Брегман

[ редактировать ]

В линеаризованном методе Брегмана линеаризуются промежуточные целевые функции. заменив второе слагаемое на (что приближает второй член вблизи ) и добавление срока наказания для постоянного . Результат становится гораздо более доступным в вычислительном отношении, особенно в поиска базиса . задачах типа [4] [5] В случае общей задачи преследования базиса , можно выразить итерацию как для каждого компонента , где мы определяем . [4]

Иногда при использовании линеаризованного метода Брегмана бывают периоды «застоя», когда остаток [ нужны разъяснения ] практически постоянен. Чтобы облегчить эту проблему, можно использовать линеаризованный метод Брегмана с пинком , где по существу обнаруживается начало периода застоя, затем прогнозируется и переходит к его концу. [4] [5]

Поскольку линеаризованный метод Брегмана математически эквивалентен градиентному спуску, его можно ускорить с помощью методов ускорения градиентного спуска, таких как поиск линии, L-BGFS , шаги Барзилай-Борвейна или метод Нестерова ; последний был предложен как ускоренный линеаризованный метод Брегмана . [5] [9]

Сплит Брегман

[ редактировать ]

Метод Сплит-Брегмана решает задачи вида , где и оба выпуклые, [4] особенно проблемы формы . [6] Начнем с того, что перепишем ее как задачу ограниченной оптимизации. , затем расслабьте его в где является константой. Определив , можно свести задачу к задаче, которую можно решить с помощью обычного алгоритма Брегмана. [4] [6]

Метод Сплит-Брегмана был обобщен для оптимизации комплексных чисел с использованием производных Виртингера . [1]

  1. ^ Jump up to: а б с д Сюн, Кай; Чжао, Гуанхуэй; Ши, Гуанмин; Ван, Инбинь (12 сентября 2019 г.). «Алгоритм выпуклой оптимизации для сжатого зондирования в сложной области: комплексный метод Брегмана с разделением» . Датчики . 19 (20) (опубликовано 18 октября 2019 г.): 4540. Бибкод : 2019Senso..19.4540X . дои : 10.3390/s19204540 . ПМК   6832202 . ПМИД   31635423 .
  2. ^ Брегман Л. «Релаксационный метод поиска общей точки выпуклых множеств и его применение к задачам оптимизации». Докл. Акад. Наук СССР, т. 171, № 5, 1966, стр. 1019-1022. (Английский перевод: Советские математические докл., т. 7, 1966, стр. 1578-1581)
  3. ^ Jump up to: а б с д и ж г час я дж к Инь, Вотао (8 декабря 2009 г.). «Методы Брегмана: обзор и новые результаты» (PDF) . Архивировано (PDF) из оригинала 13 июня 2010 г. Проверено 16 апреля 2021 г.
  4. ^ Jump up to: а б с д и ж г час Буш, Жаклин (10 июня 2011 г.). «Старшая диссертация Калифорнийского университета в Санта-Барбаре: алгоритмы Брегмана» (PDF) . Калифорнийский университет в Санта-Барбаре . Архивировано (PDF) из оригинала 30 ноября 2016 г. Проверено 16 апреля 2021 г.
  5. ^ Jump up to: а б с д и ж Инь, Вотао (28 мая 2009 г.). «Анализ и обобщения линеаризованного метода Брегмана» (PDF) . SIAM Journal on Imaging Sciences . 3 (4): 856–877. дои : 10.1137/090760350 . Проверено 16 апреля 2021 г.
  6. ^ Jump up to: а б с Гольдштейн, Том; Ошер, Стэнли (2 июня 2008 г.). «Метод Сплит-Брегмана для L1-регуляризованных задач» . СИАМ J. Imaging Sci . 2 (2): 323–343. дои : 10.1137/080725891 . Проверено 22 апреля 2021 г.
  7. ^ Jump up to: а б Цзян, Чуньчжи (май 2015 г.). «Сравнение ADMM с переменным штрафом и разделенным методом Брегмана в задачах гиперспектрального изображения» . Архивировано из оригинала 23 марта 2020 г. Проверено 20 апреля 2021 г.
  8. ^ Jump up to: а б с д Бойд, Стивен; Парих, Нил; Чу, Эрик; Пелеато, Борха; Экстайн, Джонатан (19 ноября 2010 г.). «Распределенная оптимизация и статистическое обучение с помощью метода множителей чередующегося направления». Основы и тенденции в машинном обучении . 3 : 1–122. CiteSeerX   10.1.1.722.981 . дои : 10.1561/2200000016 .
  9. ^ Jump up to: а б Хуан, Бо; Ма, Шицянь; Гольдфарб, Дональд (27 июня 2011 г.). «Ускоренный линеаризованный метод Брегмана». Журнал научных вычислений . 54 (2–3). Пленум Пресс (опубликовано 1 февраля 2013 г.): 428–453. arXiv : 1106.5413 . дои : 10.1007/s10915-012-9592-9 . ISSN   0885-7474 . S2CID   14781930 .
  10. ^ Ван, Хуахуа; Банерджи, Ариндам (13 июня 2013 г.). «Метод множителей переменного направления Брегмана». NIPS'14: Материалы 27-й Международной конференции по нейронным системам обработки информации . 2 : 2816–2824. arXiv : 1306.3203 .
  11. ^ Цзя, Жун-Цин (3 октября 2008 г.). «Анализ сходимости метода Брегмана для вариационной модели шумоподавления изображения» (PDF) . Прикладной и вычислительный гармонический анализ . 27 (3) (опубликовано в ноябре 2009 г.): 367–379. дои : 10.1016/j.acha.2009.05.002 . Проверено 22 апреля 2021 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8b6f626b61d929c7c4090b55bc24a9b0__1706768460
URL1:https://arc.ask3.ru/arc/aa/8b/b0/8b6f626b61d929c7c4090b55bc24a9b0.html
Заголовок, (Title) документа по адресу, URL1:
Bregman method - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)