метод Брегмана

Метод Брегмана — это итерационный алгоритм для решения некоторых выпуклой оптимизации, задач включающих регуляризацию . ^[1] Оригинальная версия принадлежит Льву М. Брегману , опубликовавшему ее в 1967 году. ^[2]

Алгоритм представляет собой метод действия по строкам, осуществляющий доступ к функциям ограничений одну за другой, и этот метод особенно подходит для больших задач оптимизации, где ограничения могут быть эффективно пронумерованы. ^{[ нужна ссылка ]}. Алгоритм особенно хорошо работает для регуляризаторов, таких как $\ell _{1}$ норма, где она сходится очень быстро из-за эффекта компенсации ошибок. ^[3]

Алгоритм

Чтобы иметь возможность использовать метод Брегмана, необходимо сформулировать интересующую проблему как поиск $\min _{u}J(u)+f(u)$ , где $J$ является регуляризирующей функцией, такой как $\ell _{1}$ . ^[3]

Расстояние Брегмана определяется как $D^{p}(u,v):=J(u)-(J(v)+\langle p,u-v\rangle )$ где $p$ принадлежит субдифференциалу $J$ в $u$ (который мы обозначили $\partial J(u)$ ). ^[3]^[4] Выполняется итерация $u_{k+1}:=\min _{u}(\alpha D(u,u_{k})+f(u))$ , с $\alpha$ константа, выбираемая пользователем (и минимизация, выполняемая обычным алгоритмом выпуклой оптимизации), ^[3] или $u_{k+1}:=\min _{u}(D^{p_{k}}(u,u_{k})+f(u))$ , с $p_{k}$ каждый раз выбирался в качестве члена $\partial J(u_{k})$ . ^[4]

Алгоритм начинается с пары простых и двойственных переменных. Затем для каждого ограничения выполняется обобщенная проекция на его допустимый набор, обновляя как двойственную переменную ограничения, так и все основные переменные, для которых есть ненулевые коэффициенты в градиенте функций ограничений. В случае, если цель строго выпукла и все функции ограничений выпуклы, предел этой итеративной проекции сходится к оптимальной прямой дуальной паре. ^{[ нужна ссылка ]}

В случае преследования базиса задачи типа $\min _{x:Ax=b}(|x|_{1}+{\frac {1}{2\alpha }}|x|_{2}^{2})$ , метод Брегмана эквивалентен обычному градиентному спуску в двойственной задаче $\min _{y}(-b^{t}y+{\frac {\alpha }{2}}|A^{t}y-{\text{Proj}}_{[-1,1]^{n}}(A^{t}y)|^{2})$ . ^[5] В этом случае также имеет место точный эффект типа регуляризации; если $\alpha$ превышает определенный порог, оптимальное значение $x$ это именно оптимальное решение $\min _{x:Ax=b}|x|_{1}$ . ^[3]^[5]

Приложения

Метод Брегмана или его обобщения можно применять для:

Удаление размытия изображения или шумоподавление ^[3] (включая общее шумоподавление ^[4])
МРТ-изображение ^{[ нужны разъяснения ]} реконструкция ^[3]
Магнитно-резонансная томография ^[1]^[6]
Радар ^[1]
Гиперспектральная визуализация ^[7]
Сжатое зондирование ^[5]
Наименьшие абсолютные отклонения или $\ell _{1}$ -регуляризованная линейная регрессия ^[8]
Ковариационный выбор (обучение разреженной ковариационной матрицы) ^[8]
Завершение матрицы ^[9]
Структурная минимизация рисков ^[8]

Обобщения и недостатки

Метод имеет связи с методом множителей и методом двойного восхождения (посредством так называемого метода чередующихся направлений множителей Брегмана) . ^[10]^[7] обобщая метод чередующихся множителей ^[8]) и существует множество обобщений.

Одним из недостатков метода является то, что он доказуемо сходится только в том случае, если целевая функция строго выпукла. В случае, если это невозможно обеспечить, как для линейных программ или нестрого выпуклых квадратичных программ, дополнительные методы, такие как методы проксимального градиента . разработаны ^{[ нужна ссылка ]} В случае Рудина-Ошера-Фатеми модели шумоподавления изображения ^{[ нужны разъяснения ]}, метод Брегмана доказуемо сходится. ^[11]

Некоторые обобщения метода Брегмана включают:

Метод обратного масштаба пространства ^{[ нужны разъяснения ]}^[3]
Линеаризованный Брегман ^[3]
Логистический Брегман ^[3]
Сплит Брегман ^[3]

Линеаризованный Брегман

В линеаризованном методе Брегмана линеаризуются промежуточные целевые функции. $D^{p}(u,u_{k})+f(u)$ заменив второе слагаемое на $f(u_{k})+\langle f'(u_{k}),u-u_{k}\rangle$ (что приближает второй член вблизи $u_{k}$ ) и добавление срока наказания ${\frac {1}{2\delta }}|u-u_{k}|_{2}^{2}$ для постоянного $\delta$ . Результат становится гораздо более доступным в вычислительном отношении, особенно в поиска базиса . задачах типа ^[4]^[5] В случае общей задачи преследования базиса $\min \mu |u|_{1}+{\frac {1}{2}}|Au-f|_{2}^{2}$ , можно выразить итерацию как $v_{k+1}:=v_{k}+A^{t}(f-Au_{k}),u_{k+1,i}:=\delta ~{\text{shrink}}(v_{k,i},\mu )$ для каждого компонента $i$ , где мы определяем ${\text{shrink}}(y,a):={\begin{cases}y-a,&y\in (a,\infty )\\0,&y\in [-a,a]\\y+a,&y\in (-\infty ,-a)\end{cases}}$ . ^[4]

Иногда при использовании линеаризованного метода Брегмана бывают периоды «застоя», когда остаток ^{[ нужны разъяснения ]} практически постоянен. Чтобы облегчить эту проблему, можно использовать линеаризованный метод Брегмана с пинком , где по существу обнаруживается начало периода застоя, затем прогнозируется и переходит к его концу. ^[4]^[5]

Поскольку линеаризованный метод Брегмана математически эквивалентен градиентному спуску, его можно ускорить с помощью методов ускорения градиентного спуска, таких как поиск линии, L-BGFS , шаги Барзилай-Борвейна или метод Нестерова ; последний был предложен как ускоренный линеаризованный метод Брегмана . ^[5]^[9]

Сплит Брегман

Метод Сплит-Брегмана решает задачи вида $\min _{u}|\Phi (u)|_{1}+H(u)$ , где $\Phi$ и $H$ оба выпуклые, ^[4] особенно проблемы формы $\min _{u}|\Phi u|_{1}+|Ku-f|^{2}$ . ^[6] Начнем с того, что перепишем ее как задачу ограниченной оптимизации. $\min _{u:d=\Phi (u)}|d|_{1}+H(u)$ , затем расслабьте его в $\min _{u,d}|d|_{1}+H(u)+{\frac {\lambda }{2}}|d-\Phi (u)|_{2}^{2}$ где $\lambda$ является константой. Определив $J(u,d):=|d|+H(u)$ , можно свести задачу к задаче, которую можно решить с помощью обычного алгоритма Брегмана. ^[4]^[6]

Метод Сплит-Брегмана был обобщен для оптимизации комплексных чисел с использованием производных Виртингера . ^[1]

Ссылки

^ Jump up to: ^а ^б ^с ^д Сюн, Кай; Чжао, Гуанхуэй; Ши, Гуанмин; Ван, Инбинь (12 сентября 2019 г.). «Алгоритм выпуклой оптимизации для сжатого зондирования в сложной области: комплексный метод Брегмана с разделением» . Датчики . 19 (20) (опубликовано 18 октября 2019 г.): 4540. Бибкод : 2019Senso..19.4540X . дои : 10.3390/s19204540 . ПМК 6832202 . ПМИД 31635423 .
^ Брегман Л. «Релаксационный метод поиска общей точки выпуклых множеств и его применение к задачам оптимизации». Докл. Акад. Наук СССР, т. 171, № 5, 1966, стр. 1019-1022. (Английский перевод: Советские математические докл., т. 7, 1966, стр. 1578-1581)
^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к Инь, Вотао (8 декабря 2009 г.). «Методы Брегмана: обзор и новые результаты» (PDF) . Архивировано (PDF) из оригинала 13 июня 2010 г. Проверено 16 апреля 2021 г.
^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час Буш, Жаклин (10 июня 2011 г.). «Старшая диссертация Калифорнийского университета в Санта-Барбаре: алгоритмы Брегмана» (PDF) . Калифорнийский университет в Санта-Барбаре . Архивировано (PDF) из оригинала 30 ноября 2016 г. Проверено 16 апреля 2021 г.
^ Jump up to: ^а ^б ^с ^д ^и ^ж Инь, Вотао (28 мая 2009 г.). «Анализ и обобщения линеаризованного метода Брегмана» (PDF) . SIAM Journal on Imaging Sciences . 3 (4): 856–877. дои : 10.1137/090760350 . Проверено 16 апреля 2021 г.
^ Jump up to: ^а ^б ^с Гольдштейн, Том; Ошер, Стэнли (2 июня 2008 г.). «Метод Сплит-Брегмана для L1-регуляризованных задач» . СИАМ J. Imaging Sci . 2 (2): 323–343. дои : 10.1137/080725891 . Проверено 22 апреля 2021 г.
^ Jump up to: ^а ^б Цзян, Чуньчжи (май 2015 г.). «Сравнение ADMM с переменным штрафом и разделенным методом Брегмана в задачах гиперспектрального изображения» . Архивировано из оригинала 23 марта 2020 г. Проверено 20 апреля 2021 г.
^ Jump up to: ^а ^б ^с ^д Бойд, Стивен; Парих, Нил; Чу, Эрик; Пелеато, Борха; Экстайн, Джонатан (19 ноября 2010 г.). «Распределенная оптимизация и статистическое обучение с помощью метода множителей чередующегося направления». Основы и тенденции в машинном обучении . 3 : 1–122. CiteSeerX 10.1.1.722.981 . дои : 10.1561/2200000016 .
^ Jump up to: ^а ^б Хуан, Бо; Ма, Шицянь; Гольдфарб, Дональд (27 июня 2011 г.). «Ускоренный линеаризованный метод Брегмана». Журнал научных вычислений . 54 (2–3). Пленум Пресс (опубликовано 1 февраля 2013 г.): 428–453. arXiv : 1106.5413 . дои : 10.1007/s10915-012-9592-9 . ISSN 0885-7474 . S2CID 14781930 .
^ Ван, Хуахуа; Банерджи, Ариндам (13 июня 2013 г.). «Метод множителей переменного направления Брегмана». NIPS'14: Материалы 27-й Международной конференции по нейронным системам обработки информации . 2 : 2816–2824. arXiv : 1306.3203 .
^ Цзя, Жун-Цин (3 октября 2008 г.). «Анализ сходимости метода Брегмана для вариационной модели шумоподавления изображения» (PDF) . Прикладной и вычислительный гармонический анализ . 27 (3) (опубликовано в ноябре 2009 г.): 367–379. дои : 10.1016/j.acha.2009.05.002 . Проверено 22 апреля 2021 г.

[:4-1] Jump up to: ^а ^б ^с ^д Сюн, Кай; Чжао, Гуанхуэй; Ши, Гуанмин; Ван, Инбинь (12 сентября 2019 г.). «Алгоритм выпуклой оптимизации для сжатого зондирования в сложной области: комплексный метод Брегмана с разделением» . Датчики . 19 (20) (опубликовано 18 октября 2019 г.): 4540. Бибкод : 2019Senso..19.4540X . дои : 10.3390/s19204540 . ПМК 6832202 . ПМИД 31635423 .

[2] Брегман Л. «Релаксационный метод поиска общей точки выпуклых множеств и его применение к задачам оптимизации». Докл. Акад. Наук СССР, т. 171, № 5, 1966, стр. 1019-1022. (Английский перевод: Советские математические докл., т. 7, 1966, стр. 1578-1581)

[:0-3] Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к Инь, Вотао (8 декабря 2009 г.). «Методы Брегмана: обзор и новые результаты» (PDF) . Архивировано (PDF) из оригинала 13 июня 2010 г. Проверено 16 апреля 2021 г.

[:1-4] Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час Буш, Жаклин (10 июня 2011 г.). «Старшая диссертация Калифорнийского университета в Санта-Барбаре: алгоритмы Брегмана» (PDF) . Калифорнийский университет в Санта-Барбаре . Архивировано (PDF) из оригинала 30 ноября 2016 г. Проверено 16 апреля 2021 г.

[:2-5] Jump up to: ^а ^б ^с ^д ^и ^ж Инь, Вотао (28 мая 2009 г.). «Анализ и обобщения линеаризованного метода Брегмана» (PDF) . SIAM Journal on Imaging Sciences . 3 (4): 856–877. дои : 10.1137/090760350 . Проверено 16 апреля 2021 г.

[:5-6] Jump up to: ^а ^б ^с Гольдштейн, Том; Ошер, Стэнли (2 июня 2008 г.). «Метод Сплит-Брегмана для L1-регуляризованных задач» . СИАМ J. Imaging Sci . 2 (2): 323–343. дои : 10.1137/080725891 . Проверено 22 апреля 2021 г.

[:6-7] Jump up to: ^а ^б Цзян, Чуньчжи (май 2015 г.). «Сравнение ADMM с переменным штрафом и разделенным методом Брегмана в задачах гиперспектрального изображения» . Архивировано из оригинала 23 марта 2020 г. Проверено 20 апреля 2021 г.

[:3-8] Jump up to: ^а ^б ^с ^д Бойд, Стивен; Парих, Нил; Чу, Эрик; Пелеато, Борха; Экстайн, Джонатан (19 ноября 2010 г.). «Распределенная оптимизация и статистическое обучение с помощью метода множителей чередующегося направления». Основы и тенденции в машинном обучении . 3 : 1–122. CiteSeerX 10.1.1.722.981 . дои : 10.1561/2200000016 .

[:7-9] Jump up to: ^а ^б Хуан, Бо; Ма, Шицянь; Гольдфарб, Дональд (27 июня 2011 г.). «Ускоренный линеаризованный метод Брегмана». Журнал научных вычислений . 54 (2–3). Пленум Пресс (опубликовано 1 февраля 2013 г.): 428–453. arXiv : 1106.5413 . дои : 10.1007/s10915-012-9592-9 . ISSN 0885-7474 . S2CID 14781930 .

[10] Ван, Хуахуа; Банерджи, Ариндам (13 июня 2013 г.). «Метод множителей переменного направления Брегмана». NIPS'14: Материалы 27-й Международной конференции по нейронным системам обработки информации . 2 : 2816–2824. arXiv : 1306.3203 .

[11] Цзя, Жун-Цин (3 октября 2008 г.). «Анализ сходимости метода Брегмана для вариационной модели шумоподавления изображения» (PDF) . Прикладной и вычислительный гармонический анализ . 27 (3) (опубликовано в ноябре 2009 г.): 367–379. дои : 10.1016/j.acha.2009.05.002 . Проверено 22 апреля 2021 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]