метод Брегмана
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Метод Брегмана — это итерационный алгоритм для решения некоторых выпуклой оптимизации, задач включающих регуляризацию . [1] Оригинальная версия принадлежит Льву М. Брегману , опубликовавшему ее в 1967 году. [2]
Алгоритм представляет собой метод действия по строкам, осуществляющий доступ к функциям ограничений одну за другой, и этот метод особенно подходит для больших задач оптимизации, где ограничения могут быть эффективно пронумерованы. [ нужна ссылка ] . Алгоритм особенно хорошо работает для регуляризаторов, таких как норма, где она сходится очень быстро из-за эффекта компенсации ошибок. [3]
Алгоритм
[ редактировать ]Чтобы иметь возможность использовать метод Брегмана, необходимо сформулировать интересующую проблему как поиск , где является регуляризирующей функцией, такой как . [3]
Расстояние Брегмана определяется как где принадлежит субдифференциалу в (который мы обозначили ). [3] [4] Выполняется итерация , с константа, выбираемая пользователем (и минимизация, выполняемая обычным алгоритмом выпуклой оптимизации), [3] или , с каждый раз выбирался в качестве члена . [4]
Алгоритм начинается с пары простых и двойственных переменных. Затем для каждого ограничения выполняется обобщенная проекция на его допустимый набор, обновляя как двойственную переменную ограничения, так и все основные переменные, для которых есть ненулевые коэффициенты в градиенте функций ограничений. В случае, если цель строго выпукла и все функции ограничений выпуклы, предел этой итеративной проекции сходится к оптимальной прямой дуальной паре. [ нужна ссылка ]
В случае преследования базиса задачи типа , метод Брегмана эквивалентен обычному градиентному спуску в двойственной задаче . [5] В этом случае также имеет место точный эффект типа регуляризации; если превышает определенный порог, оптимальное значение это именно оптимальное решение . [3] [5]
Приложения
[ редактировать ]Метод Брегмана или его обобщения можно применять для:
- Удаление размытия изображения или шумоподавление [3] (включая общее шумоподавление [4] )
- МРТ-изображение [ нужны разъяснения ] реконструкция [3]
- Магнитно-резонансная томография [1] [6]
- Радар [1]
- Гиперспектральная визуализация [7]
- Сжатое зондирование [5]
- Наименьшие абсолютные отклонения или -регуляризованная линейная регрессия [8]
- Ковариационный выбор (обучение разреженной ковариационной матрицы) [8]
- Завершение матрицы [9]
- Структурная минимизация рисков [8]
Обобщения и недостатки
[ редактировать ]Метод имеет связи с методом множителей и методом двойного восхождения (посредством так называемого метода чередующихся направлений множителей Брегмана) . [10] [7] обобщая метод чередующихся множителей [8] ) и существует множество обобщений.
Одним из недостатков метода является то, что он доказуемо сходится только в том случае, если целевая функция строго выпукла. В случае, если это невозможно обеспечить, как для линейных программ или нестрого выпуклых квадратичных программ, дополнительные методы, такие как методы проксимального градиента . разработаны [ нужна ссылка ] В случае Рудина-Ошера-Фатеми модели шумоподавления изображения [ нужны разъяснения ] , метод Брегмана доказуемо сходится. [11]
Некоторые обобщения метода Брегмана включают:
- Метод обратного масштаба пространства [ нужны разъяснения ] [3]
- Линеаризованный Брегман [3]
- Логистический Брегман [3]
- Сплит Брегман [3]
Линеаризованный Брегман
[ редактировать ]В линеаризованном методе Брегмана линеаризуются промежуточные целевые функции. заменив второе слагаемое на (что приближает второй член вблизи ) и добавление срока наказания для постоянного . Результат становится гораздо более доступным в вычислительном отношении, особенно в поиска базиса . задачах типа [4] [5] В случае общей задачи преследования базиса , можно выразить итерацию как для каждого компонента , где мы определяем . [4]
Иногда при использовании линеаризованного метода Брегмана бывают периоды «застоя», когда остаток [ нужны разъяснения ] практически постоянен. Чтобы облегчить эту проблему, можно использовать линеаризованный метод Брегмана с пинком , где по существу обнаруживается начало периода застоя, затем прогнозируется и переходит к его концу. [4] [5]
Поскольку линеаризованный метод Брегмана математически эквивалентен градиентному спуску, его можно ускорить с помощью методов ускорения градиентного спуска, таких как поиск линии, L-BGFS , шаги Барзилай-Борвейна или метод Нестерова ; последний был предложен как ускоренный линеаризованный метод Брегмана . [5] [9]
Сплит Брегман
[ редактировать ]Метод Сплит-Брегмана решает задачи вида , где и оба выпуклые, [4] особенно проблемы формы . [6] Начнем с того, что перепишем ее как задачу ограниченной оптимизации. , затем расслабьте его в где является константой. Определив , можно свести задачу к задаче, которую можно решить с помощью обычного алгоритма Брегмана. [4] [6]
Метод Сплит-Брегмана был обобщен для оптимизации комплексных чисел с использованием производных Виртингера . [1]
Ссылки
[ редактировать ]- ^ Jump up to: а б с д Сюн, Кай; Чжао, Гуанхуэй; Ши, Гуанмин; Ван, Инбинь (12 сентября 2019 г.). «Алгоритм выпуклой оптимизации для сжатого зондирования в сложной области: комплексный метод Брегмана с разделением» . Датчики . 19 (20) (опубликовано 18 октября 2019 г.): 4540. Бибкод : 2019Senso..19.4540X . дои : 10.3390/s19204540 . ПМК 6832202 . ПМИД 31635423 .
- ^ Брегман Л. «Релаксационный метод поиска общей точки выпуклых множеств и его применение к задачам оптимизации». Докл. Акад. Наук СССР, т. 171, № 5, 1966, стр. 1019-1022. (Английский перевод: Советские математические докл., т. 7, 1966, стр. 1578-1581)
- ^ Jump up to: а б с д и ж г час я дж к Инь, Вотао (8 декабря 2009 г.). «Методы Брегмана: обзор и новые результаты» (PDF) . Архивировано (PDF) из оригинала 13 июня 2010 г. Проверено 16 апреля 2021 г.
- ^ Jump up to: а б с д и ж г час Буш, Жаклин (10 июня 2011 г.). «Старшая диссертация Калифорнийского университета в Санта-Барбаре: алгоритмы Брегмана» (PDF) . Калифорнийский университет в Санта-Барбаре . Архивировано (PDF) из оригинала 30 ноября 2016 г. Проверено 16 апреля 2021 г.
- ^ Jump up to: а б с д и ж Инь, Вотао (28 мая 2009 г.). «Анализ и обобщения линеаризованного метода Брегмана» (PDF) . SIAM Journal on Imaging Sciences . 3 (4): 856–877. дои : 10.1137/090760350 . Проверено 16 апреля 2021 г.
- ^ Jump up to: а б с Гольдштейн, Том; Ошер, Стэнли (2 июня 2008 г.). «Метод Сплит-Брегмана для L1-регуляризованных задач» . СИАМ J. Imaging Sci . 2 (2): 323–343. дои : 10.1137/080725891 . Проверено 22 апреля 2021 г.
- ^ Jump up to: а б Цзян, Чуньчжи (май 2015 г.). «Сравнение ADMM с переменным штрафом и разделенным методом Брегмана в задачах гиперспектрального изображения» . Архивировано из оригинала 23 марта 2020 г. Проверено 20 апреля 2021 г.
- ^ Jump up to: а б с д Бойд, Стивен; Парих, Нил; Чу, Эрик; Пелеато, Борха; Экстайн, Джонатан (19 ноября 2010 г.). «Распределенная оптимизация и статистическое обучение с помощью метода множителей чередующегося направления». Основы и тенденции в машинном обучении . 3 : 1–122. CiteSeerX 10.1.1.722.981 . дои : 10.1561/2200000016 .
- ^ Jump up to: а б Хуан, Бо; Ма, Шицянь; Гольдфарб, Дональд (27 июня 2011 г.). «Ускоренный линеаризованный метод Брегмана». Журнал научных вычислений . 54 (2–3). Пленум Пресс (опубликовано 1 февраля 2013 г.): 428–453. arXiv : 1106.5413 . дои : 10.1007/s10915-012-9592-9 . ISSN 0885-7474 . S2CID 14781930 .
- ^ Ван, Хуахуа; Банерджи, Ариндам (13 июня 2013 г.). «Метод множителей переменного направления Брегмана». NIPS'14: Материалы 27-й Международной конференции по нейронным системам обработки информации . 2 : 2816–2824. arXiv : 1306.3203 .
- ^ Цзя, Жун-Цин (3 октября 2008 г.). «Анализ сходимости метода Брегмана для вариационной модели шумоподавления изображения» (PDF) . Прикладной и вычислительный гармонический анализ . 27 (3) (опубликовано в ноябре 2009 г.): 367–379. дои : 10.1016/j.acha.2009.05.002 . Проверено 22 апреля 2021 г.