Метод штрафа
Методы штрафов представляют собой определенный класс алгоритмов решения задач оптимизации с ограничениями .
Метод штрафов заменяет задачу оптимизации с ограничениями серией задач без ограничений, решения которых идеально сходятся к решению исходной задачи с ограничениями. Неограниченные задачи образуются путем добавления термина, называемого штрафной функцией , к целевой функции , которая состоит из штрафного параметра , умноженного на меру нарушения ограничений. Мера нарушения отлична от нуля, когда ограничения нарушаются, и равна нулю в области, где ограничения не нарушаются.
Описание [ править ]
Допустим, мы решаем следующую задачу с ограничениями:
при условии
Эту задачу можно решить как серию задач неограниченной минимизации.
где
В приведенных выше уравнениях – внешняя штрафная функция , а это штрафной коэффициент . Когда штрафной коэффициент равен 0, f p = f . На каждой итерации метода увеличиваем штрафной коэффициент (например, в 10 раз), решить задачу без ограничений и использовать решение в качестве первоначального предположения для следующей итерации. Решения последовательных задач без ограничений будут асимптотически сходиться к решению исходной задачи с ограничениями.
Конвергенция [ править ]
Сначала рассмотрим набор глобальных оптимизаторов исходной задачи X*. [1] : Thm.9.2.1 Предположим, что цель f имеет ограниченные множества уровня и что исходная задача осуществима. Затем:
- Для каждого штрафного коэффициента p множество глобальных оптимизаторов штрафной задачи X p * непусто.
- Для каждого ε>0 существует штрафной коэффициент p такой, что множество X p * содержится в ε-окрестности множества X*.
Эта теорема полезна в основном, когда f p выпукла, поскольку в этом случае мы можем найти глобальные оптимизаторы f p .
Вторая теорема рассматривает локальные оптимизаторы. [1] : Thm.9.2.2 Пусть x* — невырожденный локальный оптимизатор исходной задачи («невырожденный» означает, что градиенты активных ограничений линейно независимы и выполнено достаточное условие оптимальности второго порядка). Тогда существует окрестность V* точки x* и некоторый p 0 >0, такие что для всех p > p 0 штрафная цель f p имеет ровно одну критическую точку в V* (обозначаемую x*(p)) , а x*( p ) приближается к x* при p →∞. Кроме того, целевое значение f (x*( p )) слабо увеличивается с ростом p .
Практическое применение [ править ]
Алгоритмы оптимизации сжатия изображений могут использовать штрафные функции для выбора наилучшего способа сжатия цветовых зон до отдельных репрезентативных значений. [2] [3]
Преимущество метода штрафов заключается в том, что, как только у нас есть штрафная цель без ограничений, мы можем использовать любой метод неограниченной оптимизации для ее решения. Недостаток состоит в том, что с ростом штрафного коэффициента p безусловная задача становится плохо обусловленной - коэффициенты очень велики, и это может привести к числовым ошибкам и медленной сходимости безусловной минимизации. [1] : Под.9.2
См. также [ править ]
Барьерные методы представляют собой альтернативный класс алгоритмов ограниченной оптимизации. Эти методы также добавляют к целевой функции член, подобный штрафу, но в этом случае итерации вынуждены оставаться внутри допустимой области, и существует барьер, который смещает итерации, чтобы они оставались вдали от границы допустимой области. Они практически более эффективны, чем штрафные методы.
Расширенные методы Лагранжа — это альтернативные методы штрафов, которые позволяют получать решения с высокой точностью, не доводя штрафной коэффициент до бесконечности. Это облегчает решение неограниченных штрафных задач.
Другие алгоритмы нелинейного программирования:
- Последовательное квадратичное программирование
- Последовательное линейное программирование
- Последовательное линейно-квадратичное программирование
- Метод внутренней точки
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б с Немировский и Бен-Тал (2023). «Оптимизация III: Выпуклая оптимизация» (PDF) .
- ^ Галар, М.; Хурио, А.; Лопес-Молина, К.; Патернэн, Д.; Санс, Дж.; Бустинс, Х. (2013). «Функции агрегирования для объединения цветовых каналов RGB в стереосопоставлении». Оптика Экспресс . 21 (1): 1247–1257. дои : 10.1364/oe.21.001247 . hdl : 2454/21074 . ПМИД 23389018 .
- ^ «Исследователи восстанавливают изображение, используя версию, содержащую от 1 до 10 процентов информации» . Phys.org (Omicron Technology Limited) . Проверено 26 октября 2013 г.
Смит, Элис Э .; Койт Дэвид В. Штрафные функции. Справочник по эволюционным вычислениям, раздел C 5.2. Издательство Оксфордского университета и Издательство Института физики, 1996.
Коэльо, AC [1] : Теоретические и численные методы обработки ограничений, используемые с эволюционными алгоритмами: обзор современного уровня техники. Вычислить. Методы Прикл. Мех. англ. 191(11-12), 1245-1287
Курант Р. Вариационные методы решения задач равновесия и колебаний . Бык. амер. Математика. Сок., 49, 1–23, 1943.
Вотао, Ю. Алгоритмы оптимизации для ограниченной оптимизации . Департамент математики Калифорнийского университета в Лос-Анджелесе, 2015 г.