Jump to content

Метод штрафа

Методы штрафов представляют собой определенный класс алгоритмов решения задач оптимизации с ограничениями .

Метод штрафов заменяет задачу оптимизации с ограничениями серией задач без ограничений, решения которых идеально сходятся к решению исходной задачи с ограничениями. Неограниченные задачи образуются путем добавления термина, называемого штрафной функцией , к целевой функции , которая состоит из штрафного параметра , умноженного на меру нарушения ограничений. Мера нарушения отлична от нуля, когда ограничения нарушаются, и равна нулю в области, где ограничения не нарушаются.

Описание [ править ]

Допустим, мы решаем следующую задачу с ограничениями:

при условии

Эту задачу можно решить как серию задач неограниченной минимизации.

где

В приведенных выше уравнениях внешняя штрафная функция , а это штрафной коэффициент . Когда штрафной коэффициент равен 0, f p = f . На каждой итерации метода увеличиваем штрафной коэффициент (например, в 10 раз), решить задачу без ограничений и использовать решение в качестве первоначального предположения для следующей итерации. Решения последовательных задач без ограничений будут асимптотически сходиться к решению исходной задачи с ограничениями.

Конвергенция [ править ]

Сначала рассмотрим набор глобальных оптимизаторов исходной задачи X*. [1] : Thm.9.2.1 Предположим, что цель f имеет ограниченные множества уровня и что исходная задача осуществима. Затем:

  • Для каждого штрафного коэффициента p множество глобальных оптимизаторов штрафной задачи X p * непусто.
  • Для каждого ε>0 существует штрафной коэффициент p такой, что множество X p * содержится в ε-окрестности множества X*.

Эта теорема полезна в основном, когда f p выпукла, поскольку в этом случае мы можем найти глобальные оптимизаторы f p .

Вторая теорема рассматривает локальные оптимизаторы. [1] : Thm.9.2.2 Пусть x* — невырожденный локальный оптимизатор исходной задачи («невырожденный» означает, что градиенты активных ограничений линейно независимы и выполнено достаточное условие оптимальности второго порядка). Тогда существует окрестность V* точки x* и некоторый p 0 >0, такие что для всех p > p 0 штрафная цель f p имеет ровно одну критическую точку в V* (обозначаемую x*(p)) , а x*( p ) приближается к x* при p →∞. Кроме того, целевое значение f (x*( p )) слабо увеличивается с ростом p .

Практическое применение [ править ]

Алгоритмы оптимизации сжатия изображений могут использовать штрафные функции для выбора наилучшего способа сжатия цветовых зон до отдельных репрезентативных значений. [2] [3]

Преимущество метода штрафов заключается в том, что, как только у нас есть штрафная цель без ограничений, мы можем использовать любой метод неограниченной оптимизации для ее решения. Недостаток состоит в том, что с ростом штрафного коэффициента p безусловная задача становится плохо обусловленной - коэффициенты очень велики, и это может привести к числовым ошибкам и медленной сходимости безусловной минимизации. [1] : Под.9.2

См. также [ править ]

Барьерные методы представляют собой альтернативный класс алгоритмов ограниченной оптимизации. Эти методы также добавляют к целевой функции член, подобный штрафу, но в этом случае итерации вынуждены оставаться внутри допустимой области, и существует барьер, который смещает итерации, чтобы они оставались вдали от границы допустимой области. Они практически более эффективны, чем штрафные методы.

Расширенные методы Лагранжа — это альтернативные методы штрафов, которые позволяют получать решения с высокой точностью, не доводя штрафной коэффициент до бесконечности. Это облегчает решение неограниченных штрафных задач.

Другие алгоритмы нелинейного программирования:

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б с Немировский и Бен-Тал (2023). «Оптимизация III: Выпуклая оптимизация» (PDF) .
  2. ^ Галар, М.; Хурио, А.; Лопес-Молина, К.; Патернэн, Д.; Санс, Дж.; Бустинс, Х. (2013). «Функции агрегирования для объединения цветовых каналов RGB в стереосопоставлении». Оптика Экспресс . 21 (1): 1247–1257. дои : 10.1364/oe.21.001247 . hdl : 2454/21074 . ПМИД   23389018 .
  3. ^ «Исследователи восстанавливают изображение, используя версию, содержащую от 1 до 10 процентов информации» . Phys.org (Omicron Technology Limited) . Проверено 26 октября 2013 г.

Смит, Элис Э .; Койт Дэвид В. Штрафные функции. Справочник по эволюционным вычислениям, раздел C 5.2. Издательство Оксфордского университета и Издательство Института физики, 1996.

Коэльо, AC [1] : Теоретические и численные методы обработки ограничений, используемые с эволюционными алгоритмами: обзор современного уровня техники. Вычислить. Методы Прикл. Мех. англ. 191(11-12), 1245-1287

Курант Р. Вариационные методы решения задач равновесия и колебаний . Бык. амер. Математика. Сок., 49, 1–23, 1943.

Вотао, Ю. Алгоритмы оптимизации для ограниченной оптимизации . Департамент математики Калифорнийского университета в Лос-Анджелесе, 2015 г.

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b285c2ae96b29424c2b7b37785800d00__1716494880
URL1:https://arc.ask3.ru/arc/aa/b2/00/b285c2ae96b29424c2b7b37785800d00.html
Заголовок, (Title) документа по адресу, URL1:
Penalty method - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)