Барьерная функция
В ограниченной оптимизации , области математики , барьерная функция — это непрерывная функция , значение которой увеличивается до бесконечности по мере приближения ее аргумента к границе допустимой области задачи оптимизации. [1] [2] Такие функции используются для замены ограничений- неравенств штрафным членом целевой функции, с которым легче справиться. Барьерную функцию также называют внутренней штрафной функцией , поскольку это штрафная функция, которая заставляет решение оставаться внутри допустимой области.
Двумя наиболее распространенными типами барьерных функций являются обратные барьерные функции и логарифмические барьерные функции. Возобновление интереса к логарифмическим барьерным функциям было мотивировано их связью с методами прямо-двойственной внутренней точки .
Мотивация
[ редактировать ]Рассмотрим следующую задачу ограниченной оптимизации:
- минимизировать f ( x )
- при условии x ≤ b
где b — некоторая константа. Если кто-то хочет удалить ограничение неравенства, проблему можно переформулировать как
- минимизировать f ( x ) + c ( x ) ,
- где c ( x ) = ∞, если x > b , и ноль в противном случае.
Эта проблема эквивалентна первой. Он избавляет от неравенства, но создает проблему, заключающуюся в том, что штрафная функция c и, следовательно, целевая функция f ( x ) + c ( x ) являются разрывными , что не позволяет использовать исчисление для ее решения.
Барьерная функция теперь представляет собой непрерывное приближение g к c , которое стремится к бесконечности, когда x приближается к b сверху. С использованием такой функции формулируется новая задача оптимизации, а именно.
- минимизировать f ( x ) + μ g ( x )
где µ > 0 — свободный параметр. Эта задача не эквивалентна исходной, но по мере того, как µ приближается к нулю, она становится все лучшим приближением. [3]
Логарифмическая барьерная функция
[ редактировать ]Для логарифмических барьерных функций определяется как когда и в противном случае (в одном измерении; определение в более высоких измерениях см. ниже). По существу это зависит от того, что стремится к отрицательной бесконечности, так как стремится к 0.
Это вводит градиент в оптимизируемую функцию, который благоприятствует менее экстремальным значениям (в этом случае значения ниже, чем ), при этом оказывая относительно небольшое влияние на функцию вдали от этих крайностей.
Логарифмические барьерные функции могут быть предпочтительнее менее затратных в вычислительном отношении обратных барьерных функций в зависимости от оптимизируемой функции.
Высшие измерения
[ редактировать ]Распространение на более высокие измерения просто, при условии, что каждое измерение независимо. Для каждой переменной которое должно быть ограничено строго ниже, чем , добавлять .
Формальное определение
[ редактировать ]Свернуть при условии
Предположим, что это строго осуществимо:
Определить логарифмический барьер
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Nesterov, Yurii (2018). Lectures on Convex Optimization (2 ed.). Cham, Switzerland: Springer. p. 56. ISBN 978-3-319-91577-7 .
- ^ Носедаль, Хорхе; Райт, Стивен (2006). Численная оптимизация (2-е изд.). Нью-Йорк, штат Нью-Йорк: Спрингер. п. 566. ИСБН 0-387-30303-0 .
- ^ Вандербей, Роберт Дж. (2001). Линейное программирование: основы и расширения . Клювер. стр. 277–279.
Внешние ссылки
[ редактировать ]- Лекция 14: Барьерный метод от профессора Ливена Ванденберге из Калифорнийского университета в Лос-Анджелесе.