Условия Вульфа
неограниченной минимизации В задаче условия Вульфа представляют собой набор неравенств для выполнения неточного поиска прямой , особенно в квазиньютоновских методах , впервые опубликованных Филипом Вулфом в 1969 году. [1] [2]
Идея этих методов состоит в том, чтобы найти
Неточные поиски строк обеспечивают эффективный способ вычисления приемлемой длины шага. это уменьшает целевую функцию «достаточно», а не минимизирует целевую функцию по точно. Алгоритм поиска строки может использовать условия Вульфа в качестве требования для любого угаданного значения. , прежде чем найти новое направление поиска .
Правило Армихо и кривизна [ править ]
Длина шага Говорят, что он удовлетворяет условиям Вульфа , ограниченным направлением , если выполняются следующие два неравенства:
с . (При рассмотрении условия (ii) напомним, что для того, чтобы убедиться в том, что это направление спуска, мы имеем , как и в случае градиентного спуска , где , или Ньютона–Рафсона , где с положительно определенный.)
обычно выбирается довольно небольшим, в то время как намного больше; Нокедал и Райт приводят примеры значений и для методов Ньютона или квазиньютона и для метода нелинейного сопряженного градиента . [3] Неравенство i) известно как правило Армихо . [4] и ii) как условие кривизны ; и) обеспечивает соблюдение длины шага уменьшается «достаточно», и ii) гарантирует, что наклон достаточно уменьшен. Условия i) и ii) можно интерпретировать как обеспечивающие соответственно верхнюю и нижнюю границу допустимых значений длины шага.
Сильное условие Вульфа на кривизне [ править ]
Обозначим одномерную функцию ограничено направлением как . Условия Вульфа могут привести к значению длины шага, которое не близко к минимизатору . Если мы изменим условие кривизны следующим образом:
тогда i) и iii) вместе образуют так называемые сильные условия Вульфа и заставляют находиться вблизи критической точки .
Обоснование [ править ]
Основная причина наложения условий Вульфа в алгоритме оптимизации, где заключается в обеспечении сходимости градиента к нулю. В частности, если косинус угла между и градиент,
Дополнительная мотивация в случае квазиньютоновского метода заключается в том, что если , где матрица обновляется по формуле BFGS или DFP , то если положительно определен ii) подразумевает также положительно определена.
Комментарии [ править ]
Условия Вульфа сложнее, чем условия Армихо, и алгоритм градиентного спуска, основанный на условии Армихо, имеет лучшую теоретическую гарантию, чем алгоритм, основанный на условиях Вульфа (см. разделы «Верхняя граница скорости обучения» и «Теоретическая гарантия»). в статье Поиск по строке с возвратом ).
См. также [ править ]
Ссылки [ править ]
- ^ Вулф, П. (1969). «Условия сходимости методов восхождения». Обзор СИАМ . 11 (2): 226–235. дои : 10.1137/1011036 . JSTOR 2028111 .
- ^ Вулф, П. (1971). «Условия сходимости методов восхождения. II: Некоторые исправления». Обзор СИАМ . 13 (2): 185–188. дои : 10.1137/1013035 . JSTOR 2028821 .
- ^ Носедаль, Хорхе ; Райт, Стивен (1999). Численная оптимизация . п. 38.
- ^ Армихо, Ларри (1966). «Минимизация функций, имеющих липшицевы непрерывные первые частные производные» . Пасифик Дж. Математика . 16 (1): 1–3. дои : 10.2140/pjm.1966.16.1 .
Дальнейшее чтение [ править ]
- «Методы поиска строк». Численная оптимизация . Серия Springer по исследованию операций и финансовой инженерии. 2006. стр. 30–32. дои : 10.1007/978-0-387-40065-5_3 . ISBN 978-0-387-30303-1 .
- «Квазиньютоновские методы». Численная оптимизация . Серия Springer по исследованию операций и финансовой инженерии. 2006. стр. 135–163. дои : 10.1007/978-0-387-40065-5_6 . ISBN 978-0-387-30303-1 .