Jump to content

Доверительный регион

В математической оптимизации область доверия — это подмножество области целевой функции , которая аппроксимируется с помощью модельной функции (часто квадратичной ). Если в доверительной области найдена адекватная модель целевой функции, то область расширяется; и наоборот, если приближение плохое, область сжимается.

Соответствие оценивается путем сравнения отношения ожидаемого улучшения от аппроксимации модели с фактическим улучшением, наблюдаемым в целевой функции. Простое установление порога отношения используется в качестве критерия расширения и сжатия - модельной функции «доверяют» только в той области, где она обеспечивает разумное приближение.

Методы доверительной области в некотором смысле двойственны методам линейного поиска : методы доверительной области сначала выбирают размер шага (размер доверительной области), а затем направление шага, тогда как методы линейного поиска сначала выбирают направление шага, а затем размер шага.

Общая идея методов доверительной области известна под многими именами; самое раннее использование этого термина, по-видимому, принадлежит Соренсену (1982). [1] Популярный учебник Флетчера (1980) называет эти алгоритмы методами с ограниченным шагом . [2] Кроме того, в ранней основополагающей работе по этому методу Голдфельд , Квандт и Троттер (1966) называют его квадратичным восхождением на холм . [3]

Пример [ править ]

Концептуально в алгоритме Левенберга-Марквардта целевая функция итеративно аппроксимируется квадратичной поверхностью , затем с помощью линейного решателя оценка обновляется. Одно это может не сойтись должным образом, если первоначальное предположение слишком далеко от оптимального. По этой причине алгоритм вместо этого ограничивает каждый шаг, не позволяя ему зайти «слишком далеко». Это действует «слишком далеко» следующим образом. Вместо того, чтобы решать для , это решает , где — диагональная матрица с той же диагональю, что и A , а λ — параметр, управляющий размером доверительной области. Геометрически это добавляет параболоид с центром в к квадратичной форме , что приводит к меньшему шагу.

Хитрость заключается в том, чтобы изменить размер доверительной области (λ). На каждой итерации демпфированная квадратичная аппроксимация предсказывает определенное уменьшение функции стоимости: , что, как мы ожидаем, будет меньшим сокращением, чем истинное сокращение. Данный , мы можем оценить

Глядя на соотношение , мы можем настроить размер доверительной области. В общем, мы ожидаем быть немного меньше, чем , и поэтому соотношение будет, скажем, между 0,25 и 0,5. Если коэффициент больше 0,5, то мы слишком сильно демпфируем шаг, поэтому расширяем область доверия (уменьшаем λ) и выполняем итерацию. Если соотношение меньше 0,25, то истинная функция «слишком сильно» отличается от приближения доверительной области, поэтому сократите доверительную область (увеличьте λ) и повторите попытку.

Ссылки [ править ]

  1. ^ Соренсен, округ Колумбия (1982). «Метод Ньютона с модификацией модельной доверительной области» . СИАМ Дж. Нумер. Анал . 19 (2): 409–426. дои : 10.1137/0719026 .
  2. ^ Флетчер, Роджер (1987) [1980]. «Методы ограниченного шага». Практические методы оптимизации (Второе изд.). Уайли. ISBN  0-471-91547-5 .
  3. ^ Голдфельд, Стивен М.; Квандт, Ричард Э.; Троттер, Хейл Ф. (1966). «Максимизация путем квадратичного восхождения на холм». Эконометрика . 34 (3): 541–551. дои : 10.2307/1909768 . JSTOR   1909768 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6f85288909d111e63ecbb0c5e0c5ff7d__1698856440
URL1:https://arc.ask3.ru/arc/aa/6f/7d/6f85288909d111e63ecbb0c5e0c5ff7d.html
Заголовок, (Title) документа по адресу, URL1:
Trust region - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)