Jump to content

Зеркальный спуск

В математике зеркальный спуск — это итерационный оптимизации алгоритм для поиска локального минимума функции дифференцируемой .

Он обобщает такие алгоритмы, как градиентный спуск и мультипликативные веса .

История [ править ]

Зеркальный спуск был первоначально предложен Немировским и Юдиным в 1983 году. [1]

Мотивация [ править ]

При градиентном спуске с последовательностью скоростей обучения применительно к дифференцируемой функции , начинаешь с предположения за местный минимум и рассматривает последовательность такой, что

Это можно переформулировать, заметив, что

Другими словами, минимизирует приближение первого порядка к в с добавленным термином близости .

Этот квадрат евклидова расстояния является частным примером расстояния Брегмана . Использование других расстояний Брегмана приведет к появлению других алгоритмов, таких как Hedge , которые могут больше подходить для оптимизации по определенной геометрии. [2] [3]

Формулировка [ править ]

Нам дана выпуклая функция оптимизировать по выпуклому множеству , и при некоторой норме на .

Нам также дана дифференцируемая выпуклая функция , - сильно выпуклая относительно заданной нормы. Это называется функцией, производящей расстояние , а ее градиент известна как зеркальная карта .

Начиная с начального , в каждой итерации Mirror Descent:

  • Карта двойного пространства:
  • Обновите двойное пространство, используя шаг градиента:
  • Вернитесь к первоначальному пространству:
  • Проецируйте обратно в осуществимую область : , где – это расхождение Брегмана .

Расширения [ править ]

Зеркальный спуск в настройках онлайн-оптимизации известен как Online Mirror Descent (OMD). [4]

См. также [ править ]

Ссылки [ править ]

  1. ^ Аркадий Немировский и Давид Юдин. Сложность задач и эффективность методов оптимизации. Джон Уайли и сыновья, 1983 г.
  2. ^ Немировский, Аркадий (2012) Учебное пособие: алгоритмы зеркального спуска для крупномасштабной детерминированной и стохастической выпуклой оптимизации. https://www2.isye.gatech.edu/~nemrovs/COLT2012Tut.pdf
  3. ^ «Алгоритм спуска зеркала» . tlienart.github.io . Проверено 10 июля 2022 г.
  4. ^ Фанг, Хуан; Харви, Николас Дж.А.; Портелла, Виктор С.; Фридлендер, Майкл П. (3 сентября 2021 г.). «Онлайн-зеркальный спуск и двойное усреднение: не отставать в динамическом случае». arXiv : 2006.02585 [ cs.LG ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d2ad904b0c0ed496cc2a49a7bfff570f__1695468600
URL1:https://arc.ask3.ru/arc/aa/d2/0f/d2ad904b0c0ed496cc2a49a7bfff570f.html
Заголовок, (Title) документа по адресу, URL1:
Mirror descent - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)