Зеркальный спуск
В математике зеркальный спуск — это итерационный оптимизации алгоритм для поиска локального минимума функции дифференцируемой .
Он обобщает такие алгоритмы, как градиентный спуск и мультипликативные веса .
История [ править ]
Зеркальный спуск был первоначально предложен Немировским и Юдиным в 1983 году. [1]
Мотивация [ править ]
При градиентном спуске с последовательностью скоростей обучения применительно к дифференцируемой функции , начинаешь с предположения за местный минимум и рассматривает последовательность такой, что
Это можно переформулировать, заметив, что
Другими словами, минимизирует приближение первого порядка к в с добавленным термином близости .
Этот квадрат евклидова расстояния является частным примером расстояния Брегмана . Использование других расстояний Брегмана приведет к появлению других алгоритмов, таких как Hedge , которые могут больше подходить для оптимизации по определенной геометрии. [2] [3]
Формулировка [ править ]
Нам дана выпуклая функция оптимизировать по выпуклому множеству , и при некоторой норме на .
Нам также дана дифференцируемая выпуклая функция , - сильно выпуклая относительно заданной нормы. Это называется функцией, производящей расстояние , а ее градиент известна как зеркальная карта .
Начиная с начального , в каждой итерации Mirror Descent:
- Карта двойного пространства:
- Обновите двойное пространство, используя шаг градиента:
- Вернитесь к первоначальному пространству:
- Проецируйте обратно в осуществимую область : , где – это расхождение Брегмана .
Расширения [ править ]
Зеркальный спуск в настройках онлайн-оптимизации известен как Online Mirror Descent (OMD). [4]
См. также [ править ]
- Градиентный спуск
- Метод мультипликативного обновления веса
- Алгоритм хеджирования
- Дивергенция Брегмана
Ссылки [ править ]
- ^ Аркадий Немировский и Давид Юдин. Сложность задач и эффективность методов оптимизации. Джон Уайли и сыновья, 1983 г.
- ^ Немировский, Аркадий (2012) Учебное пособие: алгоритмы зеркального спуска для крупномасштабной детерминированной и стохастической выпуклой оптимизации. https://www2.isye.gatech.edu/~nemrovs/COLT2012Tut.pdf
- ^ «Алгоритм спуска зеркала» . tlienart.github.io . Проверено 10 июля 2022 г.
- ^ Фанг, Хуан; Харви, Николас Дж.А.; Портелла, Виктор С.; Фридлендер, Майкл П. (3 сентября 2021 г.). «Онлайн-зеркальный спуск и двойное усреднение: не отставать в динамическом случае». arXiv : 2006.02585 [ cs.LG ].