Оптимизация суммы квадратов
задача оптимизации Программа оптимизации суммы квадратов — это с линейной функцией стоимости и определенным типом ограничений на переменные решения. Эти ограничения имеют вид: когда переменные решения используются в качестве коэффициентов в определенных полиномах , эти полиномы должны иметь свойство полиномиального SOS . При фиксации максимальной степени задействованных полиномов оптимизация суммы квадратов также известна как Лассерра иерархия релаксаций в полуопределенном программировании .
Методы оптимизации суммы квадратов применяются в самых разных областях, включая теорию управления (в частности, для поиска полиномиальных функций Ляпунова для динамических систем, описываемых полиномиальными векторными полями), статистику, финансы и машинное обучение. [1] [2] [3] [4]
Проблема оптимизации
[ редактировать ]Учитывая вектор и полиномы для , , задача оптимизации суммы квадратов записывается как
Здесь «SOS» представляет класс полиномов суммы квадратов (SOS).Количества являются переменными решения. Программы SOS можно преобразовать в полуопределенные программы (SDP) с использованием двойственности полиномиальной программы SOS и ослабления полиномиальной оптимизации с ограничениями с использованием положительно-полуопределенных матриц , см. следующий раздел.
Двойная задача: полиномиальная оптимизация с ограничениями
[ редактировать ]Предположим, у нас есть -вариативный полином и предположим, что мы хотели бы минимизировать этот многочлен по подмножеству . Предположим, далее, что ограничения на подмножество можно закодировать с помощью полиномиальные равенства степени не более , каждая из форм где является полиномом степени не более . Естественная, хотя и невыпуклая, программа для этой задачи оптимизации выглядит следующим образом: подлежит:
( 1 ) |
где это -мерный вектор с одной записью для каждого монома в степени максимум , так что для каждого мультимножества , представляет собой матрицу коэффициентов многочлена которые мы хотим свести к минимуму, и представляет собой матрицу коэффициентов многочлена кодирование -th ограничение на подмножество . Дополнительный фиксированный постоянный индекс в нашем пространстве поиска, , добавлено для удобства записи полиномов и в матричном представлении.
Эта программа, как правило, невыпуклая, поскольку ограничения ( 1 ) не являются выпуклыми. Одна из возможных выпуклых релаксаций для этой задачи минимизации использует полуопределенное программирование для замены матрицы переменных первого ранга. с положительно-полуопределенной матрицей : индексируем каждый моном не более по мультимножеству максимум индексы, . Для каждого такого монома создадим переменную в программе, и расставляем переменные чтобы сформировать матрицу , где – это набор действительных матриц, строки и столбцы которых отождествляются с мультимножествами элементов из размера максимум . Затем запишем следующую полуопределенную программу в переменных : подлежит:
где снова – матрица коэффициентов полинома которые мы хотим свести к минимуму, и – матрица коэффициентов полинома кодирование -th ограничение на подмножество .
Третье ограничение гарантирует, что значение монома, который появляется в матрице несколько раз, одинаково во всей матрице, и добавляется, чтобы сделать соблюдайте симметрии, присутствующие в квадратичной форме .
Двойственность
[ редактировать ]Можно взять двойственную полуопределенную программу и получить следующую программу: подлежит:
У нас есть переменная соответствующий ограничению (где - это матрица, в которой все записи равны нулю, за исключением записи, индексированной ), действительная переменная для каждого полиномиального ограничения и для каждой группы мультимножеств , у нас есть двойная переменная для ограничения симметрии . Ограничение положительной полуопределенности гарантирует, что представляет собой сумму квадратов многочленов над : путем характеристики положительно-полуопределенных матриц для любой положительно-полуопределенной матрицы , мы можем написать для векторов . Таким образом, для любого ,
где мы определили векторы с коэффициентами многочлена степени не выше . Это дает доказательство суммы квадратов, что значение над .
Вышеуказанное также может быть распространено на регионы. определяется полиномиальными неравенствами.
Иерархия суммы квадратов
[ редактировать ]Иерархия суммы квадратов (иерархия SOS), также известная как иерархия Лассерра, представляет собой иерархию выпуклых релаксаций возрастающей мощности и увеличения вычислительных затрат. Для каждого натурального числа соответствующая выпуклая релаксация известна как уровень или -й раунд иерархии SOS. The первый раунд, когда , соответствует базовой полуопределенной программе или оптимизации суммы квадратов по полиномам степени не выше . Чтобы расширить базовую выпуклую программу на первый уровень иерархии -м уровне в программу добавляются дополнительные переменные и ограничения, чтобы программа учитывала полиномы не более степени .
Иерархия SOS получила свое название от того факта, что значение целевой функции в -й уровень ограничен доказательством суммы квадратов с использованием многочленов степени не выше через двойственность (см. «Двойственность» выше). Следовательно, любое доказательство суммы квадратов, использующее многочлены степени не выше может быть использовано для ограничения целевого значения, что позволяет доказать гарантии остроты релаксации.
В сочетании с теоремой Берга это далее означает, что при достаточном количестве раундов релаксация становится сколь угодно жесткой на любом фиксированном интервале. Результат Берга [5] [6] утверждает, что каждый неотрицательный действительный полином в пределах ограниченного интервала может быть аппроксимирован с точностью на этом интервале с суммой квадратов действительных многочленов достаточно высокой степени, и, следовательно, если - полиномиальное целевое значение как функция точки , если неравенство держится для всех в интересующей области, то должно быть доказательство этого факта суммой квадратов. Выбор чтобы быть минимумом целевой функции в допустимой области, мы имеем результат.
Стоимость вычислений
[ редактировать ]При оптимизации функции в переменные, -й уровень иерархии можно записать в виде полуопределенной программы над переменные и могут быть решены за время используя метод эллипсоида .
Фон суммы квадратов
[ редактировать ]Полином является суммой квадратов ( SOS ), если существуют многочлены такой, что . Например, представляет собой сумму квадратов, поскольку где Обратите внимание, что если это сумма квадратов, тогда для всех . подробные описания полиномиального SOS . Доступны [7] [8] [9]
Квадратичные формы можно выразить как где является симметричной матрицей. Аналогично полиномы степени ≤ 2 d можно выразить как где вектор содержит все мономы степени . Это известно как форма матрицы Грама . Важным фактом является то, что является SOS тогда и только тогда, когда существует симметричная и положительно-полуопределенная матрица такой, что .Это обеспечивает связь между полиномами SOS и положительно-полуопределенными матрицами.
Программные инструменты
[ редактировать ]- SOSTOOLS , лицензия GNU GPL . Справочное руководство доступно по адресу arXiv:1310.4716 [math.OC] , а презентация о его внутреннем устройстве доступна здесь .
- CDCS-sos — пакет из CDCS , расширенного решателя метода Лагранжа , предназначенный для работы с крупномасштабными программами SOS.
- Расширение SumOfSquares для JuMP для Julia.
- TSSOS for Julia, инструмент полиномиальной оптимизации, основанный на иерархиях моментного SOS, адаптированных к разреженности.
- Для двойной задачи полиномиальной оптимизации с ограничениями используйте GloptiPoly для MATLAB/Octave, Ncpol2sdpa для Python и MomentOpt для Julia.
Ссылки
[ редактировать ]- ^ Сумма квадратов: теория и приложения: краткий курс AMS, сумма квадратов: теория и приложения, 14–15 января 2019 г., Балтимор, Мэриленд . Паррило, Пабло А.; Томас, Рекха Р. Провиденс, Род-Айленд: Американское математическое общество. 2020. ISBN 978-1-4704-5025-0 . OCLC 1157604983 .
{{cite book}}
: CS1 maint: другие ( ссылка ) - ^ Тан, В., Паккард, А., 2004. « Поиск управляющих функций Ляпунова с использованием программирования сумм квадратов ». В: Аллертон Конф. по связи, управлению и вычислительной технике . стр. 210–219.
- ^ Тан, В., Топку, У., Зайлер, П., Балас, Г., Паккард, А., 2008. Достижимость с помощью моделирования и анализ локального усиления для нелинейных динамических систем . В: Учеб. конференции IEEE по принятию решений и управлению. стр. 4097–4102.
- ^ А. Чакраборти, П. Зейлер и Г. Балас, « Восприимчивость контроллеров полета F / A-18 к режиму падающего листа: нелинейный анализ », Журнал AIAA по наведению, контролю и динамике, том. 34 нет. 1 (2011), стр. 73–85.
- ^ Берг, Кристиан (1987). Ландау, Генри Дж. (ред.). «Многомерная проблема моментов и полугруппы» . Материалы симпозиумов по прикладной математике . 37 : 110–124. дои : 10.1090/psapm/037/921086 . ISBN 9780821801147 .
- ^ Лассер, Дж. (1 января 2007 г.). «Приближение суммой квадратов неотрицательных многочленов» . Обзор СИАМ . 49 (4): 651–669. arXiv : math/0412398 . дои : 10.1137/070693709 . ISSN 0036-1445 .
- ^ Паррило, П., (2000) Структурированные полуопределенные программы и методы полуалгебраической геометрии в обеспечении устойчивости и оптимизации . доктор философии диссертация, Калифорнийский технологический институт.
- ^ Паррило, П. (2003) « Релаксации полуопределенного программирования для полуалгебраических задач ». Математическое программирование Сер. Б 96 (2), 293–320.
- ^ Лассер, Дж. (2001) « Глобальная оптимизация с помощью полиномов и проблема моментов ». SIAM Journal on Optimization , 11 (3), 796{817.