Jump to content

Оптимизация суммы квадратов

задача оптимизации Программа оптимизации суммы квадратов — это с линейной функцией стоимости и определенным типом ограничений на переменные решения. Эти ограничения имеют вид: когда переменные решения используются в качестве коэффициентов в определенных полиномах , эти полиномы должны иметь свойство полиномиального SOS . При фиксации максимальной степени задействованных полиномов оптимизация суммы квадратов также известна как Лассерра иерархия релаксаций в полуопределенном программировании .

Методы оптимизации суммы квадратов применяются в самых разных областях, включая теорию управления (в частности, для поиска полиномиальных функций Ляпунова для динамических систем, описываемых полиномиальными векторными полями), статистику, финансы и машинное обучение. [1] [2] [3] [4]

Проблема оптимизации

[ редактировать ]

Учитывая вектор и полиномы для , , задача оптимизации суммы квадратов записывается как

Здесь «SOS» представляет класс полиномов суммы квадратов (SOS).Количества являются переменными решения. Программы SOS можно преобразовать в полуопределенные программы (SDP) с использованием двойственности полиномиальной программы SOS и ослабления полиномиальной оптимизации с ограничениями с использованием положительно-полуопределенных матриц , см. следующий раздел.

Двойная задача: полиномиальная оптимизация с ограничениями

[ редактировать ]

Предположим, у нас есть -вариативный полином и предположим, что мы хотели бы минимизировать этот многочлен по подмножеству . Предположим, далее, что ограничения на подмножество можно закодировать с помощью полиномиальные равенства степени не более , каждая из форм где является полиномом степени не более . Естественная, хотя и невыпуклая, программа для этой задачи оптимизации выглядит следующим образом: подлежит:

( 1 )

где это -мерный вектор с одной записью для каждого монома в степени максимум , так что для каждого мультимножества , представляет собой матрицу коэффициентов многочлена которые мы хотим свести к минимуму, и представляет собой матрицу коэффициентов многочлена кодирование -th ограничение на подмножество . Дополнительный фиксированный постоянный индекс в нашем пространстве поиска, , добавлено для удобства записи полиномов и в матричном представлении.

Эта программа, как правило, невыпуклая, поскольку ограничения ( 1 ) не являются выпуклыми. Одна из возможных выпуклых релаксаций для этой задачи минимизации использует полуопределенное программирование для замены матрицы переменных первого ранга. с положительно-полуопределенной матрицей : индексируем каждый моном не более по мультимножеству максимум индексы, . Для каждого такого монома создадим переменную в программе, и расставляем переменные чтобы сформировать матрицу , где – это набор действительных матриц, строки и столбцы которых отождествляются с мультимножествами элементов из размера максимум . Затем запишем следующую полуопределенную программу в переменных : подлежит:

где снова – матрица коэффициентов полинома которые мы хотим свести к минимуму, и – матрица коэффициентов полинома кодирование -th ограничение на подмножество .

Третье ограничение гарантирует, что значение монома, который появляется в матрице несколько раз, одинаково во всей матрице, и добавляется, чтобы сделать соблюдайте симметрии, присутствующие в квадратичной форме .

Двойственность

[ редактировать ]

Можно взять двойственную полуопределенную программу и получить следующую программу: подлежит:

У нас есть переменная соответствующий ограничению (где - это матрица, в которой все записи равны нулю, за исключением записи, индексированной ), действительная переменная для каждого полиномиального ограничения и для каждой группы мультимножеств , у нас есть двойная переменная для ограничения симметрии . Ограничение положительной полуопределенности гарантирует, что представляет собой сумму квадратов многочленов над : путем характеристики положительно-полуопределенных матриц для любой положительно-полуопределенной матрицы , мы можем написать для векторов . Таким образом, для любого ,

где мы определили векторы с коэффициентами многочлена степени не выше . Это дает доказательство суммы квадратов, что значение над .

Вышеуказанное также может быть распространено на регионы. определяется полиномиальными неравенствами.

Иерархия суммы квадратов

[ редактировать ]

Иерархия суммы квадратов (иерархия SOS), также известная как иерархия Лассерра, представляет собой иерархию выпуклых релаксаций возрастающей мощности и увеличения вычислительных затрат. Для каждого натурального числа соответствующая выпуклая релаксация известна как уровень или -й раунд иерархии SOS. The первый раунд, когда , соответствует базовой полуопределенной программе или оптимизации суммы квадратов по полиномам степени не выше . Чтобы расширить базовую выпуклую программу на первый уровень иерархии -м уровне в программу добавляются дополнительные переменные и ограничения, чтобы программа учитывала полиномы не более степени .

Иерархия SOS получила свое название от того факта, что значение целевой функции в -й уровень ограничен доказательством суммы квадратов с использованием многочленов степени не выше через двойственность (см. «Двойственность» выше). Следовательно, любое доказательство суммы квадратов, использующее многочлены степени не выше может быть использовано для ограничения целевого значения, что позволяет доказать гарантии остроты релаксации.

В сочетании с теоремой Берга это далее означает, что при достаточном количестве раундов релаксация становится сколь угодно жесткой на любом фиксированном интервале. Результат Берга [5] [6] утверждает, что каждый неотрицательный действительный полином в пределах ограниченного интервала может быть аппроксимирован с точностью на этом интервале с суммой квадратов действительных многочленов достаточно высокой степени, и, следовательно, если - полиномиальное целевое значение как функция точки , если неравенство держится для всех в интересующей области, то должно быть доказательство этого факта суммой квадратов. Выбор чтобы быть минимумом целевой функции в допустимой области, мы имеем результат.

Стоимость вычислений

[ редактировать ]

При оптимизации функции в переменные, -й уровень иерархии можно записать в виде полуопределенной программы над переменные и могут быть решены за время используя метод эллипсоида .

Фон суммы квадратов

[ редактировать ]

Полином является суммой квадратов ( SOS ), если существуют многочлены такой, что . Например, представляет собой сумму квадратов, поскольку где Обратите внимание, что если это сумма квадратов, тогда для всех . подробные описания полиномиального SOS . Доступны [7] [8] [9]

Квадратичные формы можно выразить как где является симметричной матрицей. Аналогично полиномы степени ≤ 2 d можно выразить как где вектор содержит все мономы степени . Это известно как форма матрицы Грама . Важным фактом является то, что является SOS тогда и только тогда, когда существует симметричная и положительно-полуопределенная матрица такой, что .Это обеспечивает связь между полиномами SOS и положительно-полуопределенными матрицами.

Программные инструменты

[ редактировать ]
  1. ^ Сумма квадратов: теория и приложения: краткий курс AMS, сумма квадратов: теория и приложения, 14–15 января 2019 г., Балтимор, Мэриленд . Паррило, Пабло А.; Томас, Рекха Р. Провиденс, Род-Айленд: Американское математическое общество. 2020. ISBN  978-1-4704-5025-0 . OCLC   1157604983 . {{cite book}}: CS1 maint: другие ( ссылка )
  2. ^ Тан, В., Паккард, А., 2004. « Поиск управляющих функций Ляпунова с использованием программирования сумм квадратов ». В: Аллертон Конф. по связи, управлению и вычислительной технике . стр. 210–219.
  3. ^ Тан, В., Топку, У., Зайлер, П., Балас, Г., Паккард, А., 2008. Достижимость с помощью моделирования и анализ локального усиления для нелинейных динамических систем . В: Учеб. конференции IEEE по принятию решений и управлению. стр. 4097–4102.
  4. ^ А. Чакраборти, П. Зейлер и Г. Балас, « Восприимчивость контроллеров полета F / A-18 к режиму падающего листа: нелинейный анализ », Журнал AIAA по наведению, контролю и динамике, том. 34 нет. 1 (2011), стр. 73–85.
  5. ^ Берг, Кристиан (1987). Ландау, Генри Дж. (ред.). «Многомерная проблема моментов и полугруппы» . Материалы симпозиумов по прикладной математике . 37 : 110–124. дои : 10.1090/psapm/037/921086 . ISBN  9780821801147 .
  6. ^ Лассер, Дж. (1 января 2007 г.). «Приближение суммой квадратов неотрицательных многочленов» . Обзор СИАМ . 49 (4): 651–669. arXiv : math/0412398 . дои : 10.1137/070693709 . ISSN   0036-1445 .
  7. ^ Паррило, П., (2000) Структурированные полуопределенные программы и методы полуалгебраической геометрии в обеспечении устойчивости и оптимизации . доктор философии диссертация, Калифорнийский технологический институт.
  8. ^ Паррило, П. (2003) « Релаксации полуопределенного программирования для полуалгебраических задач ». Математическое программирование Сер. Б 96 (2), 293–320.
  9. ^ Лассер, Дж. (2001) « Глобальная оптимизация с помощью полиномов и проблема моментов ». SIAM Journal on Optimization , 11 (3), 796{817.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 275ab455cd5ee35523eb46f15064b8a2__1718100540
URL1:https://arc.ask3.ru/arc/aa/27/a2/275ab455cd5ee35523eb46f15064b8a2.html
Заголовок, (Title) документа по адресу, URL1:
Sum-of-squares optimization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)