Jump to content

Принцип максимума Понтрягина

Принцип максимума Понтрягина используется в теории оптимального управления для поиска наилучшего возможного управления для перевода динамической системы из одного состояния в другое, особенно при наличии ограничений на состояние или входные управления. В нем говорится, что для любого оптимального управления вместе с траекторией оптимального состояния необходимо решить так называемую гамильтонову систему, которая представляет собой двухточечную краевую задачу плюс условие максимума гамильтониана управления . [ а ] Эти необходимые условия становятся достаточными при выполнении определенных условий выпуклости целевой функции и функции ограничений. [ 1 ] [ 2 ]

Принцип максимума был сформулирован в 1956 году российским математиком Львом Понтрягиным и его учениками. [ 3 ] [ 4 ] и его первоначальное применение заключалось в максимизации конечной скорости ракеты. [ 5 ] Результат был получен с использованием идей классического вариационного исчисления . [ 6 ] После небольшого возмущения оптимального управления рассматривается член первого порядка разложения Тейлора относительно возмущения; обращение возмущения к нулю приводит к вариационному неравенству, из которого следует принцип максимума. [ 7 ]

Значение принципа максимума, широко считающегося важной вехой в теории оптимального управления, заключается в том, что максимизировать гамильтониан намного проще, чем исходную бесконечномерную задачу управления; вместо максимизации в функциональном пространстве задача преобразуется в точечную оптимизацию. [ 8 ] Похожая логика приводит к принципу оптимальности Беллмана — родственному подходу к задачам оптимального управления, который утверждает, что оптимальная траектория остаётся оптимальной в промежуточные моменты времени. [ 9 ] Полученное уравнение Гамильтона-Якоби-Беллмана обеспечивает необходимое и достаточное условие оптимума и допускает прямое распространение на стохастические задачи оптимального управления, тогда как принцип максимума этого не делает. [ 7 ] Однако, в отличие от уравнения Гамильтона-Якоби-Беллмана, которое должно выполняться во всем пространстве состояний, чтобы быть действительным, принцип максимума Понтрягина потенциально более эффективен в вычислительном отношении, поскольку условия, которые он определяет, должны выполняться только для определенной траектории.

Обозначения

[ редактировать ]

Для набора и функции

,
,
,
,

мы используем следующие обозначения:

,
,
,
,
.

Формальная формулировка необходимых условий для задач минимизации.

[ редактировать ]

Здесь показаны необходимые условия минимизации функционала.

Рассмотрим n-мерную динамическую систему с переменной состояния , и управляющая переменная , где – множество допустимых управлений. Эволюция системы определяется состоянием и управлением согласно дифференциальному уравнению . Пусть начальное состояние системы будет и пусть эволюция системы контролируется в течение периода времени со значениями . Последнее определяется следующим дифференциальным уравнением:

Траектория управления следует выбирать в зависимости от поставленной цели. Цель – функциональный определяется

,

где можно интерпретировать как норму затрат на осуществление контроля. в штате , и можно интерпретировать как цену за попадание в состояние . Конкретный выбор зависит от приложения.

Ограничения на динамику системы можно присоединить к лагранжиану путем введения изменяющегося во времени множителя Лагранжа вектора , элементы которого называются стоатами системы. Это мотивирует построение гамильтониана определено для всех к:

где это транспонирование .

Принцип минимума Понтрягина гласит, что оптимальная траектория состояния , оптимальное управление и соответствующий вектор множителя Лагранжа должен минимизировать гамильтониан так что

( 1 )

на все времена и для всех допустимых управляющих входов . Здесь траектория вектора множителя Лагранжа является решением уравнения Костата и его терминальных условий:

( 2 )
( 3 )

Если фиксировано, то эти три условия в (1)-(3) являются необходимыми условиями оптимального управления.

Если конечное состояние не фиксировано (т. е. его дифференциальная вариация не равна нулю), существует дополнительное условие

( 4 )

Эти четыре условия в (1)-(4) являются необходимыми условиями оптимального управления.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Является ли экстремальное значение максимальным или минимальным, зависит от соглашения о знаках, используемого для определения гамильтониана. Историческая условность ведет к максимуму, а значит, к принципу максимума. В последние годы его чаще называют просто принципом Понтрягина, без использования прилагательных максимум или минимум.
  1. ^ Мангасарян, OL (1966). «Достаточные условия оптимального управления нелинейными системами». SIAM Journal по контролю . 4 (1): 139–152. дои : 10.1137/0304013 .
  2. ^ Камен, Мортон И .; Шварц, Нэнси Л. (1971). «Достаточные условия в теории оптимального управления». Журнал экономической теории . 3 (2): 207–214. дои : 10.1016/0022-0531(71)90018-4 .
  3. ^ Болтянский, В.; Мартини, Х.; Солтан, В. (1998). «Принцип максимума – как он появился?» . Геометрические методы и задачи оптимизации . Нью-Йорк: Спрингер. стр. 204–227. ISBN  0-7923-5454-0 .
  4. ^ Гамкрелидзе, Р.В. (1999). «Открытие принципа максимума». Журнал динамических систем и систем управления . 5 (4): 437–451. дои : 10.1023/A:1021783020548 . S2CID   122690986 . Перепечатано в Болибрух, А.А. ; и др., ред. (2006). Математические события двадцатого века . Берлин: Шпрингер. стр. 85–99. ISBN  3-540-23235-4 .
  5. ^ Для первых опубликованных работ см. ссылки в Фуллер, AT (1963). «Библиография принципа максимума Понтрягина». Дж. Электроника и управление . 15 (5): 513–517. дои : 10.1080/00207216308937602 .
  6. ^ МакШейн, EJ (1989). «Вариационное исчисление с самого начала через теорию оптимального управления». СИАМ Дж. Оптимальное управление . 27 (5): 916–939. дои : 10.1137/0327049 .
  7. ^ Jump up to: а б Йонг, Дж.; Чжоу, XY (1999). «Принцип максимума и стохастические гамильтоновы системы». Стохастическое управление: гамильтоновы системы и уравнения HJB . Нью-Йорк: Спрингер. стр. 101–156 . ISBN  0-387-98723-1 .
  8. ^ Састри, Шанкар (29 марта 2009 г.). «Конспект лекций 8. Оптимальное управление и динамические игры» (PDF) .
  9. ^ Чжоу, XY (1990). «Принцип максимума, динамическое программирование и их связь в детерминированном управлении». Журнал теории оптимизации и приложений . 65 (2): 363–373. дои : 10.1007/BF01102352 . S2CID   122333807 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a8693cf8e54c087f84d266a48995f3e9__1700835480
URL1:https://arc.ask3.ru/arc/aa/a8/e9/a8693cf8e54c087f84d266a48995f3e9.html
Заголовок, (Title) документа по адресу, URL1:
Pontryagin's maximum principle - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)