Jump to content

Линейно-квадратичный регулятор

Теория оптимального управления занимается эксплуатацией динамической системы с минимальными затратами. Случай, когда динамика системы описывается набором линейных дифференциальных уравнений , а стоимость описывается квадратичной функцией , называется задачей LQ. Одним из основных результатов теории является то, что решение обеспечивается линейно-квадратичным регулятором ( LQR ), регулятором с обратной связью, уравнения которого приведены ниже.

Контроллеры LQR обладают присущей им надежностью с гарантированным коэффициентом усиления и запасом по фазе . [1] и они также являются частью решения проблемы LQG (линейно-квадратично-гауссовой) . Как и сама проблема LQR, проблема LQG является одной из наиболее фундаментальных проблем теории управления . [2]

Общее описание

[ редактировать ]

Настройки (регулирующего) контроллера, управляющего машиной или процессом (например, самолетом или химическим реактором), определяются с помощью математического алгоритма, который минимизирует функцию стоимости с весовыми коэффициентами, заданными человеком (инженером). Функция стоимости часто определяется как сумма отклонений ключевых измерений, таких как высота над уровнем моря или температура процесса, от желаемых значений. Таким образом, алгоритм находит те настройки контроллера, которые минимизируют нежелательные отклонения. Величина самого управляющего воздействия также может быть включена в функцию стоимости.

Алгоритм LQR сокращает объем работы, выполняемой инженером системы управления по оптимизации контроллера. Однако инженеру все равно необходимо указать параметры функции стоимости и сравнить результаты с указанными целями проектирования. Часто это означает, что построение контроллера будет итеративным процессом, в котором инженер оценивает «оптимальные» контроллеры, созданные посредством моделирования, а затем корректирует параметры, чтобы создать контроллер, более соответствующий целям проектирования.

Алгоритм LQR, по сути, представляет собой автоматизированный способ поиска подходящего контроллера с обратной связью по состоянию . Таким образом, инженеры по управлению нередко предпочитают альтернативные методы, такие как полная обратная связь по состоянию , также известная как размещение полюсов, в которых существует более четкая взаимосвязь между параметрами контроллера и поведением контроллера. Трудность в поиске правильных весовых коэффициентов ограничивает применение синтеза контроллера на основе LQR.

Конечный горизонт, непрерывное время

[ редактировать ]

Для линейной системы с непрерывным временем, определенной на , описанный:

где (то есть, это -мерный вещественный вектор) — состояние системы и является управляющим входом. Учитывая квадратичную функцию стоимости системы, определяемую как:

Закон управления с обратной связью, минимизирующий величину стоимости, имеет вид:

где дается:

и находится путем решения дифференциального уравнения Риккати с непрерывным временем :

с граничным условием:

Условия первого порядка для J min таковы:

1) Уравнение состояния

2) Уравнение совместного состояния

3) Стационарное уравнение

4) Граничные условия

и

Бесконечный горизонт, непрерывное время

[ редактировать ]

Для линейной системы с непрерывным временем, описываемой следующим образом:

с функцией стоимости, определяемой как:

Закон управления с обратной связью, минимизирующий величину стоимости, имеет вид:

где дается:

и находится путем решения алгебраического уравнения Риккати с непрерывным временем :

Это также можно записать как:

с

Конечный горизонт, дискретное время

[ редактировать ]

Для линейной системы с дискретным временем, описываемой следующим образом: [3]

с индексом производительности, определяемым как:

, где это временной горизонт

оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:

где:

и находится итеративно назад во времени с помощью динамического уравнения Риккати:

из терминального состояния . [4] Обратите внимание, что не определено, так как доводится до конечного состояния к .

Бесконечный горизонт, дискретное время

[ редактировать ]

Для линейной системы с дискретным временем, описываемой следующим образом:

с индексом производительности, определяемым как:

оптимальная последовательность управления, минимизирующая показатель эффективности, определяется выражением:

где:

и является единственным положительно определенным решением алгебраического уравнения Риккати с дискретным временем (DARE):

.

Это также можно записать как:

с:

.

Обратите внимание, что один из способов решения алгебраического уравнения Риккати — это итерация динамического уравнения Риккати для случая конечного горизонта до тех пор, пока оно не сойдётся.

Ограничения

[ редактировать ]

На практике не все значения может быть разрешено. Одним из распространенных ограничений является линейное:

Версия с конечным горизонтом представляет собой задачу выпуклой оптимизации , поэтому проблема часто решается повторно с удаляющимся горизонтом. Это форма прогнозного управления моделью . [5] [6]

[ редактировать ]

Квадратичный регулятор

[ редактировать ]

Если уравнение состояния квадратичное, то проблема известна как квадратично-квадратичный регулятор (QQR). Алгоритм Аль'Брехта можно применить, чтобы свести эту проблему к проблеме, которую можно эффективно решить с помощью линейных решателей на основе тензоров. [7]

Полиномиально-квадратичный регулятор

[ редактировать ]

Если уравнение состояния является полиномиальным , то проблема известна как полиномиально-квадратичный регулятор (PQR). Опять же, алгоритм Аль'Брехта можно применить, чтобы свести эту проблему к большой линейной, которую можно решить с помощью обобщения алгоритма Бартельса-Стюарта ; это осуществимо при условии, что степень полинома не слишком высока. [8]

Модельно-прогностическое управление

[ редактировать ]

Модельное прогнозирующее управление и линейно-квадратичные регуляторы представляют собой два типа методов оптимального управления, которые имеют разные подходы к установлению затрат на оптимизацию. В частности, когда LQR запускается неоднократно с удаляющимся горизонтом, он становится формой прогнозного управления моделью (MPC). Однако в целом MPC не опирается на какие-либо предположения относительно линейности системы.

  1. ^ Лехтомаки, Н.; Сэнделл, Н.; Атанс, М. (1981). «Результатом устойчивости являются линейно-квадратичные конструкции многопараметрического управления на основе Гаусса» . Транзакции IEEE при автоматическом управлении . 26 (1): 75–93. дои : 10.1109/TAC.1981.1102565 . ISSN   0018-9286 .
  2. ^ Дойл, Джон К. (1978). «Гарантированная прибыль для регуляторов LQG» (PDF) . Транзакции IEEE при автоматическом управлении . 23 (4): 756–757. дои : 10.1109/TAC.1978.1101812 . ISSN   0018-9286 .
  3. ^ Чоу, Грегори К. (1986). Анализ и управление динамическими экономическими системами . Кригер Публибл. компании ISBN  0-89874-969-7 .
  4. ^ Шайджу, Эй Джей, Петерсен, Ян Р. (2008). «Формулы для дискретного времени LQR, LQG, LEQG и минимаксных задач оптимального управления LQG». Тома трудов МФБ . 41 (2). Эльзевир: 8773–8778. дои : 10.3182/20080706-5-KR-1001.01483 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  5. ^ «Гл. 8 — Линейные квадратичные регуляторы» . недоработанный.mit.edu . Проверено 20 августа 2022 г.
  6. ^ Скокарт, Пьер О.М.; Роулингс, Джеймс Б. (август 1998 г.). «Линейное квадратичное регулирование с ограничениями» (PDF) . Транзакции IEEE при автоматическом управлении . 43 (8): 1163–1169. дои : 10.1109/9.704994 . hdl : 1793/10888 . Проверено 20 августа 2022 г.
  7. ^ Борггаард, Джефф; Зицман, Лизетт (июль 2020 г.). «Задача квадратично-квадратичного регулятора: аппроксимация управления с обратной связью для нелинейных систем с квадратичным состоянием». Американская конференция по контролю (ACC) 2020 года . стр. 818–823. arXiv : 1910.03396 . дои : 10.23919/ACC45564.2020.9147286 . ISBN  978-1-5386-8266-1 . S2CID   203904925 . Проверено 20 августа 2022 г.
  8. ^ Борггаард, Джефф; Зицман, Лизетт (1 января 2021 г.). «Об аппроксимации задач полиномиально-квадратичного регулятора» . IFAC-PapersOnLine . 54 (9): 329–334. arXiv : 2009.11068 . doi : 10.1016/j.ifacol.2021.06.090 . S2CID   221856517 .
  • Квакернаак, Хьюберт; Сиван, Рафаэль (1972). Линейные оптимальные системы управления (1-е изд.). Уайли Интерсайенс. ISBN  0-471-51110-2 .
  • Зонтаг, Эдуардо (1998). Математическая теория управления: детерминированные конечномерные системы (2-е изд.). Спрингер. ISBN  0-387-98489-5 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c9b15b22b80677fb413bf6061ef51719__1720437240
URL1:https://arc.ask3.ru/arc/aa/c9/19/c9b15b22b80677fb413bf6061ef51719.html
Заголовок, (Title) документа по адресу, URL1:
Linear–quadratic regulator - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)