Уравнения оптимального проецирования
В управления теории уравнения оптимального проектирования [1] [2] [3] представляют собой необходимые и достаточные условия для локально оптимального LQG-регулятора приведенного порядка. [4]
Задача линейно-квадратично-гауссова (ЛКГ) управления является одной из наиболее фундаментальных задач оптимального управления . Это касается неопределенных линейных систем, возмущенных аддитивным белым гауссовским шумом , неполной информацией о состоянии (т.е. не все переменные состояния измеряются и доступны для обратной связи), а также возмущенных аддитивным белым гауссовским шумом и квадратичными затратами . Более того, решение уникально и представляет собой линейный закон управления с динамической обратной связью, который легко вычисляется и реализуется. Наконец, контроллер LQG также имеет фундаментальное значение для оптимального управления возмущениями нелинейных систем. [5]
Контроллер LQG сам по себе является динамической системой, подобной системе, которой он управляет. Обе системы имеют одинаковое государственное измерение. Следовательно, реализация контроллера LQG может быть проблематичной, если размерность состояния системы велика. Проблема LQG уменьшенного порядка (проблема LQG фиксированного порядка) преодолевает это за счет априорного фиксирования количества состояний контроллера LQG. Эту проблему решить труднее, поскольку она уже неразделима. Кроме того, решение больше не является уникальным. Несмотря на эти факты, доступны численные алгоритмы. [4] [6] [7] [8] решить соответствующие уравнения оптимальной проекции.
Постановка и решение математической задачи
[ редактировать ]Непрерывное время
[ редактировать ]Задача управления LQG уменьшенного порядка почти идентична обычной задаче управления LQG полного порядка . Позволять представляют состояние контроллера LQG пониженного порядка. Тогда единственная разница состоит в том, что размерность состояния контроллера LQG априори фиксировано меньшим, чем , размерность состояния управляемой системы.
LQG-регулятор пониженного порядка представлен следующими уравнениями:
Эти уравнения намеренно записаны в формате, который соответствует формату обычного контроллера LQG полного порядка . Для задачи управления ЛКГ пониженного порядка их удобно переписать в виде
где
Матрицы и LQG-регулятора пониженного порядка определяются так называемыми уравнениями оптимальной проекции ( OPE ). [3]
Квадратная матрица оптимальной проекции с размером занимает центральное место в OPE . Ранг этой матрицы почти всюду равен Соответствующая проекция представляет собой наклонную проекцию: ОПЭ . представляют собой четыре матричных дифференциальных уравнения Первые два уравнения, перечисленные ниже, являются обобщениями матричных дифференциальных уравнений Риккати, связанных с обычным LQG-регулятором полного порядка . В этих уравнениях обозначает где - единичная матрица размерности .
Если размерность регулятора LQG не уменьшена, то есть если , затем и два приведенных выше уравнения становятся несвязанными матричными дифференциальными уравнениями Риккати, связанными с обычным контроллером LQG полного порядка . Если два уравнения связаны косой проекцией Это показывает, почему проблема ЛКГ пониженного порядка неразделима . Косая проекция определяется из двух дополнительных матричных дифференциальных уравнений, которые включают условия ранга . Вместе с двумя предыдущими матричными дифференциальными уравнениями это ОПЭ . Для формулировки дополнительных двух матричных дифференциальных уравнений удобно ввести следующие две матрицы:
Тогда два дополнительных матричных дифференциальных уравнения, дополняющих ОПЭ , будут следующими:
- почти везде,
- почти везде,
с
Здесь * обозначает обобщенную инверсию группы или инверсию Дразина , которая уникальна и задается формулой
где + обозначает псевдообратную функцию Мура–Пенроуза .
Матрицы все должны быть неотрицательно симметричными . Тогда они представляют собой решение OPE , которое определяет матрицы регулятора LQG уменьшенного порядка. и :
В уравнениях над матрицами представляют собой две матрицы со следующими свойствами:
- почти везде.
Их можно получить в результате проективной факторизации . [4]
OPE . можно сформулировать разными способами, которые являются эквивалентными Для идентификации эквивалентных представлений особенно полезны следующие тождества:
Используя эти тождества, можно, например, переписать первые два уравнения оптимального проецирования следующим образом:
Это представление является относительно простым и пригодным для численных расчетов.
Если все матрицы в формулировке задачи LQG пониженного порядка инвариантны во времени и если горизонт стремится к бесконечности, оптимальный контроллер LQG уменьшенного порядка становится инвариантным во времени, как и OPE . [1] В этом случае производные в левой части ОПЭ равны нулю.
Дискретное время
[ редактировать ]Как и в случае с непрерывным временем, в случае с дискретным временем отличием от обычной задачи ЛКГ полного порядка с дискретным временем является априорно фиксированный уменьшенный порядок. измерения состояния контроллера LQG. Как и в случае с непрерывным временем, для формулировки ОПЭ с дискретным временем удобно ввести следующие две матрицы:
Тогда ОПЭ дискретного времени будет
- .
- .
- почти везде,
- почти везде.
Матрица наклонной проекции имеет вид
Неотрицательные симметричные матрицы которые решают OPE дискретного времени, определяют матрицы контроллера LQG уменьшенного порядка и :
В уравнениях над матрицами представляют собой две матрицы со следующими свойствами:
- почти везде.
Их можно получить в результате проективной факторизации . [4] Для идентификации эквивалентных представлений ОПЭ дискретного времени особенно полезны следующие тождества:
Как и в случае непрерывного времени, если все матрицы в формулировке задачи инвариантны во времени и если горизонт стремится к бесконечности, LQG-регулятор уменьшенного порядка становится инвариантным во времени. Затем OPE с дискретным временем сходится к стационарному решению, которое определяет стационарный во времени контроллер LQG пониженного порядка. [2]
ОПЭ дискретного времени применимо также к системам дискретного времени с переменным состоянием, входными и выходными размерностями (системы дискретного времени с изменяющимися во времени размерностями). [6] Такие системы возникают в случае проектирования цифрового контроллера, если выборка происходит асинхронно.
Ссылки
[ редактировать ]- ^ Jump up to: а б Хайленд, округ Колумбия; Бернштейн Д.С. (1984). «Оптимальные проекционные уравнения для динамической компенсации фиксированного порядка». Транзакции IEEE при автоматическом управлении . AC-29 (11): 1034–1037. дои : 10.1109/TAC.1984.1103418 . hdl : 2027.42/57875 .
- ^ Jump up to: а б Бернштейн Д.С.; Дэвис Л.Д.; Хайленд, округ Колумбия (1986). «Оптимальные проекционные уравнения для оценки и управления моделированием в дискретном времени пониженного порядка» (PDF) . Журнал руководства, контроля и динамики . 9 (3): 288–293. Бибкод : 1986JGCD....9..288B . дои : 10.2514/3.20105 . hdl : 2027.42/57880 . Архивировано из оригинала 9 января 2022 г. Проверено 9 января 2022 г.
- ^ Jump up to: а б Хаддад В.М.; Тадмор Г. (1993). «Регуляторы LQG пониженного порядка для линейных нестационарных установок». Системы и контрольные письма . 20 (2): 87–97. дои : 10.1016/0167-6911(93)90020-7 .
- ^ Jump up to: а б с д Ван Виллигенбург Л.Г.; Де Конинг В.Л. (2000). «Численные алгоритмы и вопросы, касающиеся уравнений оптимального проецирования в дискретном времени». Европейский журнал контроля . 6 (1): 93–100. дои : 10.1016/s0947-3580(00)70917-4 . Загрузка соответствующего программного обеспечения из Matlab Central. Архивировано 9 января 2022 г. на Wayback Machine .
- ^ Атанс М. (1971). «Роль и использование стохастической линейно-квадратично-гауссовой задачи при проектировании систем управления». Транзакции IEEE при автоматическом управлении . AC-16 (6): 529–552. дои : 10.1109/TAC.1971.1099818 .
- ^ Jump up to: а б Ван Виллигенбург Л.Г.; Де Конинг В.Л. (1999). «Оптимальные компенсаторы пониженного порядка для нестационарных дискретных систем с детерминированными параметрами и параметрами белого». Автоматика . 35 : 129–138. дои : 10.1016/S0005-1098(98)00138-1 . Загрузка соответствующего программного обеспечения из Matlab Central. Архивировано 18 октября 2019 г. на Wayback Machine .
- ^ Жигич Д.; Уотсон Л.Т.; Коллинз Э.Г.; Хаддад В.М.; Ин С. (1996). «Гомотопические методы решения уравнений оптимального проецирования для задачи модели пониженного порядка H2». Международный журнал контроля . 56 (1): 173–191. дои : 10.1080/00207179208934308 .
- ^ Коллинз-младший Э.Г.; Хаддад В.М.; Ин С. (1996). «Гомотопический алгоритм для динамической компенсации пониженного порядка с использованием уравнений оптимальной проекции Хайланда – Бернштейна». Журнал руководства, контроля и динамики . 19 (2): 407–417. дои : 10.2514/3.21633 .