Jump to content

Алгебраическое уравнение Риккати

Алгебраическое уравнение Риккати — это тип нелинейного уравнения, которое возникает в контексте задач оптимального управления на бесконечном интервале времени в непрерывном или дискретном времени .

Типичное алгебраическое уравнение Риккати похоже на одно из следующих:

алгебраическое уравнение Риккати с непрерывным временем (CARE):

или алгебраическое уравнение Риккати с дискретным временем (DARE):

P — неизвестная размера n на n симметричная матрица , а A , B , Q , R — известные вещественных коэффициентов матрицы , причем Q и R симметричны.

Хотя обычно это уравнение может иметь много решений, обычно указывается, что мы хотим получить единственное стабилизирующее решение, если такое решение существует.

Происхождение имени

[ редактировать ]

Этим уравнениям дано название Риккати из-за их связи с дифференциальным уравнением Риккати . Действительно, CARE проверяется инвариантными во времени решениями соответствующего матричного дифференциального уравнения Риккати. Что касается DARE, то оно проверяется инвариантными во времени решениями матричного разностного уравнения Риккати (которое является аналогом дифференциального уравнения Риккати в контексте LQR с дискретным временем).

Контекст алгебраического уравнения Риккати с дискретным временем

[ редактировать ]

с бесконечным горизонтом В задачах оптимального управления нас интересует значение некоторой интересующей переменной в произвольно далеком будущем, и необходимо оптимально выбрать значение управляемой переменной прямо сейчас, зная, что она также будет вести себя оптимально в любой момент времени. будущее. Оптимальные текущие значения управляющих переменных задачи в любой момент можно найти, используя решение уравнения Риккати и текущие наблюдения за развивающимися переменными состояния. При наличии нескольких переменных состояния и нескольких переменных управления уравнение Риккати будет матричным уравнением.

Алгебраическое уравнение Риккати определяет решение неизменной во времени задачи линейно-квадратичного регулятора (LQR), а также решения инвариантной во времени задачи линейно-квадратично-гауссовского управления с бесконечным горизонтом (LQG). Это две наиболее фундаментальные проблемы теории управления .

Типичная спецификация задачи линейно-квадратического управления с дискретным временем состоит в минимизации

подчиняется уравнению состояния

где x n вектор переменных состояния размером × 1, u размером k вектор переменных управления × 1, A n × n матрица перехода состояний , B размером n × k матрица множителей управления , Q ( n × n ) является симметричной положительной полуопределенной состояния матрицей стоимости , а R ( k × k ) является симметричной положительно определенной матрицей стоимости управления.

Индукцию назад во времени можно использовать для получения оптимального решения управления в каждый момент времени. [1]

с симметричной положительно определенной матрицей себестоимости P, развивающейся назад во времени от в соответствии с

которое известно как динамическое уравнение Риккати с дискретным временем этой задачи. Стационарную характеристику P , соответствующую задаче с бесконечным горизонтом, в которой T стремится к бесконечности, можно найти путем многократного повторения динамического уравнения до тех пор, пока оно не сходится; тогда P характеризуется удалением индексов времени из динамического уравнения.

Обычно решатели пытаются найти единственное стабилизирующее решение, если такое решение существует. Решение является стабилизирующим, если его использование для управления соответствующей системой LQR делает замкнутую систему стабильной.

Для CARE контроль

а матрица передачи состояний замкнутого контура равна

которая устойчива тогда и только тогда, когда все ее собственные значения имеют строго отрицательную действительную часть.

Для DARE управление

а матрица передачи состояний замкнутого контура равна

который устойчив тогда и только тогда, когда все его собственные значения находятся строго внутри единичного круга комплексной плоскости.

Решение алгебраического уравнения Риккати можно получить путем матричной факторизации или путем итерации уравнения Риккати. Один тип итерации можно получить в случае дискретного времени, используя динамическое уравнение Риккати, которое возникает в задаче с конечным горизонтом: в задаче последнего типа каждая итерация значения матрицы важна для оптимального выбора в каждый период, который представляет собой конечное расстояние во времени от конечного периода времени, и если оно повторяется бесконечно далеко назад во времени, оно сходится к конкретной матрице, которая имеет значение для оптимального выбора, за бесконечный отрезок времени до конечного периода, то есть, когда есть бесконечный горизонт.

Также возможно найти решение, найдя собственное разложение более крупной системы. Для CARE мы определяем матрицу Гамильтона

С является гамильтоновым, если оно не имеет собственных значений на мнимой оси, то ровно половина его собственных значений имеет отрицательную действительную часть. Если мы обозначим матрица, столбцы которой образуют основу соответствующего подпространства, в блочно-матричной записи, как

затем

является решением уравнения Риккати; кроме того, собственные значения являются собственными значениями с отрицательной действительной частью.

Для DARE, когда обратима, определим симплектическую матрицу

С симплектичен, если он не имеет собственных значений на единичной окружности, то ровно половина его собственных значений находится внутри единичного круга. Если мы обозначим матрица, столбцы которой образуют основу соответствующего подпространства, в блочно-матричной записи, как

где и результат разложения [2]

затем

является решением уравнения Риккати; кроме того, собственные значения являются собственными значениями которые находятся внутри единичного круга.

См. также

[ редактировать ]
  1. ^ Чоу, Грегори (1975). Анализ и управление динамическими экономическими системами . Нью-Йорк: Джон Уайли и сыновья. ISBN  0-471-15616-7 .
  2. ^ Уильям Арнольд; Алан Лауб (1984). «Алгоритмы обобщенной собственной задачи и программное обеспечение для алгебраических уравнений Риккати» .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 62b40b0550111a3163148711aba1dfb6__1703928240
URL1:https://arc.ask3.ru/arc/aa/62/b6/62b40b0550111a3163148711aba1dfb6.html
Заголовок, (Title) документа по адресу, URL1:
Algebraic Riccati equation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)