Принцип разделения
В теории управления принцип разделения , более формально известный как принцип разделения оценки и управления , утверждает, что при некоторых предположениях проблема разработки оптимального контроллера с обратной связью для стохастической системы может быть решена путем разработки оптимального наблюдателя для состояния система, которая поступает в оптимальный детерминированный контроллер для системы. Таким образом, задачу можно разбить на две отдельные части, что упрощает проектирование.
Первый пример такого принципа находится в условиях детерминированных линейных систем, а именно: если стабильный наблюдатель и стабильная обратная связь по состоянию разработаны для линейной, инвариантной во времени системы (система LTI в дальнейшем), то объединенный наблюдатель и обратная связь стабильны. . Принцип разделения, вообще говоря, не справедлив для нелинейных систем.
Другой пример принципа разделения возникает в случае линейных стохастических систем, а именно, что оценка состояния (возможно, нелинейная) вместе с оптимальным контроллером с обратной связью по состоянию, предназначенным для минимизации квадратичных затрат, оптимальна для задачи стохастического управления с выходными измерениями. Когда шум процесса и наблюдения является гауссовым, оптимальное решение разделяется на фильтр Калмана и линейно-квадратичный регулятор . Это известно как линейно-квадратично-гауссово управление . В более общем смысле, при подходящих условиях и когда шум представляет собой мартингал (с возможными скачками), снова применяется принцип разделения, известный как принцип разделения в стохастическом управлении . [1] [2] [3] [4] [5] [6]
Принцип разделения также справедлив для наблюдателей с высоким коэффициентом усиления, используемых для оценки состояния класса нелинейных систем. [7] и управление квантовыми системами.
Доказательство принципа разделения для детерминированных систем LTI
[ редактировать ]Рассмотрим детерминированную систему LTI:
где
- представляет входной сигнал,
- представляет выходной сигнал, и
- отражает внутреннее состояние системы.
Мы можем создать наблюдателя формы
и оставить отзыв
Определите ошибку e :
Затем
Теперь мы можем записать динамику замкнутого контура как
Поскольку это треугольная матрица , собственные значения совпадают с собственными значениями A − BK и A − LC . [8] Таким образом, устойчивость наблюдателя и обратная связь независимы .
Ссылки
[ редактировать ]- ^ Карл Йохан Астром (1970). Введение в стохастическую теорию управления . Том. 58. Академическая пресса. ISBN 0-486-44531-3 .
- ^ Тайрон Дункан и Правин Варайя (1971). «О решениях стохастической системы управления». СИАМ Дж. Контроль . 9 (3): 354–371. дои : 10.1137/0309026 . hdl : 1808/16692 .
- ^ МХА Дэвис и П. Варайя (1972). «Информационные состояния для стохастических систем» . Дж. Математика. Анальный. Приложения . 37 : 384–402. дои : 10.1016/0022-247X(72)90281-8 .
- ^ Андерс Линдквист (1973). «Об управлении линейными стохастическими системами с обратной связью». SIAM Journal по контролю . 11 (2): 323–343. дои : 10.1137/0311025 .
- ^ А. Бенсуссан (1992). Стохастическое управление частично наблюдаемыми системами . Издательство Кембриджского университета.
- ^ Трифон Т. Георгиу и Андерс Линдквист (2013). «Принцип разделения в стохастическом управлении, Redux». Транзакции IEEE при автоматическом управлении . 58 (10): 2481–2494. arXiv : 1103.3005 . дои : 10.1109/TAC.2013.2259207 . S2CID 12623187 .
- ^ Атасси, АН; Халил, Гонконг (1998). «Принцип разделения управления одним классом нелинейных систем» . Материалы 37-й конференции IEEE по принятию решений и управлению (кат. № 98CH36171) . Том. 1. ИИЭР. стр. 855–860. дои : 10.1109/cdc.1998.760800 . ISBN 0-7803-4394-8 . S2CID 126270534 .
- ^ Доказательство можно найти в этом math.stackexchange [1] .
- Брезински, Клод. Вычислительные аспекты линейного управления (численные методы и алгоритмы) . Спрингер, 2002.