Представление в пространстве состояний
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Май 2009 г. ) |
В технике управления и идентификации систем — представление в пространстве состояний это математическая модель физической системы, заданная как набор входных, выходных и переменных, первого порядка связанных дифференциальными уравнениями или разностными уравнениями . Такие переменные, называемые переменными состояния , изменяются со временем таким образом, что это зависит от значений, которые они имеют в любой данный момент, и от навязанных извне значений входных переменных. Значения выходных переменных зависят от значений переменных состояния, а также могут зависеть от значений входных переменных.
Пространство состояний или фазовое пространство — это геометрическое пространство , в котором оси являются переменными состояния. Состояние системы можно представить в виде вектора , вектора состояния .
Если динамическая система линейна, стационарна и конечномерна, то дифференциальные и алгебраические уравнения можно записать в матричной форме. [1] [2] Метод пространства состояний характеризуется алгебризацией общей теории систем , что позволяет использовать векторно-матричные структуры Кронекера . Возможности этих структур можно эффективно применять в исследовательских системах с модуляцией или без нее. [3] Представление в пространстве состояний (также известное как « подход во временной области ») обеспечивает удобный и компактный способ моделирования и анализа систем с множеством входов и выходов. С входы и выходы, в противном случае нам пришлось бы записывать Преобразования Лапласа кодируют всю информацию о системе. В отличие от подхода в частотной области , использование представления в пространстве состояний не ограничивается системами с линейными компонентами и нулевыми начальными условиями.
Модель пространства состояний может применяться в таких предметах, как экономика, [4] статистика, [5] информатика и электротехника, [6] и нейробиология. [7] в эконометрике Например, модели в пространстве состояний могут использоваться для разложения временного ряда на тренд и цикл, составления отдельных показателей в составной индекс, [8] определить поворотные моменты делового цикла и оценить ВВП, используя скрытые и ненаблюдаемые временные ряды. [9] [10] Многие приложения полагаются на фильтр Калмана или наблюдатель состояния для получения оценок текущих неизвестных переменных состояния на основе предыдущих наблюдений. [11] [12]
Переменные состояния [ править ]
Внутренние переменные состояния — это наименьшее возможное подмножество системных переменных, которые могут представлять все состояние системы в любой момент времени. [13] Минимальное количество переменных состояния, необходимых для представления данной системы, , обычно равен порядку определяющего дифференциального уравнения системы, но не обязательно. Если система представлена в виде передаточной функции, минимальное количество переменных состояния равно порядку знаменателя передаточной функции после его приведения к правильной дроби. Важно понимать, что преобразование реализации в пространстве состояний в форму передаточной функции может привести к потере некоторой внутренней информации о системе и может обеспечить описание стабильной системы, когда реализация в пространстве состояний нестабильна в определенных точках. В электрических цепях количество переменных состояния часто, хотя и не всегда, совпадает с количеством элементов хранения энергии в цепи, таких как конденсаторы и катушки индуктивности . Определенные переменные состояния должны быть линейно независимыми, т. е. ни одна переменная состояния не может быть записана как линейная комбинация других переменных состояния, иначе система не может быть решена.
Линейные системы [ править ]
Наиболее общее представление линейной системы в пространстве состояний с входы, результаты и переменные состояния записываются в следующем виде: [14]
где:
- называется «вектором состояния», ;
- называется «выходным вектором», ;
- называется «входным (или управляющим) вектором», ;
- это «матрица состояний (или системы)», ,
- это «входная матрица», ,
- это «выходная матрица», ,
- - это «матрица сквозного (или прямого) взаимодействия» (в тех случаях, когда модель системы не имеет прямого сквозного соединения, – нулевая матрица), ,
- .
В этой общей формулировке все матрицы могут изменяться во времени (т.е. их элементы могут зависеть от времени); однако в обычном случае LTI матрицы будут инвариантными во времени. Переменная времени может быть непрерывным (например, ) или дискретный (например, ). В последнем случае переменная времени обычно используется вместо . Гибридные системы допускают временные интервалы, которые имеют как непрерывные, так и дискретные части. В зависимости от сделанных допущений представление модели в пространстве состояний может принимать следующие формы:
Тип системы | Модель пространства состояний |
Непрерывный, не зависящий от времени | |
Непрерывный вариант времени | |
Явный дискретный, инвариантный ко времени | |
Явный дискретный вариант времени | |
Лапласа Домен непрерывный, инвариантный ко времени | |
Z- домен дискретный, инвариантный ко времени |
Пример: случай LTI с непрерывным временем [ править ]
с непрерывным временем Характеристики устойчивости и естественного отклика системы LTI (т. е. линейной с постоянными во времени матрицами) можно изучить по собственным значениям матрицы . Стабильность стационарной модели в пространстве состояний можно определить, рассматривая передаточную функцию системы в факторизованной форме. Тогда это будет выглядеть примерно так:
Знаменатель передаточной функции равен характеристическому многочлену найденному путем взятия определителя , ,
Корнями этого многочлена ( собственными значениями передаточной функции системы ) являются полюсы (т. е. особенности , в которых величина передаточной функции неограничена). Эти полюса можно использовать для анализа того, является ли система асимптотически устойчивой или маргинально устойчивой . системы Альтернативный подход к определению устойчивости, не предполагающий вычисления собственных значений, заключается в анализе устойчивости по Ляпунову .
Нули встречаются в числителе аналогичным образом можно использовать для определения того, находится ли система в минимальной фазе .
Система все еще может быть стабильной по вводу-выводу (см. BIBO стабильная ), даже если она не является внутренне стабильной. Это может быть в том случае, если нестабильные полюса компенсируются нулями (т. е. если эти особенности в передаточной функции устранимы ) .
Управляемость [ править ]
Условие управляемости состоянием подразумевает, что с помощью допустимых входных данных можно управлять состояниями от любого начального значения к любому конечному значению в пределах некоторого конечного временного окна. Непрерывная, не зависящая от времени линейная модель в пространстве состояний является управляемой тогда и только тогда, когда
где ранг — количество линейно независимых строк в матрице, а n — количество переменных состояния.
Наблюдаемость [ править ]
Наблюдаемость — это мера того, насколько хорошо внутренние состояния системы можно определить на основе знания ее внешних результатов. Наблюдаемость и управляемость системы являются математическими двойственными понятиями (т. е., поскольку управляемость обеспечивает доступность входных данных, которые переводят любое начальное состояние в любое желаемое конечное состояние, наблюдаемость предполагает, что знание выходной траектории дает достаточно информации для прогнозирования начального состояния системы). ).
Непрерывная, инвариантная ко времени линейная модель в пространстве состояний наблюдаема тогда и только тогда, когда
Передаточная функция [ править ]
« Передаточная функция » непрерывной, неизменной во времени линейной модели в пространстве состояний может быть получена следующим образом:
Во-первых, приняв Лапласа преобразование
урожайность
Далее мы упрощаем , давая
и таким образом
Замена на в выходном уравнении
предоставление
Предполагая нулевые начальные условия и системе с одним входом и одним выходом (SISO) , передаточная функция определяется как соотношение выхода и входа. . Однако для системы с несколькими входами и множеством выходов (MIMO) это соотношение не определено. Следовательно, при условии нулевых начальных условий матрица передаточной функции получается из
используя метод уравнения коэффициентов, который дает
- .
Следовательно, представляет собой матрицу размерности который содержит передаточные функции для каждой комбинации ввода-вывода. Из-за простоты этой матричной записи представление в пространстве состояний обычно используется для систем с несколькими входами и несколькими выходами. Системная матрица Розенброка обеспечивает мост между представлением в пространстве состояний и его передаточной функцией .
Канонические реализации [ править ]
Любую заданную передаточную функцию, которая является строго правильной, можно легко перенести в пространство состояний с помощью следующего подхода (этот пример относится к четырехмерной системе с одним входом и одним выходом):
Учитывая передаточную функцию, разверните ее, чтобы выявить все коэффициенты как в числителе, так и в знаменателе. В результате должна получиться следующая форма:
Коэффициенты теперь можно вставить непосредственно в модель в пространстве состояний с помощью следующего подхода:
Такая реализация в пространстве состояний называется управляемой канонической формой , поскольку результирующая модель гарантированно будет управляемой (т. е., поскольку управление входит в цепочку интеграторов, оно имеет возможность перемещать каждое состояние).
Коэффициенты передаточной функции также можно использовать для построения канонической формы другого типа.
Эта реализация в пространстве состояний называется наблюдаемой канонической формой , поскольку результирующая модель гарантированно будет наблюдаемой (т. е. поскольку выходные данные выходят из цепочки интеграторов, каждое состояние влияет на выходные данные).
Правильные функции передачи [ править ]
Только собственные (и не строго правильные ) передаточные функции также могут быть реализованы довольно легко. Хитрость здесь в том, чтобы разделить передаточную функцию на две части: строго правильную часть и константу.
Строго правильная передаточная функция затем может быть преобразована в каноническую реализацию в пространстве состояний с использованием методов, показанных выше. Реализация константы в пространстве состояний тривиально . Вместе мы тогда получаем реализацию в пространстве состояний с матрицами A , B и C, определяемыми строго правильной частью, и матрицей D , определяемой константой.
Вот пример, чтобы немного прояснить ситуацию:
что дает следующую управляемую реализацию
Обратите внимание, что результат также напрямую зависит от ввода. Это связано с константа в передаточной функции.
Обратная связь [ править ]
Распространенный метод обратной связи — умножить выходные данные на матрицу K и установить ее в качестве входных данных системы: .Поскольку значения K не ограничены, значения можно легко инвертировать при отрицательной обратной связи .Наличие отрицательного знака (обычного обозначения) является лишь условным знаком и его отсутствие не влияет на конечный результат.
становится
решение выходного уравнения для и подстановка в уравнение состояния приводит к
Преимущество этого заключается в том, что можно управлять собственными значениями A , соответствующим образом устанавливая K посредством собственного разложения A. .Это предполагает, что замкнутая система является управляемой или что нестабильные собственные значения A можно сделать стабильными за счет соответствующего выбора K .
Пример [ править ]
Для строго правильной системы D равно нулю. Другая довольно распространенная ситуация — когда все состояния являются выходами, т.е. y = x , что дает C = I , матрицу идентичности . Тогда это приведет к более простым уравнениям
Это сводит необходимое собственное разложение к просто .
Обратная связь с вводом заданного значения (задания) [ править ]
Помимо обратной связи, вклад, , можно добавить так, что .
становится
решение выходного уравнения для и подставив в уравнение состояния приводит к
Одним из довольно распространенных упрощений этой системы является удаление D , что сводит уравнения к
Пример движущегося объекта [ править ]
Классическая линейная система – это система одномерного движения объекта (например, тележки). Законы движения Ньютона для объекта, движущегося горизонтально по плоскости и прикрепленного к стене пружиной:
где
- это позиция; – скорость; это ускорение
- это приложенная сила
- коэффициент вязкого трения
- это константа пружины
- это масса объекта
Уравнение состояния тогда примет вид
где
- представляет положение объекта
- это скорость объекта
- это ускорение объекта
- вывод это положение объекта
проверка управляемости Тогда
который имеет полный ранг для всех и . Это означает, что если известно начальное состояние системы ( , , ), и если и постоянны, то существует сила это могло бы переместить тележку в любое другое положение в системе.
на наблюдаемость Тогда тест
который также имеет полный ранг. Следовательно, эта система одновременно управляема и наблюдаема.
Нелинейные системы [ править ]
Более общую форму модели в пространстве состояний можно записать в виде двух функций.
Первое — это уравнение состояния, а второе — уравнение выхода.Если функция представляет собой линейную комбинацию состояний и входных данных, то уравнения можно записать в матричной записи, как указано выше. Аргумент функции можно отбросить, если система нефорсированная (т. е. у нее нет входов).
Пример маятника [ править ]
Классическая нелинейная система представляет собой простой невынужденный маятник.
где
- - угол маятника относительно направления силы тяжести
- — масса маятника (масса стержня маятника считается равной нулю)
- это гравитационное ускорение
- коэффициент трения в точке поворота
- - радиус маятника (к центру тяжести массы )
Тогда уравнения состояния будут иметь вид
где
- это угол маятника
- - скорость вращения маятника
- - вращательное ускорение маятника
Вместо этого уравнение состояния можно записать в общем виде
Точки равновесия / стационарности системы – это когда и поэтому точки равновесия маятника - это те, которые удовлетворяют
для целых чисел n .
См. также [ править ]
- Техника управления
- Теория управления
- Государственный наблюдатель
- Наблюдаемость
- Управляемость
- Дискретизация моделей в пространстве состояний
- Фазовое пространство для информации о фазовом состоянии (например, пространстве состояний) в физике и математике.
- Пространство состояний для получения информации о пространстве состояний с дискретными состояниями в информатике.
- Фильтр Калмана для статистического применения.
Ссылки [ править ]
- ^ Каталин М. Хангос ; Р. Лакнер и М. Герцсон (2001). Интеллектуальные системы управления: введение с примерами . Спрингер. п. 254. ИСБН 978-1-4020-0134-5 .
- ^ Каталин М. Лауд; Йожеф Бокор и Габор Седеркени (2004). Анализ и управление нелинейными технологическими системами . Спрингер. п. 25. ISBN 978-1-85233-600-4 .
- ^ Васильев А.С.; Ушаков А.В. (2015). «Моделирование динамических систем с модуляцией средствами векторно-матричного представления Кронекера» . Научно-технический журнал информационных технологий, механики и оптики . 15 (5): 839–848. дои : 10.17586/2226-1494-2015-15-5-839-848 .
- ^ Сток, Дж. Х.; Уотсон, М.В. (2016), «Динамические факторные модели, факторно-дополненная векторная авторегрессия и структурная векторная авторегрессия в макроэкономике», Справочник по макроэкономике , том. 2, Elsevier, стр. 415–525, doi : 10.1016/bs.hesmac.2016.04.002 , ISBN. 978-0-444-59487-7
- ^ Дурбин, Джеймс; Купман, Сием Ян (2012). Анализ временных рядов методами пространства состояний . Издательство Оксфордского университета. ISBN 978-0-19-964117-8 . OCLC 794591362 .
- ^ Россер, Р. (1975). «Дискретная модель в пространстве состояний для линейной обработки изображений». Транзакции IEEE при автоматическом управлении . 20 (1): 1–10. дои : 10.1109/tac.1975.1100844 . ISSN 0018-9286 .
- ^ Смит, Энн К.; Браун, Эмери Н. (2003). «Оценка модели в пространстве состояний на основе точечных наблюдений за процессом». Нейронные вычисления . 15 (5): 965–991. дои : 10.1162/089976603765202622 . ISSN 0899-7667 . ПМИД 12803953 . S2CID 10020032 .
- ^ Джеймс Х. Сток и Марк В. Уотсон, 1989. «Новые индексы совпадающих и опережающих экономических индикаторов », Главы NBER, в: Ежегодник NBER Macro Economics Annual 1989, Volume 4, страницы 351–409, Национальное бюро экономических исследований, Inc.
- ^ Банбура, Марта; Модуньо, Микеле (12 ноября 2012 г.). «Оценка максимального правдоподобия факторных моделей на наборах данных с произвольным набором отсутствующих данных». Журнал прикладной эконометрики . 29 (1): 133–160. дои : 10.1002/jae.2306 . hdl : 10419/153623 . ISSN 0883-7252 . S2CID 14231301 .
- ^ «Модели в пространстве состояний с марковским переключением и выборкой Гиббса», Модели в пространстве состояний с переключением режимов , MIT Press, 2017, doi : 10.7551/mitpress/6444.003.0013 , ISBN 978-0-262-27711-2
- ^ Кальман, Р.Э. (1 марта 1960 г.). «Новый подход к задачам линейной фильтрации и прогнозирования» . Журнал фундаментальной инженерии . 82 (1): 35–45. дои : 10.1115/1.3662552 . ISSN 0021-9223 . S2CID 259115248 .
- ^ Харви, Эндрю К. (1990). Прогнозирование, модели структурных временных рядов и фильтр Калмана . Кембридж: Издательство Кембриджского университета. doi:10.1017/CBO9781107049994
- ^ Найз, Норман С. (2010). Разработка систем управления (6-е изд.). Джон Уайли и сыновья, Inc. ISBN 978-0-470-54756-4 .
- ^ Броган, Уильям Л. (1974). Современная теория управления (1-е изд.). Quantum Publishers, Inc. с. 172.
Дальнейшее чтение [ править ]
- Анцаклис, П.Дж.; Мишель, А. Н. (2007). Букварь по линейным системам . Биркгаузер. ISBN 978-0-8176-4460-4 .
- Чен, Чи-Цонг (1999). Теория и проектирование линейных систем (3-е изд.). Издательство Оксфордского университета. ISBN 0-19-511777-8 .
- Халил, Хасан К. (2001). Нелинейные системы (3-е изд.). Прентис Холл. ISBN 0-13-067389-7 .
- Хинрихсен, Дидерих; Причард, Энтони Дж. (2005). Теория математических систем I, моделирование, анализ пространства состояний, устойчивость и устойчивость . Спрингер. ISBN 978-3-540-44125-0 .
- Зонтаг, Эдуардо Д. (1999). Математическая теория управления: детерминированные конечномерные системы (PDF) (2-е изд.). Спрингер. ISBN 0-387-98489-5 . Проверено 28 июня 2012 г.
- Фридланд, Бернард (2005). Проектирование системы управления: введение в методы в пространстве состояний . Дувр. ISBN 0-486-44278-0 .
- Заде, Лотфи А.; Десоер, Чарльз А. (1979). Теория линейных систем . Krieger Pub Co. ISBN 978-0-88275-809-1 .
- О применении моделей пространства состояний в эконометрике
- Дурбин, Дж.; Купман, С. (2001). Анализ временных рядов методами пространства состояний . Оксфорд, Великобритания: Издательство Оксфордского университета. ISBN 978-0-19-852354-3 .