Государственный наблюдатель

В теории управления наблюдатель состояния или оценщик состояния — это система, которая обеспечивает оценку внутреннего состояния данной реальной системы на основе измерений входных и выходных данных реальной системы. Обычно он реализуется на компьютере и обеспечивает основу для многих практических приложений.

Знание состояния системы необходимо для решения многих теории управления задач ; например, стабилизация системы с помощью обратной связи по состоянию . В большинстве практических случаев физическое состояние системы не может быть определено прямым наблюдением. Вместо этого косвенные эффекты внутреннего состояния наблюдаются через выходные данные системы. Простой пример — транспортные средства в туннеле: скорости и скорости, с которыми транспортные средства въезжают и покидают туннель, можно наблюдать непосредственно, но точное состояние внутри туннеля можно только оценить. Если система наблюдаема , можно полностью восстановить состояние системы на основе ее выходных измерений с помощью наблюдателя состояния.

наблюдателя Типичная модель

Линейные, с задержкой, скользящий режим, с высоким коэффициентом усиления, тау, основанные на однородности, расширенные и кубические наблюдатели входят в число нескольких структур наблюдателей, используемых для оценки состояния линейных и нелинейных систем. Структура линейного наблюдателя описана в следующих разделах.

Случай дискретного времени [ править ]

Предполагается, что состояние линейной, инвариантной ко времени системы с дискретным временем удовлетворяет

x(k+1)=Ax(k)+Bu(k)

y(k)=Cx(k)+Du(k)

где, во время $k$ , $x(k)$ состояние завода; $u(k)$ это его входы; и $y(k)$ это его результаты. Эти уравнения просто говорят, что текущая продукция предприятия и его будущее состояние определяются исключительно его текущим состоянием и текущими затратами. (Хотя эти уравнения выражаются через дискретные шаги по времени, очень похожие уравнения справедливы и для непрерывных систем). Если эта система наблюдаема , то выход объекта $y(k)$ , может использоваться для управления состоянием наблюдателя состояния.

Модель наблюдателя физической системы обычно выводится из приведенных выше уравнений. Могут быть включены дополнительные условия, чтобы гарантировать, что при получении последовательных измеренных значений входных и выходных данных объекта состояние модели сходится к состоянию объекта. В частности, выходные данные наблюдателя можно вычесть из выходных данных объекта, а затем умножить на матрицу. $L$ ; затем это добавляется к уравнениям состояния наблюдателя для получения так называемого Люенбергера наблюдателя , определяемого приведенными ниже уравнениями. Обратите внимание, что переменные наблюдателя состояния обычно обозначаются «шляпкой»: ${\hat {x}}(k)$ и ${\hat {y}}(k)$ отличить их от переменных уравнений, которым удовлетворяет физическая система.

{\hat {x}}(k+1)=A{\hat {x}}(k)+L\left[y(k)-{\hat {y}}(k)\right]+Bu(k)

{\hat {y}}(k)=C{\hat {x}}(k)+Du(k)

Наблюдатель называется асимптотически устойчивым, если ошибка наблюдателя $e(k)={\hat {x}}(k)-x(k)$ сходится к нулю, когда $k\to \infty$ . Для наблюдателя Люенбергера ошибка наблюдателя удовлетворяет условию $e(k+1)=(A-LC)e(k)$ . Таким образом, наблюдатель Люенбергера для этой системы с дискретным временем асимптотически устойчив, когда матрица $A-LC$ имеет все собственные значения внутри единичного круга.

В целях управления выходные данные системы наблюдения возвращаются на вход как наблюдателя, так и объекта через матрицу выигрышей. $K$ .

u(k)=-K{\hat {x}}(k)

Тогда уравнения наблюдателя примут вид:

{\hat {x}}(k+1)=A{\hat {x}}(k)+L\left(y(k)-{\hat {y}}(k)\right)-BK{\hat {x}}(k)

{\hat {y}}(k)=C{\hat {x}}(k)-DK{\hat {x}}(k)

или, проще говоря,

{\hat {x}}(k+1)=\left(A-BK\right){\hat {x}}(k)+L\left(y(k)-{\hat {y}}(k)\right)

{\hat {y}}(k)=\left(C-DK\right){\hat {x}}(k)

Благодаря принципу разделения мы знаем, что можем выбирать $K$ и $L$ самостоятельно без ущерба для общей стабильности систем. Как правило, полюса наблюдателя $A-LC$ обычно выбираются так, чтобы сходиться в 10 раз быстрее, чем полюса системы $A-BK$ .

Случай с непрерывным временем [ править ]

Предыдущий пример был для наблюдателя, реализованного в системе LTI с дискретным временем. Однако для случая непрерывного времени процесс аналогичен; наблюдатель получает $L$ выбираются так, чтобы динамика ошибок в непрерывном времени асимптотически сходилась к нулю (т. е. когда $A-LC$ является матрицей Гурвица ).

Для линейной системы с непрерывным временем

{\dot {x}}=Ax+Bu,

y=Cx+Du,

где $x\in \mathbb {R} ^{n},u\in \mathbb {R} ^{m},y\in \mathbb {R} ^{r}$ , наблюдатель выглядит аналогично описанному выше случаю дискретного времени:

{\dot {\hat {x}}}=A{\hat {x}}+Bu+L\left(y-{\hat {y}}\right)

.

{\hat {y}}=C{\hat {x}}+Du,

Ошибка наблюдателя $e=x-{\hat {x}}$ удовлетворяет уравнению

{\dot {e}}=(A-LC)e

.

Собственные значения матрицы $A-LC$ может быть выбран произвольно путем соответствующего выбора коэффициента усиления наблюдателя $L$ когда пара $[A,C]$ является наблюдаемым, т.е. выполняется условие наблюдаемости . В частности, это можно сделать по Гурвицу, поэтому ошибка наблюдателя $e(t)\to 0$ когда $t\to \infty$ .

Пикирование и другие методы наблюдения [ править ]

Когда наблюдатель получит $L$ высока, линейный наблюдатель Люенбергера очень быстро сходится к состояниям системы. Однако высокий коэффициент усиления наблюдателя приводит к явлению пика, при котором начальная ошибка оценки может быть непомерно большой (т. е. непрактичной или небезопасной в использовании). ^[1] Как следствие, доступны нелинейные методы наблюдения с высоким коэффициентом усиления, которые быстро сходятся без явления обострения. Например, управление скользящим режимом можно использовать для создания наблюдателя, который сводит ошибку одного оцененного состояния к нулю за конечное время даже при наличии ошибки измерения; в других состояниях есть ошибка, которая ведет себя аналогично ошибке наблюдателя Люенбергера после исчезновения пика. Наблюдатели скользящего режима также обладают привлекательными свойствами устойчивости к шуму, которые аналогичны фильтру Калмана . ^[2]^[3]Другой подход заключается в применении нескольких наблюдателей, что значительно улучшает переходные процессы и уменьшает перерегулирование наблюдателей. Мультинаблюдатель можно адаптировать к любой системе, где применим наблюдатель с высоким коэффициентом усиления. ^[4]

Государственные наблюдатели за нелинейными системами [ править ]

Высокий коэффициент усиления, скользящий режим и расширенные наблюдатели являются наиболее распространенными наблюдателями для нелинейных систем. Чтобы проиллюстрировать применение наблюдателей скользящего режима для нелинейных систем, сначала рассмотрим нелинейную систему без входных данных:

{\dot {x}}=f(x)

где $x\in \mathbb {R} ^{n}$ . Также предположим, что существует измеримый результат. $y\in \mathbb {R}$ данный

y=h(x).

Существует несколько неаппроксимированных подходов к проектированию наблюдателя. Два наблюдателя, приведенные ниже, применимы и к случаю, когда у системы есть вход. То есть,

{\dot {x}}=f(x)+B(x)u

y=h(x).

динамика Линеаризуемая ошибок

Одно предложение Кренера и Исидори. ^[5] и Кренер и Респондек ^[6] может применяться в ситуации, когда существует линеаризующее преобразование (т. е. диффеоморфизм , подобный тому, который используется при линеаризации с обратной связью ) $z=\Phi (x)$ такие, что в новых переменных уравнения системы имеют вид

{\dot {z}}=Az+\phi (y),

y=Cz.

Наблюдатель Люенбергера тогда спроектирован как

{\dot {\hat {z}}}=A{\hat {z}}+\phi (y)-L\left(C{\hat {z}}-y\right)

.

Ошибка наблюдателя для преобразованной переменной $e={\hat {z}}-z$ удовлетворяет тому же уравнению, что и в классическом линейном случае.

{\dot {e}}=(A-LC)e

.

Как показали Готье, Хаммури и Осман ^[7]и Хаммури и Киннарт, ^[8] если существует трансформация $z=\Phi (x)$ такая, что систему можно преобразовать к виду

{\dot {z}}=A(u(t))z+\phi (y,u(t)),

y=Cz,

тогда наблюдатель спроектирован как

{\dot {\hat {z}}}=A(u(t)){\hat {z}}+\phi (y,u(t))-L(t)\left(C{\hat {z}}-y\right)

,

где $L(t)$ - изменяющийся во времени выигрыш наблюдателя.

Чиккарелла, Далла Мора и Джермани ^[9] получили более сложные и общие результаты, устранив необходимость в нелинейном преобразовании и доказав глобальную асимптотическую сходимость оцененного состояния к истинному состоянию, используя только простые предположения о регулярности.

Смененные наблюдатели [ править ]

Как обсуждалось выше для линейного случая, явление пика, присутствующее у наблюдателей Люенбергера, оправдывает использование переключаемых наблюдателей. Переключаемый наблюдатель включает в себя реле или двоичный переключатель, который действует при обнаружении мельчайших изменений измеряемого выходного сигнала. Некоторые распространенные типы переключаемых наблюдателей включают наблюдателя в скользящем режиме, нелинейного наблюдателя с расширенным состоянием, ^[10] наблюдатель с фиксированным временем, ^[11] переключаемый наблюдатель с высоким коэффициентом усиления ^[12] и объединяющий наблюдатель. ^[13] Наблюдатель скользящего режима использует нелинейную обратную связь с высоким коэффициентом усиления для передачи оцененных состояний на гиперповерхность , где нет разницы между расчетным выходным сигналом и измеренным выходным сигналом. Нелинейное усиление, используемое в наблюдателе, обычно реализуется с помощью масштабированной функции переключения, такой как знак (т. е. знак) расчетно-измеренной выходной ошибки. Следовательно, из-за этой обратной связи с высоким коэффициентом усиления векторное поле наблюдателя имеет складку, так что траектории наблюдателя скользят по кривой, где расчетный выходной сигнал точно соответствует измеренному выходному сигналу. Таким образом, если система наблюдаема по ее выходным данным, все состояния наблюдателя будут приведены к фактическим состояниям системы. Кроме того, используя знак ошибки для управления наблюдателем в скользящем режиме, траектории наблюдателя становятся нечувствительными ко многим формам шума. Следовательно, некоторые наблюдатели скользящего режима имеют привлекательные свойства, аналогичные фильтру Калмана , но с более простой реализацией. ^[2]^[3]

По мнению Дракунова, ^[14] наблюдатель скользящего режима также может быть разработан для класса нелинейных систем. Такой наблюдатель можно записать в терминах исходной оценки переменной ${\hat {x}}$ и имеет вид

{\dot {\hat {x}}}=\left[{\frac {\partial H({\hat {x}})}{\partial x}}\right]^{-1}M({\hat {x}})\operatorname {sgn}(V(t)-H({\hat {x}}))

где:

The $\operatorname {sgn}({\mathord {\cdot }})$ вектор расширяет скалярную функцию Signum до $n$ размеры. То есть,
$\operatorname {sgn}(z)={\begin{bmatrix}\operatorname {sgn}(z_{1})\\\operatorname {sgn}(z_{2})\\\vdots \\\operatorname {sgn}(z_{i})\\\vdots \\\operatorname {sgn}(z_{n})\end{bmatrix}}$
для вектора $z\in \mathbb {R} ^{n}$ .
Вектор $H(x)$ имеет компоненты, которые являются функцией вывода $h(x)$ и его повторяющиеся производные Ли. В частности,
$H(x)\triangleq {\begin{bmatrix}h_{1}(x)\\h_{2}(x)\\h_{3}(x)\\\vdots \\h_{n}(x)\end{bmatrix}}\triangleq {\begin{bmatrix}h(x)\\L_{f}h(x)\\L_{f}^{2}h(x)\\\vdots \\L_{f}^{n-1}h(x)\end{bmatrix}}$
где $L_{f}^{i}h$ это я ^й Производная Ли от выходной функции $h$ вдоль векторного поля $f$ (т.е. вдоль $x$ траектории нелинейной системы). когда система не имеет входных данных или имеет относительную степень n В особом случае , , $H(x(t))$ представляет собой коллекцию вывода $y(t)=h(x(t))$ и его $n-1$ производные. Поскольку обратная линеаризации якобианской $H(x)$ должно существовать, чтобы этот наблюдатель был четко определен, преобразование $H(x)$ гарантированно является локальным диффеоморфизмом .
Диагональная матрица $M({\hat {x}})$ прибыли такова, что
$M({\hat {x}})\triangleq \operatorname {diag} (m_{1}({\hat {x}}),m_{2}({\hat {x}}),\ldots ,m_{n}({\hat {x}}))={\begin{bmatrix}m_{1}({\hat {x}})&&&&&\\&m_{2}({\hat {x}})&&&&\\&&\ddots &&&\\&&&m_{i}({\hat {x}})&&\\&&&&\ddots &\\&&&&&m_{n}({\hat {x}})\end{bmatrix}}$
где для каждого $i\in \{1,2,\dots ,n\}$ , элемент $m_{i}({\hat {x}})>0$ и достаточно большой, чтобы обеспечить достижимость скользящего режима.
Вектор наблюдателя $V(t)$ таков, что
$V(t)\triangleq {\begin{bmatrix}v_{1}(t)\\v_{2}(t)\\v_{3}(t)\\\vdots \\v_{i}(t)\\\vdots \\v_{n}(t)\end{bmatrix}}\triangleq {\begin{bmatrix}y(t)\\\{m_{1}({\hat {x}})\operatorname {sgn}(v_{1}(t)-h_{1}({\hat {x}}(t)))\}_{\text{eq}}\\\{m_{2}({\hat {x}})\operatorname {sgn}(v_{2}(t)-h_{2}({\hat {x}}(t)))\}_{\text{eq}}\\\vdots \\\{m_{i-1}({\hat {x}})\operatorname {sgn}(v_{i-1}(t)-h_{i-1}({\hat {x}}(t)))\}_{\text{eq}}\\\vdots \\\{m_{n-1}({\hat {x}})\operatorname {sgn}(v_{n-1}(t)-h_{n-1}({\hat {x}}(t)))\}_{\text{eq}}\end{bmatrix}}$
где $\operatorname {sgn}({\mathord {\cdot }})$ вот нормальная функция Signum, определенная для скаляров, и $\{\ldots \}_{\text{eq}}$ обозначает «оператор эквивалентного значения» разрывной функции в скользящем режиме.

Кратко эту идею можно объяснить следующим образом. Согласно теории скользящих режимов, для описания поведения системы после начала скользящего режима используется функция $\operatorname {sgn}(v_{i}(t)\!-\!h_{i}({\hat {x}}(t)))$ следует заменить эквивалентными значениями (см. эквивалентное управление в теории скользящих режимов ). На практике он переключается (вибрирует) с высокой частотой, при этом медленная составляющая равна эквивалентному значению. Применяя соответствующий фильтр нижних частот для избавления от высокочастотной составляющей, можно получить значение эквивалентного управления, которое содержит больше информации о состоянии оцениваемой системы. Описанный выше наблюдатель использует этот метод несколько раз, чтобы получить состояние нелинейной системы в идеале за конечное время.

Модифицированную ошибку наблюдения можно записать в преобразованных состояниях $e=H(x)-H({\hat {x}})$ . В частности,

{\begin{aligned}{\dot {e}}&={\frac {\mathrm {d} }{\mathrm {d} t}}H(x)-{\frac {\mathrm {d} }{\mathrm {d} t}}H({\hat {x}})\\&={\frac {\mathrm {d} }{\mathrm {d} t}}H(x)-M({\hat {x}})\,\operatorname {sgn}(V(t)-H({\hat {x}}(t))),\end{aligned}}

и так

{\begin{aligned}{\begin{bmatrix}{\dot {e}}_{1}\\{\dot {e}}_{2}\\\vdots \\{\dot {e}}_{i}\\\vdots \\{\dot {e}}_{n-1}\\{\dot {e}}_{n}\end{bmatrix}}&={\mathord {\overbrace {\begin{bmatrix}{\dot {h}}_{1}(x)\\{\dot {h}}_{2}(x)\\\vdots \\{\dot {h}}_{i}(x)\\\vdots \\{\dot {h}}_{n-1}(x)\\{\dot {h}}_{n}(x)\end{bmatrix}} ^{{\tfrac {\mathrm {d} }{\mathrm {d} t}}H(x)}}}-{\mathord {\overbrace {M({\hat {x}})\,\operatorname {sgn}(V(t)-H({\hat {x}}(t)))} ^{{\tfrac {\mathrm {d} }{\mathrm {d} t}}H({\hat {x}})}}}={\begin{bmatrix}h_{2}(x)\\h_{3}(x)\\\vdots \\h_{i+1}(x)\\\vdots \\h_{n}(x)\\L_{f}^{n}h(x)\end{bmatrix}}-{\begin{bmatrix}m_{1}\operatorname {sgn}(v_{1}(t)-h_{1}({\hat {x}}(t)))\\m_{2}\operatorname {sgn}(v_{2}(t)-h_{2}({\hat {x}}(t)))\\\vdots \\m_{i}\operatorname {sgn}(v_{i}(t)-h_{i}({\hat {x}}(t)))\\\vdots \\m_{n-1}\operatorname {sgn}(v_{n-1}(t)-h_{n-1}({\hat {x}}(t)))\\m_{n}\operatorname {sgn}(v_{n}(t)-h_{n}({\hat {x}}(t)))\end{bmatrix}}\\&={\begin{bmatrix}h_{2}(x)-m_{1}({\hat {x}})\operatorname {sgn}({\mathord {\overbrace {{\mathord {\overbrace {v_{1}(t)} ^{v_{1}(t)=y(t)=h_{1}(x)}}}-h_{1}({\hat {x}}(t))} ^{e_{1}}}})\\h_{3}(x)-m_{2}({\hat {x}})\operatorname {sgn}(v_{2}(t)-h_{2}({\hat {x}}(t)))\\\vdots \\h_{i+1}(x)-m_{i}({\hat {x}})\operatorname {sgn}(v_{i}(t)-h_{i}({\hat {x}}(t)))\\\vdots \\h_{n}(x)-m_{n-1}({\hat {x}})\operatorname {sgn}(v_{n-1}(t)-h_{n-1}({\hat {x}}(t)))\\L_{f}^{n}h(x)-m_{n}({\hat {x}})\operatorname {sgn}(v_{n}(t)-h_{n}({\hat {x}}(t)))\end{bmatrix}}.\end{aligned}}

Так:

Пока $m_{1}({\hat {x}})\geq |h_{2}(x(t))|$ , первая строка динамики ошибок, ${\dot {e}}_{1}=h_{2}({\hat {x}})-m_{1}({\hat {x}})\operatorname {sgn}(e_{1})$ , будет соответствовать достаточным условиям для вступления в $e_{1}=0$ скользящий режим за конечное время.
Вдоль $e_{1}=0$ поверхность, соответствующая $v_{2}(t)=\{m_{1}({\hat {x}})\operatorname {sgn}(e_{1})\}_{\text{eq}}$ эквивалентное управление будет равно $h_{2}(x)$ , и так $v_{2}(t)-h_{2}({\hat {x}})=h_{2}(x)-h_{2}({\hat {x}})=e_{2}$ . Следовательно, пока $m_{2}({\hat {x}})\geq |h_{3}(x(t))|$ , вторая строка динамики ошибок, ${\dot {e}}_{2}=h_{3}({\hat {x}})-m_{2}({\hat {x}})\operatorname {sgn}(e_{2})$ , войдет в $e_{2}=0$ скользящий режим за конечное время.
Вдоль $e_{i}=0$ поверхность, соответствующая $v_{i+1}(t)=\{\ldots \}_{\text{eq}}$ эквивалентное управление будет равно $h_{i+1}(x)$ . Следовательно, пока $m_{i+1}({\hat {x}})\geq |h_{i+2}(x(t))|$ , $(i+1)$ ^й ряд динамики ошибок, ${\dot {e}}_{i+1}=h_{i+2}({\hat {x}})-m_{i+1}({\hat {x}})\operatorname {sgn}(e_{i+1})$ , войдет в $e_{i+1}=0$ скользящий режим за конечное время.

Итак, для достаточно больших $m_{i}$ выигрыши, все оцененные состояния наблюдателя достигают фактических состояний за конечное время. Фактически, увеличение $m_{i}$ допускает сходимость в любое желаемое конечное время при условии, что каждый $|h_{i}(x(0))|$ функция может быть ограничена с уверенностью. Следовательно, требование, чтобы отображение $H:\mathbb {R} ^{n}\to \mathbb {R} ^{n}$ является диффеоморфизмом (т. е. что его якобианская линеаризация обратима) утверждает, что сходимость оцененного результата влечет за собой сходимость оцененного состояния. То есть требование является условием наблюдаемости.

В случае наблюдателя скользящего режима для системы со входом необходимы дополнительные условия, чтобы ошибка наблюдения не зависела от входа. Например, это

{\frac {\partial H(x)}{\partial x}}B(x)

не зависит от времени. Тогда наблюдатель

{\dot {\hat {x}}}=\left[{\frac {\partial H({\hat {x}})}{\partial x}}\right]^{-1}M({\hat {x}})\operatorname {sgn}(V(t)-H({\hat {x}}))+B({\hat {x}})u.

Мульти-наблюдатель [ править ]

Функция нескольких наблюдателей расширяет структуру наблюдателей с высоким коэффициентом усиления от одного до нескольких наблюдателей, при этом множество моделей работают одновременно. Он имеет два уровня: первый состоит из нескольких наблюдателей с высоким коэффициентом усиления с разными состояниями оценки, а второй определяет веса важности наблюдателей первого уровня. Алгоритм прост в реализации и не содержит рискованных операций типа дифференцирования. ^[4] Идея множественных моделей ранее применялась для получения информации в адаптивном управлении. ^[15]

Схема с несколькими наблюдателями

Предполагая, что количество наблюдателей с высоким коэффициентом усиления равно $n+1$ ,

{\dot {\hat {x}}}_{k}(t)=A{\hat {x_{k}}}(t)+B\phi _{0}({\hat {x}}(t),u(t))-L({\hat {y_{k}}}(t)-y(t))

{\hat {y_{k}}}(t)=C{\hat {x_{k}}}(t)

где $k=1,\dots ,n+1$ — индекс наблюдателя. Наблюдатели первого слоя состоят из того же усиления $L$ но они отличаются исходным состоянием $x_{k}(0)$ . Во втором слое все $x_{k}(t)$ от $k=1...n+1$ наблюдатели объединяются в один для получения единой оценки вектора состояния

{\hat {y_{k}}}(t)=\sum \limits _{k=1}^{n+1}\alpha _{k}(t){\hat {x_{k}}}(t)

где $\alpha _{k}\in \mathbb {R}$ являются весовыми коэффициентами. Эти факторы изменяются, чтобы обеспечить оценку на втором уровне и улучшить процесс наблюдения.

Предположим, что

\sum \limits _{k=1}^{n+1}\alpha _{k}(t)\xi _{k}(t)=0

и

\sum \limits _{k=1}^{n+1}\alpha _{k}(t)=1

где $\xi _{k}\in \mathbb {R} ^{n\times 1}$ это некоторый вектор, который зависит от $kth$ ошибка наблюдателя $e_{k}(t)$ .

Некоторые преобразования приводят к задаче линейной регрессии

[-\xi _{n+1}(t)]=[\xi _{1}(t)-\xi _{n+1}(t)\dots \xi _{k}(t)-\xi _{n+1}(t)\dots \xi _{n}(t)-\xi _{n+1}(t)]^{T}{\begin{bmatrix}\alpha _{1}(t)\\\vdots \\\alpha _{k}(t)\\\vdots \\\alpha _{n}(t)\end{bmatrix}}

Эта формула дает возможность оценить $\alpha _{k}(t)$ . Чтобы построить многообразие, нам нужно отображение $m:\mathbb {R} ^{n}\to \mathbb {R} ^{n}$ между $\xi _{k}(t)=m(e_{k}(t))$ и гарантировать, что $\xi _{k}(t)$ рассчитывается на основе измеримых сигналов. Прежде всего, необходимо устранить явление парковки для $\alpha _{k}(t)$ из-за ошибки наблюдателя

e_{\sigma }(t)=\sum \limits _{k=1}^{n+1}\alpha _{k}(t)e_{k}(t)

.

Рассчитать $n$ производная по разу $\eta _{k}(t)={\hat {y}}_{k}(t)-y(t)$ найти отображение m привести к $\xi _{k}(t)$ определяется как

\xi _{k}(t)={\begin{bmatrix}1&0&0&\cdots &0\\CL&1&0&\cdots &0\\CAL&CL&1&\cdots &0\\CA^{2}L&CAL&CL&\cdots &0\\\vdots &\vdots &\vdots &\ddots \\CA^{n-2}L&CA^{n-3}L&CA^{n-4}L&\cdots &1\end{bmatrix}}{\begin{bmatrix}\int \limits _{t-t_{d}}^{t}{{n-1} \atop \cdots }\int \limits _{t-t_{d}}^{t}\eta _{k}(\tau )d\tau \\\vdots \\\eta (t)-\eta (t-(n-1)t_{d})\end{bmatrix}}

где $t_{d}>0$ является некоторой постоянной времени. Обратите внимание, что $\xi _{k}(t)$ реле на обоих $\eta _{k}(t)$ и его интегралы, следовательно, легко доступны в системе управления. Дальше $\alpha _{k}(t)$ определяется законом оценки; и таким образом доказывается, что многообразие измеримо. Во втором слое ${\hat {\alpha }}_{k}(t)$ для $k=1\dots n+1$ вводится как оценки $\alpha _{k}(t)$ коэффициенты. Ошибка отображения определяется как

e_{\xi }(t)=\sum \limits _{k=1}^{n+1}{\hat {\alpha }}_{k}(t)\xi _{k}(t)

где $e_{\xi }(t)\in \mathbb {R} ^{n\times 1},{\hat {\alpha }}_{k}(t)\in \mathbb {R}$ . Если коэффициенты ${\hat {\alpha }}(t)$ равны $\alpha _{k}(t)$ , то ошибка отображения $e_{\xi }(t)=0$ Теперь можно рассчитать ${\hat {x}}$ из приведенного выше уравнения и, следовательно, явление обострения уменьшается благодаря свойствам коллектора. Созданное отображение дает большую гибкость в процессе оценки. Даже можно оценить стоимость $x(t)$ во втором слое и вычислить состояние $x$ . ^[4]

Ограничивающие наблюдатели [ править ]

Ограничивающий ^[16] или интервальные наблюдатели ^[17]^[18] составляют класс наблюдателей, которые дают две оценкигосударства одновременно: одна из оценок дает верхнюю границу реальной стоимости государства,тогда как второй обеспечивает нижнюю границу. Тогда известно, что реальная стоимость государства всегда находится в пределах этих двух оценок.

Эти границы очень важны для практических приложений. ^[19]^[20] поскольку они позволяют в любой момент времени узнать точность оценки.

Математически можно использовать два наблюдателя Люенбергера, если $L$ правильно подбирается, используя, например, положительные свойства системы : ^[21] один для верхней границы ${\hat {x}}_{U}(k)$ (что гарантирует, что $e(k)={\hat {x}}_{U}(k)-x(k)$ сходится к нулю сверху, когда $k\to \infty$ , при отсутствии шума и неопределенности ), а нижняя граница ${\hat {x}}_{L}(k)$ (что гарантирует, что $e(k)={\hat {x}}_{L}(k)-x(k)$ сходится к нулю снизу). То есть всегда ${\hat {x}}_{U}(k)\geq x(k)\geq {\hat {x}}_{L}(k)$

См. также [ править ]

Ссылки [ править ]

Встроенные ссылки

^ Халил, Гонконг (2002), Нелинейные системы (3-е изд.), Аппер-Седл-Ривер, Нью-Джерси: Прентис-Холл , ISBN 978-0-13-067389-3
^ Jump up to: Перейти обратно: ^а ^б Уткин, Вадим; Гульднер, Юрген; Ши, Цзинсинь (1999), Управление скользящим режимом в электромеханических системах , Филадельфия, Пенсильвания: Taylor & Francisco, Inc., ISBN 978-0-7484-0116-1
^ Jump up to: Перейти обратно: ^а ^б Дракунов, С. В. (1983), "Адаптивный квазиоптимальный фильтр с разрывными параметрами", Автоматика и телемеханика , 44 (9): 1167–1175.
^ Jump up to: Перейти обратно: ^а ^б ^с Бернат, Дж.; Степьен, С. (2015), «Мульти-моделирование как новая схема оценки для наблюдателей с высоким коэффициентом усиления», International Journal of Control , 88 (6): 1209–1222, Bibcode : 2015IJC....88.1209B , doi : 10.1080/00207179.2014 .1000380 , S2CID 8599596
^ Кренер, Эй Джей; Исидори, Альберто (1983), «Линеаризация путем ввода выходного сигнала и нелинейных наблюдателей», System and Control Letters , 3 : 47–52, doi : 10.1016/0167-6911(83)90037-3
^ Кренер, Эй Джей; Респондек, В. (1985), «Нелинейные наблюдатели с линеаризуемой динамикой ошибок», SIAM Journal on Control and Optimization , 23 (2): 197–216, doi : 10.1137/0323016
^ Готье, JP; Хаммури, Х.; Отман, С. (1992), «Простой наблюдатель для приложений нелинейных систем в биореакторах», IEEE Transactions on Auto Control , 37 (6): 875–880, doi : 10.1109/9.256352
^ Хаммури, Х.; Киннарт, М. (1996), «Новая процедура изменяющейся во времени линеаризации вплоть до ввода выходного сигнала», System and Control Letters , 28 (3): 151–157, doi : 10.1016/0167-6911(96)00022-9
^ Чиккарелла, Г.; Далла Мора, М.; Германи, А. (1993), «Наблюдатель для нелинейных систем, подобный Люенбергеру», International Journal of Control , 57 (3): 537–556, doi : 10.1080/00207179308934406
^ Го, Бао-Чжу; Чжао, Чжи-Лян (январь 2011 г.). «Расширенный наблюдатель состояния нелинейных систем с неопределенностью» . Тома трудов МФБ . 44 (1). Международная федерация автоматического управления : 1855–1860 гг. дои : 10.3182/20110828-6-IT-1002.00399 . Проверено 8 августа 2023 г.
^ «Wayback Machine не заархивировала этот URL» . Проверено 8 августа 2023 г. ^{[ мертвая ссылка ]}
^ Кумар, Сунил; Кумар Пал, Анил; Камаль, Шьям; Сюн, Сяоган (19 мая 2023 г.). «Проектирование переключаемого наблюдателя с высоким коэффициентом усиления для нелинейных систем» . Международный журнал системных наук . 54 (7). Научно-издательская группа : 1471–1483. Бибкод : 2023IJSS...54.1471K . дои : 10.1080/00207721.2023.2178863 . S2CID 257145897 . Проверено 8 августа 2023 г.
^ «Регистрация» . IEEE Эксплор . Проверено 8 августа 2023 г.
^ Дракунов, С.В. (1992). «Скользящие наблюдатели на основе эквивалентного метода управления» . [1992] Материалы 31-й конференции IEEE по принятию решений и управлению . стр. 2368–2370 . дои : 10.1109/CDC.1992.371368 . ISBN 978-0-7803-0872-5 . S2CID 120072463 .
^ Нарендра, Канзас; Хан, З. (август 2012 г.). «Новый подход к адаптивному управлению с использованием нескольких моделей». Международный журнал адаптивного управления и обработки сигналов . 26 (8): 778–799. дои : 10.1002/acs.2269 . ISSN 1099-1115 . S2CID 60482210 .
^ Комбастель, К. (2003). «Наблюдатель за границей штата на основе зонотопов» (PDF) . Европейская конференция по контролю (ECC), 2003 г. стр. 2589–2594. дои : 10.23919/ECC.2003.7085991 . ISBN 978-3-9524173-7-9 . S2CID 13790057 .
^ Рами, М. Айт; Ченг, Швейцария; Де Прада, К. (2008). «Наблюдатели с жесткими интервалами: подход LP» (PDF) . 2008 г. 47-я конференция IEEE по принятию решений и управлению . стр. 2967–2972. дои : 10.1109/CDC.2008.4739280 . ISBN 978-1-4244-3123-6 . S2CID 288928 .
^ Ефимов Д.; Раисси, Т. (2016). «Проектирование интервальных наблюдателей для неопределенных динамических систем» . Автоматизация и дистанционное управление . 77 (2): 191–225. дои : 10.1134/S0005117916020016 . hdl : 20.500.12210/25069 . S2CID 49322177 .
^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf ^{[ только URL-адрес PDF ]}
^ Хадж-Садок, МЗ; Гузе, JL (2001). «Оценка неопределенных моделей процессов в активном иле с помощью интервальных наблюдателей». Журнал управления процессами . 11 (3): 299–310. дои : 10.1016/S0959-1524(99)00074-8 .
^ Рами, Мустафа Айт; Тадео, Фернандо; Хельмке, Уве (2011). «Позитивные наблюдатели линейных положительных систем и их последствия». Международный журнал контроля . 84 (4): 716–725. Бибкод : 2011IJC....84..716A . дои : 10.1080/00207179.2011.573000 . S2CID 21211012 .

Общие ссылки

Зонтаг, Эдуардо (1998), Математическая теория управления: детерминированные конечномерные системы. Второе издание , Springer, ISBN 978-0-387-98489-6

Внешние ссылки [ править ]

Простое объяснение фильтра Калмана , пошаговое руководство по использованию фильтра Калмана с уравнениями

[Khalil02-1] Халил, Гонконг (2002), Нелинейные системы (3-е изд.), Аппер-Седл-Ривер, Нью-Джерси: Прентис-Холл , ISBN 978-0-13-067389-3

[UtkinGS99-2] Jump up to: Перейти обратно: ^а ^б Уткин, Вадим; Гульднер, Юрген; Ши, Цзинсинь (1999), Управление скользящим режимом в электромеханических системах , Филадельфия, Пенсильвания: Taylor & Francisco, Inc., ISBN 978-0-7484-0116-1

[Drakunov83-3] Jump up to: Перейти обратно: ^а ^б Дракунов, С. В. (1983), "Адаптивный квазиоптимальный фильтр с разрывными параметрами", Автоматика и телемеханика , 44 (9): 1167–1175.

[MMObserver-4] Jump up to: Перейти обратно: ^а ^б ^с Бернат, Дж.; Степьен, С. (2015), «Мульти-моделирование как новая схема оценки для наблюдателей с высоким коэффициентом усиления», International Journal of Control , 88 (6): 1209–1222, Bibcode : 2015IJC....88.1209B , doi : 10.1080/00207179.2014 .1000380 , S2CID 8599596

[KrenerIsidori83-5] Кренер, Эй Джей; Исидори, Альберто (1983), «Линеаризация путем ввода выходного сигнала и нелинейных наблюдателей», System and Control Letters , 3 : 47–52, doi : 10.1016/0167-6911(83)90037-3

[KrenerRespondek85-6] Кренер, Эй Джей; Респондек, В. (1985), «Нелинейные наблюдатели с линеаризуемой динамикой ошибок», SIAM Journal on Control and Optimization , 23 (2): 197–216, doi : 10.1137/0323016

[GauthierHammouriOthman92-7] Готье, JP; Хаммури, Х.; Отман, С. (1992), «Простой наблюдатель для приложений нелинейных систем в биореакторах», IEEE Transactions on Auto Control , 37 (6): 875–880, doi : 10.1109/9.256352

[HammouriKinnaert96-8] Хаммури, Х.; Киннарт, М. (1996), «Новая процедура изменяющейся во времени линеаризации вплоть до ввода выходного сигнала», System and Control Letters , 28 (3): 151–157, doi : 10.1016/0167-6911(96)00022-9

[CiccarellaDallaMoraGermani93-9] Чиккарелла, Г.; Далла Мора, М.; Германи, А. (1993), «Наблюдатель для нелинейных систем, подобный Люенбергеру», International Journal of Control , 57 (3): 537–556, doi : 10.1080/00207179308934406

[10] Го, Бао-Чжу; Чжао, Чжи-Лян (январь 2011 г.). «Расширенный наблюдатель состояния нелинейных систем с неопределенностью» . Тома трудов МФБ . 44 (1). Международная федерация автоматического управления : 1855–1860 гг. дои : 10.3182/20110828-6-IT-1002.00399 . Проверено 8 августа 2023 г.

[11] «Wayback Machine не заархивировала этот URL» . Проверено 8 августа 2023 г. ^{[ мертвая ссылка ]}

[12] Кумар, Сунил; Кумар Пал, Анил; Камаль, Шьям; Сюн, Сяоган (19 мая 2023 г.). «Проектирование переключаемого наблюдателя с высоким коэффициентом усиления для нелинейных систем» . Международный журнал системных наук . 54 (7). Научно-издательская группа : 1471–1483. Бибкод : 2023IJSS...54.1471K . дои : 10.1080/00207721.2023.2178863 . S2CID 257145897 . Проверено 8 августа 2023 г.

[13] «Регистрация» . IEEE Эксплор . Проверено 8 августа 2023 г.

[Drakunov92-14] Дракунов, С.В. (1992). «Скользящие наблюдатели на основе эквивалентного метода управления» . [1992] Материалы 31-й конференции IEEE по принятию решений и управлению . стр. 2368–2370 . дои : 10.1109/CDC.1992.371368 . ISBN 978-0-7803-0872-5 . S2CID 120072463 .

[15] Нарендра, Канзас; Хан, З. (август 2012 г.). «Новый подход к адаптивному управлению с использованием нескольких моделей». Международный журнал адаптивного управления и обработки сигналов . 26 (8): 778–799. дои : 10.1002/acs.2269 . ISSN 1099-1115 . S2CID 60482210 .

[16] Комбастель, К. (2003). «Наблюдатель за границей штата на основе зонотопов» (PDF) . Европейская конференция по контролю (ECC), 2003 г. стр. 2589–2594. дои : 10.23919/ECC.2003.7085991 . ISBN 978-3-9524173-7-9 . S2CID 13790057 .

[17] Рами, М. Айт; Ченг, Швейцария; Де Прада, К. (2008). «Наблюдатели с жесткими интервалами: подход LP» (PDF) . 2008 г. 47-я конференция IEEE по принятию решений и управлению . стр. 2967–2972. дои : 10.1109/CDC.2008.4739280 . ISBN 978-1-4244-3123-6 . S2CID 288928 .

[18] Ефимов Д.; Раисси, Т. (2016). «Проектирование интервальных наблюдателей для неопределенных динамических систем» . Автоматизация и дистанционное управление . 77 (2): 191–225. дои : 10.1134/S0005117916020016 . hdl : 20.500.12210/25069 . S2CID 49322177 .

[19] ttp://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf ^{[ только URL-адрес PDF ]}

[20] Хадж-Садок, МЗ; Гузе, JL (2001). «Оценка неопределенных моделей процессов в активном иле с помощью интервальных наблюдателей». Журнал управления процессами . 11 (3): 299–310. дои : 10.1016/S0959-1524(99)00074-8 .

[21] Рами, Мустафа Айт; Тадео, Фернандо; Хельмке, Уве (2011). «Позитивные наблюдатели линейных положительных систем и их последствия». Международный журнал контроля . 84 (4): 716–725. Бибкод : 2011IJC....84..716A . дои : 10.1080/00207179.2011.573000 . S2CID 21211012 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

наблюдателя Типичная модель ​