Jump to content

Государственный наблюдатель

(Перенаправлено из оценки состояния )

В теории управления наблюдатель состояния или оценщик состояния — это система, которая обеспечивает оценку внутреннего состояния данной реальной системы на основе измерений входных и выходных данных реальной системы. Обычно он реализуется на компьютере и обеспечивает основу для многих практических приложений.

Знание состояния системы необходимо для решения многих теории управления задач ; например, стабилизация системы с помощью обратной связи по состоянию . В большинстве практических случаев физическое состояние системы не может быть определено прямым наблюдением. Вместо этого косвенные эффекты внутреннего состояния наблюдаются через выходные данные системы. Простой пример — транспортные средства в туннеле: скорости и скорости, с которыми транспортные средства въезжают и покидают туннель, можно наблюдать непосредственно, но точное состояние внутри туннеля можно только оценить. Если система наблюдаема , можно полностью восстановить состояние системы на основе ее выходных измерений с помощью наблюдателя состояния.

Типичная модель наблюдателя

[ редактировать ]
Блок-схема Luenberger Observer. Ввод усиления наблюдателя L равен .

Линейные, с задержкой, скользящий режим, с высоким коэффициентом усиления, тау, основанные на однородности, расширенные и кубические наблюдатели входят в число нескольких структур наблюдателей, используемых для оценки состояния линейных и нелинейных систем. Структура линейного наблюдателя описана в следующих разделах.

Случай дискретного времени

[ редактировать ]

Предполагается, что состояние линейной, инвариантной ко времени системы с дискретным временем удовлетворяет

где, во время , состояние завода; это его входы; и это его результаты. Эти уравнения просто говорят, что текущая продукция предприятия и его будущее состояние определяются исключительно его текущим состоянием и текущими затратами. (Хотя эти уравнения выражаются через дискретные шаги по времени, очень похожие уравнения справедливы и для непрерывных систем). Если эта система наблюдаема , то выход объекта , может использоваться для управления состоянием наблюдателя состояния.

Модель наблюдателя физической системы обычно выводится из приведенных выше уравнений. Могут быть включены дополнительные условия, чтобы гарантировать, что при получении последовательных измеренных значений входных и выходных данных объекта состояние модели сходится к состоянию объекта. В частности, выходные данные наблюдателя можно вычесть из выходных данных объекта, а затем умножить на матрицу. ; затем это добавляется к уравнениям состояния наблюдателя для получения так называемого Люенбергера наблюдателя , определяемого приведенными ниже уравнениями. Обратите внимание, что переменные наблюдателя состояния обычно обозначаются «шляпкой»: и отличить их от переменных уравнений, которым удовлетворяет физическая система.

Наблюдатель называется асимптотически устойчивым, если ошибка наблюдателя сходится к нулю, когда . Для наблюдателя Люенбергера ошибка наблюдателя удовлетворяет условию . Таким образом, наблюдатель Люенбергера для этой системы с дискретным временем асимптотически устойчив, когда матрица имеет все собственные значения внутри единичного круга.

В целях управления выходные данные системы наблюдения возвращаются на вход как наблюдателя, так и объекта через матрицу выигрышей. .

Тогда уравнения наблюдателя примут вид:

или, проще говоря,

Благодаря принципу разделения мы знаем, что можем выбирать и самостоятельно без ущерба для общей стабильности систем. Как правило, полюса наблюдателя обычно выбираются так, чтобы сходиться в 10 раз быстрее, чем полюса системы .

Случай непрерывного времени

[ редактировать ]

Предыдущий пример был для наблюдателя, реализованного в системе LTI с дискретным временем. Однако для случая непрерывного времени процесс аналогичен; наблюдатель получает выбираются так, чтобы динамика ошибок в непрерывном времени асимптотически сходилась к нулю (т. е. когда является матрицей Гурвица ).

Для линейной системы с непрерывным временем

где , наблюдатель выглядит аналогично описанному выше случаю дискретного времени:

.

Ошибка наблюдателя удовлетворяет уравнению

.

Собственные значения матрицы может быть выбран произвольно путем соответствующего выбора коэффициента усиления наблюдателя когда пара является наблюдаемым, т.е. выполняется условие наблюдаемости . В частности, это можно сделать по Гурвицу, поэтому ошибка наблюдателя когда .

Пик и другие методы наблюдения

[ редактировать ]

Когда наблюдатель получит высока, линейный наблюдатель Люенбергера очень быстро сходится к состояниям системы. Однако высокий коэффициент усиления наблюдателя приводит к явлению пика, при котором начальная ошибка оценки может быть непомерно большой (т. е. непрактичной или небезопасной в использовании). [1] Как следствие, доступны нелинейные методы наблюдения с высоким коэффициентом усиления, которые быстро сходятся без явления обострения. Например, управление скользящим режимом можно использовать для создания наблюдателя, который сводит ошибку одного оцененного состояния к нулю за конечное время даже при наличии ошибки измерения; в других состояниях есть ошибка, которая ведет себя аналогично ошибке наблюдателя Люенбергера после исчезновения пика. Наблюдатели скользящего режима также обладают привлекательными свойствами устойчивости к шуму, которые аналогичны фильтру Калмана . [2] [3] Другой подход заключается в применении нескольких наблюдателей, что значительно улучшает переходные процессы и уменьшает перерегулирование наблюдателей. Мультинаблюдатель можно адаптировать к любой системе, где применим наблюдатель с высоким коэффициентом усиления. [4]

Государственные наблюдатели нелинейных систем

[ редактировать ]

Высокий коэффициент усиления, скользящий режим и расширенные наблюдатели являются наиболее распространенными наблюдателями для нелинейных систем. Чтобы проиллюстрировать применение наблюдателей скользящего режима для нелинейных систем, сначала рассмотрим нелинейную систему без входных данных:

где . Также предположим, что существует измеримый результат. данный

Существует несколько неаппроксимированных подходов к проектированию наблюдателя. Два наблюдателя, приведенные ниже, также применимы к случаю, когда у системы есть вход. То есть,

Линеаризуемая динамика ошибок

[ редактировать ]

Одно предложение Кренера и Исидори. [5] и Кренер и Респондек [6] может применяться в ситуации, когда существует линеаризующее преобразование (т. е. диффеоморфизм , подобный тому, который используется при линеаризации с обратной связью ) такие, что в новых переменных уравнения системы имеют вид

Наблюдатель Люенбергера тогда спроектирован как

.

Ошибка наблюдателя для преобразованной переменной удовлетворяет тому же уравнению, что и в классическом линейном случае.

.

Как показали Готье, Хаммури и Осман [7] и Хаммури и Киннарт, [8] если существует трансформация такая, что систему можно преобразовать к виду

тогда наблюдатель спроектирован как

,

где - изменяющийся во времени выигрыш наблюдателя.

Чиккарелла, Далла Мора и Джермани [9] получили более сложные и общие результаты, устранив необходимость в нелинейном преобразовании и доказав глобальную асимптотическую сходимость оцененного состояния к истинному состоянию, используя только простые предположения о регулярности.

Переключенные наблюдатели

[ редактировать ]

Как обсуждалось выше для линейного случая, явление пика, присутствующее у наблюдателей Люенбергера, оправдывает использование переключаемых наблюдателей. Переключаемый наблюдатель включает в себя реле или двоичный переключатель, который действует при обнаружении мельчайших изменений измеряемого выходного сигнала. Некоторые распространенные типы переключаемых наблюдателей включают наблюдателя в скользящем режиме, нелинейного наблюдателя с расширенным состоянием, [10] наблюдатель с фиксированным временем, [11] переключаемый наблюдатель с высоким коэффициентом усиления [12] и объединяющий наблюдатель. [13] Наблюдатель скользящего режима использует нелинейную обратную связь с высоким коэффициентом усиления для передачи оцененных состояний на гиперповерхность , где нет разницы между расчетным выходным сигналом и измеренным выходным сигналом. Нелинейное усиление, используемое в наблюдателе, обычно реализуется с помощью масштабированной функции переключения, такой как знак (т. е. знак) расчетно-измеренной выходной ошибки. Следовательно, из-за этой обратной связи с высоким коэффициентом усиления векторное поле наблюдателя имеет складку, так что траектории наблюдателя скользят по кривой, где расчетный выходной сигнал точно соответствует измеренному выходному сигналу. Таким образом, если система наблюдаема по ее выходным данным, все состояния наблюдателя будут приведены к фактическим состояниям системы. Кроме того, используя знак ошибки для управления наблюдателем в скользящем режиме, траектории наблюдателя становятся нечувствительными ко многим формам шума. Следовательно, некоторые наблюдатели скользящего режима имеют привлекательные свойства, аналогичные фильтру Калмана , но с более простой реализацией. [2] [3]

По мнению Дракунова, [14] наблюдатель скользящего режима также может быть разработан для класса нелинейных систем. Такой наблюдатель можно записать в терминах исходной оценки переменной и имеет вид

где:

  • The вектор расширяет скалярную функцию сигнума до размеры. То есть,
    для вектора .
  • Вектор имеет компоненты, которые являются функцией вывода и его повторяющиеся производные Ли. В частности,
    где это я й Производная Ли от выходной функции вдоль векторного поля (т.е. вдоль траектории нелинейной системы). когда система не имеет входных данных или имеет относительную степень n В особом случае , , представляет собой коллекцию вывода и его производные. Поскольку обратная линеаризация якобианская должно существовать, чтобы этот наблюдатель был четко определен, преобразование гарантированно является локальным диффеоморфизмом .
  • Диагональная матрица прибыли такова, что
    где для каждого , элемент и достаточно большой, чтобы обеспечить достижимость скользящего режима.
  • Вектор наблюдателя таков, что
    где вот нормальная функция Signum, определенная для скаляров, и обозначает «оператор эквивалентного значения» разрывной функции в скользящем режиме.

Кратко эту идею можно объяснить следующим образом. Согласно теории скользящих режимов, для описания поведения системы после начала скользящего режима используется функция следует заменить эквивалентными значениями (см. эквивалентное управление в теории скользящих режимов ). На практике он переключается (вибрирует) с высокой частотой, при этом медленная составляющая равна эквивалентному значению. Применяя соответствующий фильтр нижних частот для избавления от высокочастотной составляющей, можно получить значение эквивалентного управления, которое содержит больше информации о состоянии оцениваемой системы. Описанный выше наблюдатель использует этот метод несколько раз, чтобы получить состояние нелинейной системы в идеале за конечное время.

Модифицированную ошибку наблюдения можно записать в преобразованных состояниях . В частности,

и так

Так:

  1. Пока , первая строка динамики ошибок, , будет соответствовать достаточным условиям для вступления в скользящий режим за конечное время.
  2. Вдоль поверхность, соответствующая эквивалентное управление будет равно , и так . Следовательно, пока , вторая строка динамики ошибок, , войдет в скользящий режим за конечное время.
  3. Вдоль поверхность, соответствующая эквивалентное управление будет равно . Следовательно, пока , й ряд динамики ошибок, , войдет в скользящий режим за конечное время.

Итак, для достаточно больших выигрыши, все оцененные состояния наблюдателя достигают фактических состояний за конечное время. Фактически, увеличение допускает сходимость в любое желаемое конечное время при условии, что каждый функция может быть ограничена с уверенностью. Следовательно, требование, чтобы отображение является диффеоморфизмом (т. е. что его якобианская линеаризация обратима) утверждает, что сходимость оцененного результата влечет за собой сходимость оцененного состояния. То есть требование является условием наблюдаемости.

В случае наблюдателя скользящего режима для системы со входом необходимы дополнительные условия, чтобы ошибка наблюдения не зависела от входа. Например, это

не зависит от времени. Тогда наблюдатель

Мульти-наблюдатель

[ редактировать ]

Функция нескольких наблюдателей расширяет структуру наблюдателей с высоким коэффициентом усиления от одного до нескольких наблюдателей, при этом множество моделей работают одновременно. Он имеет два уровня: первый состоит из нескольких наблюдателей с высоким коэффициентом усиления с разными состояниями оценки, а второй определяет веса важности наблюдателей первого уровня. Алгоритм прост в реализации и не содержит рискованных операций типа дифференцирования. [4] Идея множественных моделей ранее применялась для получения информации в адаптивном управлении. [15]

Предполагая, что количество наблюдателей с высоким коэффициентом усиления равно ,

где — индекс наблюдателя. Наблюдатели первого слоя состоят из того же усиления но они отличаются исходным состоянием . Во втором слое все от наблюдатели объединяются в один для получения единой оценки вектора состояния

где являются весовыми коэффициентами. Эти факторы изменяются, чтобы обеспечить оценку на втором уровне и улучшить процесс наблюдения.

Предположим, что

и

где это некоторый вектор, который зависит от ошибка наблюдателя .

Некоторые преобразования приводят к задаче линейной регрессии

Эта формула дает возможность оценить . Чтобы построить многообразие, нам нужно отображение между и гарантировать, что рассчитывается на основе измеримых сигналов. Прежде всего, необходимо устранить явление парковки для из-за ошибки наблюдателя

.

Рассчитать производная по разу найти отображение m привести к определяется как

где является некоторой постоянной времени. Обратите внимание, что реле на обоих и его интегралы, следовательно, легко доступны в системе управления. Дальше определяется законом оценки; и таким образом доказывается, что многообразие измеримо. Во втором слое для вводится как оценки коэффициенты. Ошибка отображения определяется как

где . Если коэффициенты равны , то ошибка отображения Теперь можно рассчитать из приведенного выше уравнения и, следовательно, явление обострения уменьшается благодаря свойствам коллектора. Созданное отображение дает большую гибкость в процессе оценки. Даже можно оценить стоимость во втором слое и вычислить состояние . [4]

Ограничивающие наблюдатели

[ редактировать ]

Ограничивающий [16] или интервальные наблюдатели [17] [18] составляют класс наблюдателей, которые дают две оценкигосударства одновременно: одна из оценок дает верхнюю границу реальной стоимости государства,тогда как второй обеспечивает нижнюю границу. Тогда известно, что реальная стоимость государства всегда находится в пределах этих двух оценок.

Эти границы очень важны для практических приложений. [19] [20] поскольку они позволяют в любой момент времени узнать точность оценки.

Математически можно использовать два наблюдателя Люенбергера, если правильно подбирается, используя, например, положительные свойства системы : [21] один для верхней границы (что гарантирует, что сходится к нулю сверху, когда , при отсутствии шума и неопределенности ), а нижняя граница (что гарантирует, что сходится к нулю снизу). То есть всегда

См. также

[ редактировать ]
Встроенные ссылки
  1. ^ Халил, Гонконг (2002), Нелинейные системы (3-е изд.), Аппер-Седл-Ривер, Нью-Джерси: Прентис-Холл , ISBN  978-0-13-067389-3
  2. ^ Jump up to: а б Уткин, Вадим; Гульднер, Юрген; Ши, Цзинсинь (1999), Управление скользящим режимом в электромеханических системах , Филадельфия, Пенсильвания: Taylor & Francisco, Inc., ISBN  978-0-7484-0116-1
  3. ^ Jump up to: а б Дракунов, С. В. (1983), "Адаптивный квазиоптимальный фильтр с разрывными параметрами", Автоматика и телемеханика , 44 (9): 1167–1175.
  4. ^ Jump up to: а б с Бернат, Дж.; Степьен, С. (2015), «Мульти-моделирование как новая схема оценки для наблюдателей с высоким коэффициентом усиления», International Journal of Control , 88 (6): 1209–1222, Bibcode : 2015IJC....88.1209B , doi : 10.1080/00207179.2014 .1000380 , S2CID   8599596
  5. ^ Кренер, Эй Джей; Исидори, Альберто (1983), «Линеаризация путем ввода выходного сигнала и нелинейных наблюдателей», System and Control Letters , 3 : 47–52, doi : 10.1016/0167-6911(83)90037-3
  6. ^ Кренер, Эй Джей; Респондек, В. (1985), «Нелинейные наблюдатели с линеаризуемой динамикой ошибок», SIAM Journal on Control and Optimization , 23 (2): 197–216, doi : 10.1137/0323016
  7. ^ Готье, JP; Хаммори, Х.; Отман, С. (1992), «Простой наблюдатель для приложений нелинейных систем в биореакторах», IEEE Transactions on Auto Control , 37 (6): 875–880, doi : 10.1109/9.256352
  8. ^ Хаммури, Х.; Киннарт, М. (1996), «Новая процедура изменяющейся во времени линеаризации вплоть до ввода вывода», System and Control Letters , 28 (3): 151–157, doi : 10.1016/0167-6911(96)00022-9
  9. ^ Чиккарелла, Г.; Далла Мора, М.; Джермани, А. (1993), «Наблюдатель для нелинейных систем, подобный Люенбергеру», International Journal of Control , 57 (3): 537–556, doi : 10.1080/00207179308934406
  10. ^ Го, Бао-Чжу; Чжао, Чжи-Лян (январь 2011 г.). «Расширенный наблюдатель состояния нелинейных систем с неопределенностью» . Тома трудов МФБ . 44 (1). Международная федерация автоматического управления : 1855–1860 гг. дои : 10.3182/20110828-6-IT-1002.00399 . Проверено 8 августа 2023 г.
  11. ^ «Wayback Machine не заархивировала этот URL» . Проверено 8 августа 2023 г. [ мертвая ссылка ]
  12. ^ Кумар, Сунил; Кумар Пал, Анил; Камаль, Шьям; Сюн, Сяоган (19 мая 2023 г.). «Проектирование переключаемого наблюдателя с высоким коэффициентом усиления для нелинейных систем» . Международный журнал системных наук . 54 (7). Научно-издательская группа : 1471–1483. Бибкод : 2023IJSS...54.1471K . дои : 10.1080/00207721.2023.2178863 . S2CID   257145897 . Проверено 8 августа 2023 г.
  13. ^ «Регистрация» . IEEE Эксплор . Проверено 8 августа 2023 г.
  14. ^ Дракунов, С.В. (1992). «Скользящие наблюдатели на основе эквивалентного метода управления» . [1992] Материалы 31-й конференции IEEE по принятию решений и управлению . стр. 2368–2370 . дои : 10.1109/CDC.1992.371368 . ISBN  978-0-7803-0872-5 . S2CID   120072463 .
  15. ^ Нарендра, Канзас; Хан, З. (август 2012 г.). «Новый подход к адаптивному управлению с использованием нескольких моделей». Международный журнал адаптивного управления и обработки сигналов . 26 (8): 778–799. дои : 10.1002/acs.2269 . ISSN   1099-1115 . S2CID   60482210 .
  16. ^ Комбастель, К. (2003). «Наблюдатель за границей штата на основе зонотопов» (PDF) . Европейская конференция по контролю (ECC), 2003 г. стр. 2589–2594. дои : 10.23919/ECC.2003.7085991 . ISBN  978-3-9524173-7-9 . S2CID   13790057 .
  17. ^ Рами, М. Айт; Ченг, Швейцария; Де Прада, К. (2008). «Наблюдатели с жесткими интервалами: подход LP» (PDF) . 2008 г. 47-я конференция IEEE по принятию решений и управлению . стр. 2967–2972. дои : 10.1109/CDC.2008.4739280 . ISBN  978-1-4244-3123-6 . S2CID   288928 .
  18. ^ Ефимов Д.; Раисси, Т. (2016). «Проектирование интервальных наблюдателей для неопределенных динамических систем» . Автоматизация и дистанционное управление . 77 (2): 191–225. дои : 10.1134/S0005117916020016 . hdl : 20.500.12210/25069 . S2CID   49322177 .
  19. ^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf [ пустой URL PDF ]
  20. ^ Хадж-Садок, МЗ; Гузе, JL (2001). «Оценка неопределенных моделей процессов в активном иле с помощью интервальных наблюдателей». Журнал управления процессами . 11 (3): 299–310. дои : 10.1016/S0959-1524(99)00074-8 .
  21. ^ Рами, Мустафа Айт; Тадео, Фернандо; Хельмке, Уве (2011). «Позитивные наблюдатели линейных положительных систем и их последствия». Международный журнал контроля . 84 (4): 716–725. Бибкод : 2011IJC....84..716A . дои : 10.1080/00207179.2011.573000 . S2CID   21211012 .
Общие ссылки
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f3b059cc8645dca730b5be4510d78ae0__1722391440
URL1:https://arc.ask3.ru/arc/aa/f3/e0/f3b059cc8645dca730b5be4510d78ae0.html
Заголовок, (Title) документа по адресу, URL1:
State observer - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)