Technique in nonlinear control theory
В теории управления возврат назад — это метод, разработанный примерно в 1990 году Мирославом Спаравало, Петром В. Кокотовичем и другими. [1] [2] [3] за разработку стабилизирующих управлений для специального класса нелинейных динамических систем . Эти системы состоят из подсистем, исходящих из неприводимой подсистемы, которую можно стабилизировать каким-либо другим методом. Благодаря такой рекурсивной структуре разработчик может начать процесс проектирования с известной стабильной системы и «откатить» новые контроллеры, которые постепенно стабилизируют каждую внешнюю подсистему. Процесс завершается при достижении окончательного внешнего управления. Следовательно, этот процесс известен как шаг назад. [4]
Отступающий подход [ править ]
Подход обратного шага обеспечивает рекурсивный метод стабилизации происхождения системы в форме строгой обратной связи . То есть рассмотрим систему вида [4]

где
с
,
являются скалярами , - u — скалярный вход в систему,
исчезают в начале координат (т.е.
),
отличны от нуля в интересующей области (т. е.
для
).
Предположим также, что подсистема

стабилизируется начале в координат (т.е.
) некоторым известным управлением
такой, что
. Предполагается также, что функция Ляпунова
для этой устойчивой подсистемы известна. То есть эта подсистема x стабилизируется каким-то другим методом, и обратный шаг расширяет ее устойчивость до
оболочка вокруг него.
В системах такой формы строгой обратной связи вокруг стабильной x подсистемы
- Управляющий вход u, разработанный с использованием обратного шага, оказывает самое непосредственное стабилизирующее воздействие на состояние.
. - Государство
затем действует как стабилизирующий контроль над государством
перед этим. - Этот процесс продолжается так, что каждое состояние
стабилизируется фиктивным «контролем»
.
Подход обратного шага определяет, как стабилизировать подсистему x, используя
, а затем переходит к определению того, как сделать следующее состояние
водить машину
к управлению, необходимому для стабилизации x . Следовательно, процесс «отходит назад» от x из системы форм строгой обратной связи до тех пор, пока не будет разработано окончательное управление u .
Обзор конструкции рекурсивного управления [ править ]
- Учитывая, что меньшая (т. е. низшего порядка) подсистема

- уже стабилизировано в исходном положении некоторым контролем
где
. То есть выбор
стабилизация этой системы должна происходить с помощью какого-то другого метода. Предполагается также, что функция Ляпунова
для этой устойчивой подсистемы известна. Обратный шаг обеспечивает способ расширить контролируемую стабильность этой подсистемы на более крупную систему.
- контроль
устроена так, что система 
- стабилизируется так, что
следует желаемому
контроль. Схема управления основана на кандидате расширенной функции Ляпунова. 
- Контроль
можно выбрать для привязки
далеко от нуля.
- контроль
устроена так, что система 
- стабилизируется так, что
следует желаемому
контроль. Схема управления основана на кандидате расширенной функции Ляпунова. 
- Контроль
можно выбрать для привязки
далеко от нуля.
- Этот процесс продолжается до тех пор, пока не станет известно фактическое значение u , и
- Реальный контроль стабилизируется
к фиктивному контролю
. - Фиктивный контроль
стабилизирует
к фиктивному контролю
. - Фиктивный контроль
стабилизирует
к фиктивному контролю
. - ...
- Фиктивный контроль
стабилизирует
к фиктивному контролю
. - Фиктивный контроль
стабилизирует
к фиктивному контролю
. - Фиктивный контроль
стабилизирует x в начале координат.
Этот процесс известен как возврат назад, поскольку он начинается с требований к стабильности некоторой внутренней подсистемы и постепенно выходит из системы, поддерживая стабильность на каждом этапе. Потому что
исчезнуть в начале координат для
,
ненулевые для
, - данный контроль
имеет
,
то полученная система имеет равновесие в начале координат (т. е. там, где
,
,
, ...,
, и
), которая глобально асимптотически устойчива .
Отступление интегратора [ править ]
Прежде чем описывать процедуру обратного шага для общих со строгой обратной связью динамических систем , удобно обсудить подход для меньшего класса систем со строгой обратной связью. Эти системы подключают ряд интеграторов ко входусистема с известным законом управления, стабилизирующим обратную связь, поэтому стабилизирующий подход известен как интеграторный обратный шаг. С небольшой модификацией подход обратного шага интегратора может быть расширен для обработки всех систем со строгой обратной связью.
одним Равновесие с интегратором
Рассмотрим динамическую систему
 | | ( 1 ) |
где
и
является скаляром. Эта система представляет собой каскадное соединение интегратора поступает в с подсистемой x (т.е. вход u интегратор, а интеграл
входит в подсистему x ).
Мы предполагаем, что
, и поэтому, если
,
и
, затем

Итак, происхождение
является равновесием (т. е. стационарной точкой ) системы. Если система когда-либо достигнет начала координат, она останется там навсегда.
Обратный шаг с одним интегратором [ править ]
В этом примере обратный шаг используется для стабилизации системы с одним интегратором в уравнении ( 1 ) вокруг ее равновесия в начале координат. Если быть менее точным, мы хотим разработать закон управления.
это гарантирует, что государства
вернуться в
после запуска системы из некоторого произвольного начального состояния.
- Во-первых, по предположению, подсистема

- с
имеет функцию Ляпунова
такой, что

- где
является положительно определенной функцией . То есть мы предполагаем , что уже показали , что эта существующая более простая x подсистема устойчива (в смысле Ляпунова) . Грубо говоря, понятие стабильности означает, что:
- Функция
подобен «обобщенной энергии» подсистемы x . По мере удаления состояний x системы от начала координат энергия
тоже растет. - Показав, что с течением времени энергия
распадается до нуля, то состояния x должны распадаться в сторону
. То есть происхождение
будет устойчивое равновесие системы – состояния x будут непрерывно приближаться к началу координат с увеличением времени. - Сказав это
положительно определен, означает, что
везде, кроме
, и
. - Заявление о том, что
означает, что
отделено от нуля для всех точек, кроме тех, где
. То есть, пока система не находится в равновесии в начале координат, ее «энергия» будет уменьшаться. - Поскольку энергия всегда затухает, система должна быть стабильной; его траектории должны приближаться к началу координат.
- Наша задача — найти элемент управления u , который заставит наше каскадное
система также стабильна. Поэтому мы должны найти нового на функцию Ляпунова кандидата для этой новой системы. Этот кандидат будет зависеть от управления u , и, правильно выбрав управление, мы можем гарантировать, что оно также затухает повсюду.
- Далее, прибавляя и вычитая
(т. е. мы никоим образом не меняем систему, поскольку не оказываем никакого суммарного эффекта)
часть более крупного
система, она становится

- которые мы можем перегруппировать, чтобы получить

- Таким образом, наша каскадная суперсистема инкапсулирует известную стабильную систему.
подсистемы плюс некоторое возмущение ошибки, генерируемое интегратором.
- Теперь мы можем изменять переменные из
к
позволяя
. Так

- Кроме того, мы позволяем
так что
и

- Мы стремимся стабилизировать эту систему ошибок с помощью обратной связи через новый элемент управления.
. Стабилизируя систему на
, государство
будет отслеживать желаемый контроль
что приведет к стабилизации внутренней подсистемы x .
- Из нашей существующей функции Ляпунова
, определим расширенной функции Ляпунова кандидата

- Так

- Распространяя
, мы видим это

- Чтобы гарантировать, что
(т.е. для обеспечения устойчивости надсистемы) выбираем закон управления

- с
, и так

- После распространения
через,

- Итак, функция нашего кандидата Ляпунова
— истинная функция Ляпунова , и наша система устойчива при этом законе управления
(что соответствует закону управления
потому что
). Используя переменные исходной системы координат, эквивалентную функцию Ляпунова
 | | ( 2 ) |
- Как обсуждается ниже, эта функция Ляпунова будет использоваться снова, когда эта процедура будет итеративно применяться к задаче с несколькими интеграторами.
- Наш выбор управления
в конечном итоге зависит от всех наших исходных переменных состояния. В частности, реальный закон управления, стабилизирующий обратную связь
 | | ( 3 ) |
- Состояния x и
и функции
и
исходят из системы. Функция
происходит из нашей известной стабильной
подсистема. Параметр усиления
влияет на скорость сходимости нашей системы. Согласно этому закону управления, наша система устойчива в начале координат.
.
- Напомним, что
в уравнении ( 3 ) управляет входом интегратора, который подключен к подсистеме, стабилизированной по обратной связи законом управления.
. Неудивительно, что контроль
имеет
член, который будет интегрирован, чтобы следовать закону стабилизирующего управления
плюс некоторая компенсация. Другие члены обеспечивают демпфирование для устранения этого смещения и любых других эффектов возмущения, которые могут быть увеличены интегратором.
Поскольку эта система стабилизирована обратной связью
и имеет функцию Ляпунова
с
, ее можно использовать в качестве верхней подсистемы в другой одноинтеграторной каскадной системе.
двумя интеграторами шаг с : обратный Мотивирующий пример
Прежде чем обсуждать рекурсивную процедуру для общего случая с несколькими интеграторами, полезно изучить рекурсию, присутствующую в случае с двумя интеграторами. То есть рассмотрим динамическую систему
 | | ( 4 ) |
где
и
и
являются скалярами. Эта система представляет собой каскадное соединение системы с одним интегратором в уравнении ( 1 ) с другим интегратором (т. е. входным
поступает через интегратор, а выход этого интегратора входит в систему в уравнении ( 1 ) через его
вход).
Позволяя
,
, 
тогда система с двумя интеграторами в уравнении ( 4 ) становится системой с одним интегратором
 | | ( 5 ) |
По одноинтеграторной процедуре закон управления
стабилизирует верхнюю часть
-to- y подсистема с использованием функции Ляпунова
, и поэтому уравнение ( 5 ) представляет собой новую систему с одним интегратором, которая структурно эквивалентна системе с одним интегратором в уравнении ( 1 ). Таким образом, стабилизирующий контроль
можно найти с помощью той же процедуры с одним интегратором, которая использовалась для нахождения
.
Отступление от многих интеграторов [ править ]
В случае с двумя интеграторами верхняя подсистема с одним интегратором была стабилизирована, в результате чего возникла новая система с одним интегратором, которую можно стабилизировать аналогичным образом. Эту рекурсивную процедуру можно расширить для обработки любого конечного числа интеграторов. Это утверждение можно формально доказать с помощью математической индукции . Здесь стабилизированная система с несколькими интеграторами строится из подсистем уже стабилизированных подсистем с несколькими интеграторами.

- который имеет скалярный вход
и выходные состояния
. Предположим, что
так что нулевой вход (т. е.
) система стационарна в начале координат
. В этом случае начало координат называется равновесием системы. - Закон управления с обратной связью
стабилизирует систему в состоянии равновесия в начале координат. - Функция Ляпунова, соответствующая этой системе, описывается выражением
.
- То есть, если выходные состояния x возвращаются на вход
по закону управления
, то выходные состояния (и функция Ляпунова) возвращаются в начало координат после однократного возмущения (например, после ненулевого начального условия или резкого возмущения). Эта подсистема стабилизируется законом управления с обратной связью.
.
- Далее подключаем интегратор ко входу
так что расширенная система имеет входные данные
(к интегратору) и выходные состояния x . Полученная дополненная динамическая система имеет вид

- Эта «каскадная» система соответствует форме в уравнении ( 1 ), и поэтому процедура обратного шага с одним интегратором приводит к стабилизирующему закону управления в уравнении ( 3 ). То есть, если мы вернём состояния
и x для ввода
по закону управления 
- с выгодой
, то государства
и x вернется в
и
после одного возмущения. Эта подсистема стабилизируется законом управления с обратной связью.
, а соответствующая функция Ляпунова из уравнения ( 2 ) равна 
- То есть по закону управления с обратной связью
, функция Ляпунова
уменьшается до нуля, когда состояния возвращаются в начало координат.
- Подключите новый интегратор к входу
так что расширенная система имеет входные данные
и выходные состояния x . Полученная дополненная динамическая система имеет вид

- что эквивалентно системе с одним интегратором

- Используя эти определения
,
, и
, эту систему можно также выразить как 
- Эта система соответствует структуре с одним интегратором уравнения ( 1 ), и поэтому процедура обратного шага с одним интегратором может быть применена снова. То есть, если мы вернём состояния
,
и x для ввода
по закону управления 
- с выгодой
, то государства
,
, и x вернется в
,
, и
после одного возмущения. Эта подсистема стабилизируется законом управления с обратной связью.
, а соответствующая функция Ляпунова есть 
- То есть по закону управления с обратной связью
, функция Ляпунова
уменьшается до нуля, когда состояния возвращаются в начало координат.
- Подключите интегратор к входу
так что расширенная система имеет входные данные
и выходные состояния x . Полученная дополненная динамическая система имеет вид

- которую можно перегруппировать в единую систему-интегратор

- По определениям
,
, и
из предыдущего шага эта система также представлена 
- Далее, используя эти определения
,
, и
, эту систему можно также выразить как 
- Таким образом, перегруппированная система имеет структуру с одним интегратором уравнения ( 1 ), и поэтому процедура обратного шага с одним интегратором может быть применена снова. То есть, если мы вернём состояния
,
,
и x для ввода
по закону управления 
- с выгодой
, то государства
,
,
, и x вернется в
,
,
, и
после одного возмущения. Эта подсистема стабилизируется законом управления с обратной связью.
, а соответствующая функция Ляпунова есть 
- То есть по закону управления с обратной связью
, функция Ляпунова
уменьшается до нуля, когда состояния возвращаются в начало координат.
- Этот процесс может продолжаться для каждого интегратора, добавленного в систему, и, следовательно, для любой системы вида

- имеет рекурсивную структуру

- и может быть стабилизирован по обратной связи путем нахождения управления, стабилизирующего обратную связь, и функции Ляпунова для одноинтегратора
подсистема (т.е. с входом
и вывести x ) и выполнять итерацию от этой внутренней подсистемы до тех пор, пока не станет известно окончательное управление u , стабилизирующее обратную связь . На итерации i эквивалентной системой является 
- Соответствующий закон управления, стабилизирующий обратную связь, имеет вид

- с выгодой
. Соответствующая функция Ляпунова есть 
- Такая конструкция обеспечивает максимальный контроль
(т. е. окончательный контроль достигается на последней итерации
).
Следовательно, любая система в этой специальной форме строгой обратной связи со многими интеграторами может быть стабилизирована с помощью обратной связи с использованием простой процедуры, которую можно даже автоматизировать (например, как часть алгоритма адаптивного управления ).
Общий возврат назад [ править ]
Системы в специальной форме строгой обратной связи имеют рекурсивную структуру, аналогичную структуре многоинтеграторной системы. Аналогичным образом, они стабилизируются путем стабилизации наименьшей каскадной системы с последующим переходом к следующей каскадной системе и повторением процедуры. Поэтому крайне важно разработать одноэтапную процедуру; эту процедуру можно рекурсивно применить для покрытия многошагового случая. К счастью, из-за требований к функциям в форме строгой обратной связи каждая одношаговая система может быть преобразована посредством обратной связи в систему с одним интегратором, и эту систему с одним интегратором можно стабилизировать с помощью методов, рассмотренных выше.
Одноэтапная процедура [ править ]
Рассмотрим простую строгой обратной связи. систему
 | | ( 6 ) |
где
,
и
являются скалярами , - Для всех х и
,
.
Вместо разработки управления, стабилизирующего обратную связь
непосредственно, ввести новый элемент управления
(будет разработано позже ) и используйте закон управления

что возможно, потому что
. Таким образом, система в уравнении ( 6 ) равна

что упрощается до

Этот новый
-to- x Система соответствует каскадной системе с одним интегратором в уравнении ( 1 ). Полагая, что закон управления, стабилизирующий обратную связь
и функция Ляпунова
для верхней подсистемы известен закон управления, стабилизирующий обратную связь, из уравнения ( 3 ):

с выгодой
. Таким образом, окончательный закон управления, стабилизирующий обратную связь, имеет вид
 | | ( 7 ) |
с выгодой
. Соответствующая функция Ляпунова из уравнения ( 2 ) равна
 | | ( 8 ) |
Поскольку эта система строгой обратной связи имеет управление, стабилизирующее обратную связь, и соответствующую функцию Ляпунова, ее можно каскадировать как часть более крупной системы строгой обратной связи, и эту процедуру можно повторить, чтобы найти окружающее управление, стабилизирующее обратную связь.
Многоэтапная процедура [ править ]
Как и в случае обратного шага со многими интеграторами, одношаговую процедуру можно выполнять итеративно, чтобы стабилизировать всю систему со строгой обратной связью. На каждом этапе
- Самая маленькая «нестабилизированная» одноступенчатая система строгой обратной связи изолирована.
- Обратная связь используется для преобразования системы в систему с одним интегратором.
- Полученная одноинтеграторная система стабилизируется.
- Стабилизированная система используется в качестве верхней системы на следующем этапе.
То есть любая система строгой обратной связи

имеет рекурсивную структуру

и может быть стабилизирован по обратной связи путем нахождения управления, стабилизирующего обратную связь, и функции Ляпунова для одноинтегратора
подсистема (т.е. с входом
и вывести x ) и выполнять итерацию от этой внутренней подсистемы до тех пор, пока не станет известно окончательное управление u , стабилизирующее обратную связь . На итерации i эквивалентной системой является

По уравнению ( 7 ) соответствующий закон управления, стабилизирующий обратную связь, равен

с выгодой
. По уравнению ( 8 ) соответствующая функция Ляпунова равна

Такая конструкция обеспечивает максимальный контроль
(т. е. окончательный контроль достигается на последней итерации
).Следовательно, любую систему со строгой обратной связью можно стабилизировать с помощью простой процедуры, которую можно даже автоматизировать (например, как часть алгоритма адаптивного управления ).