Оптимизация траектории
Оптимизация траектории — это процесс разработки траектории , которая минимизирует (или максимизирует) некоторую меру производительности, одновременно удовлетворяя ряду ограничений. Вообще говоря, оптимизация траектории — это метод вычисления разомкнутого решения задачи оптимального управления . Он часто используется для систем, где вычисление полного решения с обратной связью не требуется, непрактично или невозможно. Если задачу оптимизации траектории можно решить со скоростью, заданной обратной константой Липшица , то ее можно использовать итеративно для генерации решения с обратной связью в смысле Каратеодори . Если для задачи с бесконечным горизонтом выполняется только первый шаг траектории, то это известно как управление с прогнозированием модели (MPC) .
Хотя идея оптимизации траектории существует уже сотни лет ( вариационное исчисление , задача брахистохроны ), она стала практичной для решения реальных задач только с появлением компьютера. Многие из первоначальных применений оптимизации траектории были в аэрокосмической промышленности, где вычислялись траектории запуска ракет и ракет. В последнее время оптимизация траектории также стала использоваться в самых разных промышленных процессах и приложениях робототехники. [1]
История
[ редактировать ]Оптимизация траектории впервые появилась в 1697 году, когда была поставлена задача о брахистохроне: найти такую форму проволоки, при которой скользящая по ней бусинка переместится между двумя точками за минимальное время. [2] Самое интересное в этой задаче то, что она оптимизируется по кривой (форме провода), а не по одному числу. Самое известное из решений было вычислено с помощью вариационного исчисления .
В 1950-х годах цифровой компьютер начал использовать оптимизацию траектории для решения реальных задач. Первые подходы к оптимальному управлению выросли из вариационного исчисления , основанного на исследованиях Гилберта Эймса Блисса и Брайсона. [3] в Америке и Понтрягин [4] в России. принцип максимума Понтрягина Особо следует отметить . Эти первые исследователи заложили основу того, что мы сейчас называем косвенными методами оптимизации траектории.
Большая часть ранних работ по оптимизации траектории была сосредоточена на расчете профилей тяги ракет как в вакууме, так и в атмосфере. Это раннее исследование выявило множество основных принципов, которые используются до сих пор. Еще одним успешным применением был набор высоты по траекториям первых реактивных самолетов. Из-за высокого сопротивления, связанного с околозвуковой областью сопротивления, и низкой тяги ранних реактивных самолетов, оптимизация траектории была ключом к максимизации набора высоты. Некоторые мировые рекорды были установлены на основе оптимального управления траекториями. В этих ситуациях пилот следовал графику зависимости числа оборотов от высоты, основанному на оптимальных решениях управления.
Одной из важных ранних проблем оптимизации траекторий была проблема особой дуги , где принцип максимума Понтрягина не может дать полного решения. Примером проблемы с единичным управлением является оптимизация тяги ракеты, летящей на постоянной высоте и запускаемой с малой скоростью. Здесь проблема заключается в последовательном управлении с максимально возможной тягой до тех пор, пока не будет достигнута сингулярная дуга. Тогда решение сингулярного управления обеспечивает пониженную переменную тягу вплоть до выгорания. В этот момент импульсное управление обеспечивает то, что управление или тяга достигают минимального нулевого значения. Это решение лежит в основе конструкции ракетного двигателя с наддувом и маршевым двигателем, широко используемого сегодня для максимизации характеристик ракеты.
Приложения
[ редактировать ]Существует множество приложений для оптимизации траектории, в первую очередь в робототехнике: промышленность, манипулирование, ходьба, планирование пути и аэрокосмическая промышленность. Его также можно использовать для моделирования и оценки.
Роботы-манипуляторы
[ редактировать ]В зависимости от конфигурации роботы-манипуляторы с открытой цепью требуют определенной оптимизации траектории. Например, роботизированная рука с 7 шарнирами и 7 звеньями (7-DOF) представляет собой резервированную систему, в которой одно декартово положение рабочего органа может соответствовать бесконечному числу положений угла шарнира, таким образом, эта избыточность может быть использована для оптимизации траекторию, чтобы, например, избежать каких-либо препятствий в рабочем пространстве или минимизировать крутящий момент в суставах. [5]
Квадрокоптерные вертолеты
[ редактировать ]Оптимизация траектории часто используется для расчета траекторий квадрокоптерных вертолетов . В этих приложениях обычно использовались узкоспециализированные алгоритмы. [6] [7] Одно интересное применение, продемонстрированное лабораторией GRASP Университета Пенсильвании, — это вычисление траектории, которая позволяет квадрокоптеру пролетать через кольцо при его броске. Другой, на этот раз на ETH Zurich Flying Machine Arena , включает в себя два квадрокоптера, которые перебрасывают между собой шест, балансируя, как перевернутый маятник. Недавно также изучалась проблема расчета траекторий с минимальной энергией для квадрокоптера. [8]
Производство
[ редактировать ]Оптимизация траектории используется в производстве, особенно для управления химическими процессами. [9] или вычисление желаемого пути для роботов-манипуляторов. [10]
Шагающие роботы
[ редактировать ]В области шагающей робототехники существует множество различных приложений для оптимизации траектории. Например, в одной статье оптимизация траектории двуногой походки использовалась на простой модели, чтобы показать, что ходьба энергетически выгодна для движения с низкой скоростью, а бег энергетически выгоден для движения с высокой скоростью. [11] Как и во многих других приложениях, оптимизация траектории может использоваться для расчета номинальной траектории, вокруг которой строится стабилизирующий контроллер. [12] Оптимизация траектории может применяться при детальном планировании движения сложных гуманоидных роботов, таких как Atlas . [13] Наконец, оптимизацию траектории можно использовать для планирования пути роботов со сложными динамическими ограничениями с использованием моделей пониженной сложности. [14]
Аэрокосмическая промышленность
[ редактировать ]Для тактических ракет профили полета определяются историей тяги и подъемной силы . Этими историями можно управлять с помощью ряда средств, включая такие методы, как использование истории команд угла атаки или графика высоты / дальности падения, которому должна следовать ракета. Каждая комбинация факторов конструкции ракеты, желаемых характеристик ракеты и ограничений системы приводит к новому набору оптимальных параметров управления. [15]
Терминология
[ редактировать ]- Переменные решения
- Множество неизвестных, которые необходимо найти с помощью оптимизации.
- Задача оптимизации траектории
- Особый тип задачи оптимизации, в которой переменными решения являются функции, а не действительные числа.
- Оптимизация параметров
- Любая задача оптимизации, в которой переменными решения являются действительные числа.
- Нелинейная программа
- Класс оптимизации параметров с ограничениями, в котором либо целевая функция, либо ограничения являются нелинейными.
- Косвенный метод
- Косвенный метод решения задачи оптимизации траектории состоит из трех этапов: 1) аналитически построить необходимые и достаточные условия оптимальности, 2) дискретизировать эти условия, построив задачу оптимизации параметров с ограничениями, 3) решить эту задачу оптимизации. [16]
- Прямой метод
- Прямой метод решения задачи оптимизации траектории состоит из двух этапов: 1) непосредственная дискретизация задачи оптимизации траектории, преобразование ее в задачу оптимизации параметров с ограничениями, 2) решение этой задачи оптимизации. [16]
- Транскрипция
- Процесс, посредством которого задача оптимизации траектории преобразуется в задачу оптимизации параметров. Иногда это называют дискретизацией. Методы транскрипции обычно делятся на две категории: методы съемки и методы словосочетания.
- Метод съемки
- Метод транскрипции, основанный на моделировании, обычно с использованием явных схем Рунге--Кутты.
- Метод коллокации (одновременный метод)
- Метод транскрипции, основанный на аппроксимации функций, обычно с использованием неявных схем Рунге--Кутты.
- Псевдоспектральный метод (Global Collocation)
- Метод транскрипции, который представляет всю траекторию в виде одного ортогонального многочлена высокого порядка.
- Сетка (Сетка)
- После транскрипции ранее непрерывная траектория теперь представлена дискретным набором точек, известных как точки сетки или точки сетки.
- Уточнение сетки
- Процесс, посредством которого сетка дискретизации улучшается путем решения последовательности задач оптимизации траектории. Уточнение сетки выполняется либо путем разделения сегмента траектории, либо путем увеличения порядка полинома, представляющего этот сегмент. [17]
- Задача оптимизации многофазной траектории
- Оптимизации траектории системы с гибридной динамикой можно добиться, представив ее как задачу оптимизации многофазной траектории. Это делается путем составления последовательности стандартных задач оптимизации траектории, связанных между собой ограничениями. [18]
Методы оптимизации траектории
[ редактировать ]Методы решения любых задач оптимизации можно разделить на две категории: косвенные и прямые. Косвенный метод работает путем аналитического построения необходимых и достаточных условий оптимальности, которые затем решаются численно. Прямой метод пытается найти прямое численное решение путем построения последовательности постоянно улучшающихся приближений к оптимальному решению. [16]
Задача оптимального управления представляет собой бесконечномерную задачу оптимизации, поскольку переменные решения являются функциями, а не действительными числами. Все методы решения выполняют транскрипцию - процесс, с помощью которого задача оптимизации траектории (оптимизация по функциям) преобразуется в задачу оптимизации параметров с ограничениями (оптимизация по действительным числам). Как правило, эта задача оптимизации параметров с ограничениями представляет собой нелинейную программу, хотя в особых случаях ее можно свести к квадратичной программе или линейной программе .
Одиночная съемка
[ редактировать ]Одиночная стрельба — это самый простой метод оптимизации траектории. Основная идея аналогична тому, как вы нацеливаетесь из пушки: выберите набор параметров траектории, смоделируйте все это, а затем проверьте, попали ли вы в цель. Вся траектория представлена как один сегмент с одним ограничением, известным как ограничение дефекта, требующее, чтобы конечное состояние моделирования соответствовало желаемому конечному состоянию системы. Одиночная съемка эффективна для задач, которые либо просты, либо имеют очень хорошую инициализацию. В противном случае как косвенная, так и прямая формулировка обычно сталкиваются с трудностями. [16] [19] [20]
Многократная съемка
[ редактировать ]Многократная стрельба — это простое расширение одиночной стрельбы, которое делает ее гораздо более эффективной. Вместо того, чтобы представлять всю траекторию как одну симуляцию (сегмент), алгоритм разбивает траекторию на множество более коротких сегментов, и между каждым из них добавляется ограничение дефекта. В результате получается большая разреженная нелинейная программа, которую, как правило, легче решить, чем небольшие плотные программы, созданные путем одиночной съемки. [19] [20]
Прямое сочетание
[ редактировать ]Методы прямого коллокации работают путем аппроксимации траекторий состояния и управления с помощью полиномиальных сплайнов . Эти методы иногда называют прямой транскрипцией. Трапециевидное словосочетание - это широко используемый метод прямого словосочетания низкого порядка. Динамика, цель пути и управление представлены с помощью линейных сплайнов, а динамика удовлетворяется с помощью трапециевидной квадратуры . Коллокация Эрмита-Симпсона — это распространенный метод прямой коллокации среднего порядка. Состояние представлено кубически-эрмитовым сплайном , а динамика удовлетворяется с использованием квадратуры Симпсона . [16] [20]
Ортогональное сочетание
[ редактировать ]Ортогональное сочетание технически является подмножеством прямого сочетания, но детали реализации настолько различны, что его можно разумно рассматривать как отдельный набор методов. Ортогональная коллокация отличается от прямой коллокации тем, что в ней обычно используются сплайны высокого порядка, и каждый сегмент траектории может быть представлен сплайном разного порядка. Название происходит от использования ортогональных полиномов в сплайнах состояния и управления. [20] [21]
Псевдоспектральная дискретизация
[ редактировать ]При псевдоспектральной дискретизации вся траектория представляется набором базисных функций во временной области (независимая переменная). Базисные функции не обязательно должны быть полиномами. Псевдоспектральная дискретизация также известна как спектральная коллокация. [22] [23] [24] При использовании псевдоспектрального метода для решения задачи оптимизации траектории, решение которой является гладким, достигается спектральная (экспоненциальная) сходимость. [25] Если траектория не является гладкой, сходимость все равно будет очень быстрой, быстрее, чем у методов Рунге-Кутты. [26] [27]
Временные конечные элементы
[ редактировать ]В 1990 году Дьюи Х. Ходжес и Роберт Р. Блесс. [28] предложил слабый гамильтонов метод конечных элементов для задач оптимального управления. Идея заключалась в том, чтобы вывести слабую вариационную форму необходимых условий оптимальности первого порядка, дискретизировать временную область на конечных интервалах и использовать простое полиномиальное представление нулевого порядка состояний, управления и сопряженных элементов на каждом интервале.
Дифференциальное динамическое программирование
[ редактировать ]Дифференциальное динамическое программирование немного отличается от других методов, описанных здесь. В частности, он не разделяет четко транскрипцию и оптимизацию. Вместо этого он выполняет последовательность итеративных проходов вперед и назад по траектории. Каждый прямой проход удовлетворяет динамике системы, а каждый обратный проход удовлетворяет условиям оптимальности управления. В конце концов, эта итерация сходится к траектории, которая является одновременно осуществимой и оптимальной. [29]
Сравнение техник
[ редактировать ]Существует множество методов, из которых можно выбирать при решении задачи оптимизации траектории. Не существует лучшего метода, но некоторые методы могут лучше справляться с конкретными проблемами. В этом разделе представлено приблизительное понимание компромиссов между методами.
Косвенные и прямые методы
[ редактировать ]При решении задачи оптимизации траектории косвенным методом необходимо явно строить сопряженные уравнения и их градиенты. Зачастую это сложно сделать, но это дает отличный показатель точности решения. Прямые методы гораздо проще настроить и решить, но они не имеют встроенной метрики точности. [16] В результате более широкое распространение получили прямые методы, особенно в некритических приложениях. Косвенные методы по-прежнему имеют место в специализированных приложениях, особенно в аэрокосмической отрасли, где точность имеет решающее значение.
Одна из областей, где косвенные методы сталкиваются с особыми трудностями, — это проблемы с ограничениями неравенства путей. Эти проблемы, как правило, имеют решения, для которых ограничение частично активно. При построении сопряженных уравнений для косвенного метода пользователь должен явно записать, когда ограничение активно в решении, что априори узнать сложно. Одним из решений является использование прямого метода для вычисления первоначального предположения, которое затем используется для построения многофазной задачи, в которой задано ограничение. Полученную задачу затем можно точно решить косвенным методом. [16]
Стрельба против коллокации
[ редактировать ]Методы одиночной стрельбы лучше всего использовать для задач, где управление очень простое (или есть очень хорошая начальная догадка). Например, проблема планирования миссии спутника, где единственным контролем является величина и направление начального импульса двигателей. [19]
Многократная стрельба хорошо подходит для задач с относительно простым управлением, но сложной динамикой. Хотя ограничения пути можно использовать, они делают результирующую нелинейную программу относительно сложной для решения.
Методы прямой коллокации хороши для задач, в которых точность управления и состояния аналогичны. Эти методы, как правило, менее точны, чем другие (из-за их низкого порядка), но особенно надежны для задач со сложными ограничениями пути.
Методы ортогональной коллокации лучше всего подходят для получения высокоточных решений задач, где важна точность траектории управления. В некоторых реализациях возникают проблемы с ограничениями путей. Эти методы особенно хороши, когда решение гладкое.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Цигун; Вэй Кан; Бедроссян, Н.С.; Фару, Ф.; Пуя Сехават; Боллино, К. (декабрь 2007 г.). «Псевдоспектральное оптимальное управление для военных и промышленных приложений» . 2007 г. 46-я конференция IEEE по принятию решений и управлению . стр. 4128–4142. дои : 10.1109/CDC.2007.4435052 . ISBN 978-1-4244-1497-0 . S2CID 2935682 .
- ^ 300 лет оптимального управления: от брахистохроны к принципу максимума , Гектор Дж. Суссманн и Ян К. Виллемс. Журнал IEEE Control Systems, 1997.
- ^ Брайсон, Хо, Прикладное оптимальное управление, издательство Blaisdell Publishing Company, 1969, стр. 246.
- ^ Л. С. Понтырагин, Математическая теория оптимальных процессов, Нью-Йорк, Intersciences, 1962.
- ^ Малик, Арыслан; Хендерсон, Трой; Праженица, Ричард (январь 2021 г.). «Генерация траектории многотельной робототехнической системы с использованием продукта формулировки экспонент» . Форум AIAA Scitech 2021 : 2016. doi : 10.2514/6.2021-2016 . ISBN 978-1-62410-609-5 . S2CID 234251587 .
- ^ Дэниел Меллингер и Виджей Кумар, «Создание минимальной мгновенной траектории и управление ею для квадрокоптеров», Международная конференция по робототехнике и автоматизации, IEEE 2011.
- ^ Маркус Хен и Рафаэлло Д'Андреа, «Генерация траектории квадрокоптеров в реальном времени», Транзакции IEEE по робототехнике, 2015.
- ^ Фабио Морбиди, Роэл Кано, Дэвид Лара, «Создание траектории с минимальной энергией для квадрокоптера» в Proc. Международная конференция IEEE по робототехнике и автоматизации, стр. 1492–1498, 2016 г.
- ^ Джон В. Итон и Джеймс Б. Роулингс. «Модельно-прогностическое управление химическими процессами» Химическая инженерия, Том 47, № 4. 1992.
- ^ Т. Четтиби, Х. Лехтихет, М. Хаддад, С. Ханчи, «Планирование траектории с минимальной стоимостью для промышленных роботов», Европейский журнал механики, 2004.
- ^ Манодж Шринивасан и Энди Руина. «Компьютерная оптимизация минимальной двуногой модели обнаруживает ходьбу и бег», Nature, 2006.
- ^ Э. Р. Вестервельт, Дж. В. Гризл и Д. Е. Кодичек. «Гибридная нулевая динамика плоских двуногих ходунков» Транзакции IEEE по автоматическому управлению, 2003.
- ^ Майкл Поса, Скотт Куиндерсма и Расс Тедрейк. «Оптимизация и стабилизация траекторий динамических систем со связями». Международная конференция по робототехнике и автоматизации IEEE 2016.
- ^ Хонгкай Дай, Андрес Валенсуэла и Расс Тедрейк. Международная конференция по роботам-гуманоидам «Планирование движений всего тела с помощью центроидальной динамики и полной кинематики», IEEE 2014.
- ^ Филлипс, Калифорния, «Управление энергией для многоимпульсной ракеты», документ AIAA 88-0334, январь 1988 г.
- ^ Перейти обратно: а б с д и ж г Джон Т. Беттс «Практические методы оптимального управления и оценки с использованием нелинейного программирования» SIAM Advance in Design and Control, 2010.
- ^ Кристофер Л. Дарби, Уильям В. Хагер и Анил В. Рао. «Hp-адаптивный псевдоспектральный метод решения задач оптимального управления». Приложения и методы оптимального управления, 2010.
- ^ Паттерсон, Майкл А.; Рао, Анил В. (01 октября 2014 г.). «GPOPS-II: программное обеспечение MATLAB для решения многофазных задач оптимального управления с использованием hp-адаптивных методов гауссовой квадратурной коллокации и разреженного нелинейного программирования» . АКМ Транс. Математика. Программное обеспечение . 41 (1): 1:1–1:37. дои : 10.1145/2558904 . ISSN 0098-3500 .
- ^ Перейти обратно: а б с Обзор численных методов оптимизации траекторий; Джон Т. Беттс Журнал руководства, контроля и динамики, 1998 г.; 0731-5090 том 21 №2 (193-207)
- ^ Перейти обратно: а б с д Анил В. Рао «Обзор численных методов оптимального управления» Достижения в области астронавтики, 2009.
- ^ Камила С. Франколин, Дэвид А. Бенсон, Уильям В. Хагер, Анил В. Рао. «Оценка стоимости в оптимальном управлении с использованием интегральных квадратурных методов ортогональной коллокации» Приложения и методы оптимального управления, 2014.
- ^ Р., Малик, Муджиб (1984). Метод спектральной коллокации для уравнений Навье-Стокса . Национальное управление по аэронавтике и исследованию космического пространства, Исследовательский центр Лэнгли. OCLC 11642811 .
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ «Спектральные методы и псевдоспектральные методы» , «Спектральные методы и их приложения» , WORLD SCIENTIFIC, стр. 100–187, май 1998 г., doi : 10.1142/9789812816641_0004 , ISBN 978-981-02-3333-4 , получено 23 апреля 2021 г.
- ^ Гун, Ци. Спектральное и псевдоспектральное оптимальное управление на произвольных сетках . OCLC 1185648645 .
- ^ Ллойд Н. Трефетен. «Теория приближений и практика приближений», SIAM 2013.
- ^ Канг, Вэй (ноябрь 2010 г.). «Скорость сходимости лежандровского псевдоспектрального оптимального управления линеаризуемыми системами с обратной связью» . Журнал теории управления и приложений . 8 (4): 391–405. дои : 10.1007/s11768-010-9104-0 . ISSN 1672-6340 . S2CID 122945121 .
- ^ Трефетен, Ллойд Н. (Ллойд Николас) (январь 2019 г.). Теория приближений и практика аппроксимации . ISBN 978-1-61197-594-9 . OCLC 1119061092 .
- ^ Д.Х. Ходжес и Р.Р. Блесс, «Слабый гамильтонов метод конечных элементов для задач оптимального управления», Журнал руководства, управления и динамики, 1990. https://arc.aiaa.org/doi/10.2514/3.20616
- ^ Дэвид Х. Джейкобсон, Дэвид К. Мейн. «Дифференциальное динамическое программирование», Elsevier, 1970.