Jump to content

Оптимизация траектории

Оптимизация траектории — это процесс разработки траектории , которая минимизирует (или максимизирует) некоторую меру производительности, одновременно удовлетворяя ряду ограничений. Вообще говоря, оптимизация траектории — это метод вычисления разомкнутого решения задачи оптимального управления . Он часто используется для систем, где вычисление полного решения с обратной связью не требуется, непрактично или невозможно. Если задачу оптимизации траектории можно решить со скоростью, заданной обратной константой Липшица , то ее можно использовать итеративно для генерации решения с обратной связью в смысле Каратеодори . Если для задачи с бесконечным горизонтом выполняется только первый шаг траектории, то это известно как управление с прогнозированием модели (MPC) .

Хотя идея оптимизации траектории существует уже сотни лет ( вариационное исчисление , задача брахистохроны ), она стала практичной для решения реальных задач только с появлением компьютера. Многие из первоначальных применений оптимизации траектории были в аэрокосмической промышленности, где вычислялись траектории запуска ракет и ракет. В последнее время оптимизация траектории также стала использоваться в самых разных промышленных процессах и приложениях робототехники. [1]

Оптимизация траектории впервые появилась в 1697 году, когда была поставлена ​​задача о брахистохроне: найти такую ​​форму проволоки, при которой скользящая по ней бусинка переместится между двумя точками за минимальное время. [2] Самое интересное в этой задаче то, что она оптимизируется по кривой (форме провода), а не по одному числу. Самое известное из решений было вычислено с помощью вариационного исчисления .

В 1950-х годах цифровой компьютер начал использовать оптимизацию траектории для решения реальных задач. Первые подходы к оптимальному управлению выросли из вариационного исчисления , основанного на исследованиях Гилберта Эймса Блисса и Брайсона. [3] в Америке и Понтрягин [4] в России. принцип максимума Понтрягина Особо следует отметить . Эти первые исследователи заложили основу того, что мы сейчас называем косвенными методами оптимизации траектории.

Большая часть ранних работ по оптимизации траектории была сосредоточена на расчете профилей тяги ракет как в вакууме, так и в атмосфере. Это раннее исследование выявило множество основных принципов, которые используются до сих пор. Еще одним успешным применением был набор высоты по траекториям первых реактивных самолетов. Из-за высокого сопротивления, связанного с околозвуковой областью сопротивления, и низкой тяги ранних реактивных самолетов, оптимизация траектории была ключом к максимизации набора высоты. Некоторые мировые рекорды были установлены на основе оптимального управления траекториями. В этих ситуациях пилот следовал графику зависимости числа оборотов от высоты, основанному на оптимальных решениях управления.

Одной из важных ранних проблем оптимизации траекторий была проблема особой дуги , где принцип максимума Понтрягина не может дать полного решения. Примером проблемы с единичным управлением является оптимизация тяги ракеты, летящей на постоянной высоте и запускаемой с малой скоростью. Здесь проблема заключается в последовательном управлении с максимально возможной тягой до тех пор, пока не будет достигнута сингулярная дуга. Тогда решение сингулярного управления обеспечивает пониженную переменную тягу вплоть до выгорания. В этот момент импульсное управление обеспечивает то, что управление или тяга достигают минимального нулевого значения. Это решение лежит в основе конструкции ракетного двигателя с наддувом и маршевым двигателем, широко используемого сегодня для максимизации характеристик ракеты.

Приложения

[ редактировать ]

Существует множество приложений для оптимизации траектории, в первую очередь в робототехнике: промышленность, манипулирование, ходьба, планирование пути и аэрокосмическая промышленность. Его также можно использовать для моделирования и оценки.

Роботы-манипуляторы

[ редактировать ]

В зависимости от конфигурации роботы-манипуляторы с открытой цепью требуют определенной оптимизации траектории. Например, роботизированная рука с 7 шарнирами и 7 звеньями (7-DOF) представляет собой резервированную систему, в которой одно декартово положение рабочего органа может соответствовать бесконечному числу положений угла шарнира, таким образом, эта избыточность может быть использована для оптимизации траекторию, чтобы, например, избежать каких-либо препятствий в рабочем пространстве или минимизировать крутящий момент в суставах. [5]

Квадрокоптерные вертолеты

[ редактировать ]

Оптимизация траектории часто используется для расчета траекторий квадрокоптерных вертолетов . В этих приложениях обычно использовались узкоспециализированные алгоритмы. [6] [7] Одно интересное применение, продемонстрированное лабораторией GRASP Университета Пенсильвании, — это вычисление траектории, которая позволяет квадрокоптеру пролетать через кольцо при его броске. Другой, на этот раз на ETH Zurich Flying Machine Arena , включает в себя два квадрокоптера, которые перебрасывают между собой шест, балансируя, как перевернутый маятник. Недавно также изучалась проблема расчета траекторий с минимальной энергией для квадрокоптера. [8]

Производство

[ редактировать ]

Оптимизация траектории используется в производстве, особенно для управления химическими процессами. [9] или вычисление желаемого пути для роботов-манипуляторов. [10]

Шагающие роботы

[ редактировать ]

В области шагающей робототехники существует множество различных приложений для оптимизации траектории. Например, в одной статье оптимизация траектории двуногой походки использовалась на простой модели, чтобы показать, что ходьба энергетически выгодна для движения с низкой скоростью, а бег энергетически выгоден для движения с высокой скоростью. [11] Как и во многих других приложениях, оптимизация траектории может использоваться для расчета номинальной траектории, вокруг которой строится стабилизирующий контроллер. [12] Оптимизация траектории может применяться при детальном планировании движения сложных гуманоидных роботов, таких как Atlas . [13] Наконец, оптимизацию траектории можно использовать для планирования пути роботов со сложными динамическими ограничениями с использованием моделей пониженной сложности. [14]

Аэрокосмическая промышленность

[ редактировать ]

Для тактических ракет профили полета определяются историей тяги и подъемной силы . Этими историями можно управлять с помощью ряда средств, включая такие методы, как использование истории команд угла атаки или графика высоты / дальности падения, которому должна следовать ракета. Каждая комбинация факторов конструкции ракеты, желаемых характеристик ракеты и ограничений системы приводит к новому набору оптимальных параметров управления. [15]

Терминология

[ редактировать ]
Переменные решения
Множество неизвестных, которые необходимо найти с помощью оптимизации.
Задача оптимизации траектории
Особый тип задачи оптимизации, в которой переменными решения являются функции, а не действительные числа.
Оптимизация параметров
Любая задача оптимизации, в которой переменными решения являются действительные числа.
Нелинейная программа
Класс оптимизации параметров с ограничениями, в котором либо целевая функция, либо ограничения являются нелинейными.
Косвенный метод
Косвенный метод решения задачи оптимизации траектории состоит из трех этапов: 1) аналитически построить необходимые и достаточные условия оптимальности, 2) дискретизировать эти условия, построив задачу оптимизации параметров с ограничениями, 3) решить эту задачу оптимизации. [16]
Прямой метод
Прямой метод решения задачи оптимизации траектории состоит из двух этапов: 1) непосредственная дискретизация задачи оптимизации траектории, преобразование ее в задачу оптимизации параметров с ограничениями, 2) решение этой задачи оптимизации. [16]
Транскрипция
Процесс, посредством которого задача оптимизации траектории преобразуется в задачу оптимизации параметров. Иногда это называют дискретизацией. Методы транскрипции обычно делятся на две категории: методы съемки и методы словосочетания.
Метод съемки
Метод транскрипции, основанный на моделировании, обычно с использованием явных схем Рунге--Кутты.
Метод коллокации (одновременный метод)
Метод транскрипции, основанный на аппроксимации функций, обычно с использованием неявных схем Рунге--Кутты.
Псевдоспектральный метод (Global Collocation)
Метод транскрипции, который представляет всю траекторию в виде одного ортогонального многочлена высокого порядка.
Сетка (Сетка)
После транскрипции ранее непрерывная траектория теперь представлена ​​дискретным набором точек, известных как точки сетки или точки сетки.
Уточнение сетки
Процесс, посредством которого сетка дискретизации улучшается путем решения последовательности задач оптимизации траектории. Уточнение сетки выполняется либо путем разделения сегмента траектории, либо путем увеличения порядка полинома, представляющего этот сегмент. [17]
Задача оптимизации многофазной траектории
Оптимизации траектории системы с гибридной динамикой можно добиться, представив ее как задачу оптимизации многофазной траектории. Это делается путем составления последовательности стандартных задач оптимизации траектории, связанных между собой ограничениями. [18]

Методы оптимизации траектории

[ редактировать ]

Методы решения любых задач оптимизации можно разделить на две категории: косвенные и прямые. Косвенный метод работает путем аналитического построения необходимых и достаточных условий оптимальности, которые затем решаются численно. Прямой метод пытается найти прямое численное решение путем построения последовательности постоянно улучшающихся приближений к оптимальному решению. [16]

Задача оптимального управления представляет собой бесконечномерную задачу оптимизации, поскольку переменные решения являются функциями, а не действительными числами. Все методы решения выполняют транскрипцию - процесс, с помощью которого задача оптимизации траектории (оптимизация по функциям) преобразуется в задачу оптимизации параметров с ограничениями (оптимизация по действительным числам). Как правило, эта задача оптимизации параметров с ограничениями представляет собой нелинейную программу, хотя в особых случаях ее можно свести к квадратичной программе или линейной программе .

Одиночная съемка

[ редактировать ]

Одиночная стрельба — это самый простой метод оптимизации траектории. Основная идея аналогична тому, как вы нацеливаетесь из пушки: выберите набор параметров траектории, смоделируйте все это, а затем проверьте, попали ли вы в цель. Вся траектория представлена ​​как один сегмент с одним ограничением, известным как ограничение дефекта, требующее, чтобы конечное состояние моделирования соответствовало желаемому конечному состоянию системы. Одиночная съемка эффективна для задач, которые либо просты, либо имеют очень хорошую инициализацию. В противном случае как косвенная, так и прямая формулировка обычно сталкиваются с трудностями. [16] [19] [20]

Многократная съемка

[ редактировать ]

Многократная стрельба — это простое расширение одиночной стрельбы, которое делает ее гораздо более эффективной. Вместо того, чтобы представлять всю траекторию как одну симуляцию (сегмент), алгоритм разбивает траекторию на множество более коротких сегментов, и между каждым из них добавляется ограничение дефекта. В результате получается большая разреженная нелинейная программа, которую, как правило, легче решить, чем небольшие плотные программы, созданные путем одиночной съемки. [19] [20]

Прямое сочетание

[ редактировать ]

Методы прямого коллокации работают путем аппроксимации траекторий состояния и управления с помощью полиномиальных сплайнов . Эти методы иногда называют прямой транскрипцией. Трапециевидное словосочетание - это широко используемый метод прямого словосочетания низкого порядка. Динамика, цель пути и управление представлены с помощью линейных сплайнов, а динамика удовлетворяется с помощью трапециевидной квадратуры . Коллокация Эрмита-Симпсона — это распространенный метод прямой коллокации среднего порядка. Состояние представлено кубически-эрмитовым сплайном , а динамика удовлетворяется с использованием квадратуры Симпсона . [16] [20]

Ортогональное сочетание

[ редактировать ]

Ортогональное сочетание технически является подмножеством прямого сочетания, но детали реализации настолько различны, что его можно разумно рассматривать как отдельный набор методов. Ортогональная коллокация отличается от прямой коллокации тем, что в ней обычно используются сплайны высокого порядка, и каждый сегмент траектории может быть представлен сплайном разного порядка. Название происходит от использования ортогональных полиномов в сплайнах состояния и управления. [20] [21]

Псевдоспектральная дискретизация

[ редактировать ]

При псевдоспектральной дискретизации вся траектория представляется набором базисных функций во временной области (независимая переменная). Базисные функции не обязательно должны быть полиномами. Псевдоспектральная дискретизация также известна как спектральная коллокация. [22] [23] [24] При использовании псевдоспектрального метода для решения задачи оптимизации траектории, решение которой является гладким, достигается спектральная (экспоненциальная) сходимость. [25] Если траектория не является гладкой, сходимость все равно будет очень быстрой, быстрее, чем у методов Рунге-Кутты. [26] [27]

Временные конечные элементы

[ редактировать ]

В 1990 году Дьюи Х. Ходжес и Роберт Р. Блесс. [28] предложил слабый гамильтонов метод конечных элементов для задач оптимального управления. Идея заключалась в том, чтобы вывести слабую вариационную форму необходимых условий оптимальности первого порядка, дискретизировать временную область на конечных интервалах и использовать простое полиномиальное представление нулевого порядка состояний, управления и сопряженных элементов на каждом интервале.

Дифференциальное динамическое программирование

[ редактировать ]

Дифференциальное динамическое программирование немного отличается от других методов, описанных здесь. В частности, он не разделяет четко транскрипцию и оптимизацию. Вместо этого он выполняет последовательность итеративных проходов вперед и назад по траектории. Каждый прямой проход удовлетворяет динамике системы, а каждый обратный проход удовлетворяет условиям оптимальности управления. В конце концов, эта итерация сходится к траектории, которая является одновременно осуществимой и оптимальной. [29]

Сравнение техник

[ редактировать ]

Существует множество методов, из которых можно выбирать при решении задачи оптимизации траектории. Не существует лучшего метода, но некоторые методы могут лучше справляться с конкретными проблемами. В этом разделе представлено приблизительное понимание компромиссов между методами.

Косвенные и прямые методы

[ редактировать ]

При решении задачи оптимизации траектории косвенным методом необходимо явно строить сопряженные уравнения и их градиенты. Зачастую это сложно сделать, но это дает отличный показатель точности решения. Прямые методы гораздо проще настроить и решить, но они не имеют встроенной метрики точности. [16] В результате более широкое распространение получили прямые методы, особенно в некритических приложениях. Косвенные методы по-прежнему имеют место в специализированных приложениях, особенно в аэрокосмической отрасли, где точность имеет решающее значение.

Одна из областей, где косвенные методы сталкиваются с особыми трудностями, — это проблемы с ограничениями неравенства путей. Эти проблемы, как правило, имеют решения, для которых ограничение частично активно. При построении сопряженных уравнений для косвенного метода пользователь должен явно записать, когда ограничение активно в решении, что априори узнать сложно. Одним из решений является использование прямого метода для вычисления первоначального предположения, которое затем используется для построения многофазной задачи, в которой задано ограничение. Полученную задачу затем можно точно решить косвенным методом. [16]

Стрельба против коллокации

[ редактировать ]

Методы одиночной стрельбы лучше всего использовать для задач, где управление очень простое (или есть очень хорошая начальная догадка). Например, проблема планирования миссии спутника, где единственным контролем является величина и направление начального импульса двигателей. [19]

Многократная стрельба хорошо подходит для задач с относительно простым управлением, но сложной динамикой. Хотя ограничения пути можно использовать, они делают результирующую нелинейную программу относительно сложной для решения.

Методы прямой коллокации хороши для задач, в которых точность управления и состояния аналогичны. Эти методы, как правило, менее точны, чем другие (из-за их низкого порядка), но особенно надежны для задач со сложными ограничениями пути.

Методы ортогональной коллокации лучше всего подходят для получения высокоточных решений задач, где важна точность траектории управления. В некоторых реализациях возникают проблемы с ограничениями путей. Эти методы особенно хороши, когда решение гладкое.

См. также

[ редактировать ]
  1. ^ Цигун; Вэй Кан; Бедроссян, Н.С.; Фару, Ф.; Пуя Сехават; Боллино, К. (декабрь 2007 г.). «Псевдоспектральное оптимальное управление для военных и промышленных приложений» . 2007 г. 46-я конференция IEEE по принятию решений и управлению . стр. 4128–4142. дои : 10.1109/CDC.2007.4435052 . ISBN  978-1-4244-1497-0 . S2CID   2935682 .
  2. ^ 300 лет оптимального управления: от брахистохроны к принципу максимума , Гектор Дж. Суссманн и Ян К. Виллемс. Журнал IEEE Control Systems, 1997.
  3. ^ Брайсон, Хо, Прикладное оптимальное управление, издательство Blaisdell Publishing Company, 1969, стр. 246.
  4. ^ Л. С. Понтырагин, Математическая теория оптимальных процессов, Нью-Йорк, Intersciences, 1962.
  5. ^ Малик, Арыслан; Хендерсон, Трой; Праженица, Ричард (январь 2021 г.). «Генерация траектории многотельной робототехнической системы с использованием продукта формулировки экспонент» . Форум AIAA Scitech 2021 : 2016. doi : 10.2514/6.2021-2016 . ISBN  978-1-62410-609-5 . S2CID   234251587 .
  6. ^ Дэниел Меллингер и Виджей Кумар, «Создание минимальной мгновенной траектории и управление ею для квадрокоптеров», Международная конференция по робототехнике и автоматизации, IEEE 2011.
  7. ^ Маркус Хен и Рафаэлло Д'Андреа, «Генерация траектории квадрокоптеров в реальном времени», Транзакции IEEE по робототехнике, 2015.
  8. ^ Фабио Морбиди, Роэл Кано, Дэвид Лара, «Создание траектории с минимальной энергией для квадрокоптера» в Proc. Международная конференция IEEE по робототехнике и автоматизации, стр. 1492–1498, 2016 г.
  9. ^ Джон В. Итон и Джеймс Б. Роулингс. «Модельно-прогностическое управление химическими процессами» Химическая инженерия, Том 47, № 4. 1992.
  10. ^ Т. Четтиби, Х. Лехтихет, М. Хаддад, С. Ханчи, «Планирование траектории с минимальной стоимостью для промышленных роботов», Европейский журнал механики, 2004.
  11. ^ Манодж Шринивасан и Энди Руина. «Компьютерная оптимизация минимальной двуногой модели обнаруживает ходьбу и бег», Nature, 2006.
  12. ^ Э. Р. Вестервельт, Дж. В. Гризл и Д. Е. Кодичек. «Гибридная нулевая динамика плоских двуногих ходунков» Транзакции IEEE по автоматическому управлению, 2003.
  13. ^ Майкл Поса, Скотт Куиндерсма и Расс Тедрейк. «Оптимизация и стабилизация траекторий динамических систем со связями». Международная конференция по робототехнике и автоматизации IEEE 2016.
  14. ^ Хонгкай Дай, Андрес Валенсуэла и Расс Тедрейк. Международная конференция по роботам-гуманоидам «Планирование движений всего тела с помощью центроидальной динамики и полной кинематики», IEEE 2014.
  15. ^ Филлипс, Калифорния, «Управление энергией для многоимпульсной ракеты», документ AIAA 88-0334, январь 1988 г.
  16. ^ Перейти обратно: а б с д и ж г Джон Т. Беттс «Практические методы оптимального управления и оценки с использованием нелинейного программирования» SIAM Advance in Design and Control, 2010.
  17. ^ Кристофер Л. Дарби, Уильям В. Хагер и Анил В. Рао. «Hp-адаптивный псевдоспектральный метод решения задач оптимального управления». Приложения и методы оптимального управления, 2010.
  18. ^ Паттерсон, Майкл А.; Рао, Анил В. (01 октября 2014 г.). «GPOPS-II: программное обеспечение MATLAB для решения многофазных задач оптимального управления с использованием hp-адаптивных методов гауссовой квадратурной коллокации и разреженного нелинейного программирования» . АКМ Транс. Математика. Программное обеспечение . 41 (1): 1:1–1:37. дои : 10.1145/2558904 . ISSN   0098-3500 .
  19. ^ Перейти обратно: а б с Обзор численных методов оптимизации траекторий; Джон Т. Беттс Журнал руководства, контроля и динамики, 1998 г.; 0731-5090 том 21 №2 (193-207)
  20. ^ Перейти обратно: а б с д Анил В. Рао «Обзор численных методов оптимального управления» Достижения в области астронавтики, 2009.
  21. ^ Камила С. Франколин, Дэвид А. Бенсон, Уильям В. Хагер, Анил В. Рао. «Оценка стоимости в оптимальном управлении с использованием интегральных квадратурных методов ортогональной коллокации» Приложения и методы оптимального управления, 2014.
  22. ^ Р., Малик, Муджиб (1984). Метод спектральной коллокации для уравнений Навье-Стокса . Национальное управление по аэронавтике и исследованию космического пространства, Исследовательский центр Лэнгли. OCLC   11642811 . {{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
  23. ^ «Спектральные методы и псевдоспектральные методы» , «Спектральные методы и их приложения» , WORLD SCIENTIFIC, стр. 100–187, май 1998 г., doi : 10.1142/9789812816641_0004 , ISBN  978-981-02-3333-4 , получено 23 апреля 2021 г.
  24. ^ Гун, Ци. Спектральное и псевдоспектральное оптимальное управление на произвольных сетках . OCLC   1185648645 .
  25. ^ Ллойд Н. Трефетен. «Теория приближений и практика приближений», SIAM 2013.
  26. ^ Канг, Вэй (ноябрь 2010 г.). «Скорость сходимости лежандровского псевдоспектрального оптимального управления линеаризуемыми системами с обратной связью» . Журнал теории управления и приложений . 8 (4): 391–405. дои : 10.1007/s11768-010-9104-0 . ISSN   1672-6340 . S2CID   122945121 .
  27. ^ Трефетен, Ллойд Н. (Ллойд Николас) (январь 2019 г.). Теория приближений и практика аппроксимации . ISBN  978-1-61197-594-9 . OCLC   1119061092 .
  28. ^ Д.Х. Ходжес и Р.Р. Блесс, «Слабый гамильтонов метод конечных элементов для задач оптимального управления», Журнал руководства, управления и динамики, 1990. https://arc.aiaa.org/doi/10.2514/3.20616
  29. ^ Дэвид Х. Джейкобсон, Дэвид К. Мейн. «Дифференциальное динамическое программирование», Elsevier, 1970.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6c33f7c770e53b63c1ef0f8081abbf70__1707465000
URL1:https://arc.ask3.ru/arc/aa/6c/70/6c33f7c770e53b63c1ef0f8081abbf70.html
Заголовок, (Title) документа по адресу, URL1:
Trajectory optimization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)