Линейно-квадратичный регулятор, быстро изучающий случайное дерево
Сорт | Кинодинамическое планирование движения |
---|---|
Худшая производительность | О (п журнал п) |
Наихудшая пространственная сложность | На) |
Линейно-квадратичный регулятор быстрого исследования случайного дерева (LQR-RRT) — это алгоритм кинодинамического планирования , основанный на выборке . Решатель производит случайные действия, которые образуют воронку в пространстве состояний. Сгенерированное дерево представляет собой последовательность действий, которая выполняет функцию стоимости. Ограничение состоит в том, что модель прогнозирования, основанная на дифференциальных уравнениях для моделирования физической системы доступна . Этот метод является расширением быстро исследуемого случайного дерева , широко используемого подхода к планированию движения .
Мотивация
[ редактировать ]Теория управления использует дифференциальные уравнения для описания сложных физических систем, таких как перевернутый маятник. [ 1 ] Набор дифференциальных уравнений образует физический механизм, который отображает управляющий вход в пространство состояний системы. Прямая модель способна моделировать данную область. Например, если пользователь толкает тележку влево, маятник, установленный на тележке, отреагирует движением. Точная сила определяется законами движения Ньютона .
Решающая программа, например ПИД-регуляторы и прогнозирующее управление моделью , способна привести моделируемую систему в целевое состояние. С абстрактной точки зрения задача управления сложной физической системой представляет собой задачу планирования кинодинамического движения. [ 2 ] В отличие от обычной задачи планирования пути, пространство состояний — это не просто двухмерная карта, содержащая координаты x и y. Но физическая неактивная система имеет гораздо больше измерений, например, приложенные силы, углы поворота и трение о землю. [ 3 ] Поиск допустимой траектории в сложном пространстве состояний является сложной задачей математики.
Описание
[ редактировать ]LQR-отслеживание
[ редактировать ]Линейно-квадратичный регулятор (ЛКР) — это формулировка цели для системы дифференциальных уравнений. [ 4 ] Он определяет функцию стоимости, но не отвечает на вопрос, как привести систему в желаемое состояние. В отличие от линейных задач, например робота, следующего за линией, кинодинамические задачи можно решить не одним действием, а траекторией множества управляющих сигналов. Эти сигналы определяются и постоянно обновляются с помощью стратегии удаляющегося горизонта, также известной как управление с прогнозированием модели (MPC). LQR-отслеживание означает поиск и оценку траекторий для решения системы дифференциальных уравнений.
В отличие от ПИД-регулятора , который способен лишь найти следующее управляющее воздействие, LQR-дерево способно заранее хранить последовательность действий. [ 5 ] Это эквивалентно многоэтапному решателю, который учитывает временной горизонт . Действие, предпринятое сейчас, опосредованно повлияет на систему в будущем посредством отложенной обратной связи.
История
[ редактировать ]Алгоритм представляет собой исследовательский проект университета. Первая версия была разработана Пересом и др. в Массачусетском технологическом институте в 2012 году в лаборатории искусственного интеллекта. [ 3 ] В 2016 году алгоритм был включен в обзор методов управления автономными транспортными средствами. [ 6 ] и был адаптирован другими академическими группами робототехники, такими как Университет Флориды, для создания экспериментальных планировщиков маршрутов. В 2018 году алгоритм был включен в библиотеку Pythonrobotics. [ 7 ] Алгоритм в настоящее время тестируется на Astrobee, свободно летающем аппарате с шестью степенями свободы (DOF) и роботизированной рукой с 3 степенями свободы на Международной космической станции. [ 8 ] [ 9 ] [ 10 ] [ 11 ] В настоящее время он является частью экспериментов по относительному роению спутников и роботизированному маневрированию (ReSWARM), которые проводятся на Международной космической станции с апреля 2021 года, начиная с экспедиций 65 и 66. [ 12 ] [ 13 ] [ 14 ] [ 15 ] Будущие эксперименты повлекут за собой физическое манипулирование объектами для дальнейшей проверки демонстрации сборки на орбите, рассмотрение физических объектов для картирования в реальном времени и предотвращения столкновений, а также применение теоретико-информационной структуры к большему набору неопределенных роботов. [ 16 ]
Ссылки
[ редактировать ]- ^ «Сколько времени нужно, чтобы карандаш опрокинулся?» . ПРОВОДНОЙ . 03 сентября 2014 г. Проверено 19 августа 2020 г.
- ^ Жан-Поль Ломонд; Марк Овермарс (11 февраля 1997 г.). Алгоритмы роботизированного движения и манипулирования: WAFR 1996 . ЦРК Пресс. стр. 109–. ISBN 978-1-4398-6452-4 .
- ^ Перейти обратно: а б Алехандро Перес, Роберт Платт, Джордж Конидарис, Лесли Кельблинг и Томас Лозано-Перес (2012). «LQR-RRT *: оптимальное планирование движения на основе выборки с автоматически полученной эвристикой расширения». 2012 Международная конференция IEEE по робототехнике и автоматизации . Международная конференция IEEE 2012 по робототехнике и автоматизации. IEEE. стр. 2537–2542. CiteSeerX 10.1.1.221.856 . дои : 10.1109/icra.2012.6225177 . ISBN 978-1-4673-1405-3 .
- ^ «Наблюдение за перевернутым маятником — с управлением от Arduino» . я-программист . 2018-06-02 . Проверено 19 августа 2020 г.
- ^ Филипп Рейст, Паскаль Прейсверк и Расс Тедрейк (2016). «Планирование движения с обратной связью с помощью LQR-деревьев на основе моделирования». Международный журнал исследований робототехники . 35 (11). Публикации SAGE: 1393–1416. дои : 10.1177/0278364916647192 . hdl : 1721.1/124352 . S2CID 13307517 .
- ^ Паден, Брайан; Чап, Михал; Юн, Сзе Чжэн; Ершов Дмитрий; Фраццоли, Эмилио (март 2016 г.). «Обзор методов планирования и управления движением беспилотных городских транспортных средств» . Транзакции IEEE в интеллектуальных транспортных средствах . 1 (1): 33–55. arXiv : 1604.07446 . дои : 10.1109/TIV.2016.2578706 . ISSN 2379-8904 . S2CID 1229096 .
- ^ Сакаи, Ацуши и Ингрэм, Дэниел и Диниус, Джозеф и Чавла, Каран и Раффин, Антонин и Пакес, Алексис (2018). «PythonRobotics: коллекция кода Python алгоритмов робототехники». arXiv : 1808.10703 [ cs.RO ].
{{cite arXiv}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Дорр, Брайс; Линарес, Ричард (06 августа 2020 г.). «Планирование и управление движением для сборки на орбите с использованием LQR-RRT * и нелинейного MPC». arXiv : 2008.02846 [ cs.RO ].
- ^ «Исследования – ARCLab» . Проверено 20 апреля 2022 г.
- ^ «Выпускник CSE исследует использование робототехники в космосе» . Колледж науки и техники . Проверено 20 апреля 2022 г.
- ^ Дорр, Брайс; Олби, Кинан; Экал, Моника; Линарес, Ричард; Вентура, Родриго (20 февраля 2021 г.). «Безопасные и учитывающие неопределенность методы планирования движения роботов для гибкой сборки на орбите». arXiv : 2102.10348 [ cs.RO ].
- ^ «Детали эксперимента» . www.nasa.gov . Проверено 22 января 2023 г.
- ^ «Как достичь кувыркающейся цели в космосе» . Новости Массачусетского технологического института | Массачусетский технологический институт . 25 февраля 2022 г. Проверено 22 января 2023 г.
- ^ «6 декабря 2021 года – Отчет о состоянии нахождения МКС на орбите» . blogs.nasa.gov . 6 декабря 2021 г. Проверено 22 января 2023 г.
- ^ Гарсия, Марк (10 декабря 2021 г.). «Астронавт Маттиас Маурер на снимке внутри лабораторного модуля Кибо» . НАСА . Проверено 22 января 2023 г.
- ^ Дорр, Брайс; Олби, Кинан; Экал, Моника; Вентура, Родриго; Линарес, Ричард (3 января 2023 г.). «Эксперименты ReSWARM в условиях микрогравитации: планирование, контроль и оценка модели для операций на орбите в условиях близкого сближения». arXiv : 2301.01319 [ cs.RO ].