Jump to content

Линейно-квадратичный регулятор, быстро изучающий случайное дерево

LQR-RRT
Сорт Кинодинамическое планирование движения
Худшая производительность О (п журнал п)
Наихудшая пространственная сложность На)

Линейно-квадратичный регулятор быстрого исследования случайного дерева (LQR-RRT) — это алгоритм кинодинамического планирования , основанный на выборке . Решатель производит случайные действия, которые образуют воронку в пространстве состояний. Сгенерированное дерево представляет собой последовательность действий, которая выполняет функцию стоимости. Ограничение состоит в том, что модель прогнозирования, основанная на дифференциальных уравнениях для моделирования физической системы доступна . Этот метод является расширением быстро исследуемого случайного дерева , широко используемого подхода к планированию движения .

Мотивация

[ редактировать ]
Тележка-вешалка

Теория управления использует дифференциальные уравнения для описания сложных физических систем, таких как перевернутый маятник. [ 1 ] Набор дифференциальных уравнений образует физический механизм, который отображает управляющий вход в пространство состояний системы. Прямая модель способна моделировать данную область. Например, если пользователь толкает тележку влево, маятник, установленный на тележке, отреагирует движением. Точная сила определяется законами движения Ньютона .

Решающая программа, например ПИД-регуляторы и прогнозирующее управление моделью , способна привести моделируемую систему в целевое состояние. С абстрактной точки зрения задача управления сложной физической системой представляет собой задачу планирования кинодинамического движения. [ 2 ] В отличие от обычной задачи планирования пути, пространство состояний — это не просто двухмерная карта, содержащая координаты x и y. Но физическая неактивная система имеет гораздо больше измерений, например, приложенные силы, углы поворота и трение о землю. [ 3 ] Поиск допустимой траектории в сложном пространстве состояний является сложной задачей математики.

Описание

[ редактировать ]

LQR-отслеживание

[ редактировать ]
Схема MPC базовая

Линейно-квадратичный регулятор (ЛКР) — это формулировка цели для системы дифференциальных уравнений. [ 4 ] Он определяет функцию стоимости, но не отвечает на вопрос, как привести систему в желаемое состояние. В отличие от линейных задач, например робота, следующего за линией, кинодинамические задачи можно решить не одним действием, а траекторией множества управляющих сигналов. Эти сигналы определяются и постоянно обновляются с помощью стратегии удаляющегося горизонта, также известной как управление с прогнозированием модели (MPC). LQR-отслеживание означает поиск и оценку траекторий для решения системы дифференциальных уравнений.

В отличие от ПИД-регулятора , который способен лишь найти следующее управляющее воздействие, LQR-дерево способно заранее хранить последовательность действий. [ 5 ] Это эквивалентно многоэтапному решателю, который учитывает временной горизонт . Действие, предпринятое сейчас, опосредованно повлияет на систему в будущем посредством отложенной обратной связи.

Астронавт и бортинженер 66-й экспедиции Маттиас Маурер на фото внутри лабораторного модуля Кибо, настраивающего робота Astrobee для эксперимента ReSWARM.

Алгоритм представляет собой исследовательский проект университета. Первая версия была разработана Пересом и др. в Массачусетском технологическом институте в 2012 году в лаборатории искусственного интеллекта. [ 3 ] В 2016 году алгоритм был включен в обзор методов управления автономными транспортными средствами. [ 6 ] и был адаптирован другими академическими группами робототехники, такими как Университет Флориды, для создания экспериментальных планировщиков маршрутов. В 2018 году алгоритм был включен в библиотеку Pythonrobotics. [ 7 ] Алгоритм в настоящее время тестируется на Astrobee, свободно летающем аппарате с шестью степенями свободы (DOF) и роботизированной рукой с 3 степенями свободы на Международной космической станции. [ 8 ] [ 9 ] [ 10 ] [ 11 ] В настоящее время он является частью экспериментов по относительному роению спутников и роботизированному маневрированию (ReSWARM), которые проводятся на Международной космической станции с апреля 2021 года, начиная с экспедиций 65 и 66. [ 12 ] [ 13 ] [ 14 ] [ 15 ] Будущие эксперименты повлекут за собой физическое манипулирование объектами для дальнейшей проверки демонстрации сборки на орбите, рассмотрение физических объектов для картирования в реальном времени и предотвращения столкновений, а также применение теоретико-информационной структуры к большему набору неопределенных роботов. [ 16 ]

  1. ^ «Сколько времени нужно, чтобы карандаш опрокинулся?» . ПРОВОДНОЙ . 03 сентября 2014 г. Проверено 19 августа 2020 г.
  2. ^ Жан-Поль Ломонд; Марк Овермарс (11 февраля 1997 г.). Алгоритмы роботизированного движения и манипулирования: WAFR 1996 . ЦРК Пресс. стр. 109–. ISBN  978-1-4398-6452-4 .
  3. ^ Перейти обратно: а б Алехандро Перес, Роберт Платт, Джордж Конидарис, Лесли Кельблинг и Томас Лозано-Перес (2012). «LQR-RRT *: оптимальное планирование движения на основе выборки с автоматически полученной эвристикой расширения». 2012 Международная конференция IEEE по робототехнике и автоматизации . Международная конференция IEEE 2012 по робототехнике и автоматизации. IEEE. стр. 2537–2542. CiteSeerX   10.1.1.221.856 . дои : 10.1109/icra.2012.6225177 . ISBN  978-1-4673-1405-3 .
  4. ^ «Наблюдение за перевернутым маятником — с управлением от Arduino» . я-программист . 2018-06-02 . Проверено 19 августа 2020 г.
  5. ^ Филипп Рейст, Паскаль Прейсверк и Расс Тедрейк (2016). «Планирование движения с обратной связью с помощью LQR-деревьев на основе моделирования». Международный журнал исследований робототехники . 35 (11). Публикации SAGE: 1393–1416. дои : 10.1177/0278364916647192 . hdl : 1721.1/124352 . S2CID   13307517 .
  6. ^ Паден, Брайан; Чап, Михал; Юн, Сзе Чжэн; Ершов Дмитрий; Фраццоли, Эмилио (март 2016 г.). «Обзор методов планирования и управления движением беспилотных городских транспортных средств» . Транзакции IEEE в интеллектуальных транспортных средствах . 1 (1): 33–55. arXiv : 1604.07446 . дои : 10.1109/TIV.2016.2578706 . ISSN   2379-8904 . S2CID   1229096 .
  7. ^ Сакаи, Ацуши и Ингрэм, Дэниел и Диниус, Джозеф и Чавла, Каран и Раффин, Антонин и Пакес, Алексис (2018). «PythonRobotics: коллекция кода Python алгоритмов робототехники». arXiv : 1808.10703 [ cs.RO ]. {{cite arXiv}}: CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ Дорр, Брайс; Линарес, Ричард (06 августа 2020 г.). «Планирование и управление движением для сборки на орбите с использованием LQR-RRT * и нелинейного MPC». arXiv : 2008.02846 [ cs.RO ].
  9. ^ «Исследования – ARCLab» . Проверено 20 апреля 2022 г.
  10. ^ «Выпускник CSE исследует использование робототехники в космосе» . Колледж науки и техники . Проверено 20 апреля 2022 г.
  11. ^ Дорр, Брайс; Олби, Кинан; Экал, Моника; Линарес, Ричард; Вентура, Родриго (20 февраля 2021 г.). «Безопасные и учитывающие неопределенность методы планирования движения роботов для гибкой сборки на орбите». arXiv : 2102.10348 [ cs.RO ].
  12. ^ «Детали эксперимента» . www.nasa.gov . Проверено 22 января 2023 г.
  13. ^ «Как достичь кувыркающейся цели в космосе» . Новости Массачусетского технологического института | Массачусетский технологический институт . 25 февраля 2022 г. Проверено 22 января 2023 г.
  14. ^ «6 декабря 2021 года – Отчет о состоянии нахождения МКС на орбите» . blogs.nasa.gov . 6 декабря 2021 г. Проверено 22 января 2023 г.
  15. ^ Гарсия, Марк (10 декабря 2021 г.). «Астронавт Маттиас Маурер на снимке внутри лабораторного модуля Кибо» . НАСА . Проверено 22 января 2023 г.
  16. ^ Дорр, Брайс; Олби, Кинан; Экал, Моника; Вентура, Родриго; Линарес, Ричард (3 января 2023 г.). «Эксперименты ReSWARM в условиях микрогравитации: планирование, контроль и оценка модели для операций на орбите в условиях близкого сближения». arXiv : 2301.01319 [ cs.RO ].
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dff4f835e7fe139750ddf3b8e58b96d2__1705204860
URL1:https://arc.ask3.ru/arc/aa/df/d2/dff4f835e7fe139750ddf3b8e58b96d2.html
Заголовок, (Title) документа по адресу, URL1:
Linear-quadratic regulator rapidly exploring random tree - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)