Jump to content

Мультиагентный поиск пути

Пример многоагентного поиска пути в среде сетки.

Задача многоагентного поиска пути ( MAPF ) является примером многоагентного планирования и заключается в вычислении бесконфликтных путей для группы агентов от их местоположения до назначенной цели. Это проблема оптимизации , поскольку цель состоит в том, чтобы найти те пути, которые оптимизируют заданную целевую функцию, обычно определяемую как количество временных шагов, пока все агенты не достигнут своих целевых ячеек. MAPF — это многоагентное обобщение задачи поиска пути , тесно связанное с задачей поиска кратчайшего пути в контексте теории графов .

Для решения проблемы MAPF было предложено несколько алгоритмов. Из-за сложности оказывается, что оптимальные подходы неосуществимы в больших средах и с большим количеством агентов. Однако, учитывая приложения, в которых участвует MAPF, такие как автоматизированные склады и управление аэропортами, важно найти компромисс между эффективностью решения и его результативностью.

Формализация задачи [ править ]

Элементы классического MAPF [1] проблема в следующем:

  • набор из агенты;
  • неориентированный граф , где - это набор узлов, и это набор ребер. Узлы представляют возможные местоположения агентов, а дуги — возможные связи между такими позициями;
  • карта который связывает каждого агента с его отправной точкой;
  • карта который связывает каждого агента с его целевой точкой.

Предполагается, что время дискретно и что каждый агент может выполнить одно действие на каждом временном шаге. Существует два возможных типа действий: действие ожидания, при котором агент остается в своем узле, и действие перемещения, позволяющее агенту переместиться в соседний узел. Действие формализуется как функция , это означает, что представляет собой действие перехода от к если находится рядом с и отличается от или остаться в узле если .

Агенты выполняют последовательность действий, чтобы добраться от начальной точки до целевого местоположения. Последовательность действий, выполняемых агентом обозначается и называется планом. Если агент начинается с его местоположения и прибывает в целевое место план выполнения , затем называется одноагентным планом для агента . [1] Допустимым решением проблемы MAPF является набор планы одного агента (по одному для каждого агента), так что планы не конфликтуют друг с другом. Как только агент достигнет своей цели, он может либо остаться в целевом месте, либо исчезнуть. [1]

Типы столкновений [ править ]

Чтобы иметь правильное решение проблемы MAPF, необходимо, чтобы одноагентные планы агенты не сталкиваются друг с другом. Данный план , выражение обозначает позицию агента после выполнения этапы плана . Между двумя планами можно выделить пять различных типов коллизий. и . [1]

Типы конфликтов: (а) конфликт ребер, (б) конфликт вершин, (в) конфликт следования, (г) конфликт цикла и (д) конфликт перестановки.
  • Конфликт вершин: между планами существует конфликт вершин. и когда два агента одновременно занимают одно и то же место. Формально конфликт вершин возникает, когда .
  • Конфликт ребер: конфликт ребер возникает всякий раз, когда два агента пересекают одно и то же ребро в одном и том же направлении в одно и то же время, т.е. и . Если конфликты вершин не разрешены, то и конфликтов ребер не может быть.
  • Последующий конфликт: следующий конфликт возникает, когда на определенном временном шаге агент занимает место, которое было занято другим агентом на предыдущем временном шаге. Математически следующий конфликт описывается как .
  • Конфликт циклов: конфликт циклов возникает всякий раз, когда набор агентов (минимум три) движутся так, как будто они вращаются в цикле. Это означает, что каждый агент занимает позицию, которую ранее занимал другой агент, на шаг вперед в цикле. Если последующие конфликты запрещены, то конфликты циклов не могут произойти.
  • Конфликт обмена: конфликт обмена — это случай, когда два агента обмениваются своими позициями, проходя по одному и тому же ребру одновременно в двух разных направлениях. Это выражается как и .

При формализации задачи MAPF можно решить, какие конфликты разрешены, а какие запрещены. Единого стандарта разрешенных и запрещенных конфликтов не существует, однако конфликты вершин и ребер обычно не допускаются. [1]

Целевые функции [ править ]

При вычислении планов с одним агентом цель состоит в том, чтобы максимизировать целевую функцию, определяемую пользователем. Не существует стандартной целевой функции, однако наиболее распространенными являются: [1]

  • время потока: эта мера получается путем суммирования временных шагов, затраченных каждым агентом для достижения целевого местоположения. Формально оно равно , где планы являются одноагентными планами без коллизий;
  • makepan: количество временных шагов, необходимых для того, чтобы все агенты выполнили свои задачи, определяемые как , где являются частью допустимого решения;
  • максимизация достигнутых целей в заданный срок: цель состоит в том, чтобы найти действенное решение, которое максимизирует количество агентов, достигающих своей цели в заданный срок. [2]

Алгоритмы [ править ]

Для решения проблемы MAPF было предложено несколько алгоритмов. Проблема в том, что NP-трудно найти оптимальные решения по продолжительности изготовления или времени потока. [3] также при рассмотрении плоских графов , [4] или графики, похожие на сетки. [5] Что касается ограниченных субоптимальных решений, показано, что NP-трудно найти оптимальное решение с коэффициентом субоптимальности, меньшим, чем . [6] Оптимальные решатели MAPF возвращают решения высокого качества, но их эффективность низкая. Вместо этого ограниченно-субоптимальные и субоптимальные решатели более эффективны, но их решения менее эффективны. Также машинного обучения . для решения проблемы MAPF были предложены подходы [7]

Приоритетное планирование [ править ]

Одним из возможных подходов к решению вычислительной сложности является планирование по приоритетам. [8] Он заключается в разделении проблемы MAPF на поиска пути с помощью одного агента проблемы .

Первым шагом является присвоение каждому агенту уникального номера. это соответствует приоритету, данному агенту. Затем, следуя порядку приоритетов, для каждого агента рассчитывается план достижения целевого местоположения. При планировании агенты должны избегать столкновений с путями других агентов с более высоким приоритетом, которые уже рассчитали свои планы.

Поиск решения проблемы MAPF в такой постановке соответствует задаче о кратчайшем пути в графе временного расширения. [9] Граф расширения во времени — это график, учитывающий течение времени. Каждый узел состоит из двух записей , где это имя узла и это шаг по времени. Каждый узел связан с узлами такой, что находится рядом с и не занят на временном шаге .

Недостаток приоритетного планирования заключается в том, что, даже если это разумный подход (он возвращает действительные решения), он не является ни оптимальным, ни полным. [10] Это означает, что нет уверенности в том, что алгоритм вернет решение, и даже в этом случае решение может быть неоптимальным.

MAPF Оптимальные решатели

Можно выделить четыре различные категории оптимальных решателей MAPF: [10]

  • Расширения A* : алгоритмы этой категории используют модифицированные версии подхода A* .
  • Поиск в дереве увеличения стоимости: [11] предложена новая формализация задачи MAPF, включающая возрастающее дерево поиска и соответствующий алгоритм. Алгоритм состоит из двух уровней и основан на предположении, что правильное решение проблемы MAPF состоит из набора решений для отдельных агентов.
  • Поиск на основе конфликта: [12] этот алгоритм вычисляет пути, как при решении задач поиска пути с одним агентом, а затем постепенно добавляет ограничения, чтобы избежать коллизий.
  • Программирование ограничений : [13] При таком подходе проблемы MAPF преобразуются в набор ограничений, а затем решаются с использованием конкретных решателей ограничений, таких как SAT и решатели смешанного целочисленного программирования (MIP).

MAPF субоптимальные Ограниченные решатели

Ограниченные субоптимальные алгоритмы предлагают компромисс между оптимальностью и стоимостью решения. Говорят, что они ограничены определенным фактором, поскольку возвращают решения со стоимостью, не превышающей стоимость оптимального решения, умноженную на коэффициент. Субоптимальные решатели, ограниченные MAPF, можно разделить в соответствии с той же категоризацией, что и оптимальные решатели MAPF. [10]

Вариации [ править ]

Способ определения задач MAPF позволяет изменить различные аспекты, например, факт нахождения в среде сетки или предположение о дискретности времени. В этом разделе описаны некоторые варианты классической задачи MAPF.

Анонимный MAPF [ править ]

Это версия MAPF, в которой существует набор целевых местоположений, но агентам не назначается конкретная цель. [14] Неважно, достигнет ли агент цели, важно то, что цели достигнуты. Небольшая модификация этой версии — та, в которой агенты разделены на группы, и каждая группа должна выполнить ряд задач. [15]

прием Мультиагентный и доставка

Проблема MAPF не способна охватить некоторые аспекты реальных приложений. Например, на автоматизированных складах бывает, что роботам приходится выполнять несколько задач одну за другой. По этой причине предлагается расширенная версия MAPF, называемая Multi-Agent Pick-up and Delivery (MAPD). [16] В настройке MAPD агенты должны выполнить поток задач, где каждая задача состоит из места получения и места доставки. При планировании выполнения задачи путь должен начинаться с текущего положения робота и заканчиваться в месте доставки задания, проходя через точку погрузки. MAPD считается «пожизненной» версией MAPF, в которой задачи поступают постепенно. [16]

За пределами классического MAPF [ править ]

Предположения о том, что агенты находятся в сетевой среде, что их скорость постоянна, а время дискретно, являются упрощающими гипотезами. Во многих работах учитываются кинематические ограничения агентов, [17] такие как скорость и ориентация, или выйти за рамки предположения, что веса всех дуг равны 1. [18] Другие работы сосредоточены на исключении предположений о дискретном времени и о том, что продолжительность действий точно равна одному временному шагу. [19] Еще одно предположение, не отражающее реальности, заключается в том, что агенты занимают ровно одну клетку среды, в которой они находятся: были проведены некоторые исследования, направленные на опровержение этой гипотезы. [20] Интересно отметить, что форма и геометрия агентов могут приводить к новым типам конфликтов, поскольку агенты могут взаимодействовать друг с другом, даже если они не полностью перекрываются.

Приложения [ править ]

MAPF может применяться в нескольких реальных сценариях:

  • Автоматизированные склады : складская логистика представляет собой основное промышленное применение MAPF. Показано, что автоматизация складов позволяет повысить уровень производительности. [21]
  • Операции в аэропортах. Алгоритмы MAPF можно использовать в переполненных аэропортах для координации буксирующих транспортных средств, перевозящих самолеты. [22] Возможность оптимизировать такого рода проблемы также приносит пользу окружающей среде.
  • Автономные мобильные сервисные роботы : сервисные роботы — это автоматизированные агенты, выполняющие опасные и повторяющиеся задачи для людей в непромышленной среде. [23] Их главная цель – помощь людям.
  • Видеоигры: полезность MAPF в таких условиях можно обнаружить, когда игроку приходится перемещать команду агентов в перегруженной среде видеоигры. [24]

См. также [ править ]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б с д и ж Стерн, Рони; Стертевант, Натан Р.; Фельнер, Ариэль; Кениг, Свен; Ма, Ханг; Уокер, Тэйн; Ли, Цзяоян; Ацмон, Дор; Коэн, Лирон; Кумар, Т.К. Сатиш; Боярский, Эли; Бартак, Роман (2019). «Многоагентный поиск пути: определения, варианты и контрольные показатели» (PDF) . arXiv : 1906.08291 . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  2. ^ Ма, Ханг; Вагнер, Гленн; Фельнер, Ариэль; Ли, Цзяоян; Кумар, Т.К. Сатиш; Кениг, Свен (2018). «Мультиагентный поиск пути со сроками». arXiv : 1806.04216 [ cs.AI ].
  3. ^ Ю, Цзинджин; ЛаВалль, Стивен М. (2013). «Структура и сложность оптимального планирования пути нескольких роботов на графах» . Материалы конференции AAAI по искусственному интеллекту . Том. 27. стр. 1443–1449. дои : 10.1609/aaai.v27i1.8541 . S2CID   11655439 .
  4. ^ Ю, Цзинджин (январь 2016 г.). «Неразрешимость оптимального планирования пути мультиробота на планарных графах». Письма IEEE по робототехнике и автоматизации . 1 (1): 33–40. arXiv : 1504.02072 . дои : 10.1109/LRA.2015.2503143 . S2CID   10275469 .
  5. ^ Банфи, Якопо; Базилико, Никола; Амигони, Франческо (октябрь 2017 г.). «Неразрешимость оптимального по времени планирования пути мультиробота на двумерных сеточных графах с отверстиями». Письма IEEE по робототехнике и автоматизации . 2 (4): 1941–1947. дои : 10.1109/LRA.2017.2715406 . S2CID   36801258 .
  6. ^ Ма, Ханг; Тови, Крейг; Шарон, Гуни; Кумар, ТК; Кениг, Свен (5 марта 2016 г.). «Мультиагентный поиск пути с передачей полезной нагрузки и проблема маршрутизации роботов обмена пакетами». Материалы конференции AAAI по искусственному интеллекту . Том. 30. дои : 10.1609/aaai.v30i1.10409 . S2CID   1585005 .
  7. ^ Сарторетти, Гийом; Керр, Джастин; Ши, Юнфэй; Вагнер, Гленн; Кумар, Т.К. Сатиш; Кениг, Свен; Чосет, Хоуи (июль 2019 г.). «PRIMAL: поиск пути посредством подкрепления и имитации многоагентного обучения» . Письма IEEE по робототехнике и автоматизации . 4 (3): 2378–2385. arXiv : 1809.03531 . дои : 10.1109/LRA.2019.2903261 . S2CID   52191178 .
  8. ^ Кэп, Михал; Новак, Питер; Кляйнер, Александр; Селецкий, Мартин (июль 2015 г.). «Алгоритмы приоритетного планирования для координации траектории нескольких мобильных роботов» . Транзакции IEEE по автоматизации науки и техники . 12 (3): 835–849. arXiv : 1409.2399 . дои : 10.1109/TASE.2015.2445780 . S2CID   347488 .
  9. ^ Сильвер, Дэвид (2021). «Совместный поиск пути» . Материалы конференции AAAI по искусственному интеллекту и интерактивным цифровым развлечениям . Том. 1. С. 117–122. дои : 10.1609/aiide.v1i1.18726 . S2CID   17714238 .
  10. Перейти обратно: Перейти обратно: а б с Стерн, Рони (2019). «Мультиагентный поиск пути – обзор». Искусственный интеллект . Конспекты лекций по информатике. Том. 11866. стр. 96–115. дои : 10.1007/978-3-030-33274-7_6 . ISBN  978-3-030-33273-0 . S2CID   204832267 .
  11. ^ Шарон, Гуни; Стерн, Рони; Гольденберг, Меир; Фельнер, Ариэль (февраль 2013 г.). «Поиск дерева возрастающих затрат для оптимального многоагентного поиска пути» . Искусственный интеллект . 195 : 470–495. дои : 10.1016/j.artint.2012.11.006 .
  12. ^ Шарон, Гуни; Стерн, Рони; Фельнер, Ариэль; Стертевант, Натан Р. (февраль 2015 г.). «Поиск на основе конфликтов для оптимального многоагентного поиска пути». Искусственный интеллект . 219 : 40–66. дои : 10.1016/j.artint.2014.11.006 . S2CID   3809045 .
  13. ^ Бартак, Роман; Чжоу, Нэн-Фа; Стерн, Рони; Боярский, Эли; Сурынек, Павел (ноябрь 2017 г.). «Моделирование и решение задачи многоагентного поиска пути в Picat». 29-я Международная конференция IEEE по инструментам с искусственным интеллектом (ICTAI) , 2017 г. стр. 959–966. дои : 10.1109/ICTAI.2017.00147 . ISBN  978-1-5386-3876-7 . S2CID   7819470 .
  14. ^ Клодер, С.; Хатчинсон, С. (август 2006 г.). «Планирование пути для инвариантных к перестановкам формирований из нескольких роботов». Транзакции IEEE в робототехнике . 22 (4): 650–665. дои : 10.1109/TRO.2006.878952 . S2CID   62805494 .
  15. ^ Ма, Ханг; Кениг, Свен (2016). «Оптимальное назначение целей и поиск пути для команд агентов». arXiv : 1612.05693 [ cs.AI ].
  16. Перейти обратно: Перейти обратно: а б Ма, Ханг; Ли, Цзяоян; Кумар, Т.К. Сатиш; Кениг, Свен (30 мая 2017 г.). «Пожизненный мультиагентный поиск пути для задач онлайн-забора и доставки». arXiv : 1705.10868 [ cs.AI ].
  17. ^ Хёниг, Вольфганг; Кумар, Т.К. Сатиш; Коэн, Лирон; Ма, Ханг; Сюй, Хун; Аянян, Нора; Кениг, Свен (2016). «Мультиагентный поиск пути с кинематическими ограничениями» . Материалы двадцать шестой Международной совместной конференции по искусственному интеллекту (IJCAI-17) .
  18. ^ Бартак, Роман; Шванцара, Иржи; Влк, Марек (2018). «Подход к многоагентному поиску пути на основе планирования с использованием взвешенных и емкостных дуг» (PDF) . Материалы 17-й Международной конференции по автономным агентам и мультиагентным системам . стр. 748–756.
  19. ^ Андрейчук Антон; Яковлев Константин; Суринек, Павел; Ацмон, Дор; Стерн, Рони (апрель 2022 г.). «Многоагентный поиск пути с непрерывным временем». Искусственный интеллект . 305 : 103662. arXiv : 1901.05506 . дои : 10.1016/j.artint.2022.103662 . S2CID   207791641 .
  20. ^ Ли, Цзяоян; Суринек, Павел; Фельнер, Ариэль; Ма, Ханг; Кумар, Т.К. Сатиш; Кениг, Свен (17 июля 2019 г.). «Мультиагентный поиск пути для крупных агентов». Материалы конференции AAAI по искусственному интеллекту . Том. 33. С. 7627–7634. дои : 10.1609/aaai.v33i01.33017627 . S2CID   53687939 .
  21. ^ Вурман, Питер Р.; Д'Андреа, Рафаэлло; Маунтц, Мик (20 марта 2008 г.). «Координация работы сотен кооперативных автономных транспортных средств на складах». Журнал ИИ . 29 (1): 9. дои : 10.1609/aimag.v29i1.2082 . S2CID   10475273 .
  22. ^ Моррис, Роберт; Пасареану, Корина С. ; Луков, Каспер; Малик, Вакар; Ма, Ханг; Кумар, Т.К. Сатиш; Кениг, Свен (2016). «Планирование, составление графиков и мониторинг наземных операций в аэропорту» . Семинар AAAI: Планирование гибридных систем .
  23. ^ Велосо, Мануэла; Бисвас, Джойдип; Колтин, Брайан; Розенталь, Стефани (2015). «Коботы: надежные симбиотические автономные мобильные сервисные роботы» . IJCAI'15: Материалы 24-й Международной конференции по искусственному интеллекту . стр. 4423–4429. ISBN  978-1-57735-738-4 .
  24. ^ Ма, Ханг; Ян, Цзинсин; Коэн, Лирон; Кумар, Т.К. Сатиш; Кениг, Свен (2017). «Технико-экономическое обоснование: перемещение неоднородных команд в перегруженной среде видеоигр» . Материалы конференции AAAI по искусственному интеллекту и интерактивным цифровым развлечениям . 13 (1): 270–272. arXiv : 1710.01447 . дои : 10.1609/aiide.v13i1.12919 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ac4c4dad3dd9c029ac3fe546c879c416__1719011280
URL1:https://arc.ask3.ru/arc/aa/ac/16/ac4c4dad3dd9c029ac3fe546c879c416.html
Заголовок, (Title) документа по адресу, URL1:
Multi-agent pathfinding - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)