Jump to content

Проблема канадского путешественника

В информатике и теории графов проблема канадского путешественника ( CTP ) представляет собой обобщение задачи о кратчайшем пути на графы, которые частично наблюдаемы . Другими словами, «путешественник» в данной точке графа не может видеть весь граф, а только соседние узлы или определенное «ограничение реализации».

Эта задача оптимизации была предложена Кристосом Пападимитриу и Михалисом Яннакакисом в 1989 году, и с тех пор был изучен ряд вариантов этой проблемы. Название предположительно происходит из разговоров авторов, которые узнали о трудностях, с которыми сталкиваются канадские водители: они путешествуют по сети городов, где снегопад беспорядочно блокирует дороги. Стохастическая под версия, где каждое ребро связано с вероятностью независимого нахождения в графе, уделяла значительное внимание в исследовании операций названием «Стохастическая задача кратчайшего пути с обращением» (SSPPR).

Описание проблемы

[ редактировать ]

Для конкретного случая существует ряд возможностей или реализаций того, как может выглядеть скрытый граф. Для данного экземпляра описание того, как лучше всего следовать за ним, называется политикой . Задача CTP — вычислить ожидаемую стоимость оптимальных политик. Вычисление фактического описания оптимальной политики может оказаться более сложной задачей.

Учитывая экземпляр и политику для экземпляра, каждая реализация создает свой собственный (детерминированный) обход графа. Обратите внимание, что обход не обязательно является путем, поскольку лучшей стратегией может быть, например, посещение каждой вершины цикла и возвращение к началу. Это отличается от задачи о кратчайшем пути (со строго положительными весами), где повторения в обходе подразумевают, что существует лучшее решение.

Варианты

[ редактировать ]

В основном существует пять параметров, отличающих количество вариантов проблемы канадского путешественника. Первый параметр – это то, как оценить ход политики для данного экземпляра и реализации. В стохастической задаче о кратчайшем пути с обращением цель состоит в том, чтобы просто минимизировать стоимость обхода (определяемую как сумму по всем ребрам стоимости ребра, умноженную на количество раз, когда это ребро было взято). В задаче канадского путешественника задача состоит в том, чтобы минимизировать конкурентоспособность прогулки; т. е. минимизировать количество раз длиннее произведенного пути к кратчайшему пути в реализации.

Второй параметр заключается в том, как оценивать политику в отношении различных реализаций, соответствующих рассматриваемому случаю. В задаче канадского путешественника желательно изучить наихудший случай , а в SSPPR — средний случай . Кроме того, для анализа среднего случая необходимо указать априорное распределение по реализациям.

Третий параметр ограничен стохастическими версиями и касается того, какие предположения мы можем сделать о распределении реализаций и о том, как это распределение представлено на входе. В стохастической задаче канадского путешественника и в независимой от ребра стохастической задаче о кратчайшем пути (i-SSPPR) каждое неопределенное ребро (или стоимость) имеет связанную с ним вероятность нахождения в реализации, и событие, когда ребро находится в графе, является независимым. из которых остальные ребра находятся в реализации. Несмотря на значительное упрощение, проблема по-прежнему остается #P -сложной. Другой вариант — не делать никаких предположений о распределении, но требовать, чтобы каждая реализация с ненулевой вероятностью была явно указана (например, «Вероятность 0,1 набора ребер { {3,4},{1,2} }, вероятность 0,2 из. .."). Это называется стохастической задачей кратчайшего пути распределения (d-SSPPR или R-SSPPR) и является NP-полной . Первый вариант сложнее второго, поскольку первый может представлять в логарифмическом пространстве некоторые распределения, которые второй представляет в линейном пространстве.

Четвертый и последний параметр — это то, как график меняется со временем. В CTP и SSPPR реализация фиксирована, но неизвестна. В стохастической задаче кратчайшего пути с обращением и сбросами или задаче ожидаемого кратчайшего пути новая реализация выбирается из распределения после каждого шага, предпринятого политикой. Эту проблему можно решить за полиномиальное время, сведя ее к марковскому процессу решения с полиномиальным горизонтом. Известно, что марковское обобщение, при котором реализация графа может влиять на следующую реализацию, гораздо сложнее.

Дополнительным параметром является то, как на реализации открываются новые знания. В традиционных вариантах CTP агент раскрывает точный вес (или статус) ребра при достижении соседней вершины. Недавно был предложен новый вариант, в котором агент также имеет возможность осуществлять дистанционное зондирование из любого места реализации. В этом варианте задача состоит в том, чтобы минимизировать стоимость проезда плюс стоимость операций зондирования.

Формальное определение

[ редактировать ]

Мы определяем вариант, изучаемый в статье 1989 года. То есть цель состоит в том, чтобы минимизировать коэффициент конкуренции в худшем случае. Необходимо начать с введения некоторых терминов.

Рассмотрим данный граф и семейство неориентированных графов, которые можно построить путем добавления одного или нескольких ребер из заданного набора. Формально пусть где мы думаем о E как о ребрах, которые должны быть в графе, а о F как о ребрах, которые могут быть в графе. Мы говорим, что является реализацией семейства графов. Кроме того, пусть W — связанная матрица затрат, где — стоимость перехода от вершины i к вершине j , предполагая, что это ребро находится в реализации.

Для любой вершины v в V мы называем его инцидентные ребра относительно множества ребер B на V . Кроме того, для реализации , позволять — стоимость кратчайшего пути в графе от s до t . Это называется автономной проблемой, потому что алгоритм для такой проблемы будет иметь полную информацию о графе.

Мы говорим, что стратегия для навигации по такому графу требуется отображение из к , где обозначает степеней набор X . Мы определяем стоимость стратегии относительно конкретной реализации следующее.

  • Позволять и .
  • Для , определять
    • ,
    • , и
    • .
  • Если существует T такое, что , затем ; иначе пусть .

Другими словами, мы оцениваем политику на основе ребер, которые, как нам известно, находятся в графе ( ), а известные нам ребра могут находиться в графе ( ). Когда мы делаем шаг в графе, нам становятся известны ребра, инцидентные нашему новому местоположению. Те ребра, которые есть в графе, добавляются к , и независимо от того, есть ребра в графе или нет, они удаляются из множества неизвестных ребер, . Если цель никогда не достигается, мы говорим, что у нас бесконечная стоимость. Если цель достигнута, мы определяем стоимость прогулки как сумму стоимостей всех пройденных ребер с учетом мощности.

Наконец, мы определим проблему канадского путешественника.

Учитывая экземпляр CTP , решить, существует ли политика такой, что для каждой реализации , стоимость политики не более чем в r раз превышает оптимальный офлайн-режим, .

Пападимитриу и Яннакакис отметили, что это определяет игру для двух игроков , в которой игроки соревнуются за стоимость своих путей, а набор ребер выбирается вторым игроком (природой).

Сложность

[ редактировать ]

В исходной статье анализировалась сложность проблемы и сообщалось, что она PSPACE-полна . Было также показано, что поиск оптимального пути в случае, когда каждому ребру соответствует вероятность нахождения в графе (i-SSPPR), является простой для PSPACE, но ♯P -сложной проблемой. [1] Преодоление этого разрыва было открытой проблемой, но с тех пор выяснилось, что как направленная, так и ненаправленная версии являются трудными для PSPACE. [2]

Направленная версия стохастической задачи известна в исследовании операций как стохастическая задача кратчайшего пути с ресурсом.

Приложения

[ редактировать ]

Говорят, что эта проблема находит применение в исследовании операций , транспортном планировании, искусственном интеллекте , машинном обучении , сетях связи и маршрутизации. Исследован вариант задачи для навигации робота с вероятностным распознаванием ориентиров. [3]

Открытые проблемы

[ редактировать ]

Несмотря на возраст проблемы и ее многочисленные потенциальные применения, многие естественные вопросы все еще остаются открытыми. Существует ли аппроксимация с постоянным коэффициентом или проблема APX сложна? Это i-SSPPR #P-полный? Еще более фундаментальный вопрос остался без ответа: существует ли полиномиальное описание оптимальной политики, если оставить на мгновение время, необходимое для вычисления этого описания? [4]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Пападимитриу и Яннакакис, 1989, с. 148
  2. ^ Фрид, Шимони, Бенбассат и Веннер, 2013 г.
  3. ^ Бриггс, Эми Дж.; Детвейлер, Каррик; Шарштейн, Дэниел (2004). «Ожидаемые кратчайшие пути для навигации робота по ориентирам». Международный журнал исследований робототехники . 23 (7–8): 717–718. CiteSeerX   10.1.1.648.3358 . дои : 10.1177/0278364904045467 . S2CID   15681481 .
  4. ^ Каргер и Николова, 2008, с. 1
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 54be82f3daa83b2867af03adbe90d573__1721116860
URL1:https://arc.ask3.ru/arc/aa/54/73/54be82f3daa83b2867af03adbe90d573.html
Заголовок, (Title) документа по адресу, URL1:
Canadian traveller problem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)