Последовательная эвристика
При изучении задач поиска пути в искусственном интеллекте эвристическая функция называется последовательной или монотонной , если ее оценка всегда меньше или равна предполагаемому расстоянию от любой соседней вершины до цели плюс стоимость достижения тот сосед.
Формально, для каждого узла N и каждого преемника P из N предполагаемая стоимость достижения цели из N не превышает стоимость шага достижения P плюс расчетная стоимость достижения цели из P . То есть:
- и
где
- h — непротиворечивая эвристическая функция
- N — любой узел графа
- P — любой потомок N
- G — любой целевой узел
- c(N,P) — стоимость достижения узла P из N
Неформально, каждый узел i даст оценку, которая с учетом стоимости достижения следующего узла всегда меньше или равна оценке в узле i+1 .
Последовательная эвристика также допустима , т. е. она никогда не переоценивает стоимость достижения цели (обратное , однако, не всегда верно). Предполагая, что ребра неотрицательны, это легко доказать по индукции . [1]
Позволять быть ориентировочной стоимостью целевого узла. Это означает, что базовое условие тривиально истинно при 0 ≤ 0. Поскольку эвристика непротиворечива, путем расширения каждого члена. Указанные сроки равны реальной стоимости, , поэтому любая непротиворечивая эвристика также допустима, поскольку она ограничена истинной стоимостью.
Обратное утверждение явно неверно, поскольку мы всегда можем построить эвристику, которая всегда будет ниже истинной стоимости, но, тем не менее, несовместима, например, увеличивая эвристическую оценку от самого дальнего узла по мере приближения и, когда оценка становится максимум истинной стоимостью , мы делаем .
Последствия монотонности
[ редактировать ]Непротиворечивые эвристики называются монотонными, потому что предполагаемая конечная стоимость частичного решения монотонно не убывает по любому пути, где стоимость лучшего пути от начального узла к . эвристике необходимо и достаточно подчиняться неравенству треугольника . Чтобы быть непротиворечивой, [2]
В алгоритме поиска A* использование последовательной эвристики означает, что после расширения узла стоимость его достижения является минимально возможной при тех же условиях, которые требует алгоритм Дейкстры при решении задачи о кратчайшем пути (отсутствие ребер с отрицательной стоимостью). ). Фактически, если графу поиска задана стоимость для последовательного , то A* эквивалентно поиску по принципу «сначала лучшее» на этом графе с использованием алгоритма Дейкстры. [3] В необычном случае, когда допустимая эвристика не является последовательной, узлу потребуется повторное расширение каждый раз, когда для него будет достигнута новая лучшая (на данный момент) стоимость.
Если данная эвристика допустимо, но несовместимо, можно искусственно заставить эвристические значения на пути быть монотонно неубывающимииспользуя
как эвристическое значение для вместо , где это узел, непосредственно предшествующий на пути и . Эта идея принадлежит Ласло Меро. [4] и теперь известен как pathmax.Вопреки распространенному мнению, pathmax не превращает допустимую эвристику в непротиворечивую эвристику. Например, если A* использует pathmax и эвристику, которая является допустимой, но несогласованной, не гарантируется наличие оптимального пути к узлу при его первом расширении. [5]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Проектирование и понимание эвристики» (PDF) .
- ^ Перл, Иудея (1984). Эвристика: стратегии интеллектуального поиска для решения компьютерных задач . Аддисон-Уэсли. ISBN 0-201-05594-5 .
- ^ Эделькамп, Стефан; Шредль, Стефан (2012). Эвристический поиск: теория и приложения . Морган Кауфманн. ISBN 978-0-12-372512-7 .
- ^ Меро, Ласло (1984). «Алгоритм эвристического поиска с изменяемой оценкой». Искусственный интеллект . 23 : 13–27. дои : 10.1016/0004-3702(84)90003-1 .
- ^ Холте, Роберт (2005). «Распространенные заблуждения относительно эвристического поиска» . Материалы третьего ежегодного симпозиума по комбинаторному поиску (SoCS) . Архивировано из оригинала 01 августа 2022 г. Проверено 10 июля 2019 г.