Реактивное планирование

В искусственном интеллекте реактивное планирование обозначает группу методов выбора действий агентами автономными . Эти методы отличаются от классического планирования в двух аспектах. Во-первых, они действуют своевременно и, следовательно, могут справляться с очень динамичными и непредсказуемыми условиями . Во-вторых, они вычисляют только одно следующее действие в каждый момент времени, исходя из текущего контекста. Реактивные планировщики часто (но не всегда) используют реактивные планы , которые представляют собой хранимые структуры, описывающие приоритеты и поведение агента. Термин «реактивное планирование» появился как минимум в 1988 году и является синонимом более современного термина « динамическое планирование» .

Реактивное представление плана [ править ]

Существует несколько способов представления реактивного плана. Все они требуют базовой репрезентативной единицы и средств для составления этих единиц в планы.

Правила условие-действие (постановки) [ править ]

Правило действия условия, или правило «если-то», — это правило в форме: если условие, то действие . Эти правила называются продукцией . Смысл правила следующий: если условие выполнено, выполнить действие. Действие может быть как внешним (например, взять что-то и переместить), так и внутренним (например, записать факт во внутреннюю память или оценить новый набор правил). Условия обычно являются логическими, и действие либо может быть выполнено, либо нет.

Производственные правила могут быть организованы в относительно плоские структуры, но чаще всего они организованы в иерархию некоторую . Например, архитектура включения состоит из слоев взаимосвязанных поведений , каждый из которых фактически представляет собой конечный автомат , который действует в ответ на соответствующий входной сигнал. Затем эти уровни организуются в простую стопку, при этом более высокие уровни включают в себя цели нижних. Другие системы могут использовать деревья или могут включать специальные механизмы для изменения того, какое подмножество целей/правил в данный момент является наиболее важным. Плоские структуры относительно легко построить, но они позволяют описать только простое поведение или требуют чрезвычайно сложных условий для компенсации отсутствия структуры.

Важной частью любых алгоритмов выбора распределенных действий является механизм разрешения конфликтов. Это механизм разрешения конфликтов между предлагаемыми действиями, когда в данный момент выполняется более одного условия правил. Конфликт можно решить, например,

заранее назначая фиксированные приоритеты правилам,
назначение предпочтений (например, в архитектуре Soar ),
изучение относительных полезностей между правилами (например, в ACT-R ),
используя форму планирования .

Экспертные системы часто используют другие, более простые эвристики, такие как актуальность, для выбора правил, но трудно гарантировать хорошее поведение в большой системе с помощью простых подходов.

Разрешение конфликтов необходимо только для правил, которые хотят предпринимать взаимоисключающие действия (см. Blumberg 1996).

Некоторые ограничения такого рода реактивного планирования можно найти у Брома (2005).

Конечные автоматы [ править ]

Конечный автомат (КАМ) – это модель поведения системы. Конечные автоматы широко используются в информатике. Моделирование поведения агентов — лишь одно из возможных их применений.Типичный автомат, используемый для описания поведения агента, состоит из набора состояний и переходов между этими состояниями. Переходы на самом деле представляют собой правила действия условий. В каждый момент времени активно только одно состояние автомата, и оцениваются его переходы. Если переход выполнен, он активирует другое состояние. Это означает, что в целом переходы — это правила в следующей форме: если условие , то активировать-новое-состояние . Но в некоторых системах переходы также могут подключаться к состоянию «я», что позволяет выполнять действия перехода без фактического изменения состояния.

Есть два способа создания поведения с помощью автомата. Они зависят от того, что разработчик связывает с состояниями — это могут быть либо «действия», либо сценарии. «Действие» — это атомарное действие, которое должно быть выполнено агентом, если его автомат находится в заданном состоянии. Затем это действие выполняется на каждом временном шаге. Однако чаще бывает последний случай. Здесь каждому состоянию соответствует сценарий, описывающий последовательность действий, которые должен выполнить агент, если его автомат находится в заданном состоянии. Если переход активирует новое состояние, предыдущий сценарий просто прерывается и запускается новый.

Если сценарий более сложный, его можно разбить на несколько сценариев и использовать иерархический автомат. В таком автомате каждое состояние может содержать подсостояния. Только состояния на атомарном уровне связаны со сценарием (что несложно) или атомарным действием.

В вычислительном отношении иерархические автоматы эквивалентны автоматам. Это означает, что каждый иерархический автомат можно преобразовать в классический автомат. Однако иерархические подходы облегчают проектирование лучше.См. статью Дамиана Исла (2005), где приведен пример ASM ботов для компьютерных игр , в котором используются иерархические автоматы.

Нечеткие подходы [ править ]

И правила «если-то», и автоматы можно комбинировать с нечеткой логикой . Условия, состояния и действия больше не являются логическими или «да/нет» соответственно, а являются приблизительными и плавными. Следовательно, результирующее поведение будет более плавным, особенно в случае переходов между двумя задачами. Однако оценка нечетких условий происходит намного медленнее, чем оценка их четких аналогов.

Посмотрите архитектуру Алекса Шампандара .

коннекционистов Подходы

Реактивные планы могут быть также выражены с помощью коннекционистских сетей, таких как искусственные нейронные сети или свободнотекущие иерархии. Базовая репрезентативная единица — это единица с несколькими входными ссылками, которые снабжают единицу «абстрактной деятельностью», и выходными ссылками, которые распространяют активность на следующие единицы. Каждый блок сам по себе работает как датчик активности. Обычно блоки соединяются в многоуровневую структуру.

Положительные стороны коннекционистских сетей заключаются, во-первых, в том, что результирующее поведение является более плавным, чем поведение, создаваемое четкими правилами «если-то» и автоматами; во-вторых, сети часто являются адаптивными; в-третьих, можно использовать механизм торможения и, следовательно, поведение можно также описывается предписанно (посредством правил можно описать поведение только предписывающе). Однако методы имеют и ряд недостатков. Во-первых, дизайнеру гораздо сложнее описать поведение сети по сравнению с правилами «если-то». Во-вторых, можно описать только относительно простое поведение, особенно если предполагается использовать адаптивные свойства.

планирования реактивного Алгоритмы

Типичный алгоритм реактивного планирования просто оценивает правила «если-то» или вычисляет состояние коннекционистской сети. Однако некоторые алгоритмы имеют особенности.

Повторная оценка : при правильном логическом представлении (которое подходит только для четких правил) правила не нужно переоценивать на каждом временном шаге. Вместо этого можно использовать форму кэша, в котором хранится оценка предыдущего шага.
Языки сценариев: иногда правила или автоматы являются непосредственно примитивами архитектуры (например, в Soar ). Но чаще реактивные планы программируются на скриптовом языке , где правила — лишь один из примитивов (как в JAM или ABL).

Рулевое управление [ править ]

Управление — это особый реактивный метод, используемый при навигации агентов. Самая простая форма реактивного рулевого управления используется в транспортных средствах Брайтенберга , которые сопоставляют входные сигналы датчиков непосредственно с выходными сигналами эффекторов и могут следовать за ними или избегать их. Более сложные системы основаны на суперпозиции сил притяжения или отталкивания, действующих на агента. Этот тип рулевого управления основан на оригинальной работе о боидах Крейга Рейнольдса .С помощью рулевого управления можно добиться простой формы:

к цели, навигация
при избегании препятствий поведение
стена, следующая за поведением
враг приближается
избегание хищников
поведение толпы

Преимущество рулевого управления в том, что оно очень эффективно в вычислительном отношении. В компьютерных играх сотнями NPC с помощью этой техники можно управлять . Однако в случаях более сложной местности (например, здания) рулевое управление должно сочетаться с поиском пути (как, например, в Милани [1] ), что является формой планирования .

См. также [ править ]

ИИ, основанный на поведении

Ссылки [ править ]

Блумберг Б.: Старые трюки, новые собаки: этология и интерактивные существа . Кандидатская диссертация, Массачусетский технологический институт (1996).
Бром К.: Иерархическое реактивное планирование: где его предел? В кн.: Материалы семинара МНАС. Эдинбург, Шотландия (2005)
Брайсон, Дж.: Интеллект по дизайну: принципы модульности и координации для инженерных сложных адаптивных агентов . Кандидатская диссертация, Массачусетский технологический институт (2001 г.).
Шампандар, А.Дж.: Разработка игр с использованием искусственного интеллекта: синтетические существа с обучением и реактивным поведением . Нью-Райдерс, США (2003)
Гранд С., Клифф Д., Малхотра А.: Существа: искусственная жизнь, автономные программные агенты для домашних развлечений . В: Джонсон, У.Л. (ред.): Материалы Первой международной конференции по автономным агентам. АКМ пресс (1997) 22-29
Хубер, М.Дж.: JAM: архитектура мобильного агента на основе BDI . В: Материалы Третьей Международной конференции по автономным агентам (Агенты'99). Сиэтл (1999) 236–243
Исла, Д.: Управление сложностью в Halo 2 . В: Гамастура онлайн, 11.03 (2005).
Милани А., Поджиони В. Планирование в реактивной среде . В Computational Intelligence, 23(4), 439–463, Blackwell-Wiley, (2005) [2]
Рейнольдс, К.В. Стаи, стада и школы: распределенная поведенческая модель . В: Компьютерная графика, 21 (4) (Материалы конференции SIGGRAPH '87) (1987) 25-34.
де Севин, Э. Тельманн, Д.: Мотивационная модель выбора действий для виртуальных людей . В: Computer Graphics International (CGI), IEEE Computer SocietyPress, Нью-Йорк (2005).
Продукт Softimage/Behavior . Компания Avid Technology Inc.
Тиррелл, Т.: Вычислительные механизмы выбора действий . доктор философии Диссертация. Центр когнитивных наук, Эдинбургский университет (1993)
ван Ваверен, JMP: Бот Quake III Arena. Магистерская диссертация. Факультет информационных технологий Делфтского технологического университета (2001 г.)
Вулдридж, М. Введение в мультиагентные системы . Джон Уайли и сыновья (2009)
Погамут2 . Платформа для быстрого прототипирования агентов в Unreal Tournament 2004 с использованием POSH — реактивного планировщика, спроектированного и разработанного Джей Джей Брайсоном.
[3] . Уортэм, Р.Х., Годл, С.Э. и Брайсон, Дж.Дж., Инстинкт: биологически вдохновленный реактивный планировщик для интеллектуальных встраиваемых систем, В книге: Исследования когнитивных систем. (2018)

Внешние ссылки [ править ]

Creatures — реализация реактивного планирования Гранда и др.