МИБЕ архитектура
Архитектура MIBE ( Motivated Independent BEhavior ) — это архитектура роботов , основанная на поведении, разработанная в Лаборатории искусственного интеллекта и робототехники Миланского политехнического университета Фабио Ла Дага и Андреа Бонарини в 1998 году. Архитектура MIBE основана на идее анимата и получена из архитектуры подчинения , ранее разработанный Родни Бруксом и его коллегами из Массачусетского технологического института в 1986 году.
Описание
[ редактировать ]Архитектура MIBE основана на предположении, что автономия основана на мотивации и возникает в результате наложения синергетических действий в ответ на многочисленные стимулы . Автономный агент разрабатывается для достижения одной или нескольких целей (первичных целей), но вторичные цели также возникают из-за ограничений окружающей среды и функциональных ограничений. Архитектура MIBE определяет как первичные, так и вторичные цели как потребности . Каждая потребность порождает определенное стремление. Архитектура MIBE генерирует и взвешивает все эти побуждения в явном мотивационном состоянии . Чем выше срочность удовлетворения конкретной потребности, тем выше ее вес в мотивационном состоянии и тем выше стремление к поведению, удовлетворяющему данную потребность.
Отличия от архитектуры включения
[ редактировать ]Архитектура MIBE в основном отличается от архитектуры включения из-за введения мотивационной структуры верхнего уровня , которая определяет приоритеты поведения во время выполнения. То есть между поведенческими модулями нет слоев и статических иерархических зависимостей, а каждое поведение постоянно конкурирует с другими за взятие контроля над агентом через мотивационное состояние верхнего уровня, из которого возникают конкретные побуждения (через заранее определенные или усвоенные с подкреплением функции).
В то время как архитектура включения построена на заранее определенной иерархии поведенческих модулей, архитектура MIBE состоит из более сложной структуры, в которой несколько вариантов поведения (которые всегда конкурируют за контроль над роботом через мотивационное состояние) могут активировать и динамически контролировать адаптивный набор основных модули, называемые способностями . Каждое поведение выполняет свою задачу, активируя и настраивая необходимые ему способности. Способности предоставляют функциональные модули для выполнения определенных действий и могут активировать друг друга в иерархической структуре точно так же, как поведение использует способности. И поведение, и способности реализуются одними и теми же функциональными модулями, но существует фундаментальное различие: поведение — это самоактивирующиеся модули в ответ на состояние робота+окружающая среда, тогда как способности — это просто функциональные блоки , активируемые и контролируемые поведением для выполнения своих задач. (или способностями более высокого уровня, которые уже были активированы поведением). Поведения существуют для удовлетворения конкретных потребностей, тогда как способности не связаны с какой-либо потребностью, поскольку используются моделями поведения для выполнения своих задач, но сами по себе не имеют значения.
Список способностей, необходимых каждому модулю (поведению или способности), представлен его деревом активации ; Полный набор деревьев активации может быть представлен общесистемным ациклическим графом активации .
Поведения активируются на основе их специфического побуждения в мотивационном состоянии во время выполнения: всегда активируется наиболее мотивированное поведение (т. е. наиболее срочное или удобное). Тем не менее, менее мотивированное поведение может даже быть активировано одновременно с ограничением, которое они не могут использовать ни одной из способностей, уже собранных более мотивированным поведением, которое уже действует. Подсистема BCR ( Behavior Conflict Resolver ) гарантирует, что конфликтующее поведение (т. е. совместное использование одной или нескольких способностей в своих деревьях активации) не может быть активным одновременно.
Основным преимуществом архитектуры MIBE является ее высокая модульность и молекулярность : новые возможности и поведение можно легко добавлять, не меняя существующую модульную структуру. Аналогично, поведение можно изменить или удалить без каких-либо функциональных последствий для других модулей. Побуждения могут быть добавлены или удалены из мотивационной структуры или модифицированы без необходимости изменения предыдущей структуры системы, за исключением перебалансировки функций генерации побуждений.
Основной проблемой архитектуры MIBE является сложность моделирования оптимальных границ пространства состояний путем формирования мотивационной структуры (т. е. настройки функций генерации стимулов или алгоритмов их обучения) так, чтобы автономный агент выполнял наилучшее поведение для каждого робота. + состояние среды (однако та же трудность касается и разработки автономных агентов на основе архитектуры включения, хотя статические иерархические зависимости между поведенческими модулями немного облегчают их настройку).
См. также
[ редактировать ]- Архитектура агента
- Робототехника, основанная на поведении
- Когнитивная архитектура
- Эмерджентное поведение
- Иерархическая система управления
- Робототехнические парадигмы
- Скраффи
- Расположен
Ссылки
[ редактировать ]- Ф. Ла Дага, А. Бонарини (1998), «Архитектура поведенческого контроля с мотивационным подходом для автономных агентов», Миланский политехнический университет , факультет электроники и информации (DEI) .
- М. Коломбетти, М. Дориго (1998), «Формирование роботов: эксперимент в области инженерии поведения», серия «Интеллектуальная робототехника и автономные агенты», MIT Press
- Д. МакФарланд, Т. Боссер (1993), «Интеллектуальное поведение животных и роботов», книги MIT Press/Bradford.