ФОРР
FORR (Для правильных причин) — это когнитивная архитектура для обучения и решения проблем, вдохновленная идеями Герберта А. Саймона об ограниченной рациональности и удовлетворении . Впервые он был разработан в начале 1990-х годов в Городском университете Нью-Йорка . Он использовался в играх , поиске пути роботов, проектировании парков отдыха, системах разговорного диалога и решении NP-жестких задач удовлетворения ограничений , и он достаточно общий для многих приложений по решению проблем.
Фон
[ редактировать ]Ограниченная рациональность
[ редактировать ]FORR не обладает совершенными знаниями о том, как решить проблему, а вместо этого учится на опыте. Интеллектуальные агенты не являются оптимальными, но принимают решения, основываясь только на подмножестве всех возможных веских причин и информативных данных. Этих агентов все еще можно считать рациональными. Идея ограниченной рациональности была введена Гербертом А. Саймоном . [1] который вместе с Алленом Ньюэллом разработал ранние основы изучения когнитивных архитектур, а также вдохновил на создание таких ранних архитектур, как Soar и ACT-R .
Несколько веских причин
[ редактировать ]FORR основан на идее о том, что существует множество причин или обоснований для выполнения действий при решении проблемы. Эти причины могут быть всегда правильными (в шахматах всегда правильно сделать ход, который поставит противнику мат) или просто иногда правильными. Всегда правые причины составляют меньшинство. Иногда правильные причины могут конкурировать друг с другом: например, в игре одной веской причиной может быть захват фигур, а другой — контроль над некоторой областью доски. В ФОРР эти конкурирующие причины называются Советниками.
Многоуровневая система советников является достаточно общей, поэтому может быть реализована любая потенциально веская причина, например, вероятностная , дедуктивная или перцептивная , при условии, что она дает совет относительно предпочтения одного действия другому.
Поскольку FORR опирается на набор независимых агентов (советников), FORR можно считать коннекционистской архитектурой.
Архитектура
[ редактировать ]Архитектура FORR состоит из трех компонентов: набора описаний , описывающих состояние проблемы, многоуровневого набора советников , с которыми консультируются, чтобы решить, какое действие выполнить, и поведенческого сценария , который опрашивает советников и выполняет действие, которое они выполняют. предлагать. [2]
Советники
[ редактировать ]Советники — это набор обоснований или эвристик для принятия решения. Их можно считать компонентом процедурной памяти архитектуры. При каждом новом решении советники опрашиваются, чтобы решить, какое действие выполнить. Консультанты никогда не общаются друг с другом и не учатся самостоятельно: они просто запрашивают информацию о состоянии проблемы, хранящуюся в виде описаний, и на основе этой информации делают предложение. Советники разделены на три уровня, которые запрашиваются в следующем порядке:
- Уровень 1: эти Советники всегда правы. Если они предлагают действие, это действие выполняется немедленно, и запрос завершается. Если они запрещают действие, то это действие снимается с рассмотрения. В противном случае перейдите на следующий уровень.
- один из этих Советников Уровень 2: если срабатывает , он предлагает подзадачу или упорядоченный набор действий, достигающих подцели в решении общей проблемы (например, обход одного препятствия в лабиринте). Если советник второго уровня не активируется, перейдите к последнему уровню.
- Уровень 3: это все остальные обоснования. Они не всегда правы, но конкурируют друг с другом. Они голосуют за действие, и предложение, получившее наибольшее количество голосов, выполняется. Различные классы проблем в одной и той же области будут иметь разные веса для одних и тех же советников, а веса разрабатываются на основе опыта с помощью алгоритмов обучения .
Описания
[ редактировать ]Декларативный компонент памяти архитектуры, описательные описания представляют состояние проблемы и доступны любому советнику.
Поведенческий сценарий
[ редактировать ]Поведенческий сценарий последовательно запрашивает каждый уровень советников. Если советник уровня 1 предлагает действие, сценарий выполняет это действие. В противном случае, если срабатывает советник уровня 2, это означает, что возникла подпроблема. Советник уровня 1 гарантирует, что в любой момент времени активен только один советник уровня 2. Если нет комментариев советника уровня 1 и советник уровня 2 не активируется, поведенческий сценарий запрашивает предложения или комментарии от всех советников уровня 3 и позволяет им проголосовать. Скрипт выполняет действие, получившее наибольшее количество голосов среди всех советников 3-го уровня.
Реализация архитектуры FORR
[ редактировать ]Проблемная область — это набор схожих проблем, называемых классами проблем. Если проблемная область — это игра в простые настольные игры, то «крестики-нолики» являются проблемным классом, а одна конкретная игра «крестики-нолики» — экземпляром проблемы. Если навигация по лабиринту является проблемной областью, то конкретный лабиринт является классом, а одна попытка навигации по нему — экземпляром. После того как проблемная область определена, реализация архитектуры FORR для этой области состоит из двух основных этапов: поиск возможных правильных причин (советников) и изучение их весов для конкретного класса.
Как построить архитектуру FORR
[ редактировать ]- Определитесь с проблемной областью.
- Используйте знания предметной области, обзоры литературы, интуицию и здравый смысл, чтобы составить список возможных обоснований принятия решения, которое может быть хорошим или плохим для разных классов в предметной области. Эти обоснования являются Советниками.
- Разделите советников на уровни:
- Советники, которые всегда правы, находятся на уровне 1. Например, в настольной игре всегда правильно сделать выигрышный ход.
- Советники, которые определяют подзадачу, переходят на уровень 2. Например, обход стены в лабиринте.
- Все остальные советники относятся к 3-му уровню.
- Кодируйте советников. Каждый советник возвращает набор предлагаемых действий вместе с весами для каждого предлагаемого действия. Первоначально веса имеют одинаковое значение, например 0,05.
- Определите всю информацию о состоянии проблемы, необходимую всем консультантам. Это описания. Закодируйте их.
- Напишите поведенческий сценарий, который опрашивает советников и выполняет предлагаемые ими действия.
- Изучите веса советников в наборе конкретных экземпляров проблем на этапе обучения , используя алгоритм обучения с подкреплением .
- Протестируйте архитектуру на наборе ранее не встречавшихся экземпляров проблем.
Веса советника по обучению
[ редактировать ]Советники одинаковы для всех классов проблем в домене, но веса могут быть разными для каждого класса в домене. Важные эвристики для игры в крестики-нолики могут оказаться неважными для другой настольной игры. FORR изучает веса своих советников 3-го уровня на основе опыта. Веса советников, предлагающих действие, приводящее к неудаче, наказываются, а веса советников, чьи предложения приводят к успеху, увеличиваются. Алгоритмы обучения различаются в зависимости от реализации.
Приложения
[ редактировать ]FORR использовался для игр, поиска пути роботами, решения задач удовлетворения ограничений , проектирования парков и систем разговорного диалога . [3] [4]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Саймон, HA (1981) Науки об искусственном
- ^ Эпштейн (1992) Извлечение выгоды из конфликта: архитектура FORR
- ^ Примеры приложений см. на домашней странице FORR.
- ^ Информацию об использовании FORR в голосовых диалоговых системах см. в FORRSooth в проекте Loqui. Архивировано 17 июля 2015 г. на Wayback Machine.
- Примечания
- Эпштейн, С.Л. (1994) По правильным причинам: архитектура FORR для обучения в области навыков
- Эпштейн С.Л. и Петрович С. (2008) Опыт обучения с ограниченной рациональностью и самосознанием
- Лэнгли П., Лэрд Дж. Э. и Роджерс С. (2009) Когнитивные архитектуры: проблемы и проблемы исследования.
Внешние ссылки
[ редактировать ]- Домашняя страница ФОР
- Сравнительный репозиторий когнитивных архитектур BICA. Архивировано 9 ноября 2020 г. в Wayback Machine.
- Проект Loqui. Архивировано 17 июля 2015 г. на Wayback Machine.