Jump to content

ФОРР

FORR (Для правильных причин) — это когнитивная архитектура для обучения и решения проблем, вдохновленная идеями Герберта А. Саймона об ограниченной рациональности и удовлетворении . Впервые он был разработан в начале 1990-х годов в Городском университете Нью-Йорка . Он использовался в играх , поиске пути роботов, проектировании парков отдыха, системах разговорного диалога и решении NP-жестких задач удовлетворения ограничений , и он достаточно общий для многих приложений по решению проблем.

Ограниченная рациональность

[ редактировать ]

FORR не обладает совершенными знаниями о том, как решить проблему, а вместо этого учится на опыте. Интеллектуальные агенты не являются оптимальными, но принимают решения, основываясь только на подмножестве всех возможных веских причин и информативных данных. Этих агентов все еще можно считать рациональными. Идея ограниченной рациональности была введена Гербертом А. Саймоном . [1] который вместе с Алленом Ньюэллом разработал ранние основы изучения когнитивных архитектур, а также вдохновил на создание таких ранних архитектур, как Soar и ACT-R .

Несколько веских причин

[ редактировать ]

FORR основан на идее о том, что существует множество причин или обоснований для выполнения действий при решении проблемы. Эти причины могут быть всегда правильными (в шахматах всегда правильно сделать ход, который поставит противнику мат) или просто иногда правильными. Всегда правые причины составляют меньшинство. Иногда правильные причины могут конкурировать друг с другом: например, в игре одной веской причиной может быть захват фигур, а другой — контроль над некоторой областью доски. В ФОРР эти конкурирующие причины называются Советниками.

Многоуровневая система советников является достаточно общей, поэтому может быть реализована любая потенциально веская причина, например, вероятностная , дедуктивная или перцептивная , при условии, что она дает совет относительно предпочтения одного действия другому.

Поскольку FORR опирается на набор независимых агентов (советников), FORR можно считать коннекционистской архитектурой.

Архитектура

[ редактировать ]

Архитектура FORR состоит из трех компонентов: набора описаний , описывающих состояние проблемы, многоуровневого набора советников , с которыми консультируются, чтобы решить, какое действие выполнить, и поведенческого сценария , который опрашивает советников и выполняет действие, которое они выполняют. предлагать. [2]


Советники

[ редактировать ]

Советники — это набор обоснований или эвристик для принятия решения. Их можно считать компонентом процедурной памяти архитектуры. При каждом новом решении советники опрашиваются, чтобы решить, какое действие выполнить. Консультанты никогда не общаются друг с другом и не учатся самостоятельно: они просто запрашивают информацию о состоянии проблемы, хранящуюся в виде описаний, и на основе этой информации делают предложение. Советники разделены на три уровня, которые запрашиваются в следующем порядке:

  • Уровень 1: эти Советники всегда правы. Если они предлагают действие, это действие выполняется немедленно, и запрос завершается. Если они запрещают действие, то это действие снимается с рассмотрения. В противном случае перейдите на следующий уровень.
  • один из этих Советников Уровень 2: если срабатывает , он предлагает подзадачу или упорядоченный набор действий, достигающих подцели в решении общей проблемы (например, обход одного препятствия в лабиринте). Если советник второго уровня не активируется, перейдите к последнему уровню.
  • Уровень 3: это все остальные обоснования. Они не всегда правы, но конкурируют друг с другом. Они голосуют за действие, и предложение, получившее наибольшее количество голосов, выполняется. Различные классы проблем в одной и той же области будут иметь разные веса для одних и тех же советников, а веса разрабатываются на основе опыта с помощью алгоритмов обучения .

Описания

[ редактировать ]

Декларативный компонент памяти архитектуры, описательные описания представляют состояние проблемы и доступны любому советнику.

Поведенческий сценарий

[ редактировать ]

Поведенческий сценарий последовательно запрашивает каждый уровень советников. Если советник уровня 1 предлагает действие, сценарий выполняет это действие. В противном случае, если срабатывает советник уровня 2, это означает, что возникла подпроблема. Советник уровня 1 гарантирует, что в любой момент времени активен только один советник уровня 2. Если нет комментариев советника уровня 1 и советник уровня 2 не активируется, поведенческий сценарий запрашивает предложения или комментарии от всех советников уровня 3 и позволяет им проголосовать. Скрипт выполняет действие, получившее наибольшее количество голосов среди всех советников 3-го уровня.

Реализация архитектуры FORR

[ редактировать ]

Проблемная область — это набор схожих проблем, называемых классами проблем. Если проблемная область — это игра в простые настольные игры, то «крестики-нолики» являются проблемным классом, а одна конкретная игра «крестики-нолики» — экземпляром проблемы. Если навигация по лабиринту является проблемной областью, то конкретный лабиринт является классом, а одна попытка навигации по нему — экземпляром. После того как проблемная область определена, реализация архитектуры FORR для этой области состоит из двух основных этапов: поиск возможных правильных причин (советников) и изучение их весов для конкретного класса.

Как построить архитектуру FORR

[ редактировать ]
  1. Определитесь с проблемной областью.
  2. Используйте знания предметной области, обзоры литературы, интуицию и здравый смысл, чтобы составить список возможных обоснований принятия решения, которое может быть хорошим или плохим для разных классов в предметной области. Эти обоснования являются Советниками.
  3. Разделите советников на уровни:
    1. Советники, которые всегда правы, находятся на уровне 1. Например, в настольной игре всегда правильно сделать выигрышный ход.
    2. Советники, которые определяют подзадачу, переходят на уровень 2. Например, обход стены в лабиринте.
    3. Все остальные советники относятся к 3-му уровню.
  4. Кодируйте советников. Каждый советник возвращает набор предлагаемых действий вместе с весами для каждого предлагаемого действия. Первоначально веса имеют одинаковое значение, например 0,05.
  5. Определите всю информацию о состоянии проблемы, необходимую всем консультантам. Это описания. Закодируйте их.
  6. Напишите поведенческий сценарий, который опрашивает советников и выполняет предлагаемые ими действия.
  7. Изучите веса советников в наборе конкретных экземпляров проблем на этапе обучения , используя алгоритм обучения с подкреплением .
  8. Протестируйте архитектуру на наборе ранее не встречавшихся экземпляров проблем.

Веса советника по обучению

[ редактировать ]

Советники одинаковы для всех классов проблем в домене, но веса могут быть разными для каждого класса в домене. Важные эвристики для игры в крестики-нолики могут оказаться неважными для другой настольной игры. FORR изучает веса своих советников 3-го уровня на основе опыта. Веса советников, предлагающих действие, приводящее к неудаче, наказываются, а веса советников, чьи предложения приводят к успеху, увеличиваются. Алгоритмы обучения различаются в зависимости от реализации.

Приложения

[ редактировать ]

FORR использовался для игр, поиска пути роботами, решения задач удовлетворения ограничений , проектирования парков и систем разговорного диалога . [3] [4]

См. также

[ редактировать ]
  1. ^ Саймон, HA (1981) Науки об искусственном
  2. ^ Эпштейн (1992) Извлечение выгоды из конфликта: архитектура FORR
  3. ^ Примеры приложений см. на домашней странице FORR.
  4. ^ Информацию об использовании FORR в голосовых диалоговых системах см. в FORRSooth в проекте Loqui. Архивировано 17 июля 2015 г. на Wayback Machine.
Примечания
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d8c2d5d8367ec3bddf5d622bc66aa062__1711604700
URL1:https://arc.ask3.ru/arc/aa/d8/62/d8c2d5d8367ec3bddf5d622bc66aa062.html
Заголовок, (Title) документа по адресу, URL1:
FORR - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)