Теория адаптивного резонанса термоядерного синтеза
Эта статья может быть слишком технической для понимания большинства читателей . ( Ноябрь 2020 г. ) |
Теория адаптивного резонанса синтеза (fusion ART) [1] [2] это обобщение самоорганизующихся нейронных сетей, известное как оригинальная теория адаптивного резонанса. [3] модели для изучения категорий распознавания по нескольким каналам шаблонов. Есть отдельное направление работ по слиянию ARTMAP, [4] [5] который расширяет нечеткий ARTMAP, состоящий из двух нечетких модулей ART, соединенных полем карты между ART, до расширенной архитектуры, состоящей из нескольких модулей ART.
Fusion ART объединяет ряд конструкций нейронных моделей и поддерживает множество парадигм обучения, в частности обучение без учителя , обучение с учителем, обучение с подкреплением , мультимодальное обучение и последовательное обучение. Кроме того, были разработаны различные расширения для знаний предметной области , интеграции [6] представление памяти, [7] [8] и моделирование высокого уровня познания.
Обзор
[ редактировать ]Fusion ART является естественным продолжением оригинальной теории адаптивного резонанса (ART). [3] [9] модели, разработанные Стивеном Гроссбергом и Гейл А. Карпентер, от одного поля шаблонов до нескольких каналов шаблонов. В то время как исходные модели ART выполняют неконтролируемое обучение узлов распознавания в ответ на входящие входные шаблоны, fusion ART изучает многоканальные сопоставления одновременно по каналам мультимодальных шаблонов в режиме онлайн и постепенно .
Модель обучения
[ редактировать ]Fusion ART использует многоканальную архитектуру (как показано ниже), включающую поле категории. подключен к фиксированному количеству ( K ) каналов шаблонов или полей ввода через двунаправленные условные пути. Модель объединяет ряд сетевых проектов, в первую очередь теорию адаптивного резонанса (ART) и ассоциативную карту адаптивного резонанса (ARAM). [10] и Fusion Architecture for Learning and CogNition (FALCON), [11] Разработанный за последние десятилетия для широкого спектра функций и приложений.
Учитывая набор мультимодальных шаблонов, каждый из которых представлен в канале шаблона, цикл кодирования шаблона Fusion ART включает пять ключевых этапов, а именно активацию кода, конкуренцию кода, считывание активности, сопоставление шаблона и обучение шаблону, как описано ниже.
- Активация кода: Учитывая входные векторы активности , по одному для каждого поля ввода , функция выбора каждого узел j вычисляется на основе совокупного общего сходства между входными шаблонами и соответствующими весовыми векторами. .
- Конкуренция кодов. Далее следует процесс конкуренции кодов, в ходе которого идентифицируется узел с наибольшим значением функции выбора. Победителю присваивается индекс J , где является максимальным среди всех узлы. Это указывает на стратегию «победитель получает все».
- Считывание действий: Во время вызова памяти выбранный узел J выполняет считывание своих весовых векторов во входные поля .
- Сопоставление шаблонов: прежде чем показания активности стабилизируются и узел J можно будет использовать для обучения, процесс сопоставления шаблонов проверяет, что шаблоны весов узла J достаточно близки к соответствующим входным шаблонам. В частности, резонанс возникает, если для каждого канала k функция соответствия выбранного узла J соответствует его критерию бдительности. При нарушении любого из ограничений бдительности происходит сброс несоответствия, при котором значение функции выбора устанавливается на 0 на время представления входного сигнала. Используя процесс отслеживания совпадений , в начале каждого входного представления параметр бдительности в каждом канале ck равен базовому уровню бдительности. Когда происходит сброс несоответствия, бдительность всех каналов шаблона увеличивается одновременно до тех пор, пока один из них не станет немного больше, чем соответствующая ему функция сопоставления, что приведет к сбросу. Затем процесс поиска выбирает другой узел J по пересмотренному критерию бдительности до тех пор, пока не будет достигнут резонанс.
- Обучение по шаблону: как только возникает резонанс, для каждого канала ck весовой вектор модифицируется в соответствии с правилом обучения, которое приближает его к входному шаблону. Когда незафиксированный узел выбирается для обучения, он становится зафиксированным , и в список добавляется новый незафиксированный узел. поле. Таким образом, Fusion ART динамически расширяет свою сетевую архитектуру в ответ на входные шаблоны.
Виды слияния ВРТ
[ редактировать ]Описанная выше сетевая динамика может использоваться для поддержки многочисленных операций обучения. В последующих разделах мы покажем, как fusion ART можно использовать для решения множества традиционно различных учебных задач.
Оригинальные модели АРТ
[ редактировать ]Благодаря одному каналу шаблона архитектура Fusion ART сводится к исходной модели ART. Используя выбранное значение бдительности ρ, модель ART непрерывно изучает набор узлов распознавания в ответ на входящий поток входных шаблонов. Каждый узел распознавания в Поле учится кодировать шаблон шаблона, представляющий ключевые характеристики набора шаблонов. ART широко использовался в контексте обучения без учителя для обнаружения группировок шаблонов.
Ассоциативная карта адаптивного резонанса
[ редактировать ]Синхронизируя кодирование шаблонов по нескольким каналам шаблонов, fusion ART учится кодировать ассоциативные отображения в различных пространствах шаблонов. Конкретный пример слияния ART с двумя каналами шаблонов известен как адаптивная резонансная ассоциативная карта (ARAM), которая изучает многомерные контролируемые отображения из одного пространства шаблонов в другое пространство шаблонов. Система ARAM состоит из поля ввода , поле вывода и поле категории . Учитывая набор векторов признаков, представленных на с соответствующими векторами классов, представленными на , ARAM изучает прогнозирующую модель (закодированную узлами распознавания в ), который связывает комбинации ключевых функций с соответствующими классами.
Fuzzy ARAM, основанный на нечетких операциях ART, успешно применяется для решения многочисленных задач машинного обучения, включая составление личных профилей, [12] классификация документов, [13] персонализированное управление контентом, [14] и ДНК . анализ экспрессии генов [15] Во многих тестовых экспериментах ARAM продемонстрировала производительность прогнозирования, превосходящую показатели многих современных систем машинного обучения, включая C4.5, нейронную сеть обратного распространения ошибки, K Nearest Neighbor и машины опорных векторов .
Fusion ART со знанием предметной области
[ редактировать ]В ходе обучения fusion ART формулирует категории распознавания шаблонов ввода по нескольким каналам. Знания, которые Fusion ART обнаруживает во время обучения, совместимы с символическим представлением, основанным на правилах. В частности, категории распознавания, изученные Узлы категорий совместимы с классом правил ЕСЛИ-ТО, который отображает набор входных атрибутов (антецедентов) в одном канале шаблона в непересекающийся набор выходных атрибутов ( консеквентов ) в другом канале. Благодаря этой совместимости на любом этапе поэтапного процесса обучения инструкции в форме правил ЕСЛИ-ТО могут быть легко переведены в категории распознавания системы Fusion ART. Правила являются конъюнктивными в том смысле, что атрибуты в предложениях IF и THEN имеют отношение AND . Дополнение сети Fusion ART знаниями предметной области посредством Явные инструкции способствуют повышению эффективности обучения и точности прогнозирования.
Стратегия вставки правил fusion ART аналогична стратегии, используемой в Cascade ARTMAP, обобщении ARTMAP, которое выполняет вставку, уточнение и извлечение знаний предметной области. [16] Для прямой вставки знаний предложения IF и THEN каждой инструкции (правила) преобразуются в пару векторов A и B соответственно. Полученные пары векторов затем используются в качестве обучающих шаблонов для включения в сеть Fusion ART. Во время вставки правила параметры бдительности устанавливаются на 1 с, чтобы гарантировать, что каждое отдельное правило кодируется одним узлом категории.
Архитектура Fusion для обучения и познания (FALCON)
[ редактировать ]Обучение с подкреплением — это парадигма, в которой автономная система учится корректировать свое поведение на основе сигналов подкрепления, полученных из окружающей среды. Экземпляр fusion ART, известный как FALCON (архитектура fusion для обучения и познания), изучает сопоставления одновременно по мультимодальным шаблонам ввода, включающим состояния, действия и вознаграждения, в онлайновом и поэтапном режиме . По сравнению с другими системами обучения с подкреплением на основе ART, FALCON представляет собой поистине интегрированное решение в том смысле, что отсутствует реализация отдельного модуля обучения с подкреплением или таблицы Q-значений . Используя конкурентное кодирование в качестве основного принципа вычислений, сетевая динамика включает в себя несколько обучающих программ. парадигмы, включая обучение без учителя, обучение с учителем, а также обучение с подкреплением.
FALCON использует трехканальную архитектуру, включающую поле категории. и три поля шаблонов, а именно сенсорное поле для представления текущих состояний — двигательное поле для представления действий и поле обратной связи для представления значений вознаграждения. Класс сетей FALCON, известный как TD-FALCON. [11] , включает методы временной разницы (TD) для оценки и изучения функции значения Q(s,a) , которая указывает на возможность предпринять определенное действие a в данном состоянии s .
общий алгоритм Кратко изложен «чувство-действие-обучение» для TD-FALCON. Учитывая текущее состояние s , сеть FALCON используется для прогнозирования ценности выполнения каждого доступного действия a в наборе действий A на основе соответствующего вектора состояния. и вектор действия . Затем функции значения обрабатываются стратегией выбора действия (также известной как политика) для выбора действия. При получении обратной связи (если таковая имеется) от окружения после выполнения action, формула TD используется для вычисления новой оценки значения Q для выполнения выбранного действия в текущем состоянии. Новое значение Q затем используется в качестве обучающего сигнала (представленного в виде вектора вознаграждения R) для FALCON, чтобы изучить связь текущего состояния и выбранного действия с оценочным значением.
Ссылки
[ редактировать ]- ^ Тан, А.-Х., Карпентер, Г.А. и Гроссберг, С. (2007) Интеллект через взаимодействие: на пути к единой теории обучения . В ходе разбирательства Д. Лю и др. (Ред.): Международный симпозиум по нейронным сетям (ISNN'07) , LNCS 4491, Часть I , стр. 1098-1107.
- ^ Тан, А.-Х.; Субагджа, Б.; Ван, Д.; Мэн, Л. (2019). «Самоорганизующиеся нейронные сети для универсального обучения и мультимодального кодирования памяти» . Нейронные сети . 120 : 58–73. дои : 10.1016/j.neunet.2019.08.020 . ПМИД 31537437 . S2CID 202703163 .
- ^ Jump up to: а б Карпентер Г.А. и Гроссберг С. (2003), Теория адаптивного резонанса, архивировано 19 мая 2006 г. в Wayback Machine , В книге Майкла А. Арбиба (ред.), Справочник по теории мозга и нейронных сетей, второе издание (стр. 87-90). Кембридж, Массачусетс: MIT Press
- ^ Ю. Р. Асфур, Г. А. Карпентер, С. Гроссберг и Г. В. Лешер. (1993) Fusion ARTMAP: адаптивная нечеткая сеть для многоканальной классификации. В материалах Третьей Международной конференции по промышленному нечеткому управлению и интеллектуальным системам (IFIS).
- ^ РФ Харрисон и Дж. М. Борхес. (1995) Fusion ARTMAP: разъяснение, реализация и развитие. Отчет об исследовании № 589, факультет автоматического управления и системотехники, Университет Шеффилда.
- ^ Тенг, Т.-Х.; Тан, А.-Х.; Зурада, Дж. М. (2015). «Самоорганизующиеся нейронные сети, интегрирующие предметные знания и обучение с подкреплением» . Транзакции IEEE в нейронных сетях и системах обучения . 26 (5): 889–902. дои : 10.1109/TNNLS.2014.2327636 . ISSN 2162-237X . ПМИД 25881365 . S2CID 4664197 .
- ^ Ван, В.; Субагджа, Б.; Тан, А.-Х.; Старжик, Ю.А. (2012). «Нейронное моделирование эпизодической памяти: кодирование, извлечение и забывание» . Транзакции IEEE в нейронных сетях и системах обучения . 23 (10): 1574–1586. дои : 10.1109/TNNLS.2012.2208477 . ISSN 2162-237X . ПМИД 24808003 . S2CID 1337309 .
- ^ Ван, В.; Тан, А.-Х.; Теоу, Л.-Н. (2017). «Моделирование семантической памяти и взаимодействие памяти у обучающихся агентов» . Транзакции IEEE по системам, человеку и кибернетике: системы . 47 (11): 2882–2895. дои : 10.1109/TSMC.2016.2531683 . ISSN 2168-2216 . S2CID 12768875 .
- ^ Гроссберг, С. (1987), Конкурентное обучение: от интерактивной активации к адаптивному резонансу, Cognitive Science (Публикация), 11, 23-63.
- ^ Тан, А.-Х. (1995). «Ассоциативная карта адаптивного резонанса» (PDF) . Нейронные сети . 8 (3): 437–446. дои : 10.1016/0893-6080(94)00092-з .
- ^ Jump up to: а б Тан, А.-Х., Лу, Н.; Сяо, Д. (2008). «Интеграция методов временных различий и самоорганизующихся нейронных сетей для обучения с подкреплением с отложенной оценочной обратной связью» (PDF) . Транзакции IEEE в нейронных сетях . 9 (2): 230–244.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Тан, А.-Х.; Вскоре Х.-С. (2000). «Теория прогнозирующего адаптивного резонанса и обнаружение знаний в базах данных». Материалы Тихоокеанско-Азиатской конференции по обнаружению знаний и интеллектуальному анализу данных (PAKDD'00), LNAI . 1805 : 173–176.
- ^ Он, Дж.; Тан, А.-Х.; Тан, К.-Л. (2003). «О методах машинного обучения для классификации китайских документов» (PDF) . Прикладной интеллект . 18 (3): 311–322. дои : 10.1023/А:1023202221875 . S2CID 2033181 .
- ^ Тан, А.-Х.; Онг, Х.-Л.; Пан, Х.; Нг, Дж.; Ли, Q.-X. (2004). «На пути к персонализированному веб-аналитике» (PDF) . Знания и информационные системы . 6 (5): 595–616. дои : 10.1007/s10115-003-0130-9 . S2CID 14699173 .
- ^ Тан, А.-Х.; Пан (2005). «Прогнозирующие нейронные сети для анализа данных об экспрессии генов» (PDF) . Нейронные сети . 18 (3): 297–306. дои : 10.1016/j.neunet.2005.01.003 . ПМИД 15896577 . S2CID 5058995 .
- ^ Тан, А.-Х. (1997). «Каскад ARTMAP: интеграция нейронных вычислений и обработки символических знаний» (PDF) . Транзакции IEEE в нейронных сетях . 8 (2): 237–250. дои : 10.1109/72.557661 . ПМИД 18255628 .