Нейросимволический ИИ
Эта статья содержит неприятные слова : расплывчатые формулировки, которые часто сопровождают предвзятую или непроверяемую информацию . ( май 2024 г. ) |
Нейро-символический ИИ — это тип искусственного интеллекта , который объединяет нейронные и символические архитектуры ИИ для устранения недостатков каждого из них, обеспечивая надежный ИИ, способный рассуждать , обучаться и когнитивно моделировать . Как утверждает Лесли Валиант [1] и другие, [2] [3] эффективное построение богатых вычислительных когнитивных моделей требует сочетания символического мышления и эффективного машинного обучения . Гэри Маркус утверждал: «Мы не можем построить богатые когнитивные модели адекватным и автоматизированным способом без триумвирата гибридной архитектуры, богатых предварительных знаний и сложных методов рассуждения». [4] Далее: «Чтобы построить надежный, основанный на знаниях подход к ИИ, мы должны иметь в своем наборе инструментов механизм манипулирования символами. Слишком много полезных знаний абстрактны, чтобы действовать без инструментов, которые представляют абстракцию и манипулируют ею, и на сегодняшний день это единственный известный механизм который может надежно манипулировать таким абстрактным знанием, является аппаратом манипулирования символами». [5]
Генри Каутц , [6] Франческа Росси , [7] и Барт Селман [8] также выступал за синтез. Их аргументы пытаются обратиться к двум видам мышления, как описано в Дэниела Канемана книге «Думать быстро и медленно» . Он описывает познание как включающее два компонента: Система 1 — быстрая, рефлексивная, интуитивная и бессознательная. Система 2 более медленная, пошаговая и явная. Система 1 используется для распознавания образов . Система 2 отвечает за планирование, дедукцию и обдуманное мышление. С этой точки зрения, глубокое обучение лучше всего справляется с первым типом познания, а символическое рассуждение лучше всего справляется со вторым типом. И то, и другое необходимо для создания мощного и надежного ИИ, который сможет учиться, рассуждать и взаимодействовать с людьми, принимать советы и отвечать на вопросы. Такие модели двойного процесса с явными ссылками на две контрастирующие системы разрабатывались с 1990-х годов многими исследователями как в области искусственного интеллекта, так и в когнитивной науке. [9]
Подходы
[ редактировать ]Подходы к интеграции разнообразны. Генри Каутца . Таксономия нейросимволических архитектур [10] наряду с некоторыми примерами, следует:
- Символическая Нейронная символика — это текущий подход многих нейронных моделей обработки естественного языка , где слова или лексемы подслов являются конечными входными и выходными данными больших языковых моделей . Примеры включают BERT , RoBERTa и GPT-3 .
- Примером символического[Neural] является AlphaGo , где символические методы используются для вызова нейронных методов. В данном случае символическим подходом является поиск по дереву Монте-Карло , а нейронные методы учатся оценивать игровые позиции.
- Нейронный | Символика использует нейронную архитектуру для интерпретации перцептивных данных как символов и отношений, которые рассматриваются символически. Изучающий нейронные концепции [11] это пример.
- Нейронный: Символический → Нейронный метод опирается на символические рассуждения для генерации или маркировки обучающих данных , которые впоследствии изучаются моделью глубокого обучения, например, для обучения нейронной модели символическим вычислениям с использованием Macsyma, подобной системы символьной математики, для создания или маркировки примеров.
- Neural_{Symbolic} использует нейронную сеть , созданную на основе символических правил. Примером может служить средство доказательства нейронных теорем. [12] который конструирует нейронную сеть из дерева доказательств И-ИЛИ , созданного на основе правил и терминов базы знаний. Логические тензорные сети [13] тоже попадают в эту категорию.
- Neural[Symbolic] позволяет нейронной модели напрямую вызывать механизм символического рассуждения, например, для выполнения действия или оценки состояния. Примером может служить ChatGPT, использующий плагин для запроса Wolfram Alpha .
Эти категории не являются исчерпывающими, поскольку не учитывают мультиагентные системы. В 2005 году Бадер и Хитцлер представили более детальную категоризацию, которая учитывала, например, включает ли использование символов логику, и если да, то является ли эта логика пропозициональной или логикой первого порядка. [14] Категоризация 2005 года и приведенная выше таксономия Каутца сравниваются и противопоставляются в статье 2021 года. [10] Недавно Зепп Хохрайтер заявил, что графовые нейронные сети «...являются преобладающими моделями нейронно-символьных вычислений». [15] поскольку «[т] они описывают свойства молекул, моделируют социальные сети или предсказывают будущие состояния в физических и инженерных приложениях с помощью взаимодействий частица-частица». [16]
Общий искусственный интеллект
[ редактировать ]Гэри Маркус утверждает, что «...гибридные архитектуры, сочетающие обучение и манипулирование символами, необходимы для надежного интеллекта, но недостаточны». [17] и что есть
...четыре когнитивных предпосылки для создания надежного искусственного интеллекта:
- гибридные архитектуры, сочетающие крупномасштабное обучение с репрезентативными и вычислительными возможностями манипулирования символами,
- крупномасштабные базы знаний, вероятно, использующие врожденные структуры, которые включают символические знания наряду с другими формами знаний,
- механизмы рассуждения, способные эффективно использовать эти базы знаний и
- богатые когнитивные модели , которые работают вместе с этими механизмами и базами знаний . [18]
Это перекликается с более ранними призывами к созданию гибридных моделей еще в 1990-х годах. [19] [20]
История
[ редактировать ]Гарсез и Лэмб описали, что исследования в этой области продолжаются, по крайней мере, с 1990-х годов. [21] [22] В то время были популярны термины символический и субсимволический ИИ .
Серия семинаров по нейросимволическому искусственному интеллекту проводится ежегодно с 2005 года. Нейро-символический искусственный интеллект. [23] В начале 1990-х годов была организована первая серия семинаров по этой теме. [19]
Исследовать
[ редактировать ]Ключевые вопросы исследования остаются, [24] такой как:
- Как лучше всего интегрировать нейронную и символическую архитектуру?
- Как символические структуры следует представлять в нейронных сетях и извлекать из них?
- Как следует изучать и рассуждать о здравых знаниях?
- Как можно обращаться с абстрактными знаниями, которые сложно логически закодировать?
Реализации
[ редактировать ]Реализация нейросимволических подходов включает в себя:
- AllegroGraph : интегрированная платформа на основе Knowledge Graph для разработки нейросимволических приложений. [25] [26] [27]
- Scallop: язык, основанный на Datalog , который поддерживает дифференцируемые логические и реляционные рассуждения. Scallop можно интегрировать в Python и с модулем обучения PyTorch . [28]
- Логические тензорные сети: кодируйте логические формулы в виде нейронных сетей и одновременно изучайте кодировки терминов, веса терминов и веса формул.
- DeepProbLog: объединяет нейронные сети с вероятностными рассуждениями ProbLog .
- Символический AI: библиотека композиционно-дифференцируемого программирования.
- Объяснимые нейронные сети (XNN): объединяют нейронные сети с символическими гиперграфами и обучают с использованием смеси обратного распространения ошибки и символического обучения, называемой индукцией. [29]
Цитаты
[ редактировать ]- ^ Валиант 2008 .
- ^ Гарсез и др. 2015 .
- ^ Д’Авила Гарсес, Артур С.; Лэмб, Луи К.; Габбай, Дов М. (2009). Нейросимволическое когнитивное мышление . Когнитивные технологии. Спрингер. ISBN 978-3-540-73245-7 .
- ^ Маркус 2020 , с. 44.
- ^ Маркус и Дэвис 2019 , с. 17.
- ^ Каутц 2020 .
- ^ Росси 2022 .
- ^ Только 2022 год .
- ^ Вс 1995 г.
- ^ Перейти обратно: а б Саркер, доктор медицинских наук Камруззаман; Чжоу, Лу; Эберхарт, Аарон; Хитцлер, Паскаль (2021). «Нейро-символический искусственный интеллект: современные тенденции» . AI-коммуникации . 34 (3): 197–209. дои : 10.3233/AIC-210084 . S2CID 239199144 .
- ^ Мао и др. 2019 .
- ^ Роктешель, Тим; Ридель, Себастьян (2016). «Изучение вывода из базы знаний с помощью нейронных средств доказательства теорем» . Материалы 5-го семинара по автоматизированному построению баз знаний . Сан-Диего, Калифорния: Ассоциация компьютерной лингвистики. стр. 45–50. дои : 10.18653/v1/W16-1309 . Проверено 6 августа 2022 г.
- ^ Серафини, Лучано; Гарсез, Артур д'Авила (2016). «Логические тензорные сети: глубокое обучение и логические рассуждения на основе данных и знаний». arXiv : 1606.04422 [ cs.AI ].
- ^ Бадер и Хитцлер 2005 .
- ^ LC Lamb, AS d'Avila Garcez, M.Gori, MOR Prates, PHC Avelar, MY Vardi (2020). «Графовые нейронные сети встречаются с нейронно-символическими вычислениями: обзор и перспективы ». КоРР абс/2003.00330 (2020)
- ^ Хохрайтер, Зепп (апрель 2022 г.). «На пути к широкому ИИ» . Коммуникации АКМ . 65 (4): 56–57. дои : 10.1145/3512715 . ISSN 0001-0782 .
- ^ Маркус 2020 , с. 50.
- ^ Маркус 2020 , с. 48.
- ^ Перейти обратно: а б Солнце и Букман 1994 .
- ^ Гарсез и Ламб 2020 , с. 2.
- ^ Гарсез и др. 2002 .
- ^ «Нейро-символический искусственный интеллект» . люди.cs.ksu.edu . Проверено 11 сентября 2023 г.
- ^ Вс 2001 г.
- ^ Харпер, Джелани (29 декабря 2023 г.). «АллегроГраф 8.0 включает нейросимволический искусственный интеллект, путь к ОИИ» . Новый стек . Проверено 13 июня 2024 г.
- ^ «Нейро-символический искусственный интеллект и модели большого языка. Введение | АллегроГраф 8.1.1» . franz.com . Проверено 13 июня 2024 г.
- ^ «Franz Inc. представляет AllegroGraph Cloud: управляемый сервис для графов знаний нейросимволического ИИ» . Датанами . Проверено 13 июня 2024 г.
- ^ Ли, Цзыян; Хуан, Цзяни; Наик, Маюр (2023). «Гребешок: язык нейросимволического программирования». arXiv : 2304.04812 [ cs.PL ].
- ^ «Метод индукции модели для объяснимого ИИ» . ВПТЗ США. 06.05.2021.
Ссылки
[ редактировать ]- Бадер, Себастьян; Хитцлер, Паскаль (10 ноября 2005 г.). «Размеры нейросимволической интеграции - структурированный опрос». arXiv : cs/0511042 .
- Гарсез, Артур С. д'Авила; Брода, Крыся; Габбай, Дов М.; Габбай (2002). Нейросимволические системы обучения: основы и приложения . Springer Science & Business Media. ISBN 978-1-85233-512-0 .
- Гарсез, Артур; Бесольд, Тарек; Де Рэдт, Люк; Фёлдиак, Питер; Хитцлер, Паскаль ; Икард, Томас; Кюнбергер, Кай-Уве; Лэмб, Луис; Мииккулайнен, Ристо; Сильвер, Дэниел (2015). Нейро-символическое обучение и рассуждение: вклад и проблемы . Весенний симпозиум AAAI - Представление знаний и рассуждение: интеграция символического и нейронного подходов. Стэнфорд, Калифорния. дои : 10.13140/2.1.1779.4243 .
- Гарсес, Артур д'Авила; Гори, Марко; Лэмб, Луис К.; Серафини, Лучано; Спрангер, Майкл; Тран, Сон Н. (2019). «Нейро-символические вычисления: эффективная методология принципиальной интеграции машинного обучения и рассуждения». arXiv : 1905.06088 [ cs.AI ].
- Гарсес, Артур д'Авила; Лэмб, Луис К. (2020). «Нейросимволический ИИ: 3-я волна». arXiv : 2012.05876 [ cs.AI ].
- Хитцлер, Паскаль ; Саркер, доктор медицины Камруззаман (2022). Нейро-символический искусственный интеллект: современное состояние . ИОС Пресс. ISBN 978-1-64368-244-0 .
- Хитцлер, Паскаль ; Саркер, доктор медицины Камруззаман; Эберхарт, Аарон (2023). Сборник нейросимволического искусственного интеллекта . ИОС Пресс. ISBN 978-1-64368-406-2 .
- Хохрейтер, Зепп. «На пути к широкому ИИ». Коммун. ACM 65(4): 56–57 (2022 г.). На пути к широкому ИИ
- Хонавар, Васант (1995). Символический искусственный интеллект и числовые искусственные нейронные сети: на пути к разрешению дихотомии . Международная серия Springer по инженерным наукам и информатике. Спрингер США. стр. 351–388. дои : 10.1007/978-0-585-29599-2_11 .
- Каутц, Генри (11 февраля 2020 г.). Третье лето искусственного интеллекта, Генри Каутц, лекция на премию памяти Роберта С. Энгельмора AAAI 2020 . Проверено 6 июля 2022 г.
- Каутц, Генри (2022). «Третье лето ИИ: лекция памяти AAAI Роберта С. Энгельмора» . Журнал ИИ . 43 (1): 93–104. дои : 10.1609/aimag.v43i1.19122 . ISSN 2371-9621 . S2CID 248213051 . Проверено 12 июля 2022 г.
- Мао, Цзяюань; Ган, Чуанг; Кохли, Пушмит; Тененбаум, Джошуа Б.; Ву, Цзяцзюнь (2019). «Изучающий нейросимволические концепции: интерпретация сцен, слов и предложений под естественным наблюдением». arXiv : 1904.12584 [ cs.CV ].
- Маркус, Гэри; Дэвис, Эрнест (2019). Перезагрузка искусственного интеллекта: создание искусственного интеллекта, которому мы можем доверять . Винтаж.
- Маркус, Гэри (2020). «Следующее десятилетие искусственного интеллекта: четыре шага к надежному искусственному интеллекту». arXiv : 2002.06177 [ cs.AI ].
- Росси, Франческа (6 июля 2022 г.). «AAAI2022: Думайте быстро и медленно в области искусственного интеллекта (приглашенный доклад AAAI 2022)» . Проверено 6 июля 2022 г.
- Селман, Барт (6 июля 2022 г.). «AAAI2022: Послание президента: Состояние искусственного интеллекта» . Проверено 6 июля 2022 г.
- Серафини, Лучано; Гарсез, Артур д'Авила (7 июля 2016 г.). «Логические тензорные сети: глубокое обучение и логические рассуждения на основе данных и знаний». arXiv : 1606.04422 [ cs.AI ].
- Сан, Рон (1995). «Надежные рассуждения: интеграция рассуждений, основанных на правилах и сходстве». Искусственный интеллект . 75 (2): 241–296. дои : 10.1016/0004-3702(94)00028-Y .
- Сан, Рон; Букман, Лоуренс (1994). Вычислительные архитектуры, интегрирующие нейронные и символические процессы . Клювер.
- Сан, Рон; Александр, Фредерик (1997). Коннекционистская символическая интеграция . Лоуренс Эрлбаум Ассошиэйтс.
- Сан, Р. (2001). «Гибридные системы и коннекционистский имплементализм». Энциклопедия когнитивных наук (MacMillan Publishing Company, 2001) .
- Валиант, Лесли Дж. (2008). «Инфузия знаний: в поисках надежности искусственного интеллекта» . Ежегодная конференция IARCS по основам программных технологий и теоретической информатики . doi : 10.4230/LIPIcs.FSTTCS.2008.1770 .