Цикл
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения ) |
Оригинальный автор(ы) | Дуглас Ленат |
---|---|
Разработчик(и) | Сайкорп, Инк. |
Первоначальный выпуск | 1984 год |
Стабильная версия | 6.1 / 27 ноября 2017 г |
Написано в | Лисп , Цикл , СубЛ |
Тип | Онтология и база знаний , представления знаний язык и механизм вывода |
Веб-сайт | www |
Cyc (произносится / ˈ s aɪ k / SYKE ) — это долгосрочный проект искусственного интеллекта , целью которого является сбор комплексной онтологии и базы знаний , охватывающей основные концепции и правила того, как устроен мир.
Надеясь охватить знания, основанные на здравом смысле , Cyc фокусируется на неявных знаниях , которые другие платформы искусственного интеллекта могут воспринимать как нечто само собой разумеющееся.
Это контрастирует с фактами, которые можно найти где-то в Интернете или получить через поисковую систему или Википедию.
Cyc позволяет специалистам по семантическому рассуждению рассуждать , как у человека , и быть менее «хрупкими» при столкновении с новыми ситуациями.
Дуглас Ленат начал проект в июле 1984 года в MCC , где он был главным научным сотрудником в 1984–1994 годах, а затем, с января 1995 года, находился под активной разработкой компании Cycorp , где был генеральным директором .
Обзор
[ редактировать ]Потребность в крупномасштабном символическом проекте искусственного интеллекта возникла в начале 1980-х годов. Исследователи ИИ в течение предыдущих 25 лет наблюдали, что программы ИИ часто давали многообещающие первоначальные результаты, но с трудом «масштабировались» — им не удавалось выйти за рамки своих первоначальных обучающих наборов и охватить более широкий круг случаев. Эту проблему осветили Дуглас Ленат и Алан Кей, [1] [2] [3] который организовал встречу в Стэнфордском университете в 1983 году для обсуждения этой проблемы.
Предварительные расчеты Лената, Кея и их коллег (включая Марвина Мински , Аллена Ньюэлла , Эдварда Фейгенбаума и Джона Маккарти ) показали, что эти усилия потребуют от 1000 до 3000 человеко-лет усилий. События, произошедшие в течение года после этой встречи, позволили начать работу такого масштаба.
Проект начался в июле 1984 года как флагманский проект Корпорации микроэлектроники и компьютерных технологий (MCC) со штатом в 400 человек, исследовательского консорциума, созданного двумя дюжинами крупных американских корпораций, «чтобы противостоять зловещим на тот момент усилиям Японии в области искусственного интеллекта, столь так называемый проект « пятого поколения ». [4] Правительство США отреагировало на угрозу «пятого поколения», приняв в 1984 году Закон о национальных совместных исследованиях впервые позволил американским компаниям «вступать в сговор» при проведении долгосрочных, высокорискованных и , который . высокооплачиваемых исследований воспользуйтесь этой десятилетней возможностью. Первым президентом и генеральным директором MCC был Бобби Рэй Инман , бывший директор АНБ и заместитель директора ЦРУ.
Целью проекта Cyc было систематизировать в машинной форме миллионы знаний, составляющих человеческий здравый смысл. [5] Попутно это повлекло за собой (1) разработку адекватно выразительного языка представления CycL , [6] (2) разработка онтологии, охватывающей все человеческие концепции до определенного уровня детализации, [7] (3) разработка базы знаний на основе этой онтологической структуры, [7] включающий все человеческие знания об этих концепциях до определенного уровня детализации и (4) разработку механизма вывода в геометрической прогрессии, чем те, которые использовались в традиционных на тот момент экспертных системах, [8] [9] иметь возможность делать те же типы и глубины выводов, на которые способны люди, учитывая их знания о мире.
Немного подробнее:
- Язык представления CycL возник как расширение RLL. [10] [11] (так называемый язык репрезентации, разработанный в 1979–1980 годах Ленатом и его аспирантом Расселом Грейнером во время учебы в Стэнфордском университете), но уже через несколько лет после запуска проекта Cyc стало ясно, что даже представление типичной новостной статьи или роман, или реклама потребовали бы чего-то большего, чем просто выразительная сила полной логики первого порядка , а именно исчисления предикатов второго порядка («Какова связь между дождем и водой?»), а затем даже логики более высокого уровня, включая модальную логику , рефлексия (позволяющая системе рассуждать о своем прогрессе на данный момент по проблеме, над которой она работает) и контекстная логика (позволяющая системе явно рассуждать о контекстах, в которых могут иметь место ее различные посылки и выводы), немонотонные логика и ограничения . К 1989 году [6] CycL расширил свою выразительную силу до логики высшего порядка (HOL).
- Представления с тройным хранилищем (сродни языкам представления кадров и слотов 1970-х годов, из которых произошел RLL) сегодня широко распространены в ИИ. Возможно, будет полезно привести несколько примеров, которые подчеркивают или разрушают этот тип представления, типичных для примеров, которые вынудили проект Cyc перейти от трехэтажного представления к гораздо более выразительному в период 1984–1989 годов: [6] Английские предложения, включающие отрицания («У Фреда нет собаки»), вложенные квантификаторы («У каждого американца есть мать» означает «для всех x существует y… но «У каждого американца есть президент» означает «существует y»). такие, что для всех x...), вложенные модальные окна, такие как «Соединенные Штаты считают, что Германия хочет, чтобы НАТО избегало преследования...», и даже неудобно представлять в Triplestore отношения с арностью выше 2, например: «Лос-Анджелес находится между Сан-Диего и Сан-Франциско по шоссе US101».
- Онтология Cyc выросла примерно до 100 000 терминов в течение первого десятилетия проекта, до 1994 года, и по состоянию на 2017 год содержала около 1 500 000 терминов. Эта онтология включала в себя:
- 416 000 коллекций (типы, сорта, естественные виды , которые включают в себя как типы вещей, такие как Рыба, так и типы действий, такие как Рыбалка)
- чуть более миллиона человек, представляющих
- 42 500 предикатов (отношения, атрибуты, поля, свойства, функции),
- около миллиона общеизвестных организаций, таких как TheUnitedStatesOfAmerica, BarackObama, TheSigningOfTheUSDeclarationOfIndependentence и т. д.
- присутствует произвольно большое количество дополнительных терминов В онтологии Cyc также неявно в том смысле, что существуют функции, обозначающие термины, такие как CalendarYearFn (если указан аргумент 2016, он обозначает 2016 календарный год), GovernmentFn (если задан аргумент Франция обозначает правительство Франции), метр (при использовании аргумента 2016 он обозначает расстояние в 2,016 километра), а также вложения и композиции таких терминов, обозначающих функции.
- База знаний Cyc, состоящая из общих правил здравого смысла и утверждений, включающих эти онтологические термины, была в значительной степени создана путем написания аксиом вручную; в 1994 году оно выросло примерно до 1 миллиона, а по состоянию на 2017 год составляет около 24,5 миллиона, и на его строительство ушло более 1000 человеко-лет.
- Важно понимать, что инженеры-онтологи Cyc стремятся сохранить эти числа как можно меньшими , а не раздувать их, пока не уменьшается дедуктивная замкнутость базы знаний. Предположим, Цику рассказывают об одном миллиарде отдельных людей, животных и т. д. Тогда можно было бы сказать 10 18 факты вида «Микки Маус — это не тот же человек, что <Лось Буллвинкль/Авраам Линкольн/Дженнифер Лопес>». Но вместо этого можно было бы назвать Cyc 10 000 правил таксономии Линнея, за которыми следует всего 10 8 правила вида «Никакая мышь – лось». И, что еще более компактно, вместо этого Cyc можно было бы просто дать эти 10 000 правил таксономии Линнея, за которыми следует только одно правило вида: «Для любых двух таксонов Линнея, если ни один из них явно не является супертаксоном другого, то они не пересекаются». Эти 10 001 утверждение имеют такое же дедуктивное заключение, как и упомянутые ранее 10 утверждений. 18 факты.
- Конструкция механизма вывода Cyc отделяет эпистемологическую проблему (какое содержимое должно быть в базе данных Cyc) от эвристической проблемы (как Cyc может эффективно выводить аргументы на глубину сотен шагов в море десятков миллионов аксиом). Для первого случая может быть достаточно языка CycL и хорошо понятного логического вывода. Для последнего Cyc использовал архитектуру сообщества агентов, где специализированные модули рассуждения, каждый со своей собственной структурой данных и алгоритмом, «поднимали руку», если они могли эффективно добиться прогресса в любой из открытых в настоящее время подзадач. К 1994 году таких модулей эвристического уровня (HL) было 20; [8] по состоянию на 2017 год насчитывается более 1050 модулей HL. [12]
- Некоторые из этих модулей HL являются очень общими, например модуль, который кэширует звезду Клини ( транзитивное замыкание ) всех часто используемых транзитивных отношений в онтологии Cyc.
- Некоторые из них специфичны для предметной области, например, балансировщик химических уравнений. Это могут быть и часто являются «бегом» (указателем) к какой-либо внешней программе, веб-сервису или онлайн-базе данных, например, к модулю для быстрого «вычисления» текущего населения города, зная, где и как его посмотреть. вверх.
CycL имеет общедоступную спецификацию, а десятки модулей HL описаны в учебнике Лената и Гухи. [8] но фактический код механизма вывода Cyc и полный список из более чем 1000 модулей HL являются собственностью Cycorp. [3]
Название «Cyc» (от слова «энциклопедия», произносится [saɪk] , как « syke ») является зарегистрированным товарным знаком, принадлежащим Cycorp. Доступ к Cyc осуществляется через платные лицензии, но добросовестным исследовательским группам в области ИИ предоставляются бесплатные лицензии только на исследования (см. ResearchCyc ); По состоянию на 2017 год такими лицензиями обладают более 600 таких групп по всему миру.
Типичными фрагментами знаний, представленными в базе знаний Cyc, являются «Каждое дерево — это растение» и «Растения рано или поздно умирают». Когда его спрашивают, умирают ли деревья, машина вывода может сделать очевидный вывод и правильно ответить на вопрос.
Большая часть знаний Сайка, за исключением математики, верна только по умолчанию. Например, Cyc знает, что по умолчанию родители любят своих детей, люди улыбаются, когда счастливы, первый шаг ребенка — это большое достижение, люди счастливы, когда у любимого человека есть большое достижение, и только у взрослых есть дети. Когда его спрашивают, есть ли на картинке с подписью «Кто-то наблюдает, как его дочь делает свой первый шаг» улыбающийся взрослый человек, Сайк может логически сделать вывод, что ответ — «Да» , и «показать его работу», представив пошаговый логический аргумент, используя эти пять знаний из своей базы знаний. Они сформулированы на языке CycL , который основан на исчислении предикатов и имеет синтаксис, аналогичный синтаксису языка программирования Lisp .
В 2008 году ресурсы Cyc были сопоставлены со многими Википедии . статьями [13] Cyc в настоящее время подключен к Викиданным . В будущих планах Cyc может быть подключен как к DBpedia , так и к Freebase .
Большая часть текущей работы Cyc по-прежнему связана с инженерией знаний , представлением фактов о мире вручную и реализацией эффективных механизмов вывода на основе этих знаний. Однако работа Cycorp все чаще предполагает предоставление системе Cyc возможности общаться с конечными пользователями на естественном языке , а также помогать в текущем процессе формирования знаний посредством машинного обучения и понимания естественного языка . Еще одним крупным достижением Cycorp является создание набора инструментов онтологического проектирования на базе Cyc, позволяющего снизить порог входа для отдельных лиц, которые могут вносить свой вклад, редактировать, просматривать и запрашивать Cyc.
Как и многие компании, Cycorp планирует использовать систему обработки естественного языка Cyc для анализа всего Интернета с целью извлечения структурированных данных; в отличие от всех остальных, он способен призвать саму систему Cyc действовать как индуктивная предвзятость и как судья двусмысленности , метафоры и многоточия . Систематических контрольных исследований производительности Cyc мало, если они вообще вообще есть.
База знаний
[ редактировать ]Имена понятий в Cyc являются терминами или константами CycL . [6] Константы начинаются с необязательного #$
и чувствительны к регистру. Существуют константы для:
- Отдельные элементы, известные как отдельные лица , такие как
#$BillClinton
или#$France
. - Коллекции , такие как
#$Tree-ThePlant
(содержащий все деревья) или#$EquivalenceRelation
(содержащий все отношения эквивалентности ). Член коллекции называется экземпляром этой коллекции. [8] - Функции , которые создают новые термины из заданных. Например,
#$FruitFn
, если ему предоставлен аргумент, описывающий тип (или коллекцию) растений, вернет коллекцию его плодов. По соглашению, функциональные константы начинаются с заглавной буквы и заканчиваются строкойFn
. - Функции истины , которые могут применяться к одному или нескольким другим понятиям и возвращать либо истину, либо ложь. Например,
#$siblings
— родственное отношение, истинное, если два аргумента являются одноуровневыми. По соглашению константы функции истинности начинаются со строчной буквы. Функции истинности могут быть разбиты на логические связки (например,#$and
,#$or
,#$not
,#$implies
), кванторы (#$forAll
,#$thereExists
и т. д.) и предикаты .
Два важных бинарных предиката: #$isa
и #$genls
. Первый описывает, что один элемент является экземпляром некоторой коллекции, второй — что одна коллекция является подколлекцией другой. Факты о понятиях утверждаются с помощью определенных предложений CycL . Предикаты пишутся перед аргументами в круглых скобках:
(#$isa #$BillClinton #$UnitedStatesPresident)
«Билл Клинтон принадлежит к коллекции президентов США».
(#$genls #$Tree-ThePlant #$Plant)
«Все деревья — растения».
(#$capitalCity #$France #$Paris)
«Париж — столица Франции».
Предложения также могут содержать переменные, строки, начинающиеся с ?
. Эти предложения называются «правилами». В отношении #$isa
предикат гласит:
(#$implies (#$and (#$isa ?OBJ ?SUBSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))
"Если OBJ
является экземпляром коллекции SUBSET
и SUBSET
представляет собой подколлекцию SUPERSET
, затем OBJ
является экземпляром коллекции SUPERSET
". Другой типичный пример -
(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)
это означает, что для каждого экземпляра коллекции #$ChordataPhylum
(т.е. для каждого хордового ) существует самка животного (пример #$FemaleAnimal
), которая является его матерью (описываемой предикатом #$biologicalMother
). [8]
База знаний разделена на микротеории (МТ), коллекции концепций и фактов, обычно относящиеся к одной конкретной области знаний. В отличие от базы знаний в целом, каждая микротеория должна быть свободна от монотонных противоречий. Каждая микротеория является первоклассным объектом онтологии Cyc; у него есть имя, которое является обычной константой; Константы микротеории содержат строку Mt
по соглашению. Примером является #$MathMt
, микротеория, содержащая математические знания. Микротеории могут наследовать друг друга и организованы в иерархию: одна специализация #$MathMt
является #$GeometryGMt
, микротеория о геометрии.
Механизм вывода
[ редактировать ]Механизм вывода — это компьютерная программа, которая пытается получить ответы из базы знаний.Механизм вывода Cyc выполняет общий логический вывод (включая modus ponens , modus tollens , универсальную количественную оценку и экзистенциальную количественную оценку ). [14] Он также выполняет индуктивные рассуждения , статистическое машинное обучение и символическое машинное обучение, а также абдуктивные рассуждения (но, конечно, экономно и используя существующую базу знаний в качестве фильтра и руководства).
Релизы
[ редактировать ]OpenCyc
[ редактировать ]Первая версия OpenCyc была выпущена весной 2002 года и содержала всего 6000 концепций и 60 000 фактов. База знаний выпущена под лицензией Apache . Cycorp заявила о своем намерении выпустить OpenCyc под параллельными неограниченными лицензиями для удовлетворения потребностей своих пользователей. Интерпретатор CycL и SubL (программа, которая позволяет пользователям просматривать и редактировать базу данных, а также делать выводы) был выпущен бесплатно, но только в виде двоичного файла, без исходного кода. Он был доступен для Linux и Microsoft Windows . Texai с открытым исходным кодом [15] проект выпустил RDF -совместимый контент, извлеченный из OpenCyc. [16] Версия OpenCyc 4.0 была выпущена в июне 2012 года. OpenCyc 4.0 включала большую часть онтологии Cyc того времени, содержащую сотни тысяч терминов, а также миллионы утверждений, связывающих термины друг с другом; однако в основном это таксономические утверждения, а не сложные правила, доступные в Cyc. База знаний OpenCyc 4.0 содержала 239 000 концепций и 2 093 000 фактов.
Основная цель выпуска OpenCyc заключалась в том, чтобы помочь исследователям ИИ понять, чего не хватает в том, что они теперь называют онтологиями и графами знаний . Полезно и важно иметь правильно таксономизированные понятия, такие как человек, ночь, сон, лежание, бодрствование, счастье и т. д., но чего не хватает в контенте OpenCyc об этих терминах, но присутствует в контенте Cyc KB, так это различных Эмпирические правила, которые большинство из нас разделяют в отношении этих терминов: что (по умолчанию в ModernWesternHumanCultureMt) каждый человек спит ночью, спит лежа, его можно разбудить, он не рад, что его разбудили, и так далее. Этот момент не требует постоянного обновления версий OpenCyc, поэтому с 2017 года OpenCyc больше не доступен.
ResearchCyc
[ редактировать ]В июле 2006 года Cycorp бесплатно выпустила исполняемый файл ResearchCyc 1.0, версии Cyc, предназначенной для исследовательского сообщества. (ResearchCyc находился на стадии бета-разработки в течение всего 2004 г.; бета-версия была выпущена в феврале 2005 г.) Помимо таксономической информации, содержащейся в OpenCyc, ResearchCyc включает значительно больше семантических знаний (т. е. дополнительных фактов и практических правил), включающих концепции в его базе знаний; он также включает в себя большой словарный запас, английского языка инструменты синтаксического анализа и генерации Java , а также интерфейсы на основе для редактирования и запроса знаний. Кроме того, он содержит систему интеграции данных на основе онтологий . По состоянию на 2017 год регулярные выпуски ResearchCyc продолжали появляться: 600 исследовательских групп по всему миру бесплатно использовали лицензии для некоммерческих исследовательских целей. По состоянию на декабрь 2019 года ResearchCyc больше не поддерживается. Cycorp планирует улучшить и пересмотреть инструменты для внешних разработчиков в ближайшие годы.
Приложения
[ редактировать ]Было зарегистрировано более ста успешных применений Cyc; [17] Здесь перечислены несколько взаимно непохожих примеров:
Менеджер по тезаурусу фармацевтических терминов/интегратор
[ редактировать ]Уже более десяти лет Glaxo использует Cyc для полуавтоматической интеграции всех больших (сотни тысяч терминов) тезаурусов терминов фармацевтической промышленности, которые отражают различное использование в разных компаниях, странах, годах и подотраслях. [18] Эта задача интеграции онтологий требует знаний предметной области, поверхностных семантических знаний, а также сколь угодно глубоких знаний и рассуждений, основанных на здравом смысле. Фармацевтический словарь варьируется в зависимости от страны, (под)отрасли, компании, отдела и десятилетий. Например, что такое гель-пак ? Каково «уличное название» ранитидина гидрохлорида ? Каждый из этих n контролируемых словарей представляет собой онтологию, содержащую примерно 300 тысяч терминов. Исследователям Glaxo необходимо задать запрос в своем текущем словаре , перевести его в нейтральное «истинное значение», а затем преобразовать его в противоположном направлении, чтобы найти потенциальные совпадения с документами, каждый из которых был написан в соответствии с определенным известным словарем. .
Для этого вручную был задействован большой штат сотрудников. Cyc используется в качестве универсального интерлингва, способного представлять объединение «истинных значений» всех терминов и способного представлять 300 тысяч преобразований между каждым из этих контролируемых словарей и Cyc, тем самым преобразуя задачу n² в линейную без введения обычная "телефонная игра" с затуханием смысла. Более того, Cyc создает каждое из этих 300 тысяч сопоставлений для каждого тезауруса в значительной степени автоматически.
База знаний о терроризме
[ редактировать ]Комплексная база знаний о терроризме представляла собой разрабатываемое приложение Cyc, которое пыталось в конечном итоге содержать все соответствующие знания о «террористических» группах, их членах, лидерах, идеологии, основателях, спонсорах, связях, объектах, местоположении, финансах, возможностях, намерениях, поведении. , тактика и полные описания конкретных террористических событий. Знания хранятся в виде утверждений математической логики, пригодных для компьютерного понимания и рассуждений. [19] [20]
Фонд клиники Кливленда
[ редактировать ]Клиника Кливленда использовала Cyc для разработки интерфейса запроса биомедицинской информации на естественном языке , охватывающего десятилетия информации о кардиоторакальных операциях. [21] Запрос анализируется в набор фрагментов CycL (логика высшего порядка) с открытыми переменными (например, «этот вопрос говорит о человеке, у которого развилась инфекция эндокардита», «этот вопрос говорит о подгруппе пациентов Кливлендской клиники, которые перенес там операцию в 2009 году» и др.); затем применяются различные ограничения (знания в области медицины, здравый смысл, прагматика дискурса, синтаксис), чтобы увидеть, как эти фрагменты могут объединиться в один семантически значимый формальный запрос; примечательно, что в большинстве случаев существует ровно один и только один такой способ включения и интеграции этих фрагментов. [22] Интеграция фрагментов включает в себя (i) решение, какие открытые переменные и в каких фрагментах фактически представляют одну и ту же переменную, и (ii) для всех конечных переменных решить, какой порядок и объем количественной оценки должна иметь эта переменная, а также какой тип (универсальный или экзистенциальный). . Этот логический запрос (CycL) затем преобразуется в запрос SPARQL , который передается в CCF SemanticDB, которая является озером данных .
МатКрафт
[ редактировать ]Приложение One Cyc призвано помочь ученикам 6-го класса заниматься математикой, помогая им гораздо глубже понять этот предмет. [23] Оно основано на опыте, когда нам часто казалось , что мы что-то понимаем, но по-настоящему поняли это только после того, как нам пришлось объяснять или учить этому кого-то другого. В отличие от почти всех других образовательных программ, где компьютер играет роль учителя, это приложение Cyc, называемое MathCraft, [24] Cyc играет роль сокурсника, который всегда немного более сбит с толку, чем вы, пользователь, в этом предмете. Роль пользователя состоит в том, чтобы наблюдать за аватаром Cyc и давать ему советы, исправлять его ошибки, наставлять его, заставлять его видеть, что он делает неправильно и т. д. Поскольку пользователь дает хороший совет, Cyc позволяет аватару совершать меньше ошибок такого типа. , следовательно, с точки зрения пользователя кажется, что пользователь только что успешно научил его чему-то. Это вариант обучения через обучение .
Критика
[ редактировать ]Проект Cyc был описан как «одно из самых противоречивых проектов в истории искусственного интеллекта». [25] Кэтрин Хаваси , генеральный директор Luminoso, говорит, что Cyc является проектом-предшественником IBM Watson . [26] Ученый в области машинного обучения Педро Домингос называет проект «катастрофическим провалом» по нескольким причинам, включая бесконечный объем данных, необходимых для получения каких-либо жизнеспособных результатов, и неспособность Cyc развиваться самостоятельно. [27]
Робин Хэнсон , профессор экономики Университета Джорджа Мейсона, дает более взвешенный анализ:
Конечно, проект CYC открыт для критики по поводу многих его конкретных решений. Люди жаловались на его логические и языковые представления, на выбор прототипов случаев для построения (например, статьи в энциклопедии), на то, что он сосредоточен на ответах, а не на действиях, на то, как часто он перестраивает, а не поддерживает устаревшие системы, и о конфиденциальности и публикации всего. Но любой крупный проект, подобный этому, может вызвать такие споры, и не очевидно, что какой-либо из его решений был серьезно ошибочным. Им нужно было с чего-то начинать, и, по моему мнению, теперь они собрали базу знаний поистине впечатляющего размера, масштаба и интеграции. Другие архитектуры вполне могут работать лучше, но если знание лотов настолько важно, как думает Ленат, я ожидаю серьезных попыток ИИ импортировать знания CYC, переводя их в новое представление. Ни один другой источник не может сравниться с CYC по размеру, объему и интеграции. [28]
Аналогичное мнение выразил Марвин Мински : «К сожалению, стратегии, наиболее популярные среди исследователей ИИ в 1980-х годах, зашли в тупик», — сказал Мински. Так называемые « экспертные системы », имитирующие человеческий опыт в четко определенных предметных областях, таких как право и медицина, могут сопоставлять запросы пользователей с соответствующими диагнозами, статьями и рефератами, но они не могут изучить концепции, которые большинство детей знают к тому времени, когда они начинают учиться. 3 года. «Для каждого типа проблем, — сказал Мински, — создание экспертных систем приходилось начинать заново, потому что они не накапливали знания здравого смысла». По словам Мински, только один исследователь взял на себя колоссальную задачу по созданию комплексной системы рассуждений, основанной на здравом смысле. Дуглас Ленат в рамках своего проекта Cyc руководил построчным вводом более 1 миллиона правил в базу знаний здравого смысла. [29]
Гэри Маркус , профессор психологии и нейронауки в Нью-Йоркском университете и соучредитель компании Geometric Intelligence, занимающейся искусственным интеллектом, говорит, что «это представляет собой подход, который сильно отличается от всех вещей глубокого обучения, которые были в новостях». [30] Это согласуется с позицией Дуга Лената о том, что «иногда видимости интеллекта недостаточно». [31]
Стивен Вольфрам пишет:
На заре развития искусственного интеллекта было много дискуссий о «представлении знаний» с подходами, основанными на грамматике естественного языка, структуре логики предикатов или формализме баз данных. Было предпринято очень мало крупномасштабных проектов (ярким контрпримером является Cyc Дуга Лената). [32]
Маркус пишет:
Эта область могла бы выиграть, если бы CYC систематически описывалась и оценивалась. Если CYC решил значительную часть здравого смысла, то очень важно знать это как полезный инструмент и как отправную точку для дальнейших исследований. Если ДЮК столкнулся с трудностями, было бы полезно извлечь уроки из допущенных ошибок. Если CYC совершенно бесполезен, то исследователи могут, по крайней мере, перестать беспокоиться о том, изобретают ли они велосипед заново. [33]
появляется новая Каждые несколько лет с момента начала публикации (1993 г.) в журнале Wired Magazine статья о Cyc: [34] [29] [35] некоторые положительные и некоторые отрицательные (включая одну проблему [36] который содержал по одному каждому).
Известные сотрудники
[ редактировать ]Это список некоторых известных людей, которые работают или работали над Cyc, когда это был проект в MCC (где Cyc был впервые запущен) или Cycorp.
См. также
[ редактировать ]- БабельНет
- Категорическая логика
- Китайская комната
- Язык разметки агентов DARPA
- ДБпедия
- Компьютер пятого поколения
- Бесплатная база
- GPT
- Крупномасштабная концептуальная онтология для мультимедиа
- Список известных проектов искусственного интеллекта
- Миндпиксель
- Бесконечное изучение языка
- Открытый разум, здравый смысл
- Семантическая сеть
- Предлагаемая верхняя объединенная онтология
- ШРДЛУ
- Истинное Знание
- ЗОНТИК
- Вольфрам Альфа
- ИЗБЕГАТЬ
Ссылки
[ редактировать ]- ^ Ленат, Дуглас Б.; Браун, Джон Сили (1 августа 1984 г.). «Почему am и eurisko работают». Искусственный интеллект . 23 (3): 269–294. CiteSeerX 10.1.1.565.8830 . дои : 10.1016/0004-3702(84)90016-X .
- ^ Ленат, Дуглас Б.; Борнинг, Алан; Макдональд, Дэвид; Тейлор, Крейг; Вейер, Стивен (1983). «Кноосфера: построение экспертных систем с энциклопедическими знаниями» . Материалы восьмой международной совместной конференции по искусственному интеллекту. Том 1 . IJCAI'83: 167–169.
- ^ Jump up to: а б Ленат, Дуглас . «Наследие Хэла: Компьютер 2001 года как мечта и реальность. С 2001 по 2001 год: здравый смысл и разум HAL» (PDF) . Cycorp, Inc. Архивировано (PDF) из оригинала 9 декабря 2019 г. Проверено 26 сентября 2006 г.
- ^ Вуд, Ламонт (2002). «Мир в коробке». Научный американец . 286 (1): 18–19. Бибкод : 2002SciAm.286a..18W . doi : 10.1038/scientificamerican0102-18 .
- ^ Ленат, Дуг; Пракаш, Маянк; Шеперд, Мэри (январь 1986 г.). «CYC: Использование знаний здравого смысла для преодоления хрупкости и узких мест в приобретении знаний [sic]» . Журнал ИИ . 6 (4): 65–85. ISSN 0738-4602 .
- ^ Jump up to: а б с д Ленат, Дуглас Б.; Гуха, Р.В. (июнь 1991 г.). «Эволюция CycL, языка представления Cyc». СИГАРТ Бык . 2 (3): 84–87. дои : 10.1145/122296.122308 . ISSN 0163-5719 . S2CID 10306053 .
- ^ Jump up to: а б Ленат, Дуглас Б.; Гуха, Р.В.; Питтман, Карен; Пратт, Декстер; Шеперд, Мэри (август 1990 г.). «Cyc: К программам со здравым смыслом». Коммун. АКМ . 33 (8): 30–49. дои : 10.1145/79173.79176 . ISSN 0001-0782 . S2CID 7296269 .
- ^ Jump up to: а б с д и Ленат, Дуглас Б.; Гуха, Р.В. (1989). Создание больших систем, основанных на знаниях; Представление и вывод в проекте Cyc (1-е изд.). Addison-Wesley Longman Publishing Co., Inc. Бостон, Массачусетс, США: ISBN 978-0201517521 .
- ^ Элкан, Чарльз; Грейнер, Рассел (1 мая 1993 г.). «Создание больших систем, основанных на знаниях: представление и вывод в циклическом проекте: Д.Б. Ленат и Р.В. Гуха». Искусственный интеллект . 61 (1): 41–52. дои : 10.1016/0004-3702(93)90092-П .
- ^ «Язык представления» . www.aaai.org . Проверено 27 ноября 2017 г.
- ^ Рассел, Грейнер (октябрь 1980 г.). RLL-1: Язык представления (отчет). Архивировано из оригинала 8 февраля 2015 года.
- ^ «Расписание — представление знаний и рассуждение: интеграция символического и нейронного подходов» . сайты.google.com . Проверено 28 ноября 2017 г.
- ^ «Интеграция Cyc и Википедии: фольсономия соответствует строго определенному здравому смыслу» (PDF) . Проверено 10 мая 2013 г.
- ^ «циклический механизм вывода» . Архивировано из оригинала 09.12.2019 . Проверено 4 июня 2015 г.
- ^ «Проект Texai с открытым исходным кодом» . Архивировано из оригинала 16 февраля 2009 г.
- ^ «Файлы проекта Texai SourceForge» .
- ^ «Сайкорп Продактс» . www.cyc.com . Проверено 29 ноября 2017 г.
- ^ ХИЛЦИК, МАЙКЛ А. (21 июня 2001 г.). «Рождение думающей машины» . Лос-Анджелес Таймс . ISSN 0458-3035 . Проверено 29 ноября 2017 г.
- ^ Крис Дитон; Блейк Шепард; Чарльз Кляйн; Корринн Майанс; Бретт Саммерс; Антуан Брюссо; Майкл Уитброк; Дуг Ленат (2005). «Комплексная база знаний о терроризме в Cyc». Материалы Международной конференции по анализу разведывательной информации 2005 года . CiteSeerX 10.1.1.70.9247 .
- ^ Дуглас Б. Ленат; Крис Дитон (апрель 2008 г.). БАЗА ЗНАНИЙ О ТЕРРОРИЗМЕ (ТКБ) Итоговый технический отчет (Технический отчет). Римский исследовательский центр, Рим, Нью-Йорк : Информационное управление исследовательской лаборатории ВВС . AFRL-RI-RS-TR-2008-125.
- ^ «Пример использования: хранилище семантического веб-контента для клинических исследований» . www.w3.org . Проверено 28 февраля 2018 г.
- ^ Ленат, Дуглас; Уитброк, Майкл; Бакстер, Дэвид; Блэкстоун, Юджин; Дитон, Крис; Шнайдер, Дэйв; Скотт, Джерри; Шепард, Блейк (28 июля 2010 г.). «Использование Cyc для ответа на специальные запросы клинических исследователей» . Журнал ИИ . 31 (3): 13. дои : 10.1609/aimag.v31i3.2299 . ISSN 0738-4602 .
- ^ Ленат, Дуглас Б.; Дурлах, Паула Дж. (1 сентября 2014 г.). «Укрепление математических знаний путем погружения учащихся в смоделированный опыт обучения через преподавание» . Международный журнал искусственного интеллекта в образовании . 24 (3): 216–250. дои : 10.1007/s40593-014-0016-x . ISSN 1560-4292 .
- ^ «Mathcraft от Cycorp» . www.mathcraft.ai . Проверено 29 ноября 2017 г.
- ^ Бертино, Пьеро и Зарриа 2001 , с. 275
- ^ Хаваси, Кэтрин (9 августа 2014 г.). «Кто рассуждает здраво и почему это важно» . ТехКранч . Проверено 29 ноября 2017 г.
- ^ Домингос, Педро (2015). Главный алгоритм: как поиски совершенной обучающейся машины изменят наш мир . Основные книги. ISBN 978-0465065707 .
- ^ Робин Хэнсон (1 декабря 2008 г.). «Преодоление предвзятости: я люблю CYC» . www.overcomingbias.com . Проверено 29 ноября 2017 г.
- ^ Jump up to: а б Баард, Марк (13 мая 2003 г.). «Основатель искусственного интеллекта раскритиковал современные исследования» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.
- ^ Найт, Уилл (14 марта 2016 г.). «ИИ, который потратил 30 лет на изучение здравого смысла, готов к работе» . Обзор технологий Массачусетского технологического института . Проверено 29 ноября 2017 г.
- ^ Дуг Ленат (15 мая 2017 г.). «Иногда видимости интеллекта недостаточно | CogWorld» . CognitiveWorld.com . Проверено 29 ноября 2017 г.
- ^ «Вычислительное право, символический дискурс и конституция искусственного интеллекта — блог Стивена Вольфрама» . blog.stephenwolfram.com . 12 октября 2016 г. Проверено 29 ноября 2017 г.
- ^ Дэвис, Эрнест; Маркус, Гэри (2015). «Здравый смысл и здравый смысл в области искусственного интеллекта». Коммуникации АКМ . 58 (9): 92–103. дои : 10.1145/2701413 . S2CID 13583137 .
- ^ Голдсмит, Джеффри (1 апреля 1994 г.). «ЦИК-О» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.
- ^ Кейд Мец (25 марта 2016 г.). «Одинокий крестовый поход одного гения за то, чтобы научить компьютер здравому смыслу» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.
- ^ Wired Staff (1 ноября 1998 г.). «Проводной 25» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.
Дальнейшее чтение
[ редактировать ]- Алан Беласко и др. (2004). «Эффективное представление пробелов в знаниях» . В: Д. Карагианнис, У. Раймер (ред.): Практические аспекты управления знаниями, Труды PAKM 2004, Вена, Австрия, 2–3 декабря 2004 г. Шпрингер-Верлаг, Берлин, Гейдельберг.
- Бертино, Элиза ; Пьеро, Джиан; Заррия, Британская Колумбия (2001). Интеллектуальные системы баз данных . Аддисон-Уэсли Профессионал.
- Джон Кабрал и другие (2005). «Преобразование семантического метазнания в индуктивное смещение» . В: Материалы 15-й Международной конференции по индуктивному логическому программированию . Бонн, Германия, август 2005 г.
- Джон Кертис и др. (2005). «Об эффективном использовании Cyc в вопросно-ответной системе» . В: Материалы семинара IJCAI по знаниям и рассуждениям для ответов на вопросы . Эдинбург, Шотландия: 2005 г.
- Крис Дитон и др. (2005). «Комплексная база знаний о терроризме в Cyc» . В: Материалы Международной конференции по анализу разведывательной информации 2005 г., Маклин, Вирджиния, май 2005 г.
- Кеннет Форбус и др. (2005) . «Объединение аналогии, интеллектуального поиска информации и интеграции знаний для анализа: предварительный отчет» . В: Материалы Международной конференции по анализу разведывательных данных 2005 г. , Маклин, Вирджиния, май 2005 г.
- Дуглас Фоксвог (2010), «Циклик». В: Теория и приложения онтологии: компьютерные приложения. Архивировано 12 ноября 2018 г. в Wayback Machine , Springer .
- Фриц Леманн и д. foxvog (1998), « Наложение плоти на кости: проблемы, возникающие при создании анатомических баз знаний с богатыми реляционными структурами ». В: Обмен знаниями в системах, основанных на биологических и медицинских знаниях , AAAI .
- Дуглас Ленат и Р.В. Гуха (1990). Построение больших систем, основанных на знаниях: представление и вывод в проекте Cyc . Аддисон-Уэсли. ISBN 0-201-51752-3 .
- Джеймс Мастерс (2002). «Структурированная интеграция источников знаний и ее применение к объединению информации» . В: Материалы Пятой Международной конференции по информационному синтезу . Аннаполис, Мэриленд, июль 2002 г.
- Джеймс Мастерс и З. Гюнгорду (2003). «Интеграция структурированных источников знаний: отчет о ходе работы» в: Интеграция наукоемких мультиагентных систем . Кембридж, Массачусетс, США, 2003 г.
- Синтия Матушек и др. (2006). «Введение в синтаксис и содержание Cyc». . В: Учеб. весеннего симпозиума AAAI 2006 года по формализации и обобщению базовых знаний и их применениям к представлению знаний и ответам на вопросы . Стэнфорд, 2006 г.
- Синтия Матушек и др. (2005) . «В поисках здравого смысла: заполнение Cyc из Интернета» . В: Материалы двадцатой национальной конференции по искусственному интеллекту . Питтсбург, Пенсильвания, июль 2005 г.
- Том О'Хара и др. (2003). «Построение критериев для лексических сопоставлений массовых существительных с использованием базы знаний Cyc и ее расширения для WordNet» . В: Материалы пятого международного семинара по вычислительной семантике . Тилбург, 2003.
- Фабрицио Морбини и Ленхарт Шуберт (2009). «Оценка ЭПИЛОГА: обоснование эпизодической логики» . Университет Рочестера, конференция Commonsense '09 (описывает библиотеку Cyc, содержащую около 1600 «тестов здравого смысла»)
- Кэти Пантон и др. (2002). «Формирование знаний и диалог с использованием набора инструментов KRAKEN» . В: Восемнадцатая национальная конференция по искусственному интеллекту . Эдмонтон, Канада, 2002 г.
- Дипак Рамачандран П. Рейган и К. Гулсби (2005). «Первоупорядоченный ResearchCyc: выразительность и эффективность в онтологии здравого смысла». Архивировано 24 марта 2014 г. в Wayback Machine . В: Документы семинара AAAI по контекстам и онтологиям: теория, практика и приложения . Питтсбург, Пенсильвания, июль 2005 г.
- Стивен Рид и Д. Ленат (2002). «Отображение онтологий в Cyc» . В: Семинар конференции AAAI 2002 по онтологиям семантической сети . Эдмонтон, Канада, июль 2002 г.
- Бенджамин Роде и др. (2005). «К модели восстановления шаблонов в реляционных данных» . В: Материалы Международной конференции по анализу разведывательной информации 2005 года . Маклин, Вирджиния, май 2005 г.
- Дэйв Шнайдер и др. (2005). «Сбор и обработка фактов для разведывательного анализа» . В: Материалы Международной конференции по анализу разведывательной информации 2005 года . Маклин, Вирджиния, май 2005 г.
- Шнайдер Д. и Витброк МД (май 2015 г.). «Грамматика семантического построения: преодоление разрыва между NL и логикой» В материалах 24-й Международной конференции по Всемирной паутине (стр. 673–678).
- Блейк Шепард и др. (2005). «Подход к сетевой безопасности, основанный на знаниях: применение Cyc в области оценки сетевых рисков» . В: Материалы семнадцатой конференции по инновационным применениям искусственного интеллекта . Питтсбург, Пенсильвания, июль 2005 г.
- Ник Сигел и др. (2004). «Агентные архитектуры: сочетание сильных сторон программной инженерии и когнитивных систем» . В: Документы семинара AAAI по архитектурам интеллектуальных агентов: сочетание сильных сторон программной инженерии и когнитивных систем . Технический отчет WS-04-07, стр. 74–79. Менло-Парк, Калифорния: AAAI Press, 2004.
- Ник Сигел и др. (2005). Генерация гипотез и сбор доказательств для анализа разведывательных данных: приложение Cycorp Nooscape» . В материалах Международной конференции по анализу разведывательных данных 2005 г., Маклин, Вирджиния, май 2005 г.
- Майкл Уитброк и др. (2002). «Интерактивная диалоговая система для приобретения знаний в Cyc» . В: Материалы восемнадцатой международной совместной конференции по искусственному интеллекту . Акапулько, Мексика, 2003 г.
- Майкл Уитброк и др. (2004). «Автоматическое аннотирование OWL на основе большой базы знаний» . В: Заметки семинара 2004 г. по разметке знаний и семантической аннотации на 3-й Международной конференции по семантической сети ISWC2004 . Хиросима, Япония, ноябрь 2004 г., стр. 71–80.
- Майкл Уитброк и др. (2005). «Знания порождают знания: шаги к приобретению знаний с помощью Cyc» . В: Материалы весеннего симпозиума AAAI 2005 г. по сбору знаний от волонтеров (KCVC) . стр. 99–105. Стэнфорд, Калифорния, март 2005 г.
- Уильям Джаррольд (2001). «Проверка интеллекта в больших системах, основанных на правилах, со здравым смыслом» . «Проверка разведывательных данных на основе моделей: материалы симпозиума AAAI 2001 года» (Технический отчет AAAI SS-01-04).
- Уильям Джарролд. (2003). Использование онтологии для оценки большой онтологии, основанной на правилах: теория и практика . {\em Показатели производительности интеллектуальных систем PerMIS '03} (Специальная публикация NIST 1014).