Jump to content

Цикл

Оригинальный автор(ы) Дуглас Ленат
Разработчик(и) Сайкорп, Инк.
Первоначальный выпуск 1984 год ; 40 лет назад ( 1984 )
Стабильная версия
6.1 / 27 ноября 2017 г .; 6 лет назад ( 27.11.2017 )
Написано в Лисп , Цикл , СубЛ
Тип Онтология и база знаний , представления знаний язык и механизм вывода
Веб-сайт www .cyc

Cyc (произносится / ˈ s k / SYKE ) — это долгосрочный проект искусственного интеллекта , целью которого является сбор комплексной онтологии и базы знаний , охватывающей основные концепции и правила того, как устроен мир. Надеясь охватить знания, основанные на здравом смысле , Cyc фокусируется на неявных знаниях , которые другие платформы искусственного интеллекта могут воспринимать как нечто само собой разумеющееся. Это контрастирует с фактами, которые можно найти где-то в Интернете или получить через поисковую систему или Википедию. Cyc позволяет специалистам по семантическому рассуждению рассуждать, как у человека, и быть менее «хрупкими» при столкновении с новыми ситуациями.

Дуглас Ленат начал проект в июле 1984 года в MCC , где он был главным научным сотрудником в 1984–1994 годах, а затем, с января 1995 года, находился под активной разработкой компании Cycorp , где был генеральным директором .

Обзор [ править ]

Потребность в таком масштабном символическом проекте искусственного интеллекта возникла в начале 1980-х годов. Первые исследователи ИИ за предыдущие 25 лет имели богатый опыт работы с программами ИИ, которые давали обнадеживающие результаты на ранней стадии, но затем не могли «масштабироваться» — выходить за рамки «обучающего набора» для решения более широкого круга случаев. Дуглас Ленат и Алан Кей предупредили об этой необходимости. [1] [2] [3] и в 1983 году они организовали встречу в Стэнфорде для решения этой проблемы.

Предварительные расчеты Лената, Кея и их коллег (включая Марвина Мински , Аллена Ньюэлла , Эдварда Фейгенбаума и Джона Маккарти ) показали, что эти усилия потребуют от 1000 до 3000 человеко-лет усилий. События, произошедшие в течение года после этой встречи, позволили начать работу такого масштаба.

Проект начался в июле 1984 года как флагманский проект Корпорации микроэлектроники и компьютерных технологий (MCC) со штатом в 400 человек, исследовательского консорциума, созданного двумя дюжинами крупных американских корпораций, «чтобы противостоять зловещим на тот момент усилиям Японии в области искусственного интеллекта, столь так называемый проект « пятого поколения ». [4] Правительство США отреагировало на угрозу «пятого поколения», приняв Закон о национальных совместных исследованиях 1984 года, который впервые позволил американским компаниям «вступать в сговор» при проведении долгосрочных, высокорискованных и высокооплачиваемых исследований, а MCC и Sematech начали воспользуйтесь этой десятилетней возможностью. Первым президентом и генеральным директором MCC был Бобби Рэй Инман , бывший директор АНБ и заместитель директора ЦРУ.

Целью проекта Cyc было систематизировать в машинной форме миллионы знаний, составляющих человеческий здравый смысл. [5] Попутно это повлекло за собой (1) разработку адекватно выразительного языка представления CycL , [6] (2) разработка онтологии, охватывающей все человеческие концепции до определенного уровня детализации, [7] (3) разработка базы знаний на основе этой онтологической структуры, [7] включающий все человеческие знания об этих концепциях до определенного уровня детализации и (4) разработку механизма вывода в геометрической прогрессии, чем те, которые использовались в традиционных на тот момент экспертных системах, [8] [9] иметь возможность делать такие же выводы и глубины, на которые способны люди, учитывая их знания о мире.

Немного подробнее:

  • Язык представления CycL возник как расширение RLL. [10] [11] (так называемый язык представления, разработанный в 1979–1980 годах Ленатом и его аспирантом Расселом Грейнером во время учебы в Стэнфордском университете), но уже через несколько лет после запуска проекта Cyc стало ясно, что даже представление типичного новостного сюжета или роман, или реклама потребовали бы чего-то большего, чем просто выразительная сила полной логики первого порядка , а именно исчисления предикатов второго порядка («Какова связь между дождем и водой?»), а затем даже логики более высокого уровня, включая модальную логику , рефлексия (позволяющая системе рассуждать о своем прогрессе на данный момент по проблеме, над которой она работает) и контекстная логика (позволяющая системе явно рассуждать о контекстах, в которых могут иметь место ее различные посылки и выводы), немонотонные логика и ограничения . К 1989 году [6] CycL расширил свою выразительную силу до логики высшего порядка (HOL).
    • Представления с тройным хранилищем (сродни языкам представления кадров и слотов 1970-х годов, из которых произошел RLL) сегодня широко распространены в ИИ. Возможно, будет полезно привести несколько примеров, которые подчеркивают или разрушают этот тип представления, типичных для примеров, которые вынудили проект Cyc перейти от трехэтажного представления к гораздо более выразительному в период 1984–1989 годов: [6] Английские предложения, включающие отрицания («У Фреда нет собаки»), вложенные квантификаторы («У каждого американца есть мать» означает «для всех x существует y… но «У каждого американца есть президент» означает «существует y»). такие, что для всех x...), вложенные модальные окна, такие как «Соединенные Штаты считают, что Германия хочет, чтобы НАТО избегало преследования...», и даже неудобно представлять в Triplestore отношения с арностью выше 2, например: «Лос-Анджелес находится между Сан-Диего и Сан-Франциско по шоссе US101».
  • Онтология Cyc выросла примерно до 100 000 терминов в течение первого десятилетия проекта, до 1994 года, и по состоянию на 2017 год содержала около 1 500 000 терминов. Эта онтология включала в себя:
    • 416 000 коллекций (типы, сорта, естественные виды , которые включают в себя как типы вещей, такие как Рыба, так и типы действий, такие как Рыбалка)
    • чуть более миллиона человек, представляющих
      • 42 500 предикатов (отношения, атрибуты, поля, свойства, функции),
      • около миллиона общеизвестных организаций, таких как TheUnitedStatesOfAmerica, BarackObama, TheSigningOfTheUSDeclarationOfIndependentence и т. д.
      • присутствует произвольно большое количество дополнительных терминов В онтологии Cyc также неявно в том смысле, что существуют функции, обозначающие термины, такие как CalendarYearFn (если указан аргумент 2016, он обозначает 2016 календарный год), GovernmentFn (если задан аргумент Франция обозначает правительство Франции), метр (при использовании аргумента 2016 он обозначает расстояние в 2,016 километра), а также вложения и композиции таких терминов, обозначающих функции.
  • База знаний Cyc, состоящая из общих правил здравого смысла и утверждений, включающих эти онтологические термины, была в значительной степени создана путем написания аксиом вручную; в 1994 году оно выросло примерно до 1 миллиона, а по состоянию на 2017 год составляет около 24,5 миллиона, и на его строительство ушло более 1000 человеко-лет.
    • Важно понимать, что инженеры-онтологи Cyc стремятся сохранить эти числа как можно меньшими , а не раздувать их, пока не уменьшается дедуктивная замкнутость базы знаний. Предположим, Цику рассказывают об одном миллиарде отдельных людей, животных и т. д. Тогда можно было бы сказать 10 18 факты вида «Микки Маус — это не тот же человек, что <Лось Буллвинкль/Авраам Линкольн/Дженнифер Лопес>». Но вместо этого можно было бы назвать Cyc 10 000 правил таксономии Линнея, за которыми следует всего 10 8 правила вида «Никакая мышь – лось». И, что еще более компактно, вместо этого Cyc можно было бы просто дать эти 10 000 правил таксономии Линнея, за которыми следует только одно правило вида: «Для любых двух таксонов Линнея, если ни один из них явно не является супертаксоном другого, то они не пересекаются». Эти 10 001 утверждение имеют такое же дедуктивное заключение, как и упомянутые ранее 10 утверждений. 18 факты.
  • Конструкция механизма вывода Cyc отделяет эпистемологическую проблему (какое содержимое должно быть в базе данных Cyc) от эвристической проблемы (как Cyc может эффективно выводить аргументы на глубину сотен шагов в море десятков миллионов аксиом). Для первого случая может быть достаточно языка CycL и хорошо понятного логического вывода. Для последнего Cyc использовал архитектуру сообщества агентов, где специализированные модули рассуждения, каждый со своей собственной структурой данных и алгоритмом, «поднимали руку», если они могли эффективно добиться прогресса в любой из открытых в настоящее время подзадач. К 1994 году таких модулей эвристического уровня (HL) было 20; [8] по состоянию на 2017 год насчитывается более 1050 модулей HL. [12]
    • Некоторые из этих модулей HL являются очень общими, например модуль, который кэширует звезду Клини ( транзитивное замыкание ) всех часто используемых транзитивных отношений в онтологии Cyc.
    • Некоторые из них ориентированы на предметную область, например, балансировщик химических уравнений. Это могут быть и часто являются «бегом» (указателем) к какой-либо внешней программе, веб-сервису или онлайн-базе данных, например, к модулю для быстрого «вычисления» текущего населения города, зная, где и как его посмотреть. вверх.

CycL имеет общедоступную спецификацию, а десятки модулей HL описаны в учебнике Лената и Гухи. [8] но фактический код механизма вывода Cyc и полный список из более чем 1000 модулей HL являются собственностью Cycorp. [3]

Название «Cyc» (от слова «энциклопедия», произносится [saɪk] как « syke ») является зарегистрированным товарным знаком, принадлежащим Cycorp. Доступ к Cyc осуществляется через платные лицензии, но добросовестным исследовательским группам в области ИИ предоставляются бесплатные лицензии только на исследования (см. ResearchCyc ); По состоянию на 2017 год такими лицензиями обладают более 600 таких групп по всему миру.

Типичными фрагментами знаний, представленными в базе знаний Cyc, являются «Каждое дерево — это растение» и «Растения рано или поздно умирают». Когда его спрашивают, умирают ли деревья, машина вывода может сделать очевидный вывод и правильно ответить на вопрос.

Большая часть знаний Сайка, за исключением математики, верна только по умолчанию. Например, Cyc знает, что по умолчанию родители любят своих детей, люди улыбаются, когда счастливы, первый шаг ребенка — это большое достижение, люди счастливы, когда у любимого человека есть большое достижение, и только у взрослых есть дети. Когда его спрашивают, есть ли на картинке с подписью «Кто-то наблюдает, как его дочь делает свой первый шаг» улыбающийся взрослый человек, Сайк может логически сделать вывод, что ответ — «Да» , и «показать его работу», представив пошаговый логический аргумент, используя эти пять знаний из своей базы знаний. Они сформулированы на языке CycL , который основан на исчислении предикатов и имеет синтаксис, аналогичный синтаксису языка программирования Lisp .

В 2008 году ресурсы Cyc были сопоставлены со многими Википедии . статьями [13] Cyc в настоящее время подключен к Викиданным . В будущих планах Cyc может быть подключен как к DBpedia , так и к Freebase .

Большая часть текущей работы Cyc по-прежнему связана с инженерией знаний , представлением фактов о мире вручную и реализацией эффективных механизмов вывода на основе этих знаний. Однако работа Cycorp все чаще предполагает предоставление системе Cyc возможности общаться с конечными пользователями на естественном языке , а также помогать в текущем процессе формирования знаний посредством машинного обучения и понимания естественного языка . Еще одним крупным достижением Cycorp является создание набора инструментов онтологического проектирования на базе Cyc, позволяющего снизить порог входа для отдельных лиц, которые могут вносить свой вклад, редактировать, просматривать и запрашивать Cyc.

Как и многие компании, Cycorp планирует использовать систему обработки естественного языка Cyc для анализа всего Интернета с целью извлечения структурированных данных; в отличие от всех остальных, он способен призвать саму систему Cyc действовать как индуктивная предвзятость и как судья двусмысленности , метафоры и многоточия . Систематических контрольных исследований производительности Cyc мало, если они вообще вообще есть.

База знаний [ править ]

Имена понятий в Cyc являются терминами или константами CycL . [6] Константы начинаются с необязательного #$ и чувствительны к регистру. Существуют константы для:

  • Отдельные элементы, известные как отдельные лица , такие как #$BillClinton или #$France.
  • Коллекции , такие как #$Tree-ThePlant (содержащий все деревья) или #$EquivalenceRelation (содержащий все отношения эквивалентности ). Член коллекции называется экземпляром этой коллекции. [8]
  • Функции , которые создают новые термины из заданных. Например, #$FruitFn, если ему предоставлен аргумент, описывающий тип (или коллекцию) растений, вернет коллекцию его плодов. По соглашению, функциональные константы начинаются с заглавной буквы и заканчиваются строкой Fn.
  • Функции истины , которые могут применяться к одному или нескольким другим понятиям и возвращать либо истину, либо ложь. Например, #$siblings — это родственное отношение, истинное, если два аргумента являются одноуровневыми. По соглашению константы функции истинности начинаются со строчной буквы. Функции истинности могут быть разбиты на логические связки (например, #$and, #$or, #$not, #$implies), кванторы ( #$forAll, #$thereExistsи т. д.) и предикаты .

Два важных бинарных предиката: #$isa и #$genls. Первый описывает, что один элемент является экземпляром некоторой коллекции, второй — что одна коллекция является подколлекцией другой. Факты о понятиях утверждаются с помощью определенных предложений CycL . Предикаты пишутся перед аргументами в круглых скобках:

(#$isa #$БиллКлинтон #$Президент Соединенных Штатов) 

«Билл Клинтон принадлежит к коллекции президентов США».

(#$genls #$Tree-ThePlant #$Plant) 

«Все деревья — растения».

(#$capitalCity #$Франция #$Париж) 

«Париж — столица Франции».

Предложения также могут содержать переменные, строки, начинающиеся с ?. Эти предложения называются «правилами». В отношении #$isa предикат гласит:

(#$ подразумевает   (#$и     (#$isa ?OBJ ?SUBSET)     (#$genls ?SUBSET ?SUPERSET))   (#$isa ?OBJ ?SUPERSET)) 

"Если OBJ является экземпляром коллекции SUBSET и SUBSET представляет собой подколлекцию SUPERSET, затем OBJ является экземпляром коллекции SUPERSET". Другой типичный пример -

(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal) 

это означает, что для каждого экземпляра коллекции #$ChordataPhylum (т.е. для каждого хордового ) существует самка животного (пример #$FemaleAnimal), которая является его матерью (описываемой предикатом #$biologicalMother). [8]

База знаний разделена на микротеории (МТ), коллекции концепций и фактов, обычно относящиеся к одной конкретной области знаний. В отличие от базы знаний в целом, каждая микротеория должна быть свободна от монотонных противоречий. Каждая микротеория является первоклассным объектом онтологии Cyc; у него есть имя, которое является обычной константой; Константы микротеории содержат строку Mt по соглашению. Примером является #$MathMt, микротеория, содержащая математические знания. Микротеории могут наследовать друг друга и организованы в иерархию: одна специализация #$MathMt является #$GeometryGMt, микротеория о геометрии.

Механизм вывода [ править ]

Механизм вывода — это компьютерная программа, которая пытается получить ответы из базы знаний.Механизм вывода Cyc выполняет общий логический вывод (включая modus ponens , modus tollens , универсальную количественную оценку и экзистенциальную количественную оценку ). [14] Он также выполняет индуктивные рассуждения , статистическое машинное обучение и символическое машинное обучение, а также абдуктивные рассуждения (но, конечно, экономно и используя существующую базу знаний в качестве фильтра и руководства).

Релизы [ править ]

OpenCyc [ править ]

Первая версия OpenCyc была выпущена весной 2002 года и содержала всего 6000 концепций и 60 000 фактов. База знаний выпущена под лицензией Apache . Cycorp заявила о своем намерении выпустить OpenCyc под параллельными неограниченными лицензиями для удовлетворения потребностей своих пользователей. Интерпретатор CycL и SubL (программа, позволяющая пользователям просматривать и редактировать базу данных, а также делать выводы) был выпущен бесплатно, но только в виде двоичного файла, без исходного кода. Он был доступен для Linux и Microsoft Windows . Texai с открытым исходным кодом [15] проект выпустил RDF -совместимый контент, извлеченный из OpenCyc. [16] Версия OpenCyc 4.0 была выпущена в июне 2012 года. OpenCyc 4.0 включала большую часть онтологии Cyc того времени, содержащую сотни тысяч терминов, а также миллионы утверждений, связывающих термины друг с другом; однако это в основном таксономические утверждения, а не сложные правила, доступные в Cyc. База знаний OpenCyc 4.0 содержала 239 000 концепций и 2 093 000 фактов.

Основная цель выпуска OpenCyc заключалась в том, чтобы помочь исследователям ИИ понять, чего не хватает в том, что они теперь называют онтологиями и графами знаний . Полезно и важно иметь правильно классифицированные понятия, такие как человек, ночь, сон, лежание, бодрствование, счастье и т. д., но в контенте OpenCyc отсутствуют эти термины, но присутствуют в контенте Cyc KB, так это различные Эмпирические правила, которые большинство из нас разделяют в отношении этих терминов: что (по умолчанию в ModernWesternHumanCultureMt) каждый человек спит ночью, спит лежа, его можно разбудить, он не рад, что его разбудили, и так далее. Этот момент не требует постоянного обновления версий OpenCyc, поэтому с 2017 года OpenCyc больше не доступен.

ResearchCyc [ править ]

В июле 2006 года Cycorp бесплатно выпустила исполняемый файл ResearchCyc 1.0, версии Cyc, предназначенной для исследовательского сообщества. (ResearchCyc находился на стадии бета-разработки в течение всего 2004 г.; бета-версия была выпущена в феврале 2005 г.) Помимо таксономической информации, содержащейся в OpenCyc, ResearchCyc включает значительно больше семантических знаний (т. е. дополнительных фактов и практических правил), включающих концепции в его базе знаний; он также включает в себя большой словарный запас, английского языка инструменты синтаксического анализа и генерации Java , а также интерфейсы на основе для редактирования и запроса знаний. Кроме того, он содержит систему интеграции данных на основе онтологий . По состоянию на 2017 год регулярные выпуски ResearchCyc продолжали появляться: 600 исследовательских групп по всему миру бесплатно использовали лицензии для некоммерческих исследовательских целей. По состоянию на декабрь 2019 года ResearchCyc больше не поддерживается. Cycorp планирует улучшить и пересмотреть инструменты для внешних разработчиков в ближайшие годы.

Приложения [ править ]

Было зарегистрировано более ста успешных применений Cyc; [17] Здесь перечислены несколько взаимно непохожих экземпляров:

Менеджер/интегратор по тезаурусу фармацевтических терминов [ править ]

Уже более десяти лет Glaxo использует Cyc для полуавтоматической интеграции всех больших (сотни тысяч терминов) тезаурусов терминов фармацевтической промышленности, которые отражают различное использование в разных компаниях, странах, годах и подотраслях. [18] Эта задача интеграции онтологий требует знаний предметной области, поверхностных семантических знаний, а также сколь угодно глубоких знаний и рассуждений, основанных на здравом смысле. Фармацевтический словарь варьируется в зависимости от страны, (под)отрасли, компании, отдела и десятилетий. Например, что такое гель-пак ? Каково «уличное название» ранитидина гидрохлорида ? Каждый из этих n контролируемых словарей представляет собой онтологию, содержащую примерно 300 тысяч терминов. Исследователям Glaxo необходимо создать запрос в своем текущем словаре , перевести его в нейтральное «истинное значение», а затем преобразовать его в противоположном направлении, чтобы найти потенциальные совпадения с документами, каждый из которых был написан в соответствии с определенным известным словарем. .

Для этого вручную был задействован большой штат сотрудников. Cyc используется в качестве универсального интерлингва, способного представлять объединение «истинных значений» всех терминов и способного представлять 300 тысяч преобразований между каждым из этих контролируемых словарей и Cyc, тем самым преобразуя задачу n² в линейную без введения обычная "телефонная игра" с затуханием смысла. Более того, Cyc создает каждое из этих 300 тысяч сопоставлений для каждого тезауруса в значительной степени автоматически.

База знаний по терроризму [ править ]

Комплексная база знаний о терроризме представляла собой разрабатываемое приложение Cyc, которое пыталось в конечном итоге содержать все соответствующие знания о «террористических» группах, их членах, лидерах, идеологии, основателях, спонсорах, связях, объектах, местоположении, финансах, возможностях, намерениях, поведении. , тактика и полные описания конкретных террористических событий. Знания хранятся в виде утверждений математической логики, пригодных для компьютерного понимания и рассуждений. [19] [20]

клиники Фонд Кливлендской

Клиника Кливленда использовала Cyc для разработки интерфейса запроса биомедицинской информации на естественном языке , охватывающего десятилетия информации о кардиоторакальных операциях. [21] Запрос анализируется в набор фрагментов CycL (логика высшего порядка) с открытыми переменными (например, «этот вопрос говорит о человеке, у которого развилась инфекция эндокардита», «этот вопрос говорит о подгруппе пациентов Кливлендской клиники, которые перенес там операцию в 2009 году» и др.); затем применяются различные ограничения (знания в области медицины, здравый смысл, прагматика дискурса, синтаксис), чтобы увидеть, как эти фрагменты могут объединиться в один семантически значимый формальный запрос; примечательно, что в большинстве случаев существует ровно один и только один такой способ включения и интеграции этих фрагментов. [22] Интеграция фрагментов включает в себя (i) решение, какие открытые переменные и в каких фрагментах фактически представляют одну и ту же переменную, и (ii) для всех конечных переменных решить, какой порядок и объем количественной оценки должна иметь эта переменная, а также какой тип (универсальный или экзистенциальный). . Этот логический запрос (CycL) затем преобразуется в запрос SPARQL , который передается в CCF SemanticDB, которая является озером данных .

MathCraft [ править ]

Приложение One Cyc призвано помочь ученикам 6-го класса заниматься математикой, помогая им гораздо глубже понять этот предмет. [23] Оно основано на опыте, когда мы часто думали , что понимаем что-то, но по-настоящему поняли это только после того, как нам пришлось объяснять или учить этому кого-то другого. В отличие от почти всех других образовательных программ, где компьютер играет роль учителя, это приложение Cyc, называемое MathCraft, [24] Cyc играет роль сокурсника, который всегда немного более сбит с толку, чем вы, пользователь, в этом предмете. Роль пользователя состоит в том, чтобы наблюдать за аватаром Cyc и давать ему советы, исправлять его ошибки, наставлять его, заставлять его видеть, что он делает неправильно и т. д. Поскольку пользователь дает хороший совет, Cyc позволяет аватару совершать меньше ошибок такого типа. , следовательно, с точки зрения пользователя кажется, что пользователь только что успешно научил его чему-то. Это вариант обучения через обучение .

Критика [ править ]

Проект Cyc был описан как «одно из самых противоречивых проектов в истории искусственного интеллекта». [25] Кэтрин Хаваси , генеральный директор Luminoso, говорит, что Cyc является проектом-предшественником IBM Watson . [26] Ученый в области машинного обучения Педро Домингос называет проект «катастрофическим провалом» по нескольким причинам, включая бесконечный объем данных, необходимых для получения каких-либо жизнеспособных результатов, и неспособность Cyc развиваться самостоятельно. [27]

Робин Хэнсон , профессор экономики Университета Джорджа Мейсона, дает более взвешенный анализ:

Конечно, проект CYC открыт для критики по поводу многих его конкретных решений. Люди жаловались на его логические и языковые представления, на выбор прототипов случаев для построения (например, статьи в энциклопедии), на то, что он сосредоточен на ответах, а не на действиях, на то, как часто он перестраивает, а не поддерживает устаревшие системы, и о конфиденциальности и публикации всего. Но любой крупный проект, подобный этому, может вызвать такие споры, и не очевидно, что какой-либо из его решений был серьезно ошибочным. Им нужно было с чего-то начинать, и, по моему мнению, теперь они собрали базу знаний поистине впечатляющего размера, масштаба и интеграции. Другие архитектуры вполне могут работать лучше, но если знание лотов настолько важно, как думает Ленат, я ожидаю серьезных попыток ИИ импортировать знания CYC, переводя их в новое представление. Ни один другой источник не может сравниться с CYC по размеру, объему и интеграции. [28]

Аналогичное мнение выразил Марвин Мински : «К сожалению, стратегии, наиболее популярные среди исследователей ИИ в 1980-х годах, зашли в тупик», — сказал Мински. Так называемые « экспертные системы », которые имитировали человеческий опыт в четко определенных предметных областях, таких как право и медицина, могли сопоставлять запросы пользователей с соответствующими диагнозами, статьями и рефератами, но они не могли изучить концепции, которые большинство детей знают к тому времени, когда они начинают учиться. 3 года. «Для каждого типа проблем, — сказал Мински, — создание экспертных систем приходилось начинать заново, потому что они не накапливали знания здравого смысла». По словам Мински, только один исследователь взял на себя колоссальную задачу по созданию комплексной системы рассуждений, основанной на здравом смысле. Дуглас Ленат в рамках своего проекта Cyc руководил построчным вводом более 1 миллиона правил в базу знаний здравого смысла. [29]

Гэри Маркус , профессор психологии и нейронауки в Нью-Йоркском университете и соучредитель компании Geometric Intelligence, занимающейся искусственным интеллектом, говорит, что «это представляет собой подход, который сильно отличается от всех вещей глубокого обучения, которые были в новостях». [30] Это согласуется с позицией Дуга Лената о том, что «иногда видимости интеллекта недостаточно». [31]

Стивен Вольфрам пишет:

На заре развития искусственного интеллекта было много дискуссий о «представлении знаний» с подходами, основанными на грамматике естественного языка, структуре логики предикатов или формализме баз данных. Было предпринято очень мало крупномасштабных проектов (ярким контрпримером является Cyc Дуга Лената). [32]

Маркус пишет:

Эта область могла бы выиграть, если бы CYC систематически описывалась и оценивалась. Если CYC решил значительную часть здравого смысла, то очень важно знать это как полезный инструмент и как отправную точку для дальнейших исследований. Если ДЮК столкнулся с трудностями, было бы полезно извлечь уроки из допущенных ошибок. Если CYC совершенно бесполезен, то исследователи могут, по крайней мере, перестать беспокоиться о том, изобретают ли они велосипед заново. [33]

появляется новая Каждые несколько лет с момента начала публикации (1993 г.) в журнале Wired Magazine статья о Cyc. [34] [29] [35] некоторые положительные и некоторые отрицательные (включая одну проблему [36] который содержал по одному каждому).

Известные сотрудники [ править ]

Это список некоторых известных людей, которые работают или работали над Cyc, когда это был проект в MCC (где Cyc был впервые запущен) или Cycorp.

См. также [ править ]

Ссылки [ править ]

  1. ^ Ленат, Дуглас Б.; Браун, Джон Сили (1 августа 1984 г.). «Почему am и eurisko работают». Искусственный интеллект . 23 (3): 269–294. CiteSeerX   10.1.1.565.8830 . дои : 10.1016/0004-3702(84)90016-X .
  2. ^ Ленат, Дуглас Б.; Борнинг, Алан; Макдональд, Дэвид; Тейлор, Крейг; Вейер, Стивен (1983). «Кноосфера: построение экспертных систем с энциклопедическими знаниями» . Материалы восьмой международной совместной конференции по искусственному интеллекту. Том 1 . IJCAI'83: 167–169.
  3. Перейти обратно: Перейти обратно: а б Ленат, Дуглас . «Наследие Хэла: Компьютер 2001 года как мечта и реальность. С 2001 по 2001 год: здравый смысл и разум HAL» (PDF) . Cycorp, Inc. Архивировано (PDF) из оригинала 9 декабря 2019 г. Проверено 26 сентября 2006 г.
  4. ^ Вуд, Ламонт (2002). «Мир в коробке». Научный американец . 286 (1): 18–19. Бибкод : 2002SciAm.286a..18W . doi : 10.1038/scientificamerican0102-18 .
  5. ^ Ленат, Дуг; Пракаш, Маянк; Шеперд, Мэри (январь 1986 г.). «CYC: Использование знаний здравого смысла для преодоления хрупкости и узких мест в приобретении знаний [sic]» . Журнал ИИ . 6 (4): 65–85. ISSN   0738-4602 .
  6. Перейти обратно: Перейти обратно: а б с д Ленат, Дуглас Б.; Гуха, Р.В. (июнь 1991 г.). «Эволюция CycL, языка представления Cyc». СИГАРТ Бык . 2 (3): 84–87. дои : 10.1145/122296.122308 . ISSN   0163-5719 . S2CID   10306053 .
  7. Перейти обратно: Перейти обратно: а б Ленат, Дуглас Б.; Гуха, Р.В.; Питтман, Карен; Пратт, Декстер; Шепард, Мэри (август 1990 г.). «Cyc: К программам со здравым смыслом». Коммун. АКМ . 33 (8): 30–49. дои : 10.1145/79173.79176 . ISSN   0001-0782 . S2CID   7296269 .
  8. Перейти обратно: Перейти обратно: а б с д и Ленат, Дуглас Б.; Гуха, Р.В. (1989). Создание больших систем, основанных на знаниях; Представление и вывод в проекте Cyc (1-е изд.). Addison-Wesley Longman Publishing Co., Inc. Бостон, Массачусетс, США: ISBN  978-0201517521 .
  9. ^ Элкан, Чарльз; Грейнер, Рассел (1 мая 1993 г.). «Создание больших систем, основанных на знаниях: представление и вывод в проекте cyc: Д.Б. Ленат и Р.В. Гуха». Искусственный интеллект . 61 (1): 41–52. дои : 10.1016/0004-3702(93)90092-П .
  10. ^ «Язык представления» . www.aaai.org . Проверено 27 ноября 2017 г.
  11. ^ Рассел, Грейнер (октябрь 1980 г.). RLL-1: Язык представления (отчет). Архивировано из оригинала 8 февраля 2015 года.
  12. ^ «Расписание — представление знаний и рассуждение: интеграция символического и нейронного подходов» . сайты.google.com . Проверено 28 ноября 2017 г.
  13. ^ «Интеграция Cyc и Википедии: фольсономия соответствует строго определенному здравому смыслу» (PDF) . Проверено 10 мая 2013 г.
  14. ^ «циклический механизм вывода» . Архивировано из оригинала 09.12.2019 . Проверено 4 июня 2015 г.
  15. ^ «Проект Texai с открытым исходным кодом» . Архивировано из оригинала 16 февраля 2009 г.
  16. ^ «Файлы проекта Texai SourceForge» .
  17. ^ «Сайкорп Продактс» . www.cyc.com . Проверено 29 ноября 2017 г.
  18. ^ ХИЛЦИК, МАЙКЛ А. (21 июня 2001 г.). «Рождение думающей машины» . Лос-Анджелес Таймс . ISSN   0458-3035 . Проверено 29 ноября 2017 г.
  19. ^ Крис Дитон; Блейк Шепард; Чарльз Кляйн; Корринн Майанс; Бретт Саммерс; Антуан Брюссо; Майкл Уитброк; Дуг Ленат (2005). «Комплексная база знаний о терроризме в Cyc». Материалы Международной конференции по анализу разведывательной информации 2005 года . CiteSeerX   10.1.1.70.9247 .
  20. ^ Дуглас Б. Ленат; Крис Дитон (апрель 2008 г.). БАЗА ЗНАНИЙ О ТЕРРОРИЗМЕ (ТКБ) Итоговый технический отчет (Технический отчет). Римский исследовательский центр, Рим, Нью-Йорк : Информационное управление исследовательской лаборатории ВВС . AFRL-RI-RS-TR-2008-125.
  21. ^ «Пример использования: хранилище семантического веб-контента для клинических исследований» . www.w3.org . Проверено 28 февраля 2018 г.
  22. ^ Ленат, Дуглас; Уитброк, Майкл; Бакстер, Дэвид; Блэкстоун, Юджин; Дитон, Крис; Шнайдер, Дэйв; Скотт, Джерри; Шепард, Блейк (28 июля 2010 г.). «Использование Cyc для ответа на специальные запросы клинических исследователей» . Журнал ИИ . 31 (3): 13. дои : 10.1609/aimag.v31i3.2299 . ISSN   0738-4602 .
  23. ^ Ленат, Дуглас Б.; Дурлах, Паула Дж. (1 сентября 2014 г.). «Укрепление математических знаний путем погружения учащихся в смоделированный опыт обучения через преподавание» . Международный журнал искусственного интеллекта в образовании . 24 (3): 216–250. дои : 10.1007/s40593-014-0016-x . ISSN   1560-4292 .
  24. ^ «Mathcraft от Cycorp» . www.mathcraft.ai . Проверено 29 ноября 2017 г.
  25. ^ Бертино, Пьеро и Зарриа 2001 , с. 275
  26. ^ Хаваси, Кэтрин (9 августа 2014 г.). «Кто рассуждает здраво и почему это важно» . ТехКранч . Проверено 29 ноября 2017 г.
  27. ^ Домингос, Педро (2015). Главный алгоритм: как поиски совершенной обучающейся машины изменят наш мир . Основные книги. ISBN  978-0465065707 .
  28. ^ Робин Хэнсон (1 декабря 2008 г.). «Преодоление предвзятости: я люблю CYC» . www.overcomingbias.com . Проверено 29 ноября 2017 г.
  29. Перейти обратно: Перейти обратно: а б Баард, Марк (13 мая 2003 г.). «Основатель искусственного интеллекта раскритиковал современные исследования» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.
  30. ^ Найт, Уилл (14 марта 2016 г.). «ИИ, который потратил 30 лет на изучение здравого смысла, готов к работе» . Обзор технологий Массачусетского технологического института . Проверено 29 ноября 2017 г.
  31. ^ Дуг Ленат (15 мая 2017 г.). «Иногда видимости интеллекта недостаточно | CogWorld» . CognitiveWorld.com . Проверено 29 ноября 2017 г.
  32. ^ «Вычислительное право, символический дискурс и конституция искусственного интеллекта — блог Стивена Вольфрама» . blog.stephenwolfram.com . 12 октября 2016 г. Проверено 29 ноября 2017 г.
  33. ^ Дэвис, Эрнест; Маркус, Гэри (2015). «Здравые рассуждения и здравые знания в области искусственного интеллекта». Коммуникации АКМ . 58 (9): 92–103. дои : 10.1145/2701413 . S2CID   13583137 .
  34. ^ Голдсмит, Джеффри (1 апреля 1994 г.). «ЦИК-О» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.
  35. ^ Кейд Мец (25 марта 2016 г.). «Одинокий крестовый поход одного гения за то, чтобы научить компьютер здравому смыслу» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.
  36. ^ Wired Staff (1 ноября 1998 г.). «Проводной 25» . ПРОВОДНОЙ . Проверено 29 ноября 2017 г.

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: aeb8575d39b645750ac4c6493691621c__1717065180
URL1:https://arc.ask3.ru/arc/aa/ae/1c/aeb8575d39b645750ac4c6493691621c.html
Заголовок, (Title) документа по адресу, URL1:
Cyc - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)