Jump to content

Открытый разум, здравый смысл

(Перенаправлено с ConceptNet )

Open Mind Common Sense ( OMCS ) — это проект искусственного интеллекта, базирующийся в Массачусетского технологического института (MIT) Медиа-лаборатории , цель которого — создать и использовать большую базу знаний здравого смысла на основе вклада многих тысяч людей в Интернете. Действул с 1999 по 2016 год.

С момента своего основания он собрал более миллиона фактов на английском языке от более чем 15 000 участников, а также базы знаний на других языках. Большая часть программного обеспечения OMCS построена на трех взаимосвязанных представлениях: корпусе естественного языка, с которым люди взаимодействуют напрямую, семантической сети, построенной на основе этого корпуса, называемой ConceptNet , и матричном представлении ConceptNet, называемом AnalogySpace , которое может выводить новые знания с помощью уменьшения размерности . [ 1 ] Знания, собранные Open Mind Common Sense, позволили реализовать исследовательские проекты в Массачусетском технологическом институте и других местах.

Проект был детищем Марвина Мински , Пуша Сингха, Кэтрин Хаваси и других. Работы по разработке начались в сентябре 1999 года, а год спустя проект был открыт в Интернете. Хаваси описала это в своей диссертации как «попытку… использовать часть распределенной человеческой вычислительной мощности Интернета, идея, которая тогда находилась только на ранних стадиях». [ 2 ] Оригинальный OMCS был создан под влиянием веб-сайта Everything2 и его предшественника и представляет собой минималистичный интерфейс, вдохновленный Google .

Пуш Сингх должен был стать профессором Медиа-лаборатории Массачусетского технологического института и возглавить группу Common Sense Computing в 2007 году, но покончил жизнь самоубийством 28 февраля 2006 года. [ 3 ]

В настоящее время проектом управляет группа Digital Intuition Group в Медиа-лаборатории Массачусетского технологического института под руководством Кэтрин Хаваси. [ нужна ссылка ]

База данных и веб-сайт

[ редактировать ]

В OMCS существует множество различных типов знаний. Некоторые утверждения передают отношения между объектами или событиями, выраженные простыми фразами естественного языка: некоторые примеры включают: «Пальто используется для согрева», «Солнце очень жаркое» и «Последнее, что вы делаете, когда готовите ужин, — это помойте посуду». База данных также содержит информацию об эмоциональном содержании ситуаций в таких утверждениях, как «Проведение времени с друзьями приносит счастье» и «Попадание в автокатастрофу приводит в ярость». OMCS содержит информацию о желаниях и целях людей, как больших, так и малых, например: «Люди хотят быть уважаемый» и «Люди хотят хорошего кофе». [ 1 ]

Первоначально эти утверждения можно было вводить на веб-сайт как неограниченные текстовые предложения, которые нужно было анализировать позже. Текущая версия веб-сайта собирает знания только с использованием более структурированных шаблонов с заполнением пустых полей. OMCS также использует данные, собранные игрой, с целью « Многословность ». [ 4 ]

В своей исходной форме база данных OMCS представляет собой просто набор коротких предложений, передающих некоторые общие знания. Чтобы использовать эти знания в вычислительных целях, их необходимо преобразовать в более структурированное представление.

КонцептНет

[ редактировать ]

ConceptNet — это семантическая сеть , основанная на информации из базы данных OMCS. ConceptNet выражается как ориентированный граф, узлы которого являются понятиями, а ребра — утверждениями здравого смысла об этих понятиях. Концепты представляют собой наборы тесно связанных фраз естественного языка, которые могут быть именными фразами, глагольными фразами, прилагательными фразами или предложениями. [ 5 ]

ConceptNet создается на основе утверждений естественного языка в OMCS путем сопоставления их с шаблонами с помощью мелкого анализатора. Утверждения выражаются как отношения между двумя понятиями, выбранными из ограниченного набора возможных. отношения. Различные отношения представляют собой общие шаблоны предложений, обнаруженные в корпусе OMCS, и, в частности, каждый шаблон «заполните пробелы», используемый на веб-сайте сбора знаний, связан с конкретным отношением. [ 5 ]

Структуры данных, составляющие ConceptNet, были существенно реорганизованы в 2007 году и опубликованы как ConceptNet 3. [ 5 ] Группа Software Agents в настоящее время распространяет базу данных и API для новой версии 4.0. [ 6 ]

В 2010 году соучредитель и директор OMCS Кэтрин Хаваси вместе с Робин Спир, Деннисом Кларком и Джейсоном Алонсо создали Luminoso , компанию по разработке программного обеспечения для анализа текста, основанную на ConceptNet. [ 7 ] [ 8 ] [ 9 ] [ 10 ] Он использует ConceptNet в качестве основного лексического ресурса, чтобы помочь предприятиям осмыслить и извлечь информацию из огромных объемов качественных данных, включая опросы, обзоры продуктов и социальные сети. [ 7 ] [ 11 ] [ 12 ]

Инструменты машинного обучения

[ редактировать ]

Информация в ConceptNet может использоваться в качестве основы для алгоритмов машинного обучения . Одно представление, называемое AnalogySpace, использует разложение по сингулярным значениям для обобщения и представления закономерностей в знаниях. ConceptNet таким образом, чтобы его можно было использовать в приложениях искусственного интеллекта. Его создатели распространяют набор инструментов машинного обучения Python под названием Divisi. [ 13 ] для выполнения машинного обучения на основе текстовых корпусов, структурированных баз знаний, таких как ConceptNet, и их комбинаций.

Сравнение с другими проектами

[ редактировать ]

Другие подобные проекты включают Never-Ending Language Learning , Mindpixel (снято с производства), Cyc , Learner, SenticNet, Freebase , YAGO , DBpedia и Open Mind 1001 Questions, которые исследовали альтернативные подходы к сбору знаний и обеспечению стимулов для участия.

Проект Open Mind Common Sense отличается от Cyc тем, что он сосредоточен на представлении собранных им знаний здравого смысла в виде английских предложений, а не на использовании формальной логической структуры. ConceptNet описывается одним из его создателей, Хьюго Лю, как структурированный, больше похожий на WordNet , чем на Cyc, из-за его «акцента на неформальной концептуальной связности, а не на формальной лингвистической строгости». [ 14 ]

Существует также бразильская инициатива под названием Open Mind Common Sense в Бразилии (OMCS-Br), возглавляемая Лабораторией продвинутого взаимодействия Федерального университета Сан-Карлоса ( LIA-UFSCar ). Этот проект начался в 2005 году в сотрудничестве с Группой программных агентов Медиа-лаборатории Массачусетского технологического института. Его основная цель — собрать здравый смысл, изложенный на бразильском португальском языке, и использовать его для разработки программных приложений, учитывающих культурные особенности , на основе извлечения знаний культурных профилей из ConceptNet. Это призвано помочь разработчикам и пользователям с программным обеспечением с контентом, учитывающим культурный контекст, делая конечные приложения более гибкими, адаптивными, доступными и удобными в использовании. Основными направлениями применения являются образование и здравоохранение. [ нужна ссылка ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Робин Спир, Кэтрин Хаваси и Генри Либерман. AnalogySpace: уменьшение размерности знаний здравого смысла. Архивировано 9 июля 2010 г. в Wayback Machine . АААИ 2008.
  2. ^ Кэтрин Хаваси. Обнаружение семантических отношений с использованием методов, основанных на разложении сингулярных значений. Докторская диссертация, Университет Брандейса, июнь 2009 г.
  3. ^ Офис новостей Массачусетского технологического института (08 марта 2006 г.). «Завтра запланирована панихида по Пушпиндеру Сингху» . Технический разговор Массачусетского технологического института . Проверено 7 октября 2009 г.
  4. ^ «Профиль для многословия» . Открытый разум, здравый смысл. Архивировано из оригинала 25 июня 2010 г.
  5. ^ Jump up to: а б с Кэтрин Хаваси, Робин Спир и Джейсон Алонсо. ConceptNet 3: гибкая многоязычная семантическая сеть для знаний, основанных на здравом смысле . Proceedings of Recent Advances in Natural Language Processing, 2007. попробуйте ConceptNet 3:... Архивировано 29 мая 2015 г. на Wayback Machine.
  6. ^ Инициатива Commonsense Computing (24 февраля 2009 г.). «API ConceptNet в Launchpad» . Проверено 7 октября 2009 г.
  7. ^ Jump up to: а б Лор, Стив (27 июня 2014 г.). «Матч США-Германия через призму социальных сетей» . Нью-Йорк Таймс . Проверено 3 марта 2015 г.
  8. ^ Русли, Эвелин (14 апреля 2014 г.). «Фирмы используют искусственный интеллект, чтобы узнать мнения покупателей» . Уолл Стрит Джорнал . Проверено 3 марта 2015 г.
  9. ^ Альба, Дэйви (12 февраля 2015 г.). «Стартап, который поможет вам анализировать переписку в Твиттере в режиме реального времени» . Проводной . Проверено 3 марта 2015 г.
  10. ^ Нойес, Кэтрин (11 февраля 2015 г.). «Luminoso для предприятий: вот что на самом деле означает вся эта болтовня» . Мир ПК . Проверено 3 марта 2015 г.
  11. ^ Миллер, Рон (2 июля 2014 г.). «Luminoso получила 6,5 млн долларов в рамках серии A для продолжения создания службы облачного анализа текста» . ТехКранч . Проверено 3 марта 2015 г.
  12. ^ Дэрроу, Барб (11 февраля 2015 г.). «Luminoso использует возможности анализа текста для потоковой передачи данных» . ГигаОм . Проверено 3 марта 2015 г.
  13. ^ Инициатива Commonsense Computing (24 февраля 2009 г.). «Дивизи в Launchpad» . Проверено 7 октября 2009 г.
  14. ^ «Проект ConceptNet V2.1» . Проверено 17 декабря 2008 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 743fcf307c97461f0bd99c83f91817a5__1669643520
URL1:https://arc.ask3.ru/arc/aa/74/a5/743fcf307c97461f0bd99c83f91817a5.html
Заголовок, (Title) документа по адресу, URL1:
Open Mind Common Sense - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)