Открытый разум, здравый смысл

Open Mind Common Sense ( OMCS ) — это проект искусственного интеллекта, базирующийся в Массачусетского технологического института (MIT) Медиа-лаборатории , цель которого — создать и использовать большую базу знаний здравого смысла на основе вклада многих тысяч людей в Интернете. Действул с 1999 по 2016 год.

С момента своего основания он собрал более миллиона фактов на английском языке от более чем 15 000 участников, а также базы знаний на других языках. Большая часть программного обеспечения OMCS построена на трех взаимосвязанных представлениях: корпусе естественного языка, с которым люди взаимодействуют напрямую, семантической сети, построенной на основе этого корпуса, называемой ConceptNet , и матричном представлении ConceptNet, называемом AnalogySpace , которое может выводить новые знания с помощью уменьшения размерности . ^[1] Знания, собранные Open Mind Common Sense, позволили реализовать исследовательские проекты в Массачусетском технологическом институте и других местах.

История

Проект был детищем Марвина Мински , Пуша Сингха, Кэтрин Хаваси и других. Работы по разработке начались в сентябре 1999 года, а годом позже проект был открыт в Интернете. Хаваси описала это в своей диссертации как «попытку… использовать часть распределенной человеческой вычислительной мощности Интернета, идея, которая тогда находилась только на ранних стадиях». ^[2] Оригинальный OMCS был создан под влиянием веб-сайта Everything2 и его предшественника и представляет собой минималистичный интерфейс, вдохновленный Google .

Пуш Сингх должен был стать профессором Медиа-лаборатории Массачусетского технологического института и возглавить группу Common Sense Computing в 2007 году, но покончил жизнь самоубийством 28 февраля 2006 года. ^[3]

В настоящее время проектом управляет группа Digital Intuition Group в Медиа-лаборатории Массачусетского технологического института под руководством Кэтрин Хаваси. ^{[ нужна ссылка ]}

База данных и веб-сайт

В OMCS существует множество различных типов знаний. Некоторые утверждения передают отношения между объектами или событиями, выраженные простыми фразами естественного языка: некоторые примеры включают: «Пальто используется для согрева», «Солнце очень жаркое» и «Последнее, что вы делаете, когда готовите ужин, — это помойте посуду». База данных также содержит информацию об эмоциональном содержании ситуаций в таких утверждениях, как «Проведение времени с друзьями приносит счастье» и «Попадание в автокатастрофу приводит в ярость». OMCS содержит информацию о желаниях и целях людей, как больших, так и малых, например: «Люди хотят бытьуважаемый» и «Люди хотят хорошего кофе». ^[1]

Первоначально эти утверждения можно было вводить на веб-сайт как неограниченные текстовые предложения, которые нужно было анализировать позже. Текущая версия веб-сайта собирает знания только с использованием более структурированных шаблонов с заполнением пустых полей. OMCS также использует данные, собранные игрой, с целью « Многословность ». ^[4]

В своей исходной форме база данных OMCS представляет собой просто набор коротких предложений, передающих некоторые общие знания. Чтобы использовать эти знания в вычислительных целях, их необходимо преобразовать в более структурированное представление.

КонцептНет

ConceptNet — это семантическая сеть , основанная на информации из базы данных OMCS. ConceptNet выражается как ориентированный граф, узлы которого являются понятиями, а ребра — утверждениями здравого смысла об этих понятиях. Концепты представляют собой наборы тесно связанных фраз естественного языка, которые могут быть именными фразами, глагольными фразами, прилагательными фразами или предложениями. ^[5]

ConceptNet создается на основе утверждений естественного языка в OMCS путем сопоставления их с шаблонами с помощью мелкого анализатора. Утверждения выражаются как отношения между двумя понятиями, выбранными из ограниченного набора возможных.отношения. Различные отношения представляют собой общие шаблоны предложений, обнаруженные в корпусе OMCS, и, в частности, каждый шаблон «заполните пробелы», используемый на веб-сайте сбора знаний, связан с конкретным отношением. ^[5]

Структуры данных, составляющие ConceptNet, были существенно реорганизованы в 2007 году и опубликованы как ConceptNet 3. ^[5] Группа Software Agents в настоящее время распространяет базу данных и API для новой версии 4.0. ^[6]

В 2010 году соучредитель и директор OMCS Кэтрин Хаваси вместе с Робин Спир, Деннисом Кларком и Джейсоном Алонсо создали Luminoso , компанию по разработке программного обеспечения для анализа текста, основанную на ConceptNet. ^[7]^[8]^[9]^[10] Он использует ConceptNet в качестве основного лексического ресурса, чтобы помочь предприятиям осмыслить и извлечь информацию из огромных объемов качественных данных, включая опросы, обзоры продуктов и социальные сети. ^[7]^[11]^[12]

Инструменты машинного обучения

Информация в ConceptNet может использоваться в качестве основы для алгоритмов машинного обучения . Одно представление, называемое AnalogySpace, использует разложение по сингулярным значениям для обобщения и представления закономерностей в знаниях.ConceptNet таким образом, чтобы его можно было использовать в приложениях искусственного интеллекта. Его создатели распространяют набор инструментов машинного обучения Python под названием Divisi. ^[13] для выполнения машинного обучения на основе текстовых корпусов, структурированных баз знаний, таких как ConceptNet, и их комбинаций.

Сравнение с другими проектами

Другие подобные проекты включают Never-Ending Language Learning , Mindpixel (снято с производства), Cyc , Learner, SenticNet, Freebase , YAGO , DBpedia и Open Mind 1001 Questions, которые исследовали альтернативные подходы к сбору знаний и обеспечению стимулов для участия.

Проект Open Mind Common Sense отличается от Cyc тем, что он сосредоточен на представлении собранных им знаний здравого смысла в виде английских предложений, а не на использовании формальной логической структуры. ConceptNet описывается одним из его создателей, Хьюго Лю, как структурированный, больше похожий на WordNet , чем на Cyc, из-за его «акцента на неформальной концептуальной связности, а не на формальной лингвистической строгости». ^[14]

Существует также бразильская инициатива под названием Open Mind Common Sense in Brazil (OMCS-Br), возглавляемая Лабораторией продвинутого взаимодействия Федерального университета Сан-Карлоса ( LIA-UFSCar ). Этот проект начался в 2005 году в сотрудничестве с Группой программных агентов Медиа-лаборатории Массачусетского технологического института. Его основная цель — собрать здравый смысл, изложенный на бразильском португальском языке, и использовать его для разработки программных приложений, учитывающих культурные особенности , на основе извлечения знаний культурных профилей из ConceptNet. Это призвано помочь разработчикам и пользователям с программным обеспечением с контентом, учитывающим культурный контекст, делая конечные приложения более гибкими, адаптивными, доступными и удобными в использовании. Основными направлениями применения являются образование и здравоохранение. ^{[ нужна ссылка ]}

См. также

Ссылки

^ Перейти обратно: ^а ^б Робин Спир, Кэтрин Хаваси и Генри Либерман. AnalogySpace: уменьшение размерности знаний здравого смысла. Архивировано 9 июля 2010 г. в Wayback Machine . АААИ 2008.
^ Кэтрин Хаваси. Обнаружение семантических отношений с использованием методов, основанных на разложении сингулярных значений. Докторская диссертация, Университет Брандейса, июнь 2009 г.
^ Офис новостей Массачусетского технологического института (08 марта 2006 г.). «Завтра запланирована панихида по Пушпиндеру Сингху» . Технический разговор Массачусетского технологического института . Проверено 7 октября 2009 г.
^ «Профиль для многословия» . Открытый разум, здравый смысл. Архивировано из оригинала 25 июня 2010 г.
^ Перейти обратно: ^а ^б ^с Кэтрин Хаваси, Робин Спир и Джейсон Алонсо. ConceptNet 3: гибкая многоязычная семантическая сеть для знаний, основанных на здравом смысле . Proceedings of Recent Advances in Natural Language Processing, 2007. Попробуйте ConceptNet 3:... Архивировано 29 мая 2015 г. на Wayback Machine.
^ Инициатива Commonsense Computing (24 февраля 2009 г.). «API ConceptNet в Launchpad» . Проверено 7 октября 2009 г.
^ Перейти обратно: ^а ^б Лор, Стив (27 июня 2014 г.). «Матч США-Германия через призму социальных сетей» . Нью-Йорк Таймс . Проверено 3 марта 2015 г.
^ Русли, Эвелин (14 апреля 2014 г.). «Фирмы используют искусственный интеллект, чтобы узнать мнения покупателей» . Уолл Стрит Джорнал . Проверено 3 марта 2015 г.
^ Альба, Дэйви (12 февраля 2015 г.). «Стартап, который поможет вам анализировать переписку в Твиттере в режиме реального времени» . Проводной . Проверено 3 марта 2015 г.
^ Нойес, Кэтрин (11 февраля 2015 г.). «Luminoso для предприятий: вот что на самом деле означает вся эта болтовня» . Мир ПК . Проверено 3 марта 2015 г.
^ Миллер, Рон (2 июля 2014 г.). «Luminoso получила 6,5 млн долларов в рамках серии A для продолжения создания службы облачного анализа текста» . ТехКранч . Проверено 3 марта 2015 г.
^ Дэрроу, Барб (11 февраля 2015 г.). «Luminoso использует возможности анализа текста для потоковой передачи данных» . ГигаОм . Проверено 3 марта 2015 г.
^ Инициатива Commonsense Computing (24 февраля 2009 г.). «Дивизи в Launchpad» . Проверено 7 октября 2009 г.
^ «Проект ConceptNet V2.1» . Проверено 17 декабря 2008 г.

Внешние ссылки

Открытый разум, здравый смысл
Мета-репозиторий Open Mind Common Sense Github
КонцептНет
АналогияКосмос
Набор инструментов для вывода Divisi
Веб-страница Commonsense Computing Initiative (сайт не существует)
Инициатива Open Mind (Сайт не существует)
OMCSNetCPP — механизм вывода C++ с открытым исходным кодом, использующий данные OMCSNet.
Открытый разум, здравый смысл в Бразилии (сайт не работает)
Здравый смысл открытого сердца - эмоциональный здравый смысл в искусстве (старая страница)
Лаборатория расширенного взаимодействия

[aaai-1] Перейти обратно: ^а ^б Робин Спир, Кэтрин Хаваси и Генри Либерман. AnalogySpace: уменьшение размерности знаний здравого смысла. Архивировано 9 июля 2010 г. в Wayback Machine . АААИ 2008.

[havasi-thesis-2] Кэтрин Хаваси. Обнаружение семантических отношений с использованием методов, основанных на разложении сингулярных значений. Докторская диссертация, Университет Брандейса, июнь 2009 г.

[singh-obituary-3] Офис новостей Массачусетского технологического института (08 марта 2006 г.). «Завтра запланирована панихида по Пушпиндеру Сингху» . Технический разговор Массачусетского технологического института . Проверено 7 октября 2009 г.

[4] «Профиль для многословия» . Открытый разум, здравый смысл. Архивировано из оригинала 25 июня 2010 г.

[ranlp-conceptnet-5] Перейти обратно: ^а ^б ^с Кэтрин Хаваси, Робин Спир и Джейсон Алонсо. ConceptNet 3: гибкая многоязычная семантическая сеть для знаний, основанных на здравом смысле . Proceedings of Recent Advances in Natural Language Processing, 2007. Попробуйте ConceptNet 3:... Архивировано 29 мая 2015 г. на Wayback Machine.

[launchpad-conceptnet-6] Инициатива Commonsense Computing (24 февраля 2009 г.). «API ConceptNet в Launchpad» . Проверено 7 октября 2009 г.

[NYT-7] Перейти обратно: ^а ^б Лор, Стив (27 июня 2014 г.). «Матч США-Германия через призму социальных сетей» . Нью-Йорк Таймс . Проверено 3 марта 2015 г.

[WSJ-8] Русли, Эвелин (14 апреля 2014 г.). «Фирмы используют искусственный интеллект, чтобы узнать мнения покупателей» . Уолл Стрит Джорнал . Проверено 3 марта 2015 г.

[Wired-9] Альба, Дэйви (12 февраля 2015 г.). «Стартап, который поможет вам анализировать переписку в Твиттере в режиме реального времени» . Проводной . Проверено 3 марта 2015 г.

[PCWorld-10] Нойес, Кэтрин (11 февраля 2015 г.). «Luminoso для предприятий: вот что на самом деле означает вся эта болтовня» . Мир ПК . Проверено 3 марта 2015 г.

[TechCrunch-11] Миллер, Рон (2 июля 2014 г.). «Luminoso получила 6,5 млн долларов в рамках серии A для продолжения создания службы облачного анализа текста» . ТехКранч . Проверено 3 марта 2015 г.

[GigaOm-12] Дэрроу, Барб (11 февраля 2015 г.). «Luminoso использует возможности анализа текста для потоковой передачи данных» . ГигаОм . Проверено 3 марта 2015 г.

[launchpad-divisi-13] Инициатива Commonsense Computing (24 февраля 2009 г.). «Дивизи в Launchpad» . Проверено 7 октября 2009 г.

[hugo-conceptnet-14] «Проект ConceptNet V2.1» . Проверено 17 декабря 2008 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]