Открытый разум, здравый смысл
Open Mind Common Sense ( OMCS ) — это проект искусственного интеллекта, базирующийся в Массачусетского технологического института (MIT) Медиа-лаборатории , цель которого — создать и использовать большую базу знаний здравого смысла на основе вклада многих тысяч людей в Интернете. Действул с 1999 по 2016 год.
С момента своего основания он собрал более миллиона фактов на английском языке от более чем 15 000 участников, а также базы знаний на других языках. Большая часть программного обеспечения OMCS построена на трех взаимосвязанных представлениях: корпусе естественного языка, с которым люди взаимодействуют напрямую, семантической сети, построенной на основе этого корпуса, называемой ConceptNet , и матричном представлении ConceptNet, называемом AnalogySpace , которое может выводить новые знания с помощью уменьшения размерности . [1] Знания, собранные Open Mind Common Sense, позволили реализовать исследовательские проекты в Массачусетском технологическом институте и других местах.
История
[ редактировать ]Проект был детищем Марвина Мински , Пуша Сингха, Кэтрин Хаваси и других. Работы по разработке начались в сентябре 1999 года, а годом позже проект был открыт в Интернете. Хаваси описала это в своей диссертации как «попытку… использовать часть распределенной человеческой вычислительной мощности Интернета, идея, которая тогда находилась только на ранних стадиях». [2] Оригинальный OMCS был создан под влиянием веб-сайта Everything2 и его предшественника и представляет собой минималистичный интерфейс, вдохновленный Google .
Пуш Сингх должен был стать профессором Медиа-лаборатории Массачусетского технологического института и возглавить группу Common Sense Computing в 2007 году, но покончил жизнь самоубийством 28 февраля 2006 года. [3]
В настоящее время проектом управляет группа Digital Intuition Group в Медиа-лаборатории Массачусетского технологического института под руководством Кэтрин Хаваси. [ нужна ссылка ]
База данных и веб-сайт
[ редактировать ]В OMCS существует множество различных типов знаний. Некоторые утверждения передают отношения между объектами или событиями, выраженные простыми фразами естественного языка: некоторые примеры включают: «Пальто используется для согрева», «Солнце очень жаркое» и «Последнее, что вы делаете, когда готовите ужин, — это помойте посуду». База данных также содержит информацию об эмоциональном содержании ситуаций в таких утверждениях, как «Проведение времени с друзьями приносит счастье» и «Попадание в автокатастрофу приводит в ярость». OMCS содержит информацию о желаниях и целях людей, как больших, так и малых, например: «Люди хотят бытьуважаемый» и «Люди хотят хорошего кофе». [1]
Первоначально эти утверждения можно было вводить на веб-сайт как неограниченные текстовые предложения, которые нужно было анализировать позже. Текущая версия веб-сайта собирает знания только с использованием более структурированных шаблонов с заполнением пустых полей. OMCS также использует данные, собранные игрой, с целью « Многословность ». [4]
В своей исходной форме база данных OMCS представляет собой просто набор коротких предложений, передающих некоторые общие знания. Чтобы использовать эти знания в вычислительных целях, их необходимо преобразовать в более структурированное представление.
КонцептНет
[ редактировать ]ConceptNet — это семантическая сеть , основанная на информации из базы данных OMCS. ConceptNet выражается как ориентированный граф, узлы которого являются понятиями, а ребра — утверждениями здравого смысла об этих понятиях. Концепты представляют собой наборы тесно связанных фраз естественного языка, которые могут быть именными фразами, глагольными фразами, прилагательными фразами или предложениями. [5]
ConceptNet создается на основе утверждений естественного языка в OMCS путем сопоставления их с шаблонами с помощью мелкого анализатора. Утверждения выражаются как отношения между двумя понятиями, выбранными из ограниченного набора возможных.отношения. Различные отношения представляют собой общие шаблоны предложений, обнаруженные в корпусе OMCS, и, в частности, каждый шаблон «заполните пробелы», используемый на веб-сайте сбора знаний, связан с конкретным отношением. [5]
Структуры данных, составляющие ConceptNet, были существенно реорганизованы в 2007 году и опубликованы как ConceptNet 3. [5] Группа Software Agents в настоящее время распространяет базу данных и API для новой версии 4.0. [6]
В 2010 году соучредитель и директор OMCS Кэтрин Хаваси вместе с Робин Спир, Деннисом Кларком и Джейсоном Алонсо создали Luminoso , компанию по разработке программного обеспечения для анализа текста, основанную на ConceptNet. [7] [8] [9] [10] Он использует ConceptNet в качестве основного лексического ресурса, чтобы помочь предприятиям осмыслить и извлечь информацию из огромных объемов качественных данных, включая опросы, обзоры продуктов и социальные сети. [7] [11] [12]
Инструменты машинного обучения
[ редактировать ]Информация в ConceptNet может использоваться в качестве основы для алгоритмов машинного обучения . Одно представление, называемое AnalogySpace, использует разложение по сингулярным значениям для обобщения и представления закономерностей в знаниях.ConceptNet таким образом, чтобы его можно было использовать в приложениях искусственного интеллекта. Его создатели распространяют набор инструментов машинного обучения Python под названием Divisi. [13] для выполнения машинного обучения на основе текстовых корпусов, структурированных баз знаний, таких как ConceptNet, и их комбинаций.
Сравнение с другими проектами
[ редактировать ]Другие подобные проекты включают Never-Ending Language Learning , Mindpixel (снято с производства), Cyc , Learner, SenticNet, Freebase , YAGO , DBpedia и Open Mind 1001 Questions, которые исследовали альтернативные подходы к сбору знаний и обеспечению стимулов для участия.
Проект Open Mind Common Sense отличается от Cyc тем, что он сосредоточен на представлении собранных им знаний здравого смысла в виде английских предложений, а не на использовании формальной логической структуры. ConceptNet описывается одним из его создателей, Хьюго Лю, как структурированный, больше похожий на WordNet , чем на Cyc, из-за его «акцента на неформальной концептуальной связности, а не на формальной лингвистической строгости». [14]
Существует также бразильская инициатива под названием Open Mind Common Sense in Brazil (OMCS-Br), возглавляемая Лабораторией продвинутого взаимодействия Федерального университета Сан-Карлоса ( LIA-UFSCar ). Этот проект начался в 2005 году в сотрудничестве с Группой программных агентов Медиа-лаборатории Массачусетского технологического института. Его основная цель — собрать здравый смысл, изложенный на бразильском португальском языке, и использовать его для разработки программных приложений, учитывающих культурные особенности , на основе извлечения знаний культурных профилей из ConceptNet. Это призвано помочь разработчикам и пользователям с программным обеспечением с контентом, учитывающим культурный контекст, делая конечные приложения более гибкими, адаптивными, доступными и удобными в использовании. Основными направлениями применения являются образование и здравоохранение. [ нужна ссылка ]
См. также
[ редактировать ]- Attempto Controlled English (ACE), контролируемый естественный язык
- Бесконечное изучение языка
- Миндпиксель
- Семантическая сеть
- ДБпедия
- Бесплатная база данных (база данных)
- ЯГО (база данных)
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Робин Спир, Кэтрин Хаваси и Генри Либерман. AnalogySpace: уменьшение размерности знаний здравого смысла. Архивировано 9 июля 2010 г. в Wayback Machine . АААИ 2008.
- ^ Кэтрин Хаваси. Обнаружение семантических отношений с использованием методов, основанных на разложении сингулярных значений. Докторская диссертация, Университет Брандейса, июнь 2009 г.
- ^ Офис новостей Массачусетского технологического института (08 марта 2006 г.). «Завтра запланирована панихида по Пушпиндеру Сингху» . Технический разговор Массачусетского технологического института . Проверено 7 октября 2009 г.
- ^ «Профиль для многословия» . Открытый разум, здравый смысл. Архивировано из оригинала 25 июня 2010 г.
- ^ Перейти обратно: а б с Кэтрин Хаваси, Робин Спир и Джейсон Алонсо. ConceptNet 3: гибкая многоязычная семантическая сеть для знаний, основанных на здравом смысле . Proceedings of Recent Advances in Natural Language Processing, 2007. Попробуйте ConceptNet 3:... Архивировано 29 мая 2015 г. на Wayback Machine.
- ^ Инициатива Commonsense Computing (24 февраля 2009 г.). «API ConceptNet в Launchpad» . Проверено 7 октября 2009 г.
- ^ Перейти обратно: а б Лор, Стив (27 июня 2014 г.). «Матч США-Германия через призму социальных сетей» . Нью-Йорк Таймс . Проверено 3 марта 2015 г.
- ^ Русли, Эвелин (14 апреля 2014 г.). «Фирмы используют искусственный интеллект, чтобы узнать мнения покупателей» . Уолл Стрит Джорнал . Проверено 3 марта 2015 г.
- ^ Альба, Дэйви (12 февраля 2015 г.). «Стартап, который поможет вам анализировать переписку в Твиттере в режиме реального времени» . Проводной . Проверено 3 марта 2015 г.
- ^ Нойес, Кэтрин (11 февраля 2015 г.). «Luminoso для предприятий: вот что на самом деле означает вся эта болтовня» . Мир ПК . Проверено 3 марта 2015 г.
- ^ Миллер, Рон (2 июля 2014 г.). «Luminoso получила 6,5 млн долларов в рамках серии A для продолжения создания службы облачного анализа текста» . ТехКранч . Проверено 3 марта 2015 г.
- ^ Дэрроу, Барб (11 февраля 2015 г.). «Luminoso использует возможности анализа текста для потоковой передачи данных» . ГигаОм . Проверено 3 марта 2015 г.
- ^ Инициатива Commonsense Computing (24 февраля 2009 г.). «Дивизи в Launchpad» . Проверено 7 октября 2009 г.
- ^ «Проект ConceptNet V2.1» . Проверено 17 декабря 2008 г.
Внешние ссылки
[ редактировать ]- Открытый разум, здравый смысл
- Мета-репозиторий Open Mind Common Sense Github
- КонцептНет
- АналогияКосмос
- Набор инструментов для вывода Divisi
- Веб-страница Commonsense Computing Initiative (сайт не существует)
- Инициатива Open Mind (Сайт не существует)
- OMCSNetCPP — механизм вывода C++ с открытым исходным кодом, использующий данные OMCSNet.
- Открытый разум, здравый смысл в Бразилии (сайт не работает)
- Здравый смысл открытого сердца - эмоциональный здравый смысл в искусстве (старая страница)
- Лаборатория расширенного взаимодействия