БабельНет
![]() | |
Стабильная версия | БабельНет 5.0 / февраль 2021 г. |
---|---|
Операционная система | |
Тип | |
Лицензия | Attribution-NonCommercial-ShareAlike 3.0 Непортированный |
Веб-сайт | Вавилонская сеть |
BabelNet — это многоязычная лексикализированная семантическая сеть и онтология, разработанная в НЛП группе Римского университета Сапиенца . [1] [2] путем соединения Википедии с самым популярным компьютерным словарем английского языка . WordNet BabelNet был автоматически создан Интеграция осуществляется с помощью автоматического сопоставления и заполнения лексических пробелов в языках с ограниченными ресурсами с помощью статистического машинного перевода . Результатом является энциклопедический словарь , который содержит понятия и именованные сущности, лексикализованные на многих языках и связанные большим количеством семантических отношений . Дополнительные лексикализации и определения добавляются путем ссылки на сети слов со свободной лицензией, OmegaWiki, английский Викисловарь , Wikidata , FrameNet , VerbNet и другие. Подобно WordNet, BabelNet группирует слова на разных языках в наборы синонимов , называемые Babel синсетами . Для каждого синсета Babel BabelNet предоставляет краткие определения (называемые глоссами ) на многих языках, взятые как из WordNet, так и из Википедии.

Статистика BabelNet [ править ]
По состоянию на апрель 2021 г. [update]BabelNet (версия 5.0) охватывает 500 языков . Он содержит почти 20 миллионов синсетов и около 1,4 миллиарда значений слов (независимо от их языка). Каждый синсет Babel содержит в среднем по 2 синонима на каждый язык, т. е. значения слов. Семантическая сеть включает в себя все лексико-семантические отношения из WordNet ( гиперонимия и гипонимия , меронимия и холонимия , антонимия и синонимия и т. д., всего около 364 000 ребер отношений), а также недоопределенное отношение родства из Википедии (всего около 1,3 миллиарда ребер). . [1] Версия 5.0 также связывает около 51 миллиона изображений с синсетами Babel и обеспечивает Lemon RDF . кодировку ресурса [3] доступен через конечную точку SPARQL . 2,67 миллионам синсетов присвоены доменные метки.
Приложения [ править ]
Было показано, что BabelNet позволяет использовать многоязычные обработки естественного языка приложения . Было показано, что лексикализованные знания , доступные в BabelNet, дают самые современные результаты в:
- семантическая связанность [4] [5]
- многоязычное устранение неоднозначности в смысле слова [6]
- многоязычное устранение неоднозначности в смысле слова и связывание сущностей с Babelfy системой [7]
- видеоигры с определенной целью [8]
Призы и благодарности [ править ]
BabelNet получила премию META 2015 за «новаторскую работу по преодолению языковых барьеров с помощью многоязычной лексикализированной семантической сети и онтологии с использованием разнородных источников данных».
BabelNet занял видное место в Time . статье журнала [9] о новой эпохе инновационных и современных ресурсов лексических знаний, доступных в Интернете.
См. также [ править ]
Ссылки [ править ]
- ^ Р. Навильи, С.П. Понцетто. BabelNet: построение очень большой многоязычной семантической сети . Учеб. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Уппсала, Швеция, 11–16 июля 2010 г., стр. 216–225.
- ^ М. Эрманн, Ф. Чеккони, Д. Ваннелла, Дж. МакКрэй, П. Чимиано, Р. Навильи. Представление многоязычных данных как связанных данных: пример BabelNet 2.0 . Учеб. 9-й конференции по языковым ресурсам и оценке (LREC 2014), Рейкьявик, Исландия, 26–31 мая 2014 г.
- ^ Р. Навильи и С. Понцетто. 2012. Бабель Релате! Совместный многоязычный подход к вычислению семантической связанности. Архивировано 3 марта 2016 г. в Wayback Machine . Учеб. 26-й конференции AAAI по искусственному интеллекту (AAAI 2012), Торонто, Канада, стр. 108–114.
- ^ Дж. Камачо-Колладос, М.Т. Пилевар и Р. Навильи. NASARI: новый подход к семантически-ориентированному представлению объектов . Учеб. конференции Североамериканского отделения Ассоциации компьютерной лингвистики (NAACL 2015) 2015 г., Денвер, Колорадо (США), 31 мая – 5 июня 2015 г., стр. 567–577.
- ^ Р. Навильи и С. Понцетто. Объединение усилий окупается: устранение многоязычной совместной смысловой неоднозначности слов . Учеб. Конференции 2012 г. по эмпирическим методам обработки естественного языка (EMNLP 2012), Чеджу, Корея, 12–14 июля 2012 г., стр. 1399–1410.
- ^ А. Моро, А. Раганато, Р. Навильи. Связывание сущностей и устранение неоднозначности в смысле слова: единый подход. Архивировано 8 августа 2014 г. в Wayback Machine Transactions Ассоциации вычислительной лингвистики (TACL), 2, стр. 231–244, 2014.
- ^ Д. Юргенс, Р. Навильи. «Это все весело и игры, пока кто-нибудь не сделает аннотации: видеоигры с целью лингвистических аннотаций» (PDF) . Архивировано из оригинала 3 января 2015 года . Проверено 3 января 2015 г.
{{cite web}}
: CS1 maint: bot: статус исходного URL-адреса неизвестен ( ссылка ) Труды Ассоциации компьютерной лингвистики (TACL), 2, стр. 449-464, 2014. - ↑ Штайнмец, Кэти (12 мая 2016 г.). «Переопределение современного словаря» . Время . 187 : 20-21.