Jump to content

БабельНет

БабельНет
Стабильная версия
БабельНет 5.0 / февраль 2021 г.
Операционная система
Тип
Лицензия Attribution-NonCommercial-ShareAlike 3.0 Непортированный
Веб-сайт Вавилонская сеть .org

BabelNet — это многоязычная лексикализированная семантическая сеть и онтология, разработанная в НЛП группе Римского университета Сапиенца . [1] [2] путем соединения Википедии с самым популярным компьютерным словарем английского языка . WordNet BabelNet был автоматически создан Интеграция осуществляется с помощью автоматического сопоставления и заполнения лексических пробелов в языках с ограниченными ресурсами с помощью статистического машинного перевода . Результатом является энциклопедический словарь , который содержит понятия и именованные сущности, лексикализованные на многих языках и связанные большим количеством семантических отношений . Дополнительные лексикализации и определения добавляются путем ссылки на сети слов со свободной лицензией, OmegaWiki, английский Викисловарь , Wikidata , FrameNet , VerbNet и другие. Подобно WordNet, BabelNet группирует слова на разных языках в наборы синонимов , называемые Babel синсетами . Для каждого синсета Babel BabelNet предоставляет краткие определения (называемые глоссами ) на многих языках, взятые как из WordNet, так и из Википедии.

BabelNet — это многоязычная семантическая сеть, полученная в результате интеграции WordNet и Википедии.

Статистика BabelNet [ править ]

По состоянию на апрель 2021 г. BabelNet (версия 5.0) охватывает 500 языков . Он содержит почти 20 миллионов синсетов и около 1,4 миллиарда значений слов (независимо от их языка). Каждый синсет Babel содержит в среднем по 2 синонима на каждый язык, т. е. значения слов. Семантическая сеть включает в себя все лексико-семантические отношения из WordNet ( гиперонимия и гипонимия , меронимия и холонимия , антонимия и синонимия и т. д., всего около 364 000 ребер отношений), а также недоопределенное отношение родства из Википедии (всего около 1,3 миллиарда ребер). . [1] Версия 5.0 также связывает около 51 миллиона изображений с синсетами Babel и обеспечивает Lemon RDF . кодировку ресурса [3] доступен через конечную точку SPARQL . 2,67 миллионам синсетов присвоены доменные метки.

Приложения [ править ]

Было показано, что BabelNet позволяет использовать многоязычные обработки естественного языка приложения . Было показано, что лексикализованные знания , доступные в BabelNet, дают самые современные результаты в:

Призы и благодарности [ править ]

BabelNet получила премию META 2015 за «новаторскую работу по преодолению языковых барьеров с помощью многоязычной лексикализированной семантической сети и онтологии с использованием разнородных источников данных».

BabelNet занял видное место в Time . статье журнала [9] о новой эпохе инновационных и современных ресурсов лексических знаний, доступных в Интернете.

См. также [ править ]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б Р. Навильи и С.П. Понцетто. 2012. BabelNet: автоматическое построение, оценка и применение многоязычной семантической сети с широким охватом . Искусственный интеллект, 193, Elsevier, стр. 217–250.
  2. ^ Р. Навильи, С.П. Понцетто. BabelNet: построение очень большой многоязычной семантической сети . Учеб. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Уппсала, Швеция, 11–16 июля 2010 г., стр. 216–225.
  3. ^ М. Эрманн, Ф. Чеккони, Д. Ваннелла, Дж. МакКрэй, П. Чимиано, Р. Навильи. Представление многоязычных данных как связанных данных: пример BabelNet 2.0 . Учеб. 9-й конференции по языковым ресурсам и оценке (LREC 2014), Рейкьявик, Исландия, 26–31 мая 2014 г.
  4. ^ Р. Навильи и С. Понцетто. 2012. Бабель Релате! Совместный многоязычный подход к вычислению семантической связанности. Архивировано 3 марта 2016 г. в Wayback Machine . Учеб. 26-й конференции AAAI по искусственному интеллекту (AAAI 2012), Торонто, Канада, стр. 108–114.
  5. ^ Дж. Камачо-Колладос, М.Т. Пилевар и Р. Навильи. NASARI: новый подход к семантически-ориентированному представлению объектов . Учеб. конференции Североамериканского отделения Ассоциации компьютерной лингвистики (NAACL 2015) 2015 г., Денвер, Колорадо (США), 31 мая – 5 июня 2015 г., стр. 567–577.
  6. ^ Р. Навильи и С. Понцетто. Объединение усилий окупается: устранение многоязычной совместной смысловой неоднозначности слов . Учеб. Конференции 2012 г. по эмпирическим методам обработки естественного языка (EMNLP 2012), Чеджу, Корея, 12–14 июля 2012 г., стр. 1399–1410.
  7. ^ А. Моро, А. Раганато, Р. Навильи. Связывание сущностей и устранение неоднозначности в смысле слова: единый подход. Архивировано 8 августа 2014 г. в Wayback Machine Transactions Ассоциации вычислительной лингвистики (TACL), 2, стр. 231–244, 2014.
  8. ^ Д. Юргенс, Р. Навильи. «Это все весело и игры, пока кто-нибудь не сделает аннотации: видеоигры с целью лингвистических аннотаций» (PDF) . Архивировано из оригинала 3 января 2015 года . Проверено 3 января 2015 г. {{cite web}}: CS1 maint: bot: статус исходного URL-адреса неизвестен ( ссылка ) Труды Ассоциации компьютерной лингвистики (TACL), 2, стр. 449-464, 2014.
  9. Штайнмец, Кэти (12 мая 2016 г.). «Переопределение современного словаря» . Время . 187 : 20-21.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a91d3e7dfbbff688a40d3909135087e2__1695294360
URL1:https://arc.ask3.ru/arc/aa/a9/e2/a91d3e7dfbbff688a40d3909135087e2.html
Заголовок, (Title) документа по адресу, URL1:
BabelNet - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)