БулНет
![]() | Эта статья может быть слишком технической для понимания большинства читателей . ( Апрель 2020 г. ) |
Болгарский WordNet ( BulNet ) — это электронный многоязычный словарь наборов синонимов вместе с их пояснительными определениями и наборами семантических связей с другими словами языка. [1] [2]
Он следует структуре Princeton WordNet (PWN), которая реализует традиционные семантические сети , структура которых состоит из узлов и отношений между узлами. [3] [4] [5]
Общая информация
[ редактировать ]BulNet был запущен в рамках финансируемого ЕС проекта BalkaNet - Многоязычная семантическая сеть балканских языков. После завершения строительства BalkaNet. развитие BulNet продолжалось при поддержке правительства Болгарии.
Содержание BulNet
[ редактировать ]Категории
[ редактировать ]По состоянию на 2015 год BulNet содержал более 80 000 наборов синонимов , распределенных по девяти частям речи — существительные, глаголы, прилагательные, наречия, местоимения, предлоги , союзы , частицы и междометия .
Слова, включенные в BulNet, были отобраны по разным критериям. Основными критериями являются частотный анализ встречаемости слов в больших текстовых корпусах и включение синсетов . Синсеты включают в себя те, которые уже присутствуют в сетях слов других языков, и синсеты, которые соответствуют высокочастотным значениям слов, встречающимся в параллельных корпусах.
Синсеты
[ редактировать ]Каждый синсет кодирует отношение эквивалентности между несколькими лексическими элементами — ЛИТЕРАЛАМИ (по крайней мере один из них должен быть явно представлен в SYNSET), каждый из которых имеет уникальное значение (задаваемое значением SENSE), — которые относятся к одному и второму синсету. одной и той же части речи (заданной как значение POS) и представляют одно и то же лексическое значение (заданное как значение DEF). Каждый синсет связан со своим аналогом в PWN 3.0 посредством уникального идентификационного номера — ID. Общие синсеты в балканских языках обозначены как подмножества общих понятий — BCS .
В одноязычной базе данных синсет должен быть связан по крайней мере с одним другим синсетом внутриязыковым отношением. Также может быть закодирована необязательная информация, такая как примеры использования, стилистические особенности, морфологические или синтаксические свойства, сведения об авторе и последнем редактировании.
Семантические отношения
[ редактировать ]Большое количество отношений, закодированных в BulNet, эффективно иллюстрирует семантическое и словообразовательное богатство языка, которое предлагает разнообразные возможности для многочисленных приложений многоязычной базы данных. BulNet предлагает лингвистические решения на семантическом уровне, такие как варианты выбора синонима, запросы семантических отношений слова в лексической системе языка ( антонимия , холонимия и т. д.), запросы пояснительного определения и переводные эквиваленты лексического элемента.
BulNet — это электронный многоязычный словарь наборов синонимов, а также их пояснительных определений и наборов смысловых связей с другими словами языка. [1] [2]
Гидра
[ редактировать ]Hydra — это независимая от ОС система, предназначенная для разработки, проверки и исследования Wordnet. Программа позволяет пользователям просматривать и редактировать любое количество одноязычных сетей Word одновременно. Отдельные сети слов синхронизируются, так что эквивалентные наборы синонимов или синсеты можно просматривать и исследовать параллельно. [6]
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Коева, С. Деривационные и моросемантические отношения в болгарском Wordnet. В интеллектуальных информационных системах, XVI, Варшава, Академическое издательство, 2008, 359—389. ISBN 978-83-60434-44-4 . «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 8 июля 2011 г. Проверено 12 мая 2015 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка ) - ^ Перейти обратно: а б Цветана Димитрова, Екатерина Тарпоманова и Борислав Ризов. Борьба с деривацией в болгарской сети Wordnet. В: Хейли Орав, Кристиана Феллбаум и Пик Воссен (ред.) Материалы седьмой глобальной конференции Wordnet, Тарту, Эстония, 2014 г., стр. 109–117. [1] .
- ^ Коева, С., Г. Тотков и А. Генов. К болгарскому WordNet. Румынский журнал информационных наук и технологий, Vol. 7, № 1-2, 45-61, 2004. ISSN 1453-8245 .
- ^ Коева, С. Болгарская WordNet – развитие и перспективы. На Международной конференции «Когнитивное моделирование в лингвистике», Варна, 2005, 270-271.
- ^ Коева, С. Болгарский Wordnet - современное состояние, применение и перспективы. В болгаро-американских диалогах, Академическое издательство проф. М. Дринова, София, 2010, 120-132. ISBN 978-954-322-383-1 .
- ^ Борислав Ризов. Hydra: система программного обеспечения для Wordnet. В: Хейли Орав, Кристиана Феллбаум и Пик Воссен (ред.) Материалы седьмой глобальной конференции Wordnet, Тарту, Эстония, 2014 г., стр. 142–147. [2] .