Jump to content

Лексический ресурс

В цифровой лексикографии , обработке естественного языка и цифровых гуманитарных науках лексический ресурс — это языковой ресурс, состоящий из данных о лексемах лексикона например одного или нескольких языков, , в форме базы данных . [1]

Характеристики [ править ]

Существуют различные стандарты машиночитаемого издания лексических ресурсов, например, Lexical Markup Framework (LMF) — стандарт ISO для кодирования лексических ресурсов, включающий абстрактную модель данных и сериализацию XML , [2] и OntoLex-Lemon , словарь RDF для публикации лексических ресурсов в виде графов знаний в сети, например, в виде лингвистических связанных открытых данных . [3]

В зависимости от типа языков, к которым обращается лексический ресурс, можно квалифицировать как одноязычный , двуязычный или многоязычный . В двуязычных и многоязычных лексических ресурсах слова могут быть связаны или не связаны с одним языком с другим. При подключении эквивалентность одного языка другому осуществляется через двуязычную ссылку (для двуязычных лексических ресурсов, например, с помощью отношения vartrans:translatableAs в OntoLex-Lemon ) или через многоязычные нотации (для многоязычных лексических ресурсов, например, путем ссылки на тот же онтолекс:Концепция в OntoLex-Lemon). [4]

Также возможно создавать и управлять лексическим ресурсом, состоящим из разных лексиконов одного и того же языка, например, одного словаря для общих слов и одного или нескольких словарей для разных специализированных областей.

Машиночитаемый словарь против словаря НЛП

Лексические ресурсы в цифровой лексикографии часто называют машиночитаемым словарем ( MRD ), словарем, хранящимся в виде машинных (компьютерных) данных, а не распечатанным на бумаге. Это электронный словарь и лексическая база данных. Термин MRD часто противопоставляется словарю НЛП в том смысле, что MRD — это электронная форма словаря, который раньше печатался на бумаге. Напротив, хотя оба термина используются программами, термин «словарь НЛП» предпочтительнее, когда словарь был создан с нуля с учетом НЛП. [5]

Лексическая база данных [ править ]

Лексическая база данных — это лексический ресурс, с которым связана база данных программной среды , обеспечивающая доступ к ее содержимому. База данных может быть специально разработана для лексической информации или может быть базой данных общего назначения, в которую была введена лексическая информация.

Информация, обычно хранящаяся в лексической базе данных, включает в себя орфографию , лексические категории и синонимы слов, а также семантические и фонологические отношения между различными словами или наборами слов.

См. также [ править ]

Ссылки [ править ]

  1. ^ САРМА, Шикхар Кр и др. Создание многоязычных лексических ресурсов с использованием ворднетов: структура, проектирование и реализация . В: Материалы 3-го семинара по когнитивным аспектам лексики . 2012. С. 161-170.
  2. ^ Франкопуло, Гил; Бел, Нурия; Джордж, Монте; Кальцолари, Николетта; Монакини, Моника; Пет, Мэнди; Сория, Клаудия (01 марта 2009 г.). «Многоязычные ресурсы для НЛП в системе лексической разметки (LMF)» (PDF) . Языковые ресурсы и оценка . 43 (1): 57–70. дои : 10.1007/s10579-008-9077-5 . ISSN   1574-0218 . S2CID   7697316 .
  3. ^ Чимиано, Филипп; Кьяркос, Кристиан; МакКрэй, Джон П.; Грасия, Хорхе (2020), Лингвистические связанные данные: представление, создание и применение , Springer International Publishing, стр. 45–59, doi : 10.1007/978-3-030-30225-2_4 , ISBN  978-3-030-30225-2 , S2CID   214148590
  4. ^ Чимиано, Филипп; МакКрэй, Джон П.; Буителаар, Пол. «Лексиконная модель для онтологий: отчет сообщества, 10 мая 2016 г., окончательный отчет группы сообщества, 10 мая 2016 г.» . W3C . Проверено 6 декабря 2019 г.
  5. ^ Гил Франкопуло (под редакцией) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN   978-1-84821-430-9 )

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ba3b5180f02a3257efc94c34682fab37__1694281320
URL1:https://arc.ask3.ru/arc/aa/ba/37/ba3b5180f02a3257efc94c34682fab37.html
Заголовок, (Title) документа по адресу, URL1:
Lexical resource - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)