УБИ-ЛМФ
УБИ-ЛМФ [1] [2] — это формат стандартизации лексических ресурсов для обработки естественного языка (NLP). [3] УБИ-ЛМФ соответствует стандарту ISO для лексиконов: LMF , разработанному в рамках ISO-TC37 , и представляет собой так называемую сериализацию этого абстрактного стандарта. [4] В соответствии с LMF, все атрибуты и другие лингвистические термины, представленные в UBY-LMF, относятся к стандартизированным описаниям их значений в ISOCat .
UBY-LMF реализован на Java и активно развивается как проект с открытым исходным кодом в Google Code .На основе этой реализации Java создан крупномасштабный электронный словарь UBY. [5] был создан автоматически — это результат использования UBY-LMF для стандартизации ряда разнообразных лексических ресурсов, часто используемых в приложениях НЛП.
В 2013 году UBY содержит 10 словарей, попарно связанных между собой на смысловом уровне: [6] [7] [8]
- Английский WordNet , Викисловарь , Arc.Ask3.Ru , FrameNet , VerbNet , OmegaWiki
- Немецкий Викисловарь , Arc.Ask3.Ru , GermaNet , IMSLex-Subcat и
- многоязычная OmegaWiki.
Подмножество лексиконов, интегрированных в UBY, было преобразовано в формат семантической сети в соответствии с моделью лексикона лимона. [9] Это преобразование основано на сопоставлении UBY-LMF с моделью лексикона лимона.
Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- ^ Джудит Экл-Колер, Ирина Гуревич, Сильвана Хартманн, Майкл Матушек, Кристиан Мейер: UBY-LMF - исследование границ языково-независимых моделей лексики, в Гил Франкопуло, LMF Lexical Markup Framework , ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9 )
- ^ Джудит Экл-Колер, Ирина Гуревич, Сильвана Хартманн, Майкл Матушек и Кристиан М. Мейер. UBY-LMF — унифицированная модель стандартизации гетерогенных лексико-семантических ресурсов в ISO-LMF. В: Николетта Кальцолари, Халид Шукри, Тьерри Деклерк, Мехмет Угур Доган, Бенте Мегаард, Джозеф Мариани, Ян Одейк и Стелиос Пиперидис: материалы 8-й Международной конференции по языковым ресурсам и оценке (LREC), с. 275–282, май 2012 г.
- ^ Готфрид Херцог, Лоран Ромари, Андреас Витт: Стандарты языковых ресурсов. Стендовый доклад на выставке МЕТА-ФОРУМ 2013 - МЕТА, сентябрь 2013, Берлин, Германия.
- ^ Лоран Ромари: пешеходные переходы TEI и LMF. КоРР абс/1301.2444 (2013)
- ^ Ирина Гуревич, Джудит Экл-Колер, Сильвана Хартманн, Майкл Матушек, Кристиан Мейер, Кристиан Вирт: UBY - крупномасштабный единый лексико-семантический ресурс на основе LMF, Proceedings of EACL, стр. 580–590, 2012, Авиньон, Франция.
- ^ Кристиан М. Мейер и Ирина Гуревич. Что психолингвисты знают о химии: согласование Викисловаря и WordNet для увеличения охвата доменов, в: Материалы 5-й Международной совместной конференции по обработке естественного языка (IJCNLP), стр. 883–892, ноябрь 2011 г. Чиангмай, Таиланд.
- ^ Сильвана Хартманн и Ирина Гуревич. FrameNet на пути к Вавилону: создание двуязычной сети FrameNet с использованием Викисловаря в качестве межъязыковой связи. В: Материалы 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), том. 1, с. 1363-1373, Ассоциация компьютерной лингвистики, август 2013 г.
- ^ Михаил Матушек и Ирина Гуревич. Дейкстра-WSA: графический подход к выравниванию смысла слов. В: Труды Ассоциации компьютерной лингвистики (TACL), том. 1, с. 151-164, май 2013 г.
- ^ Джон МакКрэй, Гуадалупе Агуадо-де-Сеа, Пол Буителаар, Филипп Чимиано, Тьерри Деклерк, Асунсьон Гомес-Перес, Хорхе Грасиа, Лаура Холлинк, Елена Монтьель-Понсода, Деннис Шпор, Тобиас Вуннер. (2012) Обмен лексическими ресурсами в семантической сети. Языковые ресурсы и оценка 46:701–719.