Лексическая замена
Лексическая замена – это задача определения заменителя слова в контексте предложения. Например, при наличии следующего текста: «После матча восполните оставшийся дефицит жидкости, чтобы предотвратить хроническое обезвоживание на протяжении всего турнира», замена игры может быть предложена .
Лексическая замена строго связана с устранением смысловой неоднозначности слова (WSD), поскольку обе они направлены на определение значения слова. Однако, хотя WSD заключается в автоматическом присвоении соответствующего значения из фиксированного набора значений, лексическая замена не накладывает никаких ограничений на то, какой заменитель выбрать в качестве лучшего представителя слова в контексте. Не предписывая инвентаризации, лексическая замена решает проблему детализации смысловых различий и обеспечивает равные условия для автоматических систем, которые автоматически приобретают значения слов (задача, называемая индукцией смысла слова ).
Оценка
[ редактировать ]Для оценки автоматических систем по лексической замене на оценочном конкурсе «Семевал-2007» , проходившем в Праге в 2007 году, было организовано задание. Также выполнено задание «Семевал-2010» по межъязыковой лексической замене.
Модель пропуска грамма
[ редактировать ]Модель пропуска граммы переносит слова со схожим значением в векторное пространство (набор объектов, которые можно складывать и умножать на числа), которые находятся близко друг к другу в N-мерностях (список элементов). Разнообразные нейронные сети (компьютерная система, смоделированная по образцу человеческого мозга) формируются вместе в результате взаимодействия векторов и сетей. Все это происходит в рамках словаря, созданного в сети. [1] Модель использовалась в алгоритмах автоматизации и прогнозирования лексических замен. Один из таких алгоритмов, разработанный Ореном Меламудом, Омером Леви и Идо Даганом, использует модель пропуска грамм для поиска вектора для каждого слова и его синонимов. Затем он вычисляет косинусное расстояние между векторами, чтобы определить, какие слова будут лучшими заменителями. [2]
Пример
[ редактировать ]В предложении типа «Собака шла быстрым шагом» каждое слово имеет определенный вектор по отношению к другому. Вектором для «The» будет [1,0,0,0,0,0,0], потому что 1 — это словарь слов, а 0 — это слова, окружающие этот словарь, которые создают вектор.
См. также
[ редактировать ]Библиография
[ редактировать ]- Д. Маккарти, Р. Навильи. Задача на лексическую замену английского языка . Языковые ресурсы и оценка , 43(2), Springer, 2009, стр. 139–159.
- Д. Маккарти, Р. Навильи. SemEval-2007 Задание 10: Задача по лексической замене английского языка . Учеб. семинара Semeval-2007 (SEMEVAL) на 45-м ежегодном собрании Ассоциации компьютерной лингвистики (ACL 2007), Прага, Чешская Республика, 23–24 июня 2007 г., стр. 48–53.
- Д. Маккарти. Лексическая замена как задача оценки WSD . В материалах семинара ACL по устранению неоднозначности смысла слов: недавние успехи и будущие направления, Филадельфия, США, 2002 г., стр. 109–115.
- Р. Навильи. Устранение неоднозначности в смысле слова: опрос , ACM Computing Surveys, 41 (2), 2009 г., стр. 1–69.
Ссылки
[ редактировать ]- ^ Барацца, Леонардо (3 апреля 2017 г.). «Как работает Skip-Gram в Word2Vec?» . Стать Человеком .
- ^ Меламуд, Орен; Леви, Омер; Даган, Идо (5 июня 2015 г.). «Простая модель встраивания слов для лексической замены» . Материалы NAACL-HLT 201 : 1–7. дои : 10.3115/v1/W15-1501 . S2CID 2897037 . Проверено 16 апреля 2018 г.