Jump to content

Многословное выражение

Выражение из нескольких слов ( MWE ), также называемое фраземой. [ нужна ссылка ] , представляет собой лексемоподобную единицу, состоящую из последовательности двух или более лексем, обладающую свойствами, которые невозможно предсказать из свойств отдельных лексем или их обычного способа комбинации. MWE отличаются от лексем тем, что последние во многих источниках требуют, чтобы они имели значение, которое не может быть выведено из значения отдельных компонентов. Хотя MWE должны обладать некоторыми свойствами, которые не могут быть выведены из одного и того же свойства компонентов, рассматриваемое свойство не обязательно должно быть значением.

Для более короткого определения MWE можно охарактеризовать как «своеобразные интерпретации, выходящие за границы слов (или пробелы)». [1]

Многословное выражение может быть составным , фрагментом предложения или предложением. Группа лексем, составляющих MWE, может быть непрерывной или прерывистой. Не всегда можно обозначить MWE частью речи .

MWE может быть более или менее замороженным.

Пример №1 на английском языке: toпинать ведро , что означает скорее умереть , чем ударить ногой в ведро . В этом примере, то есть эндоцентрическом соединении , часть речи может быть определена как глагол . MWE заморожен в том смысле, что никакие изменения невозможны.

Пример №2 на английском языке: бросить <кого-нибудь> на съедение львам . Шаблон <кто-то> ограничивает использование. Выражение полузаморожено, потому что возможна определенная степень вариации, но не все возможно. Невозможно, например, сказать трем львам : Как и в предыдущем примере, частью речи является глагол.

Пример №3 на французском языке: la moutarde <me,te,lui,nous,vous,leur> monte au nez . Этот MWE более заморожен, чем другие примеры. Добавим, что для глагола допускается временная вариация, но мы не можем определить, какая часть речи является для всего выражения, поскольку это предложение.

Машинный перевод (МП)

[ редактировать ]

По данным Саг и др. (2002), многословные выражения, помимо устранения неоднозначности, являются одной из двух ключевых проблем обработки естественного языка (НЛП) и особенно машинного перевода (МП).

Количество MWE в лексиконе говорящего оценивается того же порядка, что и количество отдельных слов. Словарь специализированных предметных областей в подавляющем большинстве состоит из MWE, следовательно, доля MWE будет увеличиваться по мере того, как система добавляет словарь для новых доменов, поскольку каждый домен добавляет больше MWE, чем простые слова.

Проблемы

[ редактировать ]

Самой большой проблемой при переводе MWE может быть проблема идиоматичности , поскольку многие MWE в большей или меньшей степени имеют идиоматический смысл.

Например, для системы трудно предсказать, что такое выражение, как «Kick the Bucket», будет иметь значение, совершенно не связанное со значением «Kick» , «The» и «Bucked», но при этом будет соответствовать грамматике английского языка Vps. Идиомы нельзя перевести буквально, поскольку во многих случаях идиома не существует в эквивалентной форме на целевом языке. Следует обратить внимание на синтаксическую и семантическую (не)эквивалентность.

Кроме того, не каждый MWE исходного языка также имеет MWE на целевом языке. Например, немецкое MWE ins Auge fassen можно перевести только с помощью английского термина, состоящего из одного слова, « предвидеть» .

Наиболее многообещающим подходом к переводу MWE является машинный перевод на основе примеров, поскольку в этом случае каждый MWE может быть указан в качестве примера с его переводным эквивалентом на целевом языке.

Для машинного перевода на основе правил было бы сложно определить правила для перевода MWE из-за количества различных типов MWE.

Тем не менее, система MT, основанная на примерах, должна применять разные правила для перевода непрерывных и прерывистых MWE, поскольку труднее идентифицировать прерывистый MWE в предложении, где слова вставлены между различными компонентами одного MWE.

См. также

[ редактировать ]
  1. ^ Саг, Иван А.; Болдуин, Тимоти; Бонд, Фрэнсис; Копстейк, Энн; Фликинджер, Дэн (2002). «Многословные выражения: боль в шее для НЛП» . Компьютерная лингвистика и интеллектуальная обработка текста . дои : 10.1007/3-540-45715-1_1 . hdl : 10356/79581 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c5bc56553019197503f92783eedd7a19__1707097800
URL1:https://arc.ask3.ru/arc/aa/c5/19/c5bc56553019197503f92783eedd7a19.html
Заголовок, (Title) документа по адресу, URL1:
Multiword expression - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)